Actualmente uma das discussões que corre nos foruns é a dimensão dos APUs das consolas. Os rumores apontam para algo na ordem dos 350 mm2 para o APU Xbox e 300 mm2 para o APU da PS5. Será que esta diferença implica diferenças na performance? E o que poderá incluir um chip com 300 mm2?
Quem o tamanho que se referem virem a ter os GPUs da PS5 e Xbox Anaconda?
Se tem prestando atenção aos rumores, terão visto que o que tem vindo a ser apontando para o GPU da próxima Xbox são 350 mm2, sendo que o da PS5 teria 300 mm2.
Mas sendo isto rumores, nada nos garante que estes valores sejam exactos… e mais do que isso, que sejam sequer correctos.
Daí que surgem várias questões:
1 – Terão estes valores alguma lógica?
2 – Que implicações pode ter essa diferença?
3 – Essa diferença implica diferenças de performances claras para algum dos lados?
4 – Que diferenças internas podem justificar essa diferença?
São essas questões que vamos tentar abordar!
Qual o área que um APU para uma consola de próxima geração deveria ter?
Para respondermos à primeira questão, teremos de fazer algum cálculo!
Terão os valores alguma lógica?
Sendo que actualmente a performance mais abordada nos fóruns é algo na ordem dos 11 Tflops para ambas as consolas, vamos tentar perceber qual seria a dimensão necessária para um GPU com essa performance.
Para este cálculo, vamos usar alguma matemática invertida, partindo da velocidade de relógio anunciada para o Gonzalo/Flute/Oberon, referido como sendo o GPU da PS5, ou seja… 2 Ghz!
E para algo na ordem dos 11 Tflops (Neste caso 1,264 Tflops) vemos que com a velocidade de 2 Ghz, um GPU necessitaria de ter 44 CUs activos, o que implicaria o uso de algo bastante semelhante à Radeon RX 5700 XT, mas com mais velocidade de relógio.
44 Cus x 64 SEs x 2 operações por ciclo de relógio x 2000 = 11,264 Tflops
Esta semelhança com a RX 5700 permite termos muita papinha feita, dado que a AMD nos anuncia que o GPU Navi que equipa a Radeon RX 5700 XT possui uma área de 251 mm^2.
Claro que este GPU não possui qualquer alteração ao hardware para o Ray Tracing, mas convenhamos que não sabemos como isso vai ser implementado, pelo que não podemos dizer que área extra esse hardware vai ocupar. O que podemos dizer é que face à RX 5700 XT muitos controladores ali existentes serão partilhados com o CPU no caso de um APU, pelo que ao tomarmos esta valor como base, no valor final que vamos obter podemos considerar que o que se ganha em área com a remoção de redundâncias e o que se perde com o acréscimo do RT poderá muito bem ser igual.
Mas o facto é que sem esses dados concretos, o que vamos referir é apenas um exercício teórico, mas mesmo assim, um exercício interessante. Até porque diga-se que 300 mm2 e 350 mm2 são valores exactos demais, e como tal certamente são aproximações algo grosseiras.
Mas vamos continuar. Estávamos então com uma área de 251 mm2, à qual teremos de acrescentar os dois CCX dos CPUs.
Sabemos agora oficialmente que a PS5 usará núcleos Zen 2! e aqui a AMD vem em nosso socorro novamente ao dar a conhecer que um chiplet com dois CCX com 16 GB de cache, ocupam 74 mm2.
Se olharmos para o Zen a 12 nm, ele ocupava, com dois CCX e os mesmos 16 MB, 213 mm2. Como vemos, a redução de área é maior do que a mudança de litografia permite. Porque?
Bem, o Zen 2 possui 4 links Infinity Fabric, que foram reduzidos no Zen 2 para apenas um. E mais ainda, o ZEN 2 não requer controladores de memória, e não possui extras para Input Output uma vez que com ele há um chip à parte na board para isso. De notar que este dado é relevante, e voltaremos a pegar nele.
A realidade é que agora, com as duas áreas temos então os dados para calcular o tamanho de um APU. E ele será 251+74 = 325 mm^2
Estamos aqui então com um APU que apresenta 25 mm2 a menos na Xbox Anaconda e 25 mm2 a mais na PS5.
Vamos olhar para o caso da Xbox Anaconda primeiro!
O grande problema desta cálculo que fizemos é que ele foi efectuado tendo como base uma velocidade de relógio de 2 Ghz. Um valor que os rumores referem que a Xbox não alcançará, ficando-se por algo na ordem dos 1800 Mhz.
E essa informação bate certo com a maior dimensão. Um chip maior aquece mais, e como tal, não pode alcançar tanta velocidade. E nesta futura geração tanto Microsoft como Sony apostaram extensivamente na refrigeração, pelo que a dimensão do APU deverá ser o factor diferenciador.
Aliás esta situação tem vindo a ser referida também em rumores. A Sony terá apostado mais em velocidade, a Microsoft em processamento paralelo (mais CU). Dizem os rumores que o resultado final seria muito próximo, com ligeira vantagem para a Sony.
Ora pegando nessa informação, que claro, por ser um rumor, deve ser tratada com uma pitada de sal, podemos ver então o que poderá ser o hardware da Xbox Anaconda. E para um valor próximo dos 11 Tflops, com a velociade máxima de 1.8 Ghz, que se refere, a Xbox teria então um total de 48 CU activos (52 no total).
Estamos a valar de mais 4 CU que a PS5, ou seja… mais 20.12 mm2 de áres, para uma performance de 11,059 Tflops. Basicamente idêntico à PS5, mas com a vantagem do lado da Sony. Tal como os rumores apontam.
Isto somado aos 74 mm2 do CPU daria 345.12 mm2. No caso da Xbox a área estaria explicada!
Ou seja, como resposta à primeira questão, do lado da Xbox, a resposta é: Sim, a área tem lógica!
Vamos agora ver a PS5.
A PS5 tem uma situação diferente! Está com 24 mm2 a mais!
Isso quer dizer que aqui vamos ter de tirar qualquer coisa!
Onde vamos buscar então 25 mm2 sem afectar as performances?
Há várias alternativas, mas não quero entrar por algumas delas sem mais dados.
Daí que vou apenas referir uma das muitas hipóteses existentes que retiram esses 25 mm2 ao APU.
O que poderíamos então tirar? Bem, o Zen 2 possui 24 pistas PCIe. Algo muito relevante para um PC, mas se calhar menos relevante numa consola com hardware fixo! E algumas destas pistas poderão sair, reduzindo ainda mais a área do CPU. Para a Microsoft, essa remoção não seria de grande interesse devido ao uso partilhado do hardware com as racks.
A outra situação passa por uma remoção dos controladores de memória do GPU, usando uma versão alterada dos controladores do CPU que no Zen 2 se encontram num chip externo na motherboard. Esta situação poderá ser uma das personalizações da Sony.
Basicamente o que interessa aqui perceber-se é que há formas de se manter 44 CUs, com acréscimo de RT, e mantendo o chip com 300 mm2.
Daí que a resposta à primeira questão, do lado da PS5: Sim, a área é possível.
No entanto, acreditamos que 300 mm2 é um valor por defeito, e que a área andará mais perto dos 315 mm2. Tal e qual refere o rumor de baixo!
Que implicações pode ter essa diferença?
Conforme já vimos, na prática podem ser basicamente nenhumas, podendo a única implicação aparente ser que uma empresa apostou em processamento mais rápido, a outra em processamento mais amplo.
Mas os resultados em Tflops poderão ser muito, muito semelhantes, ao ponto de poderem ser considerados idênticos.
Seja como for, há uma outra situação possível de explicar as diferenças de cima que será menos agradável para os utilizadores. O corte de caches! Tal teria implicações na performance do CPU, e parece por isso um contra-senso. tornando o CPU bem menos capaz do que aquilo que se esperaria de um Ryzen.
Refiro esta situação por ser uma possibilidade que também existe e está em aberto, havendo mesmo um rumor nesse sentido, apesar de não ser a única explicação por existirem situações alternativas que ainda estão em aberto e que podem justificar a diferença de áreas, sem cortes nas performances. Mas a realidade é que tal também pode acontecer e não podemos ignorar isso, uma situação que colocaria a PS5 bem abaixo da Xbox a nível de CPU caso esta use as caches completas.
Aliás o benchmark do Flute mostra um APU com 8 núcleos, 16 Threads com velocidades entre 1.6 e 3.2 Ghz, e um GPU a 2 GHz. Nesse benchmark vemos que o CPU possui apenas 1/4 das caches, e uma performance semelhante a um CPU 1700X. Bem longe das performances dos Ryzen 2 actuais, mas mesmo assim um ganho de quase 4 vezes face ao actual jaguar.
Uma redução das caches para 1/4 do valor (4 MB por CCX) seria uma solução adequada para uma consola, reduzindo a área para 20 mm2 por CCX, o que daria 24 mm2 de redução, explicando só por si os 300 mm2.
É uma hipótese que não pode ser descartada!
Essa diferença implica diferenças de performances claras para algum dos lados?
Tal depende do que foi cortado! Teoricamente existem explicações que permitem que o sistema com menor área possa ter performances ao mesmo nível do maior outro. Mas para uma resposta exacta a esta, e a todas as outras questões, teremos de saber exactamente o que o RT vai acrescentar, e que cortes foram feitos. Como referido, tudo isto é, nesta fase, teórico, e apenas pretende tentar responder às questões, mas sem se poder garantir que as respostas são as correctas.
A possibilidade de corte de caches, essa sim teria implicações. Não a nível gráfico, mas a nível de CPU. Se a PS5 cortar os mesmos, mas a Xbox não, tal criará disparidade entre as performances de CPU das consolas. E dada esperada semelhança de performance gráfica, só por aqui a Xbox poderia usar o título de a consola mais potente do mercado.
Que diferenças internas podem justificar essa diferença?
Maiores ou menores cortes, sendo que a Microsoft nesse aspecto poderá estar mais limitada ao não poder tirar capacidades aos processadores por os usar em servidores. Já do lado da Sony, ao ter hardware fixo, e um uso específico, as coisas podem ser cortadas na medida daquilo que será o uso do hardware.
Para além do mais, os produtos são personalizados, e as situações alteradas são sempre feitas na relação performance custo… daí que o que puder ser optimizado para manter ou melhorar performances, diminuindo áreas (custo) é feito. Mas claro que nem todos tem as mesmas ideias, e a Microsoft está mais limitada no que pode cortar pela compatibilidade com o PC e servidores.
No entanto existe também a possibilidade de o corte ser nas caches. Com as implicações que já abordamos.
Conclusões
Basicamente, tanto para uma noção das áreas, mas para uma noção das performances, era necessário perceber-se o que foi cortado, o que foi alterado, e que implicações isso tem nas performances e áreas. Da mesma forma era necessário saber-se o que acrescenta o RT. A alteração pode ser feita ao nível dos CU, o que implicaria maior aumento de área do que uma unidade central partilhada pelos CUs.
Daí que este artigo apenas tente abordar as hipóteses todas que poderemos ter, para dar fundamento aos rumores existentes.