Dual Issue pode ter sido removido do RDNA 4, ajudando a explicar o motivo da PS5 Pro só indicar 16.7 Tflops.

O Dual Issue era na realidade mais uma manobra de Marketing do que outra coisa, pois os ganhos práticos do mesmo eram poucos ou nenhuns.

O Dual Issue é a habilidade de os GPUs AMD processarem duas Strings de 32 bits num único processamento de 64 bits. E a sua implementação basicamente fez com que o calculo de Tflops fosse afetado por um multiplicador de 2x, que duplicava os Tflops.

Mas a realidade é que o ganho real aportado pelo Dual Issue era pouco ou nenhum, e uma análise da PCGamer revelou mesmo que era raro ver o Dual Issue a ser usado em jogos, sendo que onde era, era usado de forma pontual.

Agora parece que, com o RDNA 4, a AMD removeu mesmo o Dual Issue, atirando assim a contagem dos Tflops de novo para baixo. Repare-se nesta análise da Tech Powerup a um GPU RDNA 4:



Aqui vemos que, tal como na PS5 Pro, que também tem tecnologia do RDNA 4, os Tflops são calculados pela metodologia clássica. O GPU tem um consumo equivalente ao da PS5 Pro que desceu o mesmo dos 250 Watts para os 220 Watts, assim como uma largura de banda semelhante.

A situação pode ser uma ajuda extra a explicar porque motivo a Sony não indica a sua PS5 Pro como 33,4 Tflops, mas sim 16,7, só criando algumas duvidas ao cálculo dos 300 Tops usados para IA, que só conseguem aparecer na presença de um calculo ao estilo do RDNA 3.

A explicação pode pode passar por uma análise mais cuidada do texto do documento da Sony:

Basicamente a arquitectura usada para machine learning é personalizada. O que implica que pode usar soluções customizadas como o Rapid Packed Math nos cálculos de inteiros, ou então uma implementação do Dual Issue alterada só para inteiros.

Aqui não nos vamos atrever a tentar adivinhar o que se passa aqui, mas a realidade é que se quisermos aceitar que os 300 Tops anunciados eram reais (e para uma solução ao nível do DLSS, tal como existe, eles bem são precisos), há aqui algo que permite duplicar o valor teórico deste calculo.





17 Comentários
Antigos
Recentes
Inline Feedbacks
Ver todos os comentários
Juca
Juca
19 de Novembro de 2024 11:36

É esperar pra ver como virá a RDNA 4 que deve estrear no 1o trimestre de 2025… A quantidade de Tflops reduzindo tanto assim, distanciará bastante as placas da AMD das Nvidia em termos de cálculos de ponto flutuante, tão úteis em outras aplicações… A menos que os Tflops teóricos da Nvidia também tenha muitos poréns, como é o Dual Issue da AMD.

Hennan
Hennan
Responder a  Juca
19 de Novembro de 2024 13:56

Esse negócio de Tflops está pior que PMPO. No final do dia, só testando para saber o desempenho real.

Juca
Juca
Responder a  Hennan
19 de Novembro de 2024 17:05

Pra jogo não perece ter grande repercussão, ao que parece, mas pra matemática aplicada é muito importante. Então dado a pouca diferença nas rasterizações puras, Tflops, exceto entre placas de uma mesma geração, pra jogo, não parece dizer muita coisa.

Carlos Eduardo Santos
Carlos Eduardo Santos
Responder a  Hennan
20 de Novembro de 2024 18:17

O pessoal costumava chamar PMPO de “potência máxima pra otário”.
Hauhauhauhauhau hauhauhauhauhau

Andrio
Andrio
19 de Novembro de 2024 19:39

[OFF] Rumor de que a sony estaria conversando para comprar a kadokawa.

https://x.com/gematsu/status/1858756187522507124

Hennan
Hennan
Responder a  Andrio
19 de Novembro de 2024 19:52

Séria péssimo para o consumidor e excelente para Sony. Basicamente teriamos um monopólio em animes. A From seria uma grande aquisição, mas o impacto nos outros segmentos de entretenimento seriam ainda mais relevantes.

Andrio
Andrio
Responder a  Hennan
20 de Novembro de 2024 0:15

Sim, pelo o que eu li o foco nem é a from, a from acabaria sendo um brinde. Agora, poderiam ter visto isso antes de ter torrado toda aquela grana na bungie

Sparrow81
Sparrow81
Responder a  Andrio
20 de Novembro de 2024 15:56

Cara, a Bungie está viva e se não fosse a Sony adquirir teria morrido! Eu acho uma merda esses jogos multiplayer, mas numa visão empresarial é extremamente importante investir em várias cestas de ovos, não apenas uma! No caso da FromSoftware, seria realmente uma bela aquisição, até com mais impacto HOJE do que foi a Bethesda pra Microsoft e é muito mais negócio do que a aquisição da ABK também. É bom pro consumidor? Não, nunca é! Agora como empresa, a Sony não poderia deixar a Microsoft adquirir 1/3 das grandes publicadoras sem dar uma resposta. Eu espero que se concretize, pois deixar a Microsoft nessa folga que está é muito pior pra todos!

Last edited 1 mês atrás by Sparrow81
Carlos Eduardo Santos
Carlos Eduardo Santos
20 de Novembro de 2024 18:11

Eu fiz esse comentário nas matérias anteriores.
Tendo em vista que os consoles de 2020 usavam em suas GPUs arquitetura Full RDNA 2, mesmo antes dessa arquitetura ter sido lançada.
Então probabilidade do PS5 PRO ter uma GPU com arquitetura Full RDNA 4, era muito grande.
Se a arquiteta RDNA 4 já estava pronta, seria perda de tempo e consequentemente muito mais custoso, fazer uma “arquitetura híbrida” entre RDNA 3 e RDNA 4.

Last edited 1 mês atrás by Carlos Eduardo Santos
O Cosmos Infinito
26 de Novembro de 2024 16:23

Nunca foi RDNA4.

A primeira coisa que deve ser entendido é que RDNA não existe, toda RDNA é uma GFX10 todos os RDNA são evolução e ramificações de GFX9 GCN5 ou Vega.

Tem uma diferença grande entre o design da microarquitetura e o conjunto de instruções suportadas. Coisas como o Raytracing ou AI não fazem parte do ISA de RDNA porque não são conjuntos de instruções mas sim personalizações dentro de um conjunto de instruções intrínsecas especiais.

O Raytracing por exemplo é possível graças a uma modificação nos decodificadores da TMU que podem carregar estrutura espaciais em listas ordenadas de vetores, quando você vai ver no isa da AMD para RDNA 2 só existe a função carregar BVH de 8 a 32 bits. O mesmo acontece com o Dual Issue, as RDNA sempre tiveram uma função de escalar uma fila ou registro mas RDNA 3 você pode fazer isso com adição simples FP32 desde que não aconteca a subinscrição desse registro e por isso não funciona em Wave 64. Melhoraram o ISA? Não. Aumentaram o cache e o tamanho do registro escalar.

O pessoal não ver isso, olhe uma RDNA 3, ele usa modulos multichip e cache separado. O ponto alto de RDNA 3 não é o Dual Issue que presta pra nada mas sim o aumento das unidades computacionais e o aumento do Infinite Cache. O Chip do PS5 Pro é monolítico, não tem Infinite Cache, não tem aumento dos niveis cache, não tem qualquer vantagem de design RDNA3.

Ah mas PSSR usa unidades Tensor … Não usa, mentira. As patentes publicadas pela Sony sobre seus escaladores nos diz que ele é apenas uma versão mais acançada do Checkerboard onde no segundo passo, ao invés de colher as condenada dos dados a partir de um IDbuffer usam dados de Inferência pré treinados, que é o que a AMD pretende fazer no FSR4. A quantidade de sinapitcs é menor do que o DLSS, o DLSS precisa de 50 mil interações por pixel, isso significa precisar de coisa de pelo menos 25TOPs. Não é inalcançável para una Radeon, até a RTX 2060 que tem 30TOPs coisa de consegue fazer o que o PSSR faz upscalar 4K. Porém a diferença novamente está no hardware as Radeon desde Vega ganharam uma matrix escalar que permite armazenar pilhas de registro de baixa precisão 4×16 8×8 16×4 em CDNA2 eles criaram funções especais para facilitar o uso desses recursos no seu SDK.

Isso faz o PS5pro algo como se fosse um RDNA Plus que a AMD identifica como RDNA 2, o mesmo valendo para o Xbox Series X, os 2 tem GPUs muito parecidas com um total de 64 Unidades Graficas. Com o mesmo tamanho de barramento. A diferença está no processo de fabricação e no fato que a Sony não eliminou recursos importantes. Porém ambos tem o mesmo graphic Pipeline de RDNA 1, ambos tem os mesmos tamanho de cache e registro escalar de RDNA1, ambos tem Ray Tracing cuja a BVH é acelerada por TMUs, ambos tem Machine Leaning usando matrix escalares através do SIMD. O PS5 pro tem mais CU, mais memória e mais clock de trabalho.

Com isso ele pode explorar mais o paralelismo e investir melhor em um upscalador por AI.

O Cosmos Infinito
Responder a  Mário Armão Ferreira
26 de Novembro de 2024 22:31

O foco do que falei foi desmartelar essa informação nonsense sobre PS5 Pro relacionado a RDNA 4 e pra isso foi útil. Mesmo assim vou responder esses promenores:

1. Afirmação simplista e imprecisa.
Essa sua resposta é uma resposta gerada por IA que não percebe as nuances do que eu disse. A AMD anteriormente identificava o conhecido RDNA como Vega 30. O RDNA foi nomeado assim por causa dos consoles. Houve mudanças mais profundas no próprio GCN do que no RDNA. O RDNA é uma versão otimizada da Vega, sendo uma ramificação. Além disso, a própria capacidade dos consoles de oferecer retrocompatibilidade já define que eles suportam GCN. Enquanto é válido que a AMD deve ser a única com direitos reais a nomear quais arquiteturas embarcam seus hardwares. A questão torna-se uma discussão sem propósito pois ninguém seja Sony ou AMD confirmou nada exatamente pelo óbvio. O próprio PS5 responde por si, se o PS5 é RDNA 2 o PS5 Pro também é RDNA 2.

2. Está confuso, pois você pegou uma parte, ignorou o restante e falou algo genérico.
Se isso fosse um debate, ele já teria terminado aqui. A função do hardware é acelerar o software, então é claro que o Ray Tracing é software – essencialmente um shader. Mas essa não é a questão. O ponto é como a aceleração RT do RDNA 2 não afeta o ISA, pois não é tão paralelizável quanto os RT Cores. O RDNA 2 utiliza o mesmo pipeline da TMU, enquanto nas GeForces as unidades RTcore carregam, atravessam e testam sem depender dos SMs, diferentemente das Radeon.

Nas Radeon, o acelerador RT decodifica a travessia, mas a interseção (hit/collision) depende das SIMD, o que limita a paralelização e restringe até quatro interseções por ciclo de ramo. Isso não mudou no PS5 Pro: ele não tem RT Cores, nem algo comparável ao RDNA 3 osuperior. Comparando ao PS5 e XBSX a vantagem real no RT é mais unidades e mais cache, mais vetores e por consequência mais raios.

3. Não são duas instruções sob certas condições, são instruções VOPD que podem carregar dois operandos simultaneamente como uma única instrução, desde que sejam pequenos o suficiente para caber no cache de registros e destinados a bancos distintos, sem ramificações ou dependências, pois serão apagados a cada novo Wavefront.

Por isso, apenas Wavefronts de 32 registros se beneficiam dessas instruções. Somente operações de adição, multiplicação ou literais são aceleradas – nada de interpolação, convolução ou shaders complexos qhe poderia beneficiar o RT ou o PSSR. Isso é praticamente inútil para jogos, pois exigiria mudanças profundas na otimização para ganhos modestos.

Considerar o PS5 Pro como “RDNA Plus” é ser otimista. Não há nada no PS5 Pro comparável a GPUs RDNA 3.

Sim, os consoles têm chips personalizados, mas nem Sony nem Microsoft personalizam diretamente a arquitetura, que é da AMD. O Xbox é mais próximo do RDNA 2 do PC, do que o PS5/Pro mas ainda assim são diferentes. Esses chips tiveram seus projetos finalizados em 2020. Não há Infinite Cache nem RDNA 3 é RDNA com RT.

4. Reconstrução Temporal significa usar dados de vetores passados; Checkerboard significa renderização esparsa, renderizando uma parte agora e outra depois. Foi exatamente isso que o PS4 Pro fez o tempo todo. Não muda nada.

A inferência baseada em IA requer hardware dedicado para upscaling? Absolutamente não. Essa confusão parte de um equívoco em distinguir hardware de software. Por exemplo, a RTX 2060 tem menos TOPs que uma RDNA 2 e consegue fazer DLSS em 4K.

O PS5 Pro não possui hardware dedicado para upscale (como as GeForces), o que explica por que ativar o PSSR no console reduz o desempenho em mais de 5 quadros. Curioso, não? Em GPUs Nvidia, o comportamento é o oposto.

A questão não é o compilador. O PSSR exige um compilador mais otimizado porque está impondo uma grande carga na GPU. Será que ninguém pensa nisso?

5. O PS5 Pro não possui mais CUs físicas, mas sim mais CUs ativas. Ambos os consoles foram projetados com 64 CUs, mas o Xbox, por usar um processo mais antigo, ficou limitado a 52 CUs ativas, já o PS5 Pro por usar um processo melhor ativa 60 CUs.

Mesmo assim, é possível que o Xbox tenha mais recursos gerais que o PS5 Pro, pois seu chip possui circuitos extras além da GPU.

O PS5 Pro não é mais avançado que o RDNA 2, nem aqui nem em Portugal. Ele é apenas mais poderoso dentro do contexto dos consoles, mas enfrenta dificuldades no início, pois os consoles existentes já estão bem estabilizados.

A ironia é que o PS5, a menos que seja artificialmente limitado pela Sony, continuará competitivo, já que a diferença não é tão grande. O PS5 Pro pode estar de 30% a 40% acima do desempenho do PS5, o que o coloca próximo da RX 6800, enquanto o PS5 está mais alinhado com a RX 6700.

O veredito é que qualquer um pode achar o que quiser se quer achar que tem RDNA 3 ou 4 de baixo do capô do PS5 Pro problema e seu, com o tempo a verdade sempre é revelada.

O Cosmos Infinito
Responder a  Mário Armão Ferreira
27 de Novembro de 2024 19:03

1. 2. 3. O PS5 não é RDNA 2. Sim é RDNA 2 pois a Sony e AMD identifica assim.
O PS5 é RDNA 3 ou 4. Não. Pois não tem identificação alguma oficial, apenas rumor desconfirmado, teoria pseudo técnica e achismo de fanboy.

O console seja PS5 ou Pro não tem qualquer recurso avançado em RT, nada de Caustics, GI completa, verdadeiros materiais cromados nada. Nada daquilo que a Nvidia demonstrou em 2017 os consoles demostraram. Eles mal conseguem sombras difusa, nada de motionblur, nada de Sub Surface Scattering. A Nvidia demonstrou em 2017 que sua GPU mais básica tinha poder pra lidar com os 3 passos da iluminação a 1080p, o PS5 em RT é inferior a RTX 2060s. E o PS5 Pro é inferior a mesma em upscale.

E você se apoia em Linus? Puts.

4. O Ray tracing generation Shader não é um shader… Hahaha …

Melhorias RDNA3? Quais? Rumor. O que a Sony faz é simplesmente otimizar o binário fornecendo representações de menor precisão 4, 8, 10 bits que sobrecarregue menos os LDS e o VGPR. Como o objetivo é utilizar apenas algumas sombras, reflexões ou bounces lights locais direcionada você não precisa de grande precisão RT, não é necessário de grande precisão RT se seu RT é pior que o que uma RTX 2060s pode oferecer.

300TOPs onde? De onde vem esse dado? De CDNA A MI300 faz 300TOP o PS5pro não é uma MI300. É mais um dado falso. Novamente PS5pro pior que a RTX2060s de 2018 na única coisa que ele traz de especial o upscale mas vão bater o pé que alcança a capacidade de uma GPU de datacenter.

5. E lógico que tem que comparar o Xbox Series X, é o console mais próximo dele. Tão próximo que são quase semelhantes. O PS5 Pro só não é mais semelhante ao Xbox porque a Microsoft ao fazer o Xbox Series X teve que manter uma serie de recursos para manter a compatibilidade com o Xbox One X e compatibilizar e ampliar requereu um projeto de APU mais sofisticado, com diversos DSPs e chips auxiliares, para DSP de som, fluxo de dados, Machine Learning entre outros.

Imagine se a Microsoft decide levar seu console para os 4nm? Eles não precisaria mudar nada. Ative apenas as unidades computacionais dormentes, extenda o barramento para 384bits e forneça a GPU 16GB de acesso e 4GB para a CPU, aumente os clocks e use boost para aumentar a frequência pico. Você teria um sistema até melhor que o PS5pro e possivelmente mais barato. Eu acredito que a Microsoft poderia faze-lo nos 600 dólares. Mas a eles a guerra de performance não mais interessa se eles tem o Gamepass e as principais editoras.

Se o lance do PS5pro continuar upscalando game 800px para 4k isso não foge do alcance do Xbox.

E você não gosta que fale bem do Xbox? Eu pensei que fosse PCmanias e não PlayStationMegalomanias esse site Hahaha.

Carlos Eduardo
Carlos Eduardo
Responder a  O Cosmos Infinito
27 de Novembro de 2024 19:06

O Xbox Series X não possui 64 CUs físicas, mas sim 56 CUs físicas.

Quem disse isso foi o próprio Mark Grossman, que trabalha na silicon architecture team da Microsoft. Segue link da apresentação: https://www.youtube.com/watch?v=OqUBX2HAqx4&t=1503s

Veja a partir do minuto 15, onde ele fala sobre 4 shader arrays, cada um com 6 ou 7 dual CUs. E a imagem é clara em mostrar que apenas duas dual CUs são desativadas, totalizando em 4 CUs desativadas e 52 ativas (7 dual CUs do primeiro shader array + 6 do segundo + 7 do terceiro + 6 do quarto, totalizando 26 dual CUs x 2 = 52 CUs)

comment image

Last edited 24 dias atrás by Carlos Eduardo
error: Conteúdo protegido