A discussão continua nos foruns. E as pessoas continuam a acreditar em Tflops e em numero de CUs como sendo definidores de performance.

A eterna discussão continua nos foruns. Como pode a Xbox series X com 52 CU contra 36 da PS5, e com 12.15 Tflops contra 10.28 na Ps5, empatar, ou mesmo perder com a PS5?

Quer-me parecer que as pessoas quando encontram uma métrica que pensam ser-lhes favorável, agarram-se a ela e não a largam. E isso continua a ser o que se aplica nas discussões de performance da PS5 vs a Xbox series X que continuam a existir aos pontapés nos foruns, e onde a ideia de que a culpa das performances da Xbox series X é dos programadores, começa a ganhar forma.

Apesar de eu já ter escrito artigos e mais artigos a tentar explicar como mais CUs não implica mais forçosamente performance, e de como mais Tflops tambem não implicam forçosamente mais performance, vou cair um bocado no ridiculo… E escrever mais um!

vamos então a um exemplo.

Tflops é uma medida de performance. Flop quer dizer floating point operation, e o T quer dizer que esta valor anda na casa dos Tera. Ou seja, um GPU com 1 Tflops faz 1 tera de operações de virgula flutuante por segundo.



Estas operações são efetuadas nas ALUs, ou unidades lógicas aritméticas. Que são capazes de um numero de operações que dependem da velocidade de relógio a que se encontram a funcionar.

Cada unidade de computação, ou CU, possui 64 pipelines de calculo, cada um deles com uma ALU, sendo que cada ALU pode realizar duas operações num único ciclo de relógio.

Assim, num GPU a 800 Mhz MHz, com 18 CU, a sua capacidade em Tflops será de 18*64*2*800=1843200 ou seja, 1,8432 Tflops.

Reconhecem este GPU? Era o da PS4!

Mas porque motivo, os CUs não são então forçosamente sinónimo de performance? Se são eles que possuem os pipelines onde estão as ALUs, e se o numero de ALUs entra no cálculo, os CU são relevantes!

E sim, são… se chegássemos ao GPU da PS4 e reduzíssemos o número de CUs para metade, vamos ver o que acontecia aos Tflops.



9*64*2*800=921600, ou seja, 0,9216 Tflops.

Ou seja, cortamos os CU para metade… e os Tflops cairam para metade. Os CU fazem realmente a diferença!

A questão é… que eles podem ser compensados. Porque se a este GPU duplicarmos a velocidade, o que temos?

9*64*2*1600=1843200 ou seja, 1,8432 Tflops. Exatamente o mesmo valor de antes.

Resumidamente, os CU são relevantes, mas não dizem a verdade toda, e é a combinação entre as Compute Units e a Velocidade que definem a real performance de um sistema.



Depois, obter um determinado número de Tflops por mais Compute Units ou por menos, para o valor é irrelevante. Isto apesar que na performance prática pode não ser exatamente igual, e vamos ver isso já a seguir.

Mas vamos recapitular… A velocidade pode ser compensada pelos CU e os CU pela velocidade. Mas mesmo assim, a realidade é que os valores em Tflops dão 12,15 para a Xbox series X e 10.28 para a PS5. Ou seja, há uma diferença de 1,84 Gflops. E isto é um valor em tudo equivalente à performance gráfica de uma Playstation 4.

Perante isso, sim, no papel a Xbox é mais capaz do que a PS5! Mas como temos visto… na realidade as consolas são bastante equilibradas, e em alguns casos a PS até vence. Como é que isso pode ser?

Correndo o risco de, mais uma vez, me repetir de forma cansativa, o cálculo dos Tflops apenas permite saber quantas operações de virgula flutuante um sistema pode calcular por segundo.

E aqui é que está o “busílis” da questão. porque entre pode e efetivamente faz, vai uma grande diferença.



O cálculo dos Tflops é considerado uma medida teórica porque ele parte do principio que a Alu vai processar em todos os ciclos. E mais do que isso, que vai processar as duas operações em todos os ciclos. A questão… é que isso não acontece sempre pois há diversos sistemas a funcionar em paralelo, e como tal há tempos de idle no processamento, ou seja, ciclos em que a ALU está parada à espera de dados que estão ainda a ser processados.

Ora em duas arquiteturas iguais, os sistemas funcionam de forma equivalente, e isso quer dizer que os Tflops, apesar de serem uma medida teórica são um bom índice de comparação das performances relativas. A geração PS4/Xbox One foi um bom exemplo! Não quer dizer que ambos os sistemas não tivessem optimizações diferentes, mas a realidade é que a a base de processamento era muito equivalente em todos os componentes do hardware.

No caso da PS5 e Xbox Series X as diferenças jã não são assim tão simplistas. Isto porque a PS5 tem mais 21% de velocidade de relógio que a Xbox series X. E isso tem sérias implicações em todo o funcionamento do GPU.

Se alguém se recorda das palavras de Mark Cerny, na apresentação “The Road to PS5”, ele teve uma frase muito interessante relacionada com o aumento da velocidade da PS5: “A Rising tide, lifts all boats”.

Basicamente a ideia é que uma maré ao encher, levanta os barcos todos. E isso aplica-se ao aumento de velocidade do GPU, onde todos os componentes do GPU trabalham mais depressa.



Por exemplo, apesar de a séries X ter 52 CU contra os 36 CU da PS5, vemos agora que motores de nova geração como o Unreal Engine se baseiam na criação de milhões de polígonos, tão pequenos como pixels, para colocação no ecrã. Aqui, o simples facto de a PS5 ser mais rápida a nível de velocidade de relógio, implica que a rasterização de triângulos que o GPU da PS5 consegue fazer, seja de 8,9 biliões de triângulos por segundo.  E isto quer dizer que o “Culling” calculado por metodologias standard, ou o determinar quais os triângulos não visíveis na cena e que não necessitam de ser processados (estamos a ignorar as melhorias do Geometry Engine da PS5), ascende aos 17,8 biliões de triângulos por segundo, e o desenho de pixels, ou pixel fill rate é de 142,7 biliões de pixels.

Resumindo:

Rasterização de triangulos: 8,9 biliões
Culling de triangulos – 17,8 biliões
Pixel Fill  rate – 142,7 biliões de pixels.

Comparando, a Xbox series X apresenta:

Rasterização de triangulos: 7,3 biliões
Culling de triangulos – 14,6 biliões
Pixel Fill  rate – 116,8 biliões de pixels.



Sendo os GPUs máquinas de processar triângulos e pixels, vemos que a capacidade de output da PS5, e consequentemente a capacidade de suprimir carências de esperas de processamento é superior à da Xbox.

Mas isto não é tudo, e deste vez sem me repetir com nova descrição exaustiva, relembro apenas que a PS5 tem diversas optimizações internas destinadas a aumentar a eficiência do GPU. Ou seja, diminuir os tempos de espera das ALUs de forma a aumentar o seu rendimento.

Isto não quer dizer que os CUs adicionais da Xbox não tenham vantagens para a consolas. Tem-na no numero de raios para Ray Tracing e na capacidade de texturação do GPU, bem como, se devidamente explorados, na capacidade de processamento geral. Mas o grande problema da consola é que esta vantagem nem sempre se consegue obter de forma plena devido a que otimizar o paralelismo para 52 CU é algo bem mais complexo do que o fazer para apenas 36.

Associemos a isto um API 100% dedicado na PS5, e os 1,87 Tflops de diferença esfumam-se rapidamente, dando até, em alguns casos, vantagem à PS5.

É esta a situação que ficamos de explicar atrás sobre a diferença na performance real de dois sistemas que obtenham iguais TFLOPS, um por mais velocidade e outro por mais paralelismo, e onde apesar de ambas as soluções terem vantagens, se torna mais simples obter a performance total do sistema mais rápido do que do mais paralelo.



No caso da PS5, os TFLOPS não são os mesmos, mas como referido há outras alterações e optimizações internas que reduzem os tempos em que as ALUs estão paradas, traduzindo-se isso num aumento da eficiência e rentabilidade de processamento.



30 Comentários
Antigos
Recentes
Inline Feedbacks
Ver todos os comentários
Júlio Esteves
Júlio Esteves
18 de Outubro de 2023 10:23

Mário, apesar do assunto já ter sido publicado outras vezes é sempre bom aclarar e relembrar os detalhes sobre performance de sistemas (no caso videogames).
Vivemos num mundo estranho onde muitos usam a desinformação como argumento de debate. Aqui mesmo na PCManias vemos alguns assuntos recorrentes que mesmo após comprovação de fatos e relatos observamos o retorno de discussões com os mesmos argumentos já desqualificados por informação real.
Parabéns pelo trabalho e insistência em manter um fórum de debate sadio e realmente informativo.

Juca
Juca
Responder a  Júlio Esteves
18 de Outubro de 2023 10:32

Bem isso, Júlio, concordo plenamente.

Saber Sword
Saber Sword
18 de Outubro de 2023 13:45

Pixel Fill Rate Correto.

Coloca também o Texture Fill Rate onde o PS5 perde.
379,6 GTexel/s para o Seriex X e 321,6 GTexel/s para o PS5
Maior velocidade de preenchimento de texturas por segundo. (Segundo Anandtech)
Igualmente maior capacidade de Gigarays por segundo. (Ray Tracing)

E fale também que você tirou esses dados de rasterização de triângulos e culling de triângulos de um comentário do Gamefaqs. Dados que eu coloco numa zona cinza de confiança.

Last edited 1 ano atrás by Saber Sword
Saber Sword
Saber Sword
Responder a  Mário Armão Ferreira
18 de Outubro de 2023 15:32

Como é irrelevante ter taxa de texturizacão maior ?
Sabe onde o PS5 tem seu fraco contra o Xbox SX ? É justamente no modo qualidade onde elevam as resoluções ao máximo que podem.

Apesar também das memória
serem assimétricas no geral oferecem também mais banda para os drawcalls da CPU. E o trafego para GPU.

Tudo soma para a melhor execução em maiores resoluções neste hardware. Já vimos isso nas comparações third parties.

Mesmo que a resolução seja dinâmica o PS5 vem com resoluções menores.

Juca
Juca
Responder a  Mário Armão Ferreira
18 de Outubro de 2023 16:15

Fico pensando ainda na relevância de uma discussão desse nível se um Spiderman 2 de PS5 é tido por especialistas como o maior e melhor uso de RT em consoles… e olha, no Xbox, aqueles tidos como melhores estúdios deles fogem de RT como o diabo da cruz… O RT de reflexo seletivo, numa engine e jogo totalmente de nova geração… Mais capaz de RT pra quê? O que realmente já pareceu superior no Series X em algo? Um marketing que afirmava superioridade total a estimular fanboy a passarem 4 anos (sim porque essa eguagem de superioridade já existia de antes de lançarem os consoles) a arrotar nomes tosco de tecnologias meia boca e que ainda perdem em alguns jogos multi? Na boa se em teoria é melhor em algo, deveria era mostrar, porque fazendo jogos a 4k@30 sem RT ou mesmo com RT seletivo de objetos só porque está perto, deveriam era se envergonhar tendo tanto dinheiro e sendo tão incompetentes em não entregar nada que pareça superior… Quem sabe com os multi lançados por eles na concorrência não consigam.
Olha a matemática pode até ser exata, mas considerarem apenas números convenientes sem considerarem o todo, é de cair… o que todo mundo já sabe.

Last edited 1 ano atrás by Juca
Éder Rodrigo de Moura Pim
Éder Rodrigo de Moura Pim
Responder a  Saber Sword
18 de Outubro de 2023 15:14

Boas.
“Maior capacidade de Gugaray por segundo. (Ray Tracing)”
Não é o que o The Witcher 3 modo Ray tracing nos demonstra. Em certo momento de um video comparativo, no PS5 as sombras estavam perfeitas. No mesmo momento no Series X, o cavalo não tinha sombra projetada ao chão e a sombra de uma árvore, cheia de galhos, parecia uma palmeira pela sombra projetada.

Sparrow81
Sparrow81
Responder a  Saber Sword
18 de Outubro de 2023 22:17

No entanto, o melhor Ray Tracing nos consoles está no Ps5. Fica aí com suas specs que vc já demonstrou não entender nada e eu fico com o que acontece no mundo real.

Last edited 1 ano atrás by Sparrow81
Saber Sword
Saber Sword
Responder a  Sparrow81
18 de Outubro de 2023 22:45

Acho que você não deve ter visto o Forza na noite e com chuva o espetáculo visual que é.
E quanto a outra coisa tenha classe quando for falar comigo.
O Mário ter de focar intervindo nos seus comentários prova a falta disso.

Last edited 1 ano atrás by Saber Sword
Juca
Juca
Responder a  Saber Sword
19 de Outubro de 2023 7:52

Ray tracing de noite e com chuva!?!?
Não viste o pessoal da DF dizendo que as pistas lá são no cube map e que pra chuva usam apenas reflexos screen space? Que RT de reflexão é só na lataria dos carros e de objetos seletivos? Que sombras lá atualizam a apenas 15fps? Até o filtro anisotrópico é low! E olha, e isso pra um jogo de carro trazido pra ser ser um simulador (simcade) rodando em 30FPS com blur!

Agora, sua discussão aqui visa o quê? Falar do seu gosto pessoal e do jogo que você acha bonito, ou mostrar superioridade técnica de Xbox Series em alguma coisa, porque em RT ele não mostra superioridade nenhuma, apesar da RTOA que ele traz, no geral o RT no jogo é bem fraco e seletivo!

Last edited 1 ano atrás by Juca
Saber Sword
Saber Sword
Responder a  Juca
19 de Outubro de 2023 10:37

Realçando que rodo no PC 1440p com uma 3070ti mobile no ultra.

Diria que.

Você entrou na análise e acabou não vendo o jogo rodando em si. As criticas muitas vezes apontam os defeitos residuais. E não mostram o conjunto da obra, seja cubemaps em alguns trechos, sombras atualizadas com delay(sinceramente no PC acho que é em tempo real, não foi algo que vi e tenho olho pra detalhe ) e RT.

E me impressiona que este console tenha feito 4K 30 FPS com RT ali. É muito pesado o jogo, digo isso porque ele leva minha máquina no limite de cpu e gpu e não consigo 60 FPS em 1440p. Forza Tech Engine é um destaque de otimização. Então é o jogo mesmo.

Acho que nao repararam como isso consome horrores de recursos até no novo Spider (nem 4K conseguiram nele , o jogo roda em 30 FPS de 1700 a 1900p )

Voltando aos detalhes. Os reflexos das latarias dos carros é sensacional. Do chão, até das partículas realçando a iluminacao do farol e freios na chuva. É muito bonito visualmente e se destaca. Os farois que apresentam iluminação dinâmica em relação a todo cenário para todos os carros.

Este flop tem tirado minhas horas no Gamepass.

Vou acabar comprando.

Saber Sword
Saber Sword
Responder a  Mário Armão Ferreira
19 de Outubro de 2023 12:34

Todo jogo é um prodigio de disfarce. Uns mais imperceptíveis que outros. Você ja viu a renderização em camadas nas janelas dos edificios no Spider 1 ? Visualmente quase imperceptível aos olhos afiados ainda estava lá a carregar texturas com uso de step-raster (igual ao que os GTAs usam só que mais veloz).

Eu vi Forza de perto, conheço as técnicas usadas nele e onde.
E fiquei satisfeito com o jogo, não é o que importa ?

Juca
Juca
Responder a  Saber Sword
19 de Outubro de 2023 12:41

Ah tá, pensei que falavas se superioridade de console A sobre B, estás a comparar PC, que sabe-se lá quanto gastaste, com um PS5, uma máquina de 400 dólares (PS5 digital)… Provavelmente, compraste só sua GPU por um valor mais caro que um PS5… Mas vá la… Amigo, presumo, e posso estar errado, que você também não conheça o que um PS5 faz muito bem… Se vistes um Horizon Forbidden West a rodar nele, esquecerias o forza em 2 tempos… De qualquer forma, o devs do Forza perderam foi uma boa oportunidade de entregar a opção de um path tracing no PC para entusiastas de classe média como você que sempre estão a procurar por um novo Crisys a testar o limite de suas GPUs e o RT das Nvidias! Lol Estás a ver uma coisa em casa e outra no youtube e tirar conclusões… Pelo que entendi o RT do Spiderman 2 está noutro nível ao de Forza, e como sabemos RT não é leve… Mas sobre RT, achas que é mais pesado veres um jogo como Ratchet e Clank ou Spiderman Miles Morales com RT ou o Forza? Porque também penso que é melhor olhares para o conjunto da obra antes de falar de RT isso e aquilo… Mas obviamente que estou falando do que consoles fazem não do que um PC de 2 ou 3 mil euros é capaz. Pra discutirmos algo é preciso que mantenhas a mesma perspectiva das coisas, senão, só ficaremos a incrementar informações para nos justificarmos, entende?

Last edited 1 ano atrás by Juca
Netto
Netto
Responder a  Saber Sword
19 de Outubro de 2023 15:03

Comparar o Raytracing presente em Spiderman 2 super elogiado pela DF com o Forza onde o termo escolhido pra definir foi “desapontante”

É forçar a barra

Tiohildo
Tiohildo
18 de Outubro de 2023 20:37

Mario, está escrito: “Estas operações não efetuadas nas ALUS..”. Não seria: “Estas operações são efetuadas nas ALUS..”?

Isso me lembra um caso no mundo automotivo. Aqui no Brasil, há algum tempo, a marca A lançou um carro X com 128 CV turbo 1.0 com injeção direta. Outra marca B iria lança o concorrente direto Y algum tempo depois. Quando saiu as especificações do concorrente Y, foi informado que era 116 CV turbo 1.0 com injeção indireta. Os fanboys da marca A já cantaram vitória e afirmavam que o carro Y iria “comer poeira” em uma comparação ( esqueceram das N variáveis que poderiam interferir no resultado). Pois bem, quando o carro Y lançou, ele ganhou no teste de arrancada de 0 a 100 do carro X . Ou seja, teoria é teoria, prática é prática.

Vitor Hugo
Vitor Hugo
19 de Outubro de 2023 2:54

Mario, o geometry engine, do ps5, o que seria ? Um forma de processamento melhor, o que pode trazer de benefícios para o console usar em jogos.

Juca
Juca
Responder a  Vitor Hugo
19 de Outubro de 2023 8:08

Sinteticamente falando, é um motor de nova geração que trabalha a nível de hardware poupando a GPU de processamento desnecessário, evitando processar de triângulos (geometria) que na tela não seriam visíveis.

O Mário já escreveu artigos sobre, mas infelizmente não tenho como linkar aqui pelo meu dispositivo, mas você pode procurar no buscador da página por: “Já se sabe mais sobre o Geometry Engine da PS5.”, por exemplo, se quiser se aprofundar mais no assunto.

Last edited 1 ano atrás by Juca
Livio
Livio
19 de Outubro de 2023 16:00

[OFF]

As vendas das Xbox Series desceram 35% na Europa (setembro/2023 em relação ao mesmo período de 2022)

Ou seja, Starfield em nada mudou. Daí vẽ a publicidade da MS “Acorda e sonha”!!!!!

A PS5 foi a consola mais vendida com um aumento de 175% nas vendas, comparado com setembro de 2022

Imagina em outubro

Sparrow81
Sparrow81
Responder a  Livio
19 de Outubro de 2023 18:24

Vai, Phil! Sucesso absoluto do homem que tem como maior meta na vida comprar a Nintendo.

Rodrigo
Rodrigo
23 de Outubro de 2023 23:20

Mas um ótimo artigo da Pcmanias sobre esse assunto, apesar do Mário dizer que já está cansado de escrever sobre isso, espero que não pare. Mas eu acho que nesse está se contradizendo um pouco. Em um trecho é dito o seguinte: “Apesar de eu já ter escrito artigos e mais artigos a tentar explicar como mais CUs não implica mais forçosamente performance, e de como mais Tflops também não implicam forçosamente mais performance”. Em outro trecho é dito: “Perante isso, sim, no papel a Xbox é mais capaz do que a PS5!” E em outro têm-se o seguinte: “Isto não quer dizer que os CUs adicionais da Xbox não tenham vantagens para as consolas. Tem-na no numero de raios para Ray Tracing e na capacidade de texturação do GPU, bem como, se devidamente explorados, na capacidade de processamento geral”. Ou seja, deixando de lado as otimizações específicas que a Sony fez destinadas a aumentar o desempenho da GPU, porque não se sabe como os estúdios realmente exploram essas otimizações específicas, pois a grande maioria dos jogos não são lançados apenas no PS5, são também no Xbox, no PC e alguns no Switch onde essas otimizações não existem, a diferença no hardware existe sim a favor do Serie X, independente de ser mais complexo se extrair lá. Mas como os dois consoles na prática são bem semelhantes, eu acho que os desenvolvedores não estão nem um pouco interessados em usar seu tempo, o seu jogo ou seu motor de jogo para provar que a GPU do Serie X é superior, preferem apenas equiparar e lançar o mais rápido para não ficar perdendo tempo e dinheiro. Em relação aos jogos que vem com melhor performance no PS5, esse é um fator que nem deveria ser levado muito em consideração, porque o que se tem notado no PC, onde o hardware pode ser muito superior, é que os jogos ultimamente estão vindo muito mal otimizados. O que está acontecendo no PC? Será que a GPU e as otimizações específicas do PS5 são superiores a Geforce RTX 4090 ou a Radeon RX 7900 XTX?

Rodrigo
Rodrigo
Responder a  Mário Armão Ferreira
24 de Outubro de 2023 15:47

Eu sei que você já explicou muito bem esse assunto, mas quando agente observa o que acontece na prática em outros cenários, ainda ficam dúvidas. O presente artigo explicou muito bem quais as vantagens de ter o clock mais auto, mas pegando um exemplo que eu já citei aqui entre a RTX 3080 e a RTX 3070 Ti, mesmo que a 3070 Ti tivesse um clock de uns 400MHz mais auto em comparação a 3080, em nenhum cenário possível, não importa o jogo, motor de jogo, programa, onde essas duas GPUs pudessem ser utilizadas e comparadas, a 3070 com clock maior nunca seria superior a 3080, não importa em que cenário ou comparação fosse feita entre elas. Não é essa situação que agente vê na prática? Os dois consoles não estão em condições iguais? Eles não são bem semelhantes? Qual é a condição favorável do PS5? É o Geometry Engine? De acordo com a apresentação do Mark Cerny e a maneira como ele explicou, parece justo dizer que o geometry engine é outro nome para primitive shaders ou mesh shaders, pelo que entendi, é uma maneira de os desenvolvedores programarem mais facilmente a geometria no mecanismo de renderização. Inclusve parece que foi amplamente usado na demonstração UE5 para Nanite, para reduzir drasticamente o número de polígonos necessários para renderizar certas cenas e ter um controle muito melhor de LODs. É a mesma tecnologia que a AMD construiu começando com Vega, embora a Vega não tenha se beneficiado dela devido a outros gargalos, essa tecnologia está presente nas placas Navi, e a Nvidia também a introduziu em Turing, mas a chamou de mesh shaders, ou seja, mais controle sobre a geometria permitindo uma maneira mais eficiente de controlar a quantidade de polígonos necessários e melhores LODs.
Pelo que entendi, desculpe se estou enganado, parece que é a tecnologia que foi adotada por todos.

Last edited 1 ano atrás by Rodrigo
error: Conteúdo protegido