转帖ps5机能的相关文,解释了为何ps5第三方游戏表现出色
- bazingarA9新闻区不评论,但文章是干货,3月份一个访谈。只节选几段相关机能的部分中文翻译,有兴趣的去看原贴。
不愿看长文,结论(不喜勿喷)是xsx硬件设计的原因难以发挥12T峰值算力,PS5硬件设计则很容易突破10.28T。软件API简单说PS5自研系统和API效率更高,更容易开发。
https://bbs.a9vg.com/forum.php?mod=viewthread&tid=7772409&mobile=1
原文是https://vigiato.net/p/85342的阿拉伯文访谈,NG网友翻译成英文https://www.neogaf.com/threads/n ... 0978/post-257680235
本次访谈的对象是Crytek的引擎渲染师Ali Salehi,提问者是Mohsen Vafnejad 和 Shayan Ziaei
在此人肉翻译成中文,一些次要问题和赘述略过不翻,但是我保证翻译的部分一定忠于原文(但阿拉伯文转的英文有一定的错误不好理解也没办法)
=============
问:如果我没理解错的话,Tflops难道不是优化GPU不同部分的标准吗?或者这些浮点数意味着什么?你怎么向不理解这些信息的用户描述它?
答:问题是公开宣布这些信息(Tflops)的人才应该来解释这个,但对普通用户来说这种技术信息没什么意义,也不是衡量的标准。
比如图形卡,假设有20个不同的部分组成,其中之一是计算单元(CU),CU执行的是处理功能。如果CU相邻的其它部分都以最佳方式运行,那么就不会产生限制,the battery does not boot(不懂),且只要处理器具备必须的信息,在此模式下的服务器可以每秒进行12次的浮点运算。所以在理想情况下,如果我们移除了所有的限制参数,这是可能的,但是现实里不是这样的。
一个好的例子就是XSX的硬件。微软将RAM分隔为两部分(10G+6G),这个错误在X1上他们也犯过。一部分内存带宽高而另一部分带宽低。显然,给这台主机编程就有点一言难尽,因为我们需要放进快内存的东西总数有那么多,这就有点让人烦恼了. 所以往往会有一些部件阻止图形卡达到那个标称速度
问:PS5有36 CUs, XSX有52 CUs,差别在哪里?
答:主要的不同点在于PS5的工作于一个远为更高的频率。这就是为什么,尽管在某些方面有差别,但这个差别不会很大。一个有趣的比喻来自于一个IGN记者,他形容XSX是一个标准的8缸引擎,而PS5类似一个涡轮增压的6缸引擎。
在PS5上提高时钟频率就我看来提供了一系列优点,因为比如内存,光栅器以及图形卡上的其它部件的运行性能和时钟相关。所以PS5 GPU的其余部分运行比XSX快,这些优点甚至会让PS5主机实际工作在高于其所宣称的10.28T之上。而对XSX来说,因为GPU的其余部分更慢,所以它也许在一般情况下运行于更低的Tflops,而仅仅在非常理想的条件下才会达到12 Tflops
问:这个差异会不会到世代末期,开发者极度熟悉XSX硬件后就不产生影响了呢?
答:不,因为PS软件接口扩展性性一般更强,所以到世代末期SONY的主机会有更为惊艳的表现。例如在第七代主机,即使跨平台表现普遍在PS3上不佳,但神秘海域3和美国末日的表现你也看到了。我认为下一代主机也是如此。
但是如果讲到更高的原生分辨率,PS4也许会有些小麻烦,XSX可以显示更多的像素。
问:sony说数量越少,你越能整合任务,这是什么意思?
同时使用所有的CUs是有代价的。因为CU需要分配给图形卡的资源以运行代码,如果图形卡不能将所有的资源分配到所有的CU上以运行一个代码,那么可执行的CU数量将会下降。例如,对52个CU仅利用其20%,因为图形卡没有足够的资源在所有的时间支持所有的缓存。For example, instead of 52, use 20% of it because it doesn't have enough resources for all caches at all times.
觉察到这个问题后,SONY征用了一个更快而不是更大的GPU来减少制造成本。一个更突出的例子是SIP,你看AMD甚至Intel的超多核CPU不一定能工作得更好,在游戏中,4或8核但是单核频率更高的CPU往往在游戏中表现得更好。显然一个16或者32核得CPU具有更高的Tflops,但是在游戏中更少更快速得核心能做得更好。因为对开发者来说,在所有时间都利用到所有的核实在是困难的,他们更喜欢更少而更快的核心。
问:作为一个程序猿和开发者,你认为哪个平台在开发和编程上最佳?PlayStation 5 or Xbox X series?
答:绝对是PS5.
作为一个程序猿,我要说PS5好得多,而且我不觉得你能找到觉得XSX表现比PS5好的程序猿(and I don't think you can find a programmer who can outperform the PlayStation 5 from the Xbox X-Series)。对XBOX来说,他们必须将Directx和windows搬上主机,这些东西历史悠久。而对于每一代SONY制造的主机来说,SONY可以随心所欲地重建软件和API,这同时符合他们和我们的利益。因为每件事只有一种做法,而他们提供的是尽可能地最好的做法。 - 久保由利香群号发一下,无恶意,纯想进去观摩
- 冰箱研会长e-3M看了二楼, 深刻理解了什么叫气急败坏。。。
- KarlHeisenberg你钓了一上午鱼了,休息会好么
- crosz2楼这货受什么刺激了,昨天今天发了不少脑瘫帖子
- thez
- peh这贴没一个讨论主楼内容的也是绝了,狗咬狗一嘴毛
=============================
比如图形卡,假设有20个不同的部分组成,其中之一是计算单元(CU),CU执行的是处理功能。如果CU相邻的其它部分都以最佳方式运行,那么就不会产生限制,the battery does not boot(不懂),且只要处理器具备必须的信息,在此模式下的服务器可以每秒进行12次的浮点运算。所以在理想情况下,如果我们移除了所有的限制参数,这是可能的,但是现实里不是这样的。
一个好的例子就是XSX的硬件。微软将RAM分隔为两部分(10G+6G),这个错误在X1上他们也犯过。一部分内存带宽高而另一部分带宽低。显然,给这台主机编程就有点一言难尽,因为我们需要放进快内存的东西总数有那么多,这就有点让人烦恼了. 所以往往会有一些部件阻止图形卡达到那个标称速度
=============================
这段是机翻吗,他的意思是因为微软的内存分割,导致内存没法保持在最佳运行状态,还是说短板木桶,结果快内存发挥不出来只能根据慢内存决定实际速度?这样有什么好处吗?总不可能没好处我设计硬件的时候去把内存分割开来
- mcq_2正经侠认为浮点运算能力代表的是处理速度还是处理容量?想一想这个问题,自然就有答案了。
- peh我也觉得
虽然软件拉跨拖累硬件这种事并不少见,但ms好歹也做了三代的游戏主机了,开发套件和api可以烂到把这样的硬件差距直接抹平甚至拉到更低实在是难以理解
不过主贴的意思是微软硬件也只是规格上比别人高,架构也被爆了.. - 金子一马弱智的过分了就很可能是反串了,这些人还是绕开比较好,脑子有问题的
- mcq_2现在就下结论还太早了。你见过显卡硬件指标好看但是就是跑不起来的情况么,而且处理芯片还是通一家的
- csolfans因为xbox其中一个战略目标是统合pc和游戏主机
- bazingar微软也有开发者谈xsx设计,找不到帖子。此贴是A9屁股大战被挖坟顶上来的, 手动捂脸
ps5内存带宽448GB/S
XSX 10G 560GB/S 6G 336GB/S - 医生狼多2l这傻逼上蹿下跳一天了,能不能找个管理员塞了啊
- peh这样设计的目的是什么?总不可能是为了省钱吧,这6G快相当于10G部分折半了
- 66666国外网站主流观点认为是XSX初期开发工具并没有充分发挥游戏主机的特性,第三方直接就是拿PC版另存为就直接上了XSX自然在性能上可能会没有优化到位
- 膝盖君机能强劲,还得是俺们ps5
- GuardHei“ 一个好的例子就是XSX的硬件。微软将RAM分隔为两部分(10G+6G),这个错误在X1上他们也犯过。一部分内存带宽高而另一部分带宽低。显然,给这台主机编程就有点一言难尽,因为我们需要放进快内存的东西总数有那么多,这就有点让人烦恼了. 所以往往会有一些部件阻止图形卡达到那个标称速度”
这里翻译的很奇怪啊。xsx这个划分明显就是10高速划给gpu做显存,所以带宽比ps5还高不少。那按这个说法就是显存不够用,所以要streaming内存/ssd的内容给显存。然而微软有xva和sfs来解决这个问题,而且本世代游戏就算是4k分辨率下+超清材质,10g高速显存你跟我说不够用?需要从别的地方加载进去?这就有点离谱了。
或者翻译的问题? - GuardHei“
同时使用所有的CUs是有代价的。因为CU需要分配给图形卡的资源以运行代码,如果图形卡不能将所有的资源分配到所有的CU上以运行一个代码,那么可执行的CU数量将会下降。例如,对52个CU仅利用其20%,因为图形卡没有足够的资源在所有的时间支持所有的缓存。For example, instead of 52, use 20% of it because it doesn't have enough resources for all caches at all times.”
恕我直言,以我个人的开发经验来说,能说出这种话的,真的是难以想象。合理分配cu是优化的基本操作,尤其现在各种异步compute大行其道的时候。而且本身硬件也没那么蠢。只有在人为的管线设计出现失误导致某时间段大家都在等一个轻量级task才会导致闲置cu用不上的情况干着急。
但是异步gpu任务+framegraph这类操作在本世代机上就已经是基操的东西你和我说次世代反而做不到了?
更何况高分辨率下很多compute操作也需要更多cu来解决才对。
老实说,这个人的发言对我来说相当迷惑。 - hshiki可以理解为PS5对开发者优化做的比较好吗?
- bazingar我硬件小白,难以回答大佬问题。这位渲染师一家之言看看就好。
如果是开发工具导致xsx表现不达预期,只能通过时间验证。 - IcarusInFire老文了,槽点略多,拿cpu和gpu类比来说明高频低核更好把我整笑了。。。个人感觉还是api的问题
- kkk9233差不多得了,就两款育碧游戏这么快就盖棺定论了?
- frankCC现在总共就两家三个游戏,连问题出在哪里也没确定,就谈设计不足是不是早了点。万一多翻转几次......
- UmarIbnLaAhad
我还是觉得是微软第一方惹的祸,17年天蝎刚出第三方表现一样群魔乱舞的,还有很多人嘲笑比pro贵了100画面帧数反而更差,不过那时候至少Forza7是真的4k60
至于天蝎口碑彻底碾压pro要等到rdr2了 - D-JoeII照這說法5500XT應該比5700更好,但事實不然
- D-JoeII因為XSX的內存根本就沒分割,跟360/PS4/PS5一樣都是統一在一個內存池
- allenz2这文章没啥参考价值,基本扯谈
但现在有一点是可以确认的,次世代的open world游戏,XSX表现很大可能不如PS5,因为PS5专用解压芯片释放了CPU算力,而开放世界游戏材质模型加载卸载是相对频繁的,场景运动物体也可能比较多需要占用CPU
小场景游戏我觉得应该还是可以发挥XSX优势,但话又说回来,如果小场景游戏PS5能跑到60FPS那么XSX多出来的算力也是高不成低不就 - GuardHei不是有direct storage和xva吗
- D-JoeII不是,XSX也有解壓芯片...
- Vladimeow经典气急败坏
- bazingar有种说法,为了移植pc方便,xsx用了win dx12,而不是ps5的专门api,导致低效率
- mcq_2别瞎猜了。根本站不住脚。
PS4pro跟X1X差了2t的浮点性能,照样有些游戏PS4pro帧数超过X1X。 - Re.Troy小场景那不是得@索尼第一方,软又输
- 精钢魔像不大可能,api通用不代表低效率
dx12是微软提出一个标准,dx12 要做这个那个,函数签名这个那个,调用流程这个那个
a卡和n卡根据自身硬件在驱动里实现
开发者对需求做抽象,最后的工作都是调驱动,驱动控制硬件 - D-JoeII其實DF有提到他們有消息指微軟又換了開發套件,而且開發機交得很晚,但是否真實要看之後遊戲的表現
雖說開發機晚這事X1X就發生過,17年E3時訪問菲爾他就說開發機才剛剛交貨 - AW4WA
- GuardHei
- 海马怎么叫笑死了,-110的论坛键盘侠也能出来谈编程了
- D-JoeII是,你可以用拿PS3的拆機圖和XSX的拆機圖看分割和統一內存池的分佈
- AW4WA但的主机里的 16GB 是内存和显存共享的啊,还是不宽裕吧
- GuardHei我说了啊,高速的是10g的,不是6g的啊... 不管怎么分都不应该是瓶颈的。完全可以直接10g都给显存,没必要“再分割”,尤其现在育碧各种gpu driven管线,大头数据在gpu。
你要这么看的话,ps5那个全部都440G/s。如果带宽是瓶颈的话,ps5那个才最是问题。
—— 来自S1Fun - D-JoeII應該不是問題,系統用的內存是全交給6GB那邊的
而且這個"低速"內存其實還是比X1X的內存快一點,既然X1X能4k的話XSX更加沒問題 - 苍白の正义这篇远古老文怎么又被翻出来了。
当年我看到文章说XSX的12T无法完全发挥我就笑到不行了。
XSX的GPU频率都是固定的,还“无法完全发挥”。
写文章这哥们领英的履历上只做过手游,却对主机开发侃侃而言我也是服了。 - 苍白の正义XSX也有专用的解压芯片,不会挤占CPU算力。
- Rarity536cu超冒烟就干翻52cu,想必稍有diy经验的人都心里有数吧