如果您点击链接并进行购买,我们可能会收到一小笔佣金。阅读我们的编辑政策

PlayStabwin世界杯bwin必赢亚卅tion 4 Pro内幕:索尼如何制作第一台4K游戏机

“权力本身并不是目标。问题是,这种力量使什么成为可能。”

在索尼最新主机发布六周后,我在索尼圣马特奥新总部的一间会议室里,在系统架构师马克·塞尔尼(Mark Cerny)的陪同下,回顾了迄今为止公布的大部分PlayStation 4 Pro游戏。bwin必赢亚卅bwin世界杯这是一个证实新硬件确实提供了我上个月看到的高质量4K游戏体验的机会,但更重要的是,这是我们发现索尼如何成功实现这一成就的地方——它如何部署了相对轻微的4.2万亿次浮点运算的GPU能力,从而使PS4 Pro成为超高清显示器的可行主机。

“当我们设计硬件时,我们从我们想要实现的目标开始,”Cerny说。“权力本身并不是目标。问题是,这种力量使什么成为可能。”

显而易见的是,索尼本身——也许不像它的竞争对手——就是这么做的相信主机硬件的概念时代已经结束。Cerny提出了一系列他认为可以重置游戏能力的标准:主要是新的CPU架构和大幅增加的内存分配。当然,GPU能力的巨大改进——Cerny提到了他给开发人员做的关于PS4图形核心的434页,8小时的ppt演示。对于游戏开发者来说,这是一种新的模式。

从所有这些标准来看,PS4 Pro并不是新一代硬件,也没有400页的简报。索尼的新游戏机是对现有模式的扩展——通过这种方式,现有PS4上的游戏可以在新的4K显示硬件上进行优化,同时为现有高清电视的用户提供增强的体验。这是同一代人——最能说明问题的是开发人员在开发Pro软件时需要付出的实际努力。

Cerny解释道:“作为一个中期版本,我们知道我们所做的一切都需要开发者付出最少的努力。“我们在纽约发布会上展示了《Days Gone》在PS4 Pro上的运行。这项工作很小,一个程序员就能完成。总的来说,我们的目标是将PS4 Pro支持所需的工作保持在创造一款游戏所需工作的百分之一,我相信我们已经实现了这一目标。”

PS4 Pro采用了FinFET生产技术,以便在外形大致相似的情况下,将两倍于基础PS4的功能塞进去。
基地PS4 PS4职业 提高
CPU 8个1.6GHz的美洲虎核心 8个2.1GHz的美洲虎核心 1.3倍
GPU 18 Radeon GCN计算单元在800MHz 36个改进的GCN计算单元在911MHz 2.3 x失败
内存 8GB GDDR5, 176GB/s 8GB GDDR5, 218GB/s 带宽增加24%,可用内存增加512MB

最终的结果是一个聪明的设计,考虑到一个严酷的现实,4K显示器的有效像素是标准高清电视的4倍,这个设计可能看起来有些保守。但为了迎接这一挑战,PS4 Pro必须完美地运行现有的700多款PS4游戏——这是基础硬件的关键要求,对新主机的设计产生了深远的影响。

“首先,我们把GPU的大小扩大了一倍,把它放在一个镜像版本的GPU旁边,有点像蝴蝶的翅膀。这为我们提供了一种非常干净的方式来支持现有的700种游戏,”Cerny解释道,并详细介绍了Pro如何切换到“基本”兼容模式。“我们只是关闭了一半的GPU,并以非常接近原始GPU的方式运行。”

在Pro模式下,整个GPU处于活动状态,并以911MHz的频率运行——频率提升了14%,将GPU功率从2倍提升到2.24倍。然而,CPU在原始功能上并没有得到同样的提升——索尼认为与现有PS4的互操作性是坚持使用相同的、相对适度的Jaguar CPU集群的主要原因。

“对于可变帧率游戏,我们希望提高帧率。但是我们也想要互操作性。我们希望现有的700款游戏能够完美无缺地运行。”这意味着CPU将保留8个捷豹核心,并将频率提高到新的工艺技术所能达到的最高频率,最终达到2.1GHz。它比现有型号的1.6GHz高出30%左右。”

但x86确实是一个很好的均衡器吗?当然,升级CPU不应该有什么不同-毕竟,它没有在PC上。这只是让事情变得更好,对吧?索尼不同意使用固定平台的游戏机。

Cerny解释道:“换一个不同的CPU——即使有可能避免对主机成本和外形因素的影响——也会有很多现有游戏无法正常工作的风险。”“这些问题的根源在于,在新CPU上运行的代码运行时间与旧CPU非常不同,这可能会暴露出游戏中从未遇到过的漏洞。”

但是在PS4的基础模式(类似于Xbox One S)中部署额外的Pro GPU功能呢?或者仅仅保留111MHz的GPU频率提升?对于索尼来说,一切都是为了安全起见,以确保现有的700部游戏能够正常运行。

“我已经做了很多实验,寻找频率变化时的问题……嗯…(笑)我认为最重要的是,我们需要一切都完美无缺。我们不希望人们在从标准机型转向PS4 Pro时意识到任何可能出现的问题。”

但就其核心架构而言(似乎是必然的),Pro确实有许多增强功能。当然,需要更多的内存。

“我们觉得游戏需要多一点内存——大约多10%——所以我们在主机上增加了1gb的慢速传统DRAM,”Cerny透露,并证实了它本质上是DDR3。“在标准模式下,如果你在应用程序(如Netflix)和游戏之间切换,即使你在玩游戏,Netflix仍然在系统内存中。我们使用这种架构是因为它允许在应用程序之间进行非常快速的交换。什么都不需要加载,它已经在内存中了。”

有些人可能会说这是对PS4快速GDDR5内存的过度使用,所以Pro中额外的DDR3内存被用于存储非关键应用程序,为游戏开发者提供了更多内存。

“在PS4 Pro上,我们采取了不同的做法,当你停止使用Netflix时,我们将其转移到速度较慢的传统gb DRAM上。使用这种策略可以释放8g GDDR5中的近1g。我们用512MB的空闲空间来玩游戏,也就是说游戏可以使用5.5GB,而不是原来的5 gb,剩下的大部分空间我们用来制作PS4 Pro界面——也就是你按下PS按钮时看到的画面——4K,而不是现在的1080p。”

游戏开发者可以使用他们认为合适的内存,但在大多数情况下,它将处理所需的4K渲染目标和缓冲区,基于与PS4版本完全相同的基础资产——所以我们在《古墓丽影:崛起》、《孤岛惊魂:原始版》和许多其他游戏中看到的4K纹理包不太可能适合可用的空间。Cerny表示,这些资产可能要花费“数百万美元”,而且不符合PS4 Pro的核心理念——为开发者提供廉价、简单的4K支持。

为了适应超高清渲染,GPU也有明显的提升,它们来自AMD现在和未来的架构,就像Cerny上个月在PlayStation会议上说的那样。bwin必赢亚卅bwin世界杯

“北极星是一个非常节能的GPU架构,让我们大大提高了GPU的能力,同时保持主机的外形基本相同。DCC是delta颜色压缩的缩写,是北极星改进的路线图功能。这是它在PS4 Pro上的Plabwin世界杯bwin必赢亚卅yStation首次亮相,”Mark Cerny分享道,并在此过程中证实了这一功能在标准的PS4模型中实现。

“DCC允许对去往framebuffer和渲染目标的数据进行空中压缩,从而减少用于访问它们的带宽。由于我们的GPU能力的增长超过了带宽的增长,这可能会非常有帮助。”

北极星的其他元素也出现在PlayStation 4 Pro上,尽管它们的部署可能与独立GPUbwin世界杯bwin必赢亚卅的等效功能稍有不同。

原始的丢弃加速器提高了效率,因为太小而影响渲染的三角形被从管道中移除。它更容易打开,速度的提高可以相当明显,特别是如果使用MSAA,”Cerny解释道。

“最后,还可以更好地支持半浮动等变量。到目前为止,在AMD架构中,半浮点数将占用与32位浮点数相同的内部空间。使用它们并没有太大的好处。然而,使用Polaris,可以在寄存器中并排放置两个半浮点数,这意味着如果你愿意在着色器程序中标记哪些变量适合16位存储,你可以使用两倍的数量。注释你的着色器程序,说哪些变量是16位的,然后你将使用更少的向量寄存器。”

PS4 Pro的增强也旨在从基本的AMD计算单元中提取更多的利用率。

“在CU上运行多个波阵面是一件很棒的事情,因为当一个波阵面出去加载纹理或其他内存时,其他波阵面可以愉快地进行计算。这意味着你对ALU的利用率会提高,”Cerny分享道。

“你能做的任何事情都是在CU上添加更多波前,让CU运行得更多。矢量寄存器的数量是有限的,所以如果你使用更少的矢量寄存器,你可以有更多的波前,然后你的性能就会提高,所以这就是原生16位支持的目标。它允许更多的波阵面同时运行。”

我们还深入了解了AMD的半定制硬件设计关系实际上是如何工作的。到目前为止,人们的看法是,控制台apu实际上是一个现成的AMD部件的组合,并进行了有限的修改。毕竟,PS4的GPU看起来很像Radeon HD 7850和7870中首次亮相的Pitcairn设计。Xbox One与Radeon HD 7790首次亮相的Bonaire处理器的关系不仅仅是短暂的。

“之后你可能会看到一些看起来非常像主机GPU的独立GPU,但那是非常熟悉的设计,并从主机GPU中获得灵感。因此,如果你看到一个相似之处,实际上与你的想法相反,”Cerny解释道,他说主机设计是‘经过实战考验的’,因此更容易部署为独立的GPU产品。

与完整的PC体验相比,4K模式下的《古墓丽影:崛起》有一些局限性,但基本上还不错。

“一些AMD路线图功能首次出现在PS4 Pro中,”Cerny继续说,并对半自定义关系的功能进行了广泛的概述。

“它的工作原理是,我们与AMD坐下来,他们非常合作。和他们一起工作真的很愉快。所以基本上,我们会说我们想要有多少个cpu,我们会看路线图功能,我们会看区域,我们会做一些决定,在这种情况下,我们甚至有机会,时不时地,在我们的芯片中有一个功能,在它在独立的GPU中之前。这次我们有两个,非常好。”

这些工作也会反馈到Radeon的独立产品中,有助于保持PC和主机游戏开发的一致性。例如,异步计算在PC DX12应用程序上为AMD带来了巨大的好处,特别是因为Mark Cerny在PS4设计中支持的额外硬件调度管道。

Cerny自豪地说:“我们可以定制功能,它们最终会出现在(AMD)的路线图上。”“所以王牌们……我对异步计算非常有热情,所以我们为最初的PlayStation 4做了很多工作,这些工作最终被整合到后来的AMD gpu中,这很好,因为PC开发社区非常熟悉这些技术。bwin必赢亚卅bwin世界杯当我们所热衷的gpu部分应用于PC领域时,它可以帮助我们。”

事实上,AMD在Pro中首次推出了两个新的路线图功能,在即将到来的Radeon PC产品中发布之前——可能是今年年底或明年年初的Vega gpu。

“第一次出现的功能之一是对16位变量的处理——它可以一次执行两个16位操作,而不是一个32位操作,”他说,这证实了我们在访问VooFoo Studios查看《螳螂燃烧赛车》时学到的东西。换句话说,在全浮点运算下,我们的浮点运算次数为4.2万亿次。现在有了半浮点运算,这个数字翻了一番,也就是说,在16位计算中,每秒8.4万亿次浮点运算。这有可能从根本上提高性能。”

GPU设计中还增加了一个工作分发器,旨在通过更智能的工作分配来提高效率。

《螳螂燃烧赛车》在PS4 Pro上的原生4K与标准的PS4基础游戏进行了比较。你购买的所有PS4都可以转换到PS4 Pro。

“一旦GPU达到一定的大小,GPU就必须有一个中央大脑,智能地分配和负载平衡渲染的几何图形。所以它是非常专注于,说,几何着色和镶嵌,尽管有一些基本的顶点工作,以及它将分发,”Mark Cerny分享,在解释它如何改进AMD现有的架构之前。

“PS4 Pro中的工作分发器非常先进。它不仅有相当戏剧性的镶嵌改进从北极星,它也有一些后北极星功能,加速渲染场景与许多小物体…因此,改进在于单个补丁可以智能地分布在多个计算单元之间,这比听起来要复杂得多,因为细分和渲染补丁的过程相当复杂。”

除此之外,我们将进入有趣的东西——索尼推出的定制硬件,“秘密武器”的元素,使Pro图形核心远远超出其重量。在创建4K framebuffer时,许多技术基础实际上是基于先进的抗锯齿工作,并创建了可以以多种方式利用的新缓冲区。

目前,像FXAA或SMAA这样的后处理抗锯齿技术有其局限性。边缘检测精度变化很大。基于高对比度差分、深度或法线地图——或两者结合——的搜索都有局限性。索尼已经形成了自己高度创新的解决方案。

Cerny说:“在执行空间抗锯齿时,我们真的很想知道对象和三角形的边界在哪里,但对比度、Z(深度)和法线都是不完美的解决方案。”“我们还想跟踪帧与帧之间的信息,因为我们正在执行时间抗锯齿。如果能更好地了解前一坐标系和当前坐标系之间的关系,那就太好了。对于计算机图形学中这个长期存在的问题,我们的解决方案是ID缓冲区。它就像一个超级模板。它是由自定义硬件编写的包含对象ID的单独缓冲区。”

看一下发送到PSVR耳机的图像。第二代PSVR游戏将能够利用定制的多分辨率技术,允许视图的“边缘”以较低的分辨率呈现。这将大大提高性能,而不会对HMD的图像质量产生明显影响。

它是基于硬件的,与Z缓冲区同时编写,不需要调用像素着色器,它以与Z缓冲区相同的分辨率运行。第一次,物体及其在世界空间中的坐标可以被跟踪,甚至单个三角形也可以被识别。现代gpu无法在不影响性能的情况下访问三角形计数。

Cerny解释道:“由于有了ID缓冲区,你现在可以知道物体和三角形的边缘在哪里,并在帧与帧之间跟踪它们,因为你可以在帧与帧之间使用相同的ID。”“所以这是开发人员工具箱中的一个新工具,就它所支持的技术而言,它是相当具有变革性的。我将解释使用缓冲区的两种不同技术——一种更简单的是几何渲染,另一种更复杂的是棋盘图。”

几何渲染是一种更简单的超高清渲染形式,允许开发人员创建“伪4k”图像。1080p渲染目标的深度值相当于一个完整的4K缓冲区,加上每个像素也有完整的ID缓冲区数据-最终的结果是,通过后期处理,这些“奇异”像素的1080p设置可以外推成一个支持alpha元素(如树叶和风暴围栏)的4K图像(尽管需要额外的费用)。在像素计数上,它将被解析为原生4K图像,使用从ID缓冲区中获取的数据进行颜色传播来推断出“缺失”数据。然而,它有一个深刻的局限性。

“像素着色器调用不会改变,所以纹理分辨率不会改变,”Cerny解释道,他指着一些Infamous First Light图像上模糊的1080p级纹理细节。“而且镜面效果不会改变。但它确实极大地提高了图像质量。”

成本非常低,我们认为这有助于1080p的超级采样场景,但Mark Cerny指出了另一个潜在的应用。在PS4基础硬件上,900p的标题渲染可以通过一些额外的功率提升到1080p,然后几何渲染可以提升到4K。从我所看到的《InFamous》演示版本来看,它在清晰度上有了很大的提升,但它与完整的原生4K包并不相似。棋盘棋则是另一回事。

《杀戮楼层2》使用1800p分辨率和棋盘游戏。我们有一大堆PS4 Pro的视频,深入分析。

高达4K的棋盘棋要求更高,需要一半的基本分辨率——1920x2160的缓冲区——但通过访问ID缓冲区中的三角形和对象数据,可以在基本棋盘棋输出的技术层上实现漂亮的事情。

“首先,我们可以进行与几何渲染相同的基于id的颜色传播,因此我们可以在进入时间之前获得一些优秀的空间抗锯齿,即使不注意前一帧,我们也可以创建比4米颜色样本排列在矩形网格中更高质量的图像……换句话说,图像质量立即优于1530p,”Cerny认真地解释道。

“其次,我们可以使用前一帧的颜色和id,也就是说我们可以做一些非常好的时间抗锯齿。显然,如果相机没有移动,我们可以插入前一帧的颜色,基本上得到完美的4K图像。但是,即使摄像机在移动,或者场景的某些部分在移动,我们也可以使用ID——对象ID和三角形ID来寻找前一帧的适当部分并使用它。所以id给了我们一些关于如何使用前一帧的确定性。”

那么几何渲染和检查板如何在他们的正负点方面工作呢?

Mark Cerny解释道:“使用棋盘渲染,前两个优点是相同的:清晰的边缘,详细的树叶,风暴围栏,但同时,纹理的细节增加,镜面效果的细节增加。”“但是我们正在加倍像素着色器的工作量,还有其他的开销,可能不可能从1080p的本机一直到2160p的棋盘板。”

《古墓丽影:崛起》的棋盘板高达4K帧缓冲,通常看起来非常令人印象深刻,但请注意图像底部头盔周围蒸汽的1/16分辨率alpha。

显而易见的是,几何渲染更便宜,单个开发人员可以在几天内建立并运行一个解决方案。跳棋在许多方面都更紧张,需要更多的练习——几个星期。而且还有连锁反应。时间抗锯齿需要调整,这是我上个月在PlayStation会议上看到的《地平线:零黎明》演示版本。bwin必赢亚卅bwin世界杯

Cerny总结道:“关键在于,这些技术只需要游戏总预算的几分之一就能实现。”而且,随着向开发者提供示例代码,未来所有支持PS4 Pro的游戏应该会出现相对较少的问题。那么,我上个月在纽约看到的几家公司情况如何呢?在那里部署了什么技术?

《神秘海域4》正在进行重组(“他们正在重新审视渲染策略,”Cerny说),但在透露的13款游戏中,有9款使用了棋盘棋。《天去地来》、《使命召唤:无限战争》、《古墓丽影:崛起》和《地平线:零黎明》都有高达2160p的棋盘游戏渲染,在全高清显示器上超采样到1080p,而《劳拉·克劳馥》有多种模式,明确支持1080p。Mark Cerny敏锐地指出,开发者可以自由地使用他们认为合适的棋盘技术,所以我们将看到许多不同的变体和解释。

Cerny告诉我:“《看门狗2》、《杀戮层2》、《臭名昭著》和《质量效应:仙女座》都使用了1800p的棋盘格。”对于拥有1080p屏幕的用户来说,可能还有一些非常棒的消息。“超级采样在高清电视支持方面非常受欢迎。“仙女座质量效应”有两种截然不同的策略。它们有4K的棋盘图案,还有一个单独的1080p高质量图像模式。”

从1800p开始,开发者可以使用带有2160p HUD和菜单元素的软件缩放,或者坚持使用1800p并允许硬件缩放到4K。《杀出重围:人类分裂》是一个有趣的游戏。它也使用棋盘式呈现,但它也采用了动态framebuffer。分辨率根据场景复杂程度在1800p和2160p之间变化。到目前为止,只有一张截图可用,我们计算的是3360x1890。

我们期待看到一系列有趣的升级战略。实际上,《杀出重围》使用了结合了动态框架缓冲区的棋盘棋。

“所以13个游戏中有9个是棋盘游戏。在这四款游戏中,《暗影魔多》使用动态分辨率的原生渲染。分辨率差异很大,但通常是4K的80%到90%。”Cerny继续说道。“Paragon的补丁有一个1080p原生渲染的高清电视模式,并对视觉效果进行了许多增强,包括运动模糊、程序地面覆盖、像这些神射线这样的特效……在4K电视上,你只能看到1080p图像的升级版。”

不过,1080p的升级版不会太常见,索尼表示强烈鼓励支持更高分辨率的超高清屏幕。

Cerny继续说道:“展望未来,我们非常鼓励对4K电视和高清电视的直接支持,尽管我们将他们如何做到这一点的具体细节留给开发社区。”“他们最清楚,但我们真的希望看到4K电视的更高分辨率模式,然后是高清电视的一些技术。它可以从更高的分辨率缩小。”

我们已经看到开发人员采用了他们自己的4K演示。即将上映的《蜘蛛侠》和《终极荣耀》都使用了400万个抖动样本,开发人员认为这是一种比棋盘棋更优越的技术,计算成本也差不多。但索尼提供的唯一ID缓冲区可能仍然有助于这些技术的成功。

“ID缓冲区将与这些技术中的任何一种集成,甚至是本地渲染,”Cerny继续说道。“你可以使用ID缓冲区来获得时间和空间的抗锯齿。它和所有东西都有层次。”

随后进行了演示,他们的表现和在PlayStation会议上一样出色。bwin必赢亚卅bwin世界杯事实上,它们更好,因为我们看到了更多——比如原生4K,几何渲染和棋盘式4K在InFamous First Light的比较。我还看了《Days Gone》和《checkerboard》的超高清对比,人为地设置了低帧率限制,以使比较更公平。这种对比真的很显著——我站在离65英寸索尼ZD9显示屏一英尺远的地方仍然举起。棋盘棋要柔和一些,但我敢打赌大多数人都看不出来。最重要的是,在1080p的基础上,画质的提升是巨大的。

Insomniac Games利用Epic的Brian Karis和Timothy Lottes的作品,在其新蜘蛛侠游戏中使用400万像素的抖动帧缓冲区制作4K图像。它相信,在开销相似的情况下,质量可以超过棋盘游戏。

但对于标准高清电视的用户来说,也有好消息。云纹图案和短暂的闪烁消失在暗影魔多,给一个更干净的呈现。《古墓丽影:崛起》的像素爬行AA解决方案让位于原始、坚固的外观。PS4 Pro最适合4K显示器,但对于那些拥有高清电视和《Paragon》、《古墓丽影》和《质量效应:仙女座》的人来说,这是真正的胜利。很明显,主要的开发者希望吸引那些可能还没有准备好升级到4K屏幕的人。

但我从与Mark Cerny的会面中获得的最大收获可能是索尼如何看待主机世代。PS4 Pro和天蝎座计划一直被视为向一个新的、更强大的硬件浪潮跳跃的开始,有利于中间升级。很明显,索尼对此并不买账。Cerny引用了不兼容性问题,甚至在x86 CPU和AMD GPU架构之间移动。我的印象是,PS5将是一个彻底的突破,正如我们所知道的,一个真正的世代飞跃。我对天蝎座计划没有同样的感觉,所有的迹象都表明微软试图围绕Xbox品牌建立自己的类似steam的库,让游戏随着你从一个主机转移到另一个主机——最终,甚至可能转移到PC上。

但此时此刻,我与马克·塞尔尼的会面有两个目的。一方面,我看到了更多的PlayStation Meeting演示以及更bwin世界杯bwin必赢亚卅多我们所期待的1080p增强。在这两方面,我仍然对这个350英镑/ 399美元盒子的效果印象深刻。并不是每一款游戏都是绝对原始的,但我们已经看到了很好的结果,很高兴看到开发人员在研究他们自己的技术来实现像样的4K -我真的很期待看到蜘蛛侠的表现。VR游戏也会有提升,硬件多分辨率支持应该会提高第二代PSVR游戏的性能。

我们很快就会有更多关于这方面的内容,以及其他自定义硬件功能,但与此同时,等待还在继续,直到我们亲身体验零售硬件和大量游戏。会很有趣的。

bwin888官网Digital Foundry在圣马特奥的PlayStation园区bwin世界杯bwin必赢亚卅会见了Mark Cerny。索尼支付了旅费和住宿费。

你会支持Digital Foundry团队bwin888官网吗?

bwin888官网Digital Foundry专注于游戏硬件和软件的技术分析,使用最先进的捕获系统和定制软件向您展示游戏和硬件的运行状况,准确地可视化它们的能力。为了向你展示4K游戏的真实面貌,我们需要建立自己的平台,为离线观看提供高质量的4K视频。于是我们就这么做了。

我们的视频文件是几亿字节,我们选择了高质量的提供商,以确保快速下载。然而,带宽并不是免费的,所以我们每月收取4.5英镑的小额订阅费。我们认为这是一个很小的代价,以无限访问我们的内容的顶级质量编码。谢谢你!

支持数字化铸造bwin888官网

了解更多关于Patreon的好处

你还没登录!

创建您的ReedPop ID &解锁社区功能和更多!

创建账户
作者简介
Richard Leadbetter的头像

理查德·利百特

Digital Foundry技术编辑bwin888官网

Rich从16位时代就开始做游戏记者了,擅长技术分析。在Eurogamer上,他被称为“未来的铁匠”。

评论
Baidu
map