作者:Will Judd
当索尼透露PlayStation 5 专业版,它的发布方式与 PlayStation 4 Pro 和 PlayStation 5 的展示方式非常不同。虽然首席系统架构师 Mark Cerny 是 Pro 发布的“司仪”,但首次亮相的时间很短,只有 9 分钟——而且还不错。该运行时间的一部分庆祝了标准 PlayStation 5 控制台的成就。这与索尼首款“Pro”游戏机的详细演示相去甚远,与塞尔尼在 2020 年 3 月提供的现在传奇的“PS5 之路”演示相比,细节有些缺失。我们渴望了解更多细节——而现在,他们终于来了。
发布整整三个月后,索尼对硬件设计以及实际上的性能进行了全新的深入介绍。想象PlayStation 5 Pro 背后的力量 - 这是重要的东西。该游戏机背后的理念标志着游戏机制造方式的巨大变化。虽然 PlayStation 5 Pro 的核心图形渲染技术比标准机器有所增强,但 Cerny 认为未来机器学习将在游戏机设计中发挥关键作用,而光栅化已接近极限,他认为光线追踪功能将大幅扩展继续前进。
这一愿景与 Nvidia 过去六年的战略有共同点,但我们得到的印象是,AMD 将继续成为索尼实现这一新愿景的首选合作伙伴。为此,索尼和 AMD 宣布了一项新的“Amethyst”合作。
Digital Foundry 的 Oliver Mackenzie 几周前有机会观看了新的 Cerny 演示,并采访马克·塞尔尼本人以及迈克·菲茨杰拉德- Insomniac 核心技术总监。然而,演示本身是所有 Digital Foundry 团队成员都渴望讨论的内容,因此这是我们对演讲的反应 - 当然,还有我们所学到的所有内容的概述。
从基础版 PS5 到 PS5 Pro 最明显的演变在于其图形处理能力。PS5 Pro 的主要重点不是提高 CPU 性能、提高存储速度或瞄准更高分辨率的显示器,而是通过更强大的 GPU 来提升性能和图像质量。有趣的是,PS5 Pro GPU 仍然基于 AMD 的 RDNA 2(RX 6000 系列)架构,但具有从 RDNA 3(RX 7000 系列)和 RDNA 4(RX 8000 系列,预计 2025 年)向后移植的一些功能,如下所示出色地。
在 2.17GHz 的典型时钟速度下,PS5 Pro 的性能为 16.7TF - 是发布前错误引用的 33.5TF 的一半。这可以更直接地与基础版 PS5 上附加的约 10TF 数字进行比较,而与膨胀的(或用 Mark Cerny 所说的“flop-flated”)RDNA 3 teraflop 计数相比。其他规格与早期泄露的 PS5 Pro 一致,包括 30 个 WGP、60 个计算单元和 2.35GHz 的最大提升 - 尽管在正常操作条件下不太可能看到这个频率,可能是由于功率限制。标准 PS5 的最大时钟速度为 2.23GHz,但演示表明典型运行速度与 PS5 Pro 相同为 2.17GHz,因此典型 TFLOP 约为 10TF,很少达到原始规格中引用的 10.23TF。然而,正如这一代人所证明的那样,TFLOP 被证明是一个越来越无意义的指标 - Mark Cerny 在新演示中承认了这一情况。
至于为什么PlayStation 5 Pro 并未完全采用后来的 AMD 图形架构,原因非常简单:PS5 GPU 的着色器代码无法在后来的 AMD 硬件上运行,并且无法在现有游戏中重新编译这些着色器。动态着色器编译?它不适用于 PS5,并且 - 相信我们 - 你也不会想要它。因此,PS5 Pro有使用相同的 RDNA 2.x 基线,并添加新功能的扩展 - 例如增强的光线追踪。
在其他功能方面,我们还从向开发者单独披露的信息中得知,PS5 Pro 具有完整的 RDNA 2 功能集,包括网格着色器和硬件 VRS,并且板载了额外的 2GB(较慢)DDR5 内存。其中,有超过 1 GB 的额外内存可供开发人员使用。尽管连接在类似的 256 位总线上,但此处使用的 GDDR6 内存也比基础 PS5 快了约 28%(分别为 576GB/s 和 448GB/s)。
PS5 Pro 的部分吸引力在于其在 RT 性能方面的显着改进,使开发人员能够在 PS5 Pro 增强版游戏中更自由地使用这些功能,而无需像基础 PS5 那样牺牲图像质量或帧速率。这是通过基本 PS5 的 RDNA 2.x 架构以及后来的 RDNA 技术添加的新扩展来实现的。
PS5 重新利用纹理映射单元来进行光线追踪的方框和三角形相交测试,PS5 Pro 将这部分过程的速度提高了两到三倍。Pro 还支持 BVH8 而不是 BVH4,这也提供了加速。PS5 Pro 还在硬件中添加了堆栈管理,这再次有助于光线追踪的遍历阶段,而此前仅在 Intel 和 Nvidia 硬件中出现,而非 AMD。
最后,在 PS5 Pro 上,较发散的 RT 比较一致的 RT 具有更大的性能提升。这种发散/相干频谱本质上描述了 RT 计算的复杂性,平坦表面上的阴影和反射更加相干,而弯曲或凹凸表面上的反射更加发散。同样,Nvidia 和 Intel 已经提出了处理更多不同 RT 的好方法,例如硬件排序单元和着色器执行重新排序,尽管我们在这里没有看到这些想法的精确复制品,但遍历升级和迁移到 BVH8 应该会这意味着 PS5 Pro 比其前身拥有更好的装备来处理这些计算成本更高的 RT 计算。例如,这为开发人员更轻松地使用更广泛的材料粗糙度进行反射打开了大门,而不是仅仅坚持镜面或近镜面反射。
马克·塞尔尼 (Mark Cerny) 假设我们光栅化的程度是有限的。突破这些限制的一种途径是通过 RT,它具有通过更多研究进行扩展的巨大潜力。看到索尼的这些改进表明 RDNA 4 正在朝这个方向推动更多,这是令人兴奋的事情。
当然,我们仍然不确定 RDNA 4 的 RT 性能会如何 - 它看起来像是向前迈出的重要一步,但仍然没有与 Nvidia RTX 20 系列架构中的 RT 核心相当的产品,这使得更多并发工作负载。AMD 在演示中讨论了如何在其 PC GPU 上使用更多的缓存来更好地适应 BVH,因此,了解桌面 RDNA 4 芯片在这一额外改进下的性能如何将是令人着迷的。
除了 PS5 Pro 的基准 RDNA 2.x 升级为索尼所谓的“未来 RDNA”光线追踪之外,它还配备了用于机器学习的“定制 RDNA”,特别是 PSSR 升级。马克·塞尔尼 (Mark Cerny) 告诉我们,索尼没有使用现有的升级器,而是专注于速度并最大限度地减少升级器所需的每帧时间。为此,他们需要在 NPU 和 GPU 硬件之间进行选择,最终选择了 GPU。
实际的实现非常有趣,因为索尼发现,即使处理 128MB 的 4K 16 通道图像的单层也会受到内存带宽的限制,而仅使用约 300 TOPS 可用的 3%。最简单的解决方案是立即通过芯片获取图像的一小部分,但最终会遇到边缘缺乏有关周围图块的必要信息的问题,因此需要丢弃数据。
最终,索尼选择将他们的矢量寄存器合并到 WGP 中,为他们提供总共 15MB 的内存和 200TB/s 的内存带宽。这与 AMD 处理 RT 的方法类似,您仍然使用通用硬件来实现特定目标。就整体硅足迹而言,重新利用可能具有面积效率,不需要对 RDNA 进行大规模更改,并且似乎已经使索尼能够实现 PSSR 的速度目标。
然而,PSSR 还不是“完全融合”的卷积神经网络 (CNN),而英特尔在其首个 XeSS 版本中就实现了这一点。完全融合会带来速度优势,因为您在升级单个帧时不会中途接触系统内存。根据我们的粗略计算,DLSS 耗时不到 1 毫秒,PSSR 耗时约 2 毫秒,这意味着如果将来实现这一目标,游戏有可能运行得更快。它还可以为在更高帧速率(例如 120fps)下使用升级打开大门,其中大约 2 毫秒的升级运行时间占整个帧渲染可用时间的 8.3 毫秒的很大一部分。AMD 有可能对 RDNA 4 采取类似的方法,对主 CU 进行修改,以便可以在 GPU 上本地运行聚合神经网络。
索尼还宣布与 AMD 合作,名为 Amethyst,它本身是 2014 年重新调整用途的 AMD GPU 代号,其紫色来自索尼(蓝队)和 AMD(红队)的组合。我们的想法是让适合轻量级 CNN 的硬件架构可用于实时游戏图形,以及用于游戏图形的高质量 CNN。还将在这些 CNN 的网络架构上进行合作。双方将能够访问其产品的所有这些架构。
听起来 AMD 在主要 GPU 设计方面处于领先地位,但索尼和 AMD 之间的机器学习合作有望推动两家公司在机器学习和光线追踪方面的发展。索尼获得了更大规模迭代 PSSR 的好处,AMD 则可以缩小自己与 Nvidia 之间的研发差距。目前尚不清楚 RDNA 4 GPU 上的 PSSR 和 FSR 之间是否会存在某种异花授粉,而且考虑到微软也专注于 PC,但又与 Xbox 与 PlayStation 竞争,因此看看微软的升级努力会落在哪里将会很有趣。。
这不仅仅是关于升级,而是关于一般的计算机图形学。在我们的谈话中,Mark Cerny 似乎对机器学习的巨大潜力感到非常兴奋,包括去噪、提高纹理质量和纹理流,甚至可能是几何质量,所有这些都在控制台可用的有限带宽和内存空间内。这就是索尼应该为 PS6 进行评估的事情,而像 Amethyst 这样的努力确保在这样的时间范围内实现其中一些目标是可行的。同样,宣布这种性质的合作伙伴关系表明索尼将继续与 AMD 合作开发下一代游戏机,因为 AMD 的主要优势在未来几年内将无法实现。
与 PlayStation 6 一样,随着开发者逐渐掌握新游戏机的功能,PS5 Pro 也将拥有许多令人兴奋的可能性。当然,更先进的 RT 实现以及改进的 PSSR 迭代具有实现更一致的良好结果的潜力。如果索尼想使用机器学习来增强现有的游戏库,那么还有可能对在向后兼容下运行的游戏进行更多改进。
总体而言,了解有关 PS5 Pro 的更多信息非常有趣,我们鼓励您阅读我们对马克·塞尔尼和迈克·菲茨杰拉德的采访了解有关 PS5 Pro、其开发以及未来改进潜力的更多详细信息。