作者:Henry Lin and Andrew Burnes
NVIDIA DLSS 是一套由 GeForce RTX Tensor Core 提供支持的神经渲染技术,可提高帧速率,同时提供可与原生分辨率渲染相媲美的清晰、高质量图像,作为超过 700 个 RTX 游戏和应用程序。
在 CES 2025 上,我们通过引入 DLSS 4 再次推进 DLSS,该技术具有多帧生成功能,可用于GeForce RTX 50 系列显卡和笔记本电脑;将支持 75 款游戏和应用用于多帧生成(当它们发布时)。
DLSS 多帧生成为每个传统渲染帧生成最多三个额外帧,与整套 DLSS 技术协同工作,可将帧速率比传统强力渲染提高高达 8 倍。GeForce RTX 5090 显卡的性能大幅提升,可实现令人惊叹的 4K 240 FPS 全光线追踪游戏。
在 GeForce RTX 5090 上,在赛博朋克 2077 场景中,具有多帧生成功能的 DLSS 4 性能比传统暴力渲染提高了 8 倍以上,PC 延迟减半,游戏响应更加灵敏,图像质量进一步增强
DLSS 4还对其AI模型进行了自2020年发布DLSS 2.0以来最大的升级。
DLSS 光线重建、DLSS 超分辨率和 DLAA 现在将由图形行业首个实时应用“transformers”提供支持,该应用程序与为 ChatGPT、Flux 和 Gemini 等前沿 AI 模型提供支持的先进架构相同。DLSS 变换器模型通过改善时间稳定性、更少重影和更高的运动细节来提高图像质量。
观看 NVIDIA 的 Bryan Catanzaro 和 Edward Liu 演示 DLSS 4
随着 GeForce RTX 50 系列的推出,NVIDIA 应用程序用户将能够升级游戏和应用程序以使用这些增强功能。
75 个 DLSS 游戏和应用程序具有帧生成功能的功能可在 GeForce RTX 50 系列 GPU 上升级为多帧生成。
对于这些相同的游戏,“帧生成”针对 GeForce RTX 50 系列和 GeForce 40 系列 GPU 进行了升级,从而提高了性能,同时减少了 VRAM 使用。
在所有 GeForce RTX GPU 上,具有光线重建、超分辨率和 DLAA 的 DLSS 游戏都可以升级到新的 DLSS 变压器模型。
DLSS 3 帧生成的 AI 模型使用运动矢量和深度等游戏数据以及来自 GeForce RTX 40 系列光流加速器的光流场来生成一帧额外的帧。生成多个帧的成本过高,因为每个新生成的帧都需要光流加速器和 AI 模型,并且性能成本会限制 GPU,从而导致输入帧速率降低。
DLSS 4 多帧生成结合了多个 Blackwell 硬件和 DLSS 软件创新,使生成多帧成为现实。
我们的新帧生成 AI 模型速度提高了 40%,使用的 VRAM 减少了 30%,并且每个渲染帧只需运行一次即可生成多个帧。例如,在战锤 40,000:暗潮,该模型提供了 10% 更快的帧速率,同时在 4K、最大设置下使用 DLSS 帧生成减少 400MB 内存。
我们还通过用非常高效的人工智能模型替换硬件光流来加速光流场的生成。人工智能模型共同显着降低了生成额外帧的计算成本。
新的帧生成模型具有更快的帧速率和更低的 VRAM 总消耗。使用 GeForce RTX 5090 在《战锤 40,000:暗潮》中以 4K 分辨率、最高游戏设置和 DLSS 帧生成方式捕获
即使具有这些效率,GPU 仍然需要为每个渲染帧执行 5 个跨超分辨率、光线重建和多帧生成的 AI 模型,所有这些都在几毫秒内完成,否则 DLSS 多帧生成可能会成为减速器。为了实现这一目标,GeForce RTX 50 系列 GPU 配备了第五代 Tensor Core,AI 处理性能提高了 2.5 倍。
一旦生成新帧,它们就会均匀分布以提供流畅的体验。DLSS 3 帧生成使用基于 CPU 的节奏,其可变性可能与其他帧混合,导致每帧之间的帧节奏不太一致,从而影响平滑度。
为了解决生成多个帧的复杂性,Blackwell 使用硬件翻转测光,将帧节奏逻辑转移到显示引擎,使 GPU 能够更精确地管理显示时序。Blackwell 显示引擎也得到了增强,像素处理能力提高了一倍,支持 DLSS 4 硬件翻转测光的更高分辨率和刷新率。
我们新的硬件和软件创新协同工作,使 DLSS 4 能够生成每 16 个像素中的 15 个像素,并具有出色的图像质量、平滑度和延迟。
对于游戏和应用程序,具有多帧生成、光线重建和超分辨率功能的 DLSS 4 可将帧速率比暴力渲染提高高达 8 倍,并在从帧生成升级到多帧生成时将帧速率提高高达 1.7 倍。
DLSS 4 对 DLSS 光线重建、DLSS 超分辨率和 DLAA 进行了重大架构升级,图形行业首次实时使用基于变压器的模型。
此前,DLSS 使用卷积神经网络 (CNN) 通过分析局部上下文并跟踪连续帧中这些区域的变化来生成新像素。经过六年的持续改进,我们已经达到了 DLSS CNN 架构的极限。
我们新的 DLSS 变压器模型使用视觉变压器,支持自注意力操作来评估整个帧和多个帧中每个像素的相对重要性。新模型采用 CNN 模型参数的两倍来实现对场景的更深入理解,生成的像素可提供更高的稳定性、减少重影、更高的运动细节以及更平滑的场景边缘。
在密集的光线追踪内容中,用于光线重建的新变压器模型可大幅提升图像质量,尤其是在光照条件具有挑战性的场景中。例如,在这些场景中心灵杀手2,高度详细的铁丝网围栏的稳定性得到提高,风扇叶片上的重影减少,电源线上的闪烁现象被消除,从而改善了玩家在第三人称游戏中的沉浸式体验。
超分辨率的 Transformer 模型也显示出了可喜的结果,并将作为测试版发布,以便用户在正式发布之前探索改进并提供反馈。该模型表现出更好的时间稳定性、更少的重影和更高的运动细节。
新的 Transformer 模型架构将提供数年的空间来实现持续的图像质量改进,就像我们在过去 6 年中对 CNN 架构所做的那样。
在《Horizon Forbidden West™ 完整版》中,新测试版超分辨率 DLSS 变压器模型增加了 Aloy 衣服和配饰的纹理细节以及整体清晰度
多帧生成和新的变压器模型都是为了向后兼容现有的 DLSS 集成而构建的。
当 GeForce RTX 50 系列显卡上市时,GeForce RTX 50 系列游戏玩家将能够通过 DLSS 多帧生成技术倍增性能75 个游戏和应用程序,所有 GeForce RTX 用户将能够在 50 多个游戏和应用程序中体验基于 Transformer 的全新 DLSS 光线重建、DLSS 超分辨率和 DLAA。
对于许多尚未更新到最新 DLSS 模型和功能的游戏,英伟达应用程序将通过新的 DLSS Override 功能启用支持。随着 GeForce RTX 50 系列 GPU 的推出,安装新的 GeForce Game Ready 驱动程序和最新的 NVIDIA 应用程序更新后,“图形”>“程序设置”屏幕的“驱动程序设置”下将提供以下 DLSS 覆盖选项对应每个支持的标题。
只需在 NVIDIA 应用程序中点击几下即可升级和增强游戏:
随着我们在更多游戏中完成新模型的测试,NVIDIA 应用程序 DLSS Override 游戏支持将会得到扩展。
凭借不断改进的 AI 技术、倍增性能、提高图像质量以及增强光线追踪图形,我们在 2018 年首次推出 RTX 和 DLSS 时彻底改变了游戏。随着 DLSS 4 与 GeForce RTX 50 一起推出系列 GPU,所有 GeForce RTX 台式机和笔记本电脑游戏玩家都将获得升级,使他们的游戏和应用程序变得更好。
敬请关注GeForce.com了解未来 DLSS 的发展,同时,查看我们所有其他 GeForce RTX 50 系列公告了解我们如何进一步改善您的游戏和应用体验。