Nvidia DLSS 自 2018 年随 RTX 2080 推出以来,已从最初利用机器学习提升游戏分辨率的技术,演变为功能远不止于此的强大工具。 如今,在驱动 DLSS 的 Tensor Co...

Nvidia DLSS技术详解:从升级采样到DLSS 5的演进之路

Nvidia DLSS 自 2018 年随 RTX 2080 推出以来,已从最初利用机器学习提升游戏分辨率的技术,演变为功能远不止于此的强大工具。

如今,在驱动 DLSS 的 Tensor Core 于 Nvidia Volta GPU 架构中首次亮相 8 年后,DLSS 不仅能提升你的游戏分辨率、生成全新的帧,而且随着今年晚些时候 DLSS 5 的发布,它甚至能重新绘制游戏中的每一帧。这些功能中有些比另一些更具争议,但很难否认 DLSS 是近年来最重要的 GPU 软件套件之一,也是 Nvidia 显卡如此出色的主要原因。

Nvidia DLSS技术详解:从升级采样到DLSS 5的演进之路

DLSS 超分辨率

DLSS 表面上是“深度学习超级采样”的缩写,这也正是它最初的功能。其核心理念是以较低分辨率渲染游戏,然后利用在 Nvidia 超级计算机上训练、并在 Tensor Core 上运行的 AI 算法,精确地提升到更高分辨率。

对于大多数游戏,DLSS 提供四种预设之一,每种预设都会改变游戏的缩放比例。

  • 超性能模式:33%
  • 性能模式:50%
  • 平衡模式:58%
  • 质量模式:66.7%

显然,比例越高,图像质量越好,但这反过来会影响你的帧率。根据一般经验,我建议 4K 游戏使用“性能”模式,1440p 使用“平衡”模式,1080p 使用“质量”模式。我个人只要可能就会开启 DLSS,因为如今的算法已经非常出色,除非我刻意寻找,否则几乎看不出区别。但情况并非总是如此。

起初,这项技术还很粗糙。第一代 DLSS 超分辨率噪点明显,存在大量伪影和图像整体模糊的问题。再加上当时只有少数几款游戏支持,很难让人认真对待 Nvidia 的超分辨率技术。然而,随着 2020 年 DLSS 2.0 的发布,Nvidia 通过考虑游戏引擎的运动矢量数据改进了算法,使其能够更准确地生成符合屏幕运动的像素。

DLSS 2 还将 Nvidia 的超分辨率算法从需要为每款游戏单独训练,转变为可应用于许多不同游戏的算法,前提是开发者将 DLSS 文件集成到他们的游戏中。这使得采用率飙升,我们开始看到大量游戏开始支持这项技术。

虽然超分辨率技术在随后的几年里略有改进,但下一个最大的飞跃来自 2025 年随 RTX 5080 首次亮相的 DLSS 4。这次更新将超分辨率算法从 CNN(卷积神经网络)转变为 Transformer 模型,从而大幅提高了准确性。

此次更新适用于所有 RTX 显卡,你甚至可以在驱动软件中强制启用它,使其基本上可以在任何已支持 DLSS 2 或 3 的游戏中运行。唯一的缺点是,新模型比旧的 CNN 模型稍重一些,因此可能会减弱启用 DLSS 所带来的性能提升——尤其是在较旧的 RTX 3000 和 2000 系列显卡上。

随后,在 2026 年,Nvidia 发布了一个有点奇怪的中期更新——DLSS 4.5。它同时改变了超分辨率和帧生成(我稍后会讲到),但对于超分辨率而言,它只是在你设置为“性能”或“超性能”模式时,让 Transformer 模型更准确一些。唯一的问题是它增加了在旧卡上的性能开销——所以我只建议在 RTX 5060 或更新型号的显卡上启用它。

Nvidia DLSS技术详解:从升级采样到DLSS 5的演进之路

帧生成

DLSS 超分辨率在过去几年变得相当流行,但随着 DLSS 3 和 RTX 4090 的到来,Nvidia 从使用 AI 生成额外像素,发展到生成完整的帧。理论上,帧生成非常简单:它使用算法生成额外的帧,然后将它们插入到渲染队列中实际渲染的帧之间。然而,这当然比听起来要复杂一些。

就其本质而言,电子游戏是不可预测的,因此 Nvidia 必须找到一种生成额外帧的方法,而不会让游戏变成充满幻觉和伪影的混乱画面。而且,就像超分辨率部分一样,帧生成在最初也很粗糙。

帧生成并不像 Nvidia 最初声称的那样是免费的性能提升,它反而增加了延迟,而不是降低了延迟。以更高帧率玩游戏的主要目的之一,就是减少你的操作(点击鼠标、移动角色等)与屏幕上反映该动作之间的延迟。因为帧生成实际上并没有让游戏运行得更快,它只会增加延迟,因为算法生成每一帧都需要几毫秒的时间。

Nvidia 通过 Reflex 系统来抵消这种延迟的增加,该系统本质上将渲染队列清零,并使 CPU 与显卡同步,这样帧就不会只是在那里等待 GPU 渲染。

Reflex 已经推出多年,它确实在很大程度上改善了延迟,但这是防止帧生成变得糟糕透顶的必要条件。通过帧生成,Nvidia 基本上在 GPU 本身增加了一个新的渲染队列,它获取一个已渲染的帧,将其保持到生成新帧,然后调整它们的节奏以保持运动平滑。

这也是为什么帧生成并不能完全使你的帧率翻倍,即使它是在游戏发送的每一帧基础上生成一个新帧。同样,这也是为什么它会略微影响延迟。根据我的经验,在 赛博朋克2077:往日之影 中启用帧生成时,延迟通常会从例如 30 毫秒增加到 40 毫秒。

增加的延迟并不理想,但还不足以被察觉,尤其是在你不参与竞争的单人游戏中。

Nvidia DLSS技术详解:从升级采样到DLSS 5的演进之路

尽管帧生成在随 RTX 4080 推出时颇具争议,但 Nvidia 在 2025 年通过 DLSS 4 提高了倍数,增加了 3 倍和 4 倍帧生成选项。现在,RTX 50 系列显卡每渲染一帧最多可以生成三帧,理论上可以将帧率提升 4 倍。同样,这个数字在理论上并不完全准确,但它确实极大地提高了性能。

生成所有这些渲染帧本可能是一场噩梦,但 Nvidia 在其 Blackwell(RTX 50 系列)显卡中集成了一个 AMP 核心,即 AI 管理处理器。这个小芯片充当 GPU 的某种任务管理器,接管了通常由 CPU 处理的帧节奏控制。由于这项工作现在在与 GPU 相同的芯片上处理,调度帧时的延迟更少,这就是多帧生成能够工作的原因。

然而,更令人印象深刻的是,除了 2 倍帧生成带来的初始延迟影响外,额外生成的帧对延迟的影响微乎其微。在我之前提到的同一 Cyberpunk 场景中,将帧生成设置为 4 倍只会将 PC 延迟提高到 43 毫秒,这几乎没增加多少。虽然增加延迟本身就是一个缺点,但好处是,使用 4K 240Hz 显示器并物有所值变得容易得多。

但 4 倍帧生成对 Nvidia 来说还不够。在 2026 年 CES 上,该公司宣布了 DLSS 4.5,这是 DLSS 4 的一种半代刷新。随之而来的是,现在可以实现 6 倍帧生成,但更令人兴奋的部分是动态多帧生成。启用后,这将让 GPU 动态改变帧生成倍数,以使你的帧率尽可能接近显示器的刷新率。

可以把它看作一种增强版的垂直同步,但它不是将帧率限制在你的刷新率,而是通过生成额外的帧来确保显示器始终获得充足的帧供应。通过此次更新,Nvidia 还更新了帧生成所运行的 AI 模型。在 Nvidia App 中被创意地称为“模型 B”,它在处理 UI 元素方面要好得多,这些元素在帧生成激活时可能会在某些游戏中出现问题。

Nvidia 似乎正朝着不断增加 DLSS 生成帧数量的方向发展,谁知道它会在哪里决定刹车。但无论这个倍数变得多高,请记住,这个功能肯定不适合所有人。

如果你还在使用 60Hz 显示器,帧生成对你来说不会有任何作用。如果你一开始就难以达到 50-60 fps,那么帧生成将是一个延迟严重、充满伪影的混乱画面。

相反,帧生成最适合那些已经在高刷新率显示器上获得 50-60 fps 的人,它会让游戏看起来更加流畅。即便如此,增加的延迟也意味着许多竞技游戏玩家可能应该忽略它。

Nvidia DLSS技术详解:从升级采样到DLSS 5的演进之路

DLSS 的未来

虽然 DLSS 超分辨率和帧生成都使用 AI 来提高性能,但它们并没有从根本上改变游戏本身的外观。虽然可能这里或那里有一些小错误,但最终产品极其忠实于游戏的原始输出。但这种情况可能会在今年晚些时候 DLSS 5 发布时改变。

到目前为止,我们对 DLSS 5 的了解主要来自 2026 年 GTC(图形技术大会)上的一个简短演示,所以没有太多信息可供参考。但是,基于演示内容,这种新算法似乎会极大地影响游戏的美学风格,尤其是在角色模型方面。

Nvidia 声称该模型基于游戏的几何结构和“场景语义”。但是,当模型利用游戏的最终输出以及运动矢量数据来生成叠加在上面的图像时,看起来确实像是在改变游戏的美学风格。

理论上,这意味着基础游戏看起来越好,DLSS 5 生成最终图像的效果就越好,但由于它没有考虑游戏引擎的数据,它很可能会出错。不过,Nvidia 可能会在可供下载前的未来半年内进行修补,使其看起来更好。

但除了对游戏美学的影响之外,它是否真的能提高性能还有待观察。毕竟,从一开始,DLSS 的指导原则之一就是在保持图像质量的同时最大化性能。DLSS 5 的早期模型需要两块 RTX 5090 才能运行。当然,Nvidia 会找到方法优化它,使其能在单块显卡上运行,但只有时间才能证明它是否会成为玩家愿意开启的功能。如果它只是改变了游戏的外观,但性能却更差——我想很多人不会选择使用它。