英语轻松读发新版了,欢迎下载、更新

Nvidia 宣布 RTX 5090 售价 1,999 美元,5070 售价 549 美元 - 加上 AI、DLSS 4 等

2025-01-07 05:12:20 英文原文

作者:Jarred WaltonSocial Links Navigation

Nvidia Blackwell RTX 50-series at CES 2025
(图片来源:Nvidia)

Nvidia 启动了国际消费电子展2025 年主题演讲回顾了公司历史,从 NV1 和街机开始,发展成为人工智能巨头。我们的目标是将机器学习应用到所有可能的应用程序中,所有应用程序均由 Nvidia GPU(GeForce 打造的房子)提供支持。这就是我们真正要看到的:由 Blackwell 架构提供支持的下一代 GeForce 硬件。

Nvidia 直接切入主题,以 549 美元的价格推出了 RTX 5070 GPU。据 Nvidia 称,这将以各种方式利用人工智能,以三分之一的价格提供 RTX 4090 的性能。它还将允许笔记本电脑实现更高水平的性能,移动 RTX 5070 使用 RTX 4090 一半的功率,同时在性能上与之匹配(我们假设 Nvidia 正在谈论移动 4090,尽管目前还不清楚)。

第 1 张图片(共 2 张)

Nvidia Blackwell RTX 50-series at CES 2025
(图片来源:Nvidia)

已发布的 50 系列产品线的其余产品包括售价 1,999 美元的 RTX 5090,作为这一代的光环部分,具有 3,400 AI TOPS 的性能。RTX 5080 将在 1,800 TOPS 下提供略多于一半的 AI 性能,并且价格更具吸引力,为 999 美元 - 继承了即将推出的 RTX 4080 Super 的价格。接下来是 RTX 5070 Ti,价格为 749 美元,具有 1,400 TOPS,最后是 RTX 4070,具有 1,000 TOPS,价格已经提到了 549 美元。

对于下一代 GPU 的发布来说,这是一个令人印象深刻的开始,但我们需要了解 Nvidia 计划如何提供这些升级。关于这些 GPU,我们还有很多方面(官方)还不了解。但让我们从我们所知道的开始。Nvidia 现在已经列出了许多核心规格,我们也相应地更新了表格。

滑动即可水平滚动

显卡RTX 5090RTX 5080RTX 5070 钛RTX 5070建筑学
国标202国标203国标203国标205流程节点
台积电4NP台积电4NP台积电4NP台积电4NP晶体管(十亿)92
模具尺寸(mm^2)第744章???短信
170847048GPU 着色器 (ALU)
217601075289606144张量核心
680第336章280192光线追踪核心
170847048升压时钟 (MHz)
24072617第2452章2512显存速度 (Gbps)
28302828显存 (GB)
32161612显存总线宽度
第512章256256192二级缓存
128?64?64?48?渲染输出单位
240?112?96?64?纹理映射单元680
第336章280192TFLOPS FP32(升压)104.8
56.343.930.9TFLOPS FP16(INT8 TOPS)第1676章
(3352)900 (1801)703 (1406)494 (988)带宽(GB/秒)
1792年960896第672章TBP(瓦)
第575章360300250发布日期
2025年1月2025年1月2025 年 2 月/3 月?2025 年 2 月/3 月?发行价
1,999 美元999 美元749 美元$549您会注意到,仍然存在一些问号,主要是在 RTX 5090 级别以下的 GPU 上。
Nvidia 提供了顶级 GPU 的完整规格,但尚未提供或暗示其他型号的晶体管数量和芯片尺寸。(内存速度和带宽详细信息已更新;之前未列出。)考虑到所宣称的 AI TOPS 性能,首先需要注意的是,Nvidia 相对于 Ada Lovelace 的 AI 计算操作量增加了一倍——至少对于 INT8 工作负载而言。我们的 Blackwell RTX 50 系列概述已经有一段时间传闻规格,并且根据 AI TOPS 和其他规格,我们假设其余张量核心性能也翻倍。Nvidia 还展示了“RTX Blackwell”,通过着色器提供 125 TFLOPS 的 FP32 图形计算,比 Ada 一代的同类产品高 1.5 倍,而 AI 性能将高出 3 倍。

但这是针对全脂 GB202 芯片,而不是针对 RTX 5090 中使用的精简解决方案。可能会有更高规格的 RTX 5090 Ti,甚至可能是 Titan,或者如果不是这样,肯定有潜力

使用完全启用的 GB202 芯片的更高层 AI/数据中心部分。

到目前为止,已发布的 RTX 50 系列部件均未提供标准 16Gb (2GB) GDDR7 模块之外的任何功能。

这意味着虽然 RTX 5090 上的 512 位接口提供了高达 32GB 的 VRAM,但 5080 和 5070 Ti 上的 256 位接口最终仍配备 16GB GPU,而 5070 上的 192 位接口将“仅”。' 提供 12GB VRAM。

目前对于更多游戏来说这通常已经足够了,但由于人工智能工作负载对 VRAM 的巨大需求,我们不会惊讶地看到每个 GPU 的未来变体与 24Gb (3GB) 内存模块配对,提供 50% 的提升各个级别的 VRAM 容量。也许这将成为明年中期更新的一部分。

Nvidia Blackwell RTX 50-series at CES 2025

(图片来源:Nvidia)

我们不知道 Blackwell 中使用的第五代张量核心是否会使其他数字格式的吞吐量增加一倍。考虑到这些 GPU 的多用途用例——是的,它们将用于游戏卡,但也将用于专业 GPU 和数据中心人工智能解决方案——我们怀疑张量核心的所有方面都得到了升级。我们已适当更新了 FP16 性能,但问号表明我们不确定这些数字。

有趣的是,如果我们输入已知的时钟速度和核心数量,我们就可以获得大部分最终规格。125 TFLOPS 数字还伴随着最大 4,000 INT8 TOPS,而 RTX 5090 将其扩展到 3,400 TOPS — 完全启用的 GB202 的 85%(无论是多少)。因此,假设芯片的 125 TFLOPS 数字在 RTX 5090 上缩小至约 107 TFLOPS,这是有道理的。

目前有传言称 GB202 最多可启用 192 个 SM,而 RTX 5090 只会启用 170 个 SM。凭借 2.41 GHz 升压时钟,我们还想知道这是否与 RTX 40 系列升压时钟一样保守。大多数 40 系列 GPU 往往会比列出的加速时钟高出大约 200 MHz,因此如果 Blackwell 的情况保持不变,我们可以预期时钟会更多地在 2.6-2.7 GHz 范围内。

1.8 TB/s 的带宽数字确实与之前传闻的在 512 位内存接口上运行的 28 Gbps GDDR7 内存完美匹配。5080、5070 Ti 和 5070 是否也会使用 28 Gbps GDDR7,或者它们的时钟频率会更高一些吗?Nvidia 现在发布了完整的内存规格,RTX 5080 至少将突破 28 Gbps,运行速度为 30 Gbps。5070 Ti 和 5070 将坚持与 5090 相同的 28 Gbps。

Nvidia 将如何利用其所有游戏 GPU 上双倍的 AI 计算能力?当然,它计划拥有新的功能和软件解决方案来利用这些功能。RTX 5070 提供 1,000 TOPS 的计算能力,与 RTX 4090 (1,320 TOPS) 的性能几乎相同,而价格仅为 RTX 4090 的三分之一,这为计算要求更高的任务打开了大门。

第 1 张图片(共 3 张)

Nvidia Blackwell CES 2025 keynote
(图片来源:Nvidia)

最可能的用例之一是基于AI的纹理压缩。我们过去听说过这一点,并且这个想法已经在上一代硬件上运行过,但不是在极端帧速率下运行。早在 2023 年 5 月,神经纹理压缩 (NTC) 的运行速度还不到标准 BTC(块截断编码)压缩速度的一半。但 18 个月后,随着人工智能计算的增强和更多的培训?可以想象,我们可以让 NTC 以与传统 BTC 相同的速度运行。

考虑到我们和其他人对现代游戏中 GPU 耗尽 VRAM 的担忧,NTC 成为 Blackwell 一代硬件的主要新功能之一也就不足为奇了。拥有更高的图像质量和三分之一的内存使用,如果使用它,甚至可以使 8GB 显卡更加可行,而 12GB 的 5070 就不会那么令人担忧。

只有一个小问题:许多游戏都是跨平台游戏,在 AMD GPU 驱动的游戏机上运行。如果 Nvidia 的新纹理压缩技术只需要 RTX 显卡,那么有多少游戏会支持它?如果需要 RTX 50 系列卡,这个数字就会小得多。但英伟达拥有足够的影响力,能够以 AMD 和英特尔无法做到的方式推动游戏市场。

Nvidia 也有可能通过在驱动程序中设置 NTC 设置或作为与游戏兼容的 DLSS 的一部分来解决这个问题,即使它们没有明确支持该功能。在我们看来,这将是理想的情况,因为这意味着为大量游戏带来潜在的 VRAM 有效容量优势。我们还很好奇 NTC 是否会锁定在 RTX 50 系列上,或者是否也可以在其他 RTX GPU 上使用。

换句话说,我们有很多问题,未来几天我们会找到更多答案。这很可能是 DLSS 4 系列技术的一部分,这些技术在主题演讲期间的游戏演示中进行了展示。在“神经渲染图形”的大标题下,我们看到了各种正在发挥作用的新技术:DLSS 4、RTX Neural Materials、DLSS: CNN、DLSS: Transformer、Text-to-Animation 和 RTX Neural Faces - 所有这些都具有完整的功能自然是光线追踪。然而,所有这些新技术都已启用,它们似乎具有很大的前景,因为演示视频看起来非常令人惊叹。

Nvidia Blackwell RTX 50-series at CES 2025

(图片来源:Nvidia)

除了桌面 GPU 之外,Nvidia 还公布了移动系列产品名称。配套的 RTX 5090、5080、5070 Ti 和 5070 笔记本电脑将于 2025 年 3 月上市。虽然型号名称与台式机系列匹配,但性能将显着降低,我们预计其他规格也将出现类似的削减。

RTX 5090 笔记本电脑 GPU 将提供 1,850 AI TOPS,起价为 2,899 美元。这意味着它基本上与桌面 RTX 5080 持平。移动 5080 下降至 1,350 AI TOPS,略低于桌面 5070 Ti。移动版 5070 Ti 将具有与台式机 5070 相同的 1,000 TOPS,然后普通 5070 笔记本电脑 GPU 将提供高达 800 AI TOPS - 这可能是即将推出的 RTX 5060 Ti 台式机部分的一个预告。

Nvidia Blackwell CES 2025 keynote

(图片来源:Nvidia)

正如您所预料的那样,主题演讲的其余部分花了很多时间讨论人工智能在各种其他领域的使用——车辆、医疗、仓库、机器人等。这些都是我们从 Nvidia 那里反复听到的内容在过去的几年里,这一切都很有趣,但这并不是我们真正的核心焦点。人工智能领域发生了很多事情,有时感觉很像我们在 2020 年至 2021 年听到的加密货币和 NFT 炒作。不过,这一次我们似乎不会看到以太坊挖矿的结束而让事情平静下来。

将 Tom's Hardware 的最佳新闻和深入评论直接发送到您的收件箱。

Nvidia Blackwell CES 2025 keynote

(图片来源:Nvidia)

Nvidia 还展示了其新型“AI 超级计算机”,该计算机将 Grace Blackwell GB10 超级芯片装入迷你 PC 中。它被称为 Project Digits,运行完整的 DGX 软件堆栈,具有 20 个 Grace CPU 内核、1 PFLOPS 的 FP4 性能、128GB 内存和 4TB SSD,这应该是比现有 DGX 服务器更经济、更便携的解决方案,以及可以轻松放在桌子上的东西。

主题演讲到此结束。最令人兴奋的事情显然是 RTX 50 系列的发布,而且还有很多我们仍然不知道。这一切都将在未来几天内揭晓,我们预计完整的 RTX 50 系列发布将在本月底之前开始。敬请关注。

Jarred Walton 是 Tom's Hardware 的高级编辑,专注于 GPU 的所有内容。自 2004 年以来,他一直担任科技记者,为 AnandTech、Maximum PC 和 PC Gamer 撰稿。从第一个 S3 Virge“3D 减速器”到今天的 GPU,Jarred 紧跟所有最新的图形趋势,并且是询问游戏性能的人。

关于《Nvidia 宣布 RTX 5090 售价 1,999 美元,5070 售价 549 美元 - 加上 AI、DLSS 4 等》的评论


暂无评论

发表评论

摘要

根据这篇文章,以下是有关 Nvidia RTX 50 系列 GPU 发布及相关进展的要点:1. 桌面 GPU:- 宣布四款新桌面型号:RTX 5090、5080、5070 Ti 和 5070- 性能细节尚未完全透露2.移动GPU:- 宣布将于 2025 年 3 月发布的桌面 GPU 的匹配移动版本- 预计性能明显低于桌面同类产品3.人工智能新技术:- DLSS 4 系列具有多种新功能,如 RTX 神经材质、文本转动画等。- 在游戏演示中展示了令人印象深刻的光线追踪功能4.纹理压缩(NTC):- 减少 VRAM 使用的潜在革命性技术- 关于跨平台兼容性和实施细节的问题仍然存在5. 项目数字:- 基于Grace Blackwell GB10超级芯片的新型AI超级计算机解决方案- 紧凑的外形,具有 20 个 CPU 内核、1 PFLOPS FP4 性能等。6.其他人工智能应用:- Nvidia 讨论了人工智能在汽车、医疗、机器人等领域的各种用途7. 即将举行的活动:- RTX 50 系列的完整发布预计将于本月底前开始- 更多细节将在未来几天/几周内公布文章强调,虽然宣布了许多令人兴奋的新技术,但许多细节仍然未知,并且可能会在 GPU 准备发布时很快得到澄清。对人工智能功能的关注不仅仅限于游戏应用。