将生产两款 AI GPU。
据新闻媒体 The Information 报道,TikTok 母公司字节跳动正在开发两款 AI GPU,将于 2026 年进入量产。这两款产品均由台积电生产。假设非官方来源的信息准确,字节跳动将减少对 Nvidia 的 AI 硬件依赖,同时遵守美国出口法规。
字节跳动的 AI GPU 系列目前正处于设计阶段,即将进入一年内(如果不是更晚的话)实现量产,其中包括一个用于人工智能训练的产品和另一个用于人工智能推理的产品。博通已经为谷歌制造了人工智能芯片,预计将负责设计人工智能芯片。据称,这些 GPU 是采用台积电的 N4/N5 工艺技术之一生产的,因此与台积电 4NP 类似的节点用于构建用于 AI 和 HPC 的 Nvidia Blackwell 系列 GPU。字节跳动的 GPU 预计将在 2026 年进入量产,因此预计将在 2026 年进行部署。
据报道,字节跳动已花费超过 20 亿美元购买了超过 20 万个 Nvidia H20 GPU(即每台约 10,000 美元,这是仅今年一年,其人工智能工作的投入就不足 12,000 美元(13,000 美元),而且其中许多 GPU 尚未交付给该公司。这一巨额投资凸显了人工智能对于字节跳动整体战略的重要性。
报告称,Nvidia GPU的短缺及其高昂的价格是字节跳动决定打造自己的人工智能硬件的原因之一。Nvidia 专门针对中国市场设计了 DGX H20 和其他一些 GPU,以应对美国去年实施的出口管制。
因此,HGX H20 是一款大幅精简的 GPU(与 H100 相比))如果价格信息正确的话,它的售价仍然高达 10,000 美元。例如,虽然 Nvidia 的 HGX H20 仅为 AI 计算提供 296 INT8/FP8 TOPS/TFLOPS 和 148 BF16/FP16 TFLOPS 性能,但成熟的 H100 为 AI 计算提供 3,958 INT8/FP8 TOPS/TFLOPS 以及 1,979 BF16/FP16 TFLOPS 性能。人工智能。然而,凭借96 GB的HBM3内存、高达4.0 TB/s的内存带宽和8路GPU能力,Nvidia的HGX H20在实际应用中仍然受到中国企业的高度需求。据报道,Nvidia 的处理器击败了华为的竞争对手。
虽然由于美国出口管制规则,字节跳动不太可能使其 GPU 明显快于 Nvidia 的 HGX H20(因为台积电将无法向字节跳动运送此类 GPU),对于公司来说,它们的价格将大大降低。
字节跳动为人工智能开发 GPU 的举措存在巨大缺陷。该公司现在依靠 Nvidia 的 CUDA 和支持软件堆栈进行人工智能训练和推理。一旦配备了 AI GPU,它就必须开发其软件平台并确保其软件堆栈与其硬件完全兼容。尽管许多中国公司已经开发了 AI GPU 来减少对 Nvidia 的依赖,但这些芯片仅用于特定工作负载,并继续依赖 Nvidia 的 GPU 来处理其他工作负载。
直接将 Tom's Hardware 的最佳新闻和深入评论发送到您的收件箱。
Nvidia 预计今年将向中国客户出货超过 100 万台 HGX H20,几乎是华为预计出货量的两倍到 2024 年,Ascend 910B AI GPU 的销量将达到 55 万个。Nvidia 的 H20 GPU 可能会产生超过 120 亿美元的收入,超过该公司上一年在中国的总收入,其中包括其他硬件类型的销售,例如游戏玩家的 GPU。
Anton Shilov 是 Toms Hardware 的特约撰稿人。在过去的几十年里,他涵盖了从 CPU 和 GPU 到超级计算机、从现代工艺技术和最新的制造工具到高科技行业趋势的所有内容。