埃隆·马斯克的xAI扩大了Colossus,这是世界上最大的人工智能超级计算机。

2024-10-10 14:11:00 英文原文

作者:Kaif Shaikh

meet the mammoth AI supercomputer equipped with 100,000 Nvidia H100 GPUs, ready to deliver a significant performance boost.

Elon Musk’s xAI expands Colossus, the world’s largest AI supercomputer

埃隆·马斯克(特斯拉公司的联合创始人兼首席执行官)与黄仁勋(英伟达公司的首席执行官)在美国加州圣何塞的GPU技术大会上合影。

Kim Kulish/柯比斯_via_盖蒂图片社

2024年10月4日,大孟菲斯商会批准了xAI的人工智能培训设施和超级计算机Colossus的扩建。Colossus于一个月前启动,迅速获得认可,成为世界上最大的GPU超级计算机,最初配备了100,000个Nvidia GPU。

在埃隆·马斯克的领导下,xAI的目标是将Colossus的能力翻倍至200,000个GPU,其中包括50,000个先进的H200。这个雄心勃勃的增长计划,在6月5日该设施首次宣布后的短短122天内实现,展示了其快速的推进速度和规模典型性。马斯克的事业 Ventures这个词在这里可以理解为企业或项目,但直接翻译成“事业”更为贴切。.

xAI的Colossus的技术优势

在田纳西州孟菲斯仅用四个月内建成的Colossus利用了NVIDIA的H100 GPU提供高达前一代A100型号九倍的速度,每个H100 GPU可提供高达2,000万亿次浮点运算的性能。初始配置集成了100,000个H100 GPU,并计划再添加50,000个H100和50,000个新的H200 GPU。

组合数组理论上可以达到约497.9 exaflops(497,900,000 teraflops),在超级计算机性能方面树立了新的基准。尽管这种增强的能力远远超过了当前的超级计算机记录,实际性能可能面临系统集成、通信开销、功耗和散热等方面的挑战。

Colossus也在主要竞争对手中脱颖而出,xAI计划中的200,000个GPU超过了Google AI的90,000个和Meta AI的70,000个GPU。此次扩张旨在提升xAI的能力为了开发和改进像Grok 3这样的AI模型,该模型将与OpenAI备受期待的语言模型技术突破GPT-5竞争。作为xAI最先进的聊天机器人,Grok 3预计将于2024年12月发布。

随着特斯拉准备在本月的Robotaxi活动中展示其人工智能增强功能,特斯拉的人工智能计划与xAI的计算资源之间的合作变得越来越明显,特别是在自主驾驶技术方面。

不同AI公司的GPU数量对比图表。来源:Interesting Engineering

环境影响和可持续性措施

尽管拥有技术优势,Colossus项目仍然面临着孟菲斯社区提出的环境和资源问题的担忧。

该超级计算机的运行预计会消耗130万 kWh电能每日加仑的水量并且在高峰时段每小时消耗高达150兆瓦的电力(每天360万千瓦时)。这一能耗相当于大约1.2亿个美国家庭一年的用电量。

作为回应,xAI承诺通过规划一个新的变电站和灰水处理设施来减轻这些影响。这些措施旨在缓解对当地资源的压力,体现了xAI在创新与可持续性之间寻求平衡的承诺。

关于编辑

卡伊夫·沙伊赫凯夫·沙伊kh是一名记者和作家,热衷于将复杂的信息转化为清晰、有影响力的报道。他的写作涵盖了科技、可持续性、地缘政治等领域,偶尔也会涉及小说创作。在数字媒体领域,他曾与来自免疫学、人工智能、软件即服务(SaaS)、制造以及家具等行业领导者的合作。除了他工作之外的众多事务外,他还喜欢阅读、呼吸和感恩。

关于《埃隆·马斯克的xAI扩大了Colossus,这是世界上最大的人工智能超级计算机。》的评论


暂无评论

发表评论

摘要

Meet the mammoth AI supercomputer featuring 100,000 Nvidia H100 GPUs, poised for a significant performance boost. Technological advantages of xAI’s Colossus Built in Memphis, Tennessee, in just four months, Colossus utilizes Nvidia’s H100 GPUs, offering up to nine times the speed of the previous A100 models, with each H100 GPU delivering up to 2,000 teraflops of performance. Source: Interesting Engineering 环境影响和可持续性措施 尽管Colossus项目在技术上表现出色,但它还是面临着来自孟菲斯社区的环境和资源问题。该项目的能耗相当于大约1亿2千万户美国普通家庭一年的用电量。在数字媒体领域,他曾与免疫学、人工智能、SaaS、制造业甚至家具等行业领导者合作。