meet the mammoth AI supercomputer equipped with 100,000 Nvidia H100 GPUs, ready to deliver a significant performance boost.
埃隆·马斯克(特斯拉公司的联合创始人兼首席执行官)与黄仁勋(英伟达公司的首席执行官)在美国加州圣何塞的GPU技术大会上合影。
2024年10月4日,大孟菲斯商会批准了xAI的人工智能培训设施和超级计算机Colossus的扩建。Colossus于一个月前启动,迅速获得认可,成为世界上最大的GPU超级计算机,最初配备了100,000个Nvidia GPU。
在埃隆·马斯克的领导下,xAI的目标是将Colossus的能力翻倍至200,000个GPU,其中包括50,000个先进的H200。这个雄心勃勃的增长计划,在6月5日该设施首次宣布后的短短122天内实现,展示了其快速的推进速度和规模典型性。马斯克的事业 Ventures这个词在这里可以理解为企业或项目,但直接翻译成“事业”更为贴切。.
xAI的Colossus的技术优势
在田纳西州孟菲斯仅用四个月内建成的Colossus利用了NVIDIA的H100 GPU提供高达前一代A100型号九倍的速度,每个H100 GPU可提供高达2,000万亿次浮点运算的性能。初始配置集成了100,000个H100 GPU,并计划再添加50,000个H100和50,000个新的H200 GPU。
组合数组理论上可以达到约497.9 exaflops(497,900,000 teraflops),在超级计算机性能方面树立了新的基准。尽管这种增强的能力远远超过了当前的超级计算机记录,实际性能可能面临系统集成、通信开销、功耗和散热等方面的挑战。
Colossus也在主要竞争对手中脱颖而出,xAI计划中的200,000个GPU超过了Google AI的90,000个和Meta AI的70,000个GPU。此次扩张旨在提升xAI的能力为了开发和改进像Grok 3这样的AI模型,该模型将与OpenAI备受期待的语言模型技术突破GPT-5竞争。作为xAI最先进的聊天机器人,Grok 3预计将于2024年12月发布。
随着特斯拉准备在本月的Robotaxi活动中展示其人工智能增强功能,特斯拉的人工智能计划与xAI的计算资源之间的合作变得越来越明显,特别是在自主驾驶技术方面。
环境影响和可持续性措施
尽管拥有技术优势,Colossus项目仍然面临着孟菲斯社区提出的环境和资源问题的担忧。
该超级计算机的运行预计会消耗130万 kWh电能每日加仑的水量并且在高峰时段每小时消耗高达150兆瓦的电力(每天360万千瓦时)。这一能耗相当于大约1.2亿个美国家庭一年的用电量。
作为回应,xAI承诺通过规划一个新的变电站和灰水处理设施来减轻这些影响。这些措施旨在缓解对当地资源的压力,体现了xAI在创新与可持续性之间寻求平衡的承诺。
关于编辑
卡伊夫·沙伊赫凯夫·沙伊kh是一名记者和作家,热衷于将复杂的信息转化为清晰、有影响力的报道。他的写作涵盖了科技、可持续性、地缘政治等领域,偶尔也会涉及小说创作。在数字媒体领域,他曾与来自免疫学、人工智能、软件即服务(SaaS)、制造以及家具等行业领导者的合作。除了他工作之外的众多事务外,他还喜欢阅读、呼吸和感恩。