作者:Julie Bort
周四,微软首席执行官萨蒂亚·纳德拉 (Satya Nadella)在推特上发布了视频他的公司第一个部署的大规模人工智能系统(英伟达喜欢称之为人工智能“工厂”)。他承诺这是“众多此类 Nvidia AI 工厂中的第一个”,将部署在 Microsoft Azure 的全球数据中心以运行 OpenAI 工作负载。
每个系统都是由 4,600 多台 Nvidia GB300 机架计算机组成的集群,这些计算机配备了广受欢迎的 Blackwell Ultra GPU 芯片,并通过 Nvidia 的超高速网络技术 InfiniBand 连接。(除了AI芯片之外,英伟达CEO黄仁勋也有先见之明,在InfiniBand上垄断了市场,当时他的公司收购 Mellanox2019 年为 69 亿美元。)
微软承诺,在全球推出这些系统时,将部署“数十万个 Blackwell Ultra GPU”。虽然这些系统的规模令人瞠目结舌(并且该公司分享了很多更多技术细节供硬件爱好者仔细阅读),此公告的时机也值得注意。
它紧随 OpenAI、其合作伙伴和有据可查的亦敌亦友,签署了两项备受瞩目的数据中心交易与 Nvidia 和 AMD。据估计,到 2025 年,OpenAI 已承诺投资 1 万亿美元来建设自己的数据中心。和首席执行官山姆·奥尔特曼本周表示还会有更多。
微软显然希望全世界都知道它已经拥有数据中心 –超过300该公司表示,他们在 34 个国家/地区拥有“独特的定位”,可以“满足当今前沿人工智能的需求”。这些怪物人工智能系统还能够运行具有“数百万亿参数”的下一代模型,它说。
我们预计本月晚些时候会听到更多有关微软如何加大力度为人工智能工作负载提供服务的信息。微软首席技术官凯文·斯科特将在会上发表讲话TechCrunch 颠覆,将于10月27日至29日在旧金山举行。