TensorWave认为它可以凭借基于AMD的云服务打破Nvidia在AI计算领域的垄断地位 | TechCrunch

2024-10-08 12:00:00 英文原文

作者:Kyle Wiggers

芯片制造商英伟达营收达到300亿美元在上一财政季度,主要由人工智能行业对GPU的旺盛需求所推动。GPU对于训练和运行AI模型来说是必不可少的;它们包含数千个可以并行工作的核心,能够快速执行支撑这些模型的线性代数方程。

对人工智能的需求仍然很高,而英伟达的GPU已经成为各规模人工智能玩家首选的芯片。但_tensorwave_(注意:"TensorWave" 并没有明确的官方中文名称,这里保留原词。)一家去年年底成立的公司逆势而行,推出了一种仅提供AMD硬件(该硬件与Nvidia竞争)的云服务,专门用于AI工作负载。

“我们意识到了一种不健康的垄断现象——这种垄断正在剥夺终端用户对计算资源的访问,并抑制人工智能领域的创新,”TensorWave的首席执行官兼联合创始人Darrick Horton在接受TechCrunch采访时说道。“受制于将人工智能民主化的愿望,我们致力于提供一个可行的替代方案,以恢复竞争和选择。”

曲折的小路

pickleball最初将Horton与TensorWave的另外两位联合创始人Jeff Tatarchuk和Piotr Tomasik联系在一起,或者说,至少它是促成这一切发生的契机(双关语)。

一天比赛结束后,Tomasik 和 Tatarchuk(他们是亲密的朋友,也是长期的双打搭档)邀请了 Tatarchuk 的一位前同事 Horton 一起去他们最喜欢的拉斯维加斯酒吧。

“随着对话的展开,我们讨论了GPU计算能力被垄断所导致的供应限制,”Horton说。“这一认识促成了TensorWave的成立。”

这三个合伙人不仅仅是因为打pickleball而认识的。

塔塔楚克与霍顿共同创立了云供应商VMAccel,在此之前,他将另一家初创企业、客户关系管理开发商Lets Rolo卖给了数字身份公司LifeKey。霍顿拥有机械工程和物理学学士学位,曾在洛克希德·马丁公司的臭鼬工厂研发部门工作过,之后与人联合创办了VaultMiner Technologies(一家加密货币挖矿公司)以及VMAccel的母公司。

至于Tomasik,他与Tatarchuk共同创立了Lets Rolo。(Tomasik还是影响者营销网站Influential的联合创始人,该网站于7月被法国公关公司Publicis以5亿美元的价格收购。)

那么是什么让这三个对超大规模厂商领域知之甚少的创业者认为自己能够与人工智能行业的巨头竞争呢?基本上是毅力。

“我们认为我们可以解决GPU供应问题,”霍顿说。

维加斯公司

TensorWave总部位于拉斯维加斯,对于一家云基础设施初创公司来说,这是一个不同寻常的选择。但Horton表示团队认为这里的机会很好。

他说:“我们认为 vegas 有潜力成为一个繁荣的技术和创业生态系统。”

那个预测并非完全没有根据。根据根据Dealroom.co的数据,拉斯维加斯拥有超过600家初创公司,雇用了超过11000人,并在2022年吸引了超过40亿美元的投资。

能源成本和运营费用 更低在拉斯维加斯的花费甚至超过了美国许多主要城市的消费。托马斯基和塔塔丘克都与该市的风险投资社区有着密切联系。

托马西克此前是位于拉斯维加斯的种子基金1864 Fund的投资合伙人,现在他与非营利性加速器StartUp Vegas和Vegas Tech Ventures合作。(奇怪的是,Vegas Tech Ventures的网站抛出一个404错误,显示其合作伙伴和投资组合公司的页面;一位发言人表示这是一个技术问题并会予以纠正。Tatarchuk 是风险投资孵化公司Fruition Lab的天使投资人,这家位于拉斯维加斯的孵化器相当不寻常地起源于一个不同的开始。基督教宗教组织.

这些联系——包括霍顿的联系——帮助将TensorWave打造成首批提供AMD Instinct MI300X实例用于AI工作负载的云服务之一。根据要求,TensorWave可以提供配备专用存储和高速互连设备的配置,并按小时出租GPU容量,同时要求至少六个月的合同。

“在整个云空间中,我们与同行为伍,”霍顿说。“我们认为自己是互补的,提供具有竞争力的价格性能比的特定于AI的计算能力。”

AMD向前发展

有一个繁荣的市场针对构建低成本、按需和基于GPU的云端服务的人工智能初创公司。

CoreWeave这家最初作为加密货币挖矿业务起步的GPU基础设施提供商最近筹集了11亿美元的新资金(以及75亿美元的债务),并签署了一份多项数十亿产能的合作协议。处理;交易与微软合作。Lambda Labs于四月初获得了高达5亿美元的特殊目的融资工具,并且据报导寻求额外的8亿美元。非营利组织Voltage Park,背后支持者是加密货币亿万富翁Jed McCaleb,在去年十月宣布它正在投资5亿美元于基于GPU的数据中心。_and_(注意:文本最后的“And”没有对应的中文句子,因此保留原词)一起AI一家名为的云GPU主机,在三月份获得了Salesforce领投的1.06亿美元融资。

那么TensorWave希望如何竞争呢?

首先,在价格方面。Horton指出,MI300X是显著更便宜相比目前Nvidia用于AI工作负载的最流行GPU H100,该服务成本更低,这使得TensorWave能够将节省的成本传递给客户。他没有透露TensorWave的确切实例价格。但是要想击败更具竞争力的H100计划,其价格必须低于每小时约2.50美元——这是一个具有挑战性但并非不可能实现的目标。

“定价范围从每小时约1美元到每小时10美元不等,具体取决于工作负载的定制要求和选择的GPU配置,”Horton说。“至于TensorWave每个实例的成本,由于保密协议,我们无法分享这些细节。”

其次,在性能方面。Horton指出了一些基准测试,显示MI300X压倒性火力优势H100在运行(但不是训练)AI模型方面表现出色,特别是像Meta的文本生成模型这样的模型。Llama 2其他 评估建议该优势可能与工作负载相关。)

霍顿的声称似乎有些可信之处,鉴于科技行业的重要人物对MI300X表现出了兴趣。Meta公司在12月表示,它将使用MI300X芯片用于如运行其大型语言模型等用例。元AI助理,而OpenAI,制作了ChatGPT计划在其开发工具中支持MI300X。

比赛

其他人押注于AMD的人工智能芯片则从初创公司如 laminar以及扩展到更大的、更成熟的云服务提供商如Azure以及Oracle。 (Google Cloud和AWS)保持不相信(关于AMD的竞争性。)

目前对所有这些供应商有利的是继续的Nvidia GPU短缺以及延迟关于Nvidia即将推出的Blackwell芯片。但短缺可能会缓解很快通过增加关键芯片组件的生产,特别是内存。这可能允许英伟达扩大H200的出货量,H200是H100的继任者,其性能有了显著提升。

对于押注于AMD硬件的新兴云服务提供商来说,另一个存在主义困境是跨越英伟达围绕AI芯片建立的竞争壁垒。英伟达的开发软件被认为比AMD的更成熟且更容易使用,并且它被广泛部署。AMD首席执行官苏姿丰女士表示承认的采用AMD“需要付出努力”。

在遥远的 horizon(地平线上),随着超大规模云服务商增加在定制硬件上的投资以运行和训练模型,未来的竞争可能会在价格方面变得更具挑战性。Google 提供了它的TPU; 微软最近发布了两款定制芯片,Azure梅亚和Azure钴taş;亚马逊网络服务(AWS)有Trainium、Inferentia 和 Graviton.

“随着开发人员寻求能够有效处理其AI工作负载的替代方案,特别是面对内存和性能需求增加以及持续生产问题导致的延迟时,AMD将在较长一段时间内保持优势,在AI时代的计算民主化中发挥关键作用,”Horton表示。

早期需求

TensorWave在今年春天晚些时候开始在预览阶段接纳客户。但Horton表示,它已经产生了每年300万美元的经常性收入。他预计,在TensorWave将容量提升到20,000个MI300X时,这一数字将在年底前达到2500万美元——这是一个8倍的增长。

假设每块GPU 15000美元,20,000颗MI300X芯片相当于3亿美元的投资——然而Horton声称TensorWave的烧钱速度“仍在可持续范围内”。TensorWave此前告诉了The Register 报道称,它将使用其 GPU 作为大量债务融资的抵押品,这是包括 CoreWeave 在内的其他数据中心运营商采用的一种方法;Horton 表示这仍然是计划。

“这反映了我们强大的财务健康状况,”他继续说道。“通过在最需要的地方提供价值,我们已经处于有利的战略位置,能够应对潜在的逆风。”

我问霍顿TensorWave目前有多少客户。他因为“保密”原因拒绝回答,但强调了TensorWave与网络骨干提供商公开宣布的合作伙伴关系。埃дж科RE Networks以及MK1一家由前 Neuralink 工程师创立的人工智能推理创业公司。

“我们正在迅速扩大容量,有多节点可用,并且我们将持续增加容量以满足管道日益增长的需求,”Horton表示,并补充说TensorWave计划在2024年第四季度发布的新一代AMD MI325X GPU将于今年11月或12月上线。

投资者似乎对TensorWave的增长轨迹感到满意。Nexus副总裁在周三透露,该公司领导了一轮4300万美元的融资,参与方还包括Maverick Capital、StartupNV、Translink Capital和AMD Ventures。

这一轮将TensorWave的估值定为1亿美元(投后估值)。

“AMD Ventures 分享了 TensorWave 愿景,致力于改变人工智能计算基础设施,”AMD Ventures 高级副总裁 Mathew Hein 在一份声明中表示。“他们部署 AMD Instinct MI300X 并能够向人工智能客户和开发者提供公共实例,这使他们在人工智能领域成为早期竞争者,我们很高兴通过本轮资金支持他们的成长。”

关于《TensorWave认为它可以凭借基于AMD的云服务打破Nvidia在AI计算领域的垄断地位 | TechCrunch》
暂无评论

摘要

芯片制造商英伟达在上一财季营收达到300亿美元,这主要得益于人工智能行业对GPU的强烈需求。“我们认识到一个不健康的垄断局面正在发挥作用——它使终端用户无法获得计算资源,并抑制了AI领域的创新。”TensorWave的首席执行官兼联合创始人Darrick Horton在接受TechCrunch采访时说道。“蜿蜒的道路” 最初是乒乓球将Horton与TensorWave的另外两位联合创始人Jeff Tatarchuk和Piotr Tomasik联系在一起——或者说,至少这是促成他们合作的第一步(抱歉使用了双关语)。And Together AI是一家同时进行生成式AI研究的云GPU提供商,在今年三月获得了一轮由Salesforce领投、总额为1.06亿美元的投资。Horton指出,MI300X相比英伟达目前最流行的用于AI工作负载的GPU H100要便宜得多,并且这使得TensorWave能够将节省的成本转嫁给客户。