英语轻松读发新版了,欢迎下载、更新

微软支持了一家小型硬件初创公司,该公司刚刚推出了首款人工智能处理器,无需 GPU 或昂贵的 HBM 内存即可进行推理,Nvidia 的一个重要合作伙伴正在与其合作

2024-12-28 13:28:00 英文原文

作者:Efosa UdinmwenSocial Links NavigationFreelance Journalist

A Corsair One i500 on a desk
(图片来源:Future / John Loeffler)

  • 微软支持的初创公司推出了无需 GPU 的生成式 AI 替代方案
  • DIMC架构提供150TB/s的超高内存带宽
  • Corsair 支持变形金刚、代理 AI 和交互式视频生成

总部位于加利福尼亚州圣克拉拉的硬件初创公司 d-Matrix Inc. 推出了首款人工智能处理器 Corsair,旨在增强人工智能推理能力。

支持者微软Corsair 利用尖端技术,避开了传统 GPU 和昂贵的高带宽内存 (HBM),提供了显着的性能和成本优势。

Corsair 目前可供抢先体验的客户使用,计划于 2025 年第二季度提供更广泛的可用性。

Corsair 的性能重新定义了 AI 推理

Corsair 处理器专为处理要求苛刻的人工智能推理任务而设计,特别是生成式推理任务人工智能模型。例如,它以每个令牌 1 毫秒的速度实现每秒 60,000 个令牌 在单个服务器中运行 Llama3 8B 时。

在资源更加密集的场景中,例如 Llama3 70B 型号,Corsair 在单个机架中以每个令牌 2 毫秒的速度每秒交付 30,000 个令牌,与传统方式相比,可大幅节省能源和运营成本图形处理器基于的解决方案。

该处理器基于 Nighthawk 和 Jayhawk II 模块构建,采用 6 纳米制造工艺。每个 Nighthawk 模块都集成了四个神经核心和一个 RISC-V CPU,专门用于支持具有数字内存计算 (DIMC) 和多功能数据类型处理(包括块浮点 (BFP))的大型模型推理。

Corsair 采用小芯片封装,将内存和计算集成在一起,以最大限度地提高效率。它符合行业标准 PCIe Gen5 全高全长卡外形尺寸,可与 DMX 桥卡搭配使用以实现可扩展的性能。每张卡均配备 2400 TFLOPs 8 位峰值计算能力,以及 2GB 集成性能内存和高达 256GB 的片外内存容量。

订阅 TechRadar Pro 时事通讯,获取您的企业成功所需的所有热门新闻、观点、功能和指导!

值得注意的是,美光科技是英伟达,也正在与 d-Matrix 合作。

d-Matrix 最初定于 2023 年底推出,为了响应生成式 AI 不断增长的需求,重新配置了其架构。这一转变使得 Corsair 能够整合针对 Transformer 模型和新兴应用(例如代理 AI 和交互式视频生成)量身定制的增强功能。

d-Matrix 联合创始人兼首席执行官 Sid Sheth 表示:“我们看到了 Transformer 和生成式 AI 的到来,并创立了 d-Matrix 来解决围绕我们这个时代最大的计算机会的推理挑战。”

“同类首创的 Corsair 计算平台为具有多个用户的高交互性应用程序带来了极快的代币生成速度,使 Gen AI 具有商业可行性,”Sheth 补充道。

通过电子新闻

您可能还喜欢

Efosa 撰写有关技术的文章已有 7 年多了,最初是出于好奇心,但现在是出于对该领域的强烈热情。他拥有理学硕士和博士学位,这为他的分析思维奠定了坚实的基础。Efosa 对技术政策产生了浓厚的兴趣,特别是探索隐私、安全和政治的交叉点。他的研究深入研究技术进步如何影响监管框架和社会规范,特别是在数据保护和网络安全方面。加入TechRadar Pro后,除了隐私和技术政策外,他还专注于B2B安全产品。可以通过以下电子邮件联系 Efosa:udinmwenefosa@gmail.com

关于《微软支持了一家小型硬件初创公司,该公司刚刚推出了首款人工智能处理器,无需 GPU 或昂贵的 HBM 内存即可进行推理,Nvidia 的一个重要合作伙伴正在与其合作》的评论


暂无评论

发表评论

摘要

d-Matrix Inc. 是一家由微软支持的加州初创公司,推出了 Corsair,这是其首款人工智能处理器,专为高效人工智能推理而设计,无需使用 GPU 或昂贵的高带宽内存 (HBM)。Corsair 提供 150 TB/s 的超高内存带宽,并支持 Transformer、代理 AI 和交互式视频生成。使用 Llama3 8B 型号,它可在 1 毫秒延迟下每秒处理多达 60,000 个令牌;在 Llama3 70B 型号上,可在 2 毫秒延迟下每秒处理 30,000 个令牌,与传统 GPU 解决方案相比,显着降低了能源和运营成本。Corsair 采用 6nm 工艺打造,具有数字内存计算 (DIMC) 功能,现已向早期客户开放,并计划于 2025 年第二季度提供更广泛的可用性。