MemryX 是一家源自密歇根大学的科技初创公司,推出了 149 美元的产品M.2模块 [PDF]旨在为紧凑型计算系统提供高效的人工智能处理能力。该模块面向边缘计算应用,其中功效和紧凑设计至关重要。
将四个 MemryX MX3 AI 加速器芯片封装到标准 M.2 2280 外形尺寸中,使该模块能够轻松集成到配备 PCIe Gen 3 M.2 插槽的系统中。据称,每个 MX3 芯片可提供 6 TOPS(每秒万亿次运算),总共提供高达 24 TOPS 的计算能力,而功耗仅为 6 至 8 瓦。它还支持一系列数据格式,包括 4 位、8 位、16 位权重和 BFloat16。值得注意的是,该模块无需主动冷却即可运行,而是依靠附带的被动散热器来管理热性能。
菲罗尼克斯已测试 MemryX MX3 M.2 模块,评估其作为 AI 加速器的性能和可用性。该模块安装在运行 Ubuntu 24.04 LTS 且具有 M.2 PCIe Gen 3 插槽的系统中,借助 MemryX 的开源驱动程序和开发人员工具,集成起来非常简单。据说该模块的 4 个 MemryX MX3 芯片的 24 TOPS 性能足以满足各种推理工作负载,特别是针对 8 位权重优化的推理工作负载。
第 1 张图片(共 3 张)
该评论还强调了该模块强大的软件兼容性,支持 TensorFlow 和 ONNX 等框架,以及运行中小型人工智能模型的效率。每个 MX3 芯片支持多达 1050 万个 8 位参数,该模块的四个芯片总共可处理多达 4200 万个参数。此限制是由于缺少板载 DRAM 造成的。MemryX 计划在 2025 年推出一款新的 PCIe 卡来解决这个问题,该卡将搭载更多 MX3 AI 芯片。
MX3 M.2 模块的售价为 149 美元,对于寻求向边缘设备添加 AI 处理功能的开发人员和组织来说是一个经济实惠的选择。MemryX 还宣布该模块将在即将举行的消费电子展(CES) 2025 在拉斯维加斯举行,计划展示 MX3 在各种实际应用中的性能,进一步凸显其多功能性。