由华为和中国人工智能基础设施的研究人员共同撰写启动硅流,该论文将CloudMatrix 384描述为专门的AI超级节点,是用于处理大量AI工作负载的专门构建的。
根据本周发表的论文,华为预计Cloudmatrix将重塑AI基础设施的基础。它由384个上升910C神经处理单元(NPU)和192 Kunpeng Server Central Processing单元组成,它们通过统一的总线相互联系,提供超高的带宽和低延迟。
该论文说,先进的大型语言模型(LLM)提供解决方案,称为CloudMatrix-Infer,利用基础架构。它超过了一些世界上最突出的系统的表现R1推理模型。
数据中心是容纳大容量服务器和数据存储系统的设施,具有多种功率来源和高带宽的Internet连接。更多的企业正在使用数据中心为其AI项目托管或管理计算基础架构。