英语轻松读发新版了,欢迎下载、更新

Radeon GPU支持补充说

2025-06-13 09:40:30 英文原文

作者:Anton ShilovSocial Links NavigationContributing Writer

AMD
(图片来源:AMD)

AMD本周介绍了其ROCM的第七版(莱登开放计算)开源软件堆栈用于加速计算,与ROCM 6相比,该计算实质上改善了现有硬件的AI推断,并增加了对分布式工作负载的支持,并扩展到Windows和Radeon GPU。此外,ROCM 7还为最新本能MI350X/MI355X处理器增加了对FP4和FP6低精度格式的支持。 

ROCM 7为客户端PC带来的最大变化是将ROCM扩展到Windows和Radeon GPU,它允许将离散和集成的GPU用于AI工作负载,但仅在基于Ryzen的PC上。从2025年下半年开始,开发人员将能够使用Radeon GPU在Ryzen台式机和笔记本电脑上构建和运行AI程序,这对于那些希望在当地运行高端AI LLMS的人来说可能很重要。

AMD

(图片来源:AMD)

AMD在AI硬件市场中位置较弱的原因之一是不完美的软件。但是,由于AMD的本能MI300X,ROCM 7的本能是推理性能的3.5倍,而训练吞吐量是ROCM 6的3倍,但情况似乎正在改善。该公司使用运行Llama 3.1-70B,QWEN 72B和DeepSeek-R1模型的8条本能MI300X机器进行了测试,批次尺寸为1到256,唯一的区别是ROCM 7在ROCM 6上使用ROCM 7。

图1 of 2

AMD
(图片来源:AMD)

新版本还通过与VLLM,SGLANG和LLM-D等开放框架进行集成来引入对分布式推断的支持。AMD与这些合作伙伴合作构建了共享组件和原语,从而使软件可以在多个GPU中有效扩展。” 

此外,ROCM 7增加了对诸如FP4和FP6之类的低精度数据类型的支持,这将为公司最新的基于cDNA 4的本能MI350X/MI3555X处理器带来切实的改进,并为即将到来基于cDNA 5的MI400X和下一代本能MI500X系列将分别在2026年和2027年成功成功MI300系列的产品。

AMD

(图片来源:AMD)

此外,与ROCM 7一起,AMD推出了其ROCM Enterprise AI MLOPS解决方案,该解决方案量身定制了用于企业的使用。该平台提供了使用特定领域数据集精炼模型的工具,并支持整合到结构化和非结构化工作流程中。AMD表示,它与生态系统合作伙伴合作,为诸如聊天机器人和文档摘要等应用程序建立参考实现,以使AMD硬件适合在生产环境中快速部署。” 

最后但并非最不重要的一点是,AMD还推出了其开发人员云,该云提供了对MI300X硬件的现成访问,其配置范围从具有192 GB内存的单GPU MI300X到具有1536 GB内存的八方MI300X设置。对于初学者,AMD提供25个免费使用时间,并且可以通过开发人员计划获得其他积分。还计划了对本能MI350X系统的早期支持。

获取汤姆(Tom)的硬件的最佳新闻和深入的评论,直接进入收件箱。

跟随 汤姆在Google新闻上的硬件``在您的提要中获取最新的新闻,分析和评论。确保单击“关注”按钮。

安东·希洛夫(Anton Shilov)是汤姆(Tom)硬件的撰稿人。在过去的几十年中,他涵盖了从CPU和GPU到超级计算机的所有内容,从现代流程技术和最新工厂工具到高科技行业的趋势。

关于《Radeon GPU支持补充说》的评论


暂无评论

发表评论