2025-07-07 05:59:00 · 英文原文

华为的AI实验室否认其Pangu模型之一复制了阿里巴巴的Qwen

在2025年1月29日拍摄的插图中看到了2个QWEN应用程序。路透社/dado ruvic/Illustration/File Photo

[1/2]在2025年1月29日拍摄的插图中可以看到Qwen应用程序。路透社/dado ruvic/Illustration/File Photo购买许可权利，打开新标签

北京/上海，7月7日（路透社） - 华为的人工智能研究部拒绝了主张，即其pangu Pro的版本大型语言模型已复制了阿里巴巴的元素

模特，说它是独立开发和训练的。

该部门称为Noah Ark Lab，于周六发表了声明，这是一个名为Hoxtagi的实体在代码共享平台Github上发布了英语论文的第二天，称Huawei的Pangu Pro Moe（专家混合）模型显示了Alibaba的QWEN 2.5 14b。

该论文说，这表明华为的模型是通过“升级”来得出的，并且没有从头开始训练，促使在网上和中国技术媒体中进行了广泛的讨论。

该论文补充说，其发现表明了潜在的侵犯版权，在技术报告中制造信息以及关于华为在培训模型的投资的虚假主张。

Noah Ark Lab在其声明中说，该模型“不是基于对其他制造商模型的增量培训”，并且它已经“在建筑设计和技术功能方面做出了关键的创新”。它补充说，这是完全建立在华为的上升芯片上的第一个大型型号。

它还说，其开发团队严格遵守所使用的任何第三方代码的开源许可证要求，而无需详细阐述其参考的开源模型。

阿里巴巴没有立即回应路透社的置评请求。路透社无法联系Hoxthagi或了解谁是实体背后的人。

中国初创公司的发行DeepSeek的今年1月，开源Model R1以低成本震惊了硅谷，并引发了中国科技巨头之间的激烈竞争，以提供竞争性产品。

Qwen 2.5-14b于2024年5月发布，是阿里巴巴的小型QWEN 2.5型号家族之一，可以在PC和智能手机上部署。

当华为在2021年最初发行的Pangu发行时，华为进入了大型语言模型，但此后被认为是落后于竞争对手。它于6月下旬在中国开发人员平台GitCode上开放了其Pangu Pro Moe模型，试图通过向开发人员提供免费访问来提高其AI技术的采用。

尽管QWEN更具消费者的面向消费者，并且拥有诸如Chatgpt之类的聊天机器人服务，但华为的Pangu型号往往在政府以及财务和制造业中使用。

ChePanï¼Mo和Brenda Goh的报道；Edwina Gibbs编辑

暂无评论

OC