在2025年1月29日拍摄的插图中看到了2个QWEN应用程序。路透社/dado ruvic/Illustration/File Photo
[1/2]在2025年1月29日拍摄的插图中可以看到Qwen应用程序。路透社/dado ruvic/Illustration/File Photo购买许可权利,打开新标签
该部门称为Noah Ark Lab,于周六发表了声明,这是一个名为Hoxtagi的实体在代码共享平台Github上发布了英语论文的第二天,称Huawei的Pangu Pro Moe(专家混合)模型显示了Alibaba的QWEN 2.5 14b。
报名这里。
该论文说,这表明华为的模型是通过“升级”来得出的,并且没有从头开始训练,促使在网上和中国技术媒体中进行了广泛的讨论。
该论文补充说,其发现表明了潜在的侵犯版权,在技术报告中制造信息以及关于华为在培训模型的投资的虚假主张。
Noah Ark Lab在其声明中说,该模型“不是基于对其他制造商模型的增量培训”,并且它已经“在建筑设计和技术功能方面做出了关键的创新”。它补充说,这是完全建立在华为的上升芯片上的第一个大型型号。
它还说,其开发团队严格遵守所使用的任何第三方代码的开源许可证要求,而无需详细阐述其参考的开源模型。
阿里巴巴没有立即回应路透社的置评请求。路透社无法联系Hoxthagi或了解谁是实体背后的人。
中国初创公司的发行DeepSeek的今年1月,开源Model R1以低成本震惊了硅谷,并引发了中国科技巨头之间的激烈竞争,以提供竞争性产品。
Qwen 2.5-14b于2024年5月发布,是阿里巴巴的小型QWEN 2.5型号家族之一,可以在PC和智能手机上部署。
当华为在2021年最初发行的Pangu发行时,华为进入了大型语言模型,但此后被认为是落后于竞争对手。它于6月下旬在中国开发人员平台GitCode上开放了其Pangu Pro Moe模型,试图通过向开发人员提供免费访问来提高其AI技术的采用。
尽管QWEN更具消费者的面向消费者,并且拥有诸如Chatgpt之类的聊天机器人服务,但华为的Pangu型号往往在政府以及财务和制造业中使用。
ChePanï¼Mo和Brenda Goh的报道;Edwina Gibbs编辑
我们的标准:汤森路透信托原则。,打开新标签