英语轻松读发新版了,欢迎下载、更新

Qwen的AI工程师真正来自 - 亚洲时报

2025-02-17 02:54:09 英文原文

作者:Yong Jian

DeepSeek和Alibaba的QWEN人工智能平台的最近兴起是中国和美国的技术专家和投资者中的一个热门话题。然而,有关中国工程团队的具体信息仍然很少。 

亚洲时间分析使用有关两个聊天机器人开发人员的背景的公共信息,可能有助于更清楚地描绘出deepseek和qwen的出现。

根据公开可用的研究论文和媒体报告,DeepSeek和Qwen的工程团队不会合作或重叠。” 

两人之间唯一的联系是Deepseek的研究人员在今年1月22日,他们蒸馏了Qwen2.5,以及Meta的Llama,以开发DeepSeek-R1。DeepSeek-R1的推出导致1月下旬在美国股市下跌。 

一些分析师认为,开源AI DeepSeek也可能使用知识蒸馏来从Openai Chatgpt中提取数据并训练其AI模型。但是,尚未公开证据表明这样做。 

根据1月22日的论文,DeepSeek-R1有16个核心贡献者,其中一些人与Microsoft Research Asia有直接联系(MSRA)和中国计算机联合会(CCF) 

核心贡献者Wu2014年至2019年,由MSRA的Ming Zhou在北京大学的博士学位课程中受到监督。他是2013年至2019年在MSRA的全职实习生,然后于2019年加入副研究员。” 

核心贡献者Daya Guo还在2018年至2023年在广州阳光明星大学的博士学位课程期间受到Ming Zhou的监督。计算集团 

来自Tsinghua University的核心贡献者Zhibin Gou和Zhihong Shao,共同撰写文件与MSRA的Nan Duan。 

Zhenda Xie是DeepSeek的另一个贡献者,从2018年至2023年,MSRA的杰出科学家Baining Guo在同一时期内在MSRA担任研究实习生。 

明周(Ming Zhou)和南·杜恩(Nan Duan)仍在为MSRA工作。在2016年和2018年,他们共同引领CCF的计算机术语批准工作委员会。现在是CCF的副总裁。

当然,DeepSeek的团队与MSRA研究人员之间的联系并不意味着MSRA在基于杭州的公司中有任何股份。但是,如果美国要对中国的科技领域施加更大的压力,MSRA可能必须停止其在中国的工作和实习计划。

在2023年初,MSRA据说由于担心他们与人民解放军的联系,因此停止了来自七所中国大学和北京邮政与电信大学的招聘实习生。

这些学校包括美国批准的西北理工大学(NPU)和哈尔滨理工学院(HIT)。 

达莫学院 

总部位于杭州的阿里巴巴由中国大亨杰克·马(Jack Ma)创立,以不同的方式开发了聊天机器人。

阿里巴巴动员了其电子商务业务的现金流量,于2017年成立了达莫学院,从事AI研究。达摩代表发现,冒险,动力和展望。 学院建立了

顾问委员会在10名著名的教育者和研究人员中,来自美国的6名和中国大学的4名。 阿里巴巴指派阿里扬的首席技术官吉恩·周(Jingren Zhou)经营达莫学院(Damo Academy)。

周在美国哥伦比亚大学获得了计算机科学博士学位。在2016年7月加入阿里巴巴之前,他是微软研发合作伙伴四年。 

负责Qwen数据处理的算法工程师Chang Zhou于2017年加入Damo Academy。 

在加入阿里巴巴之前,他已经工作与阿里巴巴的软件工程师进行了一些项目,并于2017年与他们共同撰写了两篇论文。北京大学教授Jun Gao显然是Chang Zhou的主管。 

GAO于2003年获得北京大学的博士学位出版超过30篇研究论文。他拥有由中国863计划和中国国家自然科学基金会(NSFC)资助的项目。 

1986年3月,200名中国科学家提出了当时的中国领导人邓小平的863计划。政府于同年11月制定了该计划。

2022年,Chang Zhou与一群学者共同撰写了一份研究论文,其中包括北京大学的Bin Cui,他们还领导了一些由863计划资助的项目。 

Cui现在是副院长北京大学计算机科学学院和副主任CCF数据库技术委员会的 

去年7月,Chang Zhou决定聘请大约10名工程师加入BOCTEDANCE。据报道,阿里巴巴提出了诉讼对周的反对,声称他没有权利加入竞争对手。 

Qwen vs DeepSeek

阿里巴巴的研究团队似乎拥有比DeepSeek更强大的顾问委员会。它在数据管理研究中也具有更广泛的历史。 

这可能就是为什么阿里巴巴可以构建原始AI模型Qwen2.5,而DeepSeek仅召集了其他AI模型的蒸馏版。这也可能是为什么Apple Inc最近与阿里巴巴合作推出AI驱动的iPhone的原因。 

IT专栏作家阿曼达·卡斯韦尔(Amanda Caswell)在最近的一部文章在她提出的所有七项测试中,Qwen2.5都击败了Deep-R1。她说Qwen2.5提供了更多结构化和可读的答案,而DeepSeek-R1的回答缺乏深度和独创性。” 

从北京的角度来看,Qwen和DeepSeek同样至关重要,因为它们帮助中国升级其行业,并将对冲抵御我们的脱钩和制裁。

媒体报告中国总统习近平很快将主持研讨会,以增强私营部门的情绪。阿里巴巴联合创始人Jack MA和DeepSeek创始人Liang Wenfeng将参加。 

阳是亚洲时报的贡献者。他是一位专门从事中国技术,经济和政治的中国记者。” 

阅读:苹果与阿里巴巴合作伙伴在中国出售AI驱动的iPhone

关于《Qwen的AI工程师真正来自 - 亚洲时报》的评论


暂无评论

发表评论

摘要

DeepSeek和Alibaba的QWEN平台的兴起引起了技术专家和全球投资者的兴趣。使用公开数据的分析表明,尽管这些平台背后的工程团队没有合作,但DeepSeek团队的某些成员与Microsoft Research Asia(MSRA)之间存在联系。这种联系提出了有关潜在知识交流的问题,但缺乏确定的证据。阿里巴巴的达莫学院(Damo Academy)成立于2017年,旨在支持AI研究,在数据管理方面拥有更强的顾问委员会和更长的历史,从而可以开发QWEN2.5(例如Qwen2.5)的原始AI模型。最近的报道表明,中国总统习近平很快将主持一个专注于促进私营部门情绪的研讨会,阿里巴巴和Deepseek的代表有望参加。