英语轻松读发新版了,欢迎下载、更新

DeepSeek的Rise Heralds Heralds地震变化在AI景观中

2025-02-18 23:20:00 英文原文

作者:王丹宁

歌曲陈/中国每日

专家说,竞争正在迅速发展的人工智能部门加热,因为初创企业DeepSeek的出现强调了中国在尖端技术方面日益增长的创新能力,这表明全球人工智能景观发生了巨大变化。

他们说,尽管美国对先进的AI芯片的出口控件收紧了,但DeepSeek的迅速崛起却挑战了一种信念,即大规模的计算资源对于AI突破至关重要。他们补充说,诸如Deep-seek之类的玩家的出现也将以开放,协作和包容的方式帮助加强全球AI生态系统的演变。

专家说,美国对技术的遏制不会阻碍中国的创新进展,而是会加速中国企业为实现技术突破的努力。

DeepSeek-R1是由Deep-Seek开发的最新OpenSource AI模型,最近启动了与位于美国OpenAI的领先模型在数学,编码和自然语言推理等任务中的领先模型的表现。但是,它以其外国同行的成本和计算能力的一小部分实现了这些出色的结果。

该模型使全世界令人惊讶,并通过科技行业发动了冲击波。它迅速飙升至Apple App Store的免费下载,超过Chatgpt并在中国免费应用程序排名中获得第1位。

领先的中国云计算公司,包括阿里巴巴云,百度AI云,腾讯云和华为云以及中国的三个最大的电信运营商,都将DeepSeek的AI模型集成到了他们的平台中。中国开发的模式还吸引了包括亚马逊,微软和NVIDIA在内的美国公司的关注。

国内突破

DeepSeek的成就可以瞥见中国科技公司如何在大型语言模型或LLM中努力取得技术突破,并推动在广泛领域中使用生成的AI技术。

阿里巴巴集团的云计算部门阿里巴巴云最近发布了其最新的AI模型QWEN 2.5-max。该公司表示,它具有增强的数学和编码功能,并且超出了OpenAI的GPT-4O和DeepSeek的V3模型等其他领先模型。

QWEN模型还提供了DeepSeek的低成本替代品。美国计算机科学家开发了一种新的推理模型,该模型在阿里巴巴的开源技术的帮助下接受了不到50美元的培训。

根据最近发表的一份研究论文,来自斯坦福大学和加利福尼亚大学伯克利分校的研究人员在阿里巴巴的QWEN 2.5-32B教学模型的背面培训了他们的AI模型,从而降低了AI培训的成本。

阿里巴巴云情报局首席技术官周·吉伦(Zhou Jingren)表示:“我们仍然致力于投资于先进的AI基础设施,以促进各个行业中广泛采用生成的AI技术。”Zhou补充说,该公司准备赋予各种规模的开发商和公司,增强其利用AI技术的能力,并进一步刺激开源社区的增长。

阿里巴巴集团首席执行官Wu Yongming强调了开源方法对LLMS的重要性,这将降低AI的开发和应用的阈值,从而大大降低了计算能力的成本,并提高了 -各种各样的行业的艺术技术。

开源使研究人员,开发人员和用户可以访问模型的基础代码,并可以使用参数,从而使它们能够使用,修改或增强模型以适应其需求。

目前,超过300,000家企业可以使用阿里巴巴的LLM,这些LLM在诸如代码编程,药物研发,太空勘探和制造等领域中具有广泛的应用。

百杜(Baidu)推出了最新版本的LLM Ernie 4.0 Turbo,该版本提供了更快的响应,并改善了处理复杂查询的性能。开发人员还能够通过百度的Qianfan AI平台整合了这项先进的技术。

这家总部位于北京的科技公司于2022年11月Openai宣布了Chatgpt,于2023年3月推出了LLM Ernie Bot。到目前为止,其AI驱动的聊天机器人已获得超过4.3亿用户。

百度联合创始人兼首席执行官罗宾·李(Robin Li)表示,基础模型的推断成本或计算费用可以在12个月内降低90%以上,并补充说,成本降低与生产率提高之间存在相关性。

李说:“如果您可以将成本降低一定百分比,那意味着您的生产力增加了这种百分比。我认为这几乎是创新的本质。”,即使在当前级别,LLM也可以在一系列场景中创造重要的价值。

李说,就AI而言,中国与一些西方国家之间的最大差异在于其应用,这推动了中国人工智能行业的快速发展。

百度最近还根据其自我开发的库伦芯片(Kunlun)芯片推出了第三代旺卡集群(Wanka Cluster),这标志着AI计算功率场中的里程碑,并显着提高了AI模型的训练效率。

Wanka群集是一个高性能计算系统,由10,000或更多GPU计算加速器芯片组成,主要用于训练和微调AI模型。

1月下旬,bytedance是受欢迎的简短视频应用Tiktok的所有者Tiktok的所有者,发布了Doubao 1.5 Pro,对其旗舰AI模型的升级,声称该模型超过了GPT-4O,在采用编码,推理和中文处理等类别中超过了GPT-4O。一种不牺牲绩效的“资源有效”培训方法。

克服障碍

中国国际贸易与经济合作学院的研究人员拜明说,DeepSeek的迅速上升表明,可以通过创新和克服政治障碍来实现AI的突破,并推翻了现有的AI发展范式,并重大地依赖大量投资于大规模的投资。基础架构和硬件。

Bai说,华盛顿试图遏制中国技术创新和进步“被证明是完全徒劳的,一定会失败”,并补充说:“它将促使中国企业对独立创新的努力加倍,以取得至关重要的进步技术。”

市场观察家表示,DeepSeek的成功为国际AI合作提供了新的机会,并通过为全球开发人员提供低成本且高效的AI平台来展示中国在AI领域的创新力量和开放态度。这也促进了全球AI技术的共享以及协作和创新。

信息与通信经济专家委员会成员潘·海林(Pan Helin)表示:“本土模型基于低成本,高性能和开源功能取得了重大突破。工业和信息技术部。

潘说:“中国人工智能公司有能力领导全球AI创新,因为他们寻求另一种AI开发方法,强调效率和开源合作,同时重塑全球AI的景观。”

这些公司的技术突破证明,AI创新不再仅仅取决于大量的计算资源,即使在限制条件下也可以蓬勃发展。潘强调,有必要通过开源原则来促进国际技术合作和创新。

Google前首席执行官埃里克·施密特(Eric Sc​​hmidt)将DeepSeek的崛起描述为AI竞赛中的“转折点”。施密特补充说,中国与大型美国科技公司竞争的能力同时使用较少的资源表明,美国有必要加强其开源人工智能努力。

主要大步

根据中国信息与通信技术学院的数据,中国现在拥有世界上有超过三分之一的LLM。该学院说,全球LLMS的数量已达到1,328,其中36%来自中国,仅次于美国的第二大中国。

北京社会科学学院副研究员王彭(Wang Peng)表示,中国在开发AI模型中的主要优势在于其丰富的数据资源和多样化的应用程序方案,而美国则领导着基本的AI研究,芯片,算法,算法和其他关键技术。

中国AI初创公司Moonshot AI最近推出了最新的型号Kimi K1.5。该模型取得了多模式推理能力的突破,使其可以处理结合文本,视觉效果,音频甚至代码的复杂输入。它还表现出强大的能力处理文本的长部分,例如单个查询中惊人的200,000个字符。

这家位于北京的初创公司表示,新模型旨在花更多的时间在响应之前花费更多的时间“思考”,并可以解决更复杂的问题,以优于其他领先的模型,例如数学和编码中的GPT-4O。

Moonshot AI由Yang Zhilin于2023年3月成立,Yang Zhilin毕业于Tsinghua University,并获得了美国卡内基·梅隆大学的计算机科学博士学位。该公司已从阿里巴巴,腾讯和社交媒体平台Xiaohongshu获得了大量资金。

根据市场研究公司CCID咨询公司的数据,中国的AI行业将在未来10至15年内取得长足的进步,其市场规模在2035年达到1.73万亿元(2367亿美元),占世界总数的30.6%。

中央金融与经济学中国互联网经济研究中心助理院长Ouyang Rihui说,中国公司的AI成就证明,他们已经规避了传统局限性,并创造了可能成为集体技术进步的新途径。

“近年来,美国试图通过出口控制和投资限制来遏制中国的技术上升。但是,中国科技公司已经开发了自己的替代解决方案,通过优化算法,模型体系结构和培训程序,培训较少的高端芯片模型,培训模型,欧阳说。

中国新经济学院的创始董事朱·凯利(Zhu Keli)表示,一系列中国人工智能公司采用的开源方法将降低技术阈值,加快AI技术的普及,并允许更多的企业和开发人员参与AI研究和发展。

朱认为,技术创新是不可阻挡的,国际合作是促进AI技术发展的重要方法,并补充说,中国的开放和包容态度有助于促进全球人工智能行业的协调发展。

朱补充说:“中国人工智能公司的突破表明了它们在全球舞台上的竞争能力不断提高,并将推动工业升级并注入强大的动力进入全球经济增长。”改进,隐私保护和数据安全。

埃森哲中国技术领导的技术领导的Yu Yi表示,随着公司努力保持领先并适应快速变化的市场,他们越来越多地转向最先进的AI技术来推动他们的创新努力,并补充说,这一比例的比例是中国公司加强投资并提高AI的应用正在急剧上升。

尽管AI带来了新的发展机会,但仍有挑战。专家呼吁努力确保通过全球治理安全可靠地应用AI技术。

自动化研究所的研究人员Zeng Yi是中国科学院的一部分。所有人。

他说,需要更多的努力来加强国际合作,以促进AI的可持续发展,并在联合国框架下建立全球人工智能发展和治理机构。

关于《DeepSeek的Rise Heralds Heralds地震变化在AI景观中》的评论


暂无评论

发表评论

摘要

中国科技公司的大型语言模型(LLMS)的快速发展正在重塑全球AI景观,尽管资源限制了,但尽管有资源限制,但仍取得了与美国同行的技术平等的重大进步。这一进展强调了中国对数据丰度和各种应用程序方案的战略关注,以增强其在AI创新中的地位。本文的要点包括:1。**全球存在**:超过三分之一的世界LLM现在是中文开发的,反映了一个支持快速技术进步的强大生态系统。2。**创新模型**:Moonshot AI(Kimi K1.5)和其他公司等公司正在开发具有高级多模式推理能力的模型,比领先的全球同行更有效地处理复杂的投入。3。**资源效率**:通过算法优化和模型架构增强功能,中国公司找到了使用较少高端硬件培训AI模型的方法,从而展示了资源有效的创新策略。4。**市场潜力**:到2035年,中国人工智能市场预计将达到1.73万元人民币,表明技术领域的经济影响和增长潜力很大。5。**国际合作**:倡导开源原则和国际合作,强调了中国致力于通过合作努力促进全球技术进步的承诺。但是,在算法改进,隐私保护和数据安全等领域仍然存在挑战,需要继续创新和强大的治理框架。专家强调了在联合国框架下提倡加强全球协作和治理机制以确保可持续的AI发展的重要性,并主张增强全球协作和治理机制的重要性。这种平衡的方法对于在解决相关风险和道德问题的同时最大程度地提高AI的好处至关重要。