中国人工智能初创公司 DeepSeek 如何打造与 OpenAI 相媲美的模型
2025-01-25 10:00:00
DeepSeek是一家中国人工智能公司,因其不依赖主要科技巨头的资金而脱颖而出。该公司由梁创立,优先聘请来自中国顶尖大学的年轻博士生,以营造专注于非正统项目的合作研究环境。这种方法与传统互联网公司形成鲜明对比,传统互联网公司的资源往往稀缺且竞争激烈。由于美国出口管制限制先进芯片的使用,DeepSeek 面临挑战,迫使他们在模型训练效率和成本效益方面进行创新。他们的进步,特别是在多头潜在注意力(MLA)和专家混合技术方面的进步,使他们成为优化人工智能模型计算资源的领导者。通过公开分享这些创新,DeepSeek 获得了全球人工智能社区的大力支持,并可能挑战美国现有的出口管制策略。