阿里巴巴的AI Model Qwen3:一个容易幻觉的聪明的孩子 - 亚洲时报
2025-05-02 22:06:28
阿里巴巴集团(Alibaba Group)发布了QWEN3,这是一种大型语言模型,优于以前的版本,在数学证明和代码写作能力方面的一些美国同行。它包括两个型号的混合物(MOE)型号和六个密集的型号,这些模型在36万亿个代币中训练,使其前身的训练数据增加了一倍。与DeepSeek V3相比,QWEN3的部署成本和能源消耗较低。测试表明,QWEN3在LiveCodeBench V5和Aime’24基准测试中表现出色,但在复杂的推理任务中落后于Gemini2.5 Pro。由于美国出口限制,中国人工智能公司面临芯片短缺,导致他们寻求诸如国内芯片或修改的NVIDIA H20 AI芯片之类的替代方案。