为什么 QwQ-32B-Preview 是值得关注的推理 AI

作者：Muhammad Zulhusni

Why QwQ-32B-Preview is the reasoning AI to watch

关于作者

经过|2024 年 12 月 6 日

Why QwQ-32B-Preview is the reasoning AI to watch 作为一名科技记者，Zul 关注的话题包括云计算、网络安全和企业行业的颠覆性技术。除了拥有网络技术背景之外，他还拥有主持网络研讨会和在视频上展示内容的专业知识。

AI 领域有一个新的竞争者正在掀起波澜：QwQ-32B-Preview。

这种所谓的“推理”人工智能模型正在与 OpenAI o1 进行比较，它是少数可以在宽松许可下下载的模型之一。对于渴望实验的开发人员和研究人员来说，这是一个巨大的好处。

QwQ-32B-Preview 由阿里巴巴的 Qwen 团队打造，绝对不是轻量级的。它包含 325 亿个参数（将这些参数视为其解决问题能力的基石），并且可以处理多达 32,000 个单词的提示；比有些小说还长！测试表明，它在 AIME 和 MATH 等基准测试中优于 OpenAI o1-preview 和 o1-mini。就上下文而言，AIME 使用其他 AI 模型来评估性能，而 MATH 是应用题的集合。

但该模型不仅仅涉及数学问题或逻辑难题。它的与众不同之处在于它处理任务的方式。QwQ-32B-Preview 提前计划，对其工作进行事实检查，并避免常见的人工智能错误。当然，它并非完美无缺，阿里巴巴承认存在语言切换、偶尔循环以及“常识”推理困难等问题。即便如此，它仍然代表着向更智能的人工智能系统迈出了一步。

QwQ-32B-Preview 是可访问的：您可以通过 Hugging Face 运行或下载它。然而，与其他中国开发的人工智能一样，它在监管范围内运行。这意味着它会小心地避开政治敏感话题，以遵守中国的规则，确保其符合“社会主义核心价值观”。

阿里巴巴在这个领域并不孤单。Meta 的 Llama 3.1 是另一个开源选项，尽管它采用了不同的方法，专注于生成人工智能而不是推理。虽然这两种模型都是创新的，但 QwQ-32B-Preview 专注于用该公司所描述的类人方法解决问题，将其归入推理类别。

中国人工智能领域的竞争正在加剧。DeepSeek、上海人工智能实验室、昆仑万维等公司纷纷加入推理人工智能竞赛，并快速发布自己的模型。例如，DeepSeek 的 r1 声称在一半的基准测试中优于 OpenAI 的 o1，特别是在数学和编程方面。上海人工智能实验室的 InternThinker 采用结构化方法来解决问题，包括理解查询、回忆知识、规划解决方案和反思答案等步骤。

这一活动的激增凸显出中国企业追赶美国科技巨头的速度有多快。来自杭州的人工智能企业家徐亮，总结了一下： – OpenAI 给出了方向；通过研究，中国科技公司正在取得进展。——QwQ-32B-Preview 及其竞争对手的发布表明了他们所涉足的领域。

但这不仅仅是追赶。推理人工智能标志着模型设计和使用方式的变化。与依赖暴力生成答案的旧人工智能系统不同，QwQ-32B-Preview 等推理模型旨在模仿人类解决问题的方式。这种方法不仅使它们能够更有效地完成复杂的任务，而且还扩展了它们的潜在用例，例如解决高级数学或提供详细的财务建议。

无论是解决谜题、推理复杂问题，还是扩展开源人工智能的功能，有一件事是明确的：人工智能的发展正在加速。系好安全带——这只是开始。

（摄影：未飞溅）

参见：阿里云全面改革人工智能合作伙伴计划

想向行业领导者了解更多关于人工智能和大数据的知识吗？查看人工智能与大数据博览会在阿姆斯特丹、加利福尼亚和伦敦举行。该综合活动与其他主要活动同期举行，包括智能自动化大会,布洛克X,数字化转型周，和网络安全与云博览会。

探索由 TechForge 提供支持的其他即将举行的企业技术活动和网络研讨会这里。

标签：人工智能,阿里巴巴云,中国

OC

为什么 QwQ-32B-Preview 是值得关注的推理 AI

关于作者

关于《为什么 QwQ-32B-Preview 是值得关注的推理 AI》的评论

发表评论

摘要

相关新闻

相关讨论