关于作者
经过|
作为一名科技记者,Zul 关注的话题包括云计算、网络安全和企业行业的颠覆性技术。除了拥有网络技术背景之外,他还拥有主持网络研讨会和在视频上展示内容的专业知识。
AI 领域有一个新的竞争者正在掀起波澜:QwQ-32B-Preview。
这种所谓的“推理”人工智能模型正在与 OpenAI o1 进行比较,它是少数可以在宽松许可下下载的模型之一。对于渴望实验的开发人员和研究人员来说,这是一个巨大的好处。
QwQ-32B-Preview 由阿里巴巴的 Qwen 团队打造,绝对不是轻量级的。它包含 325 亿个参数(将这些参数视为其解决问题能力的基石),并且可以处理多达 32,000 个单词的提示;比有些小说还长!测试表明,它在 AIME 和 MATH 等基准测试中优于 OpenAI o1-preview 和 o1-mini。就上下文而言,AIME 使用其他 AI 模型来评估性能,而 MATH 是应用题的集合。
但该模型不仅仅涉及数学问题或逻辑难题。它的与众不同之处在于它处理任务的方式。QwQ-32B-Preview 提前计划,对其工作进行事实检查,并避免常见的人工智能错误。当然,它并非完美无缺,阿里巴巴承认存在语言切换、偶尔循环以及“常识”推理困难等问题。即便如此,它仍然代表着向更智能的人工智能系统迈出了一步。
QwQ-32B-Preview 是可访问的:您可以通过 Hugging Face 运行或下载它。然而,与其他中国开发的人工智能一样,它在监管范围内运行。这意味着它会小心地避开政治敏感话题,以遵守中国的规则,确保其符合“社会主义核心价值观”。
阿里巴巴在这个领域并不孤单。Meta 的 Llama 3.1 是另一个开源选项,尽管它采用了不同的方法,专注于生成人工智能而不是推理。虽然这两种模型都是创新的,但 QwQ-32B-Preview 专注于用该公司所描述的类人方法解决问题,将其归入推理类别。
中国人工智能领域的竞争正在加剧。DeepSeek、上海人工智能实验室、昆仑万维等公司纷纷加入推理人工智能竞赛,并快速发布自己的模型。例如,DeepSeek 的 r1 声称在一半的基准测试中优于 OpenAI 的 o1,特别是在数学和编程方面。上海人工智能实验室的 InternThinker 采用结构化方法来解决问题,包括理解查询、回忆知识、规划解决方案和反思答案等步骤。
这一活动的激增凸显出中国企业追赶美国科技巨头的速度有多快。来自杭州的人工智能企业家徐亮,总结了一下: – OpenAI 给出了方向;通过研究,中国科技公司正在取得进展。——QwQ-32B-Preview 及其竞争对手的发布表明了他们所涉足的领域。
但这不仅仅是追赶。推理人工智能标志着模型设计和使用方式的变化。与依赖暴力生成答案的旧人工智能系统不同,QwQ-32B-Preview 等推理模型旨在模仿人类解决问题的方式。这种方法不仅使它们能够更有效地完成复杂的任务,而且还扩展了它们的潜在用例,例如解决高级数学或提供详细的财务建议。
无论是解决谜题、推理复杂问题,还是扩展开源人工智能的功能,有一件事是明确的:人工智能的发展正在加速。系好安全带——这只是开始。
(摄影:未飞溅)
想向行业领导者了解更多关于人工智能和大数据的知识吗?查看人工智能与大数据博览会在阿姆斯特丹、加利福尼亚和伦敦举行。该综合活动与其他主要活动同期举行,包括智能自动化大会,布洛克X,数字化转型周, 和网络安全与云博览会。
探索由 TechForge 提供支持的其他即将举行的企业技术活动和网络研讨会这里。