英语轻松读发新版了,欢迎下载、更新

New DeepSeek AI竞争对手声称比V3和Chatgpt-4O更强大 - 与Qwen2.5-Max见面

2025-01-30 14:00:37 英文原文

作者:Graham BarlowSocial Links NavigationSenior Editor, AI

Qwen2.5-Max logo.
(图片来源:QWEN/ALIBABA)

  • 新的AI模型QWEN2.5-MAX已由阿里巴巴发布
  • 阿里巴巴声称它优于DeepSeek-V3和其他
  • 您现在可以使用QWEN CHAT聊天机器人尝试

事情在人工智能中迅速移动,我们很快就习惯了DeepSeek周围,​​现场的新竞争者比新的竞争者。阿里巴巴是中国领先的科技公司之一,他发布了一种名为QWEN2.5-MAX的新型AI模型,该模型声称它优于DeepSeek-V3和chatgpt-4O在各种基准测试中。

重要的是要注意,QWEN2.5-MAX不是一个推理模型,例如DeepSeek-R1或Chatgpt-O1,因此您可以看到它认为它可以找到每个答案。它在与DeepSeek-V3或Chatgpt-4O相当的级别上起作用。

在其网站上发布QWEN团队表示,我们的基本模型在大多数基准中都表现出了显着的优势,我们乐观地认为,培训后技术的进步将把下一个版本的QWEN2.5-MAX提升到新的高度。”

发布基准

Qwen2.5-Max benchmarks

比较QWEN2.5-MAX与竞争对手(如Llama-3.1,DeepSeek-V3和Chatgpt-4O)的指导模型的性能的基准。(图片来源:QWEN/ALIBABA)

QWEN团队发布的基准,例如Arena-Hard,Livebench,Livecodebench和GPQA-Diamond,显示Qwen2.5-Max的表现优于竞争对手,同时还展示了包括MMLU-PRO在内的其他评估的竞争结果。

与DeepSeek不同,阿里巴巴的Qwen2.5-Max不是一个开源项目,这意味着有关其工作方式的某些细节不是公众知识。

现在尝试

自己尝试qwen2.5-max的最简单方法是Qwen聊天 聊天机器人在网络浏览器中。您需要使用电子邮件地址或您的谷歌帐户。与DeepSeek聊天机器人不同,现在有超时签署QWEN帐户似乎没有问题。

目前,似乎没有官方的QWEN移动应用程序,尽管某些第三方移动应用程序确实可以访问其LLM。

报名参加突发新闻,评论,意见,顶级技术交易等等。

鉴于当前由中国人工智能DeepSeek所显示的审查水平,当被问及对中国政府敏感的对象时,当答案的答案是台湾一个国家时,我们感到非常惊讶吗?.5-max提供了比DeepSeek提供的更加平衡和细微的响应。Qwen2.5-Max但是拒绝回答这个问题。等等。如果您还有其他相关问题,请随时提出。”

你也可能喜欢

Graham是Techradar AI的高级编辑。Graham拥有在线和印刷新闻领域的25年以上的经验,曾在各种市场领先的技术品牌中工作,包括计算机,PC Pro,Imore,Masformat,MacFormat,Mac | Mac Life,最大PC等。他专门报告与AI有关的所有内容,并出现在BBC电视节目中,例如BBC One Breakfast和Radio 4上,评论了技术的最新趋势。格雷厄姆(Graham)拥有计算机科学的荣誉学位,并花费了业余时间的播客和博客。

关于《New DeepSeek AI竞争对手声称比V3和Chatgpt-4O更强大 - 与Qwen2.5-Max见面》的评论


暂无评论

发表评论

摘要

阿里巴巴发布了新的AI模型QWEN2.5-MAX,在各种基准测试中声称比DeepSeek-V3和Chatgpt-4O优越。与诸如DeepSeek-R1或Chatgpt-O1之类的推理模型不同,QWEN2.5-MAX并未显示其思维过程。QWEN团队断言,培训后技术的进步将进一步增强模型。基准测试表明QWEN2.5-MAX在多个评估中都优于竞争对手。用户可以通过QWEN聊天网络聊天机器人尝试QWEN2.5-MAX,而没有报告的注册问题。在对敏感主题的回应中,QWEN2.5-MAX与DeepSeek相比提供了更细微的答案,但避免讨论Tiananmen Square。