作者:Siddharth Jindal
AI已经开源R1 1776,一个版本DeepSeek-R1在培训后进行培训以消除审查制度并提供事实响应的语言模型。虽然型号的权重拥抱脸,该模型可以通过Sonar API访问。
我们也正在考虑开放式培训和推理代码。尚未决定,但是社区和开源是我们打算做更多的事情,因为我们的价值将是提供一位出色的助手并为用户个性化,而不是在模型本身中,“困惑AI”首席Aravind Srinivas说。一个
DeepSeek-R1是一种开放量的大语言模型(LLM),其推理功能与O1和O3-Mini等领先模型类似。
但是,它的原始版本因拒绝参与某些敏感的话题而闻名,特别是由中国共产党(CCP)审查的话题。困惑的训练后工作着重于缓解这个问题。
一个以困惑性强调的例子涉及有关台湾独立性及其对Nvidia股票的潜在影响的疑问。DeepSeek-R1最初以CCP对准的语句做出响应,避免了任何直接分析。相比之下,R1 1776现在提供了详细的回应,概述了可能影响NVIDIA股价的地缘政治和经济风险。它讨论了潜在的供应链中断,市场波动,地缘政治报复,军事冲突风险和监管转变。
困惑的训练后过程包括收集一个针对审查主题的40,000个多语言提示的数据集。
AI在博客文章中说,我们雇用了人类专家来确定大约300个审查的主题。开发了一个多语言审查分类器来过滤查询,以确保响应既是事实又相关。该团队使用NVIDIA的NEMO 2.0框架来完善模型,同时保持其推理能力。
为了评估R1 1776的有效性,在1,000多个示例的数据集上对其进行了困惑,涵盖了广泛的敏感主题。该公司聘请了人类注释者和LLM法官来评估该模型是否会逃避答复或提供过度消毒的答案。”
``我们的评估表明,该模型在推理和数学基准中与基本R1模型的表现保持完全未经审查,'报道说。
最近的困惑AI宣布它的内部型号Sonar将用于平台上的所有Pro用户。具有困惑Pro计划的用户可以通过设置使Sonar成为默认模型。
该公司也是如此发射 深入研究,一种自主进行深入研究和分析的工具。该功能执行了多次搜索,审查数百个来源,并将发现汇编为综合报告。每个人都是免费的,非订阅者每天最多五个查询,每天为Pro用户提供500个查询。