困惑AI开源R1 1776从DeepSeek-R1中删除审查制度

作者：Siddharth Jindal

AI已经开源R1 1776，一个版本DeepSeek-R1在培训后进行培训以消除审查制度并提供事实响应的语言模型。虽然型号的权重拥抱脸，该模型可以通过Sonar API访问。

我们也正在考虑开放式培训和推理代码。尚未决定，但是社区和开源是我们打算做更多的事情，因为我们的价值将是提供一位出色的助手并为用户个性化，而不是在模型本身中，“困惑AI”首席Aravind Srinivas说。一个

DeepSeek-R1是一种开放量的大语言模型（LLM），其推理功能与O1和O3-Mini等领先模型类似。

但是，它的原始版本因拒绝参与某些敏感的话题而闻名，特别是由中国共产党（CCP）审查的话题。困惑的训练后工作着重于缓解这个问题。

一个以困惑性强调的例子涉及有关台湾独立性及其对Nvidia股票的潜在影响的疑问。DeepSeek-R1最初以CCP对准的语句做出响应，避免了任何直接分析。相比之下，R1 1776现在提供了详细的回应，概述了可能影响NVIDIA股价的地缘政治和经济风险。它讨论了潜在的供应链中断，市场波动，地缘政治报复，军事冲突风险和监管转变。

困惑的训练后过程包括收集一个针对审查主题的40,000个多语言提示的数据集。

AI在博客文章中说，我们雇用了人类专家来确定大约300个审查的主题。开发了一个多语言审查分类器来过滤查询，以确保响应既是事实又相关。该团队使用NVIDIA的NEMO 2.0框架来完善模型，同时保持其推理能力。

为了评估R1 1776的有效性，在1,000多个示例的数据集上对其进行了困惑，涵盖了广泛的敏感主题。该公司聘请了人类注释者和LLM法官来评估该模型是否会逃避答复或提供过度消毒的答案。”

``我们的评估表明，该模型在推理和数学基准中与基本R1模型的表现保持完全未经审查，'报道说。

最近的困惑AI宣布它的内部型号Sonar将用于平台上的所有Pro用户。具有困惑Pro计划的用户可以通过设置使Sonar成为默认模型。

该公司也是如此发射深入研究，一种自主进行深入研究和分析的工具。该功能执行了多次搜索，审查数百个来源，并将发现汇编为综合报告。每个人都是免费的，非订阅者每天最多五个查询，每天为Pro用户提供500个查询。

OC

困惑AI开源R1 1776从DeepSeek-R1中删除审查制度

关于《困惑AI开源R1 1776从DeepSeek-R1中删除审查制度》的评论

发表评论

摘要

相关新闻

相关讨论