英语轻松读发新版了,欢迎下载、更新

困惑AI开源R1 1776从DeepSeek-R1中删除审查制度

2025-02-19 07:12:26 英文原文

作者:Siddharth Jindal

AI已经开源R1 1776,一个版本DeepSeek-R1在培训后进行培训以消除审查制度并提供事实响应的语言模型。虽然型号的权重拥抱脸,该模型可以通过Sonar API访问。

我们也正在考虑开放式培训和推理代码。尚未决定,但是社区和开源是我们打算做更多的事情,因为我们的价值将是提供一位出色的助手并为用户个性化,而不是在模型本身中,“困惑AI”首席Aravind Srinivas。一个 

DeepSeek-R1是一种开放量的大语言模型(LLM),其推理功能与O1和O3-Mini等领先模型类似。 

但是,它的原始版本因拒绝参与某些敏感的话题而闻名,特别是由中国共产党(CCP)审查的话题。困惑的训练后工作着重于缓解这个问题。

一个以困惑性强调的例子涉及有关台湾独立性及其对Nvidia股票的潜在影响的疑问。DeepSeek-R1最初以CCP对准的语句做出响应,避免了任何直接分析。相比之下,R1 1776现在提供了详细的回应,概述了可能影响NVIDIA股价的地缘政治和经济风险。它讨论了潜在的供应链中断,市场波动,地缘政治报复,军事冲突风险和监管转变。

困惑的训练后过程包括收集一个针对审查主题的40,000个多语言提示的数据集。 

AI在博客文章中说,我们雇用了人类专家来确定大约300个审查的主题。开发了一个多语言审查分类器来过滤查询,以确保响应既是事实又相关。该团队使用NVIDIA的NEMO 2.0框架来完善模型,同时保持其推理能力。

为了评估R1 1776的有效性,在1,000多个示例的数据集上对其进行了困惑,涵盖了广泛的敏感主题。该公司聘请了人类注释者和LLM法官来评估该模型是否会逃避答复或提供过度消毒的答案。” 

``我们的评估表明,该模型在推理和数学基准中与基本R1模型的表现保持完全未经审查,'报道说。

最近的困惑AI宣布它的内部型号Sonar将用于平台上的所有Pro用户。具有困惑Pro计划的用户可以通过设置使Sonar成为默认模型。

该公司也是如此发射 深入研究,一种自主进行深入研究和分析的工具。该功能执行了多次搜索,审查数百个来源,并将发现汇编为综合报告。每个人都是免费的,非订阅者每天最多五个查询,每天为Pro用户提供500个查询。

关于《困惑AI开源R1 1776从DeepSeek-R1中删除审查制度》的评论


暂无评论

发表评论

摘要

Gelplexity AI已发布R1 1776,这是训练后的DeepSeek-R1语言模型的后版本,旨在提供以前避免使用中国审查标准避免的敏感主题的未经审查的事实响应。该模型可通过Sonar API获得,并通过使用40,000个多语言提示的数据集进行培训,包括对受试者进行审查的受试者的增强功能,以确保其分析中的分析保持毫无偏见。困惑的评估表明,R1 1776保持DeepSeek-R1的推理能力,同时避免了审查制度,在基准测试中与基本模型相当地执行。此外,Cllexity AI宣布了开放式培训和推理代码的计划,并将Sonar作为Pro用户的默认模型选项以及自动化研究工具的深入研究。困惑