援引有关DeepSeek的官方微信集团的帖子,彭博报告DeepSeek v3.1已准备好进行测试。
新版本具有128,000个令牌的更长上下文窗口或提示的空间。这大约是96,000个单词,大约是两本200页的英语小说。
DeepSeek的V3模型引起搅动一月份,这家初创公司声称使用约2,000个较慢的Nvidia芯片培训培训仅花费560万美元。
这远低于从Openai,Google,Anthropic等人培训Frontier模型所需的数百万美元。这一消息在一天之内从NVIDIA抹去了6000亿美元的市场价值。但政府很快禁止出于关注,DeepSeek聊天机器人的使用将保存在中国服务器上。
虽然初创公司没有在微信上分享更多邮政在雷迪特(Reddit)上说,聊天机器人的最新版本非常详细,并且还观察到“思考”按钮中的R1消失了,表明v3.1可能是一个混合的推理模型。
R1是DeepSeek也开发的推理模型。这是提出通过三个主要的美国大型大型AWS,Microsoft Azure和Google Cloud。云提供商表示,该模型是在当地托管的,因此数据不会发送到中国。
据彭博社称,开发人员仍在等待R2,这是R1的下一个模型版本。
另请阅读: 还记得DeepSeek吗?尽管担心安全,许多人采用了AI模型
在全球AI种族中,只有中国才能竞争彭博社报道,有效地在美国有效。阿里巴巴,DeepSeek和Moonshot等中国公司已经开发了AI模型,这些模型具有能力,可以接近美国最好的公司。
尽管美国在很大程度上关闭了专有的AI模型,但中国推动了通常可以免费下载和使用的开源模型。据彭博社称,中国正在牺牲短期利润,以确保全球采用中国人工智能。中国于2020年发行的第14五年蓝图发展了开源方法。一些中国人工智能创业经理还认为,进入新市场并与美国型号竞争的最快方法是提供开放的AI模型。
阅读更多: DeepSeek升级AI推理模型竞争Openai和Google
对于所有PYMNTS AI覆盖范围,请订阅每日一个 AIâ新闻通讯。