英语轻松读发新版了,欢迎下载、更新

病毒AI公司DeepSeek发布了新的图像模型系列|TechCrunch

2025-01-27 17:39:39 英文原文

作者:Kyle Wiggers

病毒AI公司DeepSeek已发布了一套新的多模式AI模型,声称它们可以超越Openai的表现dall-e 3

这些模型是可下载从AI Dev平台拥抱面孔中,DeepSeek称Janus-Pro的新模型家族的一部分。它们的规模从10亿到70亿参数不等。参数大致对应于模型解决问题的技能,并且具有更多参数的模型通常比具有较少参数的模型更好。

Janus-Pro符合MIT许可,这意味着可以在商业上使用它而无需限制。

DeepSeek image
来自DeepSeek的Janus Pro模型的图像输出。图片来源:DeepSeek

DeepSeek描述为一种新型自回归框架的Janus-Pro既可以分析又可以创建新图像。根据该公司的说法,最大的Janus-Pro模型Janus-Pro-7b在两个AI评估基准中,Geneval和DPG Bench击败了DALL-E 3,以及PIXART-ALPHA,EMU3-GEN和等型号稳定性AI稳定的扩散XL。

当然,其中一些模型在较旧的一侧,大多数Janus-Pro模型只能分析小图像,分辨率高达384 x 384。但是,考虑到这些模型,Janus-Pro的性能令人印象深刻尺寸。

Janus-Pro超过了以前的统一模型,并超过了特定于任务模型的性能,DeepSeek在一个关于拥抱脸的帖子中写的。Janus-Pro的简单性,高灵活性和有效性使其成为下一代统一多模型的有力候选者。

DeepSeek image
DeepSeek的新Janus Pro模型与竞争对手相比。图片来源:DeepSeek

DeepSeek是一家中国人工智能实验室,主要由定量交易公司高飞行资本管理资助,此后一周闯入主流意识它的聊天机器人应用程序升至Apple App Store图表的顶部。DeepSeek的语言模型是使用计算效率技术训练的,领导了许多华尔街分析师和技术人员质疑美国是否可以在AI种族中保持领先地位,以及对AI芯片的需求是否可以维持。

更新:此故事的早期版本暗示Janus-Pro模型只能输出小(384 x 384)图像。那是不真实的。我们后悔错误。


TechCrunch有一个以AI为重点的新闻通讯!在这里注册每个星期三将其放入收件箱中。


凯尔·威格斯(Kyle Wiggers)是TechCrunch的高级记者,对人工智能特别感兴趣。他的写作出现在VentureBeat和数字趋势中,以及一系列小工具博客,包括Android警察,Android Authority,Droid-Life和XDA-Developers。他与他的伴侣,钢琴教育家一起住在布鲁克林,并在钢琴中牵涉。偶尔 - 如果大部分未成功。

订阅该行业最大的技术新闻

有关的

关于《病毒AI公司DeepSeek发布了新的图像模型系列|TechCrunch》的评论


暂无评论

发表评论

摘要

DeepSeek发布了Janus-Pro,这是一个新的多模式AI模型的新家族,可在MIT许可下拥抱面孔。在某些基准等基准(如Geneval和DPG基座)中,这些模型从10亿到70亿参数,均优于dall-e 3。尽管图像分辨率分析有一些限制,但Janus-Pro的性能在分析和创建图像时的尺寸效率和多功能性都闻名。DeepSeek声称最大的模型Janus-Pro-7b匹配或超过特定于任务的模型,同时提供了高灵活性和有效性。