作者:Kyle Wiggers
病毒AI公司DeepSeek已发布了一套新的多模式AI模型,声称它们可以超越Openai的表现dall-e 3。
这些模型是可下载从AI Dev平台拥抱面孔中,DeepSeek称Janus-Pro的新模型家族的一部分。它们的规模从10亿到70亿参数不等。参数大致对应于模型解决问题的技能,并且具有更多参数的模型通常比具有较少参数的模型更好。
Janus-Pro符合MIT许可,这意味着可以在商业上使用它而无需限制。
DeepSeek描述为一种新型自回归框架的Janus-Pro既可以分析又可以创建新图像。根据该公司的说法,最大的Janus-Pro模型Janus-Pro-7b在两个AI评估基准中,Geneval和DPG Bench击败了DALL-E 3,以及PIXART-ALPHA,EMU3-GEN和等型号稳定性AI稳定的扩散XL。
当然,其中一些模型在较旧的一侧,大多数Janus-Pro模型只能分析小图像,分辨率高达384 x 384。但是,考虑到这些模型,Janus-Pro的性能令人印象深刻尺寸。
Janus-Pro超过了以前的统一模型,并超过了特定于任务模型的性能,DeepSeek在一个关于拥抱脸的帖子中写的。Janus-Pro的简单性,高灵活性和有效性使其成为下一代统一多模型的有力候选者。
DeepSeek是一家中国人工智能实验室,主要由定量交易公司高飞行资本管理资助,此后一周闯入主流意识它的聊天机器人应用程序升至Apple App Store图表的顶部。DeepSeek的语言模型是使用计算效率技术训练的,领导了许多华尔街分析师和技术人员质疑美国是否可以在AI种族中保持领先地位,以及对AI芯片的需求是否可以维持。
更新:此故事的早期版本暗示Janus-Pro模型只能输出小(384 x 384)图像。那是不真实的。我们后悔错误。
TechCrunch有一个以AI为重点的新闻通讯!在这里注册每个星期三将其放入收件箱中。
凯尔·威格斯(Kyle Wiggers)是TechCrunch的高级记者,对人工智能特别感兴趣。他的写作出现在VentureBeat和数字趋势中,以及一系列小工具博客,包括Android警察,Android Authority,Droid-Life和XDA-Developers。他与他的伴侣,钢琴教育家一起住在布鲁克林,并在钢琴中牵涉。偶尔 - 如果大部分未成功。
订阅该行业最大的技术新闻