英语轻松读发新版了,欢迎下载、更新

Apple通过图像生成技术与Dall-E和Midjourney的图像生成技术提前发展

2025-06-09 18:50:06 英文原文

作者:Michael Nuñez

Credit: VentureBeat made with Midjourney

信用:Midjourney制造的VentureBeat

加入企业领导人信任的活动近二十年。VB变换汇集了建立真正的企业AI战略的人们。 了解更多


苹果s机器学习研究团队已经开发了一个突破性的AI系统,用于产生高分辨率图像,以挑战扩散模型的主导地位,该技术为流行图像生成器提供动力,例如dall-eMidjourney

上周发表的一份研究论文中详细介绍了进步,介绍了StarflowApple研究人员与学术合作伙伴合作开发的系统,将正常的流与自回归的变压器结合在一起,以实现团队所谓的“竞争性能”与最新的扩散模型。

突破是苹果面临的关键时刻越来越多的批评在与人工智能的斗争中。在星期一全球开发人员会议,该公司仅公布适度的AI更新到它苹果智能平台,强调了一家公司面临的竞争压力,许多人认为在AI军备竞赛中落后。

``据我们所知,这项工作是在这种规模和解决方案中有效运作的首次成功演示,其中包括Apple Machine Learning研究人员Jiatao Gu,Joshua M. Susskind和Shuangfei Zhai,其中包括苹果机器学习研究人员以及包括学术合作者,包括学术合作者加州大学伯克利分校佐治亚理工学院

苹果如何在AI战争中与Openai和Google进行反击

Starflow研究代表了苹果为开发独特的AI功能的更广泛的努力,可以将其产品与竞争对手区分开。而公司喜欢谷歌Openai苹果公司一直以其生成的AI发展为主导,苹果一直在研究可以提供独特优势的替代方法。

研究团队解决了AI图像生成中的基本挑战:将标准化的流量扩展到有效地与高分辨率图像一起工作。正常化的流量是一种生成模型,该模型学会将简单的分布转变为复杂的分布,传统上被图像合成应用中的扩散模型和生成的对抗网络所掩盖。

研究人员写道,Starflow在课堂条件和文本条件形成图像生成任务中都达到了竞争性能,在样本质量中接近最新的扩散模型。

在为苹果新的AI系统提供动力的数学突破内

苹果研究团队引入了几项关键创新,以克服现有的归一化流程方法的局限性。该系统采用了研究人员所谓的“深度安装”设计,使用深层变压器块(该块)捕获了大多数模型的代表能力,并得到了一些浅层变压器块,这些浅层变压器块是计算上有效但具有实质上有益的。

根据论文,这一突破还涉及在经过预处理的自动编码器的潜在空间中运行,这比直接像素级建模更有效。这种方法使该模型可以与图像的压缩表示形式合作,而不是原始像素数据,从而显着提高了效率。

与依赖迭代降解过程的扩散模型不同,Starflow维持标准化流的数学特性,从而在不离散的情况下实现在连续空间中的确切最大似然训练。

Starflow对Apple的未来iPhone和Mac产品意味着什么

随着苹果面临越来越多的压力以证明人工智能进展有意义的进展,这项研究的到来。最近彭博分析强调了Apple Intelligence和Siri如何与竞争对手竞争。苹果本周在WWDC举行的谦虚公告强调了该公司在AI领域的挑战。

对于Apple,Starflow的确切可能性培训可能会在需要对生成内容的精确控制的应用中或在理解模型不确定性的情况下提供优势,对于苹果强调的企业应用程序和对企业的AI功能可能有价值。

研究表明,扩散模型的替代方法可以取得可比的结果,这可能为创新开辟了新的途径,这可能会在硬件软件集成和设备处理中发挥苹果的优势。

苹果为何押注大学合作伙伴关系以解决其AI问题

该研究举例说明了苹果与领先的学术机构合作以提高其AI能力的战略。合着者天陈陈是佐治亚理工学院的一名博士生,他与苹果的机器学习研究团队实习,为随机最佳控制和生成建模带来了专业知识。

合作还包括Ruixiang Zhang来自U.C.伯克利的数学系和劳伦特·丁(Laurent DinhGoogle大脑深态

研究人员强调,至关重要的是,我们的模型仍然是端到端的归一流流量,将其方法与牺牲数学障碍的混合方法区分开来,以提高了性能。

完整的研究论文可用arxiv,为希望在生成AI的竞争领域中建立这项工作的研究人员和工程师提供技术细节。尽管Starflow代表了一项重大的技术成就,但真正的测试将是Apple是否可以将这种研究突破转化为面向消费者的AI功能,这些功能使Chatgpt家喻户晓。对于一家曾经用iPhone等产品彻底改变整个行业的公司而言,问题是苹果是否可以在AI中进行创新,这是否可以足够快地做到这一点。

每日有关VB每日业务用例的见解

如果您想给老板留下深刻的印象,VB Daily可以为您提供服务。我们为您提供有关公司在制定AI的工作,从监管转变到实际部署的公司,因此您可以分享最大投资回报率的见解。

阅读我们的隐私政策

感谢您的订阅。查看更多VB时事通讯在这里

发生错误。

关于《Apple通过图像生成技术与Dall-E和Midjourney的图像生成技术提前发展》的评论


暂无评论

发表评论

摘要

苹果的机器学习研究团队开发了一种名为Starflow的新AI系统,该系统产生了高分辨率的图像,并挑战了Dall-E和Midjourney等扩散模型的当前优势。该系统将正常流与自回归变压器结合在一起,以在图像生成任务中实现竞争性能。这一突破是苹果开发独特的AI功能并证明人工智能进展的策略的一部分,发表在最近的研究论文中。Starflow在大规模上有效运行,具有与现有模型相比的精确和效率优势,对企业应用程序和设备AI功能有益。