英语轻松读发新版了,欢迎下载、更新

遇见Flux 1.1 Pro:你无法运行的最佳AI图像生成器 - Decrypt

2024-10-07 19:00:55 英文原文

作者:Decrypt / Jose Antonio Lanz

黑森林实验室,Fluxfamily系列AI图像生成器的背后工作室,宣布上周发布了Flux 1.1 [Pro]。这距离其最初的模型系列发布仅两个月,该系列包括Flux 1 Pro(一个具有行业领先能力的闭源模型)、Flux 1 Dev(一个非商业、开源模型)和Flux Schnell(一个完全开源的模型)。

Flux模型标志着生成式人工智能技术的重大突破凭借其文本生成能力、提示适应性和整体图像质量。即使是较小的模型,Flux Dev 和 Flux Schnell,生成的结果也与MidJourney相当,并且远优于SD3的输出,后者是Stability备受期待的SDXL进化版本,结果却有些令人失望。令人失望的.

新模型已经留下了印记,在Elo评分中稳居榜首人工分析图像竞技场—一个领先的AI模型评估平台。它在市场上的表现优于其他所有文本到图像的模型,同时其速度几乎与最小规模的模型一样快。

下图显示了Y轴为Elo评分(图像质量),X轴为生成速度。MidJourney的爱好者可能会注意到他们的模型未在图表上显示,因为它的速度实在太慢以至于超出了图表范围。然而,其Elo评分为大约1100分,略低于Ideogram V2。

Elo scores for AI image generators. Image: Black Forest Labs
Elo评分用于AI图像生成器。图片:Black Forest Labs

新的Flux Pro在定价方面具有优势,Flux1.1 Pro每张图片的费用为0.04美元——低于市场上的许多其他模型,包括原来的Flux1 Pro。这种定价结构使其成为MidJourney和Ideogram等付费服务的强大竞争对手,这些服务的价格$96以及$84每个选项都需要一年时间。MidJourney和Ideogram选项也更慢,并且每令牌的成本更高。

遗憾的是,Flux1.1 Pro无法本地运行。与它的开源版本不同,例如FLUX1 [Dev]和FLUX1 [Schnell]模型,这个新的专业版是闭源模型,限制用户只能通过类似平台访问它。一起AI, 复制, Fal AI,和 Freepik它不能被微调或个性化。

对于考虑尝试该模型的人来说,一些平台提供了免费生成的少量信用额度,但一旦这些用尽,根据我们自己的标准,最好的服务是Freepik那是因为它的神秘工作流显著提升了生成图像的细节和美感。

终于来了!

🔥 Freepik 神秘 🔥

“任何足够先进的技术都与魔法无异。”——阿瑟·C·克拉克 ✨ Mystic 是迄今为止最先进的人工智能生成器,输出直接支持全高清。

但是什么才是神秘的呢?让我们深入探讨一下 🧵👇pic.twitter.com/nrlPTi0OWo

— 贾维·洛佩兹 ⛩️ (@javilopen)2024年8月27日

关于FLUX1 [Dev]或FLUX1 [Schnell]模型的开源1.1版本没有公告,但很明显Black Forest Labs正致力于开发出色的图像模型。和视频创作者。

实战测试与评审

我们试用了新的Flux模型,结果令人满意。这并不是一个代际飞跃——像从Flux到SDXL那样的变化——但它无疑是一个受欢迎的升级。

它整体上非常真实,具有出色的文本生成能力,在艺术任务和风格方面也非常富有创造力。这是一款优质的多功能模型,能够提供高质量且快速的生成结果。

现实主义

带有VSCO滤镜的宝丽来照片,1990年,女性,夜晚,使用闪光灯拍摄,金发,年轻的脸庞,美丽的阴影,热带植物,位于一间公寓内,用单反相机和相机闪光灯拍摄,她手持一本笔记本,上面写着手写的标语“ Decrypt 2024年10月7日验证”。她的另一只手做出和平手势。

Test images generated with Flux 1.1 Pro
使用Flux 1.1 Pro生成的测试图像

该模型擅长生成逼真的图像,改善了初始Flux模型的过度修饰效果。虽然并非完美无缺,但在适当的提示下,结果非常令人信服。乍一看,这些图像(均由Flux 1.1 Pro生成)在不挑剔细节的情况下可以以假乱真。

字体与提示一致,手绘效果有所提升,但还不够完美。需要注意的是,这些不是精选的样本,而是最初的两代作品。在使用生成式AI时,最佳结果通常是在经过几代的迭代和编辑之后出现的。

灯光与相机闪光灯一致,聚焦于主体而不照亮整个房间。VSCO滤镜增强了真实感,且符合提示的效果非常好。

将Flux 1.1与Flux 1进行比较,从直观上看它们在现实感方面非常相似。然而,在使用相同的提示时,新模型生成的姿态更加自然,身体的一致性也更强。例如,Flux 1 生成了一个可能看起来像是多出了一条腿的结果,而Flux 1.1 则避免了这种情况。这种改进更多地与准确性有关,而不是整体的现实美感。

Test images generated with Flux 1.1 Pro and Flux 1 Pro
使用Flux 1.1 Pro和Flux 1 Pro生成的测试图像

提示遵守

“一只戴着太阳镜和帽子、穿着紫色夏威夷风格服装的白色猫在弹钢琴,全身照拍摄于灰色工作室背景前,配有灯光元素以及一只从天花板悬挂的翼手龙,商业视频截图。墙上写着‘Emerge by Decrypt’”

Test images generated with Flux 1.1 Pro and Flux 1 Pro
使用Flux 1.1 Pro和Flux 1 Pro生成的测试图像

Flux 1.1 在遵循提示方面比 Flux 1 Pro 更进一步,成功地在场景中加入更多元素而不偏离主题。我们为 Flux 1 的第一个提示没有包括照明元素或pterodactyl。此外,新一代更逼真,感觉更自然。

空间感知能力

一只站在电视上的狗,电视屏幕上显示着“解密”二字。左边是一位身穿职业装的女性手持一枚硬币,右边是一个机器人站在一个急救箱上。整个场景十分超现实。

在空间感知方面,Flux 1.1 和 Flux 1 相当。两者都能正常生成所有元素。然而,在考虑更多细节时,Flux 1.1 Pro 更加出色。例如,提示溢出的情况较少(即模型从提示中提取的元素被用到其他区域)。在 Flux 1.1 的生成结果中,女性手中只有一枚硬币且没有额外可见的硬币,而 Flux 1 在狗旁边生成了一堆硬币。此外,Flux 1 Pro 中出现的多余的手部问题在新版本模型中不存在,并且 Flux 1.1 的生成结果更好地表现了超现实风格。

结论

Flux 1.1 Pro 在生成方面整体上更加一致和逻辑。如果你无法运行本地模型,它是一个非常不错的竞争对手。它可以理解自然语言,适合初学者使用,尽管这不是它的主要优势。MidJourney 则倾向于在增强较差的提示词时更具创意。

然而,Flux 1.1 Pro在价格、速度和整体质量上都优于任何当前型号,对于那些寻求良好指令遵从性、质量和文本生成能力的人来说,它可能是最佳选择。

对于愿意付费的用户,目前的所有选项都能满足需求。我们喜欢Fal.AI提供的服务,因为它比其他平台提供了更多的控制权。然而,对于那些希望获得更专业体验的用户来说,Freepik似乎是最佳选择。虽然价格稍高一些,但它的功能更加灵活多样,不仅提供图像生成服务,还提供诸如图像放大、扩展背景去除器以及草图转图像等功能,并且拥有一个用于实验的内容库。

通用智能通讯newsletter

由生成式AI模型Gen讲述的一周人工智能之旅。

关于《遇见Flux 1.1 Pro:你无法运行的最佳AI图像生成器 - Decrypt》的评论


暂无评论

发表评论

摘要

黑森林实验室,背后开发了Flux家族AI图像生成器的工作室,在上周宣布发布了Flux 1.1 [Pro]。即使是较小的模型Flux Dev和Flux Schnell,生成的结果也与MidJourney的相当,并且远超SD3(Stability对SDXL期待已久的进化版本)的表现,后者实际上有些令人失望。VSCO滤镜增强了现实感,提示响应非常优秀。使用Flux 1.1 Pro和Flux 1 Pro生成的测试图像符合要求:提示内容为“一只戴着太阳镜、帽子并穿着紫色夏威夷风格服饰的白猫在弹钢琴,全身影像背景是灰色的工作室环境,并带有照明元素以及天花板上悬挂的翼手龙。对于愿意为此付费的人来说,当前所有的选项都可以满足需求。