AI图像生成器大比拼:我测试了ChatGPT与Gemini及Meta AI以选出胜者

2024-10-16 19:29:24 英文原文

作者:Amanda CaswellSocial Links NavigationAI Writer

logos of Meta AI, ChatGPT, Gemini
(图片版权:Future)

竞争之间谷歌Gemini的Imagen, 开放人工智能基金会's 的ChatGPT,和元AI非常激烈。经过单独测试之后,我决定进行直接对比,以真正看出哪个才是最好的最好的AI图像生成器现在。

随着AI生成的图像成为创意工作的重要组成部分,每个平台都有其优势。我通过使用一系列现实和简化的提示来测试AI模型,以评估不同的AI模型处理各种主题的能力。我的目标是确定哪个AI在五个基本类别中能产生最令人印象深刻的结果。

以下是根据生成图像的质量,每个平台的表现情况以及最终胜出的平台。

创建提示词

为了确保比较的公平性,我设计了多样化的提示词来测试每个AI生成详细且美观图像的能力。每个提示都用来测试AI在理解纹理、颜色和构图的同时保持创意水平的能力。类别包括:食物、家居装饰、动物、车辆和风景,使我能够全面探索它们的能力范围。

工作流

我使用了每个平台在默认设置下的图像生成功能。_while_谷歌双子星(Gemini)和开放人工智能(OpenAI)提供高级服务,我在这个比较中使用了它们的免费层级。谷歌双子星的Imagen集成在谷歌的平台内,元数据AI通过生成图像来提供服务 Instagram, Facebook以及 WhatsAppOpenAI的ChatGPT配备了DALL-E图像生成功能,在其单一平台上快速提供结果。

在各个平台生成图像后,我根据清晰度、创意以及AI捕捉提示意图的程度来评估每张图片。

食物

AI images of burgers

(图片版权:Future)

提示:制作一份黑松露薯条搭配的豪华汉堡包

谷歌Gemini这张图片视觉效果惊人,汉堡的摆盘夸张而层次分明。每一个元素(面包、肉饼、配料)都清晰可见,细节丰富,使得整个汉堡看起来略显顶部沉重且不均衡,这种感觉常常是点一份满载配料的汉堡时的真实写照。薯条呈现出完美的金黄色,而且黑松露调味的独特视觉效果也很吸引人。

元AI这张图片中的汉堡非常逼真,肉饼厚实,色彩对比强烈,融化的奶酪令人垂涎。黑松露调味的细节极其精致,薯条的真实感甚至比双子座(此处可能指之前的某个作品或参照物)的输出更加出色。

ChatGPT:这个显然为了赢得胜利不惜加入一份额外的薯条,但整体形象更加艺术化,几乎具有绘画般的质感。相比之下,这份黑松露薯条虽然细节丰富,却不及谷歌和Meta版本那么写实。

获胜者: 元数据
这是一次在Google Gemini和Meta AI之间极其艰难的选择。两者都擅长生成令人垂涎的美食级汉堡,让我午餐时食欲大增。但最终我会选择Meta AI作为赢家,因为它的牛肉饼非常多汁。它的真实感让人垂涎欲滴,额外的奶酪更是加分项。Gemini和Meta AI接近照片般的效果都很令人印象深刻。OpenAI的图像具有创意风格,但汉堡看起来不太真实,甚至有些滑稽。

家居装饰

AI images of living rooms in front of the ocean

(图片版权:Future)

提示:创建一个简约风格的客厅图像,该客厅有一扇大窗户,可以俯瞰海洋。

谷歌Gemini图像设计简洁,线条干净但照明较暗。海景逼真得令人惊叹,但似乎客厅漂浮在水中,以夸张的视角展现了海洋景色。这个客厅是在船上吗?

元AI这张图片捕捉到了极简主义的美学,但缺少了一些能够提升场景真实感的纹理和光线细节。虽然水景很接近,但它看起来是独立存在的,并不直接位于客厅旁边。

ChatGPT这张图片更接近我所期望的效果——客厅和海洋之间有明显的区分,色彩鲜明,形状有趣,天空也很吸引人。虽然海洋部分细节较少,但墙面艺术与独特的咖啡桌增添了不少亮点。

获胜者:元数据Meta AI和ChatGPT在这次任务中表现都很出色,但我最终还是选择Meta AI为胜者,因为它最好地捕捉了提示的精髓,包括一个看起来欢迎外界景色的客厅,而与之相比,ChatGPT生成的一排背对景观的座椅就没有那么吸引人。Meta AI在现实感方面的关注让它在这个类别中占据优势,尽管OpenAI的创意方法提供了一个更加独特的视角。

3. 动物

AI images of parrots

(图片版权:Future)

提示:创建一只彩色鹦鹉栖息在树树枝上的图像。

谷歌Gemini图像这只鹦鹉非常细腻,羽毛鲜艳,纹理逼真。树枝上的细节增添了一丝自然氛围,尽管背景相对简单。然而提示中提到的是“多彩的”,而虽然这只鸟是漂亮的绿色,我期待看到更多色彩和活力。

元AI这只鹦鹉的色彩更符合我的预期。从整体构图到喙和爪子都十分精致迷人,场景中的叶子也增添了整体美感。

ChatGPT:这只鹦鹉色彩丰富且具有艺术感,但缺乏羽毛质感的精细细节,无法使其看起来栩栩如生。它更偏向于一种超现实风格,注重亮丽的颜色而非复杂的细节。背景的添加虽然不错,但就像额外的一份薯条一样,并未被要求。

获胜者:元数据 Gemini生成了一只非常逼真的栖息在树枝上的鸟,而ChatGPT则创造了一只似乎具有童话质感的鸟,这吸引了我这个喜爱迪士尼的一侧。但在这一轮中,我还是选择了Meta AI,因为它在现实主义和色彩鲜艳度之间取得了平衡,符合我根据提示所期待的效果。

4. 车辆

AI images of futuristic electric cars

(图片版权:Future)

提示:在日落时分的城市街道上创作一辆未来感十足的电动汽车的图像

谷歌Gemini图像这辆车看起来流线型且现代,表面清晰而反射性强。日落为场景增添了一抹温暖,城市的天际线则在柔和的灯光效果下显得细节丰富。场景中的电动汽车充电器是一个很好的细节,强调了汽车的电动特性。

元AI车辆设计大胆且极具未来感。明亮的颜色使这幅图像在光线和阴影的细腻处理下格外引人注目,特别是夕阳时分。街道细节增添了氛围。

ChatGPT汽车设计非常前卫,但近乎过于夸张;日落和城市景观的描绘不够清晰。光滑的道路几乎太过完美,使得整个画面更偏向概念化而非照片真实感。

获胜者:元数据有趣的是,所有的AI模型都生成了一辆外观非常相似的电动汽车和未来场景。到目前为止,这些图像在遵循提示方面最为类似。Meta AI显然是赢家,因为它完美地结合了未来设计和环境细节,而ChatGPT则提供了一个更具概念性但不太现实的版本。Gemini紧随其后,提供了大量的细节和现实感。

5. 景观

AI images of a cabin in the mountains

(图片版权:Future)

提示:创建一幅宁静的山间小屋的画面,小屋周围环绕着松树,雾气缭绕。

谷歌Gemini:松树和山被描绘得非常细致,但小屋看起来乏味且不宜居住,更像是一座被遗弃的建筑而非宁静的居所。这幅画面逼真而具有画意,但却缺少了我希望在图像中呈现的那种氛围。

元AI雾气和树木描绘得很逼真,虽然小屋因为屋顶上过多的常春藤和绿植显得有些卡通化。背景才是这张图片真正出彩的地方。

ChatGPT图像如梦似幻,雾气被夸张处理以营造出梦幻效果。场景柔和而富有画意,仿佛是一幅幻想插图。

获胜者:ChatGPT:我不得不反复确认我没有把Meta AI和ChatGPT的图片弄混。我习惯了ChatGPT生成带有更多艺术气息的图片,但这次是Meta AI过于创意性的解读没有达到预期。谷歌再次在现实感方面表现出色,但在所有参赛作品中,最终胜出的是ChatGPT,因为它生成了一张完美符合要求的图片。

测试了这五个提示后,很明显谷歌Gemini的Imagen和Meta AI是生成逼真图片的最佳选择,这些图片能紧密地反映出现实世界的细节。Meta AI提供了出色的表现,可以生成具有惊人细节和连贯性的图像,但往往更加风格化,并且在细微之处可能缺乏Gemini那样的精致。另一方面,ChatGPT则擅长创意,在处理提示时往往会提供更具艺术感或超现实的解释。

总体而言,Meta AI 明显胜出,提供了良好的折中方案,并且在现实感和更细致地关注提示细节方面优于其他聊天机器人。

更多来自Tom's Guide的内容

在Tom’s Guide,我们的专业编辑致力于为您提供最新资讯、评测和指南,帮助您了解最新信息并保持领先!

关于《AI图像生成器大比拼:我测试了ChatGPT与Gemini及Meta AI以选出胜者》
暂无评论

摘要

(图片署名:Future) 谷歌Gemini的Imagen、OpenAI的ChatGPT和Meta AI之间的竞争非常激烈。每个元素(面包、肉饼、配料)都清晰地呈现出来,但整个汉堡显得有些头重脚轻,细节不均匀,这让人感觉像是订购了一份充满各种配料的汉堡时的真实情况。ChatGPT:这个显然为了获胜额外加了一份薯条,但从整体来看,其画面更具艺术感,几乎像是一幅绘画作品。这是船上的客厅吗?Meta AI:捕捉到了极简主义美学,但在纹理和光线细节上有所欠缺,这些细节能够提升场景的现实感。在测试了这五个提示后,很明显谷歌Gemini的Imagen和Meta AI都是生成逼真图像的最佳选择,这些图像与现实世界的细节高度相似。