英语轻松读发新版了,欢迎下载、更新

我刚刚测试了ChatGPT、Gemini和Meta AI,生成了15张图片——结果出乎我的意料。

2024-10-16 10:47:58 英文原文

作者:Amanda CaswellSocial Links NavigationAI Writer

Logos of Meta AI, Gemini, and ChatGPT
(图片版权:Future)

随着人工智能生成的图像成为创意工作的重要组成部分,各平台之间的竞争日益激烈,谷歌Gemini的Imagen, 开放人工智能基金会ChatGPT,和元AI非常激烈。在分别试验了它们之后,我决定进行对比测试,以真正看出哪一个才是最好的。最佳AI图像生成器现在。

每个平台都有其优势,所以我使用了一组既现实又简单的提示语来测试它们,以评估不同的AI模型如何处理各种主题。我的目标是确定哪个AI在五个基本类别中能够产生最令人印象深刻的结果。

以下是根据生成图像的质量,每个平台的表现情况以及最终胜出的平台。

创建提示词

为了确保比较的公平性,我设计了多样化的提示词来测试每个AI生成详细且美观图像的能力。每个提示都用于测试AI在解释纹理、颜色和构图的同时保持创意水平的能力。类别包括:食物、家居装饰、动物、车辆和风景,这让我能够全面探索它们的能力范围。

工作流

我使用了每个平台在默认设置下的图像生成功能。_while_谷歌双子星(Gemini)和OpenAI提供付费服务,但我为了这次比较只使用了它们的免费层级。Google的Gemini的Imagen集成在谷歌的平台上并且元数据AI通过交付图像Instagram, Facebook WhatsAppOpenAI的ChatGPT配备了DALL-E图像生成功能,在其单一平台上快速提供结果。

在各个平台上生成图像后,我根据清晰度、创意以及AI捕捉提示背后意图的程度来评估每张图片。

食物

AI images of burgers

(图片版权:Future)

提示:制作一款松露薯条配高档汉堡

谷歌Gemini这张图片视觉效果惊人,一个夸张的汉堡和清晰聚焦的层次感。每个元素(面包、肉饼、配料)都以锐利的细节呈现出来,使得整个汉堡看起来有些头重脚轻、不对称的感觉,这让我觉得往往是订购了一个满载配料的汉堡后的现实情况。薯条呈现出完美的金黄色,黑松露调味料在视觉上也很突出。

元AI这张图片中的汉堡超乎寻常地诱人,肉感十足,色彩对比强烈,融化的奶酪更是令人垂涎。黑松露调味的细节精致无比,薯条的摆放甚至比双子座(此处可能指之前某个作品或参照物)的输出更加逼真。

ChatGPT:这一个显然为了获胜而在薯条上做了额外的努力,但整体形象更具艺术感,几乎具有绘画般的品质。与谷歌和Meta的版本相比,松露薯条的细节更加丰富,但却不够写实。

反应这是一次在Google Gemini和Meta AI之间非常艰难的选择。两者都擅长生成令人垂涎的高级汉堡,让我午餐时很想吃一个。但最终我还是会选择Meta AI为胜者,因为它的牛肉饼异常多汁。它逼真的程度让人看了就想流口水,而且额外的奶酪更是加分项。Gemini和Meta AI近乎摄影级的效果都很令人印象深刻。OpenAI生成的图片则富有创意,但是汉堡看起来不太真实,甚至有点滑稽。

家居装饰

AI images of living rooms in front of the ocean

(图片版权:Future)

提示:创建一个简约风格的客厅图像,该客厅有一扇大窗户,可以俯瞰海洋。

谷歌Gemini图像设计简洁,线条流畅但光线较为昏暗。海景栩栩如生,但却给人一种客厅仿佛漂浮在水中、海面被夸大了的视角感。这个客厅是在船上吗?

元AI该图像捕捉到了极简主义的美学,但遗漏了一些细节纹理和光线效果,这些可以提升场景的真实感。虽然水面位置接近正确,但它看起来是独立的,并不直接紧挨着客厅。

ChatGPT这张图片更符合我的期望——客厅与海洋之间有着明显的界限,色彩鲜明,形状有趣,并且天空也非常吸引人。虽然海景细节略显不足,但墙面的艺术装饰和独特的咖啡桌却给人带来了一种愉悦的视觉体验。

反应Meta AI 和 ChatGPT 在这一点上表现出色,尽管我最终还是会选择 Meta AI 作为赢家,因为它似乎最准确地捕捉了提示的精髓,包括一个看起来欢迎窗外景色的客厅,而 ChatGPT 则是一个背对着景色的座位排。Meta AI 对现实主义的关注让它在这一类别中略胜一筹,虽然 OpenAI 的创意诠释提供了一个更具独特性的视角。

3. 动物

AI images of parrots

(图片版权:Future)

提示:创建一只彩色鹦鹉停在树枝上的图片。

谷歌Gemini图像这只鹦鹉非常细致,羽毛鲜艳且纹理逼真。树枝上的细节增添了一丝自然气息,尽管背景并不复杂。不过提示词中提到的是“多彩的”,而这只鸟虽然美丽地呈现为绿色,但在我看来它缺乏更多的活力和色彩。

元AI这只鹦鹉的色彩更符合我的预期。从整体构造到喙和爪子都十分精致漂亮,场景中的叶子也为整个画面增添了许多美感。

ChatGPT:这只鹦鹉色彩斑斓且具有艺术感,但缺乏使它看起来栩栩如生的羽毛细节。它的外观更加超现实,注重鲜艳的颜色而非复杂的细节。背景的添加虽然不错,但就像额外的一份薯条一样,并未被要求。

反应 Gemini呈现了一只非常逼真地停在树枝上的鸟,而ChatGPT生成的是一只具有童话般质感的鸟,这激发了我内心对迪士尼的喜爱。但在这个任务中我还是选择了Meta AI,因为它在现实主义与我期待的鲜艳色彩和生动感之间取得了平衡。

4. 车辆

AI images of futuristic electric cars

(图片版权:Future)

提示:在日落时分的城市街道上创作一辆未来感十足的电动汽车的画面

谷歌Gemini图像汽车看起来流线型且现代,表面清晰、反射性强。夕阳增添了温暖的色调,城市的轮廓在柔和的灯光效果下显得细节丰富。场景中的电动汽车充电器是一个很好的细节,强调了汽车的电动特性。

元AI车辆设计大胆且极具未来感。明亮的颜色使这幅画面在光线与阴影的细腻处理下显得格外引人注目,尤其是夕阳西下的场景。街道上的城市细节增添了氛围。

ChatGPT汽车的设计非常前卫,但几乎有些过头了;日落和城市景观的描绘也不够清晰。光滑的道路近乎完美,使整个画面带有一种略微概念化的感受,而不是真实的摄影效果。

反应有趣的是,所有的人工智能模型都生成了一辆外观非常相似的电动汽车和未来场景。迄今为止,这些图像在遵循提示方面最为相似。Meta AI显然是赢家,因为它完美地结合了未来设计和环境细节,而ChatGPT则提供了一个更具概念性但不太现实的观点。Gemini紧随其后,提供了大量的细节和真实性。

5. 山水景色

AI images of a cabin in the mountains

(图片提供:Future)

提示:创建一幅宁静的山间小屋的画面,小屋周围环绕着松树,雾气缭绕。

谷歌Gemini:松树和山被描绘得很细致,但小屋看起来单调而荒凉,更显荒废而非宁静。这幅画面逼真且具有画意,却缺少我希望在这张图片中看到的那种氛围。

元AI雾气和树木描绘得很逼真,虽然小屋因为屋顶上过多的常春藤和绿植显得有些卡通化。背景才是让这张图片真正脱颖而出的部分。

ChatGPT图像如梦似幻,雾气被夸张处理以营造出梦幻效果。场景柔和且具有绘画般的质感,仿佛是一幅幻想插图。

反应我不得不反复检查以确保我没有把Meta AI和ChatGPT的图片搞混。我习惯了ChatGPT生成一些更有艺术气息的图片,但这次是Meta AI过于创意性的解释偏离了主题。谷歌再次在逼真度上胜出,但是在这里的整体赢家还是ChatGPT,因为它的一张出色图片满足了所有要求。

最后的思考

经过测试这五个提示,很明显谷歌Gemini的Imagen和Meta AI是生成高度逼真、细节丰富的照片级图像的最佳选择。Meta AI提供了出色的表现,能够生成具有惊人细节和连贯性的图像,但往往更偏向于风格化,并且在细微之处的精致程度上不如Gemini表现得那么好。另一方面,ChatGPT则在创意方面表现出色,经常提供更具艺术感或超现实主义的提示解释。

总体而言,Meta AI 明显胜出,提供了良好的中间选项,并且在现实感和更细致地关注提示细节方面超越了其他聊天机器人。

更多来自Tom's Guide的内容

在Tom's Guide,我们的专业编辑致力于为您提供最佳的新闻、评论和指南,帮助您保持信息灵通并领先一步!

关于《我刚刚测试了ChatGPT、Gemini和Meta AI,生成了15张图片——结果出乎我的意料。》的评论


暂无评论

发表评论

摘要

(图片提供:Future) 随着AI生成的图像成为创意工作的重要组成部分,Google Gemini的Imagen、OpenAI的ChatGPT和Meta AI之间的竞争十分激烈。松露调料的细节非常精致,薯条摆放得比Gemini的输出更加逼真。ChatGPT: 这个显然为了赢得胜利而额外加了一份薯条,但整体图像更具艺术感,几乎达到了绘画的质量。这个客厅是在船上吗?Meta AI:该图片捕捉到了极简主义美学,但在纹理和光线方面缺少了一些细节,这些细节能够提升场景的真实感。最终想法经过测试这五个提示后,很明显Google Gemini的Imagen和Meta AI是生成高度逼真、接近现实世界细节图像的最佳选择。