2024-10-16 19:29:24 · 英文原文

AI图像生成器大比拼：我测试了ChatGPT与Gemini及Meta AI以选出胜者

作者：Amanda CaswellSocial Links NavigationAI Writer

(图片版权：Future)

竞争之间谷歌Gemini的Imagen, 开放人工智能基金会's 的ChatGPT，和元AI非常激烈。经过单独测试之后，我决定进行直接对比，以真正看出哪个才是最好的最好的AI图像生成器现在。

随着AI生成的图像成为创意工作的重要组成部分，每个平台都有其优势。我通过使用一系列现实和简化的提示来测试AI模型，以评估不同的AI模型处理各种主题的能力。我的目标是确定哪个AI在五个基本类别中能产生最令人印象深刻的结果。

以下是根据生成图像的质量，每个平台的表现情况以及最终胜出的平台。

创建提示词

为了确保比较的公平性，我设计了多样化的提示词来测试每个AI生成详细且美观图像的能力。每个提示都用来测试AI在理解纹理、颜色和构图的同时保持创意水平的能力。类别包括：食物、家居装饰、动物、车辆和风景，使我能够全面探索它们的能力范围。

工作流

我使用了每个平台在默认设置下的图像生成功能。_while_谷歌双子星（Gemini）和开放人工智能（OpenAI）提供高级服务，我在这个比较中使用了它们的免费层级。谷歌双子星的Imagen集成在谷歌的平台内，元数据AI通过生成图像来提供服务 Instagram, Facebook以及 WhatsAppOpenAI的ChatGPT配备了DALL-E图像生成功能，在其单一平台上快速提供结果。

在各个平台生成图像后，我根据清晰度、创意以及AI捕捉提示意图的程度来评估每张图片。

食物

提示:制作一份黑松露薯条搭配的豪华汉堡包

谷歌Gemini这张图片视觉效果惊人，汉堡的摆盘夸张而层次分明。每一个元素（面包、肉饼、配料）都清晰可见，细节丰富，使得整个汉堡看起来略显顶部沉重且不均衡，这种感觉常常是点一份满载配料的汉堡时的真实写照。薯条呈现出完美的金黄色，而且黑松露调味的独特视觉效果也很吸引人。

元AI这张图片中的汉堡非常逼真，肉饼厚实，色彩对比强烈，融化的奶酪令人垂涎。黑松露调味的细节极其精致，薯条的真实感甚至比双子座（此处可能指之前的某个作品或参照物）的输出更加出色。

ChatGPT:这个显然为了赢得胜利不惜加入一份额外的薯条，但整体形象更加艺术化，几乎具有绘画般的质感。相比之下，这份黑松露薯条虽然细节丰富，却不及谷歌和Meta版本那么写实。

获胜者: 元数据
这是一次在Google Gemini和Meta AI之间极其艰难的选择。两者都擅长生成令人垂涎的美食级汉堡，让我午餐时食欲大增。但最终我会选择Meta AI作为赢家，因为它的牛肉饼非常多汁。它的真实感让人垂涎欲滴，额外的奶酪更是加分项。Gemini和Meta AI接近照片般的效果都很令人印象深刻。OpenAI的图像具有创意风格，但汉堡看起来不太真实，甚至有些滑稽。

家居装饰

AI images of living rooms in front of the ocean — (图片版权：Future)

提示:创建一个简约风格的客厅图像，该客厅有一扇大窗户，可以俯瞰海洋。

谷歌Gemini图像设计简洁，线条干净但照明较暗。海景逼真得令人惊叹，但似乎客厅漂浮在水中，以夸张的视角展现了海洋景色。这个客厅是在船上吗？

元AI这张图片捕捉到了极简主义的美学，但缺少了一些能够提升场景真实感的纹理和光线细节。虽然水景很接近，但它看起来是独立存在的，并不直接位于客厅旁边。

ChatGPT这张图片更接近我所期望的效果——客厅和海洋之间有明显的区分，色彩鲜明，形状有趣，天空也很吸引人。虽然海洋部分细节较少，但墙面艺术与独特的咖啡桌增添了不少亮点。

获胜者：元数据Meta AI和ChatGPT在这次任务中表现都很出色，但我最终还是选择Meta AI为胜者，因为它最好地捕捉了提示的精髓，包括一个看起来欢迎外界景色的客厅，而与之相比，ChatGPT生成的一排背对景观的座椅就没有那么吸引人。Meta AI在现实感方面的关注让它在这个类别中占据优势，尽管OpenAI的创意方法提供了一个更加独特的视角。

3. 动物

提示:创建一只彩色鹦鹉栖息在树树枝上的图像。

谷歌Gemini图像这只鹦鹉非常细腻，羽毛鲜艳，纹理逼真。树枝上的细节增添了一丝自然氛围，尽管背景相对简单。然而提示中提到的是“多彩的”，而虽然这只鸟是漂亮的绿色，我期待看到更多色彩和活力。

元AI这只鹦鹉的色彩更符合我的预期。从整体构图到喙和爪子都十分精致迷人，场景中的叶子也增添了整体美感。

ChatGPT:这只鹦鹉色彩丰富且具有艺术感，但缺乏羽毛质感的精细细节，无法使其看起来栩栩如生。它更偏向于一种超现实风格，注重亮丽的颜色而非复杂的细节。背景的添加虽然不错，但就像额外的一份薯条一样，并未被要求。

获胜者：元数据 Gemini生成了一只非常逼真的栖息在树枝上的鸟，而ChatGPT则创造了一只似乎具有童话质感的鸟，这吸引了我这个喜爱迪士尼的一侧。但在这一轮中，我还是选择了Meta AI，因为它在现实主义和色彩鲜艳度之间取得了平衡，符合我根据提示所期待的效果。

4. 车辆

AI images of futuristic electric cars — (图片版权：Future)

提示:在日落时分的城市街道上创作一辆未来感十足的电动汽车的图像

谷歌Gemini图像这辆车看起来流线型且现代，表面清晰而反射性强。日落为场景增添了一抹温暖，城市的天际线则在柔和的灯光效果下显得细节丰富。场景中的电动汽车充电器是一个很好的细节，强调了汽车的电动特性。

元AI车辆设计大胆且极具未来感。明亮的颜色使这幅图像在光线和阴影的细腻处理下格外引人注目，特别是夕阳时分。街道细节增添了氛围。

ChatGPT汽车设计非常前卫，但近乎过于夸张；日落和城市景观的描绘不够清晰。光滑的道路几乎太过完美，使得整个画面更偏向概念化而非照片真实感。

获胜者：元数据有趣的是，所有的AI模型都生成了一辆外观非常相似的电动汽车和未来场景。到目前为止，这些图像在遵循提示方面最为类似。Meta AI显然是赢家，因为它完美地结合了未来设计和环境细节，而ChatGPT则提供了一个更具概念性但不太现实的版本。Gemini紧随其后，提供了大量的细节和现实感。

5. 景观

AI images of a cabin in the mountains — (图片版权：Future)

提示:创建一幅宁静的山间小屋的画面，小屋周围环绕着松树，雾气缭绕。

谷歌Gemini:松树和山被描绘得非常细致，但小屋看起来乏味且不宜居住，更像是一座被遗弃的建筑而非宁静的居所。这幅画面逼真而具有画意，但却缺少了我希望在图像中呈现的那种氛围。

元AI雾气和树木描绘得很逼真，虽然小屋因为屋顶上过多的常春藤和绿植显得有些卡通化。背景才是这张图片真正出彩的地方。

ChatGPT图像如梦似幻，雾气被夸张处理以营造出梦幻效果。场景柔和而富有画意，仿佛是一幅幻想插图。

获胜者：ChatGPT:我不得不反复确认我没有把Meta AI和ChatGPT的图片弄混。我习惯了ChatGPT生成带有更多艺术气息的图片，但这次是Meta AI过于创意性的解读没有达到预期。谷歌再次在现实感方面表现出色，但在所有参赛作品中，最终胜出的是ChatGPT，因为它生成了一张完美符合要求的图片。

测试了这五个提示后，很明显谷歌Gemini的Imagen和Meta AI是生成逼真图片的最佳选择，这些图片能紧密地反映出现实世界的细节。Meta AI提供了出色的表现，可以生成具有惊人细节和连贯性的图像，但往往更加风格化，并且在细微之处可能缺乏Gemini那样的精致。另一方面，ChatGPT则擅长创意，在处理提示时往往会提供更具艺术感或超现实的解释。

总体而言，Meta AI 明显胜出，提供了良好的折中方案，并且在现实感和更细致地关注提示细节方面优于其他聊天机器人。

关于《AI图像生成器大比拼：我测试了ChatGPT与Gemini及Meta AI以选出胜者》的评论

暂无评论

发表评论

摘要

（图片署名：Future）谷歌Gemini的Imagen、OpenAI的ChatGPT和Meta AI之间的竞争非常激烈。每个元素（面包、肉饼、配料）都清晰地呈现出来，但整个汉堡显得有些头重脚轻，细节不均匀，这让人感觉像是订购了一份充满各种配料的汉堡时的真实情况。ChatGPT：这个显然为了获胜额外加了一份薯条，但从整体来看，其画面更具艺术感，几乎像是一幅绘画作品。这是船上的客厅吗？Meta AI：捕捉到了极简主义美学，但在纹理和光线细节上有所欠缺，这些细节能够提升场景的现实感。在测试了这五个提示后，很明显谷歌Gemini的Imagen和Meta AI都是生成逼真图像的最佳选择，这些图像与现实世界的细节高度相似。

OC