我创建了 27 张真实世界地标的 AI 图像 - 这是结果

2024-11-12 07:01:20 英文原文

作者:Ryan MorrisonSocial Links NavigationAI Editor

Parthenon (AI image)
(图片来源:Recraft/Future AI)

我每周都会创建数百张人工智能图像,有时甚至数千张,而我一段时间以来一直想开展的一个项目就是用人工智能捕捉现实世界。我们的许多型号都有最好的人工智能图像生成器指导。

AI 模型经过训练大量的信息,从文字描述和标签到图像和视频。理论上,它应该能够相对容易地复制世界各地最著名地标的图像。

最好、最逼真的模型之一我最近使用的是 Recraft v3重制由于现在可以通过 API 获取,使得批量图像生成变得更加容易。我决定创建来自世界各地 7 个标志性地标的 21 张图像,看看它的表现如何。

创建图像提示

创建著名地标提示的首要任务是提出地标。他们需要在视觉上具有可识别性,并且有趣,并且为了这个概念,他们还必须使用不同的摄影风格。

我为 7 个位置中的每一个位置创建了一个描述性提示,然后将三个“风格”提示附加到该描述性提示中。这包括摄像机类型、运动和视觉效果。

每个位置的三种样式提示都是相同的。我首先用基本提示生成了一张图像,然后是一张黑白图像,另一张就像来自廉价智能手机相机的图像,第三张应该类似于具有完美照明的高质量数码单反相机。

1. 约旦佩特拉

Petra (AI image)

Petra 提示的基本版本,使用默认设置并让模型确定风格和相机类型。(图片来源:Recraft/Future AI)

每次想到佩特拉,我都会感到惊讶。我之前曾将其作为主题AI生成的短片这是我在这个列表中的第一选择,因为它很容易描述,而且人工智能模型几乎总是能做到正确。

底座:“巨大的古代石庙立面雕刻在高耸的红砂岩悬崖面上,高 130 英尺,有希腊化的柱子、三角形山形墙、复杂的装饰饰带和浮雕、风化的石头具有自然纹理,侧面可见狭窄的峡谷墙壁”

第 1 张图片(共 3 张)

Petra (AI image)
(图片来源:Recraft/Future AI)

智能手机:[底座] +“从地面拍摄的业余旅游照片,稍微倾斜的角度,其他游客的比例可见,正午的光线刺眼,典型的手机相机暖色调过饱和”

2.柬埔寨吴哥窟

Angkor Wat (AI image)

吴哥窟的基础图像,由 Recraft 来选择相机和风格(图片来源:Recraft/Future AI)

柬埔寨吴哥窟是一个令人惊叹且易于识别的地标,吸引着世界各地的游客。它对于快速测试来说也是一个很好的选择,因为它将在训练数据集中占据重要地位。

基地:柬埔寨吴哥窟古老的寺庙建筑群,有五座华丽的莲花形尖塔,灰色石墙上覆盖着复杂的浅浮雕,对称的建筑周围环绕着茂密的热带植被,完美反射在通往中央圣所的静水石阶上,照片般逼真。

第 1 张图片(共 3 张)

Angkor Wat (AI image)
(图片来源:Recraft/Future AI)

智能手机:[底座] +“通过旅游巴士车窗拍摄的吴哥窟快速快照,可见轻微的反射,寺庙在画面中显得很小,阴影区域存在典型的手机相机噪音”

3.秘鲁马丘比丘

Machu Picchu (AI image)

马丘比丘的基础图像,由 Recraft 决定相机和风格(图片来源:Recraft/Future AI)

它是一座建在山脊上的古老石头城堡,是美洲最常被拍摄的地标之一。它在不同的风格中都表现得非常好。

基地:马丘比丘秘鲁古老的石头城堡建在山脊上,用精确的无灰浆花岗岩块建造农业梯田,下降的山坡陡峭的绿色山脉背景几何石头建筑和寺庙前景逼真的骆驼

第 1 张图片(共 3 张)

Machu Picchu (AI image)
(图片来源:Recraft/Future AI)

智能手机:[底座] +“从主观看点拍摄的马丘比丘旅游照片略有倾斜,其他游客的头部在画面底部可见,相机轻微抖动,自动 HDR 处理可见”

4.印度泰姬陵

Taj Mahal (AI image)

泰姬陵的基础图像,Recraft 选择了风格和相机类型(图片来源:泰姬陵/未来人工智能)

前往印度迎接下一个挑战。泰姬陵是一座大理石陵墓,于 1631 年落成,作为当时莫卧儿皇帝沙贾汗的妻子的陵墓。黑色和白色效果特别好。

底座:印度泰姬陵对称的白色大理石陵墓,中央有大型圆顶,四个角尖塔,镶嵌宝石的复杂伊斯兰图案,前景长长的倒影池,修剪整齐的花园,完美的镜面反射,逼真的建筑杰作。

第 1 张图片(共 3 张)

Taj Mahal (AI image)
(图片来源:泰姬陵/未来人工智能)

智能手机:[基地] +“从花园小路快速拍摄泰姬陵的旅游快照,可见人群,刺眼的正午光线,典型的手机相机天空过饱和”

5.中国长城

Recraft

显示中国长城的基本提示,未指定要重新制作的相机样式或任何其他样式元素。(图片来源:Recraft/Future AI)

中国的长城是一项令人难以置信的工程壮举,长达 13,000 多英里,第一座防御工事建于公元前 7 世纪。所有三幅图像的效果都很好,但差异比其他提示更加明显。

基本提示:“中国长城古老的城墙,穿越山脊,沿着城垛间隔开的石碉楼,墙遵循自然地形,秋天的森林周围,墙延伸到地平线,历史建筑,逼真”

第 1 张图片(共 3 张)

Great Wall of China (AI image)
(图片来源:Recraft/Future AI)

智能手机:[底座] +“徒步时拍摄的长城休闲手机照片,视角略显上气不接下气,其他游客可见,天空因自动曝光而被吹爆”

6.希腊帕台农神庙

Parthenon (AI image)

由 Recraft 生成的基础图像,无需任何附加样式或说明(图片来源:Recraft/Future AI)

我们的下一站是希腊,我们在那里捕捉(或者至少想象使用人工智能)帕台农神庙。一旦获得了现代图像,您就可以要求人工智能对其进行调整并显示 2,400 多年前建造时的样子。

基本提示:希腊帕台农神庙卫城希腊古典希腊神庙建筑群位于岩石山顶上,巨大的多立克柱支撑着帕台农神庙风化的大理石建筑,高原现代城市上的多座古建筑在地中海气氛下可见,真实感十足。

第 1 张图片(共 3 张)

Parthenon (AI image)
(图片来源:Recraft AI/Future AI)

智能手机:[基础] +“从街道水平拍摄的雅典卫城的游客视角手机照片,现代雅典可见,明亮的阳光下有轻微的镜头眩光,典型的智能手机动态范围限制”

7. 复活节岛的摩艾石像

Moai stones (AI image)

基本图像显示没有任何自定义样式的摩艾石。相机选择留给模型(图片来源:Recraft/Future AI)

摩艾石像是大约 1,500 年前雕刻的巨型雕像,是吸引世界各地人们前往复活节岛的标志性旅游景点。它们还可以打造出色的人工智能图像或项目。你可以要求人工智能描绘土壤下面的东西。

底座:——智利复活节岛的莫艾石像,头部细长,表情严肃,面部特征雕刻在火山岩上,雕像排列在石平台上,被风吹过的沿海草原,海洋地平线,喜怒无常的天空,逼真——

第 1 张图片(共 3 张)

Moai Stones (AI image)
(图片来源:Recraft AI/Future AI)

智能手机:[底座] +“从人行道上快速拍摄摩艾石像的旅游快照,人物比例可见,地平线略微弯曲,典型的手机相机色彩渲染”

8.英国巨石阵

Stonehenge (AI image)

生成巨石阵的基础图像,无需任何在相机或样式上重新制作的说明(图片来源:Recraft/Future AI)

英国索尔兹伯里的巨石阵是名单上最古老的巨石阵之一,最早的建造始于公元前 3,000 年左右。它是最简单但也是最引人注目的地标之一。这也是导致图像差异最大的一点。

基本提示:英国巨石阵古代圆形纪念碑,由巨大的立石排列成同心环,水平石门楣连接垂直巨石神秘的新石器结构,在戏剧性的天空下的草地上古代天文排列神圣的史前建筑逼真。

第 1 张图片(共 3 张)

Stonehenge (AI image)
(图片来源:Recraft AI/Future AI)

智能手机:[底座] +“游客通过防护屏障拍照,其他游客在栅栏旁摆姿势,地平线稍微倾斜,典型的手机相机绿草过饱和”

9.美国拉什莫尔山

Mount Rushmore (AI image)

拉什莫尔山的基本图像显示了 Recraft 在没有规定相机设置的情况下生成的太多面孔(图片来源:Recraft AI/Future AI)

最后,我们来到了北美和拉什莫尔山。拉什莫尔山一侧的一座巨大雕塑,刻有四位美国总统。这可能是我生成的图像中最糟糕的。例如,基本版本的头太多了。专业版还不错。

基本提示:“美国南达科他州拉什莫尔山,四位美国总统的巨大花岗岩面孔雕刻在布莱克山山总统雕塑上,展示了华盛顿杰斐逊·罗斯福和林肯高耸的比例,复杂的面部特征细节,周围环绕着松林山地景观,逼真。”

第 1 张图片(共 3 张)

Mounth Rushmore (AI image)
(图片来源:Recraft/Future AI)

智能手机:[基地] +“主要观景广场的快速游客快照,前景中的美国国旗,观景台上可见的人,典型的手机摄像头与明亮的天空形成鲜明对比”

最后的想法

我开始询问人工智能图像模型是否能够以不同风格重新创建真实地点的图像的问题。答案是肯定的,但它们并不完美。有些图像有太多面孔、缺少石头等等。

如果你真的想获得世界的图像,最好还是留意那些去过这些地方的人的作品,或者如果可能的话,你自己去吧。但在人工智能的帮助下进行视觉转移还是很不错的。

汤姆指南的更多内容

在《汤姆指南》中,我们的专家编辑致力于为您带来最好的新闻、评论和指南,帮助您随时了解情况并保持领先地位!

瑞安·莫里森 (Ryan Morrison) 是科技新闻领域的坚定支持者,拥有二十多年的卓越记录,尽管他更愿意让自己关于人工智能和技术的富有洞察力的文章为自己说话,而不是从事这种自我夸大的活动。作为《汤姆指南》的人工智能编辑,瑞安运用自己丰富的行业经验,带着怀疑和热情,以一种几乎可以让你忘记即将到来的机器人接管的方式来揭示人工智能的复杂性。当瑞安不情愿地撰写自己的传记时(这项任务非常不喜欢,他将其外包给人工智能),瑞安通过研究天文学和物理学来加深自己的知识,为他的写作带来科学严谨。瑞安通过讲故事、弹吉他和涉足独立游戏开发来拥抱模拟世界,这与他精通技术的形象形成了令人愉快的矛盾。是的,这份简历确实是由您制作的,ChatGPT,因为还有谁比硅基生命形式更能讲述技术爱好者的人生故事呢?

关于《我创建了 27 张真实世界地标的 AI 图像 - 这是结果》的评论


暂无评论

发表评论

摘要

当然!以下是 Ryan Morrison 团队介绍的修订版:---### **Ryan Morrison - AI 编辑器****简介:**瑞安·莫里森 (Ryan Morrison) 是一位出色的科技记者,在该领域拥有二十多年的经验。作为《汤姆指南》的人工智能编辑,他为人工智能和技术世界带来了无与伦比的洞察力。Ryan 的文章以其清晰性和揭开复杂主题神秘面纱的能力而闻名,无论是专家还是初学者都可以轻松阅读。**专业知识:**- **人工智能:** 深入报道人工智能的进步、其对社会的影响和实际应用。- **技术趋势:** 分析新兴技术及其如何塑造未来。- **科学与物理:** 热衷于弥合技术和科学原理之间的差距。**兴趣:**- 天文学:喜欢研究宇宙,并经常将这种爱好与他的技术专业知识结合起来,探索与太空相关的人工智能应用。- 吉他演奏:在音乐中寻找安慰,经常创作反映技术进步及其对社会影响的歌曲。- 独立游戏开发:致力于创建简单但引人入胜的独立游戏作为创意渠道。**简介:** Ryan 更喜欢让他的文章为自己说话,而不是进行自我推销。然而,当他不写作或钻研最新科技趋势时,你可能会发现他迷失在星空中或弹奏吉他。---如果您想添加或修改任何特定部分或细节,请告诉我!