我每周都会创建数百张人工智能图像,有时甚至数千张,而我一段时间以来一直想开展的一个项目就是用人工智能捕捉现实世界。我们的许多型号都有最好的人工智能图像生成器指导。
AI 模型经过训练大量的信息,从文字描述和标签到图像和视频。理论上,它应该能够相对容易地复制世界各地最著名地标的图像。
最好、最逼真的模型之一我最近使用的是 Recraft v3从重制由于现在可以通过 API 获取,使得批量图像生成变得更加容易。我决定创建来自世界各地 7 个标志性地标的 21 张图像,看看它的表现如何。
创建图像提示
创建著名地标提示的首要任务是提出地标。他们需要在视觉上具有可识别性,并且有趣,并且为了这个概念,他们还必须使用不同的摄影风格。
我为 7 个位置中的每一个位置创建了一个描述性提示,然后将三个“风格”提示附加到该描述性提示中。这包括摄像机类型、运动和视觉效果。
每个位置的三种样式提示都是相同的。我首先用基本提示生成了一张图像,然后是一张黑白图像,另一张就像来自廉价智能手机相机的图像,第三张应该类似于具有完美照明的高质量数码单反相机。
1. 约旦佩特拉
每次想到佩特拉,我都会感到惊讶。我之前曾将其作为主题AI生成的短片这是我在这个列表中的第一选择,因为它很容易描述,而且人工智能模型几乎总是能做到正确。
底座:“巨大的古代石庙立面雕刻在高耸的红砂岩悬崖面上,高 130 英尺,有希腊化的柱子、三角形山形墙、复杂的装饰饰带和浮雕、风化的石头具有自然纹理,侧面可见狭窄的峡谷墙壁”
第 1 张图片(共 3 张)
智能手机:[底座] +“从地面拍摄的业余旅游照片,稍微倾斜的角度,其他游客的比例可见,正午的光线刺眼,典型的手机相机暖色调过饱和”
2.柬埔寨吴哥窟
柬埔寨吴哥窟是一个令人惊叹且易于识别的地标,吸引着世界各地的游客。它对于快速测试来说也是一个很好的选择,因为它将在训练数据集中占据重要地位。
基地:柬埔寨吴哥窟古老的寺庙建筑群,有五座华丽的莲花形尖塔,灰色石墙上覆盖着复杂的浅浮雕,对称的建筑周围环绕着茂密的热带植被,完美反射在通往中央圣所的静水石阶上,照片般逼真。
第 1 张图片(共 3 张)
智能手机:[底座] +“通过旅游巴士车窗拍摄的吴哥窟快速快照,可见轻微的反射,寺庙在画面中显得很小,阴影区域存在典型的手机相机噪音”
3.秘鲁马丘比丘
它是一座建在山脊上的古老石头城堡,是美洲最常被拍摄的地标之一。它在不同的风格中都表现得非常好。
基地:马丘比丘秘鲁古老的石头城堡建在山脊上,用精确的无灰浆花岗岩块建造农业梯田,下降的山坡陡峭的绿色山脉背景几何石头建筑和寺庙前景逼真的骆驼
第 1 张图片(共 3 张)
智能手机:[底座] +“从主观看点拍摄的马丘比丘旅游照片略有倾斜,其他游客的头部在画面底部可见,相机轻微抖动,自动 HDR 处理可见”
4.印度泰姬陵
前往印度迎接下一个挑战。泰姬陵是一座大理石陵墓,于 1631 年落成,作为当时莫卧儿皇帝沙贾汗的妻子的陵墓。黑色和白色效果特别好。
底座:印度泰姬陵对称的白色大理石陵墓,中央有大型圆顶,四个角尖塔,镶嵌宝石的复杂伊斯兰图案,前景长长的倒影池,修剪整齐的花园,完美的镜面反射,逼真的建筑杰作。
第 1 张图片(共 3 张)
智能手机:[基地] +“从花园小路快速拍摄泰姬陵的旅游快照,可见人群,刺眼的正午光线,典型的手机相机天空过饱和”
5.中国长城
中国的长城是一项令人难以置信的工程壮举,长达 13,000 多英里,第一座防御工事建于公元前 7 世纪。所有三幅图像的效果都很好,但差异比其他提示更加明显。
基本提示:“中国长城古老的城墙,穿越山脊,沿着城垛间隔开的石碉楼,墙遵循自然地形,秋天的森林周围,墙延伸到地平线,历史建筑,逼真”
第 1 张图片(共 3 张)
智能手机:[底座] +“徒步时拍摄的长城休闲手机照片,视角略显上气不接下气,其他游客可见,天空因自动曝光而被吹爆”
6.希腊帕台农神庙
我们的下一站是希腊,我们在那里捕捉(或者至少想象使用人工智能)帕台农神庙。一旦获得了现代图像,您就可以要求人工智能对其进行调整并显示 2,400 多年前建造时的样子。
基本提示:希腊帕台农神庙卫城希腊古典希腊神庙建筑群位于岩石山顶上,巨大的多立克柱支撑着帕台农神庙风化的大理石建筑,高原现代城市上的多座古建筑在地中海气氛下可见,真实感十足。
第 1 张图片(共 3 张)
智能手机:[基础] +“从街道水平拍摄的雅典卫城的游客视角手机照片,现代雅典可见,明亮的阳光下有轻微的镜头眩光,典型的智能手机动态范围限制”
7. 复活节岛的摩艾石像
摩艾石像是大约 1,500 年前雕刻的巨型雕像,是吸引世界各地人们前往复活节岛的标志性旅游景点。它们还可以打造出色的人工智能图像或项目。你可以要求人工智能描绘土壤下面的东西。
底座:——智利复活节岛的莫艾石像,头部细长,表情严肃,面部特征雕刻在火山岩上,雕像排列在石平台上,被风吹过的沿海草原,海洋地平线,喜怒无常的天空,逼真——
第 1 张图片(共 3 张)
智能手机:[底座] +“从人行道上快速拍摄摩艾石像的旅游快照,人物比例可见,地平线略微弯曲,典型的手机相机色彩渲染”
8.英国巨石阵
英国索尔兹伯里的巨石阵是名单上最古老的巨石阵之一,最早的建造始于公元前 3,000 年左右。它是最简单但也是最引人注目的地标之一。这也是导致图像差异最大的一点。
基本提示:英国巨石阵古代圆形纪念碑,由巨大的立石排列成同心环,水平石门楣连接垂直巨石神秘的新石器结构,在戏剧性的天空下的草地上古代天文排列神圣的史前建筑逼真。
第 1 张图片(共 3 张)
智能手机:[底座] +“游客通过防护屏障拍照,其他游客在栅栏旁摆姿势,地平线稍微倾斜,典型的手机相机绿草过饱和”
9.美国拉什莫尔山
最后,我们来到了北美和拉什莫尔山。拉什莫尔山一侧的一座巨大雕塑,刻有四位美国总统。这可能是我生成的图像中最糟糕的。例如,基本版本的头太多了。专业版还不错。
基本提示:“美国南达科他州拉什莫尔山,四位美国总统的巨大花岗岩面孔雕刻在布莱克山山总统雕塑上,展示了华盛顿杰斐逊·罗斯福和林肯高耸的比例,复杂的面部特征细节,周围环绕着松林山地景观,逼真。”
第 1 张图片(共 3 张)
智能手机:[基地] +“主要观景广场的快速游客快照,前景中的美国国旗,观景台上可见的人,典型的手机摄像头与明亮的天空形成鲜明对比”
最后的想法
我开始询问人工智能图像模型是否能够以不同风格重新创建真实地点的图像的问题。答案是肯定的,但它们并不完美。有些图像有太多面孔、缺少石头等等。
如果你真的想获得世界的图像,最好还是留意那些去过这些地方的人的作品,或者如果可能的话,你自己去吧。但在人工智能的帮助下进行视觉转移还是很不错的。