Pokémon Go 开发商 Niantic 正在努力构建和训练人工智能,使其能够仅用有限的信息自动完成现实世界的位置。它使用 Pokémon Go 玩家收集的数据来做到这一点。
在一个官方博客文章发现于垃圾日并报道了404媒体,Niantic 透露它正在构建一种称为“大型地理空间模型”的东西。您可能已经知道什么是“大型语言模型” - 它是 Chat GPT。它是一种人工智能,经过大量现有文本的训练,因此它可以自己生成听起来正常的文本,并且可以想象,就像用户可能想听到的那样。
大型地理空间模型本质上是相同的想法,但应用于物理世界。它接受了现实世界地点的训练(教堂、公园、房屋等),然后它可以使用这些数据来生成有关它尚未见过的实际地点可能是什么样子的信息。Niantic 声称这对于 AR 眼镜、机器人、内容创建等技术很有用。
或者正如 Niantic 所说:
想象你自己站在教堂后面。让我们假设最接近的本地模型只看到了该教堂的正门,因此它将无法告诉您您在哪里。该模型从未见过该建筑物的背面。但在全球范围内,我们看到了很多教堂,数以千计的教堂,它们都被世界其他地方各自的当地模型所捕捉。没有一个教会是相同的,但许多教会都有共同的特征。LGM [大型地理空间模型] 是一种访问分布式知识的方法。
但为了实现这一目标,Niantic 需要大量数据来训练人工智能,而它自己只能做这么多。多年来,谷歌一直通过谷歌地图和那些用来获取街景信息的有趣汽车收集位置数据,但在这种情况下这还不够。汽车只能在道路上行驶,而 Niantic 需要汽车无法到达的地方的行人信息。幸运的是,Niantic 在全球范围内有成千上万的用户将手机指向物体,并通过其各种项目和应用程序(包括 Pokémon Go)发回信息。
具体来说,Niantic 在其帖子中表示,它正在构建一种称为视觉定位系统 (VPS) 的技术,该技术使用手机中的图像来确定 3D 地图上某个位置的位置和方向。该技术应该允许用户以“厘米级精度”定位自己在世界中的位置,从而使他们能够“精确而真实地”看到覆盖在物理世界上的数字内容。再次来自 Niantic:
此内容是持久的,因为它在您离开后保留在某个位置,然后可以与其他人共享。例如,我们最近开始在 Pokémon GO 中推出一项名为 Pokémon Playgrounds 的实验性功能,用户可以将 Pokémon 放置在特定位置,并且它们将保留在那里供其他人查看和互动。
但所有这些技术之所以存在,是因为用户在使用 Niantic 的应用程序(包括 Pokémon Go)时不断地用手机扫描世界,而且这种情况已经存在多年了。Niantic 表示,目前它在全球扫描了 1000 万个位置,其中 100 万个可通过其 VPS 服务使用,并且每周都会进行 100 万次新扫描,其中包含数百张离散图像。这是很多数据。
目前,Niantic 表示,它正在明确使用这些数据来开发自己的技术,然后将其转化并实施到现有产品中。然而,近年来出现了诸多担忧讨论公司如何收集数据、使用数据来训练人工智能,以及这些人工智能模型最终的用途。虽然今天 Niantic 的 LGM 工作可能仅限于让我们将可爱的神奇宝贝模型扔到世界上供其他人找到,但明天它的用途可能会变得越来越复杂。
IGN 已联系 Niantic 征求意见。
丽贝卡·瓦伦丁 (Rebekah Valentine) 是 IGN 的高级记者。您可以在 BlueSky @duckvalentine.bsky.social 上找到她的帖子。有故事提示吗?将其发送至 rvalentine@ign.com。