图片来源:Kilito Chan/Getty Images
想象一下将单个静态图像转变为整个虚拟世界。这种未来的能力不仅仅是一个梦想;而是一个梦想。这就是 GenEx(生成世界浏览器)的现实。GenEx 旨在消除物理探索的需要,从而节省时间和成本并降低风险。
新系统背后的研究人员在一份报告中解释说,这种系统的潜力涵盖从灾难响应到沉浸式游戏,为我们提供了一个可以观察世界并与世界互动的新镜头。预发表论文。GenEx 因其类人推理而脱颖而出。
就像我们根据上下文推断隐藏物体的存在一样,GenEx 使用线索和先验知识来想象环境中看不见的区域。即使没有直接观察,这种概率预测也可以做出逻辑决策,模仿我们日常的认知飞跃。
例如,就像驾驶员推断汽车突然停下的原因一样,GenEx 可以预测未见过的场景来指导决策。这里的应用是深远的。在灾难响应中,它可以使用单个监控图像远程探索危险区域,从而实现更安全、更快速的救援行动。
对于导航,GenEx 通过提供对环境的详细了解来增强自主机器人和导航应用程序的培训。游戏和虚拟现实也将从这项技术中受益,为用户创造更加身临其境和逼真的体验。
GenEx 的核心有几个关键功能。它从静态图像生成合成的可导航环境,并采用“球形一致性学习”来确保无缝的 360 度全景视图。凭借其“想象力增强策略”,GenEx 使人工智能代理能够根据方向输入和距离参数做出逻辑、自适应决策并灵活地导航虚拟空间。
测试表明 GenEx 的功能不仅仅是理论上的。GenEx 在视频生成方面超越了传统基准,并改善了增强场景中的人类决策。展望未来,整合现实世界的传感器数据和动态场景可以使虚拟世界更加真实。
我们已经看到人工智能做了一些疯狂的事情,比如根据街道噪音制作准确的图像——但我们还没有看到像 GenEx 及其虚拟环境生成那样有前途的东西。