苹果的一组工程师开发了一个名为Depth Pro的基于人工智能的模型,可以绘制二维图像的深度。该团队已经撰写了一篇纸张描述该应用及其功能,并已将其发布在了arXiv预印本服务器。他们还在公司的公告板上发布了关于该应用程序的公告。机器学习研究页面.
人类和其他动物能够感知深度,因为大脑能够利用每只眼睛获取的一张图像之间的差异来判断图像中哪些部分更近,哪些部分更远。有些视频摄像头已经做过类似创建3D视频的事情。
智能手机因为依赖单一摄像头进行拍照和视频创作,因此添加了各种硬件和软件功能以实现一定程度的景深效果。在这个新的尝试中,苹果公司的工程师们使用了一个完整的深度图来实现这一目标。数据无需使用诸如相机内参之类的元数据,直接从原始图像中获取信息。
深度图是利用原图像中的所有像素创建的地图。地图上的每个数据点代表一个单独的像素,并对应于该像素所表示的部分与实际成像对象相应部分之间的距离。
这样的地图允许在平面图片中添加另一个维度,赋予其立体效果。团队建议,创建深度图可以生成比使用标准智能手机技术制作的立体效果更加锐利的效果。
在他们的公告中,苹果团队声称使用该功能的APP模型能够在配备标准GPU的计算机上仅用0.3秒生成深度图,并且不需要通常生成3D效果所需的相机数据。
通过创建这样一个运行速度极快的模型,苹果公司开启了使用单镜头相机实时生成三维图像的大门。团队指出,这可能对机器人和其他领域产生重大影响。实时的映射应用程序,例如用于自主车辆的应用程序。
更多信息:阿列克谢·博奇科夫斯基等人,Depth Pro:不到一秒钟的锐利单眼度量深度arXiv (2024). DOI: 10.48550/arxiv.2410.02073
深度专业版:github.com/apple/ml-depth-pro
期刊信息: arXiv
© 2024 Science X网络
引用苹果发布Depth Pro,这是一款可以绘制二维图像深度的AI应用程序(2024年10月10日) 检索于 2024年10月10日 从 https://techxplore.com/news/2024-10-apple-unveils-depth-pro-ai.html
本文件受版权保护。除个人研究或学习目的的合理使用外,未经书面许可,不得以任何方式复制。内容仅用于提供信息之目的。