没有一周过去而不有一些新的事情发生人工智能发展推动技术前进,但本周的来自库比蒂诺的一家小型科技公司。
当所有人都关注于苹果智能并且随着其最终发布将特定上下文的AI功能带入日常使用中,该公司还展示了一个名为Depth Pro的新AI模型。
正如其名所示,这个新的人工智能模型将实时映射图像的深度。更令人兴奋的是,它可以在标准家用计算硬件上完成这一任务——无需NvidiaH100是必需的。
Depth Pro是一款研究模型,并不一定意味着苹果会将其投入生产,但如果将来我们得到一款Apple眼镜,它肯定有助于该公司更好地实现增强现实功能,甚至可以提升Vision Pro的AR功能。
苹果昨天发布了一个令人惊叹的机器学习深度模型,该模型可以从单张图片生成以*米*为单位的深度图。我建立了一个演示项目来尝试它——增加了下载深度图(以米为单位)的功能——并且可以生成场景的真实比例3D对象文件(forked from a space by… pic.twitter.com/XdbtqN9Dp4)2024年10月6日
苹果的新模型估计相对深度和绝对深度,利用这些数据生成“度量深度”。然后可以以多种方式结合图像一起使用这些数据。
当用户拍摄照片时,Depth Pro会在图像中的物品之间绘制准确的测量值。苹果的模型也应该避免出现不一致的情况,例如认为天空是背景的一部分,或者错误地判断场景的前景和背景。
苹果的新Depth Pro型号如何使用?
潜力几乎是无穷的,不考虑《终结者2》的情节。自动驾驶汽车(讽刺的是像苹果公司取消的产品一样)、无人机和机器人吸尘器可以使用精确的深度感知技术来帮助提高物体避障能力,而增强现实技术和在线家具商店则可以帮助更准确地在房间内放置物品——无论是真实还是虚拟环境。
医学技术也可以通过深度感知得到改进,从而改善解剖结构的重建和内部器官的地图绘制。
它也可能形成一个完整的循环,更准确地帮助将图像转换为视频使用生成式AI如Luma Dream Machine这通过将深度数据与图像一起传递给视频模型来实现,以便更好地理解如何在该空间中处理对象的放置和运动。