苹果的新Depth Pro AI可能会革新AR——只需几秒钟即可从单张图像中捕捉三维空间

2024-10-08 16:28:45 英文原文

作者:Lloyd CoombesSocial Links Navigation

AI image of smart glasses
AI图像以展示未来的智能眼镜的可能性 (图片版权:Ideogram 2/未来AI)

没有一周过去而不有一些新的事情发生人工智能发展推动技术前进,但本周的来自库比蒂诺的一家小型科技公司。

当所有人都关注于苹果智能并且随着其最终发布将特定上下文的AI功能带入日常使用中,该公司还展示了一个名为Depth Pro的新AI模型。

正如其名所示,这个新的人工智能模型将实时映射图像的深度。更令人兴奋的是,它可以在标准家用计算硬件上完成这一任务——无需NvidiaH100是必需的。

Depth Pro是一款研究模型,并不一定意味着苹果会将其投入生产,但如果将来我们得到一款Apple眼镜,它肯定有助于该公司更好地实现增强现实功能,甚至可以提升Vision Pro的AR功能。

Apple Depth Pro

(图片版权:Apple Depth Pro)

苹果昨天发布了一个令人惊叹的机器学习深度模型,该模型可以从单张图片生成以*米*为单位的深度图。我建立了一个演示项目来尝试它——增加了下载深度图(以米为单位)的功能——并且可以生成场景的真实比例3D对象文件(forked from a space by… pic.twitter.com/XdbtqN9Dp4)2024年10月6日

苹果的新模型估计相对深度和绝对深度,利用这些数据生成“度量深度”。然后可以以多种方式结合图像一起使用这些数据。

当用户拍摄照片时,Depth Pro会在图像中的物品之间绘制准确的测量值。苹果的模型也应该避免出现不一致的情况,例如认为天空是背景的一部分,或者错误地判断场景的前景和背景。

苹果的新Depth Pro型号如何使用?

潜力几乎是无穷的,不考虑《终结者2》的情节。自动驾驶汽车(讽刺的是像苹果公司取消的产品一样)、无人机和机器人吸尘器可以使用精确的深度感知技术来帮助提高物体避障能力,而增强现实技术和在线家具商店则可以帮助更准确地在房间内放置物品——无论是真实还是虚拟环境。

在Tom's Guide,我们的专业编辑致力于为您提供最佳的新闻、评论和指南,帮助您保持信息灵通并领先一步!

医学技术也可以通过深度感知得到改进,从而改善解剖结构的重建和内部器官的地图绘制。

它也可能形成一个完整的循环,更准确地帮助将图像转换为视频使用生成式AI如Luma Dream Machine这通过将深度数据与图像一起传递给视频模型来实现,以便更好地理解如何在该空间中处理对象的放置和运动。

更多来自Tom's Guide的内容

来自英国埃塞克斯的自由撰稿人Lloyd Coombes自2024年起开始为Tom's Guide撰稿,此前他曾为TechRadar、iMore、Live Science等网站工作。作为一名消费科技专家,Lloyd 对苹果产品尤为熟悉,这一切始于他获得第一台iPod Mini之时。除了为Future撰写最新的电子设备文章外,他还是一位博主,并担任GGRecon.com的主编。在他不写作的时候,你会看到他在陪伴儿子或在健身房努力锻炼。你可以在Twitter上关注他 @lloydcoombes。

关于《苹果的新Depth Pro AI可能会革新AR——只需几秒钟即可从单张图像中捕捉三维空间》
暂无评论

摘要

AI图像以展示潜在的未来智能眼镜 (图片提供:Ideogram 2/Future AI) 没有一周不有一些新的AI开发推动技术进步,但本周的消息来自库比蒂诺的一家小型科技公司。更令人兴奋的是,这项技术可以在标准的家庭计算硬件上运行——不需要Nvidia H100。这将通过向视频模型传递深度数据和图像来实现,以更好地理解如何处理该空间中的对象放置和运动。更多内容请见Tom's Guide Apple Intelligence发布日期——所有AI功能即将推出 我一直在测试ChatGPT Canvas——这是我认为今年最重要的AI工具的原因 我刚刚看到了表情包的未来——Pika 1.5版本可以将任何东西变成蛋糕 来自英国埃塞克斯的自由撰稿人Lloyd Coombes从2024年开始为Tom's Guide撰写文章,此前曾在TechRadar、iMore、Live Science等网站工作。当他不写作的时候,你会发现在陪他的儿子或在健身房努力锻炼。