作者:Massachusetts Institute of Technology
自Roomba以来,机器人已经走了很长一段路。如今,无人机开始送货,自动驾驶汽车正在驾驶一些道路,机器人狗正在帮助急救人员,还有更多的机器人正在进行反弹,并在工厂的地板上提供帮助。尽管如此,卢卡·卡隆(Luca Carlone)认为最好的是尚未到来。
卡隆(Carlone)最近在麻省理工学院航空和宇航员(Aeroastro)的副教授(AeroAstro)担任过任期,他指挥Spark Lab,在那里他和他的学生在人类和机器人之间弥合了人类与机器人之间的关键差距:感知。该小组进行理论和实验研究,所有这些都是旨在以方法来扩大机器人对环境的认识人类的感知。正如卡隆(Carlone)经常说的那样,感知不仅仅是检测。
尽管机器人在检测和识别周围的物体的能力方面突飞猛进,但在对环境提高环境的感觉时,他们仍然有很多东西要学习。
作为人类,我们以直观的感觉不仅对它们的形状和标签,而且是他们的物理学的感觉 - 他们如何被操纵和移动,以及它们如何彼此之间的联系,更大的环境和我们自己。
这种人类水平的看法就是Carlone和他的团队希望授予机器人的方式,以使他们能够安全,无缝地与家中的人们,工作场所和其他非结构化环境中的人们进行无缝互动。
自2017年加入MIT教师以来,Carlone领导了他的团队开发和应用感知和场景理解的算法,以适用于各种应用程序,包括自主地下搜索和救援车辆,可以拾起并操纵物体以及操纵物体的无人机以及自动驾驶汽车。它们也可能对遵循自然语言命令的国内机器人有用,甚至有可能根据高级上下文线索预测人类的需求。
卡隆说:“感知是让机器人在现实世界中帮助我们的大瓶颈。”“如果我们可以将认知和推理的要素添加到机器人的感知中,我相信他们可以做很多事情。”
卡隆(Carlone)在意大利萨勒诺(Salerno)附近出生并长大,靠近风景秀丽的阿马尔菲(Amalfi)海岸,他是三个男孩中最小的一个。他的母亲是一位退休的小学老师,教授数学,父亲是一位退休的历史教授和出版商,他一直对他的历史研究采取分析方法。
兄弟俩可能会不知不觉地采用了父母的思维方式,因为这三个人继续是年龄较大的两个追求电子和机械工程的工程师,而卡隆(Carlone)登陆了当时已知的机器人或机器人技术。
但是,直到他的本科学习很晚才来到场地。卡隆(Carlone)参加了都灵的理工大学,他最初专注于理论工作,尤其是控制理论的领域,该领域应用数学来开发自动控制物理系统行为的算法,例如电网,飞机,汽车和机器人,。
然后,卡隆(Carlone)在他的大四时报名参加了一门关于机器人技术的课程,该课程探讨了操纵的进步以及如何编程机器人以移动和运作。
卡隆说:“这是一见钟情。使用算法和数学来发展机器人的大脑并使其移动并与环境互动是最令人满意的经历之一。”“我立即决定这是我想要做的事情。”
他继续在都灵理工大学和米兰理工大学的双学位课程中,分别获得了机电一体化和自动化工程学的硕士学位。
作为该计划的一部分,Carlone也称为Alta Scuola Politecnica,也参加了管理课程,他和来自各种学术背景的学生不得不合作地概念化,建立和制定新产品设计的营销推销。Carlone的团队开发了一个无触摸的台灯,旨在遵循用户的手动命令。该项目促使他从不同的角度考虑工程学。
他说:“这就像不得不说不同的语言。”“这是早日接触到超越工程泡沫并思考如何创建可能影响现实世界的技术工作的需求。”
卡隆(Carlone)留在都灵(都灵)完成博士学位。在机电一体化中。在那段时间里,他被赋予了选择论文主题的自由,他回想起“有点天真”。
卡隆说:“我正在探索一个社区被认为是被牢固理解的话题,许多研究人员认为无话可说。”“我低估了这个话题的确立程度,并认为我仍然可以为此做出新的贡献,我很幸运能做到这一点。”
所讨论的主题是“同时本地化和映射”,或者抨击生成和更新机器人环境地图的问题,同时跟踪机器人在该环境中的位置。
卡隆(Carlone)提出了一种重新构架问题的方法,使算法可以生成更精确的地图,而不必从初始猜测开始,就像大多数SLAM方法当时所做的那样。他的工作有助于开辟一个领域,大多数机器人认为人们做得比现有算法更好。
卡隆说:“大满贯是要弄清楚事物的几何形状以及机器人如何在这些事物之间移动。”“现在我是一个社区的一员,下一代的大满贯是什么?”
为了寻求答案,他接受了佐治亚理工学院的博士后职位,在那里他对编码和计算机视觉构想 - 回想起来,该领域可能受到了失明的刷子的启发:当他完成pH值时。D在意大利,他遭受了严重影响他的视力的医学并发症。
卡隆说:“一年来,我很容易失望。”“这让我思考了视觉和人造视力的重要性。”
他能够获得良好的医疗服务,并且状况完全解决,以便他可以继续工作。在佐治亚理工学院,他的顾问弗兰克·德拉特(Frank Dellaert)向他展示了在计算机愿景中编码的方法,并制定了复杂的三维问题的优雅数学表示。
他的顾问也是第一个开发开源大满贯图书馆的顾问之一,称为GTSAM,卡隆迅速被认为是宝贵的资源。更广泛地说,他看到,使所有人都可以使用软件,从而取得了整个机器人技术进步的巨大潜力。
卡隆说:“从历史上看,大满贯进展非常缓慢,因为人们保留了专有的代码,每个小组都必须从头开始。”“然后,开源管道开始弹出,这是一个改变游戏规则的人,这在很大程度上推动了我们过去十年来我们所看到的进步。”
在佐治亚理工学院之后,卡隆(Carlone)于2015年作为信息和决策系统实验室(LIDS)的博士后加入MIT。在此期间,他与航空和宇航员教授Sertac Karaman合作开发了软件,以帮助棕榈尺寸的无人机使用很少的车载电源来驾驭周围环境。一年后,他被晋升为研究科学家,然后在2017年,卡隆(Carlone)在Aeroastro中接受了教师职位。
“我在麻省理工学院爱上的一件事是,所有决定都是由以下问题驱动的:我们的任务是什么?这不是关于低级的收益。动机实际上是关于如何改善社会的,”卡洛恩说。“作为一种心态,这真是令人耳目一新。”
如今,卡隆(Carlone)的小组正在开发代表机器人周围环境的方法,而不是描述其几何形状和语义。可以这么说,他正在利用深度学习和大型语言模型来开发算法,使机器人能够通过高级镜头感知环境。
在过去的六年中,他的实验室发布了60多个开源存储库,全球成千上万的研究人员和从业人员使用。他的大部分工作都适合一个被称为“空间AI”的更大的新兴领域。
卡隆说:“空间AI就像猛击类固醇。”“简而言之,这与使机器人能够像人类一样思考和理解世界,这是有用的。”
这是一项巨大的事业,在使更直观的互动机器人能够在家里,在工作场所,道路上以及在偏远和潜在危险的地区提供帮助的方面,可能会产生广泛的影响。卡隆说,为了接近人类对世界的看法,将会有很多工作。
“我有2岁的双胞胎女儿,我看到他们操纵物体,一次携带10个不同的玩具,轻松地在混乱的房间上航行,并迅速适应新的环境。机器人的感知无法与幼儿可以做的事情相匹配,”卡隆说。“但是我们在阿森纳有新的工具。未来是光明的。”
该故事由麻省理工学院新闻(MIT News)重新发布(web.mit.edu/newsoffice/),一个受欢迎的网站,涵盖有关麻省理工学院研究,创新和教学的新闻。
引用:扩大机器人的看法,使人们对环境的意识更加像人类的意识(2025年,1月28日)检索2025年1月29日摘自https://techxplore.com/news/2025-01-robot-ception-human-anvareness-environment.html
该文档具有版权。除了为私人研究或研究目的的任何公平交易外,没有未经书面许可,可以复制部分。内容仅用于信息目的。