OC

Knowledge OS
鹦鹉螺口语
观看:人形机器人在网球方面出人意料地出色
2026-03-19 08:29:16 · 英文原文

观看:人形机器人在网球方面出人意料地出色

作者:By Loz Blain

这不是远程操作。中国研究人员测试了一种新的、更快、更简单的方法来教机器人打网球,结果看起来像是机器学习和现实世界人工智能的突破。

成为一名体面的运动员需要什么?首先,要有高度准确的感知能力,再加上大量的身体灵活性、出色的预测能力、快速的反射反应、对角度的第六感,以及针对特定运动的大量技术。

后者对机器人研究人员来说是一个挑战。在网球运动中,就像在大多数运动中一样,可穿戴动作捕捉技术很难处理网球运动员在比赛中跑动的距离,而且还无法读取手腕角度的细微差别以及区分好击球和坏击球的其他因素。这种情况太过动态,无法进行远程操作。

并尝试使用人工智能训练软件从多摄像机电视片段中推断出这些东西nVidia 的 Vid2Player3D......嗯,根据张等人的说法,新研究,这是一个“复杂的管道”,“可能需要大量的专业知识和工程工作”。

该团队的新 LATENT 系统可以追溯到动作捕捉,但仅用于技术构建块,并且它旨在处理不完美的数据。实际上,在当前的实验中,研究人员采集了大约五个小时的动作捕捉数据,其中人类运动员展示了网球所需的“原始技能”:正手、反手、侧向拖步和交叉步,这些数据在全尺寸网球场的一小部分区域内执行。

我们从不完美的人体运动数据中学习潜在动作空间,并训练高级策略以从中采样以完成任务。我们提出了两种新颖的设计,使高层政策能够有效地纠正和弥补该领域不完善的原始技能。pic.twitter.com/wcun1iYpvN

– 张志凯 (@Zhikai273)2026 年 3 月 15 日

他们对这些动作捕捉进行处理,创建了一系列类似人类的“动作空间”,然后将这些基本技能加载到机器人中——在本例中,Unitree 的 G1 人形机器人,你在任何地方都可以看到它可以做从舞蹈到跆拳道的所有事情,而且现在它的起价相当疯狂,约为 13,500 美元。

实际上,潜在系统或多或少地告诉机器人“好吧,这就是你应该如何移动”。现在,使用与上述类似的动作,您的任务是看到网球飞来,然后用球拍将其击过网。成功就是球落在球场另一侧的白线内。”

有了这些可供选择的基本技能和动作,机器人就可以尝试所有其余的细节;角度、时间、使用哪些动作用于何种目的以及何时移动到训练动作之外。绝大多数学习都是在模拟中以大大加快的速度完成的。

现实世界的结果呢?好吧,G1 的正手回球成功率约为 90%,反手回球成功率略低于 80%,而且看起来非常敏捷、流畅,而且……非常像网球运动员。检查一下:

显然,温布尔登还没有做好准备。事实上,它还没有准备好进行任何形式的竞争性比赛。但对于早期的努力来说,这代表着显着的进步。

在我看来,用不了多久,一个十级中国机器人将成为一个相当不错的网球训练伙伴,并且道路正在逐渐铺平,走向一个世界,最好的职业网球运动员击败这些东西的机会就像国际象棋大师击败人工智能对手一样多。

当然,职业网球运动员并不完全是人们迫切希望机器人取代的那种例行公事、重复性的工作。但机器人将获得人类从运动中获得的一些相同的好处——它们将学会在极端环境下控制自己的身体,处理复杂和高度动态的情况,以在更实际的任务中有用的方式……比如说,用阿加西级别的风格和天赋殴打抗议者的头部!

LATENT 软件是开源的,可从以下位置获取:吉图布

关于《观看:人形机器人在网球方面出人意料地出色》的评论

暂无评论

发表评论

摘要

中国研究人员开发了一种名为 LATENT 的新系统,用于使用不完美的动作捕捉数据来教机器人打网球。通过将人类动作分解为正手和反手等基本技能,该系统使机器人能够在现实场景中学习和适应这些动作。经过训练,Unitree 的 G1 人形机器人的正手成功率约为 90%,反手成功率略低于 80%。尽管在专业水平上尚未具有竞争力,但这一突破标志着在创造能够执行复杂体力任务的高级机器人运动员方面取得了重大进展。LATENT 软件可在 GitHub 上获取。