7 月 20 日消息,根据外媒 Tech Xplore 报道,位于德国斯图加特的马克斯普朗克智能系统研究所(MPI-IS)发明了一只有四条腿的小机器狗 Morti,它可以在每次跌倒后调整走路姿态,自主学习如何行走。

阐明该技术的论文《Learning Plastic Matching of Robot Dynamics in Closed-loop Central Pattern Generators》(在闭环中央模式生成器中学习机器人动力学的塑料匹配)已于 7 月 18 日在《自然・机器智能》杂志上发表,该论文的第一作者是菲利克斯・鲁珀特(Felix Ruppert)。

鲁珀特说:“我们研究的机器狗 Morti 具有跟动物相同的反射能力,可以自主从失败中学习如何走路。”

▲ 机器狗 Morti

一、摔倒后再爬起,Morti 可模仿动物学习

人类和动物的脊髓中都有一个叫做 CPG(中枢模式发生器)的神经元网络。CPG 可以帮助生物完成节律性的任务,如走路、眨眼或消化等。这种神经元网络不需要大脑输入信号,就可以产生周期性的肌肉收缩。

鲁珀特在 Morti 的背部安装了一个虚拟脊髓来模拟 CPG 的作用,并在这个虚拟脊髓中安装了样本数据库。Morti 平稳行走时,机器人脚上的传感器数据会不断与 CPG 样本库中的数据进行比较,以提供合适的走路姿势。

如果机器人摔倒了,学习算法会通过改变腿来回摆动的距离和速度来优化行走方式。在机器学习的过程中,CPG 会发送一些自适应的运动信号,来让机器人行走得更平稳。该机器学习过程的核心就是要改变 CPG 的输出信号,并监测机器在什么情况下会遇到磕绊。

▲ Morti 根据反馈数据优化行走

Morti 模仿了小动物学习走路的过程,它们都是在不断跌倒后,才能找到最有效的肌肉使用方式,学会行走。鲁珀特说,一开始,Morti 会摔倒,但大约一个小时后,算法就会帮 Morti 找到最好的行走方式。鲁珀特还说:“目前我的团队正在为 Morti 增加更多的传感器,扩大 Mortimer 的运动范围。我们想让 Morti 更像动物。”

二、高效节能,Morti 行走一小时后能耗减少 42%

行走同样的距离,目前大多数工业四足机器人需要几十上百瓦的电量,Morti 却只需消耗 5 瓦电量。

这一方面是因为工业四足机器人有更大的体积和重量,需要更多的电量支撑行动,另一方面是因为 Morti 的算法更加智能。

一般的机器人行走时,机器学习会通过大量计算,预先设计每条腿运动的细节,这会消耗大量的电量。但是 Morti 在走路跌倒后,可以根据新的算法结果,重新调整走路的角度。Morti 通过这些反馈数据来学习行走方式,不需要进行大量计算。Morti 可以在学习走路的过程中降低能量消耗。研究发现,在 Morti 行走一个小时后,它消耗的能量比刚开始走路时减少了 42%。

▲ Morti 在跑步机上行走

德克萨斯大学圣安东尼奥分校的教授迪瑞莎・库迪蒂普迪(Dhireesha Kudithipudi)表示:“通常而言,人工智能可以很好地学习一项特定任务,但人工智能无法在环境变化时进行重新校准。而 Morti 可以根据数据反馈自主调整自己的运动模式,它在重新校准环境方面可能会表现得更好。”

结语:结合人工智能与生物领域,探索机器人的更多可能

鲁珀特的机器狗可以通过人工智能算法,像生物一样进行自主学习。这不仅结合了机器学习技术,也涉及到了生物领域。

如果这种技术可以大规模使用,将会有两个好处:第一,机器学习会更加节能,消耗的能量更少。机器不必再根据大量的数据进行暴力计算,而是可以通过自主学习变得更加“聪明”。第二,这种技术可以为人工智能领域和生物领域的结合带来启发。

目前,这种技术可以让机器狗变得更像动物。未来,随着这种技术的发展,机器人可能会变得更像人类。

科技前沿:算法让机器狗在一小时内学会走路

智能机器人像新生动物一样,一个四足机器人在第一次尝试行走时会绊倒。但是,虽然小马驹或长颈鹿需要更长的时间才能掌握行走,但机器人只需一个小时就能学会流畅地向前移动。计算机程序充当动物脊髓的人工演示,并学习在短时间内优化机器人的运动。人工神经网络在开始时尚未进行理想调整,但可以快速自我调整。

新生长颈鹿或小马驹必须学会用腿走路,以尽可能快地避开捕食者。动物天生具有位于脊髓的肌肉协调网络。然而,学习腿部肌肉和肌腱的精确协调需要一些时间。最初,幼年动物严重依赖硬连线脊髓反射。接下来,必须练习更先进和精确的肌肉控制,直到神经系统最终很好地适应幼年动物的腿部肌肉和肌腱。

斯图加特马克斯·普朗克智能系统研究所(MPI-IS)的研究人员进行了一项研究,以了解动物是如何学会走路和从绊倒中学习的。他们制造了一个四条腿、狗大小的机器人,帮助他们了解细节。

MPI-IS动力运动研究小组的前博士生菲利克斯·鲁佩特(Felix Ruppert)说:“作为工程师和机器人专家,我们通过制造一种具有与动物一样的反射功能并能从错误中学习的机器人来寻找答案。但是如果它经常绊倒,它会给我们一个衡量机器人行走能力的标准。”

Felix Ruppert是《在闭环中央模式生成器中学习机器人动力学的塑料匹配》一书的第一作者,该书于2022年7月18日发表在《自然机器智能》杂志上。

学习算法优化虚拟脊髓

在一个小时内学会走路后,鲁佩特的机器人很好地利用了其复杂的腿部力学。贝叶斯优化算法指导学习:测量的脚部传感器信息与作为程序在机器人计算机中运行的模拟虚拟脊髓的目标数据相匹配。机器人通过不断比较发送的和预期的传感器信息、运行反射回路和调整其电机控制模式来学习行走。

该学习算法适应中央模式生成器(CPG)的控制参数。在人类和动物中,这些中央模式发生器是脊髓中的神经元网络,在没有大脑输入的情况下产生周期性肌肉收缩。中央模式生成器网络有助于生成有节奏的任务,如行走、眨眼或消化。此外,反射是由连接腿部传感器和脊髓的硬编码神经通路触发的非自愿运动控制动作。

只要小动物在一个完全平坦的表面上行走,中央肌电图就足以控制来自脊髓的运动信号。然而,地面上的一个小肿块改变了行走。反射开始并调整动作模式,以防止动物摔倒。运动信号中的这些瞬时变化是可逆的,或“弹性的”,并且在干扰后,运动模式恢复到其原始配置。

但是,如果动物在许多运动周期中没有停止跌跌撞撞——尽管有积极的反射——那么必须重新学习运动模式并使其“可塑”,即不可逆。在新生动物中,CpG最初调整得不够好,动物在平坦或不平坦的地形上蹒跚而行。但是,这种动物很快学会了它的中央处理器和反射如何控制腿部肌肉和肌腱。

拉布拉多大小的名为“莫蒂”的机器狗也是如此。更重要的是,机器人在大约一个小时内比动物更快地优化其运动模式。莫蒂的中央处理器是在一个小而轻的计算机上模拟的,该计算机控制着机器人腿的运动。这个虚拟脊髓被放置在四足机器人的背部,头部所在的位置。在机器人顺利行走所需的一小时内,来自机器人脚的传感器数据会不断与机器人的中央处理器预测的预期着陆进行比较。如果机器人绊倒,学习算法会改变腿来回摆动的距离、摆动的速度以及腿在地面上的长度。调整后的运动也会影响机器人如何更好地利用其柔顺的腿部力学。在学习过程中,中央处理器发送适应的电机信号,使机器人从此减少绊倒并优化其行走。在这个框架中,虚拟脊髓没有关于机器人腿部设计、电机和弹簧的明确知识。由于对机器的物理一无所知,它缺少一个机器人“模型”。

Ruppert解释说:“我们的机器人实际上是‘天生’的,对腿的解剖结构或工作方式一无所知。CPG类似于自然界提供的内置自动行走智能,我们已经将其传输到机器人。计算机产生控制腿部电机的信号,机器人最初行走和绊倒。数据从传感器返回虚拟脊髓,在那里比较传感器和CPG数据。如果传感器数据与预期数据不匹配,学习alg算法改变行走行为,直到机器人行走良好,没有绊倒。在保持反射活跃和监测机器人步履蹒跚的同时,更改中央处理器输出是学习过程的核心部分。”

节能机器人狗控制

莫蒂的电脑在行走过程中只消耗5瓦的电力。知名制造商生产的工业四足机器人已经学会了在复杂控制器的帮助下运行,因此耗电量要大得多。他们的控制器用机器人的精确质量和身体几何形状的知识编码——使用机器人模型。它们通常需要几十瓦,甚至几百瓦的功率。这两种机器人都能动态高效地运行,但在斯图加特模型中,计算能耗要低得多。它还提供了对动物解剖学的重要见解。

亚历山大·巴德里·斯普罗维茨(AlexanderBadri Spr witz)说:“我们不容易研究活动物的脊髓。但我们可以在机器人中模拟一个。”他与鲁佩特(Ruppert)共同撰写了这本出版物,并领导着动态运动研究小组。“我们知道许多动物中都存在这些CpG。我们知道反射是嵌入的;但我们如何将两者结合起来,使动物通过反射和CpG学习动作?这是机器人学和生物学交叉点的基础研究。机器人模型为我们回答了生物学本身无法回答的问题。”