本篇文章3412字,读完约9分钟

机器之心报道

机器之心部

近日,瑞士 anybotics 企业打造的 anymal 机器人登上了新一期的《science robotics》封面,这款机器人的控制器可以使其穿越各种多而杂的环境,包括溪流、草地、雪地、碎石坡等,而且不靠摄像头、激光雷达等常见设备——平衡系统不需要任何外界新闻的输入,控制模型也不包含人类输入的规则。

热门:不用摄像头和激光雷达,四足机器人“凭感觉”越野:ANYmal登上Science子刊

腿式运动扩展了机器人的应用范围,但在地球上一点最具挑战性的环境中,大部分腿式机器人依然无能为力。

多年来,瑞士 anybotics 企业的团队一直在试图处理这个问题,他们的最新研究成果——《learning quadrupedal locomotion over challenging terrain》登上了新一期《science robotics》的封面。

在这篇论文中,他们提出了一种稳健的控制器,可以部署到 anybotics 旗下多种机器人中。有了新型控制器的加持,这些机器人可以轻松翻越溪流、草地、雪地、碎石坡等富有挑战的场景。

我们可以看到,这些机器人可以轻松走过小溪:

行走在林间,即使是草木丛生的不平坦地面:

在下坡的雪地上行走:

从有水流过的台阶爬下去:

在这样多而杂的环境中行走,对于人或动物来讲有时也会显得磕磕绊绊,要打造能如履平地的机器人,难度自不必说了。

「以前传下来的」控制做法已经不够用了

在不平坦的地形上,常规腿式运动做法做法使得控制架构越来越多而杂。多个情况都要依靠多而杂的状态机来协调运动原语和反射控制器的执行。为了触发状态之间的转换或反射的执行,多个系统都确定地预估状态,例如地面接触和滑行移动。这种预估一般是基于经验设置的,同时在存在诸如泥土、雪地或植被等未建模因素的情况下可能会变得不稳定。还有一点在脚部采用接触式传感器的系统,在野外条件下也会变得不可信。

热门:不用摄像头和激光雷达,四足机器人“凭感觉”越野:ANYmal登上Science子刊

总体来说,随着考虑越来越多场景,用于在崎岖等特殊地形上进行腿式运动的常规系统的多而杂性不断升级。在开发和维护方面变得非常困难,同时也容易出现控制器设计无法实现的情况(角落情况)。

近来无模型强化学习(rl)已经成为腿式机器人运动控制器开发中的一种替代做法。强化学习方向的观点是调整控制器以优化给定的奖励函数。优化是通过执行控制器本身获取的数据来执行的,这会随着经验的增加而改进。强化学习已经用于简化运动控制器的设计,自动化设计过程的每个部分以及学习之前的做法无法设计的行为。

热门:不用摄像头和激光雷达,四足机器人“凭感觉”越野:ANYmal登上Science子刊

但是,将强化学习用于腿式运动在很大程度上仅限于实验中的环境和条件。此前的研究实现了运动和恢复行为的端到端学习,但仅限于在实验室的平坦地面上进行。其他研究也开发了用于腿式运动的强化学习技术,但同样是在实验的环境中,首要集中在平坦或带有中等纹理的表面上。

热门:不用摄像头和激光雷达,四足机器人“凭感觉”越野:ANYmal登上Science子刊

anybotics 的研究者提出了一种稳健的控制器,用于在充满挑战的地形上进行盲四足运动。该控制器仅采用联合编码器和惯性测量单元的本体感受(proprioceptive)度量,这是腿式机器人上最耐用最可信的传感器。控制器的操作如下图所示。

热门:不用摄像头和激光雷达,四足机器人“凭感觉”越野:ANYmal登上Science子刊

该控制器被用于 anymal 四足机器人的两代版本中。四足机器人在泥土、沙子、瓦砾、茂密的植被、雪地、水中和其他越野地形中安全地小跑。

研究人员介绍说,这个控制器由一种神经互联网策略驱动,在模拟环境中进行训练。虽然没有任何现实世界的数据和精确的地形模型,该控制器仍然能克服野外的各种不规则地形。研究人员还强调说,「我们的系统可以穿越视频所示的全部地形,而且一次都没有摔倒。」

热门:不用摄像头和激光雷达,四足机器人“凭感觉”越野:ANYmal登上Science子刊

此外,这项研究中提到的做法并没有用到摄像头、激光雷达或接触式传感器新闻,只依靠本体感受传感器信号(proprioceptive sensor signal)来提高控制策略在不同地形中的适应性和稳健性。

先模拟,再实战

相比之下,对于有足机器人,我们对于波士顿动力旗下的产品更加了解一点,不过来自苏黎世理工的 anymal 其实一样能力强大。基于学习的运动控制器使四足 anymal 机器人能够穿越充满挑战的自然环境。

与此前的一点无模型强化学习腿式运动做法一样,研究人员先在模拟环境中训练了控制器,随后将训练结果迁移到现实世界中。一般,首先需要在虚拟环境中对物理条件进行建模,进而参数随机化。

苏黎世理工的研究人员发现,这种做法对于更加崎岖的地形效果不佳,因为此研究人员引入了一点其他做法。首先在模型上,新做法没有采用在机器人当前状态的快照上运行的多层感知器(mlp),而是采用了序列模型,特别是感受状态的时间卷积互联网(tcn)。新做法没有采用显式的接触和滑动预估模块,相反的 tcn 会根据诉求从本体感受历史中隐式地推理出接触和滑动事情。

热门:不用摄像头和激光雷达,四足机器人“凭感觉”越野:ANYmal登上Science子刊

实现优化结果的第二个关键在于特权学习(privileged learning),研究人员发现直接通过强化学习训练出的越野运动策略并不成功:控制信号稀疏,同时所输出的互联网无法在合理的时间内学习出正确的运动。新的模型在训练中分为两个阶段,首先训练教师策略,该策略可访问特权新闻——真实情况(ground-truth)及机器人接触的情况,随后教师指导纯本体感受的学生控制器学习,后者仅采用机器人本身可用的传感器新闻。

热门:不用摄像头和激光雷达,四足机器人“凭感觉”越野:ANYmal登上Science子刊

这种特权学习会在模拟环境中启用,但最终学习到的策略可以在模拟环境,以及真实的物理环境中部署。

第三个概念对于实现其鲁棒性非常重要。该教程根据控制器在训练过程不同阶段的表现,对不同地形进行自适应。本质上,控制器会经历各种合成地形的考验,并且变得更具鲁棒性。研究者判断了参数化地形的可通行性,并采用了粒子滤波来维持中等难度地形参数的分布,以适应神经互联网的学习。训练环境的挑战性逐渐增加,促使了这种敏捷性与弹性兼具的各个方面控制器的诞生。

热门:不用摄像头和激光雷达,四足机器人“凭感觉”越野:ANYmal登上Science子刊

借助腿式运动控制器,机器人可以穿越一点现有做法无法到达的多而杂地形。该控制器拥有在零样本环境中的泛化能力,即使遇见训练过程中未见过的条件,仍然具备鲁棒性。

研究者在模拟训练中只采用了刚性地貌和一组由程序生成的地形剖面,比如山丘和台阶。然而,当控制器被部署在四足机器人上时,它能够成功应对可变化地形(比如泥土、苔藓、雪地)、动态立足点(比如在杂乱室内环境踩到滚动板、田野中的碎片)和地面障碍物(厚植被、碎石、涌出的水)。

热门:不用摄像头和激光雷达,四足机器人“凭感觉”越野:ANYmal登上Science子刊

从研究结果来看,不需要进行艰苦的建模过程,以及危险且高价钱的实地测试,物理世界的极度多而杂性也可以被克服。这一做法或许会引领未来腿式机器人的快速发展。

更适合多而杂环境,更适用于真实世界

在四足机器人行业里,名头更响的波士顿动力 spot 已在今年开卖了,目前全球已卖出约 300 台,不过人们在采用 spot 的时候会遭遇一点「翻车」情况。

对于面向工业场景的客户来讲,稳定性至关重要,在这方面不知 anymal 的机器人是否越来越强大。在今年 6 月,这家企业的机器人也已向客户交付了自家的四足机器人 anymal c。

anymal 机器人由 anybotics 企业打造。anybotics 成立于 年,是瑞士苏黎世联邦理工学院的衍生企业,致力于开发工业应用的移动机器人技术。该企业表示,其自动腿式机器人的设计目的是处理顾客在具有挑战性的环境中遇到的问题。该企业已经在多家应用中进行过 anymal 机器人的成功测试,如在北海上进行的首例离岸机器人测试。

热门:不用摄像头和激光雷达,四足机器人“凭感觉”越野:ANYmal登上Science子刊

anybotics 的团队表示,他们从事腿式机器人的研究已经超过 10 年,如今又根据工业诉求重新对 anymal 机器人进行了设计。他们的研究核心是设计出强大的扭矩可控制动器,使得机器人能够爬上陡峭的楼梯,可信地承受各种环境变化带来的压力。

热门:不用摄像头和激光雷达,四足机器人“凭感觉”越野:ANYmal登上Science子刊

在过去的十年中,anymal 系列机器人也经历了一系列的更新换代和技术改革创新,从最初的 anymal alph 到 anymal beth、anymal b 再到如今的 anymal c。经过数次迭代,anymal 变得越发强大。

论文链接:robotics.sciencemag/content/5/47/eabc5986

© the end

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin喜欢此文案的人还喜欢

原标题:《不用摄像头和激光雷达,四足机器人「凭感觉」越野:anymal登上science子刊封面》

阅览原文

/] 【专题】一线科学技术大v矩阵,硬核解读前端动态 [/h

来源:搜狐微门户

标题:热门:不用摄像头和激光雷达,四足机器人“凭感觉”越野:ANYmal登上Science子刊

地址:http://www.shwmhw.com/shxw/67204.html