当我们提及“机器人”这一概念时,通常将其分为广义上和狭义上的机器人。广义上的机器人门类众多,只要具备一定决策能力,在学术界里就能被称为机器人,例如智能洗衣机、智能语音助手。而狭义上的机器人则需要符合我们的刻板印象:不仅要有决策能力,还需要能说会道,更重要的是能够移动。
……
在科幻作品中,机器人几乎已成为一种必备元素和背景,我们似乎都习惯了它们可以像人一样行走、说话和思考,因而理所当然地产生出一种错觉:机器人离我们不远了。特别是这两年内ChatGPT的出现,更加深了这种乐观的错觉。实际上,机器人最基本的一项能力依旧是学术界的难题,那就是行走,换句话说,就是运动能力。
……
本文将带领大家从“行走”的角度纵览机器人的前世今生及其发展过程中的节点与里程碑。
这就跟着机器人ANYmal-2098逛展,进入一场机器人的“寻根之旅”吧~
经过第一个展区,机械手将ANYmal-2098的机器大脑拆下,安在了一辆叫作Shakey的三轮机器人上。解说芯片开始自动灌入知识:它有两个主动轮、一个从动轮,配备了电子摄像机、三角法测距仪、碰撞传感器与驱动电机,由斯坦福研究所(SRI)在1966—1972年之间开发,是世界上第一台移动机器人,却需要数小时的感知与规划才能做出行走决策。
1.里程碑式的单腿机器人
天花板上跟随他的机械臂拆下他的大脑,安在了一只单腿机器人上。ANYmal-2098看着自己的样子,不禁高呼,这是他们腿式机器人里程碑式的开端。3D One-leg Hopper(三维单腿跳跃者)是由MIT的LegLab实验室在1983年开发的一款单腿机器人,该实验室由马克·雷波特(Marc Raibert)领导,他成立了后来大名鼎鼎的波士顿动力公司(Boston Dynamics)。
*3D One-leg Hopper(附视频扫码演示,前27秒)
2.由四个单腿机器人组成的四足机器人
ANYmal-2098“气喘吁吁”地蹦上了几十级台阶,来到展馆的二楼,天花板的机械臂将他的大脑拆下,又安在了一只四足机器人身上。这只四足机器人就像是由四只刚才的单腿跳跃者拼凑而成,四条腿都是如出一辙的弹簧腿,它是由MIT LegLab在单腿跳跃者的研究基础上所开发的,是四足机器人的发展里程碑。
3.MIT Mini Cheetah (MIT仿生机器人实验室的集大成之作)
ANYmal-2098被安在了一台Mini Cheetah的身上,他的四条腿不再是弹性十足的弹簧腿了,而是换成了由电机和机械连杆组成的“肘弯式”腿,就像人类的弯曲手臂撑在地上似的。他的每条腿都有三枚无刷电机,每枚电机都内嵌到行星齿轮箱中,可以在紧凑的空间结构中达到目标的减速比,最终获得理想的关节扭矩和转速的搭配范围。
*MIT Mini Cheetah(附视频扫码演示)
……
4.波士顿动力公司的集大成之作Spot Mini
机械臂将他安在了由波士顿动力公司开发的Spot Mini身上。他脱下Mini Cheetah银白色的“学院服”,换上了一身亮黄色的“工业套装”。他此刻就是当初那台在21世纪上半叶叱咤过互联网、震惊过八方的Spot Mini,由马克·雷波特领导的明星机器人公司波士顿动力一手开发,而马克·雷波特就是最早开发单腿跳跃者的LegLab实验室的领导者。这台Spot Mini是他本人用几十年的技术积累沉淀而成的工业结晶,是四足机器人领域的集大成之作。
……
5.苏黎世联邦理工的ANYmal-C
天花板导游二话不说,用机械臂将他挪到了一台ANYmal-C身上,并告诉ANYmal-2098,这关他要像谍战片里的特工一样摆出合适的姿势,在不碰到光线的情况下成功越过。
ANYmal-2098双眼放出精光,他从上到下打量自己,激动之情油然而生,他终于找到自己的祖师爷了!ANYmal-C正是他自己这款型号的开山鼻祖,他只从影像资料见过照片,没想到有一天竟然可以摇身变成这位八十年前的祖先。
……
6.MIT的人形机器人MIT Humanoid
天花板的机械臂抓来了一只银白色的机器人,放在他们面前,ANYmal-2098定睛一看,发现这不就是之前的那只Mini Cheetah吗?合着还是让我当狗呀!他恼羞成怒地盯着天花板,“你在逗我吗?这不还是——”
天花板导游打断他,“别急,你看。”
这只“Mini Cheetah”忽然站起来了。这是MIT的仿生机器人实验室基于Mini Cheetah的技术,沉淀开发的一款人形机器人,MIT Humanoid,硬件和外观都和Mini Cheetah一脉相承,难怪一开始趴在那儿引起了ANYmal-2098的误会。机械臂将ANYmal-2098安在MIT Humanoid上,他终于回到自己最熟悉舒服的姿态了。他正要大摇大摆迈起步,却晃晃悠悠地踉跄了几下,他这才意识到七八十年前技术水平的局限,特别是人形机器人上的技术。MIT Humanoid运动模块中的算法开始灌入他的大脑,嵌入他的思维。
7.本田技术研究所的阿西莫(双足机器人的奠基者)
这是本田技术研究所投入二十余年心血的结晶,阿西莫(ASIMO)的名字意为高级步行创新移动机器人(Advanced Step Innovative Mobility)。从2000年诞生,到2022年退役,历时22年,是全球最早具备双足行走能力的类人机器人(与双足机器人概念不同)。此刻ANYmal-2098所安置的是第三代阿西莫,是阿西莫最高级的版本,全身具有57个自由度,即57枚电机,每条腿各有6枚电机,3枚在髋关节,3枚在膝关节,最后1枚在踝关节。身高1.3米,体重48千克。
8.波士顿动力公司的阿特拉斯(ATLAS)
机械臂又将他拆到了一只又高又壮的人形机器人上,这下ANYmal-2098自信了,他看着自己挺拔的胸肌,乐呵了起来,这可是阿特拉斯——波士顿动力公司几十年来在双足机器人上的集大成之作!不同于原先的关节电机控制,阿特拉斯的关节都由液压驱动,可谓力拔山兮。它的形象也更符合科幻片里对机器人的幻想:工业风的机身硬件、更加舒服的身材比例、腿细体壮,活脱脱一个倒三角“肌肉男”。
他此刻所在的阿特拉斯从2011年推出,到2024年退役,历经3代,最终版本身高1.5米,体重85千克,相比刚才的阿西莫,确实可以算是“又高又壮”了。
……
9.俄勒冈大学开发的“鸵鸟腿”双足机器人卡西(Cassie)
卡西由美国俄勒冈大学的Agility Robotics公司开发,和常规类人的腿部结构不同,它的腿部结构和鸵鸟相似。ANYmal-2098这下只剩下半身,像只拦腰斩断的鸵鸟,在地上着急忙慌地奔来走去……
1.荷兰艺术家泰欧·扬森(Theo Jansen)发明的风动力仿生兽。
机械臂将ANYmal-2098安在一只奇形怪状的木制机构上,他两侧的腿不再是原先机器人的腿部结构,而是一连串连杆,更像是某种艺术制品。解说芯片告诉他,这叫泰欧·扬森式腿,是七连杆结构,通过单一电机带动输入端的连杆,经过复杂的连杆间互相作用,从而带动输出末端作为脚掌的连杆。
这是由荷兰艺术家泰欧·扬森创造的一种用于腿部行走的连杆机构,专门用在他创造的“海滩仿生兽”上,凭借单一电机动力,就能在机构的末端获得优美顺滑的足端迈步曲线。
……
2.被动式机器人(Passive Walking Robot)
ANYmal-2098来到一条斜坡前,驻足停留的片刻间,又被安在了一只无任何动力源的被动式机器人身上,该机器人由康奈尔大学在1999年到2001年之间开发,截止到2024年,它仍然是步态最自然、行走最平稳的被动式机器人。
3.Minitaur机器人
ANYmal-2098自动缓行出坡道,来到了平面,转眼间又被机械臂拆下,安在了Minitaur身上。这又是一只四足机器人,但它的四条腿就像四支菱形支架。
这类腿由两个电机控制,不同于第二个展区腿式机器人展现的“开环式”机械腿,这种腿在结构上被称为“闭环式”或“并联式”,优点为速度快,足端位置精准,指哪儿打哪儿。工业机器人中的“蜘蛛手”机械臂也是这类并联式结构。
*由宾夕法尼亚大学开发的Minitaur机器人(附视频扫码演示)
4.适合在沙漠山地上行走、翻越各种障碍物的RHex机器人
很快,天花板抓来一只机器人,乍一看,ANYmal-2098以为又是一只四足机器人,定睛一瞧,才发现它竟然长了六条腿。这只六足机器人叫RHex,第一台样机由美国国防部高级研究计划局(DARPA)在1999年开发。
它的腿采用的是一种介于轮子和足式之间的结构,每条腿的电机都安了一根具有弹性的半圆弧曲腿,六条腿的电机只需要按不同的相位错开旋转,就可以配合得天衣无缝,能翻越各种地形。
ANYmal-2098来到一处沙坑前,里头是一片小沙丘,他开动六条腿,扒拉起沙面往前行进。他不仅翻越了沙丘,还碾过了坑中的各种岩石和树桩,如履平地。他调节起六条腿之间的各种相位,尝试了多种多样的步态配合,有只有一条腿在空中摆动而其余腿都接触地面的漫步步态(Amble),还有效率最高的每次动三条腿的小跑步态(trot)。
*由宾夕法尼亚大学开发的RHex机器人(附视频扫码演示)
天花板的机械臂又抓来几只安了轮子的双足人形机器人,ANYmal-2098调用他们的身子玩了一会儿。他在平地上靠转动轮子,以低能耗的方式驱动自己前进,遇到障碍物或者楼梯时,自己又可以抬起双腿攀越,他觉得自己就像一名穿着两排轮滑鞋的旱冰玩家,在新奇有趣的体验中,他结束了第三个展区短暂的旅程。
*苏黎世联邦理工RSL实验室开发的轮足机器人ANYmal-C
*波士顿动力公司开发的用于仓储搬运的轮足机器人Handle
*腾讯Robotics X实验室开发的轮足机器人Ollie,腿部结构和第三个展区的Minitaur机器人一样,也是并联机构,但是在足端加上了轮子。
“第四个展区象征着机器人发展史上的里程碑节点,是机器人在运动方面由机械、死板和局限走向智能、灵活和无限的分水岭,机器人开始真正逼近人类的机动性。”天花板导游语气庄重。
“第四展区的展品依旧是腿式机器人,但它们运动模块中内嵌的不再是第二展区那种传统的‘基于规则’(rule-based)的算法了,而是‘基于学习’(learning-based)的算法,是21世纪上叶火遍计算机学界和机器人学界的强化学习算法。”解说芯片将补充信息告诉ANYmal-2098。
在这里,你将看到Google Deepmind的强化学习算法,疯狂但又最优的跑步姿势;苏黎世联邦理工的ANYmal-C(强化学习版本);还能了解到机器人在走路时“腿”为什么伸不直……
“奇点(Singularity)”这个词经常出现在科学科幻领域中,但意思各有不同。在天文学领域,有黑洞的奇点,还有宇宙大爆炸的原初奇点;在人类技术发展领域中,有象征着人机结合时刻的奇点;而在机器人算法领域中,也存在一种数学概念的奇点。
在机器人的传统动力学算法中,当机器人的关节角度越接近伸直的瞬间,动力学算法的误差会越大,控制算法越不稳定。文中,在第二个展区的人形机器人区,ANYmal-2098试图在往前迈步的瞬间伸直膝盖,却摔了个四仰八叉,就是因为它的膝盖处于完全伸直的状态,小腿和大腿之间的关节角度接近180°。学术界将这种瞬间称为动力学上的“奇点(singularity)”,代表机器人的腿部此刻已经达到“无法完全控制”的状态了。想象一下,机器人的一条腿或者一条手臂完全竖直,就像一根直杆,如果我们让它的脚或手臂再沿着直杆方向往前伸长1厘米,机器人办得到吗?办不到,因为机器人的腿已经完全伸直了,1厘米之外的空间已经处于它的“工作空间”(workspace)之外了,所以我们说此刻的腿部是“无法完全控制”的状态,这就是动力学上的“奇点”,这个瞬间,控制算法达到了不可控的边缘。如果因为行走过程中的晃动,导致膝盖反关节旋转任何一丝丝微小的角度,那么机器人的算法就会“崩溃”,从而让发送给关节电机的信号变得一团糟,摔他个四脚朝天。
但人类为什么不会受到同样的困扰呢?因为人类和机器人使用了截然不同的两种运动控制算法。
人类用的更像是进化算法,是几百万年的历史演化而来的一种算法,而21世纪上叶这些机器人用的是以物理学为基础的动力学算法。用一个类比的话,那就是人类在行走这个能力上,就像是用大数据训练出来的大语言模型,是靠不断学习、试错和反馈塑造的;而这些机器人在行走上就像是古老经典的语音助手,按照一些设计好的语言规则来划分它听到的内容并给出回复,那时的机器人学界一般称这种主流机器人控制算法为“基于规则”的算法,而人类是“基于学习”的算法。
再回到伸直膝关节的问题。我们知道这些基于规则的控制算法是动力学,而动力学涉及很多数学中的三角函数运算,比如sin、cos。伸直膝盖时,小腿和大腿的关节角度一般是180度或者90度(取决于你从哪里开始标定零点)之类的这种以90为倍数的角度值,而这类角度在三角函数中是很特殊的,比如sin(90°)=1,cos(90°)=0,sin(180°)=0。在三角函数互相嵌套的动力学公式中,机器人膝盖伸直时,sin(180°)一旦出现在分母的位置,分母为0,整个计算就崩掉了,所以当我们观察机器人将关节逐渐伸直过程中的动力学计算步骤时,会发现其中一些中间步骤的计算值会越来越大,因为分母趋于0,整体就趋于无穷大,再配合上计算机的浮点精度限制,大数之间的加减乘除运算误差就会特别大。
但人类在行走时则是完全凭着千百万年进化而来的直觉在运动、舒张,人类不会在脑袋里面去事先算好三角函数,求解动力学,然后才去做出动作。当人类把脚往前迈一步,就是凭直觉往前大胆而又自然地迈一步,这都是刻在基因中的隐性的学习算法在起作用。
后来学术界也受到了学习算法的启发,越来越多的研究者开发出了基于学习的机器人控制算法,这类算法就是后来大火的“强化学习”,在第四个展区中就有所展示。未来某一天,当基于学习的控制算法成熟之后,机器人就可以无视之前所说的动力学计算限制,像人类一般行动自然,并肆意妄为地伸直身体关节,直膝行走,抑或是直拳出击。目前学术界在这方面的研究已经处于进行时,并取得了重大突破。但这些要建立在机械部件不易受损的前提下,因为除了“奇点”以外,早期机器人行走时膝盖总是弯曲还有其他几个小原因,比如膝盖伸得越直,腿部的机械传动零件就越靠近它们的机械限位,而频繁地靠近机械限位会让零部件磨损得很快,这需要我们开发出更轻巧结实的结构件材料。另外,膝盖越直,就意味着机器人的重心越高,这样行走起来越不稳定,对控制算法要求就越严苛,但这是算法层面可以解决的事,在未来的强化学习等更加智能的算法面前,都将被顺利攻克。