“社会上所有东西都在不断变得像人”。日本机器人专家石黑浩在大受好评的纪录片《最后的讲义》中早已给出了答案。
在清宝引擎机器人(以下简称“清宝”)的车间,当你伸出自己的手与机器人的手进行比较时,皮肤纹理、手型结构、指甲色泽等细节已然真假难辨。这还是一只属于“机器人”的手吗?难道我们已经身陷传说中的“恐怖谷效应”而不自知?
所谓“恐怖谷效应”是指当机器人与人类的相似程度达到一定程度的时候,人类就会突然变得反感与害怕它们。清宝在其官网上,赫然写着“专注于仿人机器人”,现在那些最先被大家熟知的机器人,或许还只能算得上是个“无脸侠”。
在2021年创立清宝之前,王磊在一家上市公司担任集团副总裁,负责工业机器人和自动化产线。车间的实况是,工业机器臂固定在流水线上,日复一日从事着搬运、码垛、焊接的工作。2017年,高度仿真人形机器人索菲亚(Sophia)的问世,打开了王磊的灵感之门。索菲亚有着几乎和人类一样的外观,不仅有逼真的皮肤纹理,还能完成大量的人类表情。“为什么自己不能研发一款呢?”
王磊眼中的人形机器人,不仅能与人交互,辅助人类工作,还能时不时地提供情绪价值。石黑浩曾在丹麦和日本做过一个实验,当人们面对机器人时,会自然放松地交流,尤其是自闭症儿童或者老年痴呆症患者,与人形机器人的交流更为放松。而实现这些目标的前提是,机器人的外形看起来得更像一个人类。
当前,不少银行、酒店已经部署了机器人,但王磊认为,那只不过是人与屏幕在交互,而
当一个外形更像人类的机器人出现时,人与机器的交互频次会增加。
王磊说:“外形美观能为人提供外在的情绪价值。但是要让机器人像人类一样好看,其实是非常困难的,每个人对‘好看’的定义也不尽相同。”
由于外观友好至关重要,清宝规划了一些人形机器人的设计原则。
确立身形黄金比例。在设计机器人之初,王磊对机器人的身材特征颇为纠结。头身比例多少为美?公司请来超模,按其身材比例进行设计。不断摸索之后,清宝逐渐找到一个黄金比例,即头部占比1/5,上身占比1/3。“机器人外观不美的原因往往是身材比例没有达到黄金比例标准。我们调整了身材比例后,哪怕穿上衣服,也很有时尚感。”王磊说。
让眼睛“暗送秋波”。机器人长着怎样的脸才算美,这是一个见仁见智的问题。在各方均无共识的情况下,不如先从眼睛入手。“我们观察一个人,主要是看对方的眼睛,这是机器人像人的重要元素之一,因而眼睛要做得美丽、真实、有灵性。”眼睛若有神采,便会呈现顾盼流离之姿,王磊甚至希望眼睛能够“暗送秋波”。然而这是一个整体的概念,需要从眼睛到眉毛、皮肤、嘴唇整体联动和配合,这背后需要有高级算法以及仿真数据或人类世界真实数据的支持。“人类的情感非常丰富,也非常难开发。人类的表情没有标准,我们需要自行完成一些经典的表情动作。”王磊表示。
清宝将微型高清摄像头装在机器人的瞳孔中,与眼球合为一体,加上美瞳后看起来更为真实。为了让机器人的眼球和眼眶有更好的贴合度,清宝开发了无限贴合技术。
机器人眨眼也是一个难题。有些技术在实验室里表现很好,但在商业化应用时往往会出问题。眨眼动作需要与五官联动,然而,人类眨眼的频率并不固定,工程师在设定算法时,要确保机器人眨眼像人类一样具有随机性。
人脸化妆,达成逼真效果。机器人头骨扫描完成后,工程师先打印出模具,再灌注硅胶。一张人皮面具成形后,由专业化妆师化妆,皮肤上的纹理、毛孔、晒斑,甚至胡须都在化妆环节加以还原。在量产的情况下,化妆也可以按流水线进行。
灵巧手设计,可靠性优先于灵活度。机器人的双手结构异常复杂。目前,清宝机器人手指的灵活度可以达到19个自由度。为了让机器手像人类,清宝找到人类的手模,根据手模开发出基本的外形轮廓,此后在这个轮廓上添加结构。手部的问题是,每个人的尺寸都不同,哪怕是同龄、同身形的人,手掌也有大小。而不同身高的机器人需要匹配不同尺寸的手,当手型调小时,对内部结构考验很大,涉及到一系列零件的改装。
清宝有两款灵巧手。一款是拟人型,类似于人手,手指和指关节可以动。另一款用于工业场景,要求抓取灵活。
相较于工业场景,手在生活和商用场景中的应用更为复杂。例如机器人抓取杯子时,关节电机要给予反馈,若力度不当,会损坏杯子。此外,手指上还要配有压力和温度传感器,多种传感器将提升手部的触觉能力。
业界常常将机器手的自由度数量视为技术挑战,理论上,手部的自由度也是越多越好,但是在商业应用中,王磊发现,随着自由度的增加,会带来一系列的问题。“这些自由度犹如并联电路,一旦有一个自由度损坏就会影响其他的自由度。手的自由度越高,理论上出故障的概率就越高。因此,可靠性才是关键问题。我们在可靠性和功能性之间求得平衡,在满足功能的前提下采用最低自由度。”王磊说。
微表情,差之毫厘,失之千里。清宝在机器人在表情上取得了不小的突破。机器人的头部设计由内部机械结构和外部表皮结构组成,内外结构需要很好地匹配。机器人做脸部表情时,内部(肌肉)结构要带动皮肤一起运动,如果皮肤不贴合,表情会大打折扣。由于表情过于复杂,王磊告诉团队,机器人的表情不必做很多,当前把微笑做好即可,因为大家都喜欢微笑的机器人。然而仅仅一个微笑,都会牵动到眉毛、酒窝、皮肤、嘴唇、眼睛等部位的联动。
王磊说:“恐怖谷效应的产生是因为似真人又非真人,如果你做得非常真实,人类反而更喜欢和机器人聊天、交流、握手。”
在资本寒冬,王磊的核心要务是为机器人寻找到合适的应用场景,实现商业闭环。
2021年,一家新媒体公司成为清宝的第一个客户,将人形机器人用于线下引流。如今,清宝的订单来自于各行各业,王磊说,这正是因为公司重视机器人的应用场景,才能不断拓展客户。
最初,清宝制作出一台样机,但是能够用在怎样的场景,还需要与客户不断沟通。没有场景,机器人就无法实现销售闭环。
在景区场景,今年“春节”清宝机器人在恩施大峡谷“上岗”。她如同真人幺妹儿那般,穿上土家族衣服,唱土家民歌《黄四姐》,还和游客一起大跳舞蹈《科目三》,现场游客与“幺妹儿”互动热烈。王磊说:“目前旅游景区机器人的主要作用是引流,如果没有机器人,景点也得找网红或明星来引流,成本非常高。这是科技与文旅结合的应用场景。”
“幺妹儿”除了引流,还能与游客交互,告诉游客景点、美食、住宿的信息,还能幽默地回答问题。
虽然景区场景并不复杂,但实际上每个场景在应用中都会遇到具体而微的挑战。“幺妹儿”送到客户手中后,面临了很多意想不到的问题。比如工作人员不知道如何启动机器人。由于在景区,机器人在交互过程中环境很吵闹,还会出现小孩子抱住机器人拖拽的情况,因此机器人要保持稳定性,以免压伤游客。这些问题看似微小,但在景区都是大问题。这也是王磊一再强调的“场景第一”,这