唐旭 发自 深圳
量子位 报道 | 公众号 QbitAI
“人最容易犯的一个错误,就是用现在的眼光去看未来的人。”
在谈及未来人形机器人的陪伴是否会让人更孤独的问题时,优必选创始人、CEO周剑如是回答。他说,随着时间的推移,人类的伦理、道德、情感都会发生变化,他不知道未来人是否会变得更加“孤独”,甚至很难想象30年后我们的孩子们会是什么样子。
也许他们已经在体内植入了芯片,或是戴上了某些增强力量的装置……
但周剑仍然对自己在做、要做的事情充满信心。他相信人形机器人代表着未来。
△ 中为周剑、右为优必选AI首席科学家陶大程
为什么是人形机器人?
按照维基百科的定义,人形机器人(humanoid robot)是一种“旨在模仿人类外观和行为的机器人,或者合成生物体、人工生命体”。
其实,这个定义在“或者”前后出现了一定程度的割裂——制造一个有大脑、有智慧的“生命体”,与单纯地开发一个外观和动作像人的机器相比,二者在难度上存在本质差异。因为制造难度以及成本的高昂,前者基本无法有效地实现商业化。
而近几年被深度学习与大数据所带动的人工智能复兴,则有望让人形机器人受益于相对更为成熟的语音交互和计算机视觉技术,成为家庭场景下的新一代智能硬件接口。
这或许是一个风口。近几年,亚马逊、谷歌、苹果这些巨头公司纷纷推出自己的智能音箱产品,试图借由一种成本更低的智能交互方式来收割用户。目前来看,搭载了语音助手的智能人形机器人与同样搭载了语音助手的智能音箱相比,二者在产品形态上本质上似乎区别不大。
但周剑坚信自己走在正确的道路上。
“将AI技术放在一个音箱上面,这可能是一种趋势,一种交互方式上的变化。”在将智能人形机器人与智能音箱进行对比时,周剑说,“记得之前我们和腾讯做过一个联合调查,在北美的一些家庭用上Echo后,他们在家里使用手机的频率降低了30%到40%。
数据不一定准确,但在语音识别这些技术发展到一定程度后,它代表了一种方向。”
“但我始终认为这只是一个过渡性的产品。目前,一些驱动、运动方面的机器人技术还不是很完善,商业化成本还没有真正降下来。
但如果有一天,小型的机器人也能够完成Echo的任务,对于人类来讲,与机器人之间的互动、交流一定更有乐趣。抛开成本、抛开价格,从长远上看,桌面或者是大型机器人是未来发展的方向。”
△ 优必选智能人形机器人产品Alpha 2
采访当天,量子位现场体验智能人形机器人Alpha 2。与同系列的第一代产品相比,搭载了摄像头和科大讯飞语音操作平台的Alpha 2能够通过语音和图像实现同用户的互动,在体验中,Alpha 2正确地给出了如“深圳今天天气如何”、“美国总统是谁”这类问题的答案,也能跟从指令打开或关掉顶灯,最后甚至还仰面来了个周星驰的大笑。
周剑说,他们未来的目标是打造服务机器人——可以端茶倒水、做菜做饭,甚至能在人不方便的时候帮助解决所有的事情。他认为,这种服务机器人是一种同之前所有产品都完全不同的品类,它不是一个单纯的交互设备,而是能给人以陪伴的朋友。
他表示,要做一个能在家庭场景下完成简单陪伴、教育等任务的人形机器人,让它以一个大众相对可接受的售价实现商业化,可能需要六到八年,而要实现“服务”,可能会需要更长时间。
让人形机器人智能化需要解决哪些问题?
抛开伺服电机、液压、气压这类外部机械控制技术,我们只谈机器人的内部操作平台。
去年年底,悉尼大学计算机科学教授陶大程加盟优必选担任人工智能首席科学家,负责人形机器人智能控制系统的开发。
据陶大程介绍,目前自己团队的工作主要在以下三个方面:
人脸识别:家庭场景下的人形机器人需要能够识别家庭中的成员。
物体检测:对家庭场景中的常见物品进行识别、检测。
人体姿态估计:作为人机交互的接口,机器人要理解人的动作、行为,首先要完成对于人体的姿态估计。
陶的主要工作集中于计算机视觉层面。相对医疗、工业场景,家庭场景的环境要更为复杂(受光线、油烟、物品摆放等因素影响),机器人的图像识别能力也需要和场景直接相关,因此一些通用型的物体识别算法可能并不适用。
同时,机器人搭载的摄像头在成像上也有一定的局限性,目前的成像质量还比较一般,需要通过更先进的传感器以及一些类似图像超分辨率分析的算法来解决;此外,还要考虑运动摄像时如何消除的运动模糊问题。
除了计算机视觉,要形成有效的人机交互,能够对人类自然语言形成理解和反馈的语音系统其实是更关键的部分。自然语言处理也一直是AI领域一个难于克服、进展缓慢的难点。
在这一部分,优必选将语音识别、自然语言理解、自然语言处理这类更为主要的技术工作交给了自己的投资者及合作方科大讯飞;此外,优必选也曾在自己与亚马逊合作的机器人Lynx上搭载Alexa语音平台。
△ 优必选与亚马逊合作的机器人Lynx
据周剑透露,优必选也在尝试打造自己的智能操作系统,并通过希望通过开发者社区形成自己的智能机器人产品生态。
行业还有多大空间?
今年年初,优必选入围了CB Insights评选出的AI 100榜单,此前在B轮融资中估值已经超过10亿美金的优必选也成为了榜单上智能人形机器人领域的唯一一家独角兽。
作为行业中的佼佼者,周剑认为目前国内无论是人工智能还是机器人行业,泡沫都非常大。比如,对于家庭场景下的服务机器人,能做的可能只有三点:教育、陪伴和娱乐,但很多人都在往风口上冲,其实是自己根本没想好自己能做什么。
周剑还认为,苹果、谷歌这类巨头进入智能机器人领域的可能性不大。
“其实我和苹果、BAT都接触过。第一,每家公司有自己的基因,有自己的主业。我们现在全力以赴在做的东西它们应该不会去做;第二,没有硬件的操作系统并不是一个完整的操作系统,这跟简单地将一个开发好的Alexa平台放在不同的硬件上,是完全不同的两码事情。”
周剑说,自己一直在做几乎没别人在做的事情,也许未来的机器人操作系统会有好几种,但在人形机器人这样一种载体上,优必选在未来完全有机会脱颖而出。他还表示中国的强大智能制造业实力有机会将这一行业的边界拓展到更远。
未来
未来,人形机器人是否会是通用人工智能的最终载体?
周剑说,就他个人而言,更偏爱人形机器人这种形态,也希望它能够成为这样一种载体,特别是在家庭领域——不管它需要十年、三十年还是一百年来实现。他仍然相信,在未来无论家中的硬件如何智能,人仍然会感到孤独,会需要陪伴,而他希望人形机器人能扮演这种角色。
而陶大程则给出了一个更为客观的回答:“我觉得人形机器人主要是用来完成和人之间的交互,但在一个工厂中,真的一定需要人形机器人来完成工作吗?并不是所有场景都需要人形机器人的参与。”
陶大程表示,人工智能已经遍及生活的各个角落,其表现形式可以是多种多样的。但对于人与机器人之间的交互而言,人形机器人在未来应该会是AI的主要载体。
“就像我们谁也不愿意对着一个智能音箱说话——但如果是和一个人形机器人说话,感觉到理解和陪伴,你可能会觉得更为自然。”陶大程说。
One More Thing
附送一个视频。画面中正在行走的是优必选正在开发的双足机器人Walker(目前还只是一个骨架),研发团队目前正在对其进行测试,最早有望在明年的CES大会上亮相。
周剑透露,Walker的预估研发成本在3到5亿人民币之间。
P.S.就在昨天,Google将全球最知名的机器人公司波士顿动力出售给软银。优必选相关负责人应量子位之约,从他们的角度解读这一事件:
波士顿动力在机器人行业是一家令人尊敬的公司。
在此之前,波士顿动力曾经对外表示过,公司以前是、现在是、且将长期是一个烧钱的公司。不难看出,成本问题制约着机器人商业化的步伐,尤其人形机器人,目前代表全球最高水平的本田ASIMO和波士顿动力的Atlas机器人,造价百万美元级,但都处于实验室阶段。作为产品推向市场,其性能是否稳定、成本是否可控成为关键因素。全世界目前还没有任何一家公司能够将双足机器人商业化推向市场,欧美、日韩都没做到。
而优必选从诞生之初,就非常明确要做可商业化的人形服务机器人,我们一直是“两条腿走路”,即左腿商业化,右腿为前沿技术布局。能够将研究成果迅速转化成产品进行市场化验证,收集来自用户的行为反馈,从而为接下来的技术研发提供最有价值的数据参考。
以Alpha系列为例,它是一款仿人形机器人,机器人分为仿人形、类人形和真人机器人。人形机器人是最为人类接受以及最适应人类生活及情感的形态,而人形机器人是家庭服务机器人的最终目标,真人机器人至少需要30年才能真正实现商业化,但是从短期内来看,5到10年里我们某种程度上的一些仿人形的机器人可能有机会进入家庭,适应人类生活环境,成为主动式交互中心。
被日本软银收购之后,希望看到波士顿动力在机器人商业化方面加速进程,有更多的产品创新和技术突破,对全球机器人行业以及未来人工智能的发展创造革命性的价值。
【完】
学习推荐
6月15号,量子位组织了一场沙龙,邀请到了图森首席科学家王乃岩博士分享自动驾驶相关话题,欢迎大家长按下图扫码报名~
One More Thing…
今天AI界还有哪些事值得关注?在量子位(QbitAI)公众号对话界面回复“今天”,看我们全网搜罗的AI行业和研究动态。笔芯~
△ 扫码强行关注『量子位』
追踪人工智能领域最劲内容