专栏名称: 美团技术团队
10000+工程师,如何支撑中国领先的生活服务电子商务平台?数亿消费者、数百万商户、2000多个行业、几千亿交易额背后是哪些技术在支撑?这里是美团、大众点评、美团外卖、美团配送、美团优选等技术团队的对外窗口。
目录
相关文章推荐
美团技术团队  ·  具身智能:从 “走近” 到 ... ·  3 天前  
高可用架构  ·  百度视频搜索架构演进 ·  4 天前  
架构师之路  ·  MQ如何实现,消息幂等(MQ真的不能再背锅了 ... ·  5 天前  
架构师之路  ·  MQ如何实现,消息必达到?(第32讲) ·  1 周前  
51好读  ›  专栏  ›  美团技术团队

具身智能:从 “走近” 到 “走进”,寻找和突破人机共融边界

美团技术团队  · 公众号  · 架构  · 2025-01-09 19:58

正文


2024年具身智能成为备受瞩目的领域,它承载着人们对未来人机关系的无限遐想。然而,其发展之路充满挑战与机遇。为了深入探讨具身智能相关话题,2024年美团机器人研究院学术年会的圆桌论坛邀请行业多位专家,他们凭借丰富的经验和深入研究,为我们剖析具身智能在技术、商业、人机融合等方面的现状与未来,为我们提供理解具身智能这一前沿领域的多元视角和方向。

讨论嘉宾

谭章熹丨睿思芯科创始人兼CEO 、RIOS 图灵奖实验室执行主任

王   鹤丨北京大学助理教授、银河通用创始人兼CTO、 智源学者

吴   翼丨清华大学交叉信息研究院助理教授

赵   行丨清华大学助理教授、星海图首席科学家

丁文伯丨清华大学深圳国际研究生院副教授(主持人)


圆桌讨论实录

丁文伯

非常荣幸能够担任今天的圆桌主持,我们先请各位老师开门见山,每位花不超过1分钟的时间介绍一下自己的个人情况,以及过去的5年做了哪些跟具身智能相关的事情?

谭章熹

很感谢美团的机会,能够来和大家聊聊具身智能。说到过去5年,其实我大部分时间在industry,主要做两件事情,一件事情是做芯片,我有一家创业公司,另一个就是在清华这边兼职当教授,培养人才。说到具身智能,我过去5年有两个事,一件事我现在在做RISC-V开源算力芯片,另一个是我之前在美国做过一家做传感器与计算融合的公司,卖给了一家叫Aurora的自动驾驶上市公司,可能跟主题相应地有些关系。

王鹤

各位美团的朋友们大家好,我是北京大学的助理教授王鹤,同时也是银河通用的创始人,以及北京智源人工智能研究院具身智能中心的主任。说起具身智能,我从在斯坦福大学读博士一直到今天,都在从事具身智能。银河通用目前是中国具身大模型机器人企业的领头羊,很荣幸跟大家今天在这里交流。

吴翼

我叫吴翼,我是19年从伯克利毕业,然后在清华交叉信息院当助理教授,一直做多智能体强化学习,然后是做Agent推理以及Agent怎么和人合作去完成一些任务。过去5年基本上都在做强化学习,也把这些算法放在了一些软件和游戏里,也放在了机器人里。我们在想机器人怎么跟人能够通用地进行合作,这是我一直在研究的一些问题。

赵行

大家好,我是赵行,我之前在MIT毕业以后在Waymo担任研究科学家,后来回到清华任教。我之前的研究主要都集中在自动驾驶,用AI的方法去改造自动驾驶,让自动驾驶达到L4的伟大目标。从去年开始,我觉得我们在自动驾驶里已经做出了非常瞩目的成就,包括我们已经在全世界最早地把大模型真正部署到了数10万辆的汽车上。从去年开始我们就迈向一个更高的台阶,往人形机器人、具身智能这个方向开始进发,所以我们做了这家叫做星海图的具身智能公司。

丁文伯

我也介绍一下我个人的情况,我是清华深圳国际研究生院的副教授, 19年回国来到深圳,一直从事机器人触觉的研究,当然现在也属于具身智能的领域。总结一下我们今天5位的几个关键词,教育背景上有清华、伯克利、斯坦福、MIT等顶级的工科学校,相关的学术背景有芯片,王鹤之前在斯坦福头几年也是做芯片、做微电子,还有大部分是做learning出身的。我以前是做通信,可能跟我们的一年老师比较近,我们都是不同的背景,但是有着共同的梦想。


进入到具身智能领域,梦想其实就是我今天总结的题目,《从“走近”到“走进” ,寻找和突破人机共融的边界》,不好意思,我还是用了个谐音梗。大家都知道,以前我们讲机器人更多是一种工业上的用具,它在工厂中实现了大量的自动化、机械化,但实际上我们在寻找具身智能下一阶段的突破,或者我们希望它能够走进千家万户,走进我们每个人的生活甚至生命,所以我今天把这个题目抛出来,也想听听各位老师、各位同僚的一些想法。


丁文伯:第一个问题就是,在帮助机器人融入甚至进入我们人类物理世界的大目标下,从破题的角度讲,「具身」和「智能」哪个更重要?这个题目可能稍微有点泛,大家也可以根据自己的经验来回答,每个老师大概一分半的时间。我们先请王鹤,因为你现在是做机器人做得最好、做得最大的团队之一,而且也做硬件。


王鹤:我觉得身体和支配身体的灵魂这两个应当说是缺一不可,所以说哪个更重要显然是无法下定论的。但是在不同的时间点成为瓶颈的,可以大约谈一谈。


从今天来看,我们畅想人形通用机器人的星辰大海,那么身体是要无穷无尽去研究的主题,我们最终落地家庭,我们可能希望它有像人一样全身的触觉、温觉,甚至有各种跟我们人类相匹敌的传感机制,它能够100年不坏,它能够出了任何状态自我修复。


但从我们银河通用的实践角度上来讲,从目前具身智能支持的技能出发,并不需要也驾驭不了像人一样这么复杂的身体,我们应该从简单的场景入手。在这种情况下,我们选择轮式底盘,双腿可以并在一起变成一个下蹲双手抓到地面,也可以站直抓两米多高的货架的身体,现阶段我认为身体不是bottleneck,而是应用我们成熟的轮式底盘和协作臂的经验制造出来的成熟本体之上,如何能把活干好,真正在场景当中自主全流程地可靠操作,这块其实最本质的bottleneck是智能。


所以我觉得今天我们应当基于一个成熟的硬件本体,去快速地推进像自动驾驶端到端技术一样的具身智能端到端大模型,也就是视觉语言动作大模型,这块是当下更重要的事情。


丁文伯:既然说到自动驾驶端到端模型,我们就得请赵行老师讲讲了。赵行老师在回国加入产业和学术之前,在Waymo做了很多的工作。


赵行:其实自动驾驶和机器人有很类似的地方,也有不同的地方。首先来看「具身」和「智能」,对于车来说,即便没有「智能」,它也是一个存在的「具身」本体,这是车最大的特点。在机器人时代,我觉得「具身」它会有挑战,但不是瓶颈。因为我相信随着我们中国的电子机械技术的发展,我们有非常完整的供应链,在当下我们能把机器人做得非常好,而且我能相信在不久的将来,我们也能把机器人的成本做到非常的低廉,能够进入到每一个人的家庭,所以我觉得具身的挑战更多在我们该设计一个什么样的形态,并且能够以最合适的、最具有性价比的方式把它生产出来,把它给普罗大众推广出去,这是「具身」的挑战。


「智能」更多是瓶颈。我们对比自动驾驶,机器人的「智能」包含着非常多的维度,从场景的理解、推理、决策、感知、规划,最后到控制等等这一系列的技术,我觉得都有不少的挑战。非常幸运的是在去年和前年,我们看到了大语言模型的技术突破,能够帮我们在理解推理决策这些方面做出了巨大的突破。那么接下来我相信对于机器人来说,感知到规划到控制,这些技术是我们真正要去努力突破和实现的。


丁文伯:因为谭博士研究的是芯片,其实是我们现在所有的智能和硬件,包括未来决策中间最核心的一点,有一种开玩笑的说法,如果你不给计算机或者机器人提供芯片,这个机器人就是一堆废铁。所以谭博您从芯片出发,是怎么看「具身」和「智能」的?


谭章熹:我从来不按常理出牌,所以我想谈一下我的观点。我觉得你们问的「具身」还是「智能」,其实机器人走进千家万户最大的问题是在于产业化,是整个上下游供应链的事情,因为之前我那家公司在美国的时候,也做了Waymo的生意,后来卖给了Aurora。


我们当时做的是一个相当于自动驾驶的sensor,非常fancy的all-solid-state的固态雷达,which we made it,我们确实当时也做出来了,但后来为什么我觉得那个时候不ready呢,为什么公司会要销售掉?当我跑遍了整个的产业链以后,我觉得这个是highly fragmented的supply,因为当时最大的一个market是光通信,全球也就大概5~6个billion dollars的market。


所有的供应链在机器人也是同样的道理,我相信现在我们看到了包括大语言模型,所有的basic building block,hardware也好、software也好,都存在,但是机器人是非常挑战的,你把所有东西都整合到一起的时候,这个东西是不ready的。To be honest,我认为可能还有10年左右的时间,把所有的东西放到一起再进行产业界的磨合。Fundamentally,我们看到很多的改变,整个我们人类生活的technology,其实它的cycle并不是我们说几年,大家一热去投资就可以,大概在20年到30年左右的时间。


上一个我们举个例子,我们说到芯片,上面运用的flash technology实际上是在30年前我们学界就已经有了的,但是真正把它做爆发的、上量的,是 iTunes,就像盗版的MP3,所以机器人也需要这样上量的、推动全产业链的东西,这是我的点。


丁文伯:吴翼老师的研究方向更多是偏重于多智能体,他也是国际上做多智能体强化学习最突出的青年学者之一,代表了中国的水平,你可以从这两方面谈一谈。


吴翼:我就讲得更高一点,我更偏「智能」,因为「具身」没有王老师和师兄懂。很多人考虑机器人,往往会考虑场景,会考虑任务,考虑一个机器人本体长成什么样,它能做什么。我稍微跳高一点,我们假设有个机器人可以做一些事之后,它还需要什么能力?我会觉得它需要空间上的理解和推理的能力,它不光是需要完成一个任务,它还需要能把很多事串起来。我举个例子,比如说大家都是学生,一般在家里去找东西,因为你妈帮你把东西都收好了,你找不着会跟你妈打电话说“我的袜子在哪,我的某个东西放哪了”,你妈跟你说,“它在一个白色的盒子里,或者它在某一个箱子的柜子的后边”,于是你在家里翻箱倒柜地找。


这是一个大家看起来稀松平常的事,但如果机器人要完成的话,它需要什么能力?需要理解“在白色箱子后边”这是件什么事,甚至还要说“我找不着了,妈”,它需要很多的交互能力,需要记忆、理解、推理。所以我在想,有没有一天,不管它本体长成什么样,它能做各种各样的任务之后,还有一个更大的、能长context、有空间理解、有记忆,同时也知道问什么话的大脑来驱动AI,真正地能和人进行像人一样的、长时间的、比较通用的交流和推理。我希望这个事情是最后能走进千家万户,解决所有这种长尾需求是我觉得蛮重要的点。



丁文伯:接下来第二个问题,我问得稍微刁钻一点。赵行老师和王鹤老师,现有的具身智能的路径中,本体、算法、数据都是我们的主战场,有的公司就是聚焦本体,低成本、高质量、可量产,有的公司可能就是聚焦于算法,甚至有的公司聚焦于产生大量的好用数据。除此之外,在真正做一线的产业化、包括落地推广的时候,你们觉得有没有什么技术或者市场的东西被我们忽略了,或者容易被我们忽略的地方?想请两位老师谈一谈在一线的感觉,请王老师先讲。


王鹤 :我刚刚讲的「智能」,它背后其实就是算法、算力和数据,那么「具身」本质就是本体对吧,丁教授问还有什么被忽略了?可能把这些东西串在一起构成一个系统,从真实世界真地能够去落地,然后回流数据、提升模型,真正把这件事情从0到1推动起来。虽然具身智能这个词 “Embodied AI”是大约在19年之后在美国复兴,在中国大约是22年后逐渐为大家所知,但其实背后的这些思想连贯了50年以上。为什么今天我们要推动具身智能,本质上这些要素在当下的市场和当下的需求侧已经齐备,并且需求侧给了我们很强的需求。


在很强的需求的驱动下,现在银河通用也是把数据、算法和算力结合在一起,开始在一些场景里落地尝试。我们是从合成的大数据作为数据的源泉,这部分数据不需要真实世界采集,成本相对低廉,同时可扩增scalable,这样的要素完成了具身智能的冷启动。像自动驾驶它是典型的热启动,因为你把车卖出去以后,有用户替你开,数据就直接回来了。每一个能卖出去车的车企,它后续做自动驾驶都很有能力,但是如果是一个没有作用的人形机器人,卖不出去,卖出去了以后也不会有想象的那种神奇数据回流回来。


所以我们银河通用是通过合成数据,先让机器人有了一个90分的优秀干活能力。我们部署的场景已经开始了数据回流,这一部分就是从优秀到卓越,那么它完全达到自主操作之后,整个产业闭环产生了以后,我们基本上所有刚才说的要素就齐聚了。所以目前看,在明年我们将有成规模的、数百台级的、完全无人自主的人形机器人。


丁文伯:我觉得王老师刚刚讲了一点非常重要,我列的这三点其实是个坑,因为每一点单独看起来都可难可不难,因为可以降低指标,但是反过来能把这三点串起来,是一个非常重要的点,不然的话就脱离开刚刚说到的统筹能力,包括上下游的产业链,这三点也是比较困难的,看看赵行老师有没有新的见解。


赵行:我觉得王老师说得很好,我补充一下刚才说到这三点里到底缺了什么,我觉得核心还是缺商业。大家总以为商业是商业,技术是技术,但我之前在Waymo有很长的一段时间的suffering,自动驾驶过去的教训已经告诉我们,我们没有把它真正给串通,我们就很难去证明技术的价值,也难以从商业里获取到数据的回流,这是我们过去最大的挑战和教训。那么我们希望在具身智能的时代能够打通链路,当然打通链路它一定是逐渐的。我们开始部署机器人,收到更好的数据,更好的数据让我们能训练出更好的AI,更好的AI让我们能做出更好的智能产品,智能产品又进入商业化,才能够扩大我们的商业规模,把这个闭环给打造起来。


这个闭环打造起来的几个重要的因素,第一个因素我觉得叫做更少样本,机器人能够降低它学习的边际成本。怎么样实现?我们觉得核心的技术,我们看到AI能够回流更多的数据训练,做更好的大规模预训练,这也是我们星海图主要做的事情——做更大规模的预训练,从而让它在学习新任务新技能的时候,能用更少量的数据,比如说3个样例,5个样例,就能快速把新的技能的习得,这是第一个点。


第二个点我觉得非常重要,也是几乎没有人探讨的,我觉得是安全性。机器人在部署到环境里以后,它产生商业价值没问题,或多或少我们觉得都有意义,但是我们需要保证它的下界是足够高的,它不产生危害,尤其是在和人共同生存、共同工作的环境里,要极力避免它产生危害,这样才能够使我们的商业能真正走通起来。所以我觉得打通商业非常重要的两个环节,一是降低学习的边际成本,二是提高它的安全性。


丁文伯:这个问题虽然刚刚没有说想让谭博来解释,因为您不完全作为具身智能的局内人,但是您的方向又跟具身智能还是有很强关联的。您站在这个角度,包括您过去创业的角度,你觉得除了硬件、算法、数据,还有刚刚王鹤讲的链条和赵行讲的商业,还有没有哪些你觉得是关键的、甚至决定成败的点?


谭章熹:我觉得一点很难说。因为我做芯片的,我们最开始是什么?最开始的东西有没有量,有没有足够的东西cover NRE(Non-recurring engineering一次性工程费用),这是所谓商业闭环的本质,总要有人赚钱。现在的机器人从商业应用也好,酒店有机器人、各种各样的机器人,但是没有一个上来很多量,然后固定一个场景去迭代。我们看到很多要做所谓的非标,然后用定制化,这里面就会牵扯特别多的垂直vertical application,想获得最佳的性能、最高的性价比,需要对每个部件、每个东西去定制,但dilemma就是量又不够。如何有一些像是刚才提到MP3 iTunes这样的application,去真正去drive这种每个人都要用到的场景,我觉得还是在application。还是回到一个产业cycle上,那需要可能花10年的时间,会有一些major application一定会涌现,还是要be optimistic。



丁文伯:刚刚每位嘉宾基本都稍微带到了一个很重要的点,就是商业化,所以我们就进入下一个环节,在商业、未来上的讨论。


我们也知道包括星海图和银河通用已经发布了一些人形机器人,这也是我们在探讨具身智能或者人形机器人概念的时候一直在想的一个问题,或者说大家都会在challenge:具身是不是一定要人形?以及人形机器人的市场前景在哪里?哪些行业或者场景比较适合他们率先落地应用?因为这个问题可能每个人都会有自己的感受,要不先请赵行老师,咱们按顺序来,每个人都谈一谈。 


赵行:人形是一个比较好的形态,但是完全仿人目前看起来没有特别大的必要,从落地场景来看,我抛开星海图现在做的,我觉得未来有两个大的方向,一个是和人非常远的、非常危险的作业,比如说高空的、地下的、边疆的等等,这种人不愿意干的,而且不需要和人交互的这些场景,我觉得它能产生巨大的价值,真正把人从无聊的劳动力解放出来。第二种是和人紧密相关的,我觉得这两头是两个大的发展方向,因为和人紧密交互的,它能够给人带来更多的情绪价值,可能可以和人的生活结合得更加紧密,我觉得主要是这两个。


丁文伯:所以你的结论是如果是完全无人的,就应该完全无人化,进入生活的就是带来人的情绪价值,那么你觉得情绪价值和服务价值哪个更重要?


赵行: 我觉得服务价值肯定是更重要的。


吴翼:因为我做人机交互、人机协同,所以我一直都觉得最后智能它应该是到每个人生活里面的,我们做什么最后是从谁真的需要来讲。因为大家很多都是年轻人,其实很多时候会忽略了一个很重要的群体,比如年纪比较大的一些人,他们可能整个精神、智力水平、身体机能会下降,他们需要一些可靠的东西,可以是人,也可以是机器来给他们一些支持,或者说他们需要一些人或者机器真的很有耐心。他们的反应会变慢,他们有很多长尾的需求。我会觉得他们是一个看得见的、在未来10到20年,是极其需要有不管是从情绪也好,还是功能性也好,提供支持的群体。所以大家可以考虑,如果你真需要服务这么一群人的时候,应该做哪些事。


丁文伯:你看吴老师就有不同的概念,他觉得情绪价值也很重要。


吴翼:大家如果回家陪你们家里老年人,他需要人跟他讲讲话,其实也挺重要,只是我们这个年纪可能不一定需要。


王鹤:其实从长远来讲什么都需要,为什么?人不够了。所以今天不要仅仅讨论说替代了人工作,失业怎么办?我们考虑到的是未来什么都需要,所以现在不用看需求,就看什么能做。银河通用的看法就是今天像刚刚谭老师讲的,现在有很多vertical、很多技能,能先把哪一个做出来,然后立即大面积地应用。我看就是做粗活,泛化的粗活就是抓取放置,然后在环境当中正确地导航移动。就是mobile pick and place这个活,它能干很多场景,零售里需不需要?仓储里需不需要?餐饮里需不需要?接待需不需要?都需要。所以我们看到这些24小时业态,它的活又很简单,就是把一个东西从货架上抓下来,放在桌子上给快递员,这些场景它又不是mission critical,失败了不会像自动驾驶撞死人,这样一个很好的场景也有很大的需求,我们先把它做出来。


像刚刚赵行老师讲的安全性是第一位的,但在这种无人的场景里,它即使出了安全问题,它又是可以弥合的。这样的场景将把我们具身智能从0带到1,后面有了1到10,我们再去考虑所有都需要的场景怎么从10到100。


丁文伯:特别好,我觉得王鹤老师的公司不仅具有技术高度,还有长远的人文高度,因为本质上要解决我们人口老龄化带来的社会压力和负担,这是非常重要的一点,看谭老师有没有什么补充的。


谭章熹:说到人形机器人,我再发散一点。For sure that's the future,that's the thing we want to build。为什么我们很多科幻电影里很早的人形机器人,有制造得特别像人的、有感情的、有智能的人造生命体,这东西已经是人类的梦想,不是说现在时候才有的。我想在我们每个人的DNA里,大家都想复刻上帝的做法“我也能够创造一些东西跟我是一样的”,我觉得这是来自于人性的本质。


所以no doubt这个东西一定最后是终极的目标,不管现在怎么argue说不practical,但是最后一定是会走到这一天。产业的发展是有它的一个规律的,我们刚才也说到了各种各样的application,真正大家在做的时候,公司要存活,技术要进行迭代。所以我觉得最先肯定还是一个通用技术会在一些垂直的行业出现。


随着人的需求,机器人也会慢慢地进行补充,那么人也会越来越适应,policy也好,人对机器的看法也会随着这个东西在变。我觉得这个变化可能差不多a decade or more,大家可能需要一些耐心,但是我觉得我退休的时候,肯定机器人就已经人形化机器人了。



丁文伯:我接下来再问一下赵行老师和吴翼老师两个问题。刚刚王鹤老师已经讲了他对于人形机器人未来市场的看法,从你们的角度你们看,以3到5年计,或者是以10年计,您认为哪些领域最有可能成为人形机器人技术的蓝海市场?除了养老以外,因为刚刚王老师已经讲完了,你们再想想哪些领域还有可能成为蓝海市场?


吴翼:王鹤说的特别对,3年其实都是蓝海,因为竞争没有激烈到已经开始打价格了,大家还是在一个继续探索的阶段。我倒是觉得如果看10年的话,从需求上看,如果大家认为人形机器人真能做到通用,能够进家的话,其实家庭就是一个蓝海的市场,不同的家庭,不同年龄层的家庭会有不同的需求,老年人是一个,中年人不需要吗?上班那么忙,有可能有一个人在家里帮你收拾。


赵行:看3年肯定大家都没有什么特别多的竞争,看10年的话,家庭一定是我们觉得非常有希望的蓝海市场。另外一个就是我刚才说到的,有很多人不愿意干的那些场景,我觉得可能在不用到10年,在5年之内,就会有非常大规模的应用,像是刚才说到的核电站、边疆、高空作业等等,高空作业可能会和我们的无人机更相关,这样的场景,我觉得是我们5年内能看到的一大片蓝海市场。



丁文伯:刚刚几位老师偶尔提到了一点,其实是机器人的安全,因为我们今天的题目叫“寻找和突破人机共融的边界”。机器人完成一些无人化的作业,现在已经在逐渐实现,但未来我们希望人机共融、机器人走进千家万户。所以一会可能请各位嘉宾先谈一谈,以你目前的接受程度,你能够允许机器人离你多近,帮你干啥事,和你做什么样的工作,这是第一点。第二个问题,从技术的角度谈一谈,完成这些工作可能涉及到哪些技术的突破,技术的挑战以及伦理问题好不好?我们要不先从王老师先讲。


王鹤:其实用数据驱动机器人以后,有的时候大家也不用那么担忧。比如说 Handover,我们银河通用最近有一个端到端移动接物的工作,这个工作就是人以各种姿态躺在床上,或是半弯着腰伸一个手,手伸出去这个东西可能还在晃,机器人要从你手里把它接过来。


我们发现在这个过程中,机器人不会突然间手臂一扬打你一下,为什么呢?因为它数据里没有这样的输出,它学完了以后,实际上整个神经网络的输出空间已经被它的训练数据给constrained了。所以从这个角度上讲,倒是更怕那些用motion planning的,它一下出现奇点,突然动了下,手就这么抡,你反而更怕,因为它不是基于数据驱动的。所以我的看法是,目前就握个手或者是递个东西我是不怕的,但在没有很好的力控知识前提下,更进一步拥抱或者其他这些,我还是有担忧的


吴翼:我觉得这事纯粹跟硬件问题有关系。你面前站个两吨的东西和站个200克的东西,先天的感觉是不一样的。进家的话,我觉得它应该先从小型化开始。比如买一个小的摄像头,你不会觉得它有什么大问题,你要买一个大家电,比如大冰箱,你会觉得好像有点不一样,大冰箱还能动,这就有点害怕。如果从这个角度上去看,把它抛开人形的话,很多小一点的机器人其实已经跟大家的交互很近了。


丁文伯:或者像大白这样的让人觉得很舒服很有安全感。


赵行:没错,我刚才就想说,我们需要一个像大白一样的形态,并且有很好的compliance。当你碰到它或者它碰到你的时候,你们都不会产生巨大的冲突。刚才说到标志是什么,我抢一下吴翼老师的台词,之前经常和他聊,看他玩的游戏《Overcooked!》其实挺好的。如果我们未来真地能让机器人或者人形机器人和人一起来合作做个菜,我觉得这是真正标志着机器人已经能有这样的协作能力了,实现人机共融。


谭章熹:问我多comfortable?我觉得机器人首先是一个产品,不管什么产品,总有人先吃螃蟹,总有人在alpha的时候去试这个东西,别管它多可怕。对我来讲的话,把它当做一个product来讲,要有不断的测试,要不断的用户体验,我觉得是最重要的。


那么我担心什么?我担心是你们就做这么一个产品,因为太复杂了,复杂system一定是每个building block或者component part把它搭起来,但是否能做到每个part可控,每part里面的东西能under sight,能不能保证每个环节从设计开始,甚至供应链每个环节都是可靠的,我觉得这是真正让大家comfortable的关键。



丁文伯:最后的ending part是我提前给每位嘉宾提的一个问题。今年是具身智能的元年,但是具身智能的时代什么时候到来,每个人心中都有一个milestone,站在今年的年末提这个问题,让大家讲述自己的梦想,可能等到明年或者5年之后再回过头看,会有很多的戏剧性效果,要不我们按顺序从赵行老师来。


赵行:就像我刚才说的,我觉得它需要和人有足够的合作竞争场景,我觉得是一个重要的拐点,比如说我们刚才举到的例子,和人一起合作做个菜,或者说和人一起合作踢个球,有竞争、有合作,我觉得这是我们想要达到的星辰大海。


吴翼:希望那个时代是你在装修房子的时候,你说这个地方有个插头是留给机器人的。我觉得是你会愿意为它改造,就像你现在买洗碗机,你说我留个空间给洗碗机,这就是洗碗机的时代开始走进中国人厨房了。


王鹤:我觉得我们现在像是13年的新能源汽车,我们的目标应当是在5年内有1万台人形机器人真地在场景里头自主干活,如果能达到这个点,我们看18年,是理想未来已销售了1万多台车的上市时间点,这是我比较务实的一个判断。


谭章熹:我觉得有一个标志,我们还回到产品能不能affordable这个事情。很简单,比如买车很多人可以afford,差不多现在新能源汽车或者再便宜一点的价格,所有人都买得起,而且能供得上货,同时没有太多的退货,这个时候就可以证明这确实是个产业了。


丁文伯:我最后也跟各位老师分享我对具身智能时代的一些想法,也call back刚刚我们哈工深同学讲的工作。我们所有的人在打比赛的时候有一股劲儿叫突破自我、有韧性。大家刚刚从1万分到1万7千分的时候,大家每一个阶段都觉得自己不行了,这可能是我做得最好了。这是我们人类非常引以为豪的一个特点,叫自我突破。


当然我们可能会在这个时代到来之前把它刹停,但是我在想一个真正的机器人或者智能机器人,应当具有这方面的自我突破能力,在精神上主要是从智能的角度,它能够自我突破、自我进化,当然这很可怕、很恐怖,但是反过来我觉得如果我们一开始就限制它这方面的能力,可能未来对它的高度也会有一定的影响,这是我个人的一点旁观者的思考。


我们今天的圆桌论坛就到此结束,再次感谢我们到场的嘉宾,谢谢大家。



美团无人机不断探索开拓城市低空领域

提升城市物流整体效率

助力智慧物流配送体系和智慧城市建设

更好地服务每个人