1950年,图灵在其经典论文“Computing Machinery and Intelligence”
中展望了人工智能的两条发展道路:一是聚焦抽象活动,例如下棋,我们可以称之为离身智能
(Disembodied Intelligence);
另一条道路是给机器装上优秀的感官
(best sense organs)
,教会机器用语言交流,也就是我们今天所说的具身智能
(Embodied Intelligence)。
1991年,美国麻省理工学院计算机科学与人工智能实验室
(MIT CSAIL)
前主任罗德尼·布鲁克斯
(Rodney A. Brooks)在
其发表的文章“
Intelligence Without Reason”
中提
出:“人工智能
新方法的两大基石是情景性
(situatedness)
和具身性
(embodiment)
。”英伟达CEO黄仁勋在
ITF World 2023
半导体大会上也提出了“人工智能的下一个浪潮是具身智能
(Embodied AI)
,即能理解、推理,并与物理世界互动的智能系统。”
与物理世界互动难吗?AlphaGo战胜了围棋冠军,
ChatGPT和Sora
让文艺创作者倍感压力;但即便是处理最普通的家务,对于人工智能来说依然是个挑战。汉斯·莫拉维克等人于20世纪80年代将这一现象阐释为莫拉维克悖
论
(Moravec’ s paradox):
人类所独
有的高阶智慧能力只需要非常少的计算能力,例如推理,而无意识的技能和直觉却需要极大的运算能力。
在2024年3月由Figure公司发布的Figure 01的视频中,我们可以观察到机器的反应速度与人还存在明显差距,我们能否通过引入云边端协同的技术架构,将每一个具身智能体看作“端”,通过云和边的帮助提高其处理信息的能力和学习进化的效率?另外,在大语言模型中存在著名的
Scaling Laws
,即能力随着规模而提升。我们能否通过云边端协同实现海量具身智能体
的Scaling Laws
呢?如果云边端事实上构成了具身智能的大脑和身体,那么怎样的网络架构才能更好地构建具身智能体的“神经系统”呢?本期专题邀请来自哈尔滨工业大学、华中科技大学、东北大学、湖南大学、清华大学、华为技术有限公司高斯数据库的学者和专家,分别从需求、挑战、架构、算法、应用等多方面对云边端协同数据管理与分析问题进行深入剖析,希望人工智能的学习能够从利用互联网和云里的资源扩展到云边端甚至日常的物体。
300多年前,花甲之年的康熙在避暑山庄看到漫天飞舞的萤火虫,兴致大发,让侍卫们赶紧去抓,随后装进一个薄白绢的大口袋。自从《晋书·车胤传》里记载:“胤恭勤不倦,夏月则练囊盛数十萤火以照书”,千百年来的“大语言模型”都把“囊萤”读书作为寒门刻苦学习的榜样。结果谁都没想到,按照康熙自己的话说,他当晚“取萤数百,盛以大囊,照书字画,竟不能辨”。如果仅从知识库里训练,不在物理世界里进行直接感知和实践,等于把AI装在套子里,哪能获得真正的智能呢?
CCF会士,ACM Fellow,
CCCF
主编,2022年CCF王选奖获得者。清华大学教授。
ACM Transactions on Sensor Networks
主编。