夏志宏:我们在大湾区大学讨论这些问题,是因为大学希望在人才培养方面,特别是在未来的人工智能和机器人领域有所建树。我想请大家探讨一下,我们应该朝着哪个方向、哪些领域发展? 姚新:我希望我的研究生学会三件事:首先是学习新知识,其次是学会如何提出问题。
我经常半开玩笑说,改革开放已经50年了,我们为什么还在解决别人提出的问题?这可能意味着我们在提出问题的能力上还有所欠缺。现在大家都意识到了这一点,我们也开始主办会议,提出自己的问题。但有时候,我们提出的问题似乎没有人跟着解。再难的问题,300年前的问题人家吭哧吭哧在解决。那我们要问,为什么300年前的问题就有后人帮他解,我们提的问题就没人理呢?
所以,在学知识、提问题之外,要学会知道提什么样的问题,和为什么要提这个问题,最后一点可能最重要。
人工智能领域也是如此。大部分人都在做大模型,但是我做演化计算。你做大模型,也一天花十分钟想想演化计算,没准演化计算也有好处。多问几个问题就会发现,条条大路通罗马,人工智能不是只有一条路可以走。
王煜:在人工智能和机器人技术迅速发展的大潮中,我的体会是,我们做工程教育更要推动学科交叉。现代科技发展表明,硬件的重要性日益凸显,并且发展迅猛。与此同时,软件、人工智能工具以及计算技术等都是相辅相成的。硬、软、信息和控制已经紧密结合在一起。如果我们仅仅局限于传统工程教育的狭窄领域,比如我1982年学习机械制造时所学的车铣刨磨,就会显得非常局限。
因此,交叉学科和跨学科的教育尤为重要,特别是对于工程学科的学生。还要有一个很实在的工程应用落脚点,即我们是否能够将所学最终转化为具有商业价值或技术价值的产品。这就意味着,创新和创业精神也应该成为我们教育的一部分。
孙若愚:大学教育应该将新思想与基础领域结合起来。在人工智能领域,许多人的不足或局限性在于他们缺乏扎实的基础知识。例如,人工智能领域的领军人物熟悉模型预测控制,但如果问现在的人工智能研究者,很多人可能并没有深入学习过优化算法和线性代数等基础课程,当前教育非常需要将前沿技术与基础知识融合。
夏志宏:大学在进行研究的同时,也希望能够将研究成果转化为实际应用,这一点对于大湾区大学来说尤为重要。我们建立了研究院,希望通过这个平台将基础研究成果转化为具有实际价值的产品,进而为社会经济发展做出贡献。我相信姚新老师在岭南大学也有类似的目标,作为科研副校长,关注全国范围内的成果转化的问题。请教各位,目前在机器人和人工智能领域的产业发展方面,有哪些值得关注的方向?
姚新:在知识转移和应用方面,实际上一直存在两个方向或两个群体的努力。一个群体关注的是社会面临的重大挑战,他们会组织团队针对这些挑战进行攻关,这样的跨学科合作自然就会形成。这个群体有着非常明确的问题导向;另一个群体在大学里也很常见,他们致力于提升自己的科研成果,再找什么地方可以落地。我觉得这两种途径都很必要,如果只聚焦一类问题,有时可能会损害发散性思维。
但第二种方法有其局限性,可能会导致研究者陷入“拿着锤子找钉子”的陷阱,而在学术界,每当有新的潮流出现时,往往更倾向于第二种。例如,人工智能在解决社会问题方面的作用往往是模糊的。虽然我们可以看到聊天、图片挺好玩的,但提高就业率或是解决其他社会问题方面的实际效果却不太明确。将研究方向推向实际应用,比纯粹的研究工作要困难得多。
以岭南大学为例,作为科研副校长,我可能会更倾向于第一种方法,因为岭南大学传统上是一所博雅大学,强调人文关怀和为社会服务的教育。我们培养的人才是要能够识别社会问题,并为解决这些重大问题做出贡献。因此,无论是进行研究、创新还是知识传递,我们都是从这个角度出发的。
至于具体的社会问题,比如社会不平等、贫困,或是人工智能带来的安全性问题,一旦我们确定了这些挑战,研究和产学研合作就会围绕这些问题展开。这至少是岭南大学常用的方法。
夏志宏:王煜老师的团队在成果转化和创新方面已经取得了很多成就。在整个大湾区,我们拥有哪些优势?还有哪些方面需要改进?
王煜:大湾区拥有雄厚的工业基础,这为发展硬科技提供了相当好的条件。特别是对于希望将基础技术转化为产品的技术持有者来说,这里的供应链非常强大,可以快速进行样机制作和迭代。与欧美相比,深圳、东莞等地在硬科技领域的迭代能力和条件无疑是世界上最好的。
如果教师有创新的想法和技术,并且愿意尝试将其商业化,他们可以利用大湾区的环境碰一碰、试一试。然而,创业是一个充满挑战的过程,虽然我们可以鼓励学生和教师去尝试,但也需要建立一定的支持体系。例如,学校可以提供辅导、培训和科创训练班,甚至成立科创学院,帮助大家了解知识转移和科技创新的过程,以及可能遇到的麻烦事甚至大坑。
这些准备工作非常重要,否则盲目引导教师和学生创业可能会导致他们陷入困境。我自己的创业经历就是从盲目尝试开始的。那时候,国内只要敢于尝试,就有机会成功,但同时也可能会遇到很多坑,要再想办法让别人把你捞出来。现在,随着社会的发展和规范化,相关的体制和系统正在逐步建立,这将减少失败的机会。但我们仍然需要让大家认识到这一点,并提供必要的支持。
目前,高校普遍认识到了这一环节的重要性,但并非每个人都能充分理解。最不理想的情况是,每位教师都有一个锤子,天天出去说,我要找钉子、找钉子、找钉子。这种方法不是最有效的,对学生的成长也不利。
夏志宏:我注意到孙若愚老师在算法研究的同时,也涉足了许多应用领域,特别是在通信领域中人工智能和算法的应用。孙老师是否在这方面有进一步的创新考虑?
孙若愚:在过去一两年中,我一直在探索人工智能在各类行业中的应用,也和一些投资人谈了融资。关键的问题是,当前人工智能够解决哪些具体的行业问题。港中深和深圳市大数据研究院一直在探索大模型能解决哪些实际问题,我们已经发布了医疗大模型、阿拉伯语大模型,也在开发法律领域的大模型。
但还是那个问题,发布这些模型后,我们需要问它们解决了行业中的哪个痛点。在融资过程中,投资者也经常问这个问题。当我们讨论具身智能时,不仅仅要与投资者谈论大模型,还要讨论能够为生产制造或服务的哪个部分提供解决方案。
目前,我认为在具身智能领域存在机会,但可能还需要两到三年的时间来克服技术上的挑战、寻找需求以及确保锤子(技术解决方案)与钉子(实际需求)相匹配。
夏志宏:三位嘉宾还有什么要补充的?
姚新:在讨论研究,无论是人工智能还是具身机器人等各个领域时,我们往往还带有学者的个人烙印。这种烙印主要体现在倾向于从自己的专业领域出发,思考能够解决哪些科学问题,而较少从问题本身出发。因此,我想呼吁的是,在开始研究时,应该首先明确想要解决的是哪个科学问题,并围绕这个问题进行深入讨论,这样会更有针对性和意义。否则,讨论可能会变得过于分散。
王煜:在8月机器人大会上,共有27款人形机器人展出。我们的戴蒙机器人没有参加展出,如果参加,可能会成为第28个,但考虑到需要支付费用,我们认为时机尚未成熟。我想强调的是,科技发展日新月异,一波接一波的浪潮不断涌现。对我们来说,更重要的是培养批判性思维,能够深入理解和判断,而不是仅仅依赖于自媒体的自我宣传。我们公司自己发布的自媒体内容,当然都是说我们多好多好了。
对于年轻人来说,非常重要的是能够自我把握,具备批判性地看待和思考问题的能力,这样才能做出正确的判断,决定自己下一步应该做什么。否则,有时可能会被误导,走向不太理想的方向。
孙若愚:讨论机器人时应该更多关注具体的应用场景。一个月前,我参加了一个具身智能的研讨会,机器人制造商在讨论他们的机械臂和人形机器人所面临的挑战。我很关注这个领域,对我来说,最大的疑
问是人工智能究竟能否解决这些问题,以及这需要多长时间——是3年、5年还是30年。观众1:各位老师好,我是来自澳门理工大学的。我总结了两个关于人工智能与机器人的问题,首先让我简单介绍一下我的思路背景。首先,我比较倾向于采用一种将感知、控制和决策分开的机器人开发方法,而不是采用那种新型的大模型控制器技术。我遇到一个非常棘手的问题是,当我们控制不同类型的机器人,无论是人形机器人还是其他形态的机器人,是否有一种通用的方案或方法来实现控制。例如,人形机器人有两个末端执行器,我们如何能够协调地控制它们以完成同样的任务。从控制的角度来看,是否有一种通用的方案,只要我们输入机器人的动力学模型、结构和关节自由度等基本信息,就能够得出一个解决方案。
其次,当机器人操作物体并与世界交互时,必然会发生碰撞或拿起物体等行为,这将导致其所在的环境状态发生变化。是否有一种类似于大脑的方案,能够很好地理解和处理这种物体间关系和交互的模型。据我所知,目前对于三维空间的大模型理解仍然有限,所以我的问题是,对于这两个问题,是否有可行的解决方案。王煜:在讨论机器人的移动和操作问题时,我们可以观察到,如果仅仅是移动而非操作,且不涉及双手的协同工作,那么通过模型预测控制和强化学习,机器人的控制问题已经得到了基本解决。现在,机器人可以自主学习前向运动学和逆向运动学,而不需要我们编写传统的运动学公式。这些技术使得机器人能够自主控制自己,完成移动甚至翻跟头等动作。
然而,当涉及到双手操作或更简单的任务,如用五指手抓取物体、拧螺丝或用筷子夹取花生豆时,问题就变得复杂了。目前,协同操作系统的开发仍然是一个开放性问题,这是机械手和灵巧手研究中最重要的挑战之一。我们需要找到一种方法,让机器人能够通过学习来掌握这些技能。
学习的对象是谁呢?数据从哪里来?显然,我们不能从大象那里学习,因为它们与人类的操作方式差异太大。因此,我们唯一的选择是向人类学习。我们不追究为什么人类的手是这样的结构,因为作为工程师,我们的目标是创造出能够像人类一样具有广泛操作功能的机器人。通过学习人类的能力,我们可以将这些技能传输给机器,这就是所谓的技能学习。
实际上,人类具有很强的适应性。即使不幸失去手指,人们通常仍能恢复操作能力。有些人甚至可以用脚完成抓取勺子、筷子,甚至缝衣服等精细动作。这些例子表明,人类的潜力是巨大的,而我们的目标是挖掘这些潜力,并将其应用于机器人技术中。
至于为什么人类有五个手指,或者为什么选择这种手的结构,我们可能永远无法给出一个确切的答案。有时候,我们可以将其归因于宗教或哲学上的观点,认为这是上帝创造的,或者从进化的角度来看,这是为了生存和更有效地利用资源而进化的结果。但无论原因是什么,我们可以利用这些特征来设计和改进我们的机器人技术。
观众2:各位老师好,我是来自大湾区大学的博士生,有两个问题,分别请教王老师和姚老师。
王老师,我昨天参观了深圳的一个展览馆,那里有一个机械臂制作的咖啡机器人,它不忙的时候表现得非常好,但一旦忙碌起来,咖啡就会洒得到处都是,弄得环境很脏。这让我想到,人类在操作过程中如果犯了错误,比如遇到简单的情景,可能会用手擦一下。而机器人只专注于它的目标,不太关心过程中发生的问题,只要完成任务就好。如果机器人犯了错误,应该由谁来负责纠正呢?在更严重的情况下,比如我们现在的自动驾驶汽车,如果出了问题,是否应该由开发者来承担责任?
姚老师,您提到演化有很多条路径,我们达到最终的人工智能目标并不只有唯一的路径。就像我们玩游戏时,可能会有很多不同的结局,有好的结局也有不好的结局。我的问题是,我们是否需要采取一些方法或手段来规避风险,以确保最终能够达到一个好的结果,而不是一个坏的结果。谢谢。
王煜:您提出的第一个问题实际上涉及到人工智能的行为表现。从我的角度来看,这与机器人本身没有直接关系。机器人在操作过程中如果造成混乱,比如咖啡洒出,并不是机器人自身的问题,而是没有人教导它如何清理。如果一个孩子小时候不小心洒了东西,如果没有得到及时的教育和纠正,妈妈不打屁股,没有强化学习,可能就不会学会如何处理。
孙若愚:这个问题实际上是通用人工智能(AGI,Artificial General Intelligence)需要解决的。传统的AI往往只专注于单一任务,比如让机器人倒咖啡,它就只会倒咖啡。而人类是通用的,我们执行任务时并不是只做一件事,而是会根据情况处理多种任务,这就需要多任务学习(multitask learning)。
在实际情况中,我们很难预先定义所有可能的任务。比如今天主持会议,如果麦克风突然坏了,这就涉及到另一个任务。因此,大模型的理念是让AI学习成千上万个不同的任务,这样它才能在遇到新场景时知道如何应对。所以,这确实是一个AI问题,涉及到如何让AI具备更广泛的适应性和学习能力。
姚新:关于玩游戏的话题,我想提出两点回应。
首先,从进化的角度来看,我们能够发展到现在的状态,确实存在很大的不确定性和随机性。进化过程中的每一步都充满了偶然性。
其次,当我们谈论坏的结果和好的结果时,这背后隐含了一个假设,即存在一个外部的“上帝”来评判什么是坏的,什么是好的。然而,在自然进化中,并没有这样的评判标准。进化的唯一标准是生存。如果一个物种能够生存下来,那么它就是成功的;如果它不能生存,那么它就会被淘汰。
在演化计算和真正的生物进化之间存在一个根本的不同。所有生物学家都会告诉你,计算机模拟的进化算法是不可靠的,因为它们误解了进化的真正含义。在进化算法中,我们通常设定了一个固定的适应度函数(fitness function),而在自然界中,适应度函数就是生存。所以,只有生存下来的个体才能被认为是优秀的。
因此,如果你理解了这两点,就会明白,虽然条条大路通罗马,但如果你最终没有到达罗马而是去了巴黎,除非你有一个外部的观察者来告诉你方向,否则你无法避免这样的结果。在演化算法中,我们确实有一个目标函数来指导方向,但在自然界中,我们无法用一个公式来完全表达这种偏好。
观众3:我是物理专业,目前在企业工作。在企业中,我们对机器人的期望是它们能够帮助我们解决各种问题。但在实际应用中,我们遇到了泛化能力和自主学习能力方面的挑战。我有两个问题想要请教:首先,大家预计泛化能力和自主学习能力多久能够得到解决?其次,如果这两个问题得到了解决,是否意味着机器人也将具备创新和原创能力?
姚新:我的第一反应是我无法回答,原因之一是您的问题没有表述得非常清晰。当您提到解决泛化问题时,我需要知道具体是指什么,因为在不同的应用场景中,泛化问题可能有不同的数学表达方式。你把公式写出来,我应该是有办法。但是办法好和坏,可能不能保证。
我经常发现,在与工业界的合作中,很多时候问题无法解决,并不是因为问题本身有多复杂,而是因为没有将问题表述清楚。因此,我们这些大学教授在与企业合作时,往往需要花费大量精力帮助企业明确问题的定义。一旦问题定义得当,通常研究生及以上水平的研究者总能找到解决方案,尽管这些解决方案可能并不完美。
所以,我建议您能否更详细描述您的应用场景,以及您所指的泛化能力需要达到什么样的程度。
观众3:为特定场景开发的工具,比如我之前开发的一个仿真工具,能够结合程序自动生成仿真场景并运行。这是一个完全定制化的设计。但如果问题发生变化,或者程序需要调整,往往需要重新配置工具。幸运的是,这个工具的配置相对简单,可以灵活调整。在机器人或人工智能领域,是否也可以通过配置的方式来实现泛化?这是我们现在面临的问题。很多人工智能系统在解决特定场景的问题时表现出色,但在其他场景中的表现就不尽如人意。
姚新:我可以提供一个例子,它涉及到演化计算中的一个特定领域,即所谓的基于经验的优化(experience-based optimisation)。在这个领域中,研究人员设计算法来解决旅行商问题(Traveling Salesman Problem,TSP)。现在,他们面临的挑战是,如何将解决TSP问题的算法稍作调整,就能应用于解决设施布局问题。这听起来非常有趣,因为原本用于路径规划的算法,现在被用来处理分配问题。
目前,一些研究者正在探索这一领域,但结果并不一致。他们的目标是,解决一个问题的算法不仅能够处理同类问题,而且在协调性方面也有所不同。现在,研究人员更进一步,希望同一个算法能够学习和解决不同类型的问题。这意味着算法应该是灵活的、有生命的,而不是僵化的。
这与您提到的想法有些相似,即一个系统在东莞应用后,可能只需要对深圳的参数进行一些调整就能使用,而不必从头开始重新开发。
观众4:在这几年的探索中,我总结出了三个在科技成果转化过程中普遍存在的难点。首先,从学术研究的新发现到形成理论,再到知识的应用和初步成果的展现,最终实现产业化,这个过程非常漫长,并且充满了不可预见的因素,这些都可能影响我们转化的成功率。其次,当我们在融资阶段时,投资者通常会非常关注产品的成熟度,这往往决定了他们是否愿意进行投资。第三,我在英国的经历告诉我,那里的学者更多地将精力集中在学术研究上,可能没有足够的时间和资源与产业界进行深入的产学研合作。基于这些难点,我想问的是,在中国科技成果转化的过程中,真正的痛点是什么?
王煜:成果转化确实是一个复杂的过程,它需要在多个条件成熟的情况下才能顺利进行。首先,技术的成熟度至关重要,我们通常参考技术准备水平(Technology Readiness Level, TRL)来评估。TRL低于3表示尚处于基础研究阶段,而3到9表示技术有一定的应用潜力,到了9到12级时,技术才可能成熟到可以进行产业化推广。因此,我们必须清楚地认识到自己技术的TRL水平,如果技术尚未达到可以转化的程度,过早尝试可能会浪费资源和时间。
其次,我们需要明确技术解决的问题是什么。例如,即使你能制造一个机械臂,它究竟能解决什么问题?这涉及到市场痛点的识别,这是商业化和投资中最为困难的部分。产品的商业模式和市场路径会更加复杂,无论是面向消费者(2C)、企业(2B)还是政府(2G),都需要深入研究。
创业并最终成功,不仅仅是学术界能够解决的问题,也不是任何教科书能够提供的标准答案。它需要你具备相应的能力、知识、判断力,以及能够找到合适的团队,在适宜的环境中,恰好抓住机会,同时在过程中避免陷入困境,才有可能成功。
然而,即使成功,是否能够持续保持优势也是一个挑战。在当前竞争激烈的市场环境下,一旦某个产品被证明有利可图,很快就会有众多竞争者涌入,市场很快会变成一片红海。由于国内生产和技术能力强大,人才储备丰富,一旦某个产品被证明有市场,很快就会有竞争对手通过拆解、模仿,迅速组织供应链,随后就是价格战、市场竞争和政策竞争。因此,这是一个极其复杂的过程。
尽管如此,我们的市场庞大,中国人勤奋,热衷于创新和创业,这使得成果转化仍然值得尝试。大多数老师专注于自己的科研工作,我也希望我能将我的科研做好。只不过我现在到了这个年纪,我可能无法证明更多的定理,但我可以利用我的经验和影响力,带领我的学生和博士后团队,帮助他们将科研成果推向市场。