主持人(阿里云智能集团副总裁安筱鹏):
在最近的一次讨论中,我们注意到《大西洋月刊》在去年对诺贝尔奖的评价中提到:“这次诺奖是AI青霉素和X射线的时代。” 这一评论深刻地反映了AI技术在现代科学中的重要性。与此同时,马斯克在其最新发布的Grok-3人工智能系统时提出目标:在未来三年内实现具有诺贝尔奖突破水平的人工智能。此外,各位专家也指出,当前许多科学研究文献的基础研究工作都依赖于AI技术的支持。所以今天第一个议题是各位如何看AI对科学研究创新的工具、创新的方法、创新的范式带来的影响和价值?
龚维幂(
北京市科委、中关村管委会
):
基于我在日常工作中主要联系生物医药、能源、材料相关领域的经验,我对AI4S的价值有深刻的体会,以下我分为三大点来讲:
第一、AI4S是推动科学研究范式变革的关键力量
1.AI4S显著提升了我们解决复杂问题的能力。例如,MIT和CFS公司提出的关于可控核聚变的研究愿景中,AI结合多参数协同和高温超导材料的突破展现了巨大的潜力。这为我们带来了可以预期的前景。
2. AI大幅提高了科学研究的效率。通过实验室高通量合成和测试,以及未来可能实现的黑灯无人实验室,科学家们能够更高效地进行实验。这些实验室将不再需要人机交互界面,而是通过仪器之间的通信接口和物流通道来完成任务。未来的实验室将更加集约、高效,并有助于科研数据的追溯,从而增强科研诚信。
3. 有效拓展科学研究的边界:在习近平主席提出的研究领域如宏观拓展和微观探索中,AI也起到了非常重要的作用。随着AI技术的进一步发展,它甚至可以在提出更好的科学问题方面发挥更大的作用。
第二、AI4S是产业迭代升级的关键推动力
1.对技术叠加和产品推出的贡献显著。例如,小米Su7使用的泰坦合金已经利用了人工智能工具。此外,北京科学智能研究院在OLED材料开发上也有很好的积累,展示了AI在材料科学中的应用潜力。
2. 推动产业升级的革命性变化:合成生物制造是一个典型案例。过去,化工合成过程中存在环保、污染和能耗等问题。未来,如果更多底盘细胞可以基于AI和基因编辑技术进行设计,有望取代70%的人类合成化工用品,从而带来重大的产业升级。
第三、
AI4S是
促进高质量发展的关键抓手
北京在人工智能领域拥有良好的科技和人才积累,同时在发展壮大新兴产业、培育未来产业领域也有一些配套的举措,这些措施旨在抓住新一轮科技革命和产业变革的机会,促进高质量发展。北京将进一步优化营商环境,打造便捷的基础设施,包括概念验证、投资赋能和产业转化落地的全流程服务,以推动AI4S带来更多产业机遇。谢谢大家!
孙伟杰(深势科技):
在讨论AI对科研影响的背景下,可以将问题按照不同的逻辑层次进行划分。从工具层面来看,在没有AI4S(AI for Science)之前,科研的基本流程主要由读、算、做三个模块组成。随着AI基础设施的发展,AI技术已经开始显著地改变这些传统科研环节。
首先,AI能够极大地提高处理文献数据的效率,帮助研究人员更好地整理和分析知识。其次,通过提升计算模拟的精度和效率,AI为科学研究提供了强有力的支持。最后,AI还能够优化实验室设施,提高实验过程的准确性和效率。因此,在AI4S时代,原有的科研数据库、知识库、文献库、科研软件及实验室基础设施将会迎来一轮新的重构。
当这些智能化工具形成一个完整的闭环系统时,我们迎来了所谓的“超级实验室”或AI4S的具身智能。这种具身智能不仅包括传统的数学形式逻辑处理能力,更重要的是它能够在物理世界中完成数据的闭环,通过实体实验验证或观察来反馈给大模型,实现智能体的自我学习和进化。这意味着未来的终极科研基础设施将具备对客观世界的理解和认知能力,并能自动化地执行实验任务并获得数据反馈,以支持进一步的学习和研究。
基于这样的工具体系,学校里的科研和教学以及产业中的研发试验都将发生重大变化。未来,创造力将成为驱动科研的主要力量,人们只需要有一个创造性的想法,就能借助云端的数据、软件和实验资源来实现自己的设想。这将进一步激发人类之间的创造力,并促使科研生产关系发生变化。
过去,学校和产业界的科研存在三个壁垒,一是学校的科研和产业的需求之间有壁垒;二是学校各个学科之间有壁垒;三是科研的各个生产要素之间有壁垒,然而,在AI4S时代,这些障碍必须被打破。例如,过去由图书馆管理的文献中心、由计算中心管理的软件和算力、由测试中心管理的实验仪器以及由教务部管理的教学平台,现在需要更加有机地整合在一起。深势科技正是基于此理念,在每个环节上开发出针对AI4S的数据、科研、教学、实验等方面的工具,帮助合作伙伴打破壁垒,推动AI4S进入新的发展阶段。最终目标是创建一种一体化的平台,使得科研人员只需提供一个创意,其余大部分工作都可以由这个平台自动完成,从而大幅加速科学发现和技术革新。
在我创业过程中我觉得最有自豪感的一件事情就是我们真的有可能创造出一个挖矿机。从化学、物理、生物的这个宝贵的空间里面,帮我们挖掘出高价值的分子,高价值的材料的这些矿产。而其实我们世界上的需求,这些对材料分子的需求是无限的。过去是受制于我们科学家的智力供给不足,或者科学家的时间精力供给不足,使产业变化、学术发现不可能井喷一样的被发现。但是我觉得有了AI for Science 的下一个平台,就是AI scientist,我们的科学智慧的供给将会极大的被加上杠杆。在未来,这是我最兴奋的一件事情。云加AI正在成为科学研究的重要的基础设施。这个过程中不仅仅对科学的工具,科学的方式带来新的变化,对于科研的组织方式,资源的有效的流动和优配置带来了很多新的诉求。
王铁震(Hugging Face):
Hugging Face作为最大的AI开源社区,可以被视作AI界的GitHub。它不仅提供了丰富的模型原材料和数据集资源,还允许用户上传经过训练或微调后的模型,并在平台上展示其功能,让大家迅速了解这个模型能做什么。
从个人视角来看,AI对日常生活和跨领域研究的影响尤为显著。例如,当面对孩子的深奥问题时,AI能够提供详尽且易于理解的解答。我可以跟大模型做无限深入的交流,甚至把它当成老师、朋友,整个过程让我感觉很好也很有信心。所以以后我要跨行业、跨领域去干某件事或者做一些新的领域研究时,大模型可以帮我,我也可以很有信心的走下去。
模型一旦开源,就会永远属于你,一旦达到智力的水平,就会像人一样会永远孜孜不倦的跟你交流,不需要额外认识每一个行业的专家。所以未来对我们跨行业的交流会降低很大的成本,提高很大的效率。进而对整个教育行业都会有非常颠覆性的影响。
教育的本质,是发现的过程,知道怎么把所有的资源运用起来,不停地去探索,去解决你所感兴趣的问题,这是最重要的。这个行业有AI,有大家的使用,有这个行业技术的进步,其实会给我们带来非常崭新的人才培养、交流合作等方面新的变化。
Hugging Face作为模型开源的一个社区,我觉得对于科学研究今天的主题,最重要的一个价值是AI for Science的普惠。让更多大学的教授,在没有更多的算力的时候,可以记一个开源的模型,开源的平台,交流分享使用。
陈宇翔(IBM):
由于AI的介入,是我们研究的效率得到了显著提升。在各个领域中,如芯片设计和量子计算等,AI的应用大大加速了研究进程。传统的科研范式通常由科研人员提出一个富有创意的想法,并通过实验或计算来验证其可行性。然而,以往每个想法背后都会有代价,几个月的时间成本,甚至可能需要投入数万美元的资金才能得到结果。现在,借助多种AI工具的帮助,研究人员可以在极短的时间内快速验证这些想法的可行性,将原本需要数月的工作缩短至三天甚至几小时。这使得科研人员能够花更多的精力在想法上,而且也没有时间和金钱方面的压力,因此,科研人员能够在较为轻松的状态下提出一些惊世骇俗的想法,这对科研助力非常明显的。
在提出初步想法后,可能需要进行实验或计算。可以通过云、实验室或者一些实验室系统都可以做出结果。目前对AI的定位还是一种高级的工具,包括对数据的收集、分析、整理、汇总,但最终决策仍需人类主导,但是AI在过程中的确大幅度减轻了工作人员的工作内容。
此外,还观察到了一种模式的改变,大量的工具下一代就是用上一代做出来的,就是AI for AI。例如,IBM的量子计算机设计就是采用这种方式,用上一代的技术来改进和优化下一代产品。如果进入科研能自我迭代,机器人大量参与在里面的话,将来的速度和爆发出来的能力是蛮惊人的。
金鑫(华大生命科学研究院):
刚刚从各位嘉宾分享中学到了很多,我作为一个在生命健康,基因组学研究的人,最近这段时间给我最强烈的感受就是目前至少在生命科学、组学这个领域已经不仅仅是AI4S,而是AI is Science,去年两个诺奖已经很清晰说明了这一点。
我们做的基因组学领域,人类基因组学计划之后,人的基因组所有细胞里的基因组都是同一套。之前在人类基因组计划酝酿过程中间,人们有非常乐观的愿景,我们解密了人类基因组以后,应该能够解决所有人类的疾病和健康的问题,但是二十年以来,其实大家有很多失望。之前重大的挑战是我们对于怎么去理解海量的数据和序列能力是不够的,纯靠人类的智能,还是没有能够突破所有的问题,今天可能我们理解整个碱基中只有5%、10%究竟在做什么。
我们在跟协和医院合作做一项工作,有很多罕见病病人主要致病因素就是因为基因突变,父母没有基因突变,或者父母携带传给了这个孩子,正好是同一个位置,我们要做的工作实际上就是要从整个基因组中间找到这一个真正导致疾病的突变,这其实困难非常大。过去我们可能要有一个硕士、博士学历的专业人员经过半年的专业训练,解读2~3份全基因组的报告,现在我们使用开源大模型,而且是国内的开源大模型,结合我们之前积累的很多数据和经验,现在整个解读效率已经有非常显著的提升。我们自己的解读专家已经离不开这样的工具了,所以相信未来这方面的潜力非常大。我们测试了所有模型,在我们当时完成第一版成果时,是去年9月份,那时候我们用的是通义。