专栏名称: 络绎科学
专业的科创成果产业化社区,与青年科学家同行。
目录
相关文章推荐
安徽省应急管理厅  ·  返程高峰,这份安全提示送给路上的您! ·  2 天前  
安徽省应急管理厅  ·  返程高峰,这份安全提示送给路上的您! ·  2 天前  
辽沈晚报  ·  有一种爱叫后备箱还能塞! ·  3 天前  
辽沈晚报  ·  有一种爱叫后备箱还能塞! ·  3 天前  
51好读  ›  专栏  ›  络绎科学

第二届大模型与科学计算论坛:大模型开启科学计算新篇章

络绎科学  · 公众号  ·  · 2024-11-08 13:07

正文

随着技术进步,维度更多、规模更大的科学数据被挖掘使用,科学家们迫切需要新的方法来驾驭数据洪流。大模型,打破了传统计算在复杂条件和海量数据下的计算效率与准确度问题,已经成为科学研究领域的全新工具。2024 中国计算机大会(CNCC2024)期间,来自高校、科研院所和企业的专家学者们汇聚第二届大模型与科学计算论坛。大家围绕大模型与科学计算主题,详细介绍大模型在地学、生物学、物理学等多个自然科学领域的关键应用和主要进展,以及当前科学计算领域在数据处理和算力构建上面临的挑战。



香港科技大学(广州)的陈雷教授在报告《Data Science for Large Models》中指出,大模型如今取得的成功依赖于合理的数据管理,如果大模型的数据缺乏验证和解释,那么大模型在诸多领域的适用性将大大降低。因此,解决大模型数据科学中的数据准备、训练优化、模型解释三个关键问题,将是大模型数据科学的未来研究方向。


论坛主席,之江实验室 陈红阳 研究员分享了题为《GeoGPT: A Large Language Model System for Geoscientists》的报告。GeoGPT 是一个致力于全球地球科学研究领域的开源非营利探索性项目,旨在响应“深时数字地球”这一国际大科学计划倡议,是一项汇集了研究机构、高等院校、产业界以及众多其他组织共同参与的全球开放科学实践。凭借其在文献阅读、信息提取、地质图解译与生成、知识图谱构建、以及科学假设生成等方面的强大功能,GeoGPT 正在推动地球科学研究模式的革新与转变。


来自浙江大学的陈华钧教授从知识图谱和大型语言模型两个视角总结了人工智能相关发展趋势,探讨了利用知识图谱和语言模型来表示科学知识和处理科学语言的方法和思路,带领大家深入了解了化学元素知识图谱、融合知识增强和功能提示的分子图学习、蛋白质提示学习模型等最新研究进展。


“量子多体系统有着巨大自由度和海量数据规模,经常导致我们无法进行有效计算分析。”北京大学助理教授张亿在报告《量子材料、模型和算法中的机器学习》中指出。为此,张亿介绍了其团队采用机器学习策略应对量子多体系统的计算策略,包括使用机器学习基于复杂高通量实验或计算数据来分析量子态,如奇异的演生电荷序和量子自旋液体等。他指出,利用大模型直接适配量子模型,有望促进大数据科学分析领域的新发展。



“AI for science 取得了巨大成功,但还有哪些不足?”“模型重要还是算力重要?”“大模型数据的管理存在哪些现实困境?”……在圆桌论坛环节,与会专家和现场观众围绕这些问题展开观点分享和讨论。“今年的诺奖已经证明了 AI for science 取得了初步成功,但大语言模型常常会忽略重要的细节,例如 AlphaFold 主要关注了主链,对支链关注不够,而在药物学上支链也非常重要。”“模型和算力都很重要,但关键是做好二者之间的平衡。此外,我们要创新机制,帮助高校解决缺乏智能算力的问题。”“数据安全和隐私保护是做好大模型数据管理的关键。我们希望在政府指导下实现民生数据和产业数据的开放共享,打通数据壁垒,解决数据碎片化问题。”论坛现场,大家一致认为,以大模型为代表的人工智能技术已经深刻改变了科学计算的范式,既面临着算力、模型、数据等重大挑战,也是一次抢占科技制高点的新机遇。产学研各界应当继续在这一方向上展开探索与合作,为科学研究和产业应用贡献智慧和力量。




本文内容不代表平台立场,不构成任何投资意见和建议,以个人官网/官方/公司公告为准。






请到「今天看啥」查看全文