数字催化平台 DigCat 是由
日本东北大学
李昊
教授
团队领衔,与全球范围内十余科研团队共同打造的融合大数据与人工智能的催化材料研究平台。
平台汇聚了超过 40 万条电、热、光催化材料的实验性能数据和超过 30 万个催化材料结构
。
DigCat 为用户提供强大的动态数据可视化、精准文献追溯以及智能问答助手,更有催化微观动力学理论建模,基于催化数据与知识库的 AI 聊天机器人、机器学习力场训练和回归模型建立等前沿功能。
据称,
这是目前全球首个数字催化平台及全电催化实验数据库。2024 年 9 月 1 日,DigCat 已更新至高度智能化的 3.0 版本。平台链接地址:
https://www.digcat.org/
。
全文速览
基于“大数据平台+人工智能方法+精准理论建模”的研究方法是未来开发新型催化材料的主流趋势。由“大数据平台+人工智能方法+精准理论建模”构成的人工智能实验室前端为催化剂合成和性能表征提供了更有价值的尝试方案,对于节省开发成本、加快发现新型性能优异且成本低廉的催化剂具有重要意义。
内容简介
数字催化平台 DigCat 是由
日本东北大学李昊团队
领衔,与全球范围内十余科研团队共同打造的融合大数据与人工智能的催化材料研究平台。
该平台集成了超过 40 万条电、热、光催化材料的实验性能数据和超过 30 万个催化材料结构
。DigCat 具备动态数据可视化、文献追踪、智能问答等功能,并支持催化微观动力学理论建模、基于催化数据与知识库的 AI 聊天机器人 AI 聊天机器人、机器学习力场训练及回归模型建立等一系列前沿特性。据称,DigCat 是目前全球首个专门针对催化材料领域的数字化研究平台及全电催化实验数据库。
截至 2024 年 9 月 12 日,数字平台包含
超过 40 万个实验数据点
和
超过 33 万个理论结构
,涵盖了各种材料类型,共
120
余种催化反应、
200 多个
性能指标的数据。主要包括
氧还原反应、析氧反应、析氢反应、合成氨、二氧化碳还原,双氧水合成、臭氧合成、氢、氨氧化反应、氮气、氨气氧化反应、电催化加氢、环氧烯烃合成、尿素合成、甲醇乙醇重整制氢
与
各类有机催化反应
等,同时涵盖多种材料,包括过渡金属及其合金,金属氧化物,氮化物,碳化物,硫化物,磷化物,贵金属,单原子催化剂、二维材料、钙钛矿等。值得注意的是,除了贵金属和其他经典催化材料外,
截至 2024 年 9 月 10 日,DigCat 数据库还收录了各类 M-N-C 电催化剂的实验文献数据
,其中包括单原子、多原子金属团簇掺杂的缺陷石墨烯,单原子分子片段催化剂,共价有机框架材料(COF)、金属有机框架材料(MOF)以及金属掺杂的石墨相氮化碳(g-C3N4)等新型非贵金属电催化剂体系。
用户选择反应类型和材料类型后,平台即可默认显示以年份为横坐标的性能数据。通过修改横、纵坐标类型或输入感兴趣的元素,用户可以进一步实现数据的动态可视化。平台还提供数据分类分析功能,例如按测试 pH 值对实验数据进行分类,并显示不同 pH 条件下的性能图表。针对特定条件,平台也提供了限定反应条件的滑动条,帮助用户快速筛选数据。对于热点研究领域如
海水电解、磁性催化、介导合成氨、介导环氧化
等,平台支持一键筛选相关文献。
筛选后的文献可进一步使用平台的扩展功能,如原文追溯与 AI 问答。将鼠标悬停在数据点上时,就可查看到对应的催化剂 ID 和 DOI,并通过对话框跳转至原文链接。此外,用户还可以在线查看经过实验验证的理论结构,下载相关计算文件或实验数据,用于建立或验证理论或机器学习模型。针对特定结构或文献,用户可以通过输入文献 ID,借助 AI 问答获取制备原料、方法、工艺、性能分析等详细信息。
DigCat 平台的大量数据统计分析为实验标准化和可靠性评估提供了有效支持。通过对比文献中常见对比样品的性能,用户可以识别实验数据中的异常值,并追踪可能的原因。这一过程有助于规范实验操作和数据处理流程,确保实验结果的可靠性和可重复性。
通过将规范化的文献数据与大语言模型相结合,DigCat 新推出了 AI 催化聊天科学家功能。相比原始版本与基于 PDF 文字知识库的聊天机器人,结合 DigCat 格式化数据知识库的聊天机器人 DigCat-GPT 在回答催化领域专业问题时,能够提供更具体、更详细且更具指导意义的解答。此外,DigCat 还整合了更多材料数据库作为材料源,包括穆斯堡尔谱数据库、固态无机与有机电解质数据库、热电材料数据库。通过大语言模型将这些材料的基础结构与特性与文献中的需求进行匹配,扩展了 AI 催化科学家预测催化剂的潜在材料范围。
除了基于数据和大语言模型的预测,DigCat 平台还提供了理论建模工具和机器学习模型训练模块,能够提升催化剂材料预测的可靠性。具体而言,通过 pH- 电场耦合的微观动力学建模功能,用户可以选择所需的反应类型和模型,并输入线性标度关系、电场响应参数、零点能、熵和溶剂化校正、电极电势等必要计算参数,从而获得精准的催化反应活性火山图,为实验研究提供更可靠的理论支持。
此外,DigCat 平台的理论建模功能还包括了构建机器学习力场势所需的大量催化相关稳定结构模型和过渡态结构模型。用户可以通过输入材料类型、元素种类以及能量、力或压强等信息,快速下载所需的基础结构,用于机器学习力场训练,进而为理论建模中的 DFT 计算提供数据支持。
DigCat 开发团队汇聚了来自全球多所学术机构的研究人员。
目前 DigCat 3.0 处于公测阶段,用户注册后请(用 edu 或认证机构的邮箱)联系李昊教授(邮箱地址:
[email protected]
;邮件内请提供账户名称及用户的姓名和单位信息,及希望使用的相关功能)进行权限审核及授予,方可使用里面的服务。
日本东北大学材料科学高等研究所 Hao Li Lab 团队: