新材料的发现是一个领域发展的关键。本文提出了一种
闭环材料发现工作流
程
,结合高通量合成、自动化表征和机器学习,快速筛选出具体特定属性的有机半导体材料。这一创新工作流极大地加速了材料发现的速度,仅用几个月就发现了性能卓越的分子,并实现了认证效率25.9%的钙钛矿电池。这项工作不仅为太阳能材料的开发提供了新思路,也为其他领域的研究开辟了全新可能性。
从硅到锂电池,从有机半导体到高分子光电材料,材料科学的突破始终驱动着技术革命。然而,传统材料开发依赖科学家大量的时间和试错过程,通常需要
数十年的努力
。
近年来,随着
人工智能
和
自动化技术
的发展,科学家们开始探索更高效的材料开发方法。通过机器学习分析海量数据,并结合自动化合成和表征,材料科学正迈向一个前所未有的高效时代。
在这样的背景下,本文提出了一个
闭环自动化发现流程
,用于快速设计和优化钙钛矿太阳能电池的空穴传输材料。这是一个从理论预测到实验验证的完整生态闭环。
1.
虚拟数据库的创建与分子库的合成
:根据设计原则生成初步的分子集合;
2.
密度泛函理论(DFT)计算
:提取分子的关键描述符;
3.
高通量有机合成与光电表征
:快速获取大规模的实验数据;
4.
器件及半器件的制备与表征
:评估材料的实际性能;
5.
机器学习模型的训练与迭代优化
:通过不断更新模型,提高预测精度和发现效率。
这一闭环流程贯穿了从分子设计到性能验证的完整链条,为快速筛选高性能材料提供了新工具。
构建用于训练机器学习模型的初始数据库是关键的一步,其核心原则是
分子多样性
。多样性的分子结构能够确保模型不偏向某些局部特征,而能广泛捕捉影响材料性能的关键因素。
作者共合成并表征了101种结构多样的分子,这些分子为机器学习模型提供了充足的基础数据,并确保模型的通用性与鲁棒性。
为了构建机器学习模型,本文选择了一组能充分反映器件性能差异的描述符,而非依赖于特定的假设。这些描述符包括:
·
分子统计
:例如原子种类数、芳香键数目和特定官能团的分布;
·
理论计算特征
:如溶解度对数值、分子轨道能级(HOMO/LUMO)、偶极矩以及几何性质(如旋转常数)。
模型选择方面,作者对比了多种机器学习方法,包括随机森林回归、线性回归、神经网络、高斯过程回归(GP)以及核岭回归。最终,高斯过程被选取作为代理模型,因其不确定性量化能力适用于贝叶斯优化中的采集策略。
为了验证机器学习模型预测新分子性能的能力,作者进行了两轮闭环材料优化实验。
1.通过机器学习模型和贝叶斯选择标准,筛选出潜在候选分子;
实验表明,新筛选的分子系列在器件性能上普遍优于初始数据库中的分子。这一结果充分展示了机器学习模型相比随机抽样或网格搜索的显著优势,尤其是在“利用(exploit)”模式下的表现。
为了深入理解机器学习模型的学习机制,并找出影响器件性能的关键物理参数,本文进一步进行了以下分析:
1.
分子描述符的重要性
:分析哪些描述符对模型的预测性能最为关键;
2.
模型泛化能力评估
:评估描述符对未见过的结构单元和新分子的预测能力;
3.
实验观测对模型性能的影响
:探索其他可能影响性能的特性(如PCE与器件参数的关系),以寻找潜在的中间测量指标,从而加速实验迭代。
最后,为了帮助化学家和材料科学家更直观地理解研究结果,作者用化学语言解读了机器学习的结果。比如,通过分析三苯胺的存在与否、TPSA(拓扑极性表面积)、杂原子和取代基位置等因素,可以快速缩小分子结构选择范围,从而优化材料设计。
本工作展示了材料科学与机器学习、自动化技术结合的潜力,为加速材料发现提供了范例。本文不仅发现了高效的空穴传输材料,还验证了闭环工作流的广泛适用性未来,这一方法可以应用于更广泛的领域,例如有机光电器件、催化剂开发。作者相信,随着技术的不断进步,材料科学将迎来一个“自驱动实验室”的新时代。
论文信息:
标题:Inverse design workflow discovers hole-transport materials tailored for perovskite solar cells
第一作者:武建昌,Luca Torresi, 胡曼曼, Patrick Reiser
通讯作者:武建昌,王露遥,Sang Il Seok, Pascal Friederich, Christoph J. Brabec
通讯单位:德国赫姆霍兹研究所 (Helmholtz-Institut Erlangen-Nürnberg),
埃尔朗根
-纽伦堡大学
(
Friedrich-Alexander-Universität Erlangen-Nürnberg),厦门大学,韩国蔚山国立科学技术院,卡尔斯鲁厄理工学院
https://www.science.org/doi/10.1126/science.ads0901
相关进展
长春应化所孙昭艳团队 npj Comput. Mater.: 生成式AI遇见高分子按需设计
中山大学吴进等 NML:AI增强和硬件支持的多模态电子皮肤用于环境物体识别和无线有毒气体报警
华东理工刘润辉教授、唐漾教授 Nat. Commun.:基于AI高效发现模拟宿主防御肽的抗耐药菌多肽聚合物