专栏名称: 研之成理
夯实基础,让基础成就辉煌;传递思想,让思想改变世界。“研之成理科研平台”立足于科研基础知识与科研思想的传递与交流,旨在创建属于大家的科研乐园!主要内容包括文献赏析,资料分享,科研总结,论文写作,软件使用等。科研路漫漫,我们会一路陪伴你!
目录
相关文章推荐
NaturePortfolio  ·  《自然》:你的肠道菌群也有“朋友圈” ·  昨天  
募格学术  ·  【本周开讲】高校教授 ... ·  2 天前  
社会学理论大缸  ·  担心自己的研究选题只是在“炒冷饭”,该怎么办 ... ·  3 天前  
PaperWeekly  ·  博士申请 | ... ·  6 天前  
51好读  ›  专栏  ›  研之成理

德韩中三国科学家合作,Science!

研之成理  · 公众号  · 科研  · 2024-12-13 11:13

正文

第一作者:Jianchang Wu, Luca Torresi, ManMan Hu, Patrick Reiser

通讯作者:Luyao Wang,Sang Il Seok,Pascal Friederich,Christoph J. Brabec

通讯单位:厦门大学,韩国蔚山科学技术院,德国卡尔斯鲁厄理工学院,德国纽伦堡亥姆霍兹可再生能源研究所

DOI:
https://www.science.org/doi/10.1126/science.ads0901



  


Science编辑Phil Szuromi评语
学者们利用逆向设计方法识别出用于钙钛矿太阳能电池的高性能有机空穴传输半导体。Wu等人通过Suzuki耦合反应合成了共轭有机分子库,以创建大型数据集,并评估这些分子作为空穴传输体的性能。他们基于器件性能训练了一个贝叶斯模型,并使用该模型根据分子描述符合成新的候选分子。最优分子实现了26.2%的功率转换效率,而最先进的参考空穴传输体的功率转换效率为24.6%。



  


研究背景

为特定高复杂度光电器件量身定制有机分子的逆向设计具有巨大的潜力,但尚未被实际使用。当前的模型依赖于大型数据集,而这些数据通常在专门的研究领域中并不存在。


  


本文亮点

本文展示了一种闭环工作流程,该流程结合了有机半导体的高通量合成以创建大型数据集,并利用贝叶斯优化来开发具有定制特性的新型空穴传输材料,用于太阳能电池应用。预测模型基于分子描述符,使我们能够将这些材料的结构与其性能联系起来。通过极少的数据,本文识别出了一系列高性能分子,并在钙钛矿太阳能电池中实现了高达26.2%(认证值为25.9%)的功率转换效率。



  


图文解析

图1| 方法概述

要点:

1.本文利用铃木偶联反应合成了新的分子。这一反应促进了两种不同的单体,即A型和B型分子的结合,形成了B-A-B型的共轭分子。工作流程(图1)始于创建一个源数据库并定义子数据库。源数据库包含了所有可商用的、与有机溴和硼酸进行铃木偶联反应相兼容的A型和B型单体。中间数据库含有密度泛函理论(DFT)计算结果,由从源数据库中随机选取的13,000个分子组成。然后根据特定规则,使用Kennard-Stone算法为初始数据库植入,并采用BO算法进行迭代数据库的选择,从而从中间数据库中选择合成数据库。


图2|初始库的生成

要点:

1.根据这些标准,本文选择了1132种A单体和850种B单体。随后,使用基于RDKit的脚本对单体进行注释,涵盖七个方面,包括共轭框架类型、取代基类型、电子效应和立体效应(图2A)。在这些七个方面对HTMs(空穴传输材料)进行分类,与当前对于HTMs如何影响钙钛矿器件性能的理解保持一致。然后,通过使用Kennard-Stone算法,从这个空间中选择了一个代表性的单体库(33个A和13个B)(图2B)。这种采样方法确保了从特征空间的均匀区域选择单体。为了确保与已报道分子的可比性,手动添加了一些报告性能良好的单体。

2.图2E中的合成分子的光电转换效率(PCEs)热图揭示了初步趋势。A分子与B1反应的PCEs普遍高于A分子与B2反应的。同样地,在保持单体B不变的情况下,几乎所有基于A30作为中心构建块的分子都表现出最佳性能。这一结果突出了B1和A30三苯胺(TPA)衍生物在HTMs中的巨大优势,但也有一些显著的例外:A30B2 > A30B1,A31B12 > A30B12,以及A31B13 > A30B13。前两点有一个共同点:单体B1和B12具有TPA结构,这表明过量的TPA或其位于外围可能会不利。至于第三点,仅凭化学直觉似乎难以解释,这凸显了使用机器学习进一步提供分析和识别潜在机制的必要性。


图3| 基于实验数据和计算描述符的模型训练

要点:

1.在图3A(可在图像查看器中打开)中,本文展示了最重要的特征分布。虽然本文的特征描述符获取并不基于单一的特定假设,但几个已报告的特征被包含在描述符集中,主要是基于对这些特征如何影响分子性质的理解。一个相当直接的标准是密度泛函理论(DFT)计算的最高占据分子轨道(HOMO)能级,它在影响器件性能方面得到了很好的理解。空穴传输层(HTL)的HOMO能级与钙钛矿价带(VB)之间的偏移会导致提取势垒,从而降低空穴提取速率,进而增强在该界面处的复合。预计对器件性能的影响将呈现阶梯函数或更确切地说,随着两个电子带之间的能量偏移,呈S形趋势。考虑了特定的原子,如氟(F),以及杂环,如噻吩和苯胺,因为它们被报道与钙钛矿有积极的相互作用,例如钝化效应。此外,还考虑了影响空穴传输的因素,如分子刚性和共轭。预计这些特征会影响分子间相互作用,因此也被包括在本文的描述符集中。

2.对于模型选择,本文在101个实验分子数据点的随机10折交叉验证上训练了不同的机器学习模型。测试的机器学习模型包括随机森林回归、线性回归、神经网络、高斯过程(GP)回归和核岭回归。所有简单的模型表现同样好。对于贝叶斯优化(BO),本文选择了高斯过程作为代理模型,因为它提供了许多获取策略所需的不确定性度量。图3B展示了高斯过程模型对所有设备标签超过PCE的预测准确性。


图4| 新合成分子和迭代实验数据

要点:

1.为证明机器学习模型可以通过预测可行的新有机半导体用于空穴提取来开发新分子,本文进行了两轮闭环材料优化。这个过程包括通过ML代理模型和贝叶斯选择标准识别潜在候选物,自动合成候选物,最后使用设备表征来更新模型。在第一轮中,24个新分子(蓝色三角形,图4A)被一次性合成并表征以验证先前获得的模型。考虑了新的构建块(A525-吡啶酮、A772-二氰乙烯基)和非对称结构模式,以丰富数据库中分子结构的多样性。合成的单体数据库从33×13扩展到50×19,主要通过ML推荐,辅以可访问性、初始数据库中表现出高性能结构的衍生物以及随机获取。

2.在第二轮迭代中,增加了模型中UCB(不确定性置信界限)的探索性。随后,合成了ML推荐的分子126到149(图4)。尽管没有发现新的冠军HTM,但预测的平均PCE仍然非常高,与第一轮相当。这一结果肯定了本工作流程的潜力和可行性,考虑到影响钙钛矿器件性能的众多因素。器件性能只是部分受到HTM的限制,因为许多其他层,包括电子传输层、电极以及吸收层的质量和缺陷密度,也会影响性能。此外,这些损耗背后的物理模型包括多种化学和物理现象,如材料固有的限制性质、半导体中的生成、复合和传输动力学、界面形成的能量学及其在薄膜设备中的相应电位景观、薄膜微结构的形成、器件架构本身以及宏观膜均匀性。所有这些方面都在最近上传到Matportal上的钙钛矿设备本体论中有描述。


图5| 模型分析

要点:

1.为了获得对机器学习模型所学内容的可解释性见解,并识别影响器件性能的物理参数,本文添加了更多的实验材料属性,并从训练好的机器学习模型中提取特征重要性信息(图5可在图像查看器中打开)。首先专注于模型分析,以更好地理解哪些分子描述符与生成数据中的模型预测性能相关。然后,本文系统地评估了哪些分子描述符对于模型泛化到未见过的构建块和新分子的能力是相关的,这对于分子开发很重要。最后,本文关注额外实验观察在提高模型性能方面的有用性,以帮助找到PCE和其他器件特性之间的关系,这些关系可能在未来作为中间测量手段引入代理测量或停止标准,以加速实验迭代周期。由于HOMO位置与电荷提取的物理考虑相关,HOMO能级位置预计在电极和钙钛矿之间对齐,并在图5A中被标识为显著特征。

2.为了获得一个更具可解释性的模型,本文训练了一个线性回归模型,首先应用了前向和后向的顺序特征选择,这是一种贪婪搜索算法,用于将特征空间缩减到一个更小的子集。本文使用贝叶斯信息准则评估生成的模型,以选择迄今为止表现最佳的一组特征。本文选定的模型使用了八个特征(芳香键和原子计数、分配系数的对数(logP)、氮原子计数、纯度、偶极矩、旋转常数c以及叔胺的存在)来预测PCE,达到了约0.46的R²(图5D),这比本研究团队发现的任何其他模型都要高。

3.为了增加输入和输出参数的多样性,生成了扩展表征的额外实验输入,包括润湿性、光致发光量子产率(PLQY)和时间分辨光致发光(TRPL)。因为这些测量通常只能在制造器件之后进行,所以本文将它们作为后续输出添加,并在联合目标空间上训练了一个MTGPR。任务协方差矩阵表示潜在的相关性,MTGPR模型使用在任务之间共享的核函数(图5C)。它展示了Voc、Jsc和FF与PCE之间的预期相关性。在一定程度上,它还表明PCE与额外标签之间的相关性,例如与TRPL,这与当前的报告一致。然而,相关性不如预期的那样显著,当将这些额外标签输入多任务模型时,并没有导致PCE预测准确性的统计显著提高。



  


总结展望

本文展示了一种用于开发针对高度复杂应用(例如光伏器件)优化的功能材料的工作流程。基于分子描述符构建了预测模型,使我们能够将材料的结构与高度复杂设备(如太阳能电池)的性能联系起来。通过在自主驱动的实验室中结合有机合成和自主设备优化线,实现了这一工作流程,并且这种方法可以扩展到其他应用领域。这种能力对于器件处理和优化尤其重要,它需要对材料和所涉及的过程有细致的理解。展望未来,本研究团队的目标是将材料发现和设备优化整合为一个无缝的闭环流程。实现这一点将需要在跨学科研究中进行协调努力,结合材料科学、工程学和先进计算技术的洞见,以创建一个协同的工作流程。这种综合方法是最有希望的策略,可以彻底改变开发和优化前沿技术应用材料的方式。


  
研理云服务器

业务介绍

研理云,研之成理旗下专门针对科学计算领域的高性能计算解决方案提供者。我们提供服务器硬件销售与集群系统搭建与维护服务。

   ● 配置多样(单台塔式、两台塔式、多台机架式),按需定制,质量可靠,性价比高。

 ● 目前已经为全国 100 多个课题组提供过服务器软硬件服务(可提供相同高校或临近高校往期案例咨询)。
 ● 公司服务器应用工程师具有量子化学第一性原理分子动力学等相关学科研究背景。
 ● 公司与多位化学、材料领域理论计算方向专家长期合作,一起探索最优服务器软硬件配置和部署。
 ● 可参与招投标。
产品特色
  ● 定制化硬件配置:提供售前实例测试,为您提供最合适的硬件配置方案。
  ● 一体化软件服务:根据需求发货前,完成系统、环境、队列、计算软件等所有内容的安装与配置,让您实现开机即用
  ● 完善的售后服务:为每位客户建立专属服务群,遇到问题及时解决。大大降低使用学生使用门槛和缓解老师压力。三年硬件质保 + 三年免费软件技术支持。
  ● 已购买客户咨询:我们已有超过100位已购买客户,可以给您提供相同城市或者临近城市已购买客户的联系方式,以提供真实案例咨询  
 ● 赠送课程学习机会:可选课程包括量子化学(Gaussian),第一性原理,(Vasp),分子动力学模拟(Lammps、Grommacs),钙钛矿计算模拟(Vasp)等。具体赠送方案以沟通结果为准。



扫码添加客服微信

1. 仪器表征基础知识汇总
2. SCI论文写作专题汇总
3. Origin/3D绘图等科学可视化汇总
4. 理论化学基础知识汇总
5. 催化板块汇总
6. 电化学-电池相关内容汇总贴
7. 研之成理名师志汇总
更多科研作图、软件使用、表征分析、SCI 写作、名师介绍等干货知识请进入后台自主查询。