专栏名称: 研之成理
夯实基础,让基础成就辉煌;传递思想,让思想改变世界。“研之成理科研平台”立足于科研基础知识与科研思想的传递与交流,旨在创建属于大家的科研乐园!主要内容包括文献赏析,资料分享,科研总结,论文写作,软件使用等。科研路漫漫,我们会一路陪伴你!
目录
相关文章推荐
PaperWeekly  ·  EMNLP ... ·  4 天前  
社会学理论大缸  ·  申请季最后冲刺,如何改出让导师心动的研究计划书? ·  4 天前  
募格学术  ·  1本中科院1区Top期刊、1本2区Top期刊 ... ·  4 天前  
51好读  ›  专栏  ›  研之成理

黑龙江大学Chemical Science:机器学习辅助高通量筛选OLED阳极材料

研之成理  · 公众号  · 科研  · 2024-11-23 09:06

正文

▲共同一作:崔丽莹 李庆
通讯作者:郑冰 研究员
通讯单位:黑龙江大学
论文DOI:10.1039/d4sc05598e(点击文末「阅读原文」,直达链接)


  


全文速览
本研究提出了一个结合高通量虚拟筛选与机器学习模型的目标驱动材料设计框架,用于加速新型透明OLED阳极材料的开发。所构建的二维纳米材料功函预测模型(CatBoost)具有较高的预测精度(平均绝对误差(MAE)仅为0.20 eV);通过SHAP加性解释方法,揭示了基于材料整体结构的特征和一系列基于材料组分的原子级特征对功函预测的重要作用,深化了人们对二维纳米材料功函本质的理解。通过稳健的机器学习模型、多条件组合筛选及密度泛函理论(DFT)计算,成功地确认了一种性能优于传统OLED阳极材料氧化铟锡(ITO)的新型二维纳米材料——PS。



  


背景介绍
有机发光二极管(OLED)是一种新型的显示技术,具有自发光、视角宽、色彩丰富、能耗低等优点,被广泛应用于智能手机、电视、‌平板(笔记本)电脑、‌可穿戴设备。然而,传统的OLED阳极材料ITO不仅易碎、价格昂贵,而且功函相对较低(4.3 ~ 4.7 eV),难以与大多数空穴传输层材料的最高占据分子轨道(HOMO)能级相匹配,导致器件的空穴传输效率仍有较大的提升空间;这些缺点导致ITO在OLED中的应用受到限制。二维纳米材料因其高透明度、高载流子迁移率以及机械柔韧性等优势,在OLED阳极材料方面具有极大的应用潜力,有望取代ITO。目前,研究人员已经预测出数以万计的新型二维纳米材料;然而,如何从这个庞大的材料家族中快速筛选出具有合适功函的材料并加以研究,仍是该领域亟待解决的核心问题。作为人工智能的重要分支,机器学习能够在底层物理机制未知的情况下,快速、高效地从可用数据中学习并总结事物发展的规律,因此对于探索具有特定功能的纳米材料具有重要的意义。近年来,利用机器学习辅助的高通量筛选方法,可使材料的研发周期大幅缩短,这为新型二维透明OLED阳极材料的快速开发带来可能。


  


本文亮点
(1) 基于C2DB数据库,建立了用于二维纳米材料功函预测的机器学习回归模型(CatBoost),其预测精度为92%,计算速度可达DFT的103倍。

(2) 基于SHAP方法的全局和局部模型解释结果表明,空间群是大多数二维纳米材料功函预测的决定性因素,而基于材料组分的原子尺度特征是其余材料功函预测的决定性因素。具有Pmn2_1P6m2空间群的材料通常具有较高的功函(> 7 eV),而具有P4/mmmP1空间群的材料通常具有较低的功函(< 4 eV)。

(3) 通过机器学习模型训练、多条件组合筛选和DFT计算,筛选出一种具有高功函(> 5 eV)、高透明度(透射率> 90%)、高导电性(电导率> 106 S m-1)的新型二维透明OLED阳极材料——PS;其性能显著优于传统的阳极材料ITO。



  


图文解析
1. 目标驱动的材料筛选框架

要点:所提出的目标驱动的材料筛选框架包括以下四部分:(i) 数据集准备:从C2DB数据库中选取1681种AB型二维纳米材料构建数据集,并以材料的功函为目标属性进行机器学习模型训练;(ii) 特征工程:生成统一长度的特征向量后,通过特征选择优化输入特征集,以提升模型训练效果;(iii) 模型推理:通过四个误差指标评估不同模型的性能,选取最佳模型并进行参数优化,实现最优的功函预测效果;同时采用SHAP加性解释方法揭示各特征在功函预测中起到的作用;(iv) 模型应用:将构建的功函预测模型应用于高通量筛选,用于识别具有特定功函的目标功能材料(图1)。

图2. (a)初始数据集中不同类型二维纳米材料功函的小提琴图、(b)异常值处理箱线图、异常值处理(c)前(d)后功函分布的直方图和(e) ~ (j)各模型对功函拟合效果的散点示意图

要点:采用C2DB数据库(包含4000余种二维材料的多种性质)进行模型训练;精选29种基于结构的特征(如空间群)以及一系列基于组分的原子级特征(如原子半径、电离能、电子亲和能)构建功函预测的初始特征集。模型推理阶段,选择了六种经典的机器学习回归模型进行训练,并采用R²、RMSE、MSE和MAE四个误差指标评估其性能。选择性能显著优于其他模型的CatBoost、XGBoost和GBR三个模型进行参数优化(图2)。

图3. (a) Pearson相关系数热力图、(b)特征重要性排序和经过特征工程和数据处理(c)前(d)后的三维空间可视化图

要点:通过各特征间Pearson相关系数的计算,并结合基于SHAP值的特征重要性排序结果(图3a和3b),删除相关系数大于0.8且重要性低的特征,生成包含24个特征的最优特征集。采用基于Python的shuffle函数对数据集顺序进行随机化处理,以进一步消除潜在的顺序相关性。使用t-SNE算法将特征集降维至三维和二维,以实现输入变量的空间分布可视化(图3c和3d);处理后的数据呈现明显的聚类现象,有助于模型识别数据的本质特征。


图4. 参数调优后的(a) CatBoost、(b) XGBoost和(c) GBR模型对二维纳米材料功函拟合效果的散点示意图;(d) Br6Sb2、(e) Mo2Te4和(f) Au2Br4的功函预测SHAP图(CatBoost)

要点:参数调优后,CatBoost模型在测试集上表现出最佳的性能,其MAE、RMSE和R2分别为0.20 eV、0.28 eV和0.92。基于SHAP值的局部解释结果表明,二维纳米材料的功函是多种特征协同作用的结果,而非由单一特征所决定(图4)。

图5. 功函预测模型(CatBoost)辅助高通量筛选流程图

要点:以分解能(< 0.1 eV/atom)、带隙(< 3 eV)、功函(> 5 eV)及剥离能为筛选条件,在2DMatPedia数据库中进行多轮筛选;从4066种结构简单、易于表征的AB型化合物中筛选出100种OLED阳极候选材料(包括硫族化合物、卤化物和氧化物等;图5)。

图6. (a) BiCl3和(b) PS结构的顶视图和侧视图;(c)二维OLED阳极候选材料在可见光区的透射率;(d)不同载流子浓度下PS和BiCl3沿x轴的电导率(σ, 300 K);(e)高通量筛选产生的高功函(大于7 eV)和低功函(小于4 eV)二维纳米材料的空间群分布

要点:OLED阳极材料的透明度和导电性需平衡设计。排除含有d、f区及贵金属元素的材料后,评估了10种候选材料的光学性质;其中,9种材料的透射率大于90%,具备作为OLED阳极材料的应用潜力(图6c)。此外,基于Boltzmann输运理论计算了BiCl3 (图6a)和PS (图6b)的σ/τ (电导率/弛豫时间)值及τ;PS的电导率为106至107 S m-1,达传统阳极材料ITO的10倍(图6d)。可见,二维纳米材料PS是一种理想的透明OLED阳极材料。

基于SHAP值的模型解释结果(图3b)及高通量筛选产生的高功函(大于7 eV)和低功函(小于4 eV)二维纳米材料的空间群分布(图6e),深化了对二维纳米材料功函的理解:(1) 功函由基于材料整体结构的特征和基于材料组分的原子级特征共同决定;(2) 空间群是大多数二维纳米材料功函的决定性因素,而基于材料组分的原子尺度特征是其余材料功函的决定性因素;(3) 具有Pmn2_1P6m2空间群的材料通常具有较高的功函(> 7 eV),而具有P4/mmmP1空间群的材料通常具有较低的功函(< 4 eV)。


  


总结与展望
本研究一方面深化了人们对二维纳米材料功函本质的理解,另一方面,所提出的经济、高效的目标驱动材料设计框架可用于其他高性能纳米材料的开发。


  


研理云服务器

业务介绍

研理云,研之成理旗下专门针对科学计算领域的高性能计算解决方案提供者。我们提供服务器硬件销售与集群系统搭建与维护服务。

   ● 配置多样(单台塔式、两台塔式、多台机架式),按需定制,质量可靠,性价比高。

 ● 目前已经为全国 100 多个课题组提供过服务器软硬件服务(可提供相同高校或临近高校往期案例咨询)。
 ● 公司服务器应用工程师具有量子化学第一性原理分子动力学等相关学科研究背景。
 ● 公司与多位化学、材料领域理论计算方向专家长期合作,一起探索最优服务器软硬件配置和部署。
 ● 可参与招投标。
产品特色
  ● 定制化硬件配置:提供售前实例测试,为您提供最合适的硬件配置方案。
  ● 一体化软件服务:根据需求发货前,完成系统、环境、队列、计算软件等所有内容的安装与配置,让您实现开机即用
  ● 完善的售后服务:为每位客户建立专属服务群,遇到问题及时解决。大大降低使用学生使用门槛和缓解老师压力。三年硬件质保 + 三年免费软件技术支持。
  ● 已购买客户咨询:我们已有超过100位已购买客户,可以给您提供相同城市或者临近城市已购买客户的联系方式,以提供真实案例咨询  
 ● 赠送课程学习机会:可选课程包括量子化学(Gaussian),第一性原理,(Vasp),分子动力学模拟(Lammps、Grommacs),钙钛矿计算模拟(Vasp)等。具体赠送方案以沟通结果为准。



扫码添加客服微信


1. 仪器表征基础知识汇总
2. SCI论文写作专题汇总
3. Origin/3D绘图等科学可视化汇总
4. 理论化学基础知识汇总
5. 催化板块汇总
6. 电化学-电池相关内容汇总贴
7. 研之成理名师志汇总
更多科研作图、软件使用、表征分析、SCI 写作、名师介绍等干货知识请进入后台自主查询。