专栏名称: 环境人Environmentor
热爱我环境,光大我事业!
目录
相关文章推荐
51好读  ›  专栏  ›  环境人Environmentor

中南大学李海普课题组CEJ:可解释的机器学习指导金属-有机框架的模块化设计以增强对砷酸盐的吸附去除

环境人Environmentor  · 公众号  ·  · 2024-10-03 12:25

正文

‍‍‍‍‍‍‍ ‍‍‍‍‍‍‍‍‍‍ ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍
点击上方蓝字 关注我们

题目: Enhancing arsenate removal through interpretable machine learning guiding the modular design of metal–organic frameworks
第一作者: 蔺祖弘
通讯作者 李海普 教授
通讯单位: 中南大学化学化工学院
DOI: 10.1016/j.cej.2024.155058


图片摘要

1 :图片摘要。



成果简介

近日,中南大学化学化工学院,环境与水资源研究中心的李海普教授团队在《 Chemical Engineering Journal 》上发表了题为 “Enhancing arsenate removal through interpretable machine learning guiding the modular design of metal–organic frameworks” 的研究论文( DOI 10.1016/j.cej.2024.155058 ),提出了一种通过可解释机器学习指导的金属 - 有机框架( MOFs )模块化设计方法,以增强对砷酸盐 As(V) 的吸附去除。该工作构建了基于决策树和分子指纹的十二个可解释机器学习预测模型,以预测和优化 MOFs 的吸附性能。研究从 MOFs 的分子片段组成、二级构建单元和拓扑网络,以及 MOFs 的结构参数出发,提出了一种特别针对 MOFs 吸附 As(V) 的网状化学设计方案。此外,研究还界定了有利于有效 As(V) 吸附的最佳环境条件。本研究为理解 MOFs 在水处理中对 As(V) 的吸附行为提供了新的视角,有助于设计更高效的水处理 MOFs ,降低水环境中砷污染的风险



引言

金属 - 有机框架( MOFs )因其独特的多孔结构、表面电荷特性,以及丰富的不饱和活性位点,在有毒重金属砷酸盐 As(V) 的吸附领域展现出卓越的性能,从而在众多吸附剂中突颖而出。尽管如此,如何根据 As(V) 的特性设计 MOFs 以进一步提升其吸附效能仍是一个难题。在材料科学领域,数据驱动的可解释机器学习( ML )技术已被广泛用于揭示材料的构效关系。我们从 MOFs 的网状化学特性中汲取灵感,这种特性源于其由二级构建单元( SBUs )和有机配体构成的特定拓扑网络。我们推测,通过将 MOFs 的构建过程“模块化”,并用于机器学习的特征工程,不仅可以有效构建出高精度的预测模型,还能为功能性 MOFs 的设计提供指导。为此,我们采用了分子指纹( MFs )技术来解码 MOFs 中复杂的有机配体,并结合 SBUs 、拓扑网络、 MOFs 的基本结构属性以及吸附环境等因素,构建了一系列预测模型。通过模型解释,我们揭示了 MOFs 在物理和化学吸附 As(V) 过程中的关键模块特征,为增强 MOFs As(V) 的吸附能力提供了策略性指导。我们相信,这种基于机器学习的模块化设计 MOF 策略将极大地拓展其在目标污染物去除领域的应用前景



图文导读

工作流程

在本工作中的数据集来源于文献和实验室的前期工作,通过 MOFid RDkit 包将 MOFs 拆解成了有机配体的分子指纹, SBUs 和拓扑结构标识符。进一步地,结合了 MOFs 的结构参数和吸附环境条件,通过六种基于决策树的机器学习算法,构建了一组预测模型。这些模型均采用贝叶斯优化方法进行超参数调整,在 220 轮迭代优化过程中不断精炼,以达到最优性能。十折交叉验证用以防止模型过拟合,以确保了模型的鲁棒性。最终,借助模型解释技术,我们提出了一套旨在增强 MOFs As(V) 吸附能力的设计方案(图 2 )。



2 :本研究的工作流程。

模型性能

通过 Pearson 相关矩阵精简数值型的结构特征,剩余结构特征,包括孔隙极限直径( PLD )、最大孔腔直径( LCD )、晶体密度( ρ )、体积可及比表面积( VSA )和可接近孔体积( AV ),最终用于模型训练。由决策树( DT )、随机森林( RF )、梯度提升决策树( GBDT )、直方图梯度提升( HGB )、极端梯度提升( XGB )和 CatBoost CB )六种算法构建的模型在训练集上均实现了 R 2 值大于 0.99 ,很好的验证了基于我们特征工程思路建模的合理性。为了确保模型的泛化性和鲁棒性,我们根据测试集上最高的 R 2 值以及最低的均方根误差( RMSE )和平均绝对误差( MAE )来选择最佳模型。最终优选出基于 XGB 算法和 Morgan 指纹的 XGB-Morgan 模型,达到了 0.97 R 2 值、 11.78 RMSE 7.34 MAE (图 3


3 :不同模型在训练集( a )和测试集( b )上的性能表现。


增强MOF物理吸附的模块化设计

MOFs As(V) 的物理吸附是重要的吸附过程之一。通过 XGB-Morgan 模型的 SHAP 解释和部分依赖图( PDP )分析,在考虑了结构尺寸对污染物扩散的影响后,我们确定了 PLD 5.0–10.0 Å LCD 10–30 Å VSA 1000–2500 m²/cm³ AV ρ 分别在 1.0–2.0 cm³/g 1.75 g/cm³ 左右范围内的 MOFs As(V) 可达到最佳吸附效果。然而过大的结构可能不利于 As(V) MOFs 内部的扩散。为了精确定义结构参数的适宜范围并简化 MOFs 的定向设计流程,我们通过 2D-PDP 分析筛选出相关性小于等于 0.5 的特征,进一步细化了 PLD LCD VSA AV 的最优范围,分别为 7.5–10 Å 10–16 Å 2000–2400 m²/cm³ 0.8–1.6 cm³/g (图 4


4 MOFs 物理结构参数的全局 SHAP 结果( a ),以及 MOFs VSA b )、 AV c )、 PLD d )、 LCD e )、 ρ f )的 PDP PLD VSA g ), LCD VSA h ), AV VSA i )的 2D-PDP


增强 MOF 化学吸附的模块化设计

化学吸附是 MOFs 吸附 As(V) 的最主要机理。通过 XGB-Morgan 模型的 SHAP 分析,我们识别了对 MOFs 化学吸附性能至关重要的设计要素,包括有机连接体中的特定分子片段和 SBUs 的多样性,以及拓扑结构的合理选择。我们发现,含有脂肪链的羧酸、带有取代基的芳香环羧酸和吡唑片段等有机连接体分子,以及具有开放金属位点( OMS )的 SBUs ,如钴( Co )和镧( La ),对增强 As(V) 的化学吸附起到了积极作用。此外,选择如 pcu spn rna 这样的 3D 拓扑结构,有助于优化 MOFs 的物理结构参数,从而为 As(V) 提供有效的扩散路径和吸附位点。基于这些发现,我们建议在 MOFs 设计中考虑这些关键特征,以实现对 As(V) 的高效化学吸附(图 5


5 MOFs 有机配体的分子指纹( a )、 SBUs b )、拓扑网络( c 全局 SHAP 结果,以及 MOFs SBUs d )、拓扑网络( e )的 PDP


总之,为了提升 MOFs As(V) 的吸附性能,上游的 MOFs 设计中的理想有机配体应具备如脂肪链上的羧酸、含取代基的芳香环羧酸以及吡唑片段等特定片段。这些精心设计的机配体不仅促进了以 OMS ,例如 Co Ce La 为基础的稳定 3D 拓扑网络的形成,而且还能通过氢键与 As(V) 发生相互作用。此外, MOFs 中的金属 - 羟基与 As(V) 形成的络合物进一步增强了其化学吸附能力。选择如 pcu spn rna 这类 3D 拓扑结构,能够为 MOFs 提供适宜的物理空间,包括 7.5 10 Å PLD 10 16 Å LCD 2000 2400 m²/cm³ VSA 以及 0.8 1.6 cm³/g AV 。这些物理结构参数的优化,旨在扩大用于物理吸附的有效比表面积,并确保 As(V) 分子能够顺利扩散至 SBUs 内的活性位点,实现高效的化学吸附。同时,在下游应用中,还需综合考量诸如静电吸引、浓度效应、吸附抑制作用以及吸热吸附等环境因素,以实现 MOFs As(V) 吸附的最大化(图 6

6 MOFs 的模块设计策略,从提升 As(V) 的物理吸附到化学吸附。

‘’

小结

本研究提出了一种结合可解释机器学习( ML )的建模和材料设计方法,专门针对 MOFs 在吸附 As(V) 方面的应用。我们的建模方法深入分析了 MOFs 的化学组成、物理结构和吸附环境,并通过融合多种 ML 算法与分子指纹技术,开发了一组高精准度的预测模型。这些模型显著提高了对 As(V) 吸附性能的预测准确度,并通过模型的解释能力,识别出影响吸附性能的关键结构参数。依托模型解释,我们为 MOFs 的模块化设计提出了策略性建议,推荐选用具有开放金属位点的二级构建单元和含有特定分子片段的有机配体,同时选择适宜的 3D 拓扑网络结构。这些设计参数的精心优化,目的在于充分发挥 MOFs 在物理和化学吸附方面的潜力,从而显著提高对 As(V) 的吸附效率。我们的研究成果不仅强化了 MOFs 在水环境中的应用,拟提升其去除 As(V) 的能力,还为机器学习在材料科学的其他应用领域提供了创新的建模思路,尤其是在去除有害污染物和水质净化方面
本工作受到国家重点研发计划( 2023YFC3207000 )和中南大学研究生自主创新项目( 2023ZZTS0728 )的资助。
‘’

作者简介

通讯作者: 李海普,中南大学化学化工学院教授,博士生导师。担任水环境与农产品安全湖南省重点实验室主任,中南大学环境与水资源研究中心主任。主要研究方向包括环境科学、饮用水及食品安全、功能材料的研发及界面物理化学。近年来负责的科研项目有:国家重点研发计划项目、国家公益性行业(农业)科研专项课题、国家环境保护公益性行业科研专项课题、国家重大科技专项“水专项”课题、省级科技计划及国际交流合作项目等。近 3 年在 Appl. Catal. B:Environ. , Chem. Eng. J., Sci. Total. Environ., Sep. Purif. Technol. 等国际知名刊物发表论文近 50 余篇
联系方式: [email protected]
实验室链接: https://ccce.csu.edu.cn/weaps.htm

第一作者:蔺祖弘,博士研究生,现就读于中南大学化学化工学院,主要研究方向为机器学习、大语言模型和环境工程的交叉方向。博士期间以第一作者在 Chemical Engineering Journal Separation and Purification Technology 等期刊发表 SCI 论文三篇。
联系方式: [email protected]

文献信息

Zuhong Lin, Hui Cai, Hongjia Peng, Ying Fang, Pengxu Pan, Haipu Li, Ying Yang, Jingjing Yao, Enhancing arsenate removal through interpretable machine learning guiding the modular design of metal–organic frameworks, Chemical Engineering Journal, 497, 2024, 155058.


https://doi.org/10.1016/j.cej.2024.155058



投稿 中南大学化学化工学院,环境与水资源研究中心李海普教授团队 稿、合作 、转载、进群,请添加小编微信Environmentor2020!环境人Environmentor是环境领 最大的学术公号 ,拥有 20W+活跃读者 。由于微 信修改了推送规则,请大家将环境人Environmentor加为 星标 ,或每次看完后点击页面下端的 “在看” ,这样可以第一时间收到我们每日的推文! 环境人Environmentor现有综合群、 期刊投稿群、基金申请群、留学申请群、各研究领域群等共20余个,欢迎大家加小编微信Environmentor2020,我们会尽快拉您进入对应的群



往期推荐


年度热点文章Top10(2023年)
哈工大任南琪院士团队谢国俊课题组、重庆大学陈一课题组合作ES&T封面:亚硝酸盐依赖型厌氧甲烷氧化细菌的生态位分化机制
见证一个新领域的崛起——密苏里大学肖峰团队/北京师范大学李阳团队一篇承上启下的ES&T






请到「今天看啥」查看全文