专栏名称: 吕华课题组
吕华课题组公众号
目录
相关文章推荐
51好读  ›  专栏  ›  吕华课题组

Environ. Sci. Technol. |水环境下的聚合物生物降解:基于结构-生物降解关系元分析的机器学习模型

吕华课题组  · 公众号  ·  · 2025-02-17 15:00

正文

请到「今天看啥」查看全文


大家好,今天给大家分享一篇近期发表在 Environ. Sci. Technol. 的研究进展,题 为: Polymer Biodegradation in Aquatic Environments: A Machine Learning Model Informed by Meta-Analysis of Structure Biodegradation Relationships 该工作的通讯作者是来自 凯斯西储大学的张慧春教授。

每年生产约 4.003 亿吨固态和 3630 万吨液态聚合物,广泛应用于多个行业。然而,约 94% 的聚合物最终成为环境污染物,导致微塑料问题。虽然可降解聚合物能显著缩短其环境寿命,但其在总生产量中的占比不到 2% 因此,推动可降解聚合物的研究和应用显得尤为重要。 提高聚合物生物降解性通常通过结构修饰和添加剂实现,而这些改善与聚合物结构紧密相关。现有 生物降解 数据主要针对如聚乙烯醇( PEG )、淀粉、聚(乙烯醇)( PVA )和聚羟基丁酸酯( PHB )等可降解聚合物,限制了结构的多样性 ,且 因实验条件不同而难以比较,但机器学习模型提供了新的预测聚合物 生物 降解的思路

本文 旨在开发一个回归模型来预测水环境中聚合物的有氧生物降解性 。作者从文献和实验中收集了数据集,对 26 种不同的聚合物进行了 28 次生物降解测试,还将 11 种被分类为不可降解但缺乏实验数据的聚合物添加到合成数据集中。进行了元分析,评估了实验条件、聚合物结构和聚合物特性对生物降解的影响。然后,使用不同的分子描述符来表示聚合物重复单元的结构,并筛选机器学习算法。此外,还将聚合物的热分解温度( T d )和聚合物基因组预测的其他特性作为描述符纳入模型。 最后,通过 Shapley 加法解释( SHAP )分析解释了模型,并与元分析结果的比较进行验证。 (图 1

1 . 研究思路图


首先,作者 分别收集文献、实验和模拟得到的数据,构建了一个 涵盖 74 种聚合物、 202 组生物降解数据和 1779 个单独的数据点 的数据集。经过筛选,最终 1 21 组数据用于元分析。(图 2

2. 可降解聚合物汇总


为了评估实验条件对生物降解的影响,首先作者考察了生物降解量化方法的影响 ,结果表明,溶解性有机碳( DOC )法的生物降解量高于其他测量方法 。在比较了所有聚合物组的生物降解后,作者根据 Tukey HSD 确定了具有统计差异的组对,并将它们分为快、中和慢组 。预测数据使用 Hill sigmoid 模型从动力学曲线拟合中获得,该模型之前已显示与生物降解数据拟合良好 。作者还评估了熔点( T m )和 结构对生物降解的影响 ,选择了 四种聚合物:聚酯(第 1 组和第 2 组)、二醇 - 二酸聚酯(第 3 组和第 4 组)、聚烯烯碳酸酯(第 11 组)和丙烯酸基聚合物(第 10 组) 。虽然熔融过程不是生物降解的先决条件,但 T m 表示聚合物亚结构和链柔韧性,这会影响酶的可及性。 T m 的增加通常对应生物降解性的下降 2 碳二醇 - 二酸聚酯 表现出相反的结果。作者还 研究了分子量( M w )对生物降解性的影响 PCL PEG 的生物降解性随分子量增加而降低, PASP 的生物降解性增强,而 PPG 则表现出先增加后减少的趋势 (图 3

3. 元分析分析影响生物降解的因素


随后,作者开发回归模型来预测生物降解百分比,筛选了 11 种算法: 决策树回归、弹性网络、梯度增强回归、 k 近邻回归( KNN )、 LASSO 、线性回归、随机森林( RF )回归、跨读回归、岭回归、支持向量回归和 XGBoost 回归( XGB XGB RF 是性能最好的模型 ,选择 XGB 进行进一步的模型开发 。同时 ME 嵌入表示法和摩根指纹表示法被确定为最有效的 (图 4 a

作者 将附加的描述符和数据集纳入基础模型,以评估它们对模型性能的影响 然而,加入 T m 并未改善 ME 的表现,且略微降低了摩根的表现,这可能是因为 T m 仅与特定类型的聚合物相关。相比之下,加入热解温度( T d )则提高了两种模型的表现 。最终,摩根模型结合详细指南、 T d 和扩展的实验及合成数据集,被选为最终模型。 (图 4 b

4. ML 算法和聚合物表征筛选


最后 作者 通过 SHAP 分析进行模型解释 。反应时间被确定为最具影响力的特征, 第二重要 T d ,它对生物降解产生负面影响。在所有输入变量中,有 18 个最重要的特征,其中识别出了四个重要的 结构。每个 结构可以由不同的摩根位表示 。(图 4d e

综上, 作者 探索了不同聚合物结构和生物降解性之间的关系 。通过整理一个包含 74 种聚合物和 1779 个数据点的广泛好氧生物降解数据集。随后进行了元分析,评估了实验条件、聚合物结构以及聚合物结构 与特性综合影响对生物降解的作用。接着,开发了一个机器学习模型,用于预测水环境中聚合物的生物降解性 ,达到了 0.66 测试分数。该模型可以应用于超过 20 种不同的聚合物组,预测误差小于 20% 。此外,模型验证与元分析结果一致,未见测试集的预测结果与已有的经验生物降解知识相符。


者: ZXY 校: ZHR

DOI: 10.1021/acs.est.4c11282

Link: https://doi.org/10.1021/acs.est.4c11282

上一篇







请到「今天看啥」查看全文