大家好,今天给大家分享一篇近期发表在
Environ. Sci. Technol.
上
的研究进展,题
为:
Polymer Biodegradation in Aquatic Environments: A Machine
Learning Model Informed by Meta-Analysis of Structure
Biodegradation Relationships
。
该工作的通讯作者是来自
凯斯西储大学的张慧春教授。
每年生产约
4.003
亿吨固态和
3630
万吨液态聚合物,广泛应用于多个行业。然而,约
94%
的聚合物最终成为环境污染物,导致微塑料问题。虽然可降解聚合物能显著缩短其环境寿命,但其在总生产量中的占比不到
2%
。
因此,推动可降解聚合物的研究和应用显得尤为重要。
提高聚合物生物降解性通常通过结构修饰和添加剂实现,而这些改善与聚合物结构紧密相关。现有
生物降解
数据主要针对如聚乙烯醇(
PEG
)、淀粉、聚(乙烯醇)(
PVA
)和聚羟基丁酸酯(
PHB
)等可降解聚合物,限制了结构的多样性
,且
因实验条件不同而难以比较,但机器学习模型提供了新的预测聚合物
生物
降解的思路
。
本文
旨在开发一个回归模型来预测水环境中聚合物的有氧生物降解性
。作者从文献和实验中收集了数据集,对
26
种不同的聚合物进行了
28
次生物降解测试,还将
11
种被分类为不可降解但缺乏实验数据的聚合物添加到合成数据集中。进行了元分析,评估了实验条件、聚合物结构和聚合物特性对生物降解的影响。然后,使用不同的分子描述符来表示聚合物重复单元的结构,并筛选机器学习算法。此外,还将聚合物的热分解温度(
T
d
)和聚合物基因组预测的其他特性作为描述符纳入模型。
最后,通过
Shapley
加法解释(
SHAP
)分析解释了模型,并与元分析结果的比较进行验证。
(图
1
)
图
1
.
研究思路图
首先,作者
分别收集文献、实验和模拟得到的数据,构建了一个
涵盖
74
种聚合物、
202
组生物降解数据和
1779
个单独的数据点
的数据集。经过筛选,最终
1
21
组数据用于元分析。(图
2
)
图
2.
可降解聚合物汇总
为了评估实验条件对生物降解的影响,首先作者考察了生物降解量化方法的影响
,结果表明,溶解性有机碳(
DOC
)法的生物降解量高于其他测量方法
。在比较了所有聚合物组的生物降解后,作者根据
Tukey HSD
确定了具有统计差异的组对,并将它们分为快、中和慢组
。预测数据使用
Hill sigmoid
模型从动力学曲线拟合中获得,该模型之前已显示与生物降解数据拟合良好
。作者还评估了熔点(
T
m
)和
亚
结构对生物降解的影响
,选择了
四种聚合物:聚酯(第
1
组和第
2
组)、二醇
-
二酸聚酯(第
3
组和第
4
组)、聚烯烯碳酸酯(第
11
组)和丙烯酸基聚合物(第
10
组)
。虽然熔融过程不是生物降解的先决条件,但
T
m
表示聚合物亚结构和链柔韧性,这会影响酶的可及性。
T
m
的增加通常对应生物降解性的下降
,
2
碳二醇
-
二酸聚酯
表现出相反的结果。作者还
研究了分子量(
M
w
)对生物降解性的影响
,
PCL
和
PEG
的生物降解性随分子量增加而降低,
PASP
的生物降解性增强,而
PPG
则表现出先增加后减少的趋势
。
(图
3
)
图
3.
元分析分析影响生物降解的因素
随后,作者开发回归模型来预测生物降解百分比,筛选了
11
种算法:
决策树回归、弹性网络、梯度增强回归、
k
近邻回归(
KNN
)、
LASSO
、线性回归、随机森林(
RF
)回归、跨读回归、岭回归、支持向量回归和
XGBoost
回归(
XGB
)
。
XGB
和
RF
是性能最好的模型
,选择
XGB
进行进一步的模型开发
。同时
ME
嵌入表示法和摩根指纹表示法被确定为最有效的
。
(图
4
a
)
作者
将附加的描述符和数据集纳入基础模型,以评估它们对模型性能的影响
。
然而,加入
T
m
并未改善
ME
的表现,且略微降低了摩根的表现,这可能是因为
T
m
仅与特定类型的聚合物相关。相比之下,加入热解温度(
T
d
)则提高了两种模型的表现
。最终,摩根模型结合详细指南、
T
d
和扩展的实验及合成数据集,被选为最终模型。
(图
4
b
)
图
4.
ML
算法和聚合物表征筛选
最后
,
作者
通过
SHAP
分析进行模型解释
。反应时间被确定为最具影响力的特征,
第二重要
是
T
d
,它对生物降解产生负面影响。在所有输入变量中,有
18
个最重要的特征,其中识别出了四个重要的
亚
结构。每个
亚
结构可以由不同的摩根位表示
。(图
4d
、
e
)
综上,
作者
探索了不同聚合物结构和生物降解性之间的关系
。通过整理一个包含
74
种聚合物和
1779
个数据点的广泛好氧生物降解数据集。随后进行了元分析,评估了实验条件、聚合物结构以及聚合物结构
与特性综合影响对生物降解的作用。接着,开发了一个机器学习模型,用于预测水环境中聚合物的生物降解性
,达到了
0.66
的
R²
测试分数。该模型可以应用于超过
20
种不同的聚合物组,预测误差小于
20%
。此外,模型验证与元分析结果一致,未见测试集的预测结果与已有的经验生物降解知识相符。
作
者:
ZXY
审
校:
ZHR
DOI:
10.1021/acs.est.4c11282
Link:
https://doi.org/10.1021/acs.est.4c11282
上一篇