转自:微生物互作 iMcro
原文献信息:Srivastava, S.; Wang, W.; Zhou, W.; Jin, M.; Vikesland, P. J. Machine learning-assisted surface-enhanced raman spectroscopy detection for environmental applications: A review. Environ Sci Technol 2024.
表面增强拉曼光谱(Surface-Enhanced Raman Spectroscopy, SERS)因其在高灵敏度和高特异性检测环境污染物方面的能力而备受关注。这项技术的成本效益及其潜在的便携性进一步提升了其在广泛应用中的吸引力。然而,SERS分析也面临着一系列挑战,例如如何管理大规模高维数据、检测环境干扰因素中的低浓度目标物,以及应对重叠光谱峰带来的复杂关系。为了解决这些问题,越来越多的研究采用机器学习(Machine Learning, ML)方法,利用多变量工具对SERS数据进行高效分析。本综述详细探讨了将机器学习应用于SERS分析时需要考虑的关键步骤。此外,我们回顾了将不同机器学习工具与SERS相结合,用于
检测环境样品中的病原体和(无)机污染物的多种环境应用
。我们旨在深入了解这些背景下机器学习的复杂性和优势,同时探索SERS与机器学习协同应用的未来潜力,以实现真实场景中的应用。
主要内容:
SERS是一种高灵敏度化学和生化检测技术,能增强目标分子的拉曼信号至单分子检测水平。其增强机制包括电磁场放大和电荷转移过程,使得SERS在超高灵敏度分子检测中表现卓越。SERS提供特定分子振动指纹图谱,无需复杂预处理即可识别多种物质。
SERS分子检测方法分为无标记和标记两类。
无标记SERS中,目标分子直接与SERS活性基底作用,产生独特拉曼光谱,能有效区分细菌种类并减少荧光干扰。然而,无标记SERS面临光谱峰重叠和基底变异性等技术挑战,使得特定分子识别复杂。
对于拉曼信号较弱的分子,如病毒和重金属,标记SERS方法更为适用。该方法通过在纳米粒子表面附着强拉曼散射分子(拉曼报告分子)开发SERS标签,结合生物识别元件,实现特异性识别和定量。标记SERS特别适用于生物分子识别和定量,如病毒、致病菌和生物分子等。
机器学习(ML)是人工智能分支,通过数据和经验学习提升性能,实现预测、分类和决策。在ML中,数据集分为训练集和测试集,进一步分为监督学习和无监督学习。监督学习基于标记数据进行预测,典型算法有回归、决策树和神经网络。无监督学习则发现未标记数据中的模式。
在SERS分析中,构建ML模型包括数据预处理、模型开发和性能分析。
数据预处理是基础,包括去除干扰、平滑图形、归一化等。
SERS产生海量数据,面临分析挑战。
ML能够处理大量数据,进行多重分析,揭示复杂关系。传统SERS分析专注于单变量评估,但ML能利用多个光谱分析,提供更准确结果,揭示隐藏趋势,拓展SERS分析能力。ML在SERS中应用于检测生物污染物,如细菌、病毒等,为环境监测和实时决策提供了可能。
3. SERS-ML 在生物污染物检测中的应用
SERS能够提供
细菌
独特的光谱指纹,但光谱的相似性使得有效区分变得困难。通过结合机器学习模型,如PCA、SVM和HCA,可以揭示SERS光谱中的细微差别,实现细菌的高精度识别和量化。例如,SERS-ML已成功应用于区分大肠杆菌、金黄色葡萄球菌等细菌,以及抗生素耐药性的大肠杆菌菌株。
在
病毒
检测方面,SERS-ML同样表现出色。传统方法如ELISA和RT-PCR虽然灵敏度高,但耗时较长。而SERS-ML能够在不牺牲特异性和灵敏度的情况下,快速检测到极低浓度的病毒。例如,利用功能化金纳米针阵列和PCA-SVM模型,可在5分钟内检测到低至80拷贝/mL的SARS-CoV-2病毒。此外,通过设计特定的SERS探针,还可以实现病毒变种的实时检测。除了直接检测病毒外,SERS-ML还可以通过分析病毒感染后细菌或其代谢物的SERS信号变化来间接检测病毒。
SERS在
核酸
检测中表现突出,优于DNA微阵列等方法。虽然无标记检测面临挑战,但采用多变量分析如PCA和Tr-SVM分类器可提高精度。通过核酸杂交的间接方法,SERS探针可在极低浓度下检测核酸。在环境样品中,选择拉曼探针的多个特征峰并使用RF等机器学习进行多变量分析,可增强检测稳健性,与ddPCR相比无显著差异。
4. SERS-ML用于有机污染物的检测
SERS-ML技术在有机污染物检测中展现出显著效果,尤其针对
多环芳烃(PAHs)
和
有机磷酸酯类农药(OPPs)
。PAHs因致癌性和环境污染性备受关注,但疏水性和光谱重叠等挑战限制其检测。通过表面修饰和ML方法,如CNN,可实现高精度分类和浓度预测,解决复杂场景下的分析难题。Bajomo等人提出的CaPE算法进一步提高了SERS光谱解析能力,有效识别PAHs混合物。对于OPPs,SERS-ML技术采用无标记策略或利用报告分子相互作用,结合深度学习模型如ResNet,实现了高分类和回归准确性。Li等人通过等离子体纳米立方体超表面检测多种OPPs,PCA提取光谱差异作为模型输入,成功识别环境水样中的OPPs,排除基质干扰,浓度预测准确性高。
5.
利用SERS-ML检测无机污染物
SERS技术在水质监测中用于检测无机污染物,包括
阴离子和重金属阳离子
。对于阴离子,如硝酸盐、亚硝酸盐和硫酸盐,SERS面临电荷排斥挑战,但可通过阳离子涂层纳米颗粒和基底克服。ML技术的引入有望实现多重快速检测。对于重金属阳离子,SERS通过形成配位复合物间接检测,如使用螯合剂检测多种金属离子。PCA方法有助于区分不同金属离子,但在真实样本中预测低浓度金属离子存在困难。结合CNN等ML技术,SERS可实现更精准的重金属检测,如As(V)和Cr(VI)的检出限极低。此外,利用细菌代谢对重金属的响应,SERS结合ML算法也可检测饮用水和废水中的重金属,灵敏度和特异性高。这些方法在复杂样本中表现出稳定的性能,为水质监测提供了有力工具。
6.SERS-ML在微塑料检测中的应用
SERS-ML技术在
微塑料
检测中展现出高效能。微塑料作为新型污染物,广泛存在于环境中,对生态和人类健康构成潜在风险。已有多种SERS方法能检测微塑料,但微塑料间光谱相似性促使ML方法的应用。Luo等人结合CNN与SERS,实现了对六种微塑料的高精度识别和分类,准确率达99.54%。Kim等人开发了3D-PGNP纳米结构,结合逻辑回归模型,能在低浓度下检测聚苯乙烯,且数字计数与浓度呈对数趋势。该模型在复杂环境样本中也能有效检测微塑料,回收率高。SERS-ML技术为微塑料的快速、准确检测提供了有力工具,有助于评估其对环境和健康的潜在风险。