专栏名称: 邃瞳科学云
邃瞳科学云是一个百家争鸣的个性化学术传播平台。依托新媒体矩阵,小程序及APP等完整产品线,在开展专业性的学术活动的同时,还致力于科普教育和科学传播,更自由、重分享。 格物致知,光被遐荒。Meet Your Science!
目录
相关文章推荐
四川商务  ·  市州观察 | ... ·  22 小时前  
中国出口信用保险公司  ·  重庆首张!西藏首张!新疆首张!中国信保助力西 ... ·  3 天前  
中国出口信用保险公司  ·  重庆首张!西藏首张!新疆首张!中国信保助力西 ... ·  3 天前  
松阳警方  ·  以“新”为帆,奋力开拓外贸新空间 ·  4 天前  
松阳警方  ·  以“新”为帆,奋力开拓外贸新空间 ·  4 天前  
51好读  ›  专栏  ›  邃瞳科学云

中科大罗毅JACS:利用自注意力神经网络修复低频振动光谱

邃瞳科学云  · 公众号  ·  · 2024-10-15 10:25

正文



第一作者:杨国昆 博士、肖恒宇 博士、高昊 博士

通讯作者:罗毅 教授、江俊 教授、汪炀 教授

通讯单位:中国科学技术大学 精准智能化学重点实验室

DOI:10.1021/jacs.4c10893




全文速览
光谱作为化学领域常用的表征手段,在化学合成、药物设计及功能材料等领域具有广泛应用。近年来,大数据与深度学习技术的兴起为化学研究带来了诸多新场景,多个课题组纷纷报道了基于深度学习和神经网络的光谱预测研究。这些研究主要集中于高通量理论计算生成的光谱,利用光谱作为描述符来预测分子的物理化学性质,如吸附能和结合能,具有重要的指导意义。然而,深度学习技术在辅助实验光谱测量及探究精密光谱背后化学内涵的应用仍较为有限,亟需进一步探索。


近日,中国科学技术大学罗毅教授、江俊教授和汪炀教授合作,利用基于注意力机制的神经网络模型,从光谱预训练出发构建了振动光谱的高频区与低频区的关联,以修复BPE分子的低频红外与拉曼信号。作者团队通过对模型的可解释性分析证明了这种关联性的根源是分子内原子和基团的振动模式相似性。该模型通过理论光谱进行预训练,展示了良好的迁移性,能够直接应用于实验测量的BPE分子光谱,修复其低频区的信号。这项研究不仅验证了光谱在连接理论与实验中的重要性,还展示了人工智能模型在识别理论与实验光谱一致性方面的潜力。




背景介绍
红外光谱和拉曼光谱是基于对分子特定旋转和振动模式引起的偶极矩与极化率变化的测量,成为识别原子结构的重要技术。这些光谱的低频区域(<1000 cm ¹)通常被称为“指纹”区域,因其对旋转和振动引起的结构变化高度敏感而得名。然而,这些指纹的特异性相对较低,且易受到多种环境因素的影响,导致信号失真。例如,仪器测量中固有的高斯比例噪声、有限的光谱分辨率造成的峰重叠、样品杂质引起的错峰,以及不可避免的环境波动所导致的信号红移,均对精确的实验表征构成重大挑战。相比之下,波数高于1000 cm ¹的高频信号更易于进行精确测量,因为它们通常具备良好的特异性,且不易出现明显的峰值重叠与噪声干扰。

图1. 低频振动光谱中容易出现的4中噪声干扰

为了验证低频光谱特征恢复的可行性,作者选择反式-1,2-双(4-吡啶基)乙烯(BPE)作为测试分子,因其具备独特的高质量信号以及高灵敏度的拉曼光谱和红外光谱。随后,作者采用了前述噪声模型,利用Voigt函数对光谱进行展宽处理。在低频区域,作者引入了随机噪声和错误峰值,并对这些光谱峰值进行了随机移动,以模拟检测过程中可能遭遇的各种环境干扰。接着,作者运用上述模型,从布满噪声的粗糙光谱信号中成功还原出清晰的低频光谱。最终,作者成功地将该模型应用于完善BPE在不同环境条件(包括吸附在金属表面和外加电场)下的振动光谱,表明该方法具备良好的可迁移性。此外,该方法有效地还原了实验测量的光谱,可直接应用于迁移模型,以获取低频区域的精确振动光谱。




图文解析
银表面吸附的BPE吸附构型分布是通过原子分子动力学模拟(AIMD)生成的,该模拟捕捉了从最初的垂直吸附构型到最终的水平吸附构型的转变过程。作者提取了3500个单步快照,并对每个构型进行了谐振频率计算,以确定吸附BPE的每个正常模式的频率及相应的红外和拉曼光谱强度,并对这些光谱线进行了扩宽处理(见图S1)。为了模拟实验中观察到的典型不清晰的低频光谱,作者对1000 cm ¹以下的范围进行了噪声处理,包括加入高斯噪声、增加额外峰值,并将峰值移向较低波数以模拟红移。如辅助信息中所述,噪声频谱的展宽因子被设定以实现谱峰重叠。在最终分析中,作者模型的输入为高达4000 cm ¹的清晰光谱,辅以1000 cm ¹以下的额外噪声,输出则包括延伸至1000 cm ¹的精确光谱。最终,将3500个噪声光谱按8:1:1的比例分为训练集、验证集和测试集。


为了建立一个用于提炼低频光谱的神经网络(NN)模型,研究团队选择了U-Net神经网络架构,该架构包括一个由编码器和解码器组成的注意层。在编码器块中,数据传输过程中数据长度减半,特征维度加倍,形成一个特征丰富的高维向量,随后该向量被传递给解码器。解码器的结构与编码器相同,但执行相反的操作,即增加数据长度并降低特征维度。解码器模块通过连接卷积编码器的向量与相同深度的递归编码器的隐藏状态,将这些高维向量恢复为序列光谱。编码器与解码器之间的连接通过注意力层实现,如图2所示。

图2. 作者使用的Attention U-net模型框架,用于修复低频光谱中的噪声


为了验证该模型相较于其他常用标准神经网络模型(如线性神经网络(LNN)、普通卷积神经网络(CNN)和普通U-Net模型)的优势,研究团队使用多个量化指标对其性能进行了比较,如图3所示。在余弦相似度(CS)、地球移动距离(EMD)、平均绝对误差(MAE)和均方根误差(RMSE)等指标上,该复合模型均表现优于这些标准模型。研究团队认为,注意力机制在频谱提炼过程中至关重要并使用热图来表示这种相关性。为了说明注意力机制的运行情况,团队提取了一些光谱样本。图3b和3c展示了注意力机制在寻找最重要的峰值和特定振动模式时的工作原理。有趣的是,这两个峰均对应于BPE分子中的乙烯基振动(见图S4-8)。这一结果与团队之前的观察一致,表明该振动模式在BPE的红外和拉曼光谱神经网络模型中占据重要地位。

图3. 作者使用的Attention U-net与其他模型的对比以及注意力热图分析


图4a-b、d-e展示了使用开发的注意力U-Net模型修复的低频光谱。无噪声的原始光谱经过对称处理,以便更好地区分。背景中的浅色线表示添加了噪声的光谱,包括光谱峰值偏移、高斯噪声和线宽化。为了比较遵循特定分布的两组序列的相似性,研究团队选择了斯皮尔曼相关系数,这是一种广泛用于测量两个分布之间非参数相关性的指标。噪声光谱与清晰光谱之间的斯皮尔曼系数较低(红外光谱:0.36,拉曼光谱:0.53),清楚地表明这类干扰严重影响了光谱分析的精度。如图4c和4f所示,经过神经网络模型的去噪处理后,这些最初相关性较差的光谱的相关性显著提高(红外光谱:0.88,拉曼光谱:0.85),凸显了模型在消除噪声和恢复主要光谱细节方面的有效性。此外,最初被高斯噪声掩盖的低频区域在经过模型细化后变得清晰可见,进一步证明了该模型在恢复光谱信息方面的优越性能。

图4. 修复的理论低频红外与拉曼光谱示例以及测试集的整体分布


图5展示了吸附在银表面的BPE分子的红外光谱修复结果。在780-880 cm ¹波长范围内的实验光谱中观察到一个宽峰,表明存在光谱信号,但由于噪声过大而难以辨识。应用光谱校正模型后,研究团队推测该峰值应表现为双峰。文献中报道的高精度实验光谱验证了校正结果的准确性,在820 cm ¹和823 cm ¹处清晰地显示了两个峰,分别对应于C-H和C-C面外弯曲振动,以及C-N和C-C面内弯曲振动。拉曼光谱结果与此观察一致,实验光谱在860-900 cm ¹附近也显示了一个信号峰。经过模型修复后,该区域出现了双双峰特征,并得到了文献数据的支持。具体而言,观察到的双音对应于879 cm ¹处的C-H面外弯曲振动和891 cm ¹处的C-C双键面内弯曲振动及环呼吸振动。值得注意的是,这四种振动模式仅在红外或拉曼响应中显现,进一步证明了模型有效地从理论计算中学习了光谱知识,并能够将这些知识反映在实验光谱中。

图5. 模型修复的实验BPE分子吸附在Ag表面的红外与拉曼光谱结果




总结与展望
在这项研究中,罗毅教授团队将U-Net网络与注意力机制相结合,从红外和拉曼光谱测量中常见的噪声低频信号中提取特征。作为概念验证,该方法被应用于修复吸附在银表面的BPE的低频振动光谱。此外,作者团队还将这一套程序和方法扩展至不同的金属基底和外加电场,证明了模型的强大可迁移性。这使得通过预训练和迁移学习方法,能够以相对较低的成本获得适用于多种情况的模型。


研究团队通过还原实验光谱来验证这些模型的稳健性及迁移能力,从而说明了从清晰的高频信号中提取特征的。该方案的主要创新在于巧妙利用注意力机制和深度卷积网络,学习由AIMD计算得到理论光谱数据,建立高频振动光谱与低频光谱之间的高维相关性,并通过将添加噪声信号与良好信号对齐来实现修复低频指纹区光谱。这一过程有效证明了光谱中蕴含大量信息,研究团队通过可解释性分析证明了高频和低频光谱关联的实质是分子内部原子基团振动模式的关联性。这项工作的另一个重要意义是证明了人工智能模型能够学习到理论计算光谱与实验测量光谱之间的一致性,探索了光谱描述符作为沟通理论与实验桥梁的可能性。


声明

本文仅用于学术分享,如有侵权,请联系后台小编删除
欢迎关注我们,订阅更多最新消息






请到「今天看啥」查看全文