变分图编码器能够有效地将图卷积网络与变分自编码器相结合,并已广泛应用于生物医学图结构数据中。
2024年11月8日,
军事医学科学院伯晓晨、Song He、Yixin Zhang以及上海大学机电工程与自动化学院昝鹏合作,在
Nat Mach Intell发表文章
Reusability report: exploring the utility of variational graph encoders for predicting molecular toxicity in drug design。
研究人员基于变分图编码器开发了一个框架NYAN,旨在促进计算机辅助药物设计中的分子性质预测。在NYAN中,从变分图自编码器中获得的低维潜在变量被用作通用的分子表示,在整个药物发现过程中展现出卓越的性能和多功能性。
与其他最先进的分子特性预测方法,如基于transformer(KPGT、UniMol和 PharmHGT)、基于图神经网络 (MolCLR)、基于长短期记忆(BAN)、基于知识图谱(KANO)等的方法相比,配备常见替代模型的NYAN在毒性预测方面显示出有竞争力或更好的性能。
图 5:配备代理模型的 NYAN 潜在表示与毒性预测中最先进的分子特性预测方法之间的比较
研究人员还利用NYAN潜在空间的低维和特征多样性,设计了一种具有特征增强和共识推理的多任务学习策略,进一步推动了多终点急性毒性估计。
与以往前沿的急性毒性预测方法相比--包括单任务深度神经网络、单任务随机森林、多任务深度神经网络、图卷积神经网络和深度学习共识架构--实验证明,配备NYAN潜伏的多任务学习框架,称为MT-NYAN,可以进一步提高急性毒性任务的估计性能。
总体来说,利用更广泛的毒性数据,研究人员验证了原研究中提出的NYAN框架在毒性评估方面的能力。原始研究中的图变自动编码器在分子特征表示方面具有明显优势。研究人员还探索了原始研究中提出的代用模型之外的下游模型的性能,发现集合学习方法--深度森林--可以进一步提高NYAN潜在表征在分子毒性预测中的性能。通过与目前先进的基于变换器、GNN、LSTM 和知识图谱的分子性质预测方法进行实验比较,进一步证明了将 NYAN 潜在表征与简明代用模型相结合进行毒性预测的优越性。
尽管NYAN已被证明高效简洁,具有良好的通用性,但仍有可能优化变异图编码器的结构。例如,它的训练目前仅依赖于分子SMILES字符串,其中包含原子间的图结构信息。纳入更丰富、更详细的分子信息,进一步提高变异图编码器的表征学习能力,如三维结构知识、多模态分子数据等,将是未来可能的改进方向。
参考资料:
https://nature.66557.net/articles/s42256-024-00923-6
感兴趣的读者,可以添加小邦微信加入
读者实名讨论微信群