人工智能、机器学习和深度学习在植物育种中的应用
简介
随着人工智能(AI)技术的进步,特别是机器学习(ML)和深度学习(DL)技术的推动,植物育种领域经历了一场范式转变。这些尖端技术改变了我们对植物生物学的理解。
从解码植物防御的复杂分子机制到自动化疾病检测和优化营养水平,AI正在重塑植物育种的格局。AI辅助的组学技术提供了对植物-病原体相互作用的洞察,并促进了应激反应基因的识别。
本篇主要参考专题(https://doi.org/10.3389/fpls.2024.1420938),介绍几篇关于计算机技术在植物科学中的应用的论文。
AI算法用于解码复杂的组学数据来阐明植物防御的分子基础
Murmu等人的研究强调了AI算法,特别是ML和DL,在解码复杂的组学数据以阐明植物防御的分子基础方面的潜力。
植物通过复杂的防御系统来应对各种生物和非生物压力。组学技术(包括基因组学、转录组学、蛋白质组学和代谢组学)革命性地探索了植物防御机制,揭示了植物在应对各种压力时的分子复杂性。然而组学数据的复杂性和规模需要精密的分析工具以获得有意义的见解。
在他们的综述文章中,人工智能算法(特别是机器学习和深度学习)在解析植物防御研究中的复杂组学数据方面、AI辅助组学技术在增强作物保护策略和确保全球粮食安全方面的应用、挑战和前景。通过将AI与组学技术相结合,研究人员可以揭示复杂的基因调控网络,并开发针对性的干预措施以增强作物的抗逆性。
(A)开发机器学习模型的基本步骤。机器学习的类型:(B)有监督和(C)无监督技术。
人工智能辅助组学技术提供了一个可靠的工具包,使我们能够深入了解植物防御的分子基础,为在气候变化和新兴疾病中实现更有效的作物保护策略奠定基础。
基于自组织映射(SOM)的ML方法来解码不同温度条件下的基因表达模式
面对气候变化和新兴疾病的挑战,AI驱动的方法提供了一套强大的工具包,以确保全球粮食安全和农业的可持续性。气候变化对农业系统构成了重大威胁,强调了阐明作物冷防御机制的重要性。
Konecny等人的研究介绍了基于自组织映射(SOM)的ML方法,以解码不同温度条件下的基因表达模式。
他们使用自组织映射(Self Organizing Maps)机器学习方法分析了五个Vitis vinifera品种在四种不同温度条件下处理的叶片基因表达数据。该算法生成了标准化基因表达数据的样本特定“肖像”,揭示了与施加的温度条件相关的独特模式。
自组织映射(SOM)展示和样本相似性分析揭示了不同温度之间明显不同的模式
他们的研究强调了SOM作为解码复杂转录组数据的价值。将自组织映射应用于葡萄转录组学,识别出在寒冷应激下触发的共调控基因模块,并提供了对葡萄藤冷防御机制分子基础的洞察。提出的机器学习方法为植物转录组学研究提供了一种有前途的选择。
oracle选择在推动基因组选择方法创新方面存在潜力
自从基因组选择在植物育种中引入以来,不同植物育种项目中实现了高遗传增益。基于基因组估计育种值(GEBVs)的各种方法已经被提出,用于选择最大化遗传增益的亲本系以及改进基因组选择预测性能的方法。尽管取得了显著进展,但准确测量长期遗传价值仍具挑战性。
Vanavermaete等人提出了oracle选择的概念,这是一种利用真实情况来最优选择亲本或优化训练群体以在每个育种周期中最大化遗传增益的假设性思维框架,为植物育种中的挑战和机遇提供了独特的视角。讨论了oracle选择对育种计划优化的影响,并强调了其在推动基因组选择方法创新方面的潜力。尽管在实际情景中不直接适用,但oracle选择激发了批判性思维并促进了育种计划设计的创新。
利用来自RGB和NIR传感器的多模态图像及机器学习模型来预测生物质和叶面积
表型组学已成为弥合植物育种中基因型-表型差距的重要工具。解析复杂性状(如高度动态的植物生长)以及在植物不同生长阶段量化其组成性状将极大地有助于解析生物质生产的遗传基础。基于RGB图像,最近开发了预测生物质的模型。然而,在不同实验中找到性能稳定的模型非常具有挑战性。
Singh等人解决了使用RGB图像开发的模型准确预测生物量的挑战,探讨了使用来自RGB和NIR传感器的多模态图像及机器学习模型来非侵入性地预测生物质和叶面积的方法,强调了在不同实验中稳定性能的需求。
i-Traits预测生物量的数据分析与建模管道
研究展示了通过使用16种机器学习模型可以准确预测RGB和NIR图像中的生物质相关性状(如鲜重、干重和茎面积)。结果简化了与生物量生产相关的新基因的发现,并通过非侵入性、高通量的表型组学技术打破了产量瓶颈。