专栏名称: 植物科学最前沿
致力于分享和交流植物科学研究方法、学术成果,努力构建中国植物科学研究共同体和最专业的植物科学学术传播平台。
目录
相关文章推荐
运维  ·  再见 ... ·  昨天  
运维  ·  服务部署—— Vsftpd 服务器 ·  3 天前  
51好读  ›  专栏  ›  植物科学最前沿

Mol Plant团队综述近二十年影响基因组选择育种的关键因素

植物科学最前沿  · 公众号  ·  · 2024-04-02 09:08

正文

随着全基因组测序技术的普及,基因组选择(Genome Selection, GS) 作为一项关键技术,在育种中的应用越来越广泛。GS通过分析基因组信息来预测育种材料及其后代的表现,可在幼苗期评估个体的农艺性状。与传统育种相比,GS具有高准确性和较短的育种周期,从而提高了植物育种效率。

2024年3月12日,瑞典 Rodomiro Ortiz 团队在 Molecular Plant 发表题为“ Genomic selection in plant breeding: Key factors shaping two decades of progress ”的综述文章。该论文总结了最近20年基因组选择育种的影响因素和重要进展。

https://doi.org/10.1016/j.molp.2024.03.007

在GS过程中,首先需要获得群体的基因组变异信息和表型数据。然后通过模型构建和优化,获得变异信息和表型数据的关联性。最后,对新的育种群体的个体进行基因组序列分析,预测个体的表型,从而实现基因组选择(图1)。本文全面概述了影响植物育种中基因组预测(Genomic Prediction,GP)的关键因素,包括交叉验证方法,训练数据的大小和结构和遗传多样性等方面。其中,深入探讨了训练群体规模和遗传多样性的关键作用,以及它们与育种群体之间的关系,以实现GP的准确性(图1)。


图1 GS的概况和影响基因组预测的关键因素

该文章特别强调了优化训练群体规模的重要性,探讨了其超过最佳规模后的递减回报 (图2)。在考虑资源有限性和预测准确性之间的平衡后,可实现最优的表型预测。此外,单核苷酸多态性的密度和分布、连锁不平衡的水平、遗传复杂性、性状遗传力、机器学习方法和非加性效应也是影响表型预测的重要因素。其中,作者以小麦、玉米和马铃薯为例,总结了这些因素对不同性状的GP准确性的影响。

图2 群体数据训练的优化

在模型算法方面,可分为参数模型、半参数模型和非参数模型。其中,参数模型包括线性模型和贝叶斯模型等类型,而非参数模型则包括深度学习在内的机器学习方法(图3)。为了在基因组预测中实现高准确性,理论上使用Pearson相关性作为度量标准时效果最优。然而,这仍然是一个值得研究的活跃领域。作者推测,借助超大规模的基因型和表型数据集、有效训练群体的方法优化以及其他组学方法(转录组学、代谢组学和蛋白质组学)的支持,再加上深度学习算法,可以克服当前限制的边界,实现最高可能的预测准确性,使基因组选择成为植物育种中的有效工具。

图3 基因组预测的统计方法

总之,该综述总结了影响基因组选择育种的关键因素,包括群体数据采集,表型-环境的互作和统计模型等方面,并提出了潜在的优化方向。未来,随着全基因组测序成本的持续下降,加上高通量的表型数据采集和多种优化的计算模型,高效的全基因组选择育种将变得可能。









请到「今天看啥」查看全文