蛋白质是分子生物学乃至整个生物学研究领域的重中之重,在上一期,我们介绍了一些用于检索已知信息的蛋白质数据库,文章链接:
经验分享|实用学术网站分享:蛋白质数据库篇
。
图片来源:https://images.app.goo.gl/XxbgibEMkzwCvQWr7
但事实上在实验中有时会发现全新蛋白,或者自己进行检测,因此就需要蛋白质结构预测工具。2024年诺奖正是颁给了这一领域的明星AI:AlphaFold。以下我们将逐个介绍一些蛋白质结构预测网页工具。
Alphafold
AlphaFold Protein Structure Database
Alphafold是这一领域的明星,现已更新到Alphafold3,且预测的蛋白质数据是公开的。采用深度学习技术与对特定序列的注意力机制优化预测准确性,与晶体实验结果重合度很高。
SWISS-MODEL
SWISS-MODEL
在Alphafold横空出世之前,SWISS-MODEL是科研人员常用的预测工具。它的原理是同源建模,根据提供给它的序列,自动寻找并基于相似的已知的蛋白结构进行建模预测。注意其原理是同源建模,需要有已知的相似蛋白作为模板。
I-TASSER (Iterative Threading ASSEmbly Refinement)
I-TASSER server for protein structure and function prediction
I-TASSER基于蛋白质线索模板(threading)自动化预测蛋白质结构,在CASP比赛中常年胜出。结合了序列比对、结构建模和模型精炼,可以识别结构上的功能域和潜在的功能注释,尤其适用于难以找到好模板用于同源建模的蛋白质。也可以用于预测蛋白互作和酶活性位点。它还有一个DLC:C-I-TASSER(https://zhanggroup.org/C-I-TASSER/),专门用于预测蛋白质-蛋白质复合体的结构。
Phyre2 (Protein Homology/analogY Recognition Engine V2.0)
PHYRE2 Protein Fold Recognition Server
Phyre2是一款基础工具,因用户友好而常用于教学。使用序列比对技术,常用于预测和分析蛋白质结构、功能和突变的影响。
Robetta
robetta.bakerlab.org
可以在线使用Rosetta软件进行完全自动化的建模,核心算法包括片段插入和模拟退火算法,还提供蛋白质设计和蛋白质-蛋白质对接的预测。
MODELLER
About MODELLER
MODELLER是专门的同源建模工具。
特点在于引入了能量函数优化模型,以确保结构的热力学合理性。
支持单一结构预测、多结构预测和循环建模。