专栏名称: 解螺旋
解螺旋——医生科研最好的帮手。无论你是科研零基础,抑或初窥门径,你都可以在解螺旋获得极大的提升,从而面对基金、论文、实验游刃有余。解螺旋课堂是所有热爱科研技能学习的医生聚集地,解螺旋会员是医生科研全方位的贴心助手,加入我们,体验改变。
目录
51好读  ›  专栏  ›  解螺旋

基础扫盲贴:如雷贯耳的BLAST到底是啥?

解螺旋  · 公众号  · 医学  · 2017-07-20 18:00

正文

科研经验 | 文献 | 实验 | 工具 | SCI写作 | 国自然

作者:麦子

转载请注明:解螺旋·临床医生科研成长平台


Blast(Basic Local Alignment Search Tool),可谓生信领域最常用的工具,拿到一段序列(测序结果,或设计好的引物等等),一般都会去blast一下,查找相似序列。在查找相似序列的基础上衍生出了各种作用,比如鉴别基因组,蛋白质,查找特定靶区,检验引物特异性等等。自打1990年由Altschul SF等人开发出来,NCBI引进,至今还在改善,更新算法。

 

量身选用数据库

 

网址:https://blast.ncbi.nlm.nih.gov/Blast.cgi


做BLAST不仅要考虑选择哪种算法,还要考虑选哪个数据库来比对。我们最常用的可能就人类或小鼠基因组+转录组,但仍可根据自身情况选择合适的数据库,能大大节省检索时间,并提高返回的结果的质量和特异性。

 


不过这么多库怎么选呢,可以点一下旁边的问号(Help),查看选所的数据库的说明:

 


再者,如果你已经知道你要查的序列来自哪个物种,或你要跟哪个物种比对,也可以在Organism选项框中输入,也可以减少BLAST的操作程序,节省时间。

 


不同的序列要用不同的算法

 

BLAST工具跟一套手术器械似的,不同的算法干不同的活,得根据自己需要的信息,选择需要的工具。可以看到检索页面上方有5个选项卡,分别代表5种查询类型。

 


各大类之下可能还有几个小分类可选:

 


它们的功能要点总结如下:

 


结果解读


找一小段蛋白序列来试一下那个新算法Quickblastp。可能是我的序列太短了,并没有感觉到Quick (0.0) 如果你的序列够长可以体会一下。

 

首先会看到一个表头,展示这次比对的基本信息,如比对类型、序列长度、所选的数据库等等,就不贴图了。

 

接下来就是图形描述(Graphic Summary)。

 


第一部分是保守域,当检测到时才会显示。

 

第二部分是比对上的序列(hit)在查询序列上的分布。有刻度的条带是序列的坐标,其下的每一个细条带代表一段hit,其颜色是按上方的颜色标尺显示比例得分(alignment score),得分越高,相似度越高。另外还可注意E value,E值越低,相似度越高,点击可显示详细信息。

 

保守域也可点开查看详情,在每个hit上悬浮鼠标可看到它编码的蛋白的3D结构图以及功能等详细说明,在下方的列表中点开+号还可看到具体的序列。

 


这样便可对你的序列特征和功能有个大致的了解。

 

参考资料:

1.http://bitesizebio.com/21223/how-does-blast-work/

2.http://bitesizebio.com/26522/blast-off-the-basic-local-alignment-search-tool-explained/

3.ftp://ftp.ncbi.nlm.nih.gov/pub/factsheets/HowTo_BLASTGuide.pdf


投稿邮箱: [email protected]

合作微信:helixlife6