科研经验 | 文献 | 实验 | 工具 | SCI写作 | 国自然
作者:麦子
转载请注明:解螺旋·临床医生科研成长平台
Blast(Basic Local Alignment Search Tool),可谓生信领域最常用的工具,拿到一段序列(测序结果,或设计好的引物等等),一般都会去blast一下,查找相似序列。在查找相似序列的基础上衍生出了各种作用,比如鉴别基因组,蛋白质,查找特定靶区,检验引物特异性等等。自打1990年由Altschul SF等人开发出来,NCBI引进,至今还在改善,更新算法。
网址:https://blast.ncbi.nlm.nih.gov/Blast.cgi
做BLAST不仅要考虑选择哪种算法,还要考虑选哪个数据库来比对。我们最常用的可能就人类或小鼠基因组+转录组,但仍可根据自身情况选择合适的数据库,能大大节省检索时间,并提高返回的结果的质量和特异性。
不过这么多库怎么选呢,可以点一下旁边的问号(Help),查看选所的数据库的说明:
再者,如果你已经知道你要查的序列来自哪个物种,或你要跟哪个物种比对,也可以在Organism选项框中输入,也可以减少BLAST的操作程序,节省时间。
BLAST工具跟一套手术器械似的,不同的算法干不同的活,得根据自己需要的信息,选择需要的工具。可以看到检索页面上方有5个选项卡,分别代表5种查询类型。
各大类之下可能还有几个小分类可选:
它们的功能要点总结如下:
找一小段蛋白序列来试一下那个新算法Quickblastp。可能是我的序列太短了,并没有感觉到Quick (0.0) 如果你的序列够长可以体会一下。
首先会看到一个表头,展示这次比对的基本信息,如比对类型、序列长度、所选的数据库等等,就不贴图了。
接下来就是图形描述(Graphic Summary)。
第一部分是保守域,当检测到时才会显示。
第二部分是比对上的序列(hit)在查询序列上的分布。有刻度的条带是序列的坐标,其下的每一个细条带代表一段hit,其颜色是按上方的颜色标尺显示比例得分(alignment score),得分越高,相似度越高。另外还可注意E value,E值越低,相似度越高,点击可显示详细信息。
保守域也可点开查看详情,在每个hit上悬浮鼠标可看到它编码的蛋白的3D结构图以及功能等详细说明,在下方的列表中点开+号还可看到具体的序列。
这样便可对你的序列特征和功能有个大致的了解。
参考资料:
1.http://bitesizebio.com/21223/how-does-blast-work/
2.http://bitesizebio.com/26522/blast-off-the-basic-local-alignment-search-tool-explained/
3.ftp://ftp.ncbi.nlm.nih.gov/pub/factsheets/HowTo_BLASTGuide.pdf
投稿邮箱: [email protected]