专栏名称: 基迪奥生物
广州基迪奥生物官方公众平台,小圆每天分享各种生信软件使用技巧, 搜罗好玩的科研生活,定期还有掉节操的生物界八卦分享,让科研变得有意思咯~
目录
相关文章推荐
神嘛事儿  ·  我回答了 @bala-------bala ... ·  23 小时前  
数据宝  ·  两大主线爆发!机构抢先布局 ·  3 天前  
国资报告  ·  透视美国科技创新背后的“举国体制” ·  4 天前  
51好读  ›  专栏  ›  基迪奥生物

如何下载蛋白序列并进行比对分析?

基迪奥生物  · 公众号  ·  · 2024-08-18 10:59

正文

前段时间在一篇NC文章中,看到下图a这样的蛋白序列对位图,黑白配色,很高级的样子。那么,如果拿到感兴趣基因的蛋白序列,如何绘制这样好看的序列对位图呢?

Nature Communications , 2024)




1.序列Blast


首先,要有感兴趣的蛋白序列文件,保存为Fasta格式的文本文件,可使用记事本、Notepad++、Sublime等文本编辑器进行编辑保存。


接着,使用NCBI数据库中的BLAST在线工具,就可以得到同源序列。

网址链接:
https://www.ncbi.nlm.nih.gov/

注意,由于是蛋白序列,这里选择点击Protein BLAST按钮。


在BLAST工具参数设置页面,点击选择文件按钮上传我们的Fasta蛋白序列文件,其他参数保持默认,然后点击下方的 BLAST 按钮。由于只有一条序列,当然也可以直接将蛋白序列复制粘贴到输入框中。


由于是在线比对,整个任务需要一点点时间。任务完成后,在Description选项,我们可以直接查看得到的同源序列。


而在Alignment选项页面,可以查看每条序列与提交序列的相似度。


取消选择select all,选择感兴趣的序列,如这里选择7条序列,然后点击Download批量下载完整的FASTA序列。


得到的同源序列文件如下,我们可以使用文本编辑器修改序列的名称(“>”符号后面的文本),只保留序列ID即可。




2.序列Alignment


接着,使用MEGA软件进行多序列 Alignment ,通过File菜单的 Open A File/Session 命令打开序列文件。


然后,通过 Alignment 菜单下的 Align by ClustalW (或 Align by MUSCLE )进行多序列对位分析,如下图。


完成序列对位分析后,通过 Data 菜单下的 Export Alignment/FASTA Format 命令保存对位结果文件。




3.对位序列可视化


完成多序列对位后,接着使用ESPript 3.0工具进行对位序列展示。在 Aligned Sequences 选项版块点击 选择文件 按钮上传序列对位结果文件,如下图。

工具链接:
https://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi

在下方的 Alignments output layout 选项版块,设置配色方案、字体尺寸、每行的字母数、画布尺寸、图片格式等。


然后,点击 SUBMIT 按钮提交绘图任务,在弹出的窗口中下载PNG和PDF格式的图片。


按照默认的Normal配色方案,得到的绘图效果如下:


当配色方案调整为PAM250,得到的序列对位图如下:


最后,也可以将Color Scheme改为“B&W”,这样就可有得到像文献案例那样的黑白配色的对位序列图。


最后, 基迪奥生物 是定制化组学测序与生物信息分析服务领域的领先者,公司组学服务涉及单细胞组学、空间组学、翻译组、基因组等40条业务线,欢迎留言咨询!

长按识别二维码填写意向









请到「今天看啥」查看全文