专栏名称: 生信百科
依托高校科研平台,面向生物信息科研工作者。生物信息学习资料;常见数据分析技巧、流程;公共数据库分享;科研思路分享;
目录
相关文章推荐
第十一诊室  ·  这个比脸更易衰老的部位,很多人都忽略了…… ·  4 天前  
医学影像沙龙  ·  非常详细的肺部解剖!建议收藏! ·  5 天前  
医学影像沙龙  ·  医院最累科室最新排名,影像科稳居榜首!! ·  6 天前  
51好读  ›  专栏  ›  生信百科

PAUP构建系统发育树

生信百科  · 公众号  · 医学  · 2017-08-12 09:00

正文

一 PAUP*简介

PAUP* 全称Phylogenetic Analysis Using Parsimony (and Other Methods) 是美国佛罗里达大学的David Swofford 博士编写的,是用最大简约法建立进化树最重要的软件,同时与ModelTest 软件一起,是进化模型筛选等的必备软件,也可以进行如极大似然法建树及其他分析。在同类软件中,几乎拥有最快的运行速度,性能卓越。PAIP*能在MacOS, Windows,Unix等平台上运行。目前最新版本为paup4a156

其网址为:http://people.sc.fsu.edu/~dswofford/paup_test/

基本 指令 (如下图 1)

filenameExecute (or exe) filename----->导入比对好的序列文件( .nex)格式

Cleartrees-----> 清除所有生成的树Quit-----> 退出 PAUP

?------->显示所有命令

基本 的建树步骤: exe(导入文件 )>outgroup(设置外类群或不)>set criterion (设置建树类型 ML or MP DistanceML or MP DistanceML or MP Distance ML or MP DistanceML or MP Distance)>lset (pset/set)(建树参数设置 )>hsearch(建树策略设置 )>bootstrap (计算设置 )>savetrees(保存设置 )

(一)ML 树(步骤):

1,exe filename.nex   打开要分析文件

2,cstatus;  tstatus   检查文件当前的设置状态

3,outgroup  name  指定树的外类群为根(可选择,也可以做无根树后期在其他看

树软件中设置)

4,set criterion=likelihood    设置建树标准为 ML

5,lset参数设置需要先寻找合适的模型及参数,可以用 ModelTest or JModelTest 先对序列进行模型选择 ,再参照选择的 合适模型参数 进行此项设置(见后文 JModelTest 使用说明):

LestNST=1/2/6 (1-所有模型的替代速率一致;2-默认设置;6-根据选择出的模型 进行多个参数设置)。若设置 NST=6,则继续如下参数设置:

Lestrmatrix=(rAC rAG rAT rCG rCT)---选择的模型中得到的相对应碱基替代速率 值,没有则无需设置

Lsetbasefreq=(frqA  frqC  frqG) ----选择的模型中计算出的 A,C,G 碱基的频率

Lset rates=gamma/equal---gamma 表示模型+G;equal 或不设置表示平衡(无+G+I) 若设置 rates=gamma,则需要设置 shape=value----数值表示模型的gamma  分布 Lsetpinvar=value---设置数值表示位点不接受替代速率的比率,由选择模型得到, 不设置表示默认为 0

以上可以一并设置,如:

Lsetnst=6 rmatrix=(value) basefreq=(value) rates=gamma shape=value pinvar=value 6,hsearch  参数用来设置和寻找合适的建树策略

Hsearch start=stepwise/NJ-----选择第一个树的策略(stepwise 默认,NJ-NJ 树);

Addseq=simple/random-----simple单一的,默认设置;random 随机

Nreps=value------随机(random)次数 Rseed=value-----设置随机种子数

Swap=TBR/SPR/NNI/NONE------树枝搜寻策略,常用 TBR 7, bootstrap      nreps=value brlens=yes

search=heuristic/nj/UPGMA/faststep/bandBtreefile=name------设置使用 bootstrap 建树的相关参数

8,savetreesfile=name.tre format=nexus/phylip/…(可选设置) root=yes brlens=yes savebootp=brlensfrom=value to=value-----保存从第几个到第几个树,包括根,枝长及 bootstrap

9, pscorestreelist(all/number-number)/ci=yes ri=yes rc=yeshi=yes KHtest=yes-----设置计算所有(all)或者(eg.,11-50 第11 到第 50 个树)的一致性(CI),维持 力(RI),调节一致性(RC),同源性(HI)检测以及对树的拓扑结构进行相似 性(KHtest, K ishino-Hasegawa test; KHtest 不适合检测ML 树)检测(此项更多 用在 MP 方法建树分析中)。

10,contree all/percentvalue(合并计算%value 的树)或者 contree all/strict=yes(计 算一个严格一致树)semistrict=yes(半严格一致树)

11,showtrees 或者 savetrees from=value to=value-----显示树或保存树

12,Quit   回车,退出

PAUP

(二)MP 树

1,exefilename.nex   打开要分析文件

2,cstatus;  tstatus  检查文件当前的设置状态

3,outgroup name 指定树的外类群为根(可选择,也可以做无根树后期在其他看 树软件中设置)

4,set criterion=parsimony  设置建树标准为 MP

5,pset gapmode=missing/indel/newstate----定义空位,缺失(missing)或空位(indel) 或第五位点(newstate)-----只能针对 MP 树设置!

6,psetancstates=name-----设置祖先个体(与 outgroup 类似)

7,hsearch start=stepwise/NJaddseq=simple/random nreps=value rseed=value swap=tbr/spr/nni/none-----设置 HSEARCH 参数寻找合适的建树策略

8,bootstrap  nreps=value  brlens=yes

search=heuristic/nj/UPGMA/faststep/bandB     treefile=name------   设 置 使 用

bootstrap 建树的相关参数

9, savetrees    file=name.tre   root=yes   brlens=yes   savebootp=brlens   from=value to=value-----保存从第几个到第几个树,包括根,枝长及 bootstrap

10,pscorestreelist(all/number-number)/ci=yes ri=yes rc=yes hi=yes KHtest=yes------ 设置计算所有(all)或者(eg.,11-50 第 11 到第 50 个树)的一致性(CI),维持 力(RI),调节一致性(RC),同源性(HI)检测以及对树的拓扑结构进行相似性(KHtest, Kishino-Hasegawa   test)检测。

11,contree all/percent value(合并计算%value的树)或者 contree all/strict=yes(计 算一个严格一致树)semistrict=yes(半严格一致树)

12,showtrees 或者 savetrees from=value to=value-----

显示树或保存树

13,Quit   回车,退出 PAUP

(三)NJ 和 UPGMA 树

1,1,exe filename.nex   打开要分析文件

2,cstatus;  tstatus   检查文件当前的设置状态

3,outgroup name 指定树的外类群为根(可选择,也可以做无根树后期在其他看树软件中设置)

4,set criterion=distance   设置建树标准为距离

5,dset  采用距离构建树的参数设置:

Dset distance=user/total/mean/abs/jc/P/f81/tajnei/k2p/f84/hky85/k3p/…-------定义距 离模型,常用K2P/P/HKY85/JC

Rates=equal/gamma----替 代 速 率 , 默 认 equal ;若 rates=gamma,则需 设置

shape=value  pinvar=value(设置参数与 ML 树构建中的模型筛选一样)

6,showdist-------显示距离矩阵; savedist file=nameformat=tabtext/nexus/phylip/onecolumn triangle=lower/upper/both----保存距离文件, 格式及上三角,下三角或矩形格式;

7, NJ (or upgma)brlens=yes showtree=yes treefile=name.tre -------NJ 法(或 UPGMA 法)查找所有的树

8,dset objective=me/lsfit-------设置距离树的构建标准,默认 ME(最小进化树)或 lsfit(最小平方树);若设置 objective=lsfit,  则需要 power=2(默认) 9,hsearchnreps=value rseed=value swap=tbr/spr/nni/none-----设置 HSEARCH 参数 寻找合适的建树策略

10,bootstrap       nreps=value             brlens=yes search=heuristic/nj/UPGMA/faststep/bandBtreefile=name------设置使用 bootstrap 建树

11 , savetreesfile=name.tre root=yes brlens=yessavebootp=brlens from=value to=value-----保存从第几个到第几个树,包括根,枝长及 bootstrap

12,contree all/percentvalue(合并计算%value 的树)或者 contree all/strict=yes(计 算一个严格一致树)semistrict=yes(半严格一致树)

13,showtrees 或者 savetrees  from=value to=value-----显示树或保存树

*:使用 MP,ML 和 distance 构建的树保存为.tre 格式都可以用 treeview 等分析树 的软件打开

14,Quit   回车,退出 PAUP

(四)不同类型数据的兼并性检测(ILD test)-----partition homogeneity  test

此检测用于检测不同类型数据能够一起合并分析

1, 将需要分析的数据先进行合并,头尾相连后比对,保存为 NEXUS 格式文件

2, Exe  filename.nex-------导入文件

3, Charpartition filename=name:start-end,name:start-. -------按序列长度设置不同 数据的分割位置(e.g.,charpartition myfile=AH:1-400,ycf1=401-.;  最后的*.  *表示 到最后一个字符,也可以写完整的最后一个字符的位置)

4, Cstatus or tstatus-----查看数据状态

5, Set criterion=parsimony-------设置检测标准为 parsimony

6, Hsearch swap=tbr------设置搜索标准为 TBR

7, Hompartpartition=filename nreps=value------设置检测参数进行检测,最后的 结果P 值不显著表明两个标记不存在显著的冲突,可以合并进行分析(如下图 2)

图2

8, Quit 回车,退出


感谢杨师兄的指导和提供的资料!


注意生信培训班信息,请查阅:


2017北京市计算中心9月培训班通知 (公众号报名优惠)


还有就是可以分享或资料!


福利来啦!生信学习资料大赠送!


欢迎分享!