一 PAUP*简介
PAUP* 全称Phylogenetic Analysis Using Parsimony (and Other Methods) 是美国佛罗里达大学的David Swofford 博士编写的,是用最大简约法建立进化树最重要的软件,同时与ModelTest 软件一起,是进化模型筛选等的必备软件,也可以进行如极大似然法建树及其他分析。在同类软件中,几乎拥有最快的运行速度,性能卓越。PAIP*能在MacOS, Windows,Unix等平台上运行。目前最新版本为paup4a156
其网址为:http://people.sc.fsu.edu/~dswofford/paup_test/
基本 指令 (如下图 1)
filenameExecute (or exe) filename----->导入比对好的序列文件( .nex)格式
Cleartrees-----> 清除所有生成的树Quit-----> 退出 PAUP
?------->显示所有命令
基本 的建树步骤: exe(导入文件 )>outgroup(设置外类群或不)>set criterion (设置建树类型 ML or MP DistanceML or MP DistanceML or MP Distance ML or MP DistanceML or MP Distance)>lset (pset/set)(建树参数设置 )>hsearch(建树策略设置 )>bootstrap (计算设置 )>savetrees(保存设置 )
(一)ML 树(步骤):
1,exe filename.nex 打开要分析文件
2,cstatus; tstatus 检查文件当前的设置状态
3,outgroup name 指定树的外类群为根(可选择,也可以做无根树后期在其他看
树软件中设置)
4,set criterion=likelihood 设置建树标准为 ML
5,lset参数设置需要先寻找合适的模型及参数,可以用 ModelTest or JModelTest 先对序列进行模型选择 ,再参照选择的 合适模型参数 进行此项设置(见后文 JModelTest 使用说明):
LestNST=1/2/6 (1-所有模型的替代速率一致;2-默认设置;6-根据选择出的模型 进行多个参数设置)。若设置 NST=6,则继续如下参数设置:
Lestrmatrix=(rAC rAG rAT rCG rCT)---选择的模型中得到的相对应碱基替代速率 值,没有则无需设置
Lsetbasefreq=(frqA frqC frqG) ----选择的模型中计算出的 A,C,G 碱基的频率
Lset rates=gamma/equal---gamma 表示模型+G;equal 或不设置表示平衡(无+G+I) 若设置 rates=gamma,则需要设置 shape=value----数值表示模型的gamma 分布 Lsetpinvar=value---设置数值表示位点不接受替代速率的比率,由选择模型得到, 不设置表示默认为 0
以上可以一并设置,如:
Lsetnst=6 rmatrix=(value) basefreq=(value) rates=gamma shape=value pinvar=value 6,hsearch 参数用来设置和寻找合适的建树策略
Hsearch start=stepwise/NJ-----选择第一个树的策略(stepwise 默认,NJ-NJ 树);
Addseq=simple/random-----simple单一的,默认设置;random 随机
Nreps=value------随机(random)次数 Rseed=value-----设置随机种子数
Swap=TBR/SPR/NNI/NONE------树枝搜寻策略,常用 TBR 7, bootstrap nreps=value brlens=yes
search=heuristic/nj/UPGMA/faststep/bandBtreefile=name------设置使用 bootstrap 建树的相关参数
8,savetreesfile=name.tre format=nexus/phylip/…(可选设置) root=yes brlens=yes savebootp=brlensfrom=value to=value-----保存从第几个到第几个树,包括根,枝长及 bootstrap
9, pscorestreelist(all/number-number)/ci=yes ri=yes rc=yeshi=yes KHtest=yes-----设置计算所有(all)或者(eg.,11-50 第11 到第 50 个树)的一致性(CI),维持 力(RI),调节一致性(RC),同源性(HI)检测以及对树的拓扑结构进行相似 性(KHtest, K ishino-Hasegawa test; KHtest 不适合检测ML 树)检测(此项更多 用在 MP 方法建树分析中)。
10,contree all/percentvalue(合并计算%value 的树)或者 contree all/strict=yes(计 算一个严格一致树)semistrict=yes(半严格一致树)
11,showtrees 或者 savetrees from=value to=value-----显示树或保存树
12,Quit 回车,退出
PAUP
(二)MP 树
1,exefilename.nex 打开要分析文件
2,cstatus; tstatus 检查文件当前的设置状态
3,outgroup name 指定树的外类群为根(可选择,也可以做无根树后期在其他看 树软件中设置)
4,set criterion=parsimony 设置建树标准为 MP
5,pset gapmode=missing/indel/newstate----定义空位,缺失(missing)或空位(indel) 或第五位点(newstate)-----只能针对 MP 树设置!
6,psetancstates=name-----设置祖先个体(与 outgroup 类似)
7,hsearch start=stepwise/NJaddseq=simple/random nreps=value rseed=value swap=tbr/spr/nni/none-----设置 HSEARCH 参数寻找合适的建树策略
8,bootstrap nreps=value brlens=yes
search=heuristic/nj/UPGMA/faststep/bandB treefile=name------ 设 置 使 用
bootstrap 建树的相关参数
9, savetrees file=name.tre root=yes brlens=yes savebootp=brlens from=value to=value-----保存从第几个到第几个树,包括根,枝长及 bootstrap
10,pscorestreelist(all/number-number)/ci=yes ri=yes rc=yes hi=yes KHtest=yes------ 设置计算所有(all)或者(eg.,11-50 第 11 到第 50 个树)的一致性(CI),维持 力(RI),调节一致性(RC),同源性(HI)检测以及对树的拓扑结构进行相似性(KHtest, Kishino-Hasegawa test)检测。
11,contree all/percent value(合并计算%value的树)或者 contree all/strict=yes(计 算一个严格一致树)semistrict=yes(半严格一致树)
12,showtrees 或者 savetrees from=value to=value-----
显示树或保存树
13,Quit 回车,退出 PAUP
(三)NJ 和 UPGMA 树
1,1,exe filename.nex 打开要分析文件
2,cstatus; tstatus 检查文件当前的设置状态
3,outgroup name 指定树的外类群为根(可选择,也可以做无根树后期在其他看树软件中设置)
4,set criterion=distance 设置建树标准为距离
5,dset 采用距离构建树的参数设置:
Dset distance=user/total/mean/abs/jc/P/f81/tajnei/k2p/f84/hky85/k3p/…-------定义距 离模型,常用K2P/P/HKY85/JC
Rates=equal/gamma----替 代 速 率 , 默 认 equal ;若 rates=gamma,则需 设置
shape=value pinvar=value(设置参数与 ML 树构建中的模型筛选一样)
6,showdist-------显示距离矩阵; savedist file=nameformat=tabtext/nexus/phylip/onecolumn triangle=lower/upper/both----保存距离文件, 格式及上三角,下三角或矩形格式;
7, NJ (or upgma)brlens=yes showtree=yes treefile=name.tre -------NJ 法(或 UPGMA 法)查找所有的树
8,dset objective=me/lsfit-------设置距离树的构建标准,默认 ME(最小进化树)或 lsfit(最小平方树);若设置 objective=lsfit, 则需要 power=2(默认) 9,hsearchnreps=value rseed=value swap=tbr/spr/nni/none-----设置 HSEARCH 参数 寻找合适的建树策略
10,bootstrap nreps=value brlens=yes search=heuristic/nj/UPGMA/faststep/bandBtreefile=name------设置使用 bootstrap 建树
11 , savetreesfile=name.tre root=yes brlens=yessavebootp=brlens from=value to=value-----保存从第几个到第几个树,包括根,枝长及 bootstrap
12,contree all/percentvalue(合并计算%value 的树)或者 contree all/strict=yes(计 算一个严格一致树)semistrict=yes(半严格一致树)
13,showtrees 或者 savetrees from=value to=value-----显示树或保存树
*:使用 MP,ML 和 distance 构建的树保存为.tre 格式都可以用 treeview 等分析树 的软件打开
14,Quit 回车,退出 PAUP
(四)不同类型数据的兼并性检测(ILD test)-----partition homogeneity test
此检测用于检测不同类型数据能够一起合并分析
1, 将需要分析的数据先进行合并,头尾相连后比对,保存为 NEXUS 格式文件
2, Exe filename.nex-------导入文件
3, Charpartition filename=name:start-end,name:start-. -------按序列长度设置不同 数据的分割位置(e.g.,charpartition myfile=AH:1-400,ycf1=401-.; 最后的*. *表示 到最后一个字符,也可以写完整的最后一个字符的位置)
4, Cstatus or tstatus-----查看数据状态
5, Set criterion=parsimony-------设置检测标准为 parsimony
6, Hsearch swap=tbr------设置搜索标准为 TBR
7, Hompartpartition=filename nreps=value------设置检测参数进行检测,最后的 结果P 值不显著表明两个标记不存在显著的冲突,可以合并进行分析(如下图 2)
图2
8, Quit 回车,退出
感谢杨师兄的指导和提供的资料!
注意生信培训班信息,请查阅:
2017北京市计算中心9月培训班通知 (公众号报名优惠)
还有就是可以分享或资料!
福利来啦!生信学习资料大赠送!
欢迎分享!