专栏名称: 生信百科

依托高校科研平台，面向生物信息科研工作者。生物信息学习资料；常见数据分析技巧、流程；公共数据库分享；科研思路分享；

PAUP构建系统发育树

生信百科 · 公众号 · 医学 · 2017-08-12 09:00

正文

一 PAUP*简介

PAUP* 全称Phylogenetic Analysis Using Parsimony (and Other Methods) 是美国佛罗里达大学的David Swofford 博士编写的，是用最大简约法建立进化树最重要的软件，同时与ModelTest 软件一起，是进化模型筛选等的必备软件，也可以进行如极大似然法建树及其他分析。在同类软件中，几乎拥有最快的运行速度，性能卓越。PAIP*能在MacOS， Windows，Unix等平台上运行。目前最新版本为paup4a156

其网址为：http://people.sc.fsu.edu/~dswofford/paup_test/

基本指令（如下图 1）

filenameExecute (or exe) filename----->导入比对好的序列文件（ .nex）格式

Cleartrees-----> 清除所有生成的树Quit-----> 退出 PAUP

？------->显示所有命令

基本的建树步骤： exe(导入文件 )>outgroup（设置外类群或不）>set criterion （设置建树类型 ML or MP DistanceML or MP DistanceML or MP Distance ML or MP DistanceML or MP Distance）>lset (pset/set)（建树参数设置）>hsearch（建树策略设置）>bootstrap （计算设置）>savetrees（保存设置）

（一）ML 树(步骤)：

1，exe filename.nex 打开要分析文件

2，cstatus; tstatus 检查文件当前的设置状态

3，outgroup name 指定树的外类群为根（可选择，也可以做无根树后期在其他看

树软件中设置）

4，set criterion=likelihood 设置建树标准为 ML

5，lset参数设置需要先寻找合适的模型及参数，可以用 ModelTest or JModelTest 先对序列进行模型选择，再参照选择的合适模型参数进行此项设置(见后文 JModelTest 使用说明)：

LestNST=1/2/6 (1-所有模型的替代速率一致；2-默认设置；6-根据选择出的模型进行多个参数设置)。若设置 NST=6，则继续如下参数设置：

Lestrmatrix=(rAC rAG rAT rCG rCT)---选择的模型中得到的相对应碱基替代速率值，没有则无需设置

Lsetbasefreq=(frqA frqC frqG) ----选择的模型中计算出的 A,C,G 碱基的频率

Lset rates=gamma/equal---gamma 表示模型+G；equal 或不设置表示平衡（无+G+I）若设置 rates=gamma，则需要设置 shape=value----数值表示模型的gamma 分布 Lsetpinvar=value---设置数值表示位点不接受替代速率的比率，由选择模型得到，不设置表示默认为 0

以上可以一并设置，如：

Lsetnst=6 rmatrix=(value) basefreq=(value) rates=gamma shape=value pinvar=value 6，hsearch 参数用来设置和寻找合适的建树策略

Hsearch start=stepwise/NJ-----选择第一个树的策略（stepwise 默认，NJ-NJ 树）；

Addseq=simple/random-----simple单一的，默认设置；random 随机

Nreps=value------随机（random）次数 Rseed=value-----设置随机种子数

Swap=TBR/SPR/NNI/NONE------树枝搜寻策略，常用 TBR 7, bootstrap nreps=value brlens=yes

search=heuristic/nj/UPGMA/faststep/bandBtreefile=name------设置使用 bootstrap 建树的相关参数

8，savetreesfile=name.tre format=nexus/phylip/…(可选设置) root=yes brlens=yes savebootp=brlensfrom=value to=value-----保存从第几个到第几个树，包括根，枝长及 bootstrap

9， pscorestreelist(all/number-number)/ci=yes ri=yes rc=yeshi=yes KHtest=yes-----设置计算所有（all）或者（eg.,11-50 第11 到第 50 个树）的一致性（CI），维持力（RI），调节一致性（RC），同源性（HI）检测以及对树的拓扑结构进行相似性（KHtest, K ishino-Hasegawa test; KHtest 不适合检测ML 树）检测（此项更多用在 MP 方法建树分析中）。

10，contree all/percentvalue（合并计算%value 的树）或者 contree all/strict=yes（计算一个严格一致树）semistrict=yes（半严格一致树）

11，showtrees 或者 savetrees from=value to=value-----显示树或保存树

12，Quit 回车，退出

PAUP

（二）MP 树

1，exefilename.nex 打开要分析文件

2，cstatus; tstatus 检查文件当前的设置状态

3，outgroup name 指定树的外类群为根（可选择，也可以做无根树后期在其他看树软件中设置）

4，set criterion=parsimony 设置建树标准为 MP

5，pset gapmode=missing/indel/newstate----定义空位，缺失（missing）或空位（indel）或第五位点（newstate）-----只能针对 MP 树设置！

6，psetancstates=name-----设置祖先个体（与 outgroup 类似）

7，hsearch start=stepwise/NJaddseq=simple/random nreps=value rseed=value swap=tbr/spr/nni/none-----设置 HSEARCH 参数寻找合适的建树策略

8，bootstrap nreps=value brlens=yes

search=heuristic/nj/UPGMA/faststep/bandB treefile=name------ 设置使用

bootstrap 建树的相关参数

9， savetrees file=name.tre root=yes brlens=yes savebootp=brlens from=value to=value-----保存从第几个到第几个树，包括根，枝长及 bootstrap

10，pscorestreelist(all/number-number)/ci=yes ri=yes rc=yes hi=yes KHtest=yes------ 设置计算所有（all）或者（eg.,11-50 第 11 到第 50 个树）的一致性（CI），维持力（RI），调节一致性（RC），同源性（HI）检测以及对树的拓扑结构进行相似性（KHtest, Kishino-Hasegawa test）检测。

11，contree all/percent value（合并计算%value的树）或者 contree all/strict=yes（计算一个严格一致树）semistrict=yes（半严格一致树）

12，showtrees 或者 savetrees from=value to=value-----

显示树或保存树

13，Quit 回车，退出 PAUP

（三）NJ 和 UPGMA 树

1，1，exe filename.nex 打开要分析文件

2，cstatus; tstatus 检查文件当前的设置状态

3，outgroup name 指定树的外类群为根（可选择，也可以做无根树后期在其他看树软件中设置）

4，set criterion=distance 设置建树标准为距离

5，dset 采用距离构建树的参数设置：

Dset distance=user/total/mean/abs/jc/P/f81/tajnei/k2p/f84/hky85/k3p/…-------定义距离模型，常用K2P/P/HKY85/JC

Rates=equal/gamma----替代速率，默认 equal ；若 rates=gamma,则需设置

shape=value pinvar=value（设置参数与 ML 树构建中的模型筛选一样）

6，showdist-------显示距离矩阵； savedist file=nameformat=tabtext/nexus/phylip/onecolumn triangle=lower/upper/both----保存距离文件, 格式及上三角，下三角或矩形格式；

7， NJ （or upgma）brlens=yes showtree=yes treefile=name.tre -------NJ 法(或 UPGMA 法)查找所有的树

8，dset objective=me/lsfit-------设置距离树的构建标准，默认 ME（最小进化树）或 lsfit（最小平方树）；若设置 objective=lsfit, 则需要 power=2（默认） 9，hsearchnreps=value rseed=value swap=tbr/spr/nni/none-----设置 HSEARCH 参数寻找合适的建树策略

10，bootstrap nreps=value brlens=yes search=heuristic/nj/UPGMA/faststep/bandBtreefile=name------设置使用 bootstrap 建树

11 ， savetreesfile=name.tre root=yes brlens=yessavebootp=brlens from=value to=value-----保存从第几个到第几个树，包括根，枝长及 bootstrap

12，contree all/percentvalue（合并计算%value 的树）或者 contree all/strict=yes（计算一个严格一致树）semistrict=yes（半严格一致树）

13，showtrees 或者 savetrees from=value to=value-----显示树或保存树

*：使用 MP,ML 和 distance 构建的树保存为.tre 格式都可以用 treeview 等分析树的软件打开

14，Quit 回车，退出 PAUP

（四）不同类型数据的兼并性检测（ILD test）-----partition homogeneity test

此检测用于检测不同类型数据能够一起合并分析

1，将需要分析的数据先进行合并，头尾相连后比对，保存为 NEXUS 格式文件

2， Exe filename.nex-------导入文件

3， Charpartition filename=name:start-end,name:start-. -------按序列长度设置不同数据的分割位置（e.g.,charpartition myfile=AH:1-400,ycf1=401-.; 最后的*. *表示到最后一个字符，也可以写完整的最后一个字符的位置）

4， Cstatus or tstatus-----查看数据状态

5， Set criterion=parsimony-------设置检测标准为 parsimony

6， Hsearch swap=tbr------设置搜索标准为 TBR

7， Hompartpartition=filename nreps=value------设置检测参数进行检测，最后的结果P 值不显著表明两个标记不存在显著的冲突，可以合并进行分析（如下图 2）

图2

8， Quit 回车，退出

感谢杨师兄的指导和提供的资料！

注意生信培训班信息，请查阅：

2017北京市计算中心9月培训班通知（公众号报名优惠）

还有就是可以分享或资料！

福利来啦！生信学习资料大赠送！

欢迎分享！