1.11.1. 右键单击“PCGsRNA”、“PCGs12RNA”或“AA”的PartitionFinder2或ModelFinder的结果文件夹,然后选择“Import to MrBayes”。基因序列文件将被导入“Alignment File”输入框,最优分区策略和进化模型将被导入“Partition Models”,双击该按钮可以查看分区结果(注意,如果此按钮选中,Models”等参数的设置将会失效,即基于分区结果建树)。
1.11.2. 选择外群。
1.11.3. “MCMC Settings”参数设置。
a. Generations:指定单次运行的MCMC世代数。建议设置一个较大的代数,因为当结果收敛时,可以随时在PhyloSuite中结束运行并推导系统发育树。
b. Sampling Freq:定义马尔可夫链被采样的频率(即每多少代采样一次),该值和MCMC的世代数决定产生的样本的数量。如果设置的值过小,输出的结果将会占较大内存。PhyloSuite(v1.2.3)使用1000作为默认值,即运行1,000,000代将产生1000个采样统计结果(每个结果包含一棵树)。
c. Nrun:同时运行的独立分析数量,默认值为2。
d. Nchains:同时运行的马尔可夫链数。默认值为4,包括3条“热链”和1条“冷链”(详见MrBayes手册)。
f. Contype:一致树的类型。“Halfcompat”:生成50%多数规则树(majority-rule tree),即后验概率值(BPP)小于0.5的进化枝将被视为多歧枝。“Allcompat”,BPP小于0.5的进化枝依然视为二歧枝,该参数与PAUP中勾选了“Show frequencies of all observed bipartitions”选项的50%多数规则树相似。PhyloSuite(v1.2.3)将以“Allcompat”为默认参数。
g. Conformat:一致树的格式。“Simple”:生成简单的一致树,可以被多数下游程序(例如iTOL)识别。“Figtree”:结果文件中包含丰富的可以被Figtree软件识别的统计信息,但iTOL等软件无法识别。PhyloSuite(v1.2.3)默认使用“Simple”。
h. Burnin Fraction:在BI分析中,马尔可夫链刚开始通常会经历一段不稳定状态,因此为了参数估计更可靠,同时减少模拟误差(simulation errors),通常会选择删除早期不稳定的马尔可夫链运行结果,这一过程被称为“burnin”。“Burnin Fraction”值默认为0.25,即前25%样本被删除。此外,“burnin”选项可以直接指定要删除的样本数。
1.11.4. 设置结果文件夹名称(在这里命名为“PCGsRNA-BI”,“PCGs12RNA-BI”和“AA-BI”),然后单击“Start”按钮开始运行。
1.11.5. BI运行收敛后,点击“Stop”按钮右侧的下拉菜单,选择“Stop the run and infer the tree”,得到树和统计结果文件(图27)。
MrBayes使用MCMC进行系统发育的贝叶斯推断,MCMC运行的理想状态是达到目标后验概率分布。例如,2个运行(run)生成的树样本应该非常相似。当MrBayes开始运行时,“Progress”框将实时显示“Average standard deviation of split frequencies”(ASDSF)值。一般来说,当ASDSF值低于0.01时,便可以认为BI运行收敛,此时可以停止运行获得结果文件(具体操作见1.11.5)。
此外,还有2种指标可用于评估MCMC运行是否收敛。第一种是potential scale reduction factor(PSRF)指标,当运行收敛时,所有参数的PSRF应接接近1.0。另一个是effective sample size(ESS),其值高于100才算收敛。这两个指标都可以在log文件中找到。(详见MrBayes说明书)
如果BI运行结束但不收敛怎么办?