前面草堂君给大家系统介绍了2k析因设计和数据分析的内容,包括2k析因设计的原理和运用场景、2^2析因设计及案例分析、2^3析因设计及案例分析、2k析因设计及案例分析以及单次重复2k析因设计和案例分析等内容,大家可以点击下方文章链接进行回顾:最新实验设计(Minitab软件)的系列文章,请从公众号下方导航栏获取实验设计(Minitab软件)导航页获取。今天草堂君将给大家介绍附加中心点的2k析因设计及其数据分析原理。
实验设计使用的数据分析方法为各种方差分析,这些不同类型的方差分析被统称为一般线性模型,从名称可知,这些方差分析都是有线性假定的,也就是说,在不考虑交互效应和多项式的情况下,因变量和自变量之间的关系可以用下方传统的线性回归方程表示:
从上面的方程可知,自变量xi每增加1,因变量y增加βi,也就是说自变量和因变量之间是线性相关关系。那么线性回归方程是否可以考虑非线性的情况呢?其实是可以的,但是能够增加的非线性因素一般仅限于交互项和多项式项,可以用下方回归方程表示:
如下方两张三维图所示,纵轴表示因变量,两个横轴表示两个自变量,如果两个自变量与因变量之间只存在线性关系,也就是上方第一个公式表示的关系,那么做出来的三维图就如下方左侧图形,是一个平面;如果自变量和因变量的关系如上方第二个公式所示,那么图形就如下方右侧图形,是一个曲面。
在前面的内容中,草堂君介绍过,实验设计的方差分析模型可以纳入交互项,分析交互项是否显著,如果交互项显著,说明存在调节效应,因此由调节效应导致的非线性情况,方差分析模型是可以直接得出结论的。至于多次项是否显著的结果,方差分析模型一般不会直接输出(除非自己在方差分析模型中加入多次项),这是因为方差分析原理没有考虑自变量多次项的情况,虽然可以由分析者自己在模型中加入,但是分析结果是不准确的。实验设计中有专门的响应曲面设计,草堂君将在后面的文章中具体介绍。如果分析者需要考虑多项式导致的非线性关系是否显著,可以通过在实验设计中附加中心点,然后比较中心点实验数值与四个角实验数值的平均值,如果两者之间差异很大,那么这个平面一定是弯曲的,也就是非线性的。
本篇文章,草堂君给大家介绍如何通过附加中心点设计,实现自变量的二次效应的检验,这是响应曲面设计和分析的一种方法,更为具体的会在后面的内容中介绍,包括三次效应,多次效应等,本篇文章作为一个抛砖引玉的动作,帮助大家了解分析的思路。二次响应模型如下所示,这个模型其实是上面模型的一个二次项的形式:
下式是二次项弯曲部分的离差平方和,如果周边四点实验数据的平均值与中心点实验数据的平均值相差很多,那么离差平方和就会很大,那么就会得到显著的结论。
某企业考虑影响化学品产率的四个因素:温度(A)、压强(B)、催化剂浓度(C)和搅拌速度(D),每个因素取两个水平,每个实验只进行一次。企业进行析因分析的目的是,摸索出一个最适合的生产条件,希望减少催化剂浓度,这样可以节省成本。这是一个单次重复的2k析因设计,实验数据如下所示:
由于这是一个单次重复的2k析因设计,按照前面我们介绍的内容,可以通过正态概率图或半正态概率图,筛选出有显著性的项,然后再建立模型进行分析(回顾:实验分析技术:Minitab的正态概率图用于单次重复的2k析因分析)。本篇文章,可以在上面四个实验因子的中心点,也就是取每个因子的高水平和低水平的中心点进行重复实验,本篇文章在中心点进行四次重复,得到四个实验数据73,75,66,69。
1、因为数据采用的是文章:实验分析技术:Minitab的正态概率图用于单次重复的2k析因分析的案例,区别在增加了四次中心点实验,所以minitab实验设计的操作过程,点击上方文章链接回归即可。将四次中心点实验数据添加到最后面四行即可,如下图所示:中心点取值也就是上方四个因素:温度,压强,催化剂浓度和搅拌速度的高水平(代号+1)和低水平(代号-1)的中心值(代号0)。将实验数据填入后,进行分析。
(可前往qq群:577312904和134373751下载案例数据)2、点击菜单【统计】-【DOE】-【因子】-【分析因子设计】,将产率输入选入响应框内。点击【项】按钮。
3、点击【项】按钮,进行全模型分析,将所有主效应和交互效应项都选入【所选项】框中,点击【确定】,然后再上一层对话框中继续点击确定,输出结果。
1、Pareto图和标准化效应正态图。从下方两个图可知,有显著性的效应项为A、C、D、AD和AC五项,这个结果和文章: 的结果相同。
2、模型拟合结果。从方差分析结果可知,因为本次数据加入和四个中心点数据,所以可以直接输出全模型的方差分析结果,上篇文章介绍过,单次测量的全因子实验,是无法直接输出全因子方差分析结果的。方差分析结果显示,有显著性的效应项包括A,C,D,AC,AD五项;在误差上,有个失拟项,值等于1.51,这一项就是二次项的均方差,p值等于0.780,表示中心点的平均值与所有16个因子水平组合点上的实验数值的平均值之间没有显著性差异,也就代表空间图不存在弯曲,说明所有四个因子的二次项效应不显著。
从上面介绍的内容可知,通过在实验设计中附加中心点,不仅可以对实验因子的多次项是否显著进行检验,而且可以使单次测量的实验数据能够进行全模型分析,。在进行实验设计和数据分析时,采用的都是方差分析这样的一般线性模型,这类模型不仅指能分析线性关系,也能分析由交互项和多项式这样的非线性关系。考虑多项式的实验设计和显著性检验又被称为响应曲面设计和分析,草堂君会在后面详细介绍,这篇文章就作为一个引子。
公众号的文章都是一文一例,所有例题的数据文件及minitab软件也都已上传到QQ群(群号:577312904或134373751)