ANOVA

前言

方差分析(analysis of variance)是在概率与统计学中很重要的一部分内容,方差分析用于检验多对数据的平均数差之间的显著性,如果是采用t检验的话,只能每次对2组数据进行检验,对于n组数据则需要进行2的排列组合次,并且即使每次的置信度为95%,累乘起来的置信度也不高,即容易犯错,所以需要新方法,方差分析就是解决这个问题的方法。在这一篇博客中我们只讨论单因素方差分析

1. 基本概念

概念 理解
因素 在实验设计中,控制某个变量,如温度、光照、反应物浓度等等,这就是某个因素
水平 在因素的基础上,进一步选择一些度量,比如具体的温度梯度,每一个梯度就是一个水平

注意:在水平下还有多次重复样本,同一个水平中的方差称为组内方差,不同水平之间的方差称为组间方差,这是在稍后进行方差分解计算的基础。

2. 方差分析基本流程

  1. 收集所有待处理数据,提出原假设
  2. 计算数据的各项参数,进行方差分解
  3. 进行自由度分解
  4. 计算均方差,检验随机误差的方差与处理效应的方差的显著性
  5. 根据F检验判断是否具有显著性,得出结论

3. 两种效应计算

在处理效应中,具有固定效应和随机效应,固定效应指的的在实际的因素中指定特定的几个水平进行计算,得出的结论只适用于这几个水平,不能推广到所有水平,此时这个因素也可称为固定因素,相应的处理效应为固定效应;随机效应指的是把所有水平当做一个总体分布,从中随机抽取一些水平进行计算,此时这个因素也可以称为随机因素,相应的效应为随机效应,得到的结论可以推广到所有水平中使用。

符号说明:
$$y_{i}.=\sum_{j=1}^ny_{ij}$$
$$\bar y_i.=\frac1ny_i.\ (i=1,2,3,…,a)$$
$$y..=\sum_{i=1}^a\sum_{j=1}^ny_{ij},\ \bar y..=\frac1{an}y..$$

3.1. 固定效应