统计方差分析
wangzf / 2023-07-13
方差分析简介
对于多个总体均值的比较问题, 处理这类问题通常采用所谓的方差分析方法
方差分析理论
单因子方差分析
问题描述:
通常, 在单因子试验中, 记因子为 , 设其有 个水平, 记为 , 在每一个水平下考察的指标可以看成一个总体, 现有 个水平, 故有 个总体, 假定如下,并且这三个假定都可以用统计方法进行验证:
- (1) 每一个总体均为正态总体, 记为 . 利用正态性验证成立.
- (2) 各总体的方差相同, 记为 . 利用方差齐性检验验证成立.
- (3) 从每一总体中抽取的样本是相互独立的, 即所有的试验结果 都相互独立. 可由随机化实现, 这里的随机化是指所有试验按随机次序进行.
接下来要做的工作就是比较各水平下的均值是否相同,即要对如下的一个假设进行检验:
其备择假设为:
在不会引起误会的情况下 通常可省略不写.
- 问题讨论:
- 如果 成立,因子 的 个水平均值相同, 称因子 的 个水平间没有显著差异,简称因子 不显著;
- 反之,当 不成立时,因子 的 个水平均值不全相同, 这时称因子 的不同水平间有显著差异,简称因此 显著.
- 进行试验:
- 为了对假设 进行试验,需要从每一水平下的总体抽取样本, 设从第 个水平下的总体获得 个试验结果, 记 表示第 个总体的第 次重复试验结果, 共得如下 个试验结果:
- 其中: 为水平数, 为重复数, 为水平编号, 为重复序号.
- 在水平 下的试验结果 与该水平下的指标均值 一般总是有差距的, 记 , 称为随机误差,于是有:
- 上式称为试验结果 的数据结构式, 把三个假定用于数据结构式就可以写出单因子方差分析的统计模型.
- 单因子方差分析的统计模型
为了更好地描述数据,常在方差分析中引入总均值与水平效应的概念, 称诸 的平均(所有试验结果的均值的平均)为总均值,也称一般平均。
称第 水平下的均值 与总均值 的差为因子 的第 水平的主效应, 简称为 的水平效应:
容易看出第 个总体均值是由总均值与该水平效应叠加而成的:
- 单因子方差分析的假设
原假设:
其备择假设为: