现在我们来深入探讨假设检验中的核心概念。
·1. 显著性水平。在假设检验中,我们设定一个阈值,如果检验统计量的绝对值大于等于这个阈值,则认为总体参数x与基准值μ0之间的差异是显著的,从而我们拒绝原假设H0。相反,如果检验统计量的绝对值小于这个阈值,我们则认为它们之间的差异不显著,因此接受原假设H0。这个阈值被称为显著性水平,通常用α表示。
上述方法用于构建小概率事件,并将其称为检验统计量。在假设检验中,我们通常假设检验统计量服从标准正态分布。原假设H0和备择假设H1通常表述为在显著性水平α下检验H0,或者表述为在显著性水平α下针对H1检验H0。因此,H0被称为原假设或零假设,而H1被称为备择假设。
备择假设就是备择的,当我们拒绝检验统计量取某个区域C中的值时,我们拒绝原假设H0,则称这个区域C为拒绝域,即我们之前推导的那个不等式。如果x满足那个不等式,我们就说它落入到了拒绝域里面。拒绝域的边界点被称为临界点,就是我们最初提到的等于k的情况。
在这个地方,我们使用的是z=±z_(α/2)法。临界点是比较特殊的,需要根据实际情况进行特别分析。
·2. 两类错误。假设检验的依据是小概率事件在一次试验中很难发生,但很难发生并不等于不会发生,因此假设检验所做出的结论有可能是错误的。这种错误分为两类。
→ 第一类错误是当原假设H0为真时,观察值却落入到拒绝域里面,我们做出了拒绝H0的判断,这被称为第一类错误,又称为弃真错误。这类错误是以真为假,犯第一类错误的概率是显著性水平α。
→ 第二类错误是当原假设H0不真时,观察值却漏出到了拒绝域外面,我们做出了接受H0的判断,这被称为第二类错误,又称为取伪错误。这类错误是以假为真,犯第二类错误的概率记作β。
一般来说,当样本容量n一定时,如果要减少犯第一类错误的概率,那么犯第二类错误的概率往往增大。如果要同时减少两类错误的概率,除非增加样本的容量,但增加样本的容量会增大工作量,所以这往往是没有两全其美的事情。
·第六个,只对犯第一类错误的概率加以控制,而不考虑犯第二类错误的概率的检验,称为显著性检验。
·第七个,双边备择假设与双边假设检验。上面提到的H0和H1,备择假设H1表示可能大于,也可能小于,没有方向性就是写的是μ不等于μ0,称为双边备择假设。
就把形如上面写的假设检验称为双边假设检验。