假设检验
第四章假设检验 参数估计与假设检验的关系:参数估计和假设检验是推断统计方法的两个重要组成部分。 共同点:都是利用样本信息对总体数量特征进行推断。不同点:推断的角度不同 4.14.1 假设检验的基本问题假设检验的基本问题 1、假设检验——是指先对总体的参数或分布形式提出某种假设,然后利用样本信息判断假 设是否成立的过程; 包括参数检验和非参数检验;逻辑上运用的是概率反证法;统计依据为小概率原理。 2、小概率事件——若事件 A 发生的概率 P(A)很小很小或接近于 0。一般在假设检验中,通 常要求 P(A)≤0.05。 3、原假设——又称零假设,是指研究者想收集证据予以反对的假设,表示为 H0。总是有 符号 、 或 备择假设——也称研究假设,是指研究者想收集证据予以支持的假设,表示为 H1。总 是有符号 、 或 4、原假设和备择假设是一个完备事件组,而且相互对立。在一项假设检验中,原假设和备 择假设必有一个成立,而且只有一个成立; 先确定备择假设, 再确定原假设。 因为备择假设大多是人们关心并想予以支持和证实的, 一般比较清楚和容易确定; 等号“=”总是放在原假设上; 因研究目的不同,对同一问题可能提出不同的假设,也可能得出不同的结论。 假设检验主要是搜集证据来推翻和拒绝原假设。 5、双侧检验——是指备择假设没有特定的方向性, 并含有符号的假设检验, 又称为双尾检 验。 单侧检验——是指备择假设具有特定的方向性,并含有符号或 临界值,拒绝 H0 左侧检验:统计量 临界值,拒绝 H0 10、利用 p 值进行决策 p 值——又称为观察到的显著性水平,在原假设为真的条件下,所得到的样本结果会像实际 观测结果那么极端或更极端的概率。 α是指原假设正确时被拒绝的概率,或拒绝原假设犯错误的最大允许值; p 值与原假设的对或错的概率无关,它是关于数据的概率。如果原假设正确,p 值表示这样 的观测数据会有多么的不可能得到。或是犯错误的实际概率。 不论是单侧检验还是双侧检验,用p 值进行决策的规则: 若 p 值,不拒绝 H0 p 值反映实际观测到的数据与原假设H0 之间不一致的程度的一个概率值。 p 值越小,说明实际观测到的数据与原假设H0 之间不一致的程度就越大,检验的结果也就 越显著。 11、假设检验步骤 (1)、提出原假设和备择假设; (2)、确定一个适当的检验统计量,并利用样本数据算出其具体数值; (3)、根据显著性水平,计算出其临界值,指定拒绝域; (4)、将统计量的值与临界值进行比较,作出决策。 统计量的值落在拒绝域,拒绝H0,否则不拒绝 H0也可以直接利用 p 值作出决策 4.24.2一个正态总体的检验一个正态总体的检验 一、总体均值的检验一、总体均值的检验 1、总体方差已知的检验 当总体方差已知的情况,无论样本是大样本,还是小样本时,都使用z 检验统计量。 z x 0 ~ N(0,1) n 【例 1】 某厂生产铜丝, 其主要质量指标为折断力X, 根据历史资料统计, 可假定 X N(570,82)。 今新换材料生产,抽取 30 个样本值为: 577、578、579、569、565、577、568、587、 578、572、570、568、572、581、582、569、 570、570、572、596、584,598、588、563、 577、587、567、587 欲检验新材料生产的铜丝的折断力X 有无明显变化。假定方差σ2 = 8 2 保持不变, α=0.05 【解】此题为正态总体均值的假设检验H0: µ= 570H1:µ≠570 由于铜丝折断力 X 为大样本且总体方差已知,故可以采用 Z 检验法。依题意,样本均值 x 577578.567587 538.4 为:x n30 检验统计量Z x 0 n 538.457031.6 21.64 1.46830 α=0.05,查表得 Zα/2=1.96 检验统计量|Z|=21.64Zα/2=1.96 所以应拒绝 H0,表明新材料生产的铜丝的折断力X 有明显的变化。 【练习 1】完成生产线上某件工作所需的平均时间不少于15.5 分钟,标准差为 3 分钟,对随 机抽选的 36 名职工讲授一种新方法, 训练期结束后这 36 名职工完成此项工作所需的平均时 间为 13.5 分钟,这个结果是否提供了充分证据,说明用新方法所需的时间短?设α=0.05, 并假定完成这件工作的时间服从正态分布。 解:H0:µ≥15.5H1:µ30,属于大样本,故采用Z 检验法。检验统计量为: Z p 0 0.70.80.1 3.06 0 1 0 0.80.20.03266 150n α=0.05,查表得出临界值 因为 Z 3.06 Z 2 1.96 Z 2 1.96 所以应拒绝 H0,由此可以判定业务科长的说法不可信,即参加保险的户数不足80%。 【练习 5】某生产商向供应商购一批西红柿, 双方规定若优质西红柿的比例在40%及以上按 一般市场价格收购,否则按低于市场价格收购。现随机抽取了100 个西红柿,只有 34 个为 优质品。于是,生产商欲按低于市场价格收购,而供应商则认为样本比例不足 40%是由随 机因素引起的。请用α=0.05 进行检验并加以说明。 依题意,可建立如下假设H0:P≥0.4H1:P30,属于大样本,故采用Z 检验法。 检验统计量为:Z p 0 0.340.40.06 1.22 0 1 0 0.40.60.04899 100n 当α=0.05 时,查表得出左侧检验临界值: 因为:Z 1.22 Z 1.645 Z 1.645 所以不拒绝原假设 H0,即根据样本数据还不能认为优质西红柿的比例显著地低于40%,故 而生产商仍应按一般市场价格收购。 大样本总体比例的检验小结大样本总体比例的检验小结 假设假设双侧检验双侧检验 H0:=0 H1:0 左侧检验左侧检验 H0 :0 H1 :0 假设形式假设形式 统计量统计量 z p 0 0 (1 0 ) n 拒绝域拒绝域 P P 值决策值决策 z z / 2 P z z 拒绝 H0 z z 三、总体方差的检验三、总体方差的检验 通常假设总体近似服从正态分布,使用2 分布。其检验统计量为: 2 (n1)s2 2 0 ~2(n1) 【例 4】已知某种零件的尺寸服从 N(23.02,1.52)现从这批零件中任取 7 件进行测量,测得 尺寸数据(单位:mm)如下: 21.0022.0422.3224.0124.6825.0221.63 能否认为该批零件的方差是否和以往一样?(α=0.05) 依题意可归结为以下假设:H0:σ²=1.52H1:σ²≠1.52, 由于总体服从正态分布,采用χ²检验。 又知s 2.5331 2 检验统计量为: 2 (n1)s2 2 0 (71)2.5331 6.7549 1.52 α=0.05,查χ²分