西格玛管理基础词汇
有关统计学有关统计学相关概念,大家一起来学习讨论 平均值的标准误 (SE Mean) 度量样本平均值多大精确程度地估计总体平均值,并用于创建总体平均值的置信区间。SE Mean 值越 小,表示对总体平均值的估计越精确。 SE Mean 等于样本标准差 (s) 除以样本大小 (n) 的平方根。因此: 标准差越大,产生的 SE Mean 越大。 样本大小越大,产生的 SE Mean 越小。 例如,根据 312 个交货时间的随机样本,得到平均交货时间为 3.80 天,标准差为 1.43 天。这些数字 产生的 SE Mean 为 0.08 天(1.43 除以 312 的平方根)。如果从相同总体中抽取大小相同的多个随 机样本,则这些不同样本平均值的标准差将大约为 0.08 天。 SE Mean 可用于创建总体平均值的置信区间。例如,根据样本大小,95% 的置信区间将从样本平均 值向外展开大约 +/- 两个 SE Mean。对于此示例,95% 置信区间将为 (3.64, 3.96) 天。真实总体平均 值落于此范围内的置信度为 95%。 SE Mean 估计样本之间的变异性,而标准差则度量单个样本内的变异性 变异系数 一种相对变异性的度量,等于标准差除以均值(Minitab 会将所得的商乘以 100)。因为它是一个无量 纲数,所以可以用来比较均值显著不同的总体的离散性。 例如,您是一家牛奶瓶装厂的质量控制检验员,该厂的牛奶有大瓶装和小瓶装两种。您抽取每种产品 的样本并观测到小瓶装的平均容量为 1 杯,标准差为 0.08 杯,大瓶装的平均容量为 1 加仑(16 杯), 标准差为 0.4 杯。虽然大瓶加仑装的标准差是小瓶装的标准差的 5 倍,但它们的变异系数 (COV) 却支 持不同的结论: 大瓶装小瓶装 COV = 100 0.4 杯 / 16 杯 = 2.5 COV = 100 0.08 杯 / 1 杯 = 8 小瓶装的变异系数是大瓶装的三倍多。也就是说,虽然大瓶装具有较大的标准差,但小瓶装相对于其 均值来说具有更大的变异性。 均方递差 (MSSD) 作为方差估计值使用。它是通过将连续观测值之间的平方差相加,然后再用所得和除以 2 计算得出。 两种常见应用为: 基本统计量 均方递差的一种常见应用是用于检验一个观测值序列是否是随机的。在 此检验中,是将估计的总体方差与均方递差进行比较。 质量控制 另一种应用是当子组大小为 1 时作为方差估计值使用。对于单值、 CUSUM、EWMA 和移动平均控制图,Minitab 默认使用平均移动极差法来估计标准差。对于您无法假 定两个连续点形成一个合理子组并使用移动极差法的情况,均方递差法可作为替代方法。要作为标准 差的估计值使用,请计算均方递差的平方根。 计算均方递差 例如,假设您正在收集使用机器注装小瓶 MMR 接种疫苗的数据。您要确保机器是随机分配的,即不 存在任何特殊变异原因。 12 个小瓶的注装量分别为: 0.50 毫升 0.48 毫升 0.49 毫升 0.50 毫升 0.505 毫升 0.50 毫升 0.49 毫升 0.498 毫升 0.50 毫升 0.479 毫升 0.49 毫升 0.51 毫升 均方递差 = (Xi + 1 Xi)2 = 0.00008 2 (n 1) 要手工执行此计算,可以将 0.50 毫升减去 0.48 毫升获得第一个差值 (0.02)。将 0.48 毫升减去 0.49 毫升获得第二个差值 (0.01)。继续这一过程直至得到 11 个差值。将每个差值平方后相加。 将所得和除以 22 或 2x(n-1)。 单值图 用于通过单个数据值来评估和比较样本分布,这些值可以选择按类别变量分组。单值图还可以帮助您 查找编码值中的明显错误。下图显示了用三种不同橡胶配方制成的橡胶带的弹性。当从左到右对它们 进行比较时,您可以看到,尽管不同配方橡胶的弹性平均值在增大(由各组之间连接的蓝色符号标 注),但第三组中变异(即各组中点的散布程度)的增加相当显著。(非正式)标识异常值和分布形 状时,单值图类似于箱线图,其不同之处在于它单独为每个值绘制一个图。当观测值相对较少或需要 评估每个观测值的效应时,单值图特别有用。 Fisher 精确检验 检验两个二进制变量是否是独立的。该检验可以分析 2x2 列联表,并产生精确的 p 值,以检验以下假 设: H0:行变量和列变量是独立的 H1:行变量和列变量是相关的 Fisher 精确检验中的 p 值对于所有样本大小都是准确的,而当单元格计数较小时,用于检查相同假设 的卡方检验的结果可能不准确。 例如,可以使用 Fisher 精确检验来分析下面的竞选结果列联表,以确定投票是否独立于投票人的性别。 候选人 A 候选人 B 女性 9 26 男性 21 35 对于该表,Fisher 精确检验产生的 p 值为 0.263。由于该 p 值大于常用的 水平,因此数据与 原假设一致。因而,没有证据表明在竞选中投票人的性别会影响其选择。 您还可以使用 Fisher 精确检验来确定两个总体比率是否相等。对于此应用,原假设假定两个总体比率 是相等的 (H0:p1= p2);备择假设可以是左尾 (p1 p2),或双尾 (p1 ≠ p2)。Fisher 精 确检验作为两个比率的检验十分有用,因为它对于所有样本大小都是准确的,而当事件数小于 5 时, 以及试验数减去事件数的结果小于 5 时,基于正态近似的 2 个比率的检验可能不准确。 Fisher 精确检验基于超几何分布。因此,p 值在表的边际合计中是有条件的。 Poisson 过程描述某一事件在给定的时间、面积、体积等范围内的出现次数。 正态性检验 确定您绘制样本所基于的总体是否呈非正态分布的单样本假设检验。许多统计过程均依赖于总体正态 性,且使用正态性检验确定否定此假设是不是分析中的重要步骤。正态性检验的原假设假定总体为正 态分布。备择假设假定总体为非正态分布。要确定样本数据是否来自非正态总体,您可以从四种检验 中进行选择。 图形方法 您可以使用正态概率图来评估总体正态性,如果样本的总体呈正态分布,该图将根据您期望它们接近 的值绘制顺序数据值。如果总体呈正态分布,绘制的点将大致形成一条直线。 Anderson-Darling 检验 此检验是将样本数据的经验累积分布函数与假设数据呈正态分布时期望的分布进行比较。如果实测差 异足够大,该检验将否定总体呈正态分布的原假设。 Ryan-Joiner 正态性检验 此检验通过计算数据与数据的正态分值之间的相关性来评估正态性。如果相关系数接近 1,则总体就 很有可能呈正态分布。Ryan-Joiner 统计量可以评估这种相关性的强度;如果它未达到适当的临界值, 您将否定总体呈正态分布的原假设。此检验类似于 Shapiro-Wilk 正态性检验。 Kolmogorov-Smirnov 正态性检验 此检验是将样本数据的经验累积分布函数与假设数据呈正态分布时期望的分布进行比较。如果实测差 异足够大,该检验将否定总体呈正态分布的原假设。 如果这些检验的 p 值低于您选择的 水平,您可以否定原假设并断定总体呈非正态分布。 “粗笔检验” 一种非正式的近似正态性检验,称为