t分布的概念及表和查表方法
t t 分布介绍分布介绍 在概率论和统计学中,学生 t t- -分布分布(t-distribution),可简称为 t 分布,用于根据小样 本来估计呈正态分布且方差未知的总体的均值。如果总体方差已知(例如在样本数量足够多 时),则应该用正态分布来估计总体均值。 t 分布曲线形态与 n(确切地说与自由度 df)大小有关。与标准正态分布曲线相比,自 由度 df 越小,t 分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度 df 愈大, t 分布曲线愈接近正态分布曲线,当自由度 df=∞时,t 分布曲线为标准正态分布曲线。 中文名 外文名 学科 t 分布 t-distribution 概率论和统计学 应用 别称 在对呈正态分布的总体 学生 t 分布 相关术语t 检验 目录目录 1 历史 2 定义 3 扩展 4 特征 5 置信区间 6 计算 历史历史 在概率论和统计学中,学生学生 t t- -分布分布(Student st-distribution)经常应用在对呈正态分布的总体的均值 进行估计。 它是对两个样本均值差异进行显着性测试的学生t 测定的基础。 t 检定改进了 Z 检定 (en:Z-test) , 不论样本数量大或小皆可应用。在样本数量大(超过 120 等)时,可以应用Z 检定,但 Z 检定用在小的 样本会产生很大的误差,因此样本很小的情况下得改用学生t 检定。在数据有三组以上时,因为误差无法 压低,此时可以用变异数分析代替学生t 检定。 当母群体的标准差是未知的但却又需要估计时,我们可以运用学生t-分布。 学生 t t- - 分布分布可简称为 t 分布。其推导由威廉·戈塞于 1908 年首先发表,当时他还在都柏林的健力士酿 酒厂工作。因为不能以他本人的名义发表,所以论文使用了学生(Student)这一笔名。之后 t 检验以及 相关理论经由罗纳德·费雪的工作发扬光大,而正是他将此分布称为学生分布。 定义定义 由于在实际工作中,往往σ 是未知的,常用s 作为 σ 的估计值,为了与u 变换区别,称为t 变换,统 计量 t 值的分布称为 t 分布。 假设 X 服从标准正态分布N(0,1),Y 服从分布,那么 记为。 的分布称为自由度为 n 的 t 分布, 分布密度函数 其中,Gam(x)为伽马函数。 , 扩展扩展 正态分布(normal distribution)是数理统计中的一种重要的理论分布,是许多统计方法的理论基础。 正态分布有两个参数,μ 和 σ,决定了正态分布的位置和形态。为了应用方便,常将一般的正态变量X 通 过 u 变换[(X-μ)/σ]转化成标准正态变量 u, 以使原来各种形态的正态分布都转换为μ=0, σ=1 的标准正态分 布(standard normal distribution),亦称 u 分布。 根据中心极限定理, 通过上述的抽样模拟试验表明, 在正态分布总体中以固定n, 抽取若干个样本时, 样本均数的分布仍服从正态分布,即N(μ,)。所以,对样本均数的分布进行u 变换,也可变换为标准正态 分布 N (0,1)。 特征特征 1.以 0 为中心,左右对称的单峰分布; 2.t 分布是一簇曲线,其形态变化与n(确切地说与自由度 df)大小有关。自由度df 越小,t 分布曲线越 低平;自由度 df 越大,t 分布曲线越接近标准正态分布(u 分布)曲线,如图: t(n)分布与标准正态 N(0,1)的密度函数。 3. 随着自由度逐渐增大,t 分布逐渐接近标准正态分布。 对应于每一个自由度 df,就有一条t 分布曲线,每条曲线都有其曲线下统计量t 的分布规律,计算较 复杂。 学生的 t-分布(或也t 分布),在概率统计中,在置信区间估计、显着性检验等问题的计算中发挥重 要作用。 t 分布情况出现时(如在几乎所有实际的统计工作)的总体标准偏差是未知的,并要从数据估算。教 科书问题的处理标准偏差,因为如果它被称为是两类: ( 1 )那些在该样本规模是如此之大的一个可处理的数据为基础估计的差异,就好像它是一定的; ( 2 )这些说明数学推理,在其中的问题,估计标准偏差是暂时忽略的,因为这不是一点,这是作 者或导师当时的解释。 置信区间置信区间 假设数量 A 在当 T 呈 t-分布(T 的自由度为 n1)满足 这与是相同的。A 是这个概率分布的第95 个百分点。 那么 等价于 因此 μ 的 90%置信区间为:。 计算计算 下表列出了自由度为 1-30 以及 80、100、120 等 t 分布的单侧和双侧区间值。例如,当样本数量n=5 时,则自由度 df=4,我们就可以查找表中以4 开头的行。该行第5 列值为,对应的单侧值为 95%(双侧 值为 90%)。这也就是说,T 小于的概率为 95%(即单侧),记为 Pr(∞ T= ;同时,T 值介于和之间 的概率为 90%(即双侧),记为 Pr( T= 。 这是根据分布的对称性计算得到的。 Pr(T= 1= 因此, Pr( T= 12 = 注意注意关于表格的最后一行的值:自由度为无限大(自由度为无限大(n=120n=120)的)的 t t 分布和正态分布等价分布和正态分布等价。 (查表时注意:v 是指自由度,并分单侧和双侧两种类型) (右侧的示意图是单侧检验的情形) (下图是左右、双侧等检验的情形) 如何查如何查 t t分布表分布表 1、本表是自由度 V 和下侧概率 P 给出 t 分布的分位数 tp(v)。 例:对于 V=20 和 P=,tp(v)=。 2、当 P时,tp(v)= -t1-p(v)。 例:(20)= (20)= 。 3、与双侧概率α相应的分位数为 t1- α/2(v)。 例:对于 V=20 和α=,t1- α/2(v)=(20)==。 注:对于自由度V 和 t 给出 t 分布函数 P(t;v)的数值,方法类似“自由度V 和下侧概率 P 给 出 t 分布的分位数 tp(v)”,此表忽略,见标准。