统计学思考题
百度文库 - 让每个人平等地提升自我 思考题 1、什么是统计学怎样理解统计学与统计数据的关系 答⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的 数量规律性;⑵统计学是由收集、整理、 显示和分析统计数据的方法组成的,这些方法来源 于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答 1统计数据来源于直接获取的数据和间接获取的数据; 2直接获取的数据来自于直接 组织的调查、观察和科学试验;3间接获取的数据来源于报纸、杂志、统计年鉴、网络或 从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答1非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关 规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差, 调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;2抽样 误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免 的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位 答 (1)反映了一组数据的中心点或代表值, 是数据误差互相抵消后的客观事物必然性数量 特征的一种反映; (2)是统计分布的均衡点; (3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答1洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨()提出,依据(意)帕累托() 的“二八原理”和收入分配公式绘制; (2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答基尼系数用于反应收入分配的变化情况,取值在0~1 之间 ①基尼系数小于,表明分配平均;②在~之间,分配比较适当;③ 是收入分配不公平的警 戒线,超过,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度 答可以从三个方面测度⑴分布的集中趋势 反映的是数据一般水平的代表值或者数据分 布的中心值; ⑵分布的离散程度 反映的是分布离散和差异程度;⑶分布的偏态与峰 度 反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答 ①频率反映的是某一事物出现的频繁程度; ②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答⑴古典概率 实验的基本事件总数有限, 每个基本事件出现的可能性相同; ⑵统计概率 实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率 随机事件 发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面 答 (1)联系概率密度函数的积分是分布函数,分布函数的导数是概率密度函数; (2)区 1 百度文库 - 让每个人平等地提升自我 别概率密度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。 11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同 答⑴离散型随机变量的概率分布可以用表格、 函数或图形等形式来表现。 最常见的离散型 随机变量的概率分布是二项分布,此外还有伯松分布、超几何分布; ⑵连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示。 最常见 的连续型随机变量的概率分布有正态分布、均匀分布等。 12、正态分布所描述的随机现象有什么特点为什么许多随机现象服从或近似服从正态分 布 答⑴正态分布所描述的随机现象的特点①对称的分布;②中间多两端少; ⑵许多随机现象的分布都会有集中趋势和离散趋势, 即现象的分布表现为中间多两端少的特 点,这种分布与正态分布十分贴近。 13、解释总体分布、样本分布和抽样分布的含义。 答 ①总体分布是指总体的全部观察值形成的分布; ②样本分布是指一个样本的所有观察值 形成的分布;③抽样分布就是由样本观察值计算的统计量的概率分布。 14、解释中心极限定理的含义。 答⑴样本来自于任意总体,样本容量充分大;⑵当样本容量充分大时,样本均值的抽样分 22 布近似于一个均值x 和方差 x n 的正态分布。 15、简述评价估计量好坏的标准 答 ①无偏性估计量抽样分布的数学期望等于被估计的总体参数; ②有效性无偏估计量 与总体参数的离散程度;③相合性随着样本容量的增大,估计量与总体参数的接近程度。 16、解释置信水平的含义。 答 ⑴对总体参数进行区间估计时给定的一个概率值; ⑵反应总体参数包括在置信区间的概 率。 17、简述样本容量与置信水平、总体方差、允许误差的关系。 答①样本容量与置信水平成正比; ②样本容量与总体方差成正比; ③样本容量与允许误差 成反比。 18、第Ⅰ类错误和第Ⅱ类错误分别是指什么它们发生的概率大小之间存在怎样的关系 答⑴第Ⅰ类错误是指当原假设为真时拒绝原假设所犯的错误; ⑵第Ⅱ类错误是指当原假 设为假时没有拒绝原假设所犯的错误;⑶两类错误的概率之间的关系增大时,减小; 增大时,减小。 19、什么是显著性水平它对于假设检验决策的意义是什么 答 (1)显著性水平是指假设检验中犯的第Ⅰ类错误的概率,记为; (2)显著性水平所 围成的区域成为拒绝域; (3)检验统计量落在拒绝域则拒绝原假设的概率, 是人们事先指定 的犯第Ⅰ类错误概率的最大允许值。 20、分别列出小样本情形下总体均值左侧检验、右侧检验及双侧检验的拒绝域。 答 (1)方差已知左侧检验为-∞,-z,右 侧检验为z,∞,双侧检验为 - ∞,-z/2z/2,∞; (2)方差未知左侧检验为-∞,-t,右侧检验为t,∞,双侧检验 为-∞,-t/2t/2,∞。 21、什么是统计上的显著性 答 (1)由于随机因素的作用,点估计量与假设的总体参数出现差异是可以理解的;(2)点 2 百度文库 - 让每个人平等地提升自我 估计量与假设的总体参数出现较小差异是大概率事件, 出现过大差异是小概率事件; (3)在 一次试验中, 点估计量与假设的总体参数出现差异过大是不正常的, 这就是统计上的显著性。 22、方差分析中有哪些基本假定 答①每个总体都应服从正态分布;②各个总体的方差σ2必须相同;③观测值是独立的。 23、简述方差分析的基本思想。 答①将观测值之间的差异分为两类组内误差和组间误差;②组内误差只包含随机误差, 组间误差既包括随机误差, 也包括系统误差;③衡量组内误差与组间误差的大小, 推断观测 值之间差异产生的原因。 24、方差分析包括哪些类型它们有何区别 答⑴主要是两种类型 单因素反差分析和双因素方差分析, 双因素方差分析又分为无交互 作用和有交互作用的方差分析两类; ⑵区别之一是考虑因素的数目不同; ⑶区别之二是两个 因素是否有交互作用。 25、解释方差分析中的水平项平方和、误差项平方和的含义。 答 ⑴水平项误差平方和是各组平均值与总平均值的误差平方和, 反映各总体的样本均值之 间