统计学第四版答案贾俊平
请举出统计应用的几个例子请举出统计应用的几个例子: 1、用统计识别作者:对于存在争议的论文,通过统计量推出作者 2、用统计量得到一个重要发现:在不同海域鳗鱼脊椎骨数量变化不大,推断所有各个不 同海域内的鳗鱼是由海洋中某公共场所繁殖的 3、挑战者航天飞机失事预测 请举出应用统计的几个领域请举出应用统计的几个领域: 1、在企业发展战略中的应用2、在产品质量管理中的应用3、在市场研究中的应 用④在财务分析中的应用 ⑤在经济预测中的应用 你怎么理解统计的研究内容你怎么理解统计的研究内容: 1、统计学研究的基本内容包括统计对象、统计方法和统计规律。2、统计对象就是统 计研究的课题,称谓统计总体。 3、统计研究方法主要有大量观察法、数量分析法、抽样推断法、实验法等。④统计规律 就是通过大量观察和综合分析所揭示的用数量指标反映的客观现象的本质特征和发展规 律。 举例说明分类变量、顺序变量和数值变量举例说明分类变量、顺序变量和数值变量: 分类变量:表现为不同类别的变量称为分类变量,如“性别”表现为“男”或“女”, “企 业所属的行业”表现为 “制造业” 、 “零售业” 、 “旅游业”等, “学生所在的学院”可能是“商 学院” 、 “法学院”等 顺序变量:如果类别有一定的顺序, 这样的分类变量称为顺序变量, 如考试成绩按等级分 为优、良、中、及格、不及格,一个人对事物的态度分为赞成、中立、反对。这里的“考试 成绩等级” 、 “态度”等就是顺序变量。 数值变量:可以用数字记录其观察结果,这样的变量称为数值变量,如“企业销售额” 、 “生活费支出” 、 “掷一枚骰子出现的点数” 。 定性数据和定量数据的图示方法各有哪些定性数据和定量数据的图示方法各有哪些: 1、定性数据的图示:条形图、帕累托图、饼图、环形图 2、定量数据的图示: a、分组数据看分布:直方图 b、未分组数据看分布:茎叶图、箱线图、垂线图、误差图 c、两个变量间的关系:散点图 d、比较多个样本的相似性:雷达图和轮廓图 直方图与条形图有何区别:直方图与条形图有何区别: 1、条形图中的每一个矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组 的组距。 2、由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排 列。 3、条形图主要用于展示定性数据,而直方图则主要用于展示定量数据。 一组数据的分布特征可以从哪几个方面进行描述一组数据的分布特征可以从哪几个方面进行描述: 1、数据的水平,反映数据的集中程度2、数据的差异,反映各数据的离散程度 3、分布的形状,反映数据分布的偏态和峰态 说明平均数、中位数和众数的特点及应用场合说明平均数、中位数和众数的特点及应用场合: 平均数也称为均值, 它是一组数据相加后除以数据的个数而得到的结果。 平均数是度量数 据水平的常用统计量,在参数估计以及假设检验中经常用到。 中位数是一组在数据排序后处于中间位置上的数值, 用 Me 表示。中位数是用中间位置上 的值代表数据水平,其特点是不受极端值影响,在研究收入分配中很有用。 众数与数据出现的次数有关, 着眼于对各数据出现的频率的考察, 其大小只与这组数据中 的部分数据有关,其特点是不受极端值的影响, 具有不惟一性,一组数据中可能会有一个人 众数,也可能会有多个或没有。 为什么要计算离散系数为什么要计算离散系数: 极差、平均差、方差和标准差等都是反映数据分散程度的绝对值, 其数值的大小取决于原 变量值本身水平高低的影响。 它们与原变量值的计量单位相同, 采用不同计量单位计量的变量值, 其离散程度的测度值 也就不同。 因此,为消除变量值水平高低和数量单位不同对离散程度的测度值的影响,需 要计算离散系数。 举例说明离散型随机变量和连续性随机变量举例说明离散型随机变量和连续性随机变量: 离散型随机变量:设 X 是一个随机变量,如果它全部可能的取值只有有限个或可数无穷 个,则称 X 为一个离散型随机变量。包括二项分布、泊松分布、超几何分布,如一定时间 内某航空公司接到的订票电话数 连续型概率分布:包括正态分布、均匀分布和指数分布。 叙述正态分布曲线的特点:叙述正态分布曲线的特点: 正态曲线的图形是关于x=u 对称的钟形曲线, 且峰值在 x=u 处。正态分布的两个参数 u 和σ一旦确定,正态分布的具体形式也惟一确定,不同参数取值的正态分布构成一个完整 的“正态分布族” 。当 X 的取值向横轴左右两个方向无限延伸时,正态曲线的左右两个 尾端也无限渐近横轴,但理论上永远不会与之相交。 ④正态随机变量在特定区间上取值的 概率由正态曲线下的面积给出,而且其曲线下的总面积等于1 解释中心极限定理的含义:解释中心极限定理的含义: 随着样本量 n 的增大(通常要求 n=30) ,不论原来的总体是否服从正态分布,样本均值的 概率分布都将趋于正态分布,其分布的期望值为总体均值 u,方差为总体方差的 1/n。这一 定理可表述为:从均值为u、方差为σ^2 的总体中,抽取样本量为n 的随机样本,当n 充分 大时(通常要求 n=30) ,样本均值的分布近似服从均值为u,方差为σ^2/n 的正态分布。 说明区间估计的基本原理说明区间估计的基本原理: 区间估计, 是在点估计的基础上给出总体参数估计的一个估计区间, 该区间通常是由样本统 计量加减估计误差得到的。与点估计不同,进行区间估计时,根据样本统计量的抽样分布, 可以对统计量与总体参数的接近程度给出的一个概率度量。 简述评价估计量的标准:简述评价估计量的标准: 无偏性:它是指估计量抽样分布的期望值等于被估计的总体参数;有效性:它是指估 计量的方差尽可能小; 一致性:它是指随着样本量的增大,点估计量的值越来越接近被估计总体的参数 解释置信水平的含义解释置信水平的含义 : 置信水平, 是指总体参数值落在样本统计值某一区内的概率; 而置信区间是指在某一置信水 平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。 简述样本量与置信水平、总体方差、估计误差的关系简述样本量与置信水平、总体方差、估计误差的关系 样本量与置信水平成正比, 在其他条件不变的情况下, 置信水平越大,所需的样本量也就越 大;样本量与总体方差成正比,总体的差异越大,所要求的样本量也越大;样本量与估计 误差的平方成正比,即允许的估计误差的平方越大,所要求的样本量就越大。 解释原假设和备择假设解释原假设和备择假设: 原假设:它通常是研究者想收集证据予以推翻的假设,用H0 表示,原假设所表达的含义总 是指参数没有变化或变量之间没有关系,等号“=”总放在原假设上。 备择假设:通常指研究者想收集证据予以支持的假设,用H1 或 Ha 表示。备择假设所表达 的含义是总体参数发生了变化或变量之间有某种关系。备择假设的形式总是为H1:u≠ u0,H1:uu0 第一类错误和第二类错误分别是指什么?第一类错误和第二类错误分别是指什么? 它们发生的概率大小之间存在怎样的关系:第Ⅰ类错误(弃真错误):原假设为真时拒绝原假 设时所犯的错误 第Ⅱ类错误(取伪错误):原假设为假时未拒绝原假设 当样本容量 n 确定后,当α变小时, 则检验的拒绝域变小,相应的接受域会变大, 因此β值 也就随之变大