统计考点汇总版
第二章第二章 1、 简述统计数据的两个来源,及其相互关系。 从统计数据的观测登记方式和统计数据本身的属性看,统计数据存在着两种不同的来源:一是专门组织一是专门组织 的统计调查;二是科学试验、生产实验和交易活动的观测数据。的统计调查;二是科学试验、生产实验和交易活动的观测数据。 从使用者的角度看,统计数据存在两种不同的来源。 一是直接的来源一是直接的来源,使用者所应用是由自己亲自观测登记获得的统计数据,属于第一手的统计数据,称为 初级数据; 二是间接的来源二是间接的来源,使用者所应用是由他人观测登记获得的统计数据,属于第二手的统计数据,称为次级 数据。 任何第二手统计数据都是来源于他人观测登记所获得的第一手统计数据。归根到底,专门组织的统任何第二手统计数据都是来源于他人观测登记所获得的第一手统计数据。归根到底,专门组织的统 计调查,科学试验和生产实验的观测数据是统计数据的来源所在,是第一性的,决定着统计数据的质量。计调查,科学试验和生产实验的观测数据是统计数据的来源所在,是第一性的,决定着统计数据的质量。 2、 简述普查、抽样调查的特点和联系。 普查:为了特定目的而专门组织的一次性或周期性的全面调查,调查在某一标准时间上的社会经济现象的为了特定目的而专门组织的一次性或周期性的全面调查,调查在某一标准时间上的社会经济现象的 总量。总量。 普查具有以下特点: (1)普查是一种全面调查。 (2)普查是一种一次性或周期性的调查。 (3)普查是一种调查在某一标准时间上的社会经济现象总量的调查。 抽查:根据随机原则和具体的抽样技术的要求,从总体中抽取部分个体构成样本,并依据样本信息推断总随机原则和具体的抽样技术的要求,从总体中抽取部分个体构成样本,并依据样本信息推断总 体数量特征的非全面调查。体数量特征的非全面调查。 1)抽样调查是一种按照随机原则抽取样本的调查。 2)抽样调查是一种可以事先估计和控制抽样误差的调查。 3)抽样调查是一种非全面调查。 4)抽样调查是一种准确性高的调查。 5)抽样调查是一种具有广泛适用性的调查。 3、 统计调查方案设计的主要内容。 1.调查任务和目的 2.调查对象、调查单位和填报单位 3.调查项目和调查指标 4.调查时间 5.调查方法 6.调查误差的控制方法 7.调查数据的汇总处理方法 8.调查表和调查问卷设计 9. 制定调查工作的组织实施计划 4、 问卷设计的主要内容。 a问卷结构 问卷结构由问卷的开始,主体和结束三个部分组成。 b 封闭性问题及备选答案 c问题排列 5、 数据的登记性误差和代表性误差。 1. 登记性误差。 登记性误差是指在调查过程中由于调查者和被调查者的人为原因形成的误差。登记性误差是指在调查过程中由于调查者和被调查者的人为原因形成的误差。例如,调查者的人为原因 主要有总体界定错误、调查单位缺失、计量和测量误差、记录失误、抄录错误、汇总差错;被调查者的人 为原因主要有有意识地提供虚假数据、无意识地提供有误数据。从理论上说登记性误差属于可以消除的误 差。 2.代表性误差。 代表性误差是指利用样本数据推断总体参数时产生的误差。代表性误差是指利用样本数据推断总体参数时产生的误差。分为随机性误差和系统性误差。 (1)随机性误差是由于随机性原因形成的代表性误差,它是服从于某一概率分布的随机变量。随机性误差是由于随机性原因形成的代表性误差,它是服从于某一概率分布的随机变量。随机性误 差是不可以消除的误差,只要利用样本数据推断总体参数,就必然存在着随机性误差。随机性误差的取值 随着样本容量的增大而减小。 (2)系统性误差是由于非随机性原因形成的代表性误差。系统性误差是由于非随机性原因形成的代表性误差。主要原因有抽样框过于陈旧导致的抽样框偏误、 非随机样本、无回答问题、辅助数据偏误等。系统性误差属于代表性误差,也是在利用样本数据推断总体 参数时产生的误差,但是系统性误差不会随着样本容量的增大而减小,不能通过增大样本容量来实现对系 统性误差的控制。 6、什么是统计数据质量的三点标准? 时效性,准确性、一致性时效性,准确性、一致性 第三章第三章 1 1、、 什么是数据的审核,具体有什么内容和方式?什么是数据的审核,具体有什么内容和方式? 数据审核是指在进行数据整理之前对原始数据的审查和核对。审查和核对。 内容 统计数据的时效性,准确性、一致性三个方面的标准就是数据审核的基本内容。 (1)统计数据的时效性审核。检查是否在规定的统计调查时间内完成数据搜集,采集的数据是 否为规定的调查时点上,或规定的调查时段内的数量特征。 (2)统计数据的准确性审核。从数据的完整性、真实性和精确性角度进行审核。 (3)统计数据的一致性审核。检查统计数据在时间和空间上的连续性和可比性。 方式:逻辑检查和技术检查 2 2、、 非数值型数据分组和数值型数据分组有那些差别?非数值型数据分组和数值型数据分组有那些差别? 非数值型数据的分组也称为分类。定类数据和定序数据都是对事物质的属性的描述,两者都是一种分类性 质的数据,只在分类划分的无序和有序上存在差别。 反映事物自然属性的非数值型数据的分组一般比较简单,只要进行适当的细分或合并,以及选择恰当的 分组标志即可。 反映事物社会经济属性的非数值型数据的分组一般比较复杂,往往是人们对事物数量特征进行深入地统 计分析之后形成的一种质的划分,这种质的划分体现了人们认识活动对与事物由量变到质变的把握,一般 采用国家标准、行业标准或者企业标准等标准化的形式确定下来,并借助统计报表和统计调查方案等方式 加以明确,以此来规范和指导后续的统计活动。 数值型数据分组可以分为单变量分组和组距分组。 单变量分组是指每个分组只用一个变量值表示的分组形式,又称为单项分组。单变量分组一般在分组标 志为离散变量,且变量的取值范围不是太大的情况下使用。 组距分组是指每个分组用一个数据取值区间表示的分组形式。组距分组适用于按连续变量分组或变量的 取值范围较大的离散变量的场合。 3、 简述数值型数据分组的具体方式有那些? 4、 怎样确定等距分组中组距、组数和各组上限、下限? 5、 频数、频数分布的概念和意义。 频数(Frequence)是落在某一特定分组中的数据个数 频数分布(Frequence Distribution)是由各组的频数组成的一个数组。 频数与频数分布总是在具体的分组设置前提下的对总体数据分布特征的描述 6、组中值的意义和计算方法。 组距分组中处在各组取值范围中点位置上的数值。 代表性的数值,用来代表该组数据取值的一般水平。 7、 绝对数的概念、种类和计量单位。 绝对数是反映总体绝对规模和绝对水平的测度,是通过数据汇总直接得到的测度。 1.总值和频数。 2.时期数据和时点数据 3.截面数据和时间序列数据。 计量单位:计量单位:实物实物单位、单位、货币货币单位及单位及时间时间单位单位 8、 统计表的构成和绘制要求。 构成 从形式上看,统计表由表头、行标题、列标题和数据4 个主要部分内容组成。此外,在需要时做某些说 明时,可以在表的上下端加上附注。 9、直方图、折线图的概念和绘制方法。 第四章第四章 1、 应从哪几方面对数据分布特征进行度量,为什么? 数据分布特征的度量包括三个