卫生统计学学习指导与习题集
下载后可任意编辑 卫生统计学学习指导与习题集 第一章 绪论 【教学要求】 了解:医学统计学的进展史;统计学与公共卫生的关系。 熟悉:统计学习的目标与方法 掌握:统计学基本概念:总体与样本、同质与变异、变量的类型、参数与统计量。 【重点难点】 第一节 医学中统计思维的进化 第二节 统计学与公共卫生互动推动 一、 统计学是公共卫生专业人员的得力工具 公共卫生是群体科学,应用统计探究群体规律。 统计抽样技术;设计群体调查,掌握人群的卫生状况和需求; 统计描述:反映疾病和卫生资源的分布特征; 统计推断:偶然性的背景中识别危险因素、评价卫生措施、进行科学决策。 二、 现代公共卫生领域对统计学的挑战 公共卫生不仅应用统计学,而且不断提出新要求和新问题,是现代统计学讨论和进展的巨大功力。 第三节 统计学的若干概念 一、 总体与样本 总体是根据讨论目的确定的同质讨论对象的全体,按讨论对象来源又有目标总体和讨论总体。 样本是指从讨论总体中抽取的一部分有代表性的个体。 抽样讨论的目的是用样本推断总体。 二、 同质与变异 同质是指同一总体中个体的性质、影响条件或背景相同或非常相近。 变异是指同质的个体之间存在的差异。 统计学的任务是在变异的背景上描述同一总体的同质性,揭示不同总体的异质性。 分类变量 { 三、 变量的类型 { 定性变量 有序变量 定量变量 变量 定量变量可分为离散型变量和连续型变量。 变量类型可以转化:定量→有序→分类→二值。注意转化方向只能由信息量多向信息量少。 四、 参数与统计量 参数是指反映总体特征的统计指标。 五、 设计与分析 统计设计是医药卫生设计科研不可或缺的部分。统计设计包括抽样方法、统计学原则、统计方法数据如何收集、样本量多大等统计学内容。设计决定了统计分析的方法。统计设计和统计分析是不可分割的两项内容。 六、 因果与联系 探究因果关系首先考虑是否存在联系。但存在联系未必有因果联系,因为存在大量的混杂因素。单靠统计学分析大多只能考虑变量之间的联系,难于证明因果联系。 第四节 目标与方法 一、 基本概念方法与技能 正确理解基本概念、掌握常用的设计和经典的分析方法、学会用统计软件完成有关计算。 二、 教与学的方法 应用是根本目的,理解概念与动手实践才是根本。要结合生活经验、医学实际来教与学。借助统计学实验理解统计现象与理论,借助案例讨论从反面吸取教训。 【补充习题】 一、 选择题 (一) A1题 每一道题下面有A、B、C、D、E五个被选答案,请从中选择一个最佳答案。 1. 下面的变量中,属于分类变量的是(B) A.脉搏B.血型C.肺活量D.红细胞计数E.血压 2. 下面的变量中,属于定量变量的是(B) A.性别B.体重C.血型D.职业E.民族 3.某人记录了50名病人体重的测定结果:小于50kg的13人,介于50kg和70kg间的20人,大于70kg的17人,此种资料属于(A) A.定量资料B.分类资料C.有序资料D.二分类资料E.名义变量资料 4.上述资料可以转换为(C) A.定量资料B.分类资料C.有序资料D.二分类资料E.名义变量资料 5.若要通过样本作统计推断,样本应是(C) A.总体中典型的一部分B.总体中任一部分 C.总体中随机抽取的一部分D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 6.统计量(E) A.是统计总体数据得到的量 B.反映总体统计特征的量 C.是根据总体中的全部数据计算出的统计指标 D.是用参数估量出来的 E.是由样本数据计算出的统计指标 7.因果关系(C) A.就是变量间数量上的联系B.可以用统计方法证明 C.必定表现为数量间的联系D.可以通过单独考察两个变量间关系得出 E.可以通过变量间数量上的联系来证明 (二)A2型 每一道题以一个小案例出现,其下面都有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。 1. 教材中提及美国人1954年实施了旨在评价Salk疫苗预防小儿麻痹或死于脊髓灰质炎效果的临床试验。有180万儿童参加,约有1/4参加者得到了随机化。这180万儿童是(C) A.目标总体B.讨论总体C.1份样本D.1份随机样本E.180万份样本 2.上述试验最终肯定了索尔克疫苗的效果。请问此结论是针对(C)而言。 A.180万儿童B.每个儿童C.所有使用索菲克疫苗的儿童D.所有儿童E.180万儿童中随机化的1/4 二、是非题 1.定量变量、分类变量和有序变量可以相互转换。(×) 2.假变量可以参加计算,所以假变量是定量变量。(×) 3.离散变量在数值很大时。单位为“千”或“万”时可以取小数值,此时可接近地视为连续型变量(√) 4.同质的个体间不存在差异。(×) 5.假如个体间有变异,则它们一定不是来自同一总体。(×) 第二章 定量资料的统计描述 【重点难点】 第一节 频率分布表与频率分布图 一、离散型定量变量的频率分布 对离散型定量变量,变量值的取值是不连续的。直接清点各变量值出现的频数,即为频率分布表。离散型定量变量的频率分布图可用直方图表达,以各等宽矩形直条的高度表示各频率的多少。 二、连续型定量变量的频率分布 对连续型定量变量,变量值的取值是连续的,将数据适当分组,清点各组的频数,即为频率分布表。连续型定量变量的频率分布图可用直方图表达。即纵坐标为频率密度,即频率/组距,直方图的面积之和等于1. 三、频率分布表(图)的用途 频率分布表(图)可以揭示资料的分布类型,如对称分布或偏峰分布;也可以描述资料的分布特征,即集中趋势和离散趋势;便于发现某些特大和特小的可疑值;便于进一步计算指标和统计分析。 第二节 描述集中趋势的统计指标 对于连续型定量变量,平均数是应用最广泛、最重要的一个指标体系,它常用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。常用的平均数有3种:算数均数、几何均数和中位数。 一、算术均数 意义:算术均数简称均数,常用μ表示总体均数,X表示样本均数。反映全部数量观察值的平均数量水平。 适用条件:适用于对称分布资料,尤其正态或近似正态分布资料。 计算:1.直接法(基于原始数据) X=X1+X2+…+Xnn=Xn 其中,n为样本含量,X1+X2+…+Xn为观察值。 2. 频率表法(也叫加权法,基于频率表资料) X= fx0 f= fx0n 其中, f为组段的频数,x0为组段的中值,x0=(组段上限+组段下限)/2。 二、几何均数 意义:几何均数以符号G表示,常用来反映一