蚂蚁文库
换一换
首页 蚂蚁文库 > 资源分类 > DOC文档下载
 

SAS学习系列20 用PROC FREQ计算频数及卡方检验

  • 资源ID:54776648       资源大小:137.09KB        全文页数:8页
  • 资源格式: DOC        下载权限:游客/注册会员    下载费用:10积分 【人民币10元】
快捷注册下载 游客一键下载
会员登录下载
三方登录下载: 微信快捷登录 QQ登录  
下载资源需要10积分 【人民币10元】
邮箱/手机:
温馨提示:
支付成功后,系统会自动生成账号(用户名和密码都是您填写的邮箱或者手机号),方便下次登录下载和查询订单;
支付方式: 微信支付    支付宝   
验证码:   换一换

 
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,既可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰   

SAS学习系列20 用PROC FREQ计算频数及卡方检验

20. 用PROC FREQ计算频数及卡方检验 (一)卡方检验 一、卡方分布 k 个相互独立的标准正态分布变量的平方和服从自由度为k 的卡方分布。 二、卡方检验概述得到,主要应用于计数Karl Pearson卡方检验,由英国统计学家数据(定性变量中的无序分类变量)的分析,对于总体的分布不作任 何假设,因此它属于非参数检验法。又称期望频数), f理论证明,实际观察频数()与理论频数(fe0可表近似服从卡方分布,之差的平方再除以理论频数所得的统计量, 示为 2ff 22e0)n( fef越大,近似效果越好。显然这是卡方检验的原始公式,其中当foe相差越小,卡方值就越小;因f相差越大,卡方值就越大;f与与feoe 相差的程度。与f此它能够用来表示feo卡方检验的一般问题是要检验名义型变量的实际根据这个公式, 观测频数和理论频数分布之间是否存在显著差异。观察值相分类相互排斥,互不包容;② 一般卡方检验要求① ,否则需要进行校正。样本容量不宜太小,理论频数≥5互独立;③ 5,处理方法有四种如果个别单元格的理论频数小于 )单元格合并法;1( )增加样本数;(2 )去除样本法;(3 )使用校正公式。(4 5当期望次数小于时,应该用校正公式计算卡方值2.05ffe0 2fe二、卡方检验的原理 1. 卡方检验所检测的是样本观察频数与理论(或总体)频数的 差异性; 2. 理论或总体的分布状况,可用统计的期望值(理论值)来体现; 3. 卡方的统计原理,是取观察频数与期望频数相比较。当观察2值为观察频数与期望频数越接近,0;频数与期望频数完全一致时,2值越小;观察频数与期望频数差别越大,两者之间的差异越小,22值大于某一个临界值,即两者之间的差异越大,值越大。一旦可获得显著的统计结论。 4. 步骤 22 ≠H原假设H0; 备择假设 0; 10根据数据计算卡方值、P值(右尾面积); ; 若P值α,则接受H. H值≤α,则拒绝若P00 三、卡方检验的应用 1. 拟合优度检验 检验单个多项分类名义型变量的各分类间的实际观测次数(根据样本数据得到的实计数)与理论次数(根据理论或经验得到的期望次数)之间是否一致、或者服从理论上的某种分布这一类检验称为拟合性检验。其自由度通常为分类数减去1。 2. 各变量间的独立性检验(定性变量列联表) 两个或两个以上因素多项分类的计数资料分析,也就是研究两类变量之间的关联性和依存性问题。如果两变量无关联即相互独立,说另一变量多项分类次数上的变化是在无差明对于其中一个变量而言, 说明二者之间有交互作用存范围之内;如果两变量有关联即不独立, 在。列联表是由独立性检验一般采用列联表的形式记录观察数据, 是用于提供基本调查结两个以上的变量进行交叉分类的频数分布表, 果的最常用形式,可以清楚地表示定类变量之间是否相互关联。 1)(行数其自由度是-1)(列数- PROC FREQ过程步(二) 一、基本语法; PROC FREQ data 数据集列变量行变量; * / optionsTABLES ; 权重变量WEIGHT 说明结果将以表格形式(频数表)输出, 单向频数表;TABLES a 为行,b为列的双向频数表;TABLES a*ba c为列的三维频数表;a为分层,b为行,TABLES a*b*c ”;TABLES a*b c等价于“TABLES a*b a*c 可选项AGREE )(1 做配对卡方检验; (2)CHISQ 做独立性和关联度的卡方检验; CL (3) 输出关联度的置信限; CMH4)( 统计量,特别对分层二维表; 输出Cochran-Mantel-Haenszel EXACT5)( Fisher精确检验; 做 6)MEASURES( gamma、 输出Pearson and Spearman相关系数、 、c-、Somers D、lambdaKendalls tau-b、Stuarts tau 、置信区间的关联度;odds ratios、risk ratios )RELRISK(7 表的相对风险度;输出22 TREND)(8 检验;-Armitage对趋势做 Cochran(9)NOROW, NOCOL, NOPERCENT 不输出行百分比、列百分比、百分比; 二、绘制PROC FREQ的图表 默认也会输出PROC FREQ的图表,若要输出指定图表,需要在TABLES语句中,使用绘图可选项“PLOTS plot-list;”即可。可以绘制频数图、优势比图、Agreement图、偏差图、以及两类带Kappa 统计量和置信限的图。. 基本语法; 数据集PROC FREQ data ; plot-listTABLES variable1 * variable2 / options PLOTS 可选绘图类型 双向(配对)表 AGREEPLOT 单向表 CUMFREQPLOT 单向(卡方检验)表 DEVIATIONPLOT FREQPLOT(任意) KAPPAPLOT三维表 MEASURES or RELRISK)h22( ODDSRATIOPLOT MEASURES or RELRISK)22( RELREISKPLOTh )2(RELRISK RISKDIFFPLOTh2 r r2 (配对表)hWTKAPPAPLOTr例如分组条形图默认是竖直排列,FREQPLOT可以加选项,注 若要改用水平排列,可以用 variable1 * variable2 / PLOTS FREQPLOTTWOWAY TABLES GROUPHORIZONTAL; 若要堆叠分组条形,用“TWOWAYSTACKED”。 例1 一组常规公交车(R Regular)和快速公交车(E Express)的延 )C\MyRawData\Bus.dat(的数据)O On Time(或准时)L Late(误 过程步计算频数,并做卡方检验。读入数据,用PROC FREQ 代码 bus; data; infile c\MyRawData\Bus.dat BusType OnTimeOrLate ; ; run; at proc Regularvalue type R; Express E late OOn Timue; LLate ; run bus; freqdataproc CHISQNOCOLtables

注意事项

本文(SAS学习系列20 用PROC FREQ计算频数及卡方检验)为本站会员(sunhongz120)主动上传,蚂蚁文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知蚂蚁文库(发送邮件至2303240369@qq.com或直接QQ联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们


网站客服QQ:2303240369

copyright@ 2017-2027 mayiwenku.com 

网站版权所有  智慧蚂蚁网络

经营许可证号:ICP备2024020385号



收起
展开