SPSS预测与分析期末作业
第三题 1、①进行随机抽样,抽取85%的样本 ② 将数据按“存(取)款金额”升序排序,找到有效样本的最低值和最高值 ③ 参考Sturgis提出的经验公式确定分组数为10,10组的组距为10000,分布为少于10000 元,10001-20000 元,20001-30000 元,30001-40000 元,40001-50000 元,50001-60000 元, 60001-70000元,70001-80000元,80001-90000元,90001元以上,并将分组结果存到一个 新变量中,分组后进行频数分析并绘制带正态曲线的直方图,如下 ④利用SPSS的频数分析计算所有样本的存(取)款金额的四分位数;然后,按照年龄 段对数据进行拆分,并重新计算分位数,分别得到年龄段为20岁以下、20-35岁、35-50 岁和50岁以上的存(取)款金额的四分位数 统计量 存(取)款金额 20岁以下 N 有效 2 35-50岁 N 有效 78 缺失 0 缺失 0 百分位数 25 50.00 百分位数 25 500.00 50 25025.00 50 1000.00 75 75 4250.00 20-35岁 N 有效 133 50岁以上 N 有效 33 缺失 0 缺失 0 百分位数 25 500.00 百分位数 25 550.00 50 1000.00 50 1000.00 75 5000.00 75 2000.00 ⑤进行各年龄段分组频数分析并绘制带正态曲线的直方图, 如下 ⑥结果分析:由于采取的分组方法是等距分组,抽取的样本量又没有屏蔽小概率事件使 得频率分布很不均匀,从③中所得正态曲线和直方图中可知95%以上的储户一次存款都在 10000元以下,从④中得出结论(20岁以下储户很少,不参与比较)50岁以上的储户分布 较均衡且大额存款明显比重增多,而20-50岁两群体基本上每次存款金额稳定分布在10000 元内。20-35岁群体75%分位数金额最高。 2、①利用交叉分组下的频数分析找出收入水平和物价趋势两变量之间的相互影响和关系, 利用卡方检验建立交叉列联表和相应的条形图 收入情况*物价趋势交叉制表 物价趋势 合计 上升 稳定 下降 收入情况增加计数 2 37 3 42 期望的计数 4.5 30.5 7.0 42.0 收入情况中的% 4.8% 88.1% 7.1% 100.0% 物价趋势中的% 8.0% 21.8% 7.7% 17.9% 总数的% .9% 15.8% 1.3% 17.9% 基本不变计数 17 110 22 149 期望的计数 15.9 108.2 24.8 149.0 收入情况中的% 11.4% 73.8% 14.8% 100.0% 物价趋势中的% 68.0% 64.7% 56.4% 63.7% 总数的% 7.3% 47.0% 9.4% 63.7% 减少计数 6 23 14 43 期望的计数 4.6 31.2 7.2 43.0 收入情况中的% 14.0% 53.5% 32.6% 100.0% 物价趋势中的% 24.0% 13.5% 35.9% 18.4% 总数的% 2.6% 9.8% 6.0% 18.4% 合计计数 25 170 39 234 期望的计数 25.0 170.0 39.0 234.0 收入情况中的% 10.7% 72.6% 16.7% 100.0% 物价趋势中的% 100.0% 100.0% 100.0% 100.0% 总数的% 10.7% 72.6% 16.7% 100.0% 卡方检验 值 df 渐进Sig.(双 侧) Pearson 卡方 14.587 4 .006 似然比 14.254 4 .007 线性和线性组合 2.090 1 .148 有效案例中的N 234 a. 2单元格(22.2%)的期望计数少于5。最小期望计数为 4.49。 ②卡方检验结果显示P值小于0.05,拒绝原假设,认为 行列之间变量相关,即不同收入水平的储户对“物价趋势”持不同的态度。 3、①对居民一次存款金额首先按照户口进行分类汇总,计算统计量得如下表格: 户口类型 均值 标准差 中值 样本数 1城镇 4956.94 9792.51 1000.00 200 2农村 4204.32 13402.43 800.00 82 对居民一次存款金额按照职业进行分类汇总,计算统计量得如下表格: 职业 均值 标准差 中值 样本数 1国家机关 2631.67 3041.69 1000.00 24 2商业服务业 2442.98 3729.02 800.00 54 3文教卫生 4869.44 6882.48 2750.00 18 4公交建筑业 1766.67 1954.36 1000.00 15 5经营性公司 11527.78 20852.18 3450.00 18 6学校 2498.00 5000.91 700.00 15 7 一般农户 1574.29 3667.29 500.00 35 8种粮棉专业户 990.00 752.15 880.00 4 9种果菜专业户 11750.10 31046.20 1000.00 10 10工商运专业户 7541.18 11015.31 3000.00 34 11退役人员 2976.82 5691.05 1000.00 18 12金融机构 7167.80 14134.65 2000.00 35 13现役军人 15833.33 14885.68 8000.00 3 ②结果分析:由户口得到的分类汇总表可看出城镇居民比农村居民存储金额略高,稳定 性也较好,且由于客观原因,农村储户所占比例本身就较小,故稳定性较差也是合理的。 由职业分类汇总得到的表格可知各职业一次存款金额存在着较大差异,经营性公司、种 果菜专业和现役军人一次存款明显较高,这可能与其收入来源周期、季节和闲暇时间有限 有关。标准差最小的是种棉粮专业户,但样本数较小不具说服性,其次就是从事公交建筑 业职业人群,可见其消费习惯和收入来源较之其他职业从业人员更稳定,中值和均值趋势 大抵吻合,不在赘述。 第六题 ① 直接建立多元回归线性模型,课题总数X5为因变量,自变量选择投入人年数X2、投 入科研事业费X4、论文数X7、获奖数X8,采用向后筛选解释变量,统计量中,勾选估计、 模拟拟合度和共线性诊断;绘制中,勾选标准化