基于回归分析的房价模型及预测
下载后可任意编辑 毕 业 论 文 题 目 基于回归分析的房价模型及预测 学生姓名 王 赛 学号 0809014046 所在院(系) 数 学 与 计 算 机 科 学 学 院 专业班级 数学与应用数学(师范类)专业081班 指导老师 李晓康 论文完成地点 陕西理工学院 2012年5月27日 基于回归分析的房价模型及预测 王赛 (陕西理工学院数学与计算机科学学院数学与应用数学08级1班,陕西 汉中 723000) 指导老师:李晓康 【摘要】 选取全国几个代表性城市,确定影响房价的主要因素,建立房价的数学模型—多元线性回归模型.首先用信息增益法找出影响房价的主要因素,确定模型,利用最小二乘法求解模型中的参数,用回归分析确定模型精度及检验,从而得出一个完整的数学模型;接着利用往年数据建立拟合曲线,预测未来四年影响北京市房价的主要因素及房价走势,并进行定量分析;最后根据模型进行预测,分析模型的优缺点并提出改进方向,并给出抑制房价的建议. 【关键词】 房价问题;回归模型;拟合曲线;预测;经济进展 1 引言 房价问题事关国计民生,对国家经济进展和社会稳定有重大影响,一直是各国政府大力关注的问题.我国自从取消福利分房制度以来,随着房价的不断飙升,房价问题已经成为全民关注的焦点议题之一,从国家领导人、地方政府官员,到开发商、专家学者、普通百姓通过各种媒体表达各种观点,但对于房价是否合理、未来房价的走势等关键问题,至今尚未形成统一的认识. 房地产行业作为中国经济的支柱产业,它的一举一动都影响着国民经济的进展以及吸引着媒体和大众的目光.近几年来房地产业已经成为一个社会关注度很高、情绪化影响很大、学术讨论水平很低、政策手段很矛盾、调控效果很不确定的产业.而这几年,房价问题越来越受到人们的关注.所以,认清当今的房价现状,对我国相关政策法规的制定、企业进展规划以及普通家庭的置业理财等都大有裨益. 影响房价的因素有很多,如人口增长率、工薪收入、城乡人均储蓄余额、房屋造价、人均全年住房支出、城镇房地产开发投资等.回归分析是确定变量间相关关系的有效方法.本文拟采纳信息增益法确定影响房价的主要因素,采纳回归分析法建立模型,对未来房价进行分析和预测. 2 基本假设及定义符号说明 2.1基本假设 假设一 所选的城市物价和其他情况相对比较稳定,全局内没有大起大落的现象; 假设二 未来几年不会发生特大自然灾害、战争动乱以及人为损害; 假设三 房屋建造成本用竣工房屋造价来代替; 假设四 房屋价格通过商品房平均销售价(元/平方米)来表示; 假设五 房价购买能力用人均储蓄存款、人均可支配收入来表示,银行利率每年保持稳定; 假设六 忽略消费成本如交通费用、物业费用、停车费用等对房价的影响; 假设七 供需平衡指:供应量=需求量. 2.2定义符号说明 : 表示工薪收入(元); : 表示城乡人均储蓄余额(元/人); : 表示造价(元/平方米); : 人均全年住房支出(元); : 竣工面积; : 人口增长率; : 开发商投资; : 商品房平均销售价(元/平方米); : 为随机变量; :序列的方差; 分别表示序列的均值; 分别表示,即中心化序列; : 模型参数; : 为残差的平方和; : 统计城市数(样本数); : 年份序号; : 中心化序列的协方差. 3 模型的建立 下表为我国13个城市商品房平均销售价及其相关因素统计表.依照此表可以求得各因素对商品房平均售价的影响程度,采纳信息增益计算法. 表 3.1 13个城市商品房平均销售价及其相关因素统计表 城市 竣工面积(万平方米) 人口增长率(‰) 工薪收入(元) 城乡人均储蓄余额(元/人) 造价(元/平方米) 人均全年住房支出(元) 城镇房地产开发投资(亿元) 房价(元/平方米) 北 京 5225.5 3.50 21105.61 83601.71 2219.07 551.99 2337.7 13799 天 津 2240.1 2.60 14389.10 39781.95 2642.37 450.48 735.2 6886 石家庄 7751.0 6.50 9830.57 19263.99 1851.67 187.24 1520.0 3263 上 海 5719.9 2.70 23172.36 71355.13 2923.56 991.08 1462.1 12840 南 京 43307.5 2.56 13480.72 25994.34 2147.98 512.11 3338.5 4983 杭 州 40239.7 4.63 16701.04 34427.49 2049.83 652.20 2254.3 7826 福 州 7435.1 6.20 14211.49 19516.98 1509.06 469.24 1136.3 5427 武 汉 10280.7 3.48 10331.51 14271.78 1881.15 289.00 1200.4 3532 长 沙 10073.8 6.11 9854.09 12191.34 1667.34 315.10 1084.6 2680 成 都 11393.5 2.72 10132.43 14141.95 1403.38 314.46 1588.4 3509 昆 明 3771.2 6.08 9641.68 10213.56 1564.40 432.74 737.5 2931 拉 萨 177.5 10.24 13326.40 7805.05 999.54 105.27 15.7 2452 西 安 3128.2 4.00 10775.37 17878.61 1865.76 243.32 941.6 3223 平 均 11595.7 4.7 13611.7 28495.7 1901.9 424.2 1411.7 5642.4 注:上表数据来源为《中华人民共和国国家统计局—年度数据》. 3.1 信息增益计算法 信息增益基于信息论中熵的概念.熵是对事件的属性的不确定性的度量.一个属性的熵越大,它蕴含的不确定信息越大.因此,ID3总是选择具有最高信息增益的属性作为当前结点的测试属性. 设是个数据样本的集合.假定类标号属性具有个不同的值,定义个不同的类.设是类中的样本数.对于给定的样本分类所需要的期望信息由下式给出 , 其中是任意样本属于的概率,一