试验一回归模型的OLS估计
实验一实验一回归模型的回归模型的 OLSOLS 估计估计 【实验目的】 掌握一元线性、非线性回归模型的建模方法 【实验内容】 建立我国税收预测模型 【实验步骤】 【例 1】建立我国税收预测模型。表1 列出了我国 1994-2018 年间税收收入 Y 和国内生产 总值(GDP)x 的时间序列数据,请利用统计软件Eviews 建立一元线性回归模型。 表 1我国历年税收、GDP 年份税收GDP年份税收GDP 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 一、建立工作文件 5126.88 6038.04 6909.82 8234.04 9262.8 10682.58 12581.51 15301.38 17004 20450 25718 30865.83 37636.27 48197.9 60793.7 71176.6 78973 84402.3 89677.1 99214.6 109655.2 120332.7 135822.8 159878.3 184937 216314.4 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 49442.73 54223.79 59514.7 77390 89720.31 100601 110497 119158 124892 130354 144360 156401 265810.3 314045.4 340506.9 397983 471564 519322 568845 641280.6 685992.9 740060.8 820754.3 900309 ⒈菜单方式 在录入和分析数据之前,应先创建一个工作文件(Workfile) 。启动 Eviews 软件之后, 将出现图 1 所示的界面,选择“Create a new Eviews workfile” ,将弹出一个对话框(如图2 所示) 。用户可以选择数据的时间频率(Frequency) 、起始期和终止期。 1 图 1 Eviews 菜单方式创建工作文件示意图 图 2 工作文件定义对话框 本例中选择时间频率为Annual (年度数据) ,在起始栏和终止栏分别输入相应的日期94 和 18。然后点击 OK,在 Eviews 软件的主显示窗口将显示相应的工作文件窗口(如图3 所 示) 。 2 图 3 Eviews 工作文件窗口 一个新建的工作文件窗口内只有 2 个对象(Object),分别为 c(系数向量)和 resid(残 差) 。它们当前的取值分别是0 和 NA(空值) 。可以通过鼠标左键双击对象名打开该对象查 看其数据,也可以用相同的方法查看工作文件窗口中其它对象的数值。 ⒉命令方式 还可以用输入命令的方式建立工作文件。在Eviews 软件的命令窗口中直接键入 CREATE命令,其格式为: CREATE时间频率类型起始期终止期 本例应为:CREATEA19942018 二、输入数据 在 Eviews 软件的命令窗口中键入数据输入/编辑命令: DATAYX 此时将显示一个数组窗口(如图4 所示) ,即可以输入每个变量的数值 图 4 Eviews 数组窗口 3 三、图形分析 借助图形分析可以直观地观察经济变量的变动规律和相关关系, 以便合理地确定模型的 数学形式。 ⒈趋势图分析 命令格式:PLOT变量 1变量 2……变量 K 作用:⑴分析经济变量的发展变化趋势 ⑵观察是否存在异常值 本例为:PLOTYX ⒉相关图分析 命令格式:SCAT变量 1变量 2 作用:⑴观察变量之间的相关程度 ⑵观察变量之间的相关类型, 即为线性相关还是曲线相关, 曲线相关时大致是哪 种类型的曲线 说明:⑴SCAT命令中,第一个变量为横轴变量,一般取为解释变量;第二个变量为纵 轴变量,一般取为被解释变量 ⑵SCAT 命令每次只能显示两个变量之间的相关图,若模型中含有多个解释变 量,可以逐个进行分析 ⑶通过改变图形的类型,可以将趋势图转变为相关图 本例为:SCATYX 图 5 税收与 GDP 趋势图 图 5、图 6 分别是我国税收与 GDP 时间序列趋势图和相关图分析结果。两变量趋势图 分析结果显示, 我国税收收入与 GDP 二者存在差距逐渐增大的增长趋势。 相关图分析显示, 我国税收收入增长与 GDP 密切相关,二者为非线性的曲线相关关系。 4 图 6 税收与 GDP 相关图 三、估计线性回归模型 在数组窗口中点击 Proc\Make Equation,如果不需要重新确定方程中的变量或调整样本 区间, 可以直接点击 OK 进行估计。 也可以在 Eviews 主窗口中点击 Quick\Estimate Equation, 在弹出的方程设定框(图7)内输入模型: YCX或 Y C(1) C(2) X 图 7 方程设定对话框 5 还可以通过在 Eviews 命令窗口中键入 LS 命令来估计模型,其命令格式为: LS被解释变量C解释变量 系统将弹出一个窗口来显示有关估计结果(如图8 所示) 。因此,我国税收模型的估计 式为: 4017.1580.1874xy 这个估计结果表明,GDP 每增长 1 亿元,我国税收收入将增加0.1874 亿元。 图 8 我国税收预测模型的输出结果 如果存在滞后项,则命令格式为: 1、存在一期滞后期命令格式为:yy(-1)cx 2、存在多期滞后期命令格式为:yy(-1)y(-2) y(-3) y(-4) cx 或者为:yy(-1 to -4)cx 上述命令中的变量,可以包含公式,公式中不应有空格或者应当用小括号括起来 LOG(Y) C LOG(Y(-1)) ((X+X(-1))/2) 标准回归模型输出结果解读: 标准误差(标准误差(Std.Std. ErrorError)) ::是描述均数抽样分布的离散程度及衡量均数抽样误差大小 的尺度。主要用来衡量回归系数的统计可靠性。 6 标准误差的理念原自一个事实: 只要样本平均值是无偏估计值 (unbiased estimator), 误差(估量与真实数值的差)的标准差等于估量自身的标准差,因为随机变量和期望值 之间差异的标准差等于一个随机变量自身的标准差。 在很多实际应用中,标准差的真正值通常是未知的。因此,标准误这个术语通常运 用于代表这一未知量的估计。在这些情况下,需要清楚业已完成的和尝试去解决的标准 误差仅仅可能是一个估量。然而,这通行上不太可能:人们可能往往采取更好的估量方 法,而避免使用标准误,例如采用最大似然或更形式化的方法去测定置信区间。第一个 众所周知的方法是在适当条件下可以采用学生t-分布为一个估量平均值提供置信区间。 在其他情况下,标准差可以有效地利用于提供一个不确定性空间的示值,但其正式或半 正式使用是提供置信区间或测试,并要求样本总量必须足够大。 其总量大小取决于具体 的数量分析 概率(概率(ProbProb)): :显示在服从 t 分布条件下,对应相关 t 统计量值的概率。 可决系数(可决系数(R-squaredR-squared)) ::测量的是在样本范围内用回归来预测被解