03多元线性回归模型学习辅导
第三章第三章多元线性回归模型学习辅导多元线性回归模型学习辅导 一、本章的基本内容一、本章的基本内容 ( (一一) )基本内容基本内容 多元线性回归模型的形式 模 型 与 假 定 偏回归系数 多元线性回归的古典假定: 增加无多重共线性假定 多元线性回归性参数的最小二乘估计 多 元 线 性 回 归 模 型 模 型 估 计 参数最小二乘估计的性质 随机扰动项方差的估计 多元线性回归模型参数的区间估计 拟合优度检验:修正的可决系数 模 型 检 验 回归方程的显著性检验(F 检验) 回归参数的显著性检验(t 检验) 模 型 预 测 被解释变量的点预测 被解释变量均值与个别值预测 图 3.1第三章基本内容 ( (二二) )本章的教学目标本章的教学目标 在现实的计量经济分析中, 事实上影响被解释变量的因素不止一个, 通常会有多个影响 因素;另外,即使我们的分析目的是仅考察某一个因素对被解释变量的影响, 但为了得到该 因素对被解释变量的“净”影响,也需要将其他影响因素作为“控制变量”,使其以显性形 式出现在模型中,以提高模型估计精度。 因此,在对现实经济问题进行计量经济分析时,通 常需要建立包含两个及两个以上解释变量的计量模型,此类模型称为多元回归模型。 多元回归模型是在简单回归模型理论基础上的扩展, 其建模的理论基础、 基本思路、模 型估计等与一元回归模型基本一致, 只是因解释变量增多, 从而带来一些新的内容, 比如模 型整体显著性检验(F 检验)、修正的可决系数(R2)以及解释变量之间多重共线性等问 题。本章的教学目标是:深刻理解建立多元回归模型的目的;掌握多元线性回归模型估计、 检验的理论与方法;熟练掌握多元线性回归EViews 输出结果的解释。 二、重点与难点分析二、重点与难点分析 1.1.对多元线性回归模型参数意义的理解对多元线性回归模型参数意义的理解 多元线性回归模型的参数与简单线性回归模型的参数有重要区别。 在多元线性回归模型 中,解释变量对应的参数是偏回归系数, 表达的是控制其他解释变量不变的条件下, 该解释 变量的单位变动对被解释变量平均值的“净”影响。 为了更深刻理解偏回归系数,可以两个解释变量的多元线性回归模型为例加以说明1。 例如,被解释变量 Y 与解释变量X 2 和X 3 都有关,如果分别建立模型: 多元线性回归: Y i 1 2 X 2i 3 X 3i u i 简单线性回归: Y i a 1 a 2 X 2i u 1i 由于 Y 与X 3 有关,可以作回归:Y i b 1 b 3 X 3i u 2i ,若用OLS 估计其参数,并计算残 ˆ b ˆ X y b ˆ x,这里的e表示除去X影响后的Y。差e 2i Y i b 2i3ii133ii33i 如果X 2 和X 3 也有相关性,并有X 2i c 1 c 23 X 3i u 3i ,若用 OLS 估计其参数,并计 ˆ 1 c ˆ 23 X 3i x 2i c ˆ 23 x 3i ,这里的e3i表示。算残差e3i X 2i c 再作除去X 3i 影响后的Y i 对除去X 3i 影响后的X 2i 的回归,即e2i对e3i的回归,因为e2i 和e3i的均值为 0,应为过原点的回归,即e2i 2e3i v i 。用 OLS 估计其参数,结果为 ˆ 2 e 2ie3i e2 3i 。并有 1证明见古加拉蒂《计量经济学》第四版附录 7A.2 ˆ 2 e 2ie3i ˆ 、c ˆ 2 ˆ 23 代入得 将b 3 i ˆ x )(x c ˆ (y b e ˆ x )(x c 2 3i i33i 2i 2i 233i 233i 2 x ) [y (y xx )x [x (x i3i 2 3i 2i 3i ][x 2i (x 2i x 3i x 2i3i x 2 x2 3i )x 3i ] 2 3i )x 3i ]2 2(y i x 2i )(x 3i )(y i x 3i )(x 2i x 3i ) (x )(x )(x 2i x 3i ) 2 2i 2 3i ˆ 2 ˆ 是一致的,而与简单线性回归中的 a ˆ 2 是这表明,这样估计的ˆ 2 与多元回归中估计的 2 不一致的。只要X 2 和X 3 相关,x 2i3i x 0, 2 与a2就有区别。并且这说明多元线性回 归中的参数是控制其它解释量不变的条件下, 第 j 个解释变量的单位变动对被解释变量平均 值的影响,即对 Y 平均值“直接”或“净”的影响。 此外,如果X 3i d 1 d 32 X 2i u 4i 还可以证明2,223d32 x (u u) ,则 x 2ii 2 2i 有E(a2) 23d32。只要d32 0,2与a2是有区别的。a2不仅包括X 2i 对 Y 平均值的 “直接”影响 2 ,还包括由于导致X 3i 的变动而对 Y 平均值的“间接”影响 3d32 。 2.2.对无多重共线性假定的理解对无多重共线性假定的理解 本章对模型新增加了一个假定, 即解释变量之间无多重共线性假定。 这一假定是针对解 释变量之间的关系而设定, 根本目的是保证模型可以估计。 如果解释变量之间存在完全多重 共线性,会造成数据观测矩阵X 非列满秩,模型参数将无法估计。在实际做计量经济分析 时,很多经济变量虽然不存在完全的线性关系, 却通常都存在一定的相关性, 不一定满足无 多重共线性的假定,模型的估计可能会受到影响, 其影响和处理措施详见第四章。 本章的目 的是讨论多元线性回归模型的理论与方法, 为了不使问题复杂化, 这里先假定不存在多重共 线性。 3.3. 为什么要对可决系数加以修正为什么要对可决系数加以修正 在多元回归中R是模型中解释变量个数的非减函数, 也就是说, 随着模型中解释变量 个数的增加,R的值通常都会变大,为了得到拟合优度较高的模型,似乎加入更多解释变 量是合理选择。但是,在建立计量经济模型时,随着解释变量个数的增加, 待估计的参数也 2 2 2证明见古加拉蒂《计量经济学》第三版附录 7A.5 会增多,由此造成样本自由度的减少,模型参数估计的准确性下降。因此, 在多元回归模型 中,仅仅依据R2对模型作比较和选择会产生问题,在增加新的解释变量时,必须对由其带 来的模型自由度下降这一“负面影响”而做出“惩罚”,因此需要对R2做出相应的修正。 4.4.个别参数显著性个别参数显著性 t t 检验与模型整体显著性检验与模型整体显著性 F F 检验的关系检验的关系 F 检验用于判断模型整体显著性,F 检验是检验若干解释变量联合起来作为一个整体对 被解释变量的影响是否显著, 或者说是检验整个模型的整体显著性。 而 t 检验是检验模型中 个别参数的显著性,检验个别解释变量是否是影响被解释变量的显著因素。 F 检验与 t 检验 的关系好比拔河比赛中团队力量与个人力量的关系,A 队胜过 B 队,说明 A 队整体力量胜 过 B 队,相当于 F 检验,但并不意味着A 队每个队员的力量都很强,还需要