第 4 章 多元线性回归:统计推断
4.1 引例
在电影《肖申克的救赎》的一开始,男主人公被控杀害妻子,“铁证如山”,锒铛入狱。但,男主人公是被冤枉的。
审判的程序:
- 提出原假设(无罪);
- 提供证据;
- 若证据不足,维持原假设(无罪释放);若证据足够充分,拒绝原假设(投入监狱)。
可能存在的问题:
- 释放了真正的罪犯(错误地维持原假设);
- 将无辜的人关进监狱(错误地拒绝原假设)。
统计推断的程序和存在的问题亦如是。
4.3 检验对单个总体参数的假设
见伍德里奇(2015)《计量经济学导论:现代观点》第五版第4.2节。
多元线性回归可借助软件Stata估计并做统计推断。Stata命令如下(假设有三个自变量):
regress y x1 x2 x3
4.4 多元回归能解决遗漏变量问题吗?
相比简单回归,多元回归考虑了更多的影响因素,能不能彻底解决遗漏变量问题?问题在于,影响因素有很多,能把所有的因素都包含进来吗?有两个难点:
- 第一个难点是,甚至不可能列出所有的影响因素。例:20世纪90年代,美国犯罪率大幅降低,什么原因导致?列维特和都伯纳(2016)提出并验证了,70年代允许堕胎法案的通过在一定程度上导致90年代犯罪率降低!多数人想不到这个影响因素。
- 第二个难点是,即使列出来一些影响因素,一定能找到这些影响因素的数据吗?收集数据最原始的方式是发问卷。如果想度量更多的影响因素,就要在问卷上设置更多的问题。问题一多,做一份问卷的时间就长了,时间或人工成本增加,未必是时间或经费有限的研究者能够承受的。在有限的时间或经费预算内,理性的做法是,测度重要的因素,舍弃次要的因素。
总之,不可能把所有的影响因素都加入自变量。未纳入的影响因素进入干扰项。不能保证所有未纳入的因素都和核心解释变量不相关。一旦有一个未纳入的因素与核心解释变量相关,零条件均值假设就不成立了,OLS估计量有偏,平均而言不能识别因果关系。
结论:相比二元线性回归,多元线性回归使得遗漏变量问题有所缓解,但不能保证彻底解决遗漏变量问题,且通常不能彻底解决遗漏变量问题。
但,有一种特殊的情况,多元线性回归能识别因果关系,这就是满足一定前提条件的清晰断点回归(可以把它看作多元线性回归的一个特例)。为能理解清晰断点回归,需要先学习定性信息的知识。
参考文献
- 列维特、都伯纳. 魔鬼经济学01[M]. 中信出版社会, 2016.
- 伍德里奇. 计量经济学导论(第五版)[M]. 中国人民大学出版社, 2015.