步骤二、参数估计知识点:
1、最小二乘估计的基本原理:残差平方和最小化。 2、参数估计量:
xiyiˆ1xi2 ① 一元回归:ˆˆ0Y1X1TˆXXXY ② 多元回归:
3、最小二乘估计量的性质(Gauss-Markov定理):
ˆ是的最优线性无偏估在满足基本假设的情况下,最小二乘估计量计量(BLUE估计量)
步骤三、模型检验
1、经济计量检验(后三章内容) 2、统计检验 ①拟合优度检验 知识点:
ⅰ:拟合优度检验的作用:检验回归方程对样本点的拟合程度 ⅱ:拟合优度的检验方法:计算(调整的)样本可决系数R2/R2
R2RSSESS1TSSTSS,R21ESS/nk1
TSS/n1注意掌握离差平方和、回归平方和、残差平方和之间的关系以及它们
的自由度。
计算方法:通过方差分析表计算 方差来源 离差平方和 回归平方和 残差平方和 符号 TSS RSS ESS 计算公式 自由度(d.f.) n-1 k n-k-1 均方值(MSS) YiYi2 YiYi2/n-1 2iˆYYi2iˆYYi/k iˆYiY2iˆYiY2/ n-k-1 例2:下表列出了三变量(二元)模型的回归结果:
方差来源 离差平方和TSS 回归平方和RSS 残差平方和ESS 1) 样本容量为多少?
解:由于TSS的自由度为n-1,由上表知n-1=14,因此样本容量n=15。 2) 求ESS
解:由于TSS=ESS+RSS,故ESS=TSS-RSS=77 3) ESS和RSS的自由度各为多少?
解:对三变量模型而言,k=2,故ESS的自由度为n-k-1=12 RSS的自由度为k=2 4) 求R2和R2
2解:R平方和(SS) 自由度 66042 65965 14 均方值 RSS65965ESS/nk10.9988,R210.9986 TSS66042TSS/n1
②回归方程的显著性检验(F检验)
目的:检验模型中的因变量与自变量之间是否存在显著的线性关系 步骤:1、提出假设:
H0:12...k0H1:至少有一j0 , j1,2,...,k
2、构造统计量:FRSS/k~F(k,nk1)
ESS/nk1 3、给定显著性水平,确定拒绝域FFk,nk1 4、计算统计量值,并判断是否拒绝原假设
例3:就例2中的数据,给定显著性水平1%,对回归方程进行显著性检验。
解:由于统计量值FRSS/k65965/25140.13,
ESS/nk177/12又F0.012,126.93,而F5140.13F0.012,126.93
故拒绝原假设,即在1%的显著性水平下可以认为回归方程存在显著的线性关系。
附:R与F检验的关系:
RSSRSSR2RRSSESS2R2/kTSSESSRSS1R由于 F2RSS/k1R/nk1 又FESS/nk122③解释变量的显著性检验(t检验)
目的:检验模型中的自变量是否对因变量存在显著影响。 知识点:
多元回归:Sˆe2iink1Ci1,i1,其中Ci1,i1为XX中位于第i+1行
1和i+1列的元素;
一元回归:Sˆ0eXnn2x2i2i2i,Sˆ1n2xi2e2i
变量显著性检验的基本步骤:
1、提出假设:H0:i0 H1:i0 2、构造统计量:tS~t(nk1)
ˆiˆi3、给定显著性水平,确定拒绝域tt/2(nk1) 4、计算统计量值,并判断是否拒绝原假设 例4:根据19个样本数据得到某一回归方程如下:
ˆ58.90.2X0.1XY12se (0.0092) (0.084)
试在5%的显著性水平下对变量X1和X2的显著性进行检验。
解:由于t/2(nk1)t0.025(16)2.12,故t检验的拒绝域为t2.12。对
自变量X1而言,其t统计量值为tˆ1Sˆ10.221.742.12,落入 0.0092拒绝域,故拒绝10的原假设,即在5%的显著性水平下,可以认为自变量X1对因变量有显著影响;
对自变量X2而言,其t统计量值为tˆ2Sˆ20.11.192.12,未落入拒0.084绝域,故不能拒绝20的原假设,即在5%的显著性水平下,可以认为自变量X2对因变量Y的影响并不显著。 ④回归系数的置信区间
目的:给定某一置信水平1,构造某一回归参数i的一个置信区间,使
i落在该区间内的概率为1
基本步骤:
1、构造统计量tˆiiSˆi~t(nk1)
2、给定置信水平1,查表求出水平的双侧分位数t/2(nk1)
ˆtS,ˆtS 3、求出i的置信度为1的置信区间ˆˆi/2i/2ii例5:根据例4的数据,求出1的置信度为95%的置信区间。 解:由于t0.025(16)2.12,故1的置信度为95%的置信区间为:
0.22.120.0092,0.22.120.00920.18,0.22
3、经济意义检验
目的:检验回归参数的符号及数值是否与经济理论的预期相符。 例6:根据26个样本数据建立了以下回归方程用于解释美国居民的个人消费支出:
ˆ10.960.93X2.09XY12t (3.33) (249.06) (3.09) R20.9996 其中:Y为个人消费支出(亿元);X1为居民可支配收入(亿元);X2为利率(%)
ˆ和ˆ的符号; 1) 先验估计12解:由于居民可支配收入越高,其个人消费水平也会越高,因此预期自变量X1回归系数的符号为正;而利率越高,居民储蓄意愿越强,消费意愿
ˆ应为负。相应越低,因此个从消费支出与利率应该存在负相关关系,即 22) 解释两个自变量回归系数的经济含义;
ˆ0.93表示,居民可支配收入每增加1亿元,其个人消费支出相应解:1会增加0.93亿元,即居民的边际消费倾向MPC=0.93;
ˆ2.09表示,利率提高1个百分点,个人消费支出将减少2.09亿元。 2截距项表示居民可支配收入和利率为零时的个人消费支出为-10.96亿元,它没有明确的经济含义。 3) 检验1是否显著不为1;(5%) 解:1)提出假设:H0:11 H1:11
2)构造统计量:tˆ11Sˆ1~t(nk1)
3)给定显著性水平5%,查表得t/2(nk1)t0.025(23)2.07,故拒绝域为t2.07
ˆˆ0.931ˆSˆ10.003734 4)计算统计量值:由于t(1)1ˆSˆ249.06t(1)1则tˆ11Sˆ10.0718.752.07,落入拒绝域。故拒绝11 的原假设。
0.003734即在5%的显著性水平下,可认为边际消费倾向MPC显著不为1。 4) 检验2显否显著不为零;(5%) 解:1)提出假设:H0:20 H1:20
2)构造统计量:tˆ2Sˆ2~t(nk1)
3)给定显著性水平5%,查表得t/2(nk1)t0.025(23)2.07,故拒绝域为t2.07
ˆ)3.092.07,落入拒绝域,故拒绝原假4)计算统计量值:由于t(2设。即在5%的显著性水平下,可以认为2显著异于零。 5) 计算R2值;
ESS/nk1ESSn1n1111R2TSS/n1TSSnk1nk1解:由于
261110.99960.999572621R21
6) 计算每个回归系数的标准差;
ˆ10.960S3.29ˆ0ˆt(0)3.33ˆˆˆ0.93iiˆ解:由于t(i)SˆSˆ10.00373 i1ˆˆSˆ249.06t(i)t(1)iˆSˆ22.090.672ˆ)3.09t(27) 给出2置信水平为95%的置信区间;
ˆ2.09 , S解:由于ˆ220.67 , t0.025(23)2.07,故2置信水平为
95%的置信
区间为2.092.070.67 , 2.092.070.67-3.49 , -0.69 8) 对回归方程进行显著性检验; 解:提出假设:H0:120 H1:1或20
构造统计量FRSS/k~F(k,nk1)
ESS/nk1确定拒绝域:FF(k.nk1)F0.05(2,23)3.42 计算统计量并进行判断:
R2/k0.9996/228738.53.42 由于F20.0004/231R/nk1故拒绝原假设,即在5%的显著性水平下认为回归方程的线性关系显著成立。
步骤四:经济预测
ˆ可以看着是Y的条件均值EY|X和个别值Y的预测值,ˆX点预测:Y00000分别称为均值预测和个值预测;
ˆ是EY|X和Y的一个无偏估计量。 ˆX性质:Y00000区间预测:均值EY0|X0的区间预测
预测步骤:1)确定统计量:tˆEY|XY000SYˆ0~t(nk1)
其中SYˆ0e2ink1X0XXX01
2)给定置信水平1,确定EY0|X0的预测区间为:
Yˆt0/2ˆt(nk1)S(nk1)SYˆ,Yˆ0/2Y00
个值Y0的区间预测
ˆYe0Y00~t(nk1) 预测步骤:1)确定统计量:tSe0Se0其中Se01 1X0XXX0nk1e2i2)给定置信水平1,确定Y0的预测区间为:
Yˆt0/2ˆt(nk1)S(nk1)Se0,Y0/2e0
作业:
为解释某地对酒的消费,根据20年的样本数据得到了如下回归方程:
ˆ0.0140.354X0.018X0.657X0.059X Y1234其中:Y:每一成年人每年对酒的消费量(升); ; X1:酒类的平均价格(元)
X2:个人可支配收入(元) X4:酒类广告投入(万元)
X3:酒类经营许可证数量(张)
1已知R20.6, C2,228.9014,XX对角线上的元素分别为C1,10.0576,回归方程的残差平方和ESS0.0375 C3,30.01,C4,428.3042,C5,50.4624,1) 先验地,你认为各自变量回归系数的符号为什么? 2) 请完成以下方差分析表:
方差来源 离差平方和TSS 回归平方和RSS 残差平方和ESS 平方和(SS) 0.0375 自由度 均方值 3) 计算R2值
4) 对4个自变量进行显著性检验,并分析其经济含义; 5) 给出2置信水平为95%的区间估计; 6) 对方程进行显著性检验;