招生咨询08:00-24:00
微信公众号
咨询老师
20、利用普通最小二乘法求的样本回归直线具有以下特点:
(1)样本回归直线必然通过点X的均值和点Y的均值;
(2)预测值Y的平均值与实际值Y的平均值相等;
(3)残差ei均值为零;
(4)残差ei与解释变量X不相关。
21、普通最小乘估计量的特性:
(1)无偏性:E(β0)= β0,E(β1)= β1由不同样本得到的β0和β1可能大于或小于总体的β1和β0,但平均起来等于总体参数。
(2)线性特性:即估计量β0和β1均为样本观测值Y的线性组合。
(3)有效性:即β1和β0的方差最小。
22、简单线性回归模型的检验
(1)对估计值的直观判断:1.对回归系数β1的符号判断;2.对β1的大小判断。
(2)拟合优度的检验:拟合优度是指样本回归直线与样本观测值之间的拟合程度,通常用判定系数r2表示。检验拟合优度的目的,是了解释变量X对被解释变量Y的解释程度。X对Y的解释能力越强,残差ei的绝对值就越小,从而样本观测值离回归直线的距离越近。判定系数计算公式:
ESS Σ(Y(预测值)—Y(均值)) β12(回归系数)Σ(X(样本值)—X(均值))
r2=———=——————————————=————————————————————
TSS Σ(Y(样本值)—Y(均值)) Σ(Y(样本值)—Y(均值))
判定系数r2的两个重要性质:
1.它是一个非负的量。
2.它是在0与1之间变化的量。当r2=1时,所有的观测值都落在样本回归直线上,是完全拟合;当r2=0时,解释变量与被解释变量之间没有关系。
23、相关系数是衡量变量之间线性相关的指标。用r表示,它具有下列性质:
(1)它是可正可负的数
(2)它是在-1与+1之间变化的量。
(3)它具有对称性,即X与Y之间的相关系数与Y与X值将的相关系数相同。
(4)如果X和Y在统计上独立,则相关系数为零。当r=0,并不说明两个变量之间一定独立。这是因为,r仅适用于变量之间的线性关系,而变量之间可能存在非线性关系。
Σ(X(样本值)—X(均值))(Y(样本值)—Y(均值))
r=—————————————————————————————
[Σ(X(样本值)—X(均值))2Σ(Y(样本值)—Y(均值))2]1/2
r=±[r2]1/2并且r的符号与回归系数β1的符号相同。
相关系数与判定系数在概念上仍有明显区别:前者建立在相关分析的理论基础上,研究的是两个随机变量之间的线性相关的关系,不仅反映变量之间的因果关系;后者建立在回归分析的理论基础上,研究的是一个普通变量(X)对另一个随机变量的定量解释程度。
24、相关系数的检验(t检验)
一般说来,相关系数可以反映X与Y之间的线性相关程度。r的绝对值越接近于1,X与Y之间的线性关系就越密切。但相关系数通常是根据样本数据得到的,因而带有一定的随机性,且样本越小其随机型就越大。因此,我们有必要依据样本相关系数r对总体相关系数ρ进行统计检验。可构造t统计量:
r(n—2)1/2
t=—————— 其中r为相关系数,n为样本数,服从(n-2)的t分布;查t分布得
(1—r2) 1/2 相应的临界值tα/2如果有:|t|≥tα/2则认为X与Y之间存在显著的线性相关关系。反之若有|t|≤tα/2则认为X与Y之间不存在显著的线性相关关系。
25、在一元线性回归模型中Y=β0+β1X+μi,β1代表解释变量X对被解释变量Y的线性影响。如果X对Y的影响是显著的,则有β1≠0;若X对Y的影响不显著,则有β1=0。由于真实参数β1是未知的,我们只能依据样本估计值对β1进行统计检验。
26、多重判定系数R2:为了说明二元回归方程对样本观测值拟合的优劣,需要定义多重判定系数。多重判定系数与简单判定系数r2一样,R2也定义为有解释的变差(ESS)与总变差(TSS)之比。显然,R2也是一个在0与1 之间的数。R2的值越接近1,拟合优度就越高。R2=1时,RSS=0,表明被解释变量Y的变化完全由解释变量X1和X2决定;当R2=0,表明Y的变化与X1,X2无任何关系。同时对于两个被解释变量相同而解释变量个数不同的模型,包含解释变量多的模型就会有较高的R2值。