短信预约提醒成功
第二节 因果分析法-1
因果分析法主要包括:
回归分析法.
弹性系数分析法.
消费系数法等方法。
回归分析法是分析相关因素相互关系的一种数理统计方法,通过建立一个或一组自变量与相关随机变量的回归分析模型,来预测相关随机变量的未来值。回归分析法按分析中自变量的个数分为一元回归与多元回归;按自变量与因变量的关系分为线性回归与非线性回归。不论是一元回归模型还是多元回归模型,预测模型的建立要经过严格的统计检验,否则模型不能成立。
弹性系数法是―种相对简单易行的定量预测方法,通过计算某两个变量相对变化弹性关系,弹性是―个相对量,它衡量某―变量的改变所引起的另―变量的相对变化。
消费系数法是按行业、部门、地区、人口、群体等对某产品的消费者进行分析,认识和掌握消费者与产品的数量关系,从而预测产品需求量。
一、一元线性回归
(一)基本公式
如果预测对象与主要影响因素之间存在线性关系,将预测对象作为因变量y,将主要影响因素作为自变量x,即引起因变量y变化的变量,则它们之间的关系可以用一元回归模型表示为如下形式:
y=a+bx+e
其中:a和b是揭示x和y之间关系的系数,a为回归常数,b为回归系数
e是误差项或称回归余项。
对于每组可以观察到的变量x,y的数值xi,yi,满足下面的关系:
yi =a+bxi+ei
其中ei是误差项,是用a+bxi去估计因变量yi的值而产生的误差。
在实际预测中,ei是无法预测的,回归预测是借助a+bxi得到预测对象的估计值yi。为了确定a和b,从而揭示变量y与x之间的关系,公式可以表示为:
y=a+bX
公式y=a+bX是式y=a+bx+e的拟合曲线。可以利用普通最小二乘法原理(OLS)求出回归系数。最小二乘法基本原则是对于确定的方程,使观察值对估算值偏差的平方和最小。由此求得的回归系数为:
b=[∑xiYi―x∑yi]/∑xi2―x∑xi
a=y’-bx’
式中:xi、yi分别是自变量x和因变量y的观察值,x-、y-分别为x和y的平均值.
x-=∑xi/ n
y-= ∑yi/ n
对于每一个自变量的数值,都有拟合值:
yi’=a+bxi
yi’与实际观察值的差,便是残差项
ei=yi一yi’
(二)回归检验
在利用回归模型进行预测时,需要对回归系数、回归方程进行检验,以判定预测模型的合理性和适用性。检验方法有方差分析、相关检验、t检验、F检验。 对于一元回归,相关检验与t检验、F检验的效果是等同的,因此,在一般情况下,通过其中一项检验就可以了。对于多元回归分析,t检验与F检验的作用却有很大的差异。
1.方差分析
通过推导,可以得出:
∑(yi―y-)2= ∑(yi―yi’)2+∑(yi―y-)2
其中:
∑(yi’―y-)2=TSS,称为偏差平方和,
反映了n个y值的分散程度,又称总变差。
∑(yi―yi’)2=RSS,称为回归平方和,
反映了x对y线性影响的大小,又称可解释变差。
∑(yi―yi’)2=ESS,称为残差平方和,
根据回归模型的假设条件,ESS是由残差项e造成的,它反映了除x对y的线性影响之外的一切使y变化的因素,其中包括x对y的非线性影响及观察误差。因为它无法用x来解释,故又称未解释变差。
所以,TSS=RSS+ESS
其实际意义是总变差等于可解释变差与未解释变差之和。
在进行检验时,通常先进行方差分析,一方面可以检验在计算上有无错误;另一方面,也可以提供其他检验所需要的基本数据。
定义可决系数R2,
R2 =RSS/TSS
R2 的大小表明了y的变化中可以用x来解释的百分比,因此,R2 是评价两个变量之间线性关系强弱的一个指标。可以导出,
R2 = RSS/TSS=∑(yi―yi’)2 /∑(yi―y-)2
=1- ESS/ TSS=1-∑(yi―y-)2 /∑(yi―y-)2
2.相关系数检验
相关系数是描述两个变量之间的线性相关关系的密切程度的数量指标,用R表示。
R在―1和1之间,
当R=1时,变量x和少完全正相关;
当R=-1时,为完全负相关;
当0 当-1 当R=0时,变量x和y没有线性关系。 所以,R的绝对值越接近1,表明其线性关系越好; 反之,R的绝对值越接近0,表明其线性关系越不好。 只有当R的绝对值大到一定程度时,才能采用线性回归模型进行预测。在计算出R值后,可以查相关系数检验表(见书附表1)。 在自由度n―2(n为样本个数)和显著性水平a(一般取a=0.05)下, 若R大于临界值,则变量x和y之间的线性关系成立; 否则,两个变量不存在线性关系。 3.t检验 即回归系数的显著性检验,以判定预测模型变量x和y之间线性假设是否合理。因为要使用参数t值,故称为t检验。回归常数a是否为0的意义不大,通常只检验参数b。
其中:Sb是参数b的标准差,n为样本个数。 S为回归标准差, tb服从t分布,可以通过t分布表(见本书附表2)查得显著性水平为a,自由度为n―2的数值t(a/2,n―2)。与之比较,若tb的绝对值大于t,表明回归系数显著性不为0,参数的t检验通过,说明变量x和y之间线性假设合理。若tb的绝对值小于或等于t,表明回归系数为0的可能性较大,参数的‘检验未通过,回归系数不显著,说明变量x和y之间线性假设不合理。 4,F检验 即回归方程的显著性检验。是利用方差分析,检验预测模型的总体线性关系的显著性。
统计量F服从F分布,可以通过F分布表(见书附表3),查找显著性水平为a,自由度为n=1,n=n―2的F值Fa(1,n―2)。 将F与Fa(1,n―2)比较: 若F大于Fa(1,n―2),则回归方程较好地反映了变量x和y之间的线性关系,回归效果显著,方程的F检验通过,意味着预测模型从整体上是适用的; 若F小于或等于Fa(1,n―2),说明回归方程不能很好地反映变量x和y之间的关系,回归效果不显著,方程的F检验未通过,预测模型不能采用。