短信预约提醒成功
(三)回归分析的概念
1.回归分析的概念
计算相关系数只能说明现象间相关关系的方向和程度,关系密切与否,但不能说明一个现象发生一定量的变化,另一个现象一般也会发生多大的变化。如销售收入每增加一万元时,销售利润一般会增加多少?施肥量增加一斤,一般地会增加多少产量?
为了测定现象之间数量变化上的一般关系要使用数学方法,这类数学方法称为回归分析。“回归”这个词的意思,就是指的变量之间的一般数量关系。根据现象之间相关关系的表现形式,配合一条直线或曲线,用这条直线或曲线来代表自变量和因变量相随变动的一般数量关系。也就是要建立并求解直线或曲线的数学方程式,从而求得变量间的一般关系值。
回归有不同种类,按照自变量的个数分,有一元回归和多元回归。只有一个自变量的叫一元回归,有两个或两个以上自变量的叫多元回归;按照回归曲线的形态分,有线性(直线)回归和非线性(曲线)回归。实际分析时应根据客观现象的性质、特点、研究目的和任务选取回归分析的方法。本节仅讨论一元线性回归分析。
与直线相关分析的特点相比,简单直线回归分析有以下特点。
(1)两个变量之间不是对等关系,一个是自变量,一个是因变量,在进行回归分析时,首先加以确定。
(2)相关系数是个抽象的系数,而回归方程是利用自变量的给定值来推算因变量值,它反映的是变量之间的具体的变动关系。
(3)有些现象因果关系不明显,x、y两个变量可以互换,从方程式看,存在着两个回归方程:一个是以x为自变量,y为因变量,求出的回归方程称“y倚x回归方程”;另一个是以y为自变量,x为因变量,求出的回归方程称“x倚 y回归方程”。画出图来,是两条斜率不同的回归直线。
(4)直线回归方程中的回归系数也有正负号,回归系数为正号,表示两个变量之间的变动方向相同,为负号则表示两变量之间的变动方向相反。
(5)回归分析中的自变量是给定数值,不是随机的,而因变量是随机的,代入给定的自变量值,求出因变量的估计值,这个估计值是许多可能数值的平均值,存在着估计标准误差。
2.相关分析与回归分析的关系
相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之前,就进行回归分析,很容易造成“虚假回归”。与此同时,相关分析只研究变量之间相关的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来,才能达到研究和分析的目的。
二者的区别主要体现在以下三个方面:
1.相关分析主要通过相关系数来判断两个变量之间是否存在着相互关系及其关系的密切程度,其前提条件是两个变量都是随机变量,且变量之间不必区别自变量和因变量。而回归分析研究一个随机变量(Y)与另一个非随机变量(X)之间的相互关系,且变量之间必须区别自变量和因变量。
2.相关系数只能观察变量间相关关系的密切程度和方向,不能估计推算具体数值。而回归分析可以根据回归方程,用自变量数值推算因变量的估计值。
3.互为因果关系的两个变量,可以拟合两个回归方程,且互相独立、不能互相替换。而相关系数却只有一个,即自变量与因变量互换相关系数不变。
需要指出的是,变量之间是否存在“真实相关”,是由变量之间的内在联系所决定的。相关分析和回归分析只是定量分析的手段,通过相关分析和回归分析,虽然可以从数量上反映变量之间的联系形式及其密切程度,但是无法准确判断变量之间内在联系的存在与否,也无法判断变量之间的因果关系。因此,在具体应用过程中,一定要始终注意把定性分析和定量分析结合起来,在准确的定性分析的基础上展开定量分析。