短信预约提醒成功
二、讲解内容 $lesson$
1.主成分分析的基本思路和简单数学解释
主成分分析就是把多个指标简化为少数几个综合指标的统计分析方法,它能使这些综合指标尽可能地反映原来多个指标的信息,并保证这些综合指标彼此之间互不相关。
主成分分析的数学解释:
设有p个原始指标:x1,x2,x3,…xp,用来对n个单位进行评价,则共有np个数据。
这p个原始指标之间往往存在着一定的相关性,主成分分析的目的是要将这些原始指标组合成新的不相关的指标:y1,y2,y3,…yp,以使各指标在整个经济过程中的作用容易解释,这些综合指标表现为原始指标的线性函数:
y1=l11x1+l12x2+…l1pxp
y2=l21x1+l22x2+…l2pxp
yp=lp1x1+lp2x2+…lppxp
由于所组合成的新指标:y1,y2,y3,…yp彼此不相关,就使我们有可能从中选择主要成分,通过对主要成分的重点分析,达到综合评价的目的。
通过数学计算可以将p个指标的总方差分解为p个不相关的综合指标的方差之和并使第一个综合指标y1方差达到最大(贡献率最大),第二个综合指标y2的方差次大,依此类推,一般前面几个综合指标y1,y2,y3,…yr(r
2.计算步骤
主成分分析可分为以下几个主要步骤:
(1)列出指标数值矩阵X
(2)计算X的协方差矩阵S。为了消除指标间不同量纲的影响,一般需先对原始数据进行标准化处理,而变换后的标准化值的协方差矩阵恰好是原始指标数值X的相关矩阵。因此,计算协方差矩阵可简化为计算相关矩阵R。
(3)计算协方差矩阵S(或相关矩阵R)的特征值λ和特征向量L(即指标x的系数)。
(4)计算贡献率和累计贡献率,据以确定主成分(即综合指标)的个数,并建立主成分议程。
每个主成分yk的贡献率等于它的特征值λk除以原始指标个数p,累计贡献率等于各主成分贡献率顺序相加,根据一定的选择标准,如果前r个主成分的累计贡献率大于或等于80%,(r
y1=l11x1+l12x2+…l1pxp
y2=l21x1+l22x2+…l2pxp
yp=lr1x1+lr2x2+…lrpxp
(5)解释各主成分的意义,并将各单位的原始数据代入方程中计算综合评价值进行分析比较。在多指标综合评价中,一般只需取第一个主成分y1作为全面反映各指标状况的综合指标,因为它综合原始指标信息的能力最强。然后,根据这个综合指标值进行各参评单位的比较评价。