Logo

主成分分析

主成分分析(principalcomponentanalysis)多元统计分析的一种。研究如何通过变量的少数几个线性组合来解释这些变量的相关结构。1933年霍特林建立。若p个标准化相关变量Z1,Z2,,Z。的线性组合Y,=bIZ+…+bipZp,…,Yp=bolZ+…十bppZp,且Yi,Y2,·,Y。满足以下两个条件:(1)Y:的系数向量为单位长,即b娟++b房p=1,i=1,…,p:(2)Y,Y2,…,Yp的方差达到最大且互不相关,则Y,,Y2,,Y。被称为相关变量Z1,Z2,…,Z。的主成分。第一主成分Y1是一切系数为单位长的线性组合中方差最大者,第二主成分Y?是一切系数为单位长且与Y,不相关的线性组合中方差最大者,依次类推,第k主成分Y是一切系数为单位长且与前k一1个主成分不相关的线性组合中方差最大者。设入!≥A2≥…≥入p≥0是Z1,Z2,…,Z。的相关矩阵R的特征根,e1,e,,ep为相应的标准正交化特征向量。可以证明,第一主成分Y,的系数向量是,方差为入1,第二主成分Y2的系数向量是2,方差为2。一般地,第k主成分Yk的系数向量是ek,方差为Ak,即Y=!Z:+eZ2+…+eZp,k=1,2,…,p,式中ek=(e1,e2,…,ep)'。且对于方差有如下结果一ar(,)-ar(2)=p,从而第k主成分的方差占变量总方差的比例为入/p。 若前m个主成分的方差之和占总方差的比例很大(如超过0.8),则可用它们近似解释原来变量的变化情况,即主成分分析的思想。主成分分析可作为其他多元统计的中间环节。当变量较多且彼此相关时,用少数重要的主成分代替原来的变量,可用于回归分析、聚类分析等。

问念心理:专业级心理学知识库和文献资料库,免费心理学知识与资料分享,专业心理学论文查询。