主成分分析的主要用途
根據(jù)主成分分析的定義及性質(zhì)可以發(fā)現(xiàn),主成分分析主要有以下幾個(gè)方面的用途:
第一,主成分分析能降低所研究的數(shù)據(jù)空間的維數(shù)。 即用研究m維的y空間代替p維的x空間(m<p),而低維的y空間代替高維的x空間所損失的信息較少。即使只有一個(gè)主成分y1 (m=1)時(shí),這個(gè)y1仍是使用全部x變量(p個(gè))得到的。例如要計(jì)算y1的均值也得使用全部x的均值。在所選的前m個(gè)主成分中,如果某個(gè)xi的系數(shù)都近似于零的話,就可以把這個(gè)xi刪除,這也是一種刪除多余變量的方法。
第二,有時(shí)可通過(guò)因子負(fù)荷aij的結(jié)構(gòu),弄清x變量間的某些關(guān)系。例如在評(píng)價(jià)某企業(yè)的經(jīng)濟(jì)效益時(shí),如果得稅指標(biāo)的負(fù)荷全為正值,產(chǎn)值指標(biāo)的負(fù)荷全為負(fù)值,這似乎可以說(shuō)明企業(yè)對(duì)國(guó)家的貢獻(xiàn)主要來(lái)自于利稅,利稅指標(biāo)是衡量企業(yè)貢獻(xiàn)大小的主要指標(biāo)。
第三,多維數(shù)據(jù)的一種圖形表示方法。 當(dāng)維數(shù)大于3時(shí)便不能畫(huà)出幾何圖殂,而多元統(tǒng)計(jì)研究的問(wèn)題大都多于3個(gè)變量,因此無(wú)法將問(wèn)題用圖形表示出來(lái)。 然而,經(jīng)過(guò)主成分分析后,選取前兩個(gè)主成分或其中某兩個(gè)主成分,根據(jù)主成分的得分,畫(huà)出N個(gè)樣品在二維平面上的分布情況,由圖形可直觀地看出各樣品在主分量中的地位,進(jìn)而還可對(duì)樣品進(jìn)行分類處理,圖形發(fā)現(xiàn)遠(yuǎn)離大多數(shù)樣本點(diǎn)的離群點(diǎn)。
第四,由主成分分析法構(gòu)造回歸模型。 即把各主成分作為新的自變量代替原來(lái)自變量x作回歸分析。
第五,用主成分分析篩選回歸變量。 回歸變量的選擇有著重大的實(shí)際意義,為了使模型能夠更好地進(jìn)行結(jié)構(gòu)分析、控制和預(yù)報(bào),應(yīng)從原始變量構(gòu)成的子集合中選擇最佳變量,構(gòu)成最佳變量子集合。 用主成分分析篩選回歸變量,計(jì)算量小,易于選擇最佳變量子集合。
多元統(tǒng)計(jì)分析中的主成分分析法,以其理論的簡(jiǎn)潔性、賦權(quán)的客觀性等特點(diǎn)被廣泛應(yīng)用于經(jīng)濟(jì)、社會(huì)、科教、環(huán)保等領(lǐng)域眾多對(duì)象的評(píng)價(jià)和排序。這一方法的基本特征是應(yīng)用數(shù)理統(tǒng)計(jì)和線性代數(shù)知識(shí),通過(guò)尋找樣本點(diǎn)散布最開(kāi)的幾個(gè)正交方向,對(duì)樣本陣中的信息進(jìn)行提煉和降維;再應(yīng)用決策分析和泛函分析知識(shí)探索主成分價(jià)值函數(shù)的形成機(jī)理和結(jié)構(gòu)形式。 由于上述優(yōu)點(diǎn),主成分分析法在社會(huì)經(jīng)濟(jì)、企業(yè)管理及地質(zhì)、生化等各領(lǐng)域都有其用武之地,如在綜合評(píng)價(jià)、過(guò)程控制與診斷、數(shù)理壓縮、信息處理、模式識(shí)別等方向都有廣泛的應(yīng)用,并取得了良好的運(yùn)用效果。
[1]殷克東.經(jīng)濟(jì)管理系統(tǒng)分析技術(shù)方法論[M].北京:經(jīng)濟(jì)科學(xué)出版社,2009:94.
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。