精品欧美无遮挡一区二区三区在线观看,中文字幕一区二区日韩欧美,久久久久国色αv免费观看,亚洲熟女乱综合一区二区三区

        ? 首頁(yè) ? 理論教育 ?主成分因素分析法

        主成分因素分析法

        時(shí)間:2023-03-28 理論教育 版權(quán)反饋
        【摘要】:它是因素分析中最常使用的方法。主成分?jǐn)?shù)據(jù)分析中,以較少成分解釋原始變量變異量較大的部分。在因素分析中,有兩個(gè)重要指針: 一為“共同性”,二為“特征值”。將每個(gè)共同因素的特征值除以總題數(shù),為此共同因素可以解釋的變異量,主成分因素分析的目的之一,即在因素結(jié)構(gòu)的簡(jiǎn)單化,希望以最少的共同因素,能對(duì)總變異量作最大的解釋,因而抽取出的因素愈少愈好,但抽取因素的累積解釋的變異量愈大愈好。
        主成分因素分析法_勞動(dòng)力市場(chǎng)分割與農(nóng)民工就業(yè)實(shí)證研究

        主成分分析(Principal Component Analysis,PCA)是把原來(lái)多個(gè)變量化為少數(shù)幾個(gè)綜合指標(biāo)的一種統(tǒng)計(jì)分析方法,從數(shù)學(xué)角度來(lái)看,這是一種降維處理技術(shù)。假定有n個(gè)樣本,每個(gè)樣本共有p個(gè)變量描述,這樣就構(gòu)成了一個(gè)n×p階的數(shù)據(jù)矩陣:

        如何從這么多變量的數(shù)據(jù)中抓住事物的內(nèi)在規(guī)律性呢? 要解決這一問(wèn)題,如果要在p維空間中加以考察,這是很困難的,因此需要進(jìn)行降維處理,即用較少的幾個(gè)綜合指標(biāo)來(lái)代替原來(lái)較多的變量指標(biāo),而且使這些較少的綜合指標(biāo)既能盡量多地反映原來(lái)較多指標(biāo)所反映的信息,同時(shí)它們之間又是彼此獨(dú)立的。那么,這些綜合指標(biāo)(即新變量)應(yīng)如何選取呢? 顯然,其最簡(jiǎn)單的形式就是取原來(lái)變量指標(biāo)的線性組合,適當(dāng)調(diào)整組合系數(shù),使新的變量指標(biāo)之間相互獨(dú)立且代表性最好。

        如果記原來(lái)的變量指標(biāo)為x1,x2,…,xp,它們的綜合指標(biāo)——新變量指標(biāo)為z1,z2,…,zm(m≤p),則:

        在上式中,系數(shù)lij由下列原則來(lái)決定:

        (1)zi與zj(i≠j; i,j=1,2,…,m)相互無(wú)關(guān);

        (2)z1是x1,x2,…,xp的一切線性組合中方差最大者; z2是與z1不相關(guān)的x1,x2,…,xp的所有線性組合中方差最大者; 依此類推,zm是與z1,z2,…,zm-1都不相關(guān)的x1,x2,…,xp的所有線性組合中方差最大者。

        這樣決定的新變量指標(biāo)z1,z2,…,zm分別稱為原變量指標(biāo)x1,x2,…,xp的第一,第二,…,第m主成分。其中,z1在總方差中占的比例最大,z2,z3,…,zm的方差依次遞減。在實(shí)際問(wèn)題的分析中,常挑選前幾個(gè)最大的主成分,這樣既減少了變量的數(shù)目,又抓住了主要矛盾,簡(jiǎn)化了變量之間的關(guān)系。

        從以上分析可以看出,找主成分就是確定原來(lái)變量xj(j=1, 2,…,p)在諸主成分zi(i=1,2,…,m)上的載荷lij(i=1,2,…,m; j=1,2,…,p)。從數(shù)學(xué)上容易知道,它們分別是x1,x2,…,xp的相關(guān)矩陣的m個(gè)較大的特征值所對(duì)應(yīng)的特征向量。

        主成分因素分析法,目的是在多變量系統(tǒng)中,把多個(gè)很難解釋而彼此有關(guān)的變量,轉(zhuǎn)化成少數(shù)有概念化意義而彼此獨(dú)立性大的因素,從而分析多個(gè)因素的關(guān)系。它是因素分析中最常使用的方法。

        主成分?jǐn)?shù)據(jù)分析中,以較少成分解釋原始變量變異量較大的部分。成分變異量通常用“特征值”表示。因素分析是一種潛在結(jié)構(gòu)分析法,其模式理論中,假定每個(gè)指針(外在變量或稱題項(xiàng))均由兩部分所構(gòu)成,一為“共同因素”,一為“唯一因素”。共同因素的數(shù)目會(huì)比指針數(shù)(原始變量數(shù))還少,而每個(gè)指針或原始變量皆有一個(gè)唯一因素,亦即一份量表共有n個(gè)題項(xiàng)數(shù),則會(huì)有n個(gè)唯一因素。至于所有共同因素間彼此的關(guān)系,可能有相關(guān)或可能皆沒(méi)有相關(guān)。在直交轉(zhuǎn)軸狀態(tài)下,所有的共同因素間彼此沒(méi)有相關(guān); 在斜交轉(zhuǎn)軸情況下,所有的共同因素間彼此就有相關(guān)。

        因素分析的理想情況,在于個(gè)別因素負(fù)荷量(所謂的因素負(fù)荷量,是因素結(jié)構(gòu)中原始變量與因素分析時(shí)抽取出共同因素的相關(guān))不是很大就是很小,這樣每個(gè)變量才能與較少的共同因素產(chǎn)生密切關(guān)聯(lián),如果想要以最少的共同因素?cái)?shù)來(lái)解釋變量間的關(guān)系程度,則唯一因素彼此間或與共同因素間就不能有關(guān)聯(lián)存在。

        在因素分析中,有兩個(gè)重要指針: 一為“共同性”,二為“特征值”。所謂共同性,就是每個(gè)變量在每個(gè)共同因素的負(fù)荷量的平方總和(一橫列中所有因素負(fù)荷量的平方和),也就是個(gè)別變量可以被共同因素解釋的變異量百分比,這個(gè)值是個(gè)別變量與共同因素間多元相關(guān)的平方。從共同性的大小可以判斷這個(gè)原始變量與共同因素之間的關(guān)系程度。而各變量的唯一因素大小就是1減掉該變量共同性的值(在主成分分析中,有多少個(gè)原始變量便有多少個(gè)成分,所以共同性會(huì)等于1,沒(méi)有唯一因素)。所謂特征值,是每個(gè)變量在某一共同因素的因素負(fù)荷量的平方總和(一直行所有因素負(fù)荷量的平方和)。

        在因素分析的共同因素抽取中,特征值最大的共同因素會(huì)最先被抽取,其次是次大者,最后抽取出的共同因素的特征值最小,通常會(huì)接近0(在主成分分析中,有幾個(gè)題項(xiàng),便有幾個(gè)成分,因而特征值的總和剛好等于變量的總數(shù))。將每個(gè)共同因素的特征值除以總題數(shù),為此共同因素可以解釋的變異量,主成分因素分析的目的之一,即在因素結(jié)構(gòu)的簡(jiǎn)單化,希望以最少的共同因素,能對(duì)總變異量作最大的解釋,因而抽取出的因素愈少愈好,但抽取因素的累積解釋的變異量愈大愈好。

        免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。

        我要反饋