共詞頻次矩陣的數(shù)據(jù)類型和數(shù)據(jù)總體分布的推斷分析
5.3 共詞頻次矩陣的數(shù)據(jù)類型和數(shù)據(jù)總體分布的推斷分析
由于數(shù)據(jù)類型和數(shù)據(jù)總體分布影響統(tǒng)計分析方法的選擇,針對不同類型的數(shù)據(jù)和不同的總體分布特征,采用的統(tǒng)計方法可能有所不同,因此,在選擇統(tǒng)計分析方法之前,首先要分析數(shù)據(jù)的類型和分布特征。
1.共詞頻次矩陣的數(shù)據(jù)類型
我們得到的共詞矩陣的數(shù)據(jù),其取值范圍是由10~80之間的正整數(shù)組成,每個值的大小表明共詞的頻率,但其差值沒有可比意義,因此,判斷該數(shù)據(jù)為離散型有序數(shù)據(jù)。
2.共詞頻次矩陣的數(shù)據(jù)分布推斷
由于正態(tài)分布是在統(tǒng)計分析中運(yùn)用最廣泛的假設(shè)分布,因此首先運(yùn)用Lillifors統(tǒng)計量檢驗法,判定相關(guān)矩陣的數(shù)據(jù)總體是否符合正態(tài)分布。SPSS提供了Lillifors法,它可以在方差和均值未知的情況下直接使用,它是對Kolmogorov-Smirnov和Shapiro-Wilk統(tǒng)計量的修正,Kolmogorov-Smirnov和Shapiro-Wilk檢測時建立在觀測量與預(yù)期積累分布之間存在巨大差異的基礎(chǔ)上,一般情況下,當(dāng)其顯著水平值S<0.05時,便可以拒絕數(shù)據(jù)正態(tài)分布的原假設(shè)。
在SPSS13.0軟件中,得到表5-3所示的正態(tài)分布測試結(jié)果。
表中顯示Kolmogorov-Smirnov和Shapiro-Wilk統(tǒng)計量中的顯著水平值S=0.000<0.05,所以拒絕數(shù)據(jù)的正態(tài)分布的假設(shè),相關(guān)矩陣數(shù)據(jù)分布不符合正態(tài)分布規(guī)律。
其次,運(yùn)用非參數(shù)檢驗推斷共詞頻次矩陣數(shù)據(jù)的總體分布。啟用非參數(shù)檢驗(nonparametric tests)的卡方檢驗(Chi-square test)功能??ǚ綌M合優(yōu)度檢驗的方法是:我們研究的總體分布F未知,希望由樣本來檢驗這個總體分布F是否等于給定的分布F0,即H0∶F(x)=F0(x),H1∶F(x)≠F0(x)H0,其中F0(x)為已知的分布函數(shù)(在離散場合用概率分布)。常見的已知分布F0(x)在離散時為均勻分布,在連續(xù)場合為正態(tài)分布,指數(shù)分布等。我們對共頻次矩陣進(jìn)行均勻分布測試。在SPSS13.0軟件中,得到表5-4所示的均勻分布測試結(jié)果。
表5-3 正態(tài)分布測試結(jié)果(Tests of Normality)
續(xù)表
a Lilliefors Significance Correction.
表5-4 均勻分布測試結(jié)果(Test Statistics)
續(xù)表
表中顯著水平值A(chǔ)symp.S=0.000<0.05,所以拒絕數(shù)據(jù)的均勻分布的假設(shè),相關(guān)矩陣數(shù)據(jù)分布不符合均勻分布規(guī)律。
基于正態(tài)分布和均勻分布測試結(jié)果,我們將在下文采取與其相適應(yīng)的分析方法和步驟。
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請告知,我們將盡快刪除相關(guān)內(nèi)容。