列聯(lián)表和列聯(lián)表分布
6.1.1 列聯(lián)表
所謂列聯(lián)表,就是兩個(gè)或兩個(gè)以上的變量進(jìn)行交叉分類的頻數(shù)分布表。
【例6‐1】 某大學(xué)對(duì)某項(xiàng)獎(jiǎng)學(xué)金政策做調(diào)整,學(xué)校為了了解各年級(jí)學(xué)生對(duì)該項(xiàng)政策的態(tài)度,進(jìn)行了抽樣調(diào)查,其結(jié)果可以整理成一張頻數(shù)分布表(見表6‐3)。
表6‐3 關(guān)于獎(jiǎng)學(xué)金政策調(diào)整調(diào)查結(jié)果
上述問題有兩個(gè)變量,行變量為態(tài)度變量,共有三個(gè)類別;列變量為年級(jí)變量,共有四個(gè)類別。表6‐3是一個(gè)3×4列聯(lián)表。表中的每個(gè)數(shù)據(jù),都反映著來自年級(jí)和態(tài)度兩個(gè)方面的信息,例如大二年級(jí)學(xué)生贊成該項(xiàng)政策的有23人。學(xué)校管理層需要分析學(xué)生態(tài)度與年級(jí)之間是否有關(guān)聯(lián)。
一般的,假設(shè)有兩個(gè)分類變量A和B;A為行變量,共有n類;B為列變量,共有m類;屬于AiBj的個(gè)體數(shù)目為nij(i=1,2,… ,n;j=1,2,… ,m)。則可以得到如表6‐4所示列聯(lián)表,稱為n×m列聯(lián)表。
表6‐4 變量A和變量B的頻數(shù)分布表
6.1.2 列聯(lián)表的分布
列聯(lián)表的分布包括兩種:觀測(cè)值的分布和期望值的分布。
6.1.2.1 觀測(cè)值的分布
事實(shí)上,表6‐3就是一個(gè)最簡(jiǎn)單的觀測(cè)值分布表。例如,這次調(diào)查贊成獎(jiǎng)學(xué)金改革的178人中,大一、大二、大三和大四的學(xué)生數(shù)分別為55人、23人、69人和31人。大三的100個(gè)學(xué)生中贊成的有69人、無所謂的21人、反對(duì)的10人。這次調(diào)查總共有290人,其中大一至大四分別有80人、35人、100人和75人,持贊成態(tài)度的有178人、無所謂的有85人,持反對(duì)態(tài)度的有27人。觀測(cè)值分布反映了數(shù)據(jù)的實(shí)際分布,但總體的基數(shù)不同時(shí),誰多誰少并不適合于直接用分布中的頻數(shù)對(duì)比。為了能在相同的基數(shù)上進(jìn)行比較,使列聯(lián)表中的數(shù)據(jù)提供更多的信息,往往需要計(jì)算相應(yīng)的百分比,即得到頻率分布,如表6‐5所示。
表6‐5 關(guān)于獎(jiǎng)學(xué)金政策調(diào)整包含百分比的列聯(lián)分布
表6‐5是在表6‐3的基礎(chǔ)上增加了關(guān)于行百分比、列百分比和總百分比的數(shù)據(jù)。例如,贊成態(tài)度下的行百分比表示在總共贊成改革的178人中,大一學(xué)生占30.9% ,大二學(xué)生占12.9% ,大三學(xué)生占38.8% ,大四學(xué)生占17.4% ;列百分比表示參與調(diào)查的各年級(jí)學(xué)生中贊成該方案的比例,大一學(xué)生贊成的比例為68.75% ,大二贊成的比例為65.7% ,大三贊成的比例為69% ,而大四學(xué)生的贊成比例為41.3% 。
從頻率分布表中,我們可以對(duì)所分析的對(duì)象有一些初步的認(rèn)識(shí),例如可以看出,在贊成該方案的學(xué)生中,大三學(xué)生的比例是最高的;參與調(diào)查的學(xué)生中,大一、大二、大三學(xué)生贊成的比例最高,而大四則是無所謂的比例最高。但是學(xué)生對(duì)該改革方案的態(tài)度與年級(jí)這兩個(gè)變量之間是存在一定聯(lián)系還是彼此獨(dú)立,僅從百分比上很難得出結(jié)論,需要進(jìn)一步分析。
6.1.2.2 期望值的分布
如果我們想進(jìn)一步了解年級(jí)與態(tài)度之間是否存在著相互關(guān)系,就需要進(jìn)行統(tǒng)計(jì)檢驗(yàn)。
在前例,全部290個(gè)樣本中,贊成的有178人,占到總數(shù)的61.4% 。如果我們假設(shè)各年級(jí)學(xué)生對(duì)該方案的看法是相同的,那么對(duì)大一學(xué)生來說,贊成該方案的人數(shù)應(yīng)當(dāng)為:80×61. 4% =49.1人,大二贊成該方案的人數(shù)為:35×61.4% =21.5人,大三贊成該方案的人數(shù)應(yīng)當(dāng)為:100×61.4% =61.4人,大四贊成該方案的人數(shù)應(yīng)當(dāng)為:75×61.4% =46.0人。由此可以計(jì)算出期望值的分布,見表6‐6。
表6‐6 期望值分布
我們還可以把觀測(cè)值與期望值的頻數(shù)分布列在同一張表中,得表6‐7。
表6‐7 觀測(cè)值與期望值頻數(shù)對(duì)比分布
如果年級(jí)變量與態(tài)度變量是沒有關(guān)聯(lián)的,也就是假設(shè):
H0:年級(jí)變量與態(tài)度變量相互獨(dú)立;
H1:年級(jí)變量與態(tài)度變量不獨(dú)立。
這時(shí)表6‐7中觀測(cè)值分布與期望值分布應(yīng)當(dāng)非常接近;反之,如果不同年級(jí)學(xué)生對(duì)該改革方案的態(tài)度是有差異的,那么表6‐7中觀測(cè)值和期望值就會(huì)相差比較大。
一般的,將表6‐4列聯(lián)表中的每一個(gè)元素都除以元素總和,pij=nij/N,于是得到頻率意義上的列聯(lián)表,其中pi.=ni./N,p.j=n.j/N,見表6‐8。
表6‐8 變量A和變量B的頻率分布
如果變量A與變量B之間相互獨(dú)立,則變量A第i類別與變量B第j類別同時(shí)出現(xiàn)的概率等于總體中變量A第i類別出現(xiàn)的概率與變量B第j類別出現(xiàn)的概率的乘積,Pij=pi. ×p.j,變量A第i類別與變量B第j類別出現(xiàn)的期望頻數(shù)為Nij=(ni.×n.j)/N。從而,表6‐4對(duì)應(yīng)的期望頻數(shù)分布見表6‐9。
表6‐9 變量A和變量B的期望值頻數(shù)分布
如果變量A與變量B是沒有關(guān)聯(lián)的,也就是假設(shè):
H0:變量A與變量B相互獨(dú)立;
H1:變量A與變量B不獨(dú)立。
對(duì)于這個(gè)假設(shè)的統(tǒng)計(jì)檢驗(yàn),可以進(jìn)行χ2檢驗(yàn)。
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。