數(shù)據(jù)的初步整理方法
數(shù)據(jù)的錄入是指以數(shù)據(jù)庫的形式錄入和保存,以利于將來進(jìn)行統(tǒng)計(jì)分析,數(shù)據(jù)的錄入可以用電子表格(如Excl),數(shù)據(jù)庫(如Foxpro系列)等,但不宜以文檔的形式錄入和保存(如Word文檔),這種文檔格式不利于進(jìn)行運(yùn)算和統(tǒng)計(jì)處理。
當(dāng)然,數(shù)據(jù)的錄入要求準(zhǔn)確,這對下一步的統(tǒng)計(jì)分析和處理是非常重要的。
1.樣本平均數(shù)。
平均數(shù)的計(jì)算是定量分析的最基本的計(jì)算方法和處理方法之一,也是我們進(jìn)一步對數(shù)據(jù)進(jìn)行分析的前提。所以,我們有必要將平均數(shù)的計(jì)算方法和它所反映的意義弄清楚。
平均數(shù)在教育科研中,它反映了一組數(shù)據(jù)的平均發(fā)展水平或集中趨勢。如測驗(yàn)所得成績的平均分,它反映了被試學(xué)生的這次測驗(yàn)成績的平均水平。
平均數(shù)和它的計(jì)算方法有多種,如算術(shù)平均數(shù)、加權(quán)平均數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)等。下面我們只介紹算術(shù)平均數(shù)和加權(quán)平均數(shù)的計(jì)算方法及其應(yīng)用舉例。對其他的平均數(shù)的計(jì)算方法和應(yīng)用,可以參考相關(guān)書籍。
求平均數(shù)的最基本的計(jì)算公式是:
在計(jì)算平均數(shù)時(shí),有時(shí)會遇到這樣的情況:在一給數(shù)據(jù)中某個數(shù)值出現(xiàn)好幾次。這時(shí)如果要求這一組數(shù)據(jù)的平均數(shù)時(shí),可以用下面的公式進(jìn)行計(jì)算就比較簡便些:
其中“”為數(shù)據(jù)中每個數(shù)據(jù)所出現(xiàn)的次數(shù), n為樣本容量,并且有“
” 。這種平均數(shù)的計(jì)算方法我們把它叫作加權(quán)平均數(shù)。
在教育研究中,平均數(shù)說明什么問題呢?它說明了參與計(jì)算的數(shù)據(jù)的一種集中趨勢,有時(shí)我們的研究對象的容量比較大時(shí),就可以用它的一個樣本平均數(shù)去估計(jì)總體的平均數(shù)。
2.樣本方差及標(biāo)準(zhǔn)差。
標(biāo)準(zhǔn)差在教育研究中應(yīng)用是非常廣泛的,這是因?yàn)椋?/p>
一是標(biāo)準(zhǔn)差它反映了全部數(shù)據(jù)的差異情況。
二是標(biāo)準(zhǔn)差受到抽樣變動的影響比較小。
當(dāng)然,標(biāo)準(zhǔn)差也有它的缺點(diǎn):即計(jì)算比較復(fù)雜,結(jié)果易受兩端數(shù)據(jù)的影響。標(biāo)準(zhǔn)差與平均數(shù)在實(shí)際問題中常常結(jié)合在一加以應(yīng)用。一般來說,只有平均數(shù)相同或接近相等,至少是沒有顯著性差異時(shí),比較兩組單位相同的數(shù)據(jù)的標(biāo)準(zhǔn)差才有意義,即要求在同一水平上比較它們的離散程度才是科學(xué)的;另外,只有兩組數(shù)據(jù)在同一次測量條件下測量得到的、同一問題的數(shù)據(jù)才能用標(biāo)準(zhǔn)差進(jìn)行比較它們的離散程度,這就是標(biāo)準(zhǔn)差的使用條件。
比如,在學(xué)校教育教學(xué)中,同一次測驗(yàn)的同一學(xué)科成績(比如兩個班在同一次數(shù)學(xué)測驗(yàn)中的成績比較),在平均分相對接近或相等時(shí)就可以比較它們的標(biāo)準(zhǔn)差了。
3.差異系數(shù)。
標(biāo)準(zhǔn)差是帶有與原數(shù)據(jù)相同的單位的差異量,這種差異量稱之為絕對差異量。絕對差異量對單位不同的或者單位相同而平均數(shù)不同的,且相關(guān)較大的兩組數(shù)據(jù)則無法比較它們的大小(即離散程度大小),為了解決這一實(shí)際問題中存在的問題,我們采用一種叫相對差異量的方法來比較,這種相對差異量叫差異系數(shù)(有時(shí)也叫變異系數(shù))。
差異系數(shù)的計(jì)算公式是:
其中為標(biāo)準(zhǔn)差,
為平均數(shù)。差異系數(shù)的特點(diǎn)是:一是它反映了數(shù)據(jù)分布中相對于自身平均數(shù)的離散程度,因此是相對差異量;二是它是一個不帶單位的數(shù)據(jù),即無單位數(shù)。
由于差異系數(shù)具有上面的特征,所以在比較兩組單位不同的數(shù)據(jù)的離散程度時(shí),選用差異系數(shù)作為一個比較指標(biāo)就比較合適。如在教育教學(xué)研究中,可用來比較不同學(xué)科或不同年批次的學(xué)生學(xué)習(xí)成績的離散程度。
在實(shí)際應(yīng)用中,有時(shí)也可以采用差異系數(shù)作為考查教師的教學(xué)是否面向全體學(xué)生的一介指標(biāo)。
4.圖表繪制(圖)。
有時(shí)一些數(shù)據(jù)用圖表來表示時(shí)會比單純用數(shù)據(jù)更能說明問題,并且,圖表能讓人更加直觀地理解數(shù)據(jù)所要說明的問題。
例93:“柳州市中等職業(yè)技術(shù)學(xué)校專業(yè)建設(shè)調(diào)查研究”中的一個圖表。
5.例題舉要。
(1)平均數(shù)的實(shí)際應(yīng)用。
例94:在一項(xiàng)課題的研究中,有5所學(xué)校參與了實(shí)驗(yàn),在對課題研究所進(jìn)行的某一項(xiàng)測量中,這5所學(xué)校分別是:A校100名學(xué)生,平均分為90分;B校150名學(xué)生,平均分為85分;C校90名學(xué)生,平均分為80分;D校120名學(xué)生,平均分為78分;E校80名學(xué)生,平均分為70分。求這5所學(xué)校在這項(xiàng)目測驗(yàn)中的總體的平均成績。
解:根據(jù)題意得
所以,這項(xiàng)課題研究中,這5所實(shí)驗(yàn)學(xué)校的這次測驗(yàn)共有540名學(xué)生參加,他們的平均成績?yōu)?1.3148分。
在教育研究中,平均數(shù)說明什么問題呢?它說明了參與計(jì)算的數(shù)據(jù)的一種集中趨勢,有時(shí)我們研究的對象容量比較大時(shí),就可以用它的一個樣本去估計(jì)總體的平均數(shù)。如,在上面參與實(shí)驗(yàn)的5所學(xué)校中,如果是同年級學(xué)生都是研究對象,而上面的計(jì)算只是它的一個樣本的話,那么我們就可以估計(jì)出研究對象總體的平均數(shù)大約是81.3148分。
(2)標(biāo)準(zhǔn)差的應(yīng)用。
例95:在某小學(xué)進(jìn)行某一教學(xué)研究中,對學(xué)生的學(xué)業(yè)水平的前后兩次測試結(jié)果分別是:實(shí)驗(yàn)前的測試實(shí)驗(yàn)班與對比班的數(shù)學(xué)成績平均分分別為67.35分和67.50分,計(jì)算得標(biāo)準(zhǔn)差分別是2.69和2.91;實(shí)驗(yàn)后的測試結(jié)果實(shí)驗(yàn)班與對比班的平均分分別是89.93分和87.58分,標(biāo)準(zhǔn)差分別是18.44和3.27。問:如何分析比較實(shí)驗(yàn)前后的數(shù)據(jù)的變化?
結(jié)論:從實(shí)驗(yàn)前測試的數(shù)據(jù)來看,實(shí)驗(yàn)前的平均分和標(biāo)準(zhǔn)差是比較接近的,這說明實(shí)驗(yàn)前兩個班的學(xué)科學(xué)習(xí)水平基本一致,都在同一個發(fā)展水平上,這為實(shí)驗(yàn)后的測試所取得的數(shù)據(jù)的可比性提供了基礎(chǔ)。實(shí)驗(yàn)后的測試的平均分稍有變化,這說明該實(shí)驗(yàn)對提高實(shí)驗(yàn)班的學(xué)科總體水平有一定的作用,但是由于標(biāo)準(zhǔn)差變化較大,實(shí)驗(yàn)班與對比班的標(biāo)準(zhǔn)差的差為15.17分,這說明實(shí)驗(yàn)對學(xué)生的分化所起的作用比較大,作為基礎(chǔ)教育不利于全面地提高學(xué)生的學(xué)習(xí)水平,只對少數(shù)尖子學(xué)生有利。對這一結(jié)果我們可以用如圖1來表示。
圖1. 實(shí)線為實(shí)驗(yàn)班的成績
例96:在上一例題研究中,如果實(shí)驗(yàn)前的測試結(jié)果不變,但是實(shí)驗(yàn)后測試對比班和實(shí)驗(yàn)班的平均分分別為68.47和83.06,標(biāo)準(zhǔn)差分別是2.78和2.02。問:怎樣評價(jià)這一實(shí)驗(yàn)結(jié)果?
結(jié)論:從實(shí)驗(yàn)班與對比班實(shí)驗(yàn)后的測試的標(biāo)準(zhǔn)差可以看出,這兩個班在實(shí)驗(yàn)后學(xué)生的學(xué)習(xí)離散程度基本上是相同的,即兩極分化程度基本一致,但是,從平均分可以看出,經(jīng)過這一教學(xué)實(shí)驗(yàn)研究的實(shí)施,實(shí)驗(yàn)班學(xué)生在該科總體的平均學(xué)習(xí)水平得到了很大提高,由原來的67.35提高到了83.06分,但對比班的學(xué)生學(xué)習(xí)平均水平并沒有得到太大的提高。這說明這一實(shí)驗(yàn)
對提高學(xué)生的總體學(xué)習(xí)平均水平是有利的。這結(jié)果也可以用如圖2表示。
圖2 實(shí)線為實(shí)驗(yàn)班的成績
(3)差異系數(shù)的應(yīng)用。
例97:在一次參加全市統(tǒng)一考試中,某中學(xué)各科成績統(tǒng)計(jì)結(jié)果如下:
科 別 語文 數(shù)學(xué) 英語 物理 化學(xué)
平均分 85.8 97.54 80.80 86.73 75.8
標(biāo)準(zhǔn)差 8.72 13.95 5.44 12.65 13.10
問:這五科學(xué)生的發(fā)展情況如何?哪一科學(xué)生出現(xiàn)兩極分化比較嚴(yán)重些?或者說哪科的教師在教學(xué)過程中“面向全體學(xué)生”做得比較好?
結(jié)論:由于是比較不同學(xué)科的學(xué)習(xí)成績,雖然單位相同,但學(xué)科不同,不同學(xué)科成績的分布是相對獨(dú)立的,如果直接用所得的標(biāo)準(zhǔn)差來比較學(xué)生兩極分化的程度,那么結(jié)果最嚴(yán)重的是數(shù)學(xué),其次是化學(xué),然后是物理、語文,最好的是英語。但是,由于考試難度不同,平均水平也不相同,這樣比較是不太科學(xué)的。為了解決這一問題,所以在這里采用差異系數(shù)作為這一問題的比較指標(biāo)就更為合適些。
我們先計(jì)算得各科差異系數(shù):
我們先計(jì)算得各科差異系數(shù):
從上所計(jì)算得到的差異系數(shù)看,英語的差異系數(shù)最小,然后是語文,數(shù)學(xué),物理,最后是化學(xué),也就是說英語發(fā)展最整齊,其次是語文、數(shù)學(xué)、物理,化學(xué)分化比較嚴(yán)重。
例98:某校在進(jìn)行一項(xiàng)教學(xué)法的實(shí)驗(yàn)研究過程中,對實(shí)驗(yàn)前測和實(shí)驗(yàn)后測所得的數(shù)據(jù)如下:實(shí)驗(yàn)前測所得的平均分為75.68分,標(biāo)準(zhǔn)差為16.77分,實(shí)驗(yàn)后測得到的平均分為85.32分,標(biāo)準(zhǔn)差是18.13分,問:怎樣評價(jià)實(shí)驗(yàn)前后的測試學(xué)生成績分化的變化?
結(jié)論:在這一個例子中,雖然所得成績是同一學(xué)科成績,但它是兩次互相獨(dú)立的不同測試,平均水平也不相同,所以也不能直接用標(biāo)準(zhǔn)差來比較前后兩次測試所反映的學(xué)生分化程度。我們?nèi)匀徊捎米儺愊禂?shù)來比較:
從變異系數(shù)的變化看,實(shí)驗(yàn)后學(xué)生的成績分化程度小于實(shí)驗(yàn)前的分化程度。從表面上看,學(xué)生的標(biāo)準(zhǔn)差實(shí)驗(yàn)前小于實(shí)驗(yàn)后,為什么實(shí)驗(yàn)后的分化程度反而小于實(shí)驗(yàn)前?這是因?yàn)榻?jīng)過實(shí)驗(yàn)后,雖然標(biāo)準(zhǔn)差增大了,但它是在總體平均水平提高的前提下增大的??梢?,平均水平不同是不能直接用標(biāo)準(zhǔn)差來比較學(xué)生的分化程度的,這和前面在討論平均分及標(biāo)準(zhǔn)差時(shí)的所得的結(jié)論是一樣的。
在實(shí)際應(yīng)用中,有時(shí)也可以采用差異系數(shù)作為考查教師的教學(xué)是否面向全體學(xué)生的一個指標(biāo)。
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請告知,我們將盡快刪除相關(guān)內(nèi)容。