類型及作用
第一節(jié) 抽樣的概念、類型及作用
一、抽樣的基本概念
1.總體(population)
總體通常與構(gòu)成它的元素共同定義:總體是構(gòu)成它的所有元素的集合,而元素則是構(gòu)成總體的最基本單位,總體一般用大寫字母N表示。在社會研究中,最常見的總體是由社會中的某些個人組成的,這些個人便是構(gòu)成總體的元素。比如,當(dāng)我們開展對某省大學(xué)生的擇業(yè)傾向進行研究和探討時,該省所有在校大學(xué)生的集合就是我們研究的總體,而每一個在校大學(xué)生便是構(gòu)成總體的元素。又比如,我們打算研究某城市居民的家庭生活質(zhì)量。那么,該市所有的居民家庭就構(gòu)成我們研究的總體,而其中的每一戶家庭都是這個總體中的一個元素。
2.樣本(sample)
樣本就是從總體中按一定的方式抽取出的一部分元素的集合。樣本數(shù)目一般用小寫字母n表示?;蛘哒f,樣本就是總體的一個子集。比如,從某省總數(shù)為11.8萬人的大學(xué)生總體中,按一定方式抽取1000名大學(xué)生進行調(diào)查,這1000名大學(xué)生就構(gòu)成該總體的一個樣本(當(dāng)然,從一個總體中可以抽取若干個不同的樣本)。在社會研究中,資料的收集工作往往是在樣本中完成的。
3.抽樣(sampling)
明白了總體和樣本的概念,再來理解抽樣的概念就十分容易了。抽樣就是從組成某個總體的所有元素的集合中,按一定的方式選擇或抽取一部分元素(即抽取總體的一個子集)的過程,或者說,抽樣是從總體中按一定方式選擇或抽取樣本的過程。比如,從3000名工人所構(gòu)成的總體中,按一定的方式抽取200名工人的過程;或者從1000戶家庭構(gòu)成的總體中,按一定方式抽取一個由100戶家庭構(gòu)成的樣本的過程,這都叫做抽樣。
4.抽樣單位(sampling unit)
抽樣單位就是一次直接的抽樣所使用的基本單位。抽樣單位與構(gòu)成總體的元素有時是相同的,有時又是不同的。比如,上面所舉的例子中,單個的大學(xué)生既是構(gòu)成某省11.8萬名大學(xué)生這一總體的元素,又是我們從總體中一次直接抽取1000名大學(xué)生的樣本時所用的抽樣單位;但是,當(dāng)我們從這一總體中一次直接抽取40個班級,而以這40個班級中的全部學(xué)生(假定正好1000名)作為我們的樣本時,抽樣單位就是班級了,所以抽樣單位(班級)與構(gòu)成總體的元素(學(xué)生)就不是一樣的了。
5.抽樣框(sample frame)
抽樣框又稱作抽樣范圍,它指的是一次直接抽樣時總體中所有抽樣單位的名單。比如,從一所中學(xué)的全體學(xué)生中直接抽取200名學(xué)生作為樣本,那么,這所中學(xué)全體學(xué)生的名單就是這次抽樣的抽樣框;如果是從這所中學(xué)的所有班級中抽取部分班級的學(xué)生作為調(diào)查的樣本,那么,此時的抽樣框就不再是全校學(xué)生的名單,而是全校所有班級的名單了。因為此時的抽樣單位已不再是單個學(xué)生,而是學(xué)校的單個班級了。
6.參數(shù)值(parameter)
參數(shù)值也稱為總體值,它是關(guān)于總體中某一變量的綜合描述,或者說是總體中所有元素的某種特征的綜合數(shù)量表現(xiàn)。在統(tǒng)計中最常見的總體值就是某一變量的平均值。比如,某市待業(yè)青年的平均年齡和某廠工人的平均收入,等等,它們分別是關(guān)于某市待業(yè)青年這一總體在年齡這一變量上的綜合描述,以及某廠工人這一總體在收入這一變量上的綜合描述。需要說明的是,總體值只有通過對總體中的每一個元素都進行調(diào)查或測量才能得到。
7.統(tǒng)計值(statistic)
統(tǒng)計值也稱為樣本值,它是關(guān)于樣本中某一變量的綜合描述,或者說是樣本中所有元素的某種特征的綜合數(shù)量表現(xiàn)。樣本值是從樣本的所有元素中計算出來的,它是相應(yīng)的總體值的估計值。比如,樣本的平均值就是通過對樣本中的每一個元素進行調(diào)查或測量后計算出來的,它是相應(yīng)的總體平均值的估計量。抽樣的目的之一,就是要通過這些樣本值去估計和推斷各種總體值。由于從一個相同的總體中可以根據(jù)不同的抽樣設(shè)計得到若干個不同的樣本,所以,從每一個樣本中所得到的估計量都只是總體的許多個可能的估計量中的一個。抽樣設(shè)計的目標(biāo),就是盡可能使所抽取的樣本的估計量接近總體的參數(shù)值。
注意參數(shù)值和統(tǒng)計值的重要區(qū)別。參數(shù)值是確定不變的、唯一的,并且通常是未知的;統(tǒng)計值則是變化的,即對于同一個總體來說,不同樣本所得的統(tǒng)計值是有差別的。同時,對于任意一個特定的樣本來說,統(tǒng)計值是已知的或者說是可以通過計算得到的。
8.置信度(Confidence Level)
置信度又稱為置信水平,它指的是總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)間內(nèi)的概率,或者說,是總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)間中的把握性程度。它反映的是抽樣的可靠性程度。比如,置信度為90%,指的是總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)間的概率為90%,或者說,我們有90%的把握認(rèn)為樣本統(tǒng)計值將落在總體參數(shù)值周圍的某一區(qū)間內(nèi)。
9.置信區(qū)間(Confidence Interval)
上面介紹置信度時所說的“某一區(qū)間”,就是指置信區(qū)間。它是指在一定的置信度下,樣本統(tǒng)計值與總體參數(shù)值之間的誤差范圍。置信區(qū)間反映的是抽樣的精確性程度。置信區(qū)間越大,即誤差范圍越大,抽樣的精確性程度就越低;反之,置信區(qū)間越小,即誤差范圍越小,抽樣的精確性程度就越高。
二、抽樣類型
根據(jù)抽取對象的具體方式,我們把抽樣分為各種不同的類型。從大的方面看,各種抽樣都可以歸為概率抽樣與非概率抽樣兩大類。這是兩種有著本質(zhì)區(qū)別的抽樣類型。概率抽樣是依據(jù)概率論的基本原理,按照隨機原則進行的抽樣,因而它能夠避免抽樣過程中的人為誤差,保證樣本的代表性;而非概率抽樣則主要是依據(jù)研究者的主觀意愿、判斷或是否方便等因素來抽取對象,它不考慮抽樣中的等概率原則,因而往往產(chǎn)生較大的誤差,難以保證樣本的代表性。本章的大部分內(nèi)容將主要涉及概率抽樣的方法,因為它是目前用得最多,也是最有用處的抽樣類型。而對于非概率抽樣方法的介紹只占很小的篇幅。
在概率抽樣與非概率抽樣這兩大類中,還可細(xì)分出若干不同的形式,具體情況見圖5-1。
三、抽樣的作用
從抽樣的定義中不難看出,抽樣主要涉及和處理有關(guān)總體與部分之間的關(guān)系問題。抽樣作為人們從部分認(rèn)識整體這一過程的關(guān)鍵環(huán)節(jié),其基本作用是向人們提供一種實現(xiàn)“由部分認(rèn)識總體”這一目標(biāo)的途徑和手段。實際上,抽樣早就在人們的日常認(rèn)識活動中發(fā)揮著這種作用。抽樣的基本思想或基本邏輯早就被人們自覺或不自覺地運用著。比如,顧客在買米時,往往先從一大袋米中隨手抓一把看看,便知道這批米的質(zhì)量好不好;醫(yī)生只要從病人身上抽取很少的一點血液,便可以了解病人全身血液的各種狀況。當(dāng)然,抽樣方法更廣泛地應(yīng)用在各種形式的社會科學(xué)研究、自然科學(xué)研究,以及生產(chǎn)、銷售等經(jīng)濟活動中。例如,對社會熱點問題進行民意測驗、對不同水稻品種的產(chǎn)量進行估計、對各種商品的質(zhì)量進行檢驗或評比,都少不了抽樣方法的運用和幫助。
圖5-1 基本抽樣方法分類圖
在社會研究中,抽樣主要解決的是對象的選取問題,即如何從總體中選出一部分對象作為總體的代表的問題。一項社會研究若能對總體中的全部個體都進行了解,則當(dāng)然是很好的。實際上廣大研究人員常常會在時間、經(jīng)費、人力等方面遇到難題,甚至陷入困境,從而不得不在龐大的總體與有限的時間、經(jīng)費、人力之間尋求平衡。以現(xiàn)代統(tǒng)計學(xué)的概率論為基礎(chǔ)的現(xiàn)代抽樣理論,以及不斷發(fā)展不斷完善的各種抽樣方法,正好適應(yīng)了社會研究的發(fā)展和應(yīng)用的需要,成為社會研究知識體系中必不可少的一部分內(nèi)容??梢哉f,抽樣方法是架在研究者十分有限的時間、經(jīng)費、人力與龐雜、廣闊、紛繁、多變的社會現(xiàn)象之間的一座橋梁。有了它的幫助,研究者可以方便地從較小的部分達到很大的整體。
為了綜合地說明抽樣所具有的神話般的作用,我們來看一個實際的例子。1984年11月,羅納德·里根59%比41%的優(yōu)勢當(dāng)選為美國新一任總統(tǒng)。在正式投票選舉的前夕,一些政治民意測驗機構(gòu)就已根據(jù)他們抽樣的結(jié)果預(yù)言了里根的勝利。表5-1就是美國的一些全國性的民意測驗機構(gòu)在10月底或11月初所作出的預(yù)測結(jié)果與實際投票結(jié)果的比較。
從表5-1中可以看出,盡管各種民意測驗的結(jié)果并不相同,但是,一方面,他們都正確地預(yù)言了誰將獲勝;另一方面,他們所預(yù)言的結(jié)果基本上都是緊緊圍繞在實際投票結(jié)果的周圍。那么,在將近1億的美國選民中,他們究竟調(diào)查了多少人就得到這種結(jié)果的呢?他們的調(diào)查對象還不到2000人!這就是抽樣所具有的力量和效率。
表5-1 1984年美國總統(tǒng)選舉預(yù)測結(jié)果與實際投票結(jié)果的比較(%)
資料來源:BABBIE.The Practice of Social Research,1986:137.
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請告知,我們將盡快刪除相關(guān)內(nèi)容。