多階段分層不等概率抽樣的估計
本次研究采用的抽樣方法為多階段分層不等概率抽樣。由于是全國性大樣本的調(diào)查,在各個階段中用到了多種復(fù)雜抽樣方法的組合,包括PPS抽樣[4]、簡單隨機抽樣、等距抽樣、KISH表抽樣、典型抽樣等。
由于抽樣階段很多,每個層次涉及到的抽樣方法各不相同,在進行最終統(tǒng)計推斷時非常復(fù)雜。為了簡化參數(shù)估計的計算,對總體的推斷有更加清晰的了解,我們將復(fù)雜的抽樣過程簡化為兩個階段:初級抽樣單元(PSU),即抽取到的城市;二級抽樣單元(SSU),即抽取到的最終樣本——個人。
根據(jù)方差分析原理,對總體進行分層后,總體方差可以分解為兩部分,一部分是層間方差,一部分是層內(nèi)方差。初級抽樣單元PSU之間的方差為層間方差;二級抽樣單元SSU之間的方差為層內(nèi)方差。兩個層的方差估計過程如下:
第一階段,城市的抽取,采用的是PPS抽樣。PPS抽樣的估計,可直接應(yīng)用漢森—赫維茨(Hansen-Hurwitz)估計量的公式進行計算。具體計算過程如下:
記Yij為總體的第i個群中第j個次級單元的觀測值(i=1,2,...,N;j=1,2,...,Mi),其中Mi是群的大小。yij為樣本中第i個群中第j個次級單元的觀測值(i=1,2,..., n;j=1,2,...,mi)其中mi是群的大小。
總體總量Y的估計量為。
其中(Mi是分層抽樣中群的大小,Mo是總體中所有群大小之和)。
第二階段,從抽到的城市中抽取訪問的個體。這個過程分成了多個階段,地圖塊的抽取采用簡單隨機抽樣,從地圖塊抽取戶采用等距抽樣,從戶中抽取最終訪問的樣本采用KISH表抽樣。在這一階段中雖然采用了多種抽樣方法的結(jié)合,但這幾種方法組合的抽樣原理基本可以認為與分層隨機抽樣一致。因此在這一階段,我們采用分層隨機抽樣的統(tǒng)計推斷方法來對總體進行估計。
在抽中的PSU所含的全部Mi個SSU中抽取mi個,總體方差的估計公式為
非自代表城市的樣本,是通過以上兩階段抽取,在統(tǒng)計推斷時其總體方差估計=公式(1)+公式(2)。自代表城市的樣本,沒有經(jīng)過抽取城市的第一階段,因此在統(tǒng)計推斷時其總體方差僅來自于層內(nèi)差,即公式(2)。
農(nóng)業(yè)人口樣本,在抽取縣和行政村時采用了就近抽樣的典型抽樣方法,這種方法的變異量要高于隨機抽樣。因此在估計農(nóng)業(yè)人口樣本的總體方差時需要適當擴大公式(2)的值。
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請告知,我們將盡快刪除相關(guān)內(nèi)容。