選擇被訪者
選擇被訪者
要仔細(xì)選擇被訪者,因為他們是調(diào)查數(shù)據(jù)的來源。假如你與錯誤的人在錯誤的時間和地點(diǎn)進(jìn)行了調(diào)查訪問,那么再好的問題設(shè)計也沒用。
(旁注)提問順序是提問策略的有效補(bǔ)充。
定義總體
選擇受訪者的第一步是確認(rèn)你所希望研究的總體或目標(biāo)群體。
選擇被訪者的第一步是定義你想要研究的總體。這個總體可能規(guī)模很小且同質(zhì)化,如教堂里的一個年輕人社團(tuán)中的成員;也可能規(guī)模很大,具有多樣性,如全中國所有具有選民資格的成年人。你可能只對一個大規(guī)??傮w中的某個子集感興趣,比如年輕人社團(tuán)中的男孩子,或者北京地區(qū)的女大學(xué)生。你確定的總體應(yīng)該包括全體有能力且夠資格回答問題的人以及你想要由之推出結(jié)論的人。
假如目標(biāo)總體規(guī)模很?。ū热缬醒踅∩戆鄬W(xué)員或者電視臺的技術(shù)人員),你就可以和全部人員進(jìn)行訪問。但是,絕大部分調(diào)查要研究的總體遠(yuǎn)遠(yuǎn)超出調(diào)查時間、資金和人員允許的范圍,比如總體是一個大學(xué)里35 000個大學(xué)生或者一個250 000人口的城市里所有年滿18歲的居民。區(qū)區(qū)幾十個訪員不可能與這個目標(biāo)群體中的所有人員進(jìn)行訪問,即使他們有無限的時間和資金。
既然與目標(biāo)總體的所有人員進(jìn)行訪問往往是不可能實現(xiàn)的,那就只訪問其中的部分人員并且把結(jié)論推廣到總體,要努力使這個抽樣群能真正代表總體。
抽樣原則
抽樣最根本的原則是,樣本必須能夠代表總體或研究目標(biāo)群體。市場上賣西瓜的人仔細(xì)地從一個西瓜上切下一小塊所實踐的就是這一原則,這一小塊楔形西瓜展示了整個西瓜是什么樣的。
(旁注)總體就是所有目標(biāo)調(diào)查對象的集合。
每一個定義總體里的潛在被訪者都必須有均等的機(jī)會被抽到,你必須確定每個人被抽到的可能性,它取決于允許誤差幅度。調(diào)查的精度就是“用同樣的方法得出的樣本結(jié)果和總體結(jié)果之間的相似水平”⑨。絕大多數(shù)調(diào)查采用95%的置信度,也就是說,不管通過何種方式計算,在5%的誤差下100個被訪者中都會有95個得出和訪問總體所得相同的結(jié)果。NBC—美聯(lián)社、CBS—紐約時報、ABC—華盛頓郵報或者哈里斯(Harris)定期發(fā)布的調(diào)查成果規(guī)定,調(diào)查的允許誤差是4%,這意味著,假如42%的被訪者同意總統(tǒng)的工作方式,那實際的數(shù)字可能像38%那么低或者46%那么高。
(旁注)樣本是一個縮小了的總體。
(旁注)誤差決定了調(diào)查的價值。
允許誤差取決于如何使用調(diào)查結(jié)果,假如你想預(yù)測選舉結(jié)果或者一個新藥的療效,就應(yīng)盡量把誤差控制得更小些,控制在3%或者更小一點(diǎn)。假如你進(jìn)行調(diào)查是想知道員工們對新娛樂設(shè)施的感覺,那可以讓誤差稍高點(diǎn),控制在4%或5%。
樣本量取決于總體大小和允許誤差的范圍。沒有所謂的神奇公式來決定被訪者數(shù)量。一些調(diào)查機(jī)構(gòu)使用大約1 500個樣本就可以實施誤差控制在3%的精確性全國調(diào)查。標(biāo)準(zhǔn)公式顯示,總體數(shù)量增加時,最小樣本數(shù)量占總體的比例下降很快。換句話說,為了獲得同樣精確的結(jié)果,你對5 000人的訪問比例要遠(yuǎn)遠(yuǎn)大于對50 000人的訪問比例。公式還顯示,要把誤差從5%降到4%再降到3%,你必須增加很多樣本。為了減少這一點(diǎn)誤差也許不值得提高那么多費(fèi)用來增加大量訪問。菲利普·梅耶(Philip Meyer)提供了下面的表格,來展示在一個5%的誤差范圍下,95%的置信度水平上,不同總體所必需的樣本量⑩。
(旁注)樣本量即訪問對象的真實數(shù)字。
總體數(shù) 樣本數(shù)
無限384
500 000 384
100 000 383
50 000 381
10 000 370
5 000 357
3 000 341
2 000 322
1 000 278
抽樣技術(shù)
樣本量大小很重要,但是,對于調(diào)查的有效性來說,如何實施抽樣更重要。
隨機(jī)抽樣
隨機(jī)抽樣是從目標(biāo)總體中抽取有代表性樣本的最簡單方法。例如,假如你有總體人員的全部名冊,你就可以把所有的名字放在一個容器內(nèi),把它們混合在一起,然后一次抓取一個名字直到取夠樣本。這就像發(fā)行彩票,藏有數(shù)字的乒乓球在密閉的玻璃容器中滾動,然后一次一個球地蹦出來,這就是一個隨機(jī)抽樣。
(旁注)隨機(jī)抽樣就好像“從帽子里抽人名”。
隨機(jī)數(shù)字表
一種較復(fù)雜的隨機(jī)抽樣方法是,給每一個潛在的被訪者編號,然后建立或購買一個隨機(jī)數(shù)字表,閉上眼睛,用手指隨便點(diǎn)一個數(shù)字,然后讀出它上、下、左、右或?qū)蔷€上的相鄰數(shù)字。把這個數(shù)字代表的被訪者作為一個樣本,或者取這個數(shù)字(假設(shè)它為46)的后一個數(shù)字6,和它右邊相鄰數(shù)字(假設(shè)為29)的前一個數(shù)字2,把兩個數(shù)字合起來作為被訪者的編號62。重復(fù)這個過程直到取夠樣本。
等距抽樣或隨機(jī)數(shù)位抽樣
你在電話簿中每隔10個抽取一個電話號碼,在顧客花名冊里每隔五個抽取一人,或者選擇在超市里每隔一個碰到的人,這都是在應(yīng)用等距抽樣或叫隨機(jī)數(shù)位抽樣。這種常用的抽樣技術(shù)有一些內(nèi)在缺陷,例如,可能有15%或更多的人的電話號碼沒有列在電話簿上,一些群體(學(xué)生、窮人、民工、正在搬家的人)可能沒有電話或者名字沒有列入電話簿。一個投票人、顧客或成員名單可能不是最新的,或者已根據(jù)專業(yè)、資歷、階層或成員類別進(jìn)行過劃分,這樣產(chǎn)生的樣本就無法代表總體。一天中的什么時間、一周內(nèi)的哪一天、商場所在位置、商場內(nèi)的哪個鋪位都可能決定在那兒購物的是某類特定人群:家庭主婦、職業(yè)人士、自由職業(yè)者、失業(yè)者、退休者、夜班工人或者青少年學(xué)生。
(旁注)等距抽樣是指,你從名單表中每隔n個選擇一個名字。
分層隨機(jī)抽樣
隨機(jī)抽樣可能無法提供總體中全部有代表性的子群體,即使是放在帽子里抽簽。如果總體里的各子群體可以清楚定義(如男性和女性;年齡;教育水平;收入水平;不同文化團(tuán)體),那就可以使用分層抽樣。這一方法允許你按照每一群體在目標(biāo)總體中所占比例分別從中抽出最小樣本。例如,假如你知道目標(biāo)總體中包括52%的女性和48%的男性、12%的青少年和9%的老年人、75%的職業(yè)人士和25%的無職業(yè)者,調(diào)查樣本就要反映出這些比例。
(旁注)分層抽樣最能代表總體。
抽樣點(diǎn)
一些調(diào)查機(jī)構(gòu)給訪員提供抽樣點(diǎn),每一個抽樣點(diǎn)代表一個含特定類型人群(如CBD或退休人員)的地理區(qū)域(如一個街區(qū)或一公里之內(nèi))。給訪員的指令可能會要求他跳過街拐角的房子(街拐角的房子通常更貴),然后每隔一個房子選取一戶,直到他們得到兩個男性和兩個女性作為被訪者。這種抽樣點(diǎn)或街區(qū)抽樣使調(diào)查設(shè)計者不必借助人員名單、隨機(jī)數(shù)位或電話號碼就可以控制對訪問對象的選取。點(diǎn)或街區(qū)要仔細(xì)選擇以代表總體內(nèi)的不同單元。美國農(nóng)業(yè)部曾經(jīng)通過對農(nóng)場和農(nóng)作物進(jìn)行航拍來確定要作為訪問對象的農(nóng)場主,以此來推斷每年不同農(nóng)作物的種植數(shù)量和可能產(chǎn)量。
(旁注)一個抽樣點(diǎn)通常是一個地理區(qū)域。
自發(fā)性回應(yīng)抽樣
精度最低的抽樣方法是自發(fā)性回應(yīng)抽樣。你幾乎每天都能看到這種方法,它們充斥于電視的脫口秀節(jié)目、新聞報道以及關(guān)于一些藥品、保健品功效的宣傳報告中。你猜,誰最可能打電話給報社、電臺、電視臺或者給有關(guān)部門寫信?答案是:那些正處于極度氣憤情緒中的人,或者對某一行為持極端反對或贊同態(tài)度的人。態(tài)度平和的人很少打電話或?qū)懶拧_@就很容易預(yù)測,關(guān)于節(jié)目好壞、交通管制、流產(chǎn)、死刑、藥物療效等問題的自發(fā)性回應(yīng)調(diào)查會得出什么結(jié)果。自發(fā)性回應(yīng)樣本不具備隨機(jī)性和對總體各單元的代表性。
(旁注)自發(fā)性回應(yīng)抽樣是抽樣方法中最沒有代表性的一種。
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請告知,我們將盡快刪除相關(guān)內(nèi)容。