精品欧美无遮挡一区二区三区在线观看,中文字幕一区二区日韩欧美,久久久久国色αv免费观看,亚洲熟女乱综合一区二区三区

        ? 首頁 ? 理論教育 ?樣本抽樣誤差計算公式

        樣本抽樣誤差計算公式

        時間:2023-03-14 理論教育 版權反饋
        【摘要】:設、Δp分別表示樣本均值允許誤差和樣本成數(shù)允許誤差,則有:由于抽樣平均誤差反映誤差的一般水平,因此,抽樣允許誤差往往以抽樣平均誤差的Z倍來界定,即三、參數(shù)估計用樣本統(tǒng)計量估計總體參數(shù)有點估計和區(qū)間估計兩種形式。
        參數(shù)估計_統(tǒng)計學教程

        第一節(jié) 參數(shù)估計

        一、參數(shù)估計的優(yōu)良標準

        參數(shù)估計(Parameter estimation)是以樣本統(tǒng)計量作為未知總體參數(shù)的估計量,并通過對樣本各單位的實際觀察取得樣本數(shù)據(jù),計算樣本統(tǒng)計量的取值作為被估計參數(shù)的估計值。

        由于統(tǒng)計量是樣本變量的函數(shù),根據(jù)樣本變量可以構造許多統(tǒng)計量,但并不是所有的統(tǒng)計量都能夠充當總體參數(shù)良好的估計量。作為優(yōu)良的估計量應符合以下三項標準:

        (一)無偏性(Unbiasedness)

        即抽樣指標的數(shù)學期望(均值)等于總體參數(shù)。也就是說,雖然每一次抽樣指標可能與總體參數(shù)有一定偏差,但是,總體中所有可能的樣本抽樣指標的均值要等于總體參數(shù)。這是一個好的估計量必須具備的性質。

        (二)有效性(Effectiveness)

        當容量相同的兩個樣本統(tǒng)計量進行比較時,其中抽樣分布的標準差較小的那個統(tǒng)計量比另一個更有效。因此,作為優(yōu)良估計量的統(tǒng)計量,其標準差應小于其他統(tǒng)計量的標準差。

        (三)一致性(Consistency)

        以樣本統(tǒng)計量估計總體參數(shù),要求當樣本的單位數(shù)充分大時,樣本統(tǒng)計量也充分接近總體參數(shù)。也就是說,隨著樣本量n的無限增加,樣本統(tǒng)計量和被估計的總體參數(shù)之差的絕對值小于任意小正數(shù)。

        可以證明,樣本均值img247和樣本成數(shù)p均滿足上述三條標準,因此,它們是總體參數(shù)μ和P的優(yōu)良估計量。

        二、抽樣誤差

        當用樣本指標估計總體參數(shù)時,不可避免地要出現(xiàn)誤差。產生這一誤差的原因有兩個方面:一方面是由抽樣工作中人為因素造成的,包括調查過程中的登記性誤差、不遵守隨機原則故意多選有利的單位或不利的單位而造成的系統(tǒng)性誤差;另一方面,在遵守隨機原則前提下,由于抽樣方法本身所致的樣本結構與總體結構不一致而產生的偶然性的代表性誤差。上述第一種誤差是由于抽樣過程中人為因素造成的,可通過采取措施預防其發(fā)生或將其減少到最小限度,而第二種誤差則是抽樣方法本身所固有的、無法消除的。所謂抽樣誤差(Sampling error),就是指按隨機原則抽樣時,在沒有登記性誤差和系統(tǒng)性誤差的條件下,單純由用樣本得出估計量而產生的偶然性的代表性誤差。

        (一)抽樣平均誤差

        由于樣本統(tǒng)計量的隨機性,抽樣誤差也是隨機變量,因此,個別樣本的抽樣誤差大小是很難估計的。然而,全部可能樣本的樣本指標與總體參數(shù)的平均離差程度是可以度量的,這個統(tǒng)計量稱為抽樣平均誤差(Mean sampling error)。

        1.抽樣平均誤差的計算。以樣本均值為例,抽樣平均誤差的計算公式為:

        img248

        所以,抽樣平均誤差即為樣本均值的標準差,若已知總體標準差σ,即可方便地計算得到抽樣平均誤差。

        在實際工作中,往往進行的是不放回抽樣,在不放回抽樣條件下,同樣可以證明,抽樣平均誤差為:

        img249

        當N很大,相對n很小時,不放回抽樣與放回抽樣的結果近似相等,實際中可以將不放回抽樣按照放回抽樣處理。

        在計算抽樣平均誤差時,本標準差通常得不到總體標準差的數(shù)值,此時可用σ的無偏估計量S來代替總體標準差。S的計算公式是:

        img250

        在大樣本的情況下,也可以用樣本標準差的一般公式計算S來代替總體標準差:

        img251

        成數(shù)的抽樣平均誤差與均值相似,若用σp表示成數(shù)抽樣平均誤差,有:

        放回抽樣  img252

        不放回抽樣 img253

        同樣當N很大,相對n很小時,不放回抽樣與放回抽樣的結果近似相等,實際中可以將不放回抽樣按照放回抽樣處理。

        在得不到總體成數(shù)P的資料時,如果n≥30也可以用總體成數(shù)的優(yōu)良估計量即樣本成數(shù)p來代替。

        例6-1:一批食品罐頭共60000桶,隨機抽查300桶,發(fā)現(xiàn)其中6桶不合格,求合格率的抽樣平均誤差。

        根據(jù)已知條件 img254

        放回抽樣  img255

        不放回抽樣  img256

        img257

        2.抽樣平均誤差的影響因素。抽樣平均誤差的大小受以下幾個因素的影響:

        (1)樣本量n的大小。在其他條件不變的情況下,抽樣單位數(shù)越多,樣本就越能反映總體,誤差就越小。若當抽樣單位數(shù)接近總體單位數(shù)時,此時的抽樣調查已接近于全面調查,抽樣誤差接近于零。反之,抽樣單位數(shù)越少,誤差越大。

        (2)總體方差σ2的大小。在其他條件不變的情況下,總體被研究標志的變異程度越?。é?sup>2?。?,說明總體各單位標志值之間差異小,這樣樣本指標與總體指標之間的誤差也小。相反,若總體被研究標志變異程度大(σ2大),則樣本指標與總體指標之間的誤差也大。

        (3)抽樣組織方式。采取不同的抽樣組織方式,所抽出的樣本對于總體的代表性也不相同,因此,抽樣組織方式影響抽樣誤差的大小。在實踐中,我們可以利用不同抽樣組織方式下抽樣誤差的大小,來判斷不同方式的有效性。

        (4)抽樣方法。抽樣方法有放回和不放回抽樣兩種,若其他條件相同,不放回抽樣的抽樣誤差一般小于放回抽樣的誤差,這是因為不放回抽樣避免了總體單位的重復中選,因而更能反映總體結構,故抽樣誤差會較小些。

        (二)抽樣允許誤差

        以樣本統(tǒng)計量估計總體參數(shù)必須考慮抽樣誤差的大小,誤差越大則樣本的價值越??;同時誤差也非越小越好,因為在一定限度之下減少抽樣誤差會增加抽樣的難度。所以在進行抽樣估計時,應根據(jù)所研究對象的變異程度和分析任務的要求確定可允許的誤差范圍。這種可允許的誤差范圍稱為抽樣允許誤差(Permissible sampling error),表現(xiàn)為樣本統(tǒng)計量可允許變動的上限或下限與總體參數(shù)之差的絕對值。

        img258、Δp分別表示樣本均值允許誤差和樣本成數(shù)允許誤差,則有:

        img259

        由于抽樣平均誤差反映誤差的一般水平,因此,抽樣允許誤差往往以抽樣平均誤差的Z倍來界定,即

        img260

        三、參數(shù)估計

        用樣本統(tǒng)計量估計總體參數(shù)有點估計和區(qū)間估計兩種形式。

        點估計(Point estimator)就是估計總體參數(shù)的一個值,即直接用樣本指標來代替總體指標。例如,為了掌握一批產品的平均壽命,從中隨機抽取100件產品,測得該樣本的平均壽命為960小時。因此,用點估計方法可以估計該批產品的平均壽命即為960小時。

        由于點估計的結果具有很強的近似性,且沒有辦法掌握這一估計的把握程度,因此,實踐中使用較少,而更多使用的是區(qū)間估計方法。

        區(qū)間估計(Interral estimator)就是給出總體參數(shù)以一定的概率把握程度1-α可能落入的區(qū)間,這一區(qū)間稱為估計區(qū)間或置信區(qū)間,一定的概率把握程度稱為概率度或置信度,α稱為顯著性水平。

        置信區(qū)間表達了區(qū)間估計的精確性,置信度表達了區(qū)間估計的可靠性。在進行區(qū)間估計時,必須同時考慮置信區(qū)間與置信度兩個方面,若置信度定得比較大即可靠性高,則置信區(qū)間相應的也較大即準確性低。因此,可靠性與準確性要結合具體問題、具體要求全面考慮。

        (一)總體均值的區(qū)間估計

        1.一個總體均值的區(qū)間估計。一個總體均值的區(qū)間估計就是找出總體均值μ以一定的概率把握程度1-α可能落入的區(qū)間(img261),其中,

        img262

        則,

        img263

        根據(jù)第五章第二節(jié)所述,如果樣本為大樣本,或者為抽自方差已知正態(tài)總體的小樣本,樣本均值服從正態(tài)分布,這時上式中的zα/2為將樣本均值分布轉換成標準正態(tài)分布后的雙側上α/2分位點。根據(jù)事先給定的把握程度1-α,查附錄二表2標準正態(tài)分布雙側分位數(shù)表,可得zα/2值。即

        img264

        因而有:

        img265

        即總體均值μ在1-α的把握程度下的估計區(qū)間為img266

        這里,把握程度1-α也稱置信度,估計區(qū)間img267也稱置信區(qū)間。

        在對μ的實際估計中,一般事先給定估計的概率保證程度1-α,即估計的把握程度,再由把握程度確定img268

        例6-2:某軋鋼廠生產一批圓鋼,為了解這批圓鋼的抗拉性能,從這批產品中隨機抽出50根做抗拉強度試驗,實測結果如表6-1所示。要求在95.45%的概率保證下估計這批圓鋼的抗拉強度。

        由表6-1計算出50根圓鋼抗拉強度的樣本均值(公斤/平方毫米):

        img269

        由表6-1計算出50根圓鋼抗拉強度的樣本方差:

        img270

        表6-1   樣本均值與方差計算表

        img271

        抽樣平均誤差:

        此例的試驗為破壞性的,因此屬于不放回抽樣,然而,此例N■n,所以按放回抽樣公式計算的img272(公斤/平方毫米)為:

        img273

        由題意有zα/2=2,于是抽樣允許誤差(公斤/平方毫米)為:

        img274

        故在95.45%的把握程度下可推斷該批圓鋼的抗拉強度范圍為(36.7±1.24),即抗拉強度為35.44~37.94公斤/平方毫米。

        由前述抽樣推斷原理可知,當樣本量小于30,且抽自方差未知正態(tài)總體時,可以使用t分布對總體參數(shù)進行區(qū)間估計。

        應用t分布估計總體參數(shù)時,抽樣允許誤差為:

        img275

        式中t值根據(jù)給定的把握程度1-α及自由度(=樣本量-1)由附錄二表4 t分布雙側分位數(shù)表查得。t分布表的結構不同于正態(tài)分布表,查表時要使用自由度和α值兩個參數(shù)。α值表示總體參數(shù)落入置信區(qū)間以外的概率,若要求以95%的把握估計總體參數(shù)取值范圍,則α=100%-95%=5%。為方便起見,分位數(shù)表只給出對應幾個常用α值的數(shù)值,如α=10%、5%、2%和1%。

        式中img276的計算:

        當放回抽樣時

        img277

        當不放回抽樣時

        img278

        在小樣本情況下,采用不放回抽樣很容易滿足n/N很小的條件,因此,可以將不放回抽樣按照放回抽樣處理。

        例6-3:某單位為了解其平均日耗電量情況,隨機調查了15天的耗電情況。調查結果表明,這15天平均日耗電量為362千瓦·時,樣本方差為493,若已知日耗電量服從正態(tài)分布,要求以95%的把握程度估計該單位的日耗電量水平。

        由題意可知:img279,s2=493

        自由度為15-1=14,α=5%

        于是由附錄二表4 t分布表可查得t值為2.145。

        由于總體耗電可認為是無限大,故按放回抽樣公式計算img280

        img281

        于是平均日耗電量的抽樣允許誤差為:

        img282

        因此,在95%的把握程度下,該單位日耗電量水平范圍為(362±12.3),即該單位平均日耗電量為349.7~374.3千瓦·時。

        2.兩個總體均值之差的區(qū)間估計。如果兩個總體均為方差已知的正態(tài)總體,則有:

        img283

        標準化轉換后有:

        img284

        則μ1-μ2的估計區(qū)間為:

        img285

        例6-4:為測定甲、乙兩廠生產的某種材料的拉力強度是否相同,從甲廠抽取36個樣本,測得平均拉力為29公斤,從乙廠抽取25個樣本,測得平均拉力為27公斤。根據(jù)過去的經(jīng)驗,兩廠產品拉力強度的方差均為14,試以95%的把握程度估計兩廠產品拉力強度的差,以確定兩廠產品的拉力強度是否有顯著差別。

        解:據(jù)已知條件,img286

        img287

        因此,μ1-μ2的估計區(qū)間為

        img288

        即有95%的把握說明兩廠產品的抗拉強度之差在0.09~3.91公斤之間。

        如果兩個總體均為正態(tài)總體,方差未知,但img289,則有:

        img290

        式中:

        img291

        則μ1-μ2的估計區(qū)間為:

        img292

        例6-5:為了解某農作物兩個品種的產量差異,隨機調查了8個地區(qū),結果如下(單位:公斤/畝):

        A品種 430,435,280,465,420,465,375,395

        B品種 400,395,290,455,385,410,380,330

        假定這兩個品種的畝產量分別服從正態(tài)分布,且方差相等,試以95%的把握程度估計兩個品種畝產量之差。

        解:n1=n2=8為小樣本,tα/2(n1+n2-2)=2.14,則

        img293

        img294

        μA-μB的估計區(qū)間為:

        img295

        即有95%的把握兩個品種畝產量之差在-28.3~83.3公斤之間。

        (二)總體成數(shù)的區(qū)間估計

        1.一個總體成數(shù)的區(qū)間估計。由前述樣本成數(shù)的抽樣分布已知,在大樣本情況下,樣本成數(shù)趨于正態(tài)分布,因此,對于給定的把握程度1-α,一個總體成數(shù)P的估計區(qū)間為p±zα/2σp

        例6-6:在例6-2中若規(guī)定抗拉強度小于30公斤/平方毫米為不合格品,試在95.45%的概率保證下估計這批圓鋼的合格率。

        由例6-2中已知的資料可以計算出樣本的合格率為img296。

        抽樣平均誤差的計算。因為總體N》n,所以用放回抽樣公式計算,即:

        img297

        由題意,zα/2=2,于是有抽樣允許誤差:

        Δp=zα/2σp=2×0.046=0.092

        總體成數(shù)范圍為:

        p-Δp≤P≤p+Δp

        0.88-0.092≤P≤0.88+0.092

        得   0.788≤P≤0.972

        即在95.45%的把握程度下可以斷定這批圓鋼的合格率在78.8%~97.2%之間。

        小樣本情況下,樣本成數(shù)服從二項分布,這時,對于給定的把握程度1-α,可以找到兩個常數(shù)p1,p2,使

        P(p1≤p≤p2)=1-α

        并且滿足

        img298

        實際工作中,我們可以用已經(jīng)編制好的二項分布參數(shù)P的置信區(qū)間表,而不必按照區(qū)間估計的原理確定區(qū)間的上下限。

        2.兩個總體成數(shù)之差的區(qū)間估計。如果兩個樣本分別抽自兩個獨立總體,則當樣本容量足夠大時,p1-p2近似服從正態(tài)分布,記作

        img299

        標準化轉換后,有:

        img300

        則P1-P2的置信區(qū)間為:

        img301

        例6-7:兩家日化廠生產兩種品牌洗衣粉,為比較兩種洗衣粉的洗滌效果,現(xiàn)進行抽樣調查,調查結果為:使用A廠洗衣粉的360人中144人認為洗滌效果明顯,而使用B廠洗衣粉的320人中96人認為洗滌效果明顯。試以95%的把握程度估計兩種洗衣粉洗滌效果的差異。

        解:根據(jù)已知條件,有

        img302

        由于n1=360、n2=320均為大樣本,zα/2=1.96,則P1-P2的估計區(qū)間為:

        img303

        即使用A廠洗衣粉洗滌效果明顯者所占比例與使用B廠洗衣粉洗滌效果明顯者所占比例之差約為3%~17%之間,A廠洗衣粉洗滌效果好于B廠。

        需要說明的是,在估計兩個總體均值或成數(shù)之差時,若估計區(qū)間的上下限同為正或負數(shù),可以據(jù)此判斷兩個總體特征值的差異;否則,不能據(jù)此判斷兩個總體特征值的差異。

        (三)總體方差的區(qū)間估計

        設隨機變量X~N(μ,σ2),隨機變量X1,X2,…,Xn為X的一個樣本,則有:

        img304

        對于給定的置信度1-α,有:

        img305

        則可得σ2的置信區(qū)間為:

        img306

        例6-8:已知某乳品廠生產的袋裝奶粉的重量服從正態(tài)分布,但方差未知,現(xiàn)從中隨機抽取12袋,測得重量如下(單位:克):

        401  409  395  390  405  410

        385  398  400  388  402  405

        試以95%的把握程度估計總體方差σ2的置信區(qū)間。

        解:

        img307

        由n=12,1-α=0.95,查附錄二表3得:

        img308

        img309

        則σ2的置信區(qū)間為:

        img310

        即有95%的把握程度總體方差σ2在30.2~173.4之間。

        (四)不同抽樣組織方式總體參數(shù)的區(qū)間估計

        1.簡單隨機抽樣。簡單隨機抽樣的抽樣誤差計算、全及總體指標的估計就是本節(jié)前面介紹的方法,這里不再贅述。

        2.分層抽樣。以實際工作中通常采用的等比例抽樣為例。

        (1)總體均值估計。

        首先,計算樣本均值。若總體分為k組,則

        img311

        img314

        然后,計算抽樣平均誤差。

        放回抽樣  img315

        不放回抽樣  img316

        img319

        若當各組方差未知時,可以用樣本方差代替。

        例6-9:某鄉(xiāng)種植糧食5000公頃,分種在平原和山地。為了解該鄉(xiāng)糧食平均每公頃產量,現(xiàn)采用放回抽樣法抽取630公頃作為樣本,抽樣時根據(jù)兩種地的面積大小等比例進行抽樣。抽樣結果見表6-2。

        表6-2   分層抽樣計算表

        img320

        由于采用等比例抽樣,所以,兩種地分別抽取504公頃和126公頃,即:

        img321

        樣本平均產量(公斤):

        img322

        平均組內方差:

        img323

        抽樣平均誤差(公斤):

        img324

        當概率保證程度為95%時,抽樣允許誤差(公斤)為:

        Δx=zα/2σx=1.96×70.68=138.5

        由  μ的置信區(qū)間:img325

        有  6746.5≤μ≤7023.5

        這就是說,有95%的把握程度認為該鄉(xiāng)糧食平均每公頃產量為6746.5~7023.5公斤。

        (2)總體成數(shù)估計。在對總體進行成數(shù)估計時,當總體存在明顯的分組且各組的成數(shù)相差較大時,應采用分層抽樣法。

        然后,計算樣本方差img328。

        img329

        最后,計算抽樣平均誤差。

        放回抽樣img330

        不放回抽樣img331

        3.等距抽樣。等距抽樣的抽樣平均誤差是個很難解決的問題,因此在實踐中常用簡單隨機抽樣誤差公式近似計算,尤其是對于按無關標志排隊的總體。

        例6-10:有一長方形麥地,地長300米,寬100米,共200垅。為了解該地小麥的平均每公頃產量及總產量,現(xiàn)采用等距抽樣方式抽取30個3米長的垅段作為樣本,要求在95.45%的概率保證下估計總體參數(shù)。

        img332

        即每隔2000米選一個樣本點。從地角一邊樣本距離的一半處抽取第一個樣本,即第1000米為第一點,該點前后1.5米的垅段為第一個樣本,以后每隔2000米如此取樣,直至抽夠30個樣本。設30個樣本點的實測數(shù)據(jù)如表6-3所示。

        表6-3   等距抽樣樣本指標計算表

        img333

        每垅小麥產量的樣本均值(公斤):

        img334

        即平均每3米長的垅段產小麥0.97公斤。

        img335

        抽樣平均誤差(公斤):

        由于img336,所以,采用放回抽樣公式計算。

        img337

        img338

        即每3米長垅段的小麥產量在(0.97±0.062)公斤之間。

        下面計算每公頃平均產量:

        img339

        于是樣本每公頃產量(公斤/公頃)為:

        img340

        即樣本每公頃產量在6053~6880公斤之間,該地總產量(公斤)則為:

        6050×3=18150

        6880×3=20640

        即該地總產量在18150~20640公斤之間。

        4.整群抽樣。整群抽樣中,群的劃分有等群與不等群兩種,即各群所含單位數(shù)可以相等也可以不等。下面我們所要討論的是等群的整群抽樣估計方法。

        (1)總體均值估計。設總體全部單位劃分為R群,從R群中隨機抽取r群組成樣本,于是有:

        總體均值:

        img341

        其中:μi表示總體各群的均值。

        樣本均值:

        img342

        其中:img343表示樣本中各群的均值。

        總體方差與樣本方差。由于整群抽樣群內各單位是全面檢查的。因此,整群抽樣的抽樣誤差取決于各群之間差異的大小。于是有

        總體群間方差:

        img344

        樣本群間方差:

        img345

        抽樣平均誤差的計算。整群抽樣均是按不放回抽樣法進行的,不存在放回抽樣,于是有抽樣平均誤差:

        img346

        例6-11:某化肥廠一天可生產化肥14400袋,平均每分鐘生產10袋化肥。為了解某一天所生產化肥的平均每袋凈重,現(xiàn)在對某天生產的化肥采用整群抽樣方法進行調查,即每隔144分鐘抽出1分鐘的化肥進行檢查,共抽10分鐘的產量。要求在95%的概率保證下,估計這一天每袋凈裝化肥的平均重量。抽樣結果見表6-4。

        表6-4   整群抽樣計算表

        img349

        由題意可知,每次抽出1分鐘的產品進行檢查,因此每1分鐘產品即為一群,又由于全天24小時連續(xù)生產,于是

        全天生產的化肥總群數(shù)(群)為:

           R=24×60=1440

        或  img350

        抽得的樣本群數(shù)(群)為:

        img351

        樣本的平均每袋重量(公斤/袋)為:

        img352

        群間方差為:

        img353

        抽樣平均誤差(公斤/袋)為:

        img354

        當概率保證為95%時,查表得zα/2=1.96。

        于是有抽樣允許誤差(公斤/袋):

        img355

        所以  μ的置信區(qū)間:img356

        即在95%的概率保證下,可以推斷該天生產化肥的平均每袋重量在48.5~50.5公斤之間。

        (2)總體成數(shù)估計。設Pi為全及總體各群的成數(shù),pi為樣本群的成數(shù),于是有總體和樣本成數(shù):

        img357

        總體和樣本的群間方差分別為:

        img358

        抽樣平均誤差為:

        img359

        5.階段抽樣。下面我們將著重介紹兩階段的抽樣方法和總體參數(shù)估計。

        設將總體劃分為R組,每組包含Mi個單位。第一步從R組中隨機抽取若干組,第二步從中選的組(共r組)中分別隨機抽取mi個單位,然后組成樣本。用字母表示以上數(shù)字關系為:

        總體單位數(shù):N=M1+M2+…+MR

        樣本單位數(shù):n=m1+m2+…+mr

        上面的各Mi值可以是相等的,也可以是不相等的;各mi值也可有相等和不相等之分。下面我們將討論Mi和mi均分別相等的情況,即:N=RM,n=rm。

        設Xij為第i個樣本組中第j個樣本單位的標志值,則第i個樣本組的樣本均值為:

        img360

        所有r組的樣本均值為:

        img361

        抽樣平均誤差為:

        img362

        式中:img363表示各組內方差的平均值;δ2表示組間方差。

        當總體的img364與δ2未知時,可以用樣本的相應指標來代替。

        例6-12:調查某地區(qū)居民人均月收入情況。該地區(qū)共有60個街道,平均每個街道有100戶居民?,F(xiàn)采取兩階段抽樣方法,先從總體中抽取5個街道,然后從中選的街道中再抽取6戶居民進行調查,調查結果見表6-5。要求,在95.45%的概率保證下,估計這一地區(qū)居民的人均月收入水平。

        表6-5   兩階段抽樣樣本指標計算表

        img365

        中選戶人均收入的均值(元)計算:

        img366

        樣本平均組內方差計算:

        各組的方差為

        img367

        于是,有平均組內方差:

        img372

        組間方差:

        img373

        于是,中選戶人均收入的抽樣平均誤差(元)為:

        img374

        由題意可知zα/2=2,于是中選戶人均收入的抽樣允許誤差(元)為:

        img375

        于是,可以以95.45%的概率估計該地區(qū)居民人均月收入為296.26~325.34元之間。

        四、樣本單位數(shù)的確定

        從理論上講,樣本量越大,樣本指標的代表性越強,但是,如果樣本量過大,必然增加抽樣調查的難度。因此,在抽樣調查方案的設計中,需要根據(jù)所研究問題的性質確定允許的誤差范圍和必要的概率保證程度,然后通過歷史資料或其他試點資料確定總體標準差σ,運用抽樣允許誤差公式來推算必要的樣本單位數(shù)n。

        這里我們以簡單隨機抽樣且樣本統(tǒng)計量服從或近似服從正態(tài)分布為例介紹確定樣本單位數(shù)的方法。

        (一)估計均值的樣本量

        1.放回抽樣:

        由    img376

        有    img377

        2.不放回抽樣:

        由    img378

        得    img379

        上面式中的σ2往往是利用以往的經(jīng)驗數(shù)據(jù),因為這時還沒有抽樣,因此不可能用樣本方差來代替未知的總體方差σ2。

        (二)估計成數(shù)的樣本量

        1.放回抽樣:

        由    img380

        得    img381

        2.不放回抽樣:

        由    img382

        得    img383

        與前面遇到的問題一樣,式中P往往不知道,一般情況是利用以往的資料來確定。

        例6-13:現(xiàn)要對某種型號電池的電流強度進行檢驗,按以往正常生產經(jīng)驗,電池電流強度的標準差為0.4安培,電池合格率為90%。現(xiàn)用放回抽樣方式,并要求概率保證程度為95.45%,若電流平均強度的抽樣允許誤差不超過0.08安培,合格率的抽樣允許誤差不超過5%,求必要的抽樣單位數(shù)。

        在放回抽樣條件下,檢測電流強度:

        由σ=0.4,zα/2=2,img384

        需要檢測電流強度的電池數(shù)(只)為:

        img385

        在放回抽樣條件下抽檢電池合格率:

        由p=0.9,zα/2=2,Δp≤0.05

        需抽檢的電池數(shù)(只)為:

        img386

        由上面計算可知,若分別抽檢電流強度和電池合格率指標,樣本單位數(shù)分別取100和144。如果要求同時檢查電流強度和合格率指標,則應取n=144進行抽樣,以滿足兩種指標的抽樣要求。

        免責聲明:以上內容源自網(wǎng)絡,版權歸原作者所有,如有侵犯您的原創(chuàng)版權請告知,我們將盡快刪除相關內容。

        我要反饋