第二節(jié) 假設檢驗
一、假設檢驗的概念
假設檢驗(Hypothesis testing)是統(tǒng)計推斷的另一主要內容。以產品質量的抽樣檢驗為例,如果我們要以一定的概率把握程度以樣本的不合格品率估計總體不合格品率,即為我們上一節(jié)討論的參數估計問題;如果我們要以一定的概率把握程度判斷整批產品是否合格,則為假設檢驗問題。
例6-14:某外貿公司出口一種名茶,每包重量服從正態(tài)分布,并且包裝規(guī)格標準差為5克,現抽樣檢驗該茶葉的每包重量,結果如表6-6所示。
表6-6 茶葉每包重量抽檢結果
又知:這種茶葉平均每包規(guī)格重量不得低于150克方可出口,則這批茶葉是否達到出口要求?
為判斷這批茶葉是否符合出口要求,我們首先假設它成立,即能夠出口,然后根據已知條件計算出樣本的平均每包重量,并以樣本的平均每包重量來檢驗我們的假設是否正確,從而做出該批茶葉能否出口的決定,這便是一個假設檢驗問題。
例6-15:某地區(qū)小麥的一般生產水平為畝產250公斤,標準差為30公斤,根據經驗知道,小麥畝產漸近服從正態(tài)分布。現對一種化肥進行效果試驗,對該地區(qū)小麥施用該種化肥后,抽取25個地塊檢測,平均畝產量為270公斤。問:這種化肥是否使小麥明顯增產?
從直觀上看,施用這種化肥后,小麥的畝產量較以前有所增加,但是,由于數據來源并非全面調查的結果,因此,差別也可能是隨機原因造成的。究竟這種化肥是否使小麥明顯增產,我們可以先做這種化肥能夠使小麥明顯增產的假設,然后利用統(tǒng)計方法檢驗該假設是否成立。這也是個假設檢驗問題。
因此,假設檢驗是先對研究總體的參數做出某種假設,然后通過對樣本的觀察,運用統(tǒng)計方法,判斷假設是否成立。
二、假設檢驗的步驟
假設檢驗的一般步驟如下:
第一步:設立假設。根據研究問題的需要提出原假設H0和備擇假設H1。
在假設檢驗中,稱所要檢驗的假設H0為原假設(Null hypothesis)或零假設,稱H1為對立假設或備擇假設(Alternative hypothesis),若原假設被拒絕,備擇假設就被接受。拒絕原假設的區(qū)域稱為拒絕域(Rejection region),拒絕域之外的區(qū)域即為接受域(Acception region)。原假設的提出一般有三種方式,以總體均值的檢驗為例:
(1)H0: μ=μ0,H1:μ≠μ0
(2)H0: μ≤μ0,H1:μ>μ0
(3)H0: μ≥μ0,H1:μ<μ0
具體采用哪一種方式需要根據具體情況而定,若采用第一種方式,則拒絕域在分布曲線的兩側,稱為雙側或雙尾檢驗,如圖6-1所示;若采用后兩種方式,則拒絕域位于分布曲線的右側或左側,稱為單側或單尾檢驗,如圖6-2和圖6-3所示。
圖6-1 H0:μ=μ0
圖6-2 H0:μ≤μ0
圖6-3 H0:μ≥μ0
第二步:確定檢驗統(tǒng)計量。假設檢驗與參數估計一樣,需要通過樣本統(tǒng)計量進行推斷,用于假設檢驗的統(tǒng)計量稱為檢驗統(tǒng)計量。在具體問題中,選擇什么樣的檢驗統(tǒng)計量需要考慮總體方差已知或未知,樣本屬于大樣本還是小樣本,等等。
第三步:規(guī)定顯著性水平α。由于假設檢驗是根據樣本信息對總體情況進行判斷,因此,存在誤判的可能,若原假設正確卻被當成錯誤而被拒絕,統(tǒng)計上把犯這種錯誤的概率α稱為假設檢驗中的顯著性水平(Significant level),α的取值人為確定,通常取α=0.05或α=0.01。
第四步:確定臨界值。按照規(guī)定的顯著性水平和樣本統(tǒng)計量的分布性質,確定接受域和拒絕域的臨界值(Critical value)。
第五步:計算檢驗統(tǒng)計量的值。根據樣本數據計算出檢驗統(tǒng)計量的值。
第六步:將檢驗統(tǒng)計量的值與臨界值進行比較,做出判斷。
三、假設檢驗中的小概率原理
假設檢驗的基本思想是應用小概率原理。所謂小概率原理,是指發(fā)生概率很小的隨機事件在一次試驗中是幾乎不可能發(fā)生的。例如,如果有一個廠商聲稱,他的產品的合格率很高,可以達到99%,那么,從一批產品(如100件)中隨機抽取一件,該件產品恰巧是次品的概率為1%,非常小。如果我們假設廠商所言為真,則隨機抽取一件產品為次品的情況幾乎是不可能發(fā)生的,但是,如果這種情況確實發(fā)生了,我們就有理由懷疑原來的假設,做出廠商的宣稱是假的,推翻原假設這樣的推斷。當然,我們也有1%的可能性恰巧抽中100件產品中的惟一一件次品,從而做出錯誤的推斷,這里的1%即為前述顯著性水平α。
雖然小概率事件在一次試驗中發(fā)生的可能性很小,但依然可能出現。如果小概率事件發(fā)生了,而我們卻拒絕了原假設,我們就犯了以真為假即棄真錯誤,犯這種錯誤的可能性或概率就是α。統(tǒng)計上稱棄真錯誤為第一類錯誤(TypeⅠerror)。反之,若原假設不正確而我們卻接受了原假設,我們就犯了以假為真即取偽的錯誤,犯這種錯誤的可能性或概率記作β。統(tǒng)計上稱取偽錯誤為第二類錯誤(TypeⅡerror)。假設檢驗中各種可能結果的概率參見表6-7。
表6-7 假設檢驗中各種可能結果的概率
在樣本量一定的情況下,如果減小犯第一類錯誤的概率,就必然增大第二類錯誤的概率;反之亦然。若要同時減小兩類錯誤,只有增大樣本量,但樣本量不能無限制,否則就有悖于抽樣調查的意義。通常情況下,只對犯第一類錯誤的概率α加以限制,這種假設檢驗稱為顯著性檢驗。
四、參數的假設檢驗
(一)總體均值的假設檢驗
1.一個總體均值的假設檢驗。如果要檢驗的總體X~N(μ,σ2),則樣本均值,檢驗統(tǒng)計量為Z統(tǒng)計量:
我們按照假設檢驗的基本步驟,對例6-14的假設進行檢驗。
(1)提出原假設和備擇假設。判斷這種茶葉的包裝重量是否符合出口要求,即不低于150克,顯然這是一個單側檢驗問題。因此
H0:μ≥150
H1:μ<150
(2)確定檢驗統(tǒng)計量。由于總體服從正態(tài)分布,且總體方差已知,樣本均值,檢驗統(tǒng)計量為:
(3)規(guī)定顯著性水平α。一般取α=0.01或α=0.05,這里我們取α=0.05。查標準正態(tài)分布表得臨界值
zα=-1.64
(4)計算檢驗統(tǒng)計量的值。
(5)根據已知條件,做出判斷。如圖6-4所示。
從圖6-4可以看出,計算出的檢驗統(tǒng)計量z=0.6>-1.64,落入接受域,因此接受H0。這意味著,該種茶葉的包裝重量符合出口要求。
圖6-4 假設檢驗決策示意圖
例6-16:某日化公司生產洗滌劑,現該公司欲引進一條瓶裝洗滌劑自動包裝線,其設計規(guī)格為每瓶500克,標準差為6克。隨機抽取100瓶進行檢查后發(fā)現每瓶平均重量為498克。若該瓶裝洗滌劑的重量服從正態(tài)分布,α=0.05,問該生產線的設計規(guī)格能否接受。
解:H0:μ=500
H1:μ≠500
查標準正態(tài)分布表,臨界值zα/2=±1.96
因為z=-3.33<-1.96,落入拒絕域,所以拒絕原假設,即樣本的平均每瓶重量與包裝線設計規(guī)格存在顯著差異,該設計規(guī)格不能接受。
如果樣本來自方差未知的正態(tài)總體,大樣本時依然可以采用Z統(tǒng)計量進行假設檢驗,未知的總體方差以樣本方差代替;小樣本時則檢驗統(tǒng)計量為:
如例6-16,若總體標準差未知,并且僅抽取25瓶進行檢驗,樣本標準差為5.8克,這時,檢驗統(tǒng)計量為:
查t分布表,tα/2(n-1)=±2.06
由于-2.06<-1.72<2.06,落入接受域,所以接受H0,即樣本的平均每瓶重量與包裝線設計規(guī)格不存在顯著差異,該設計規(guī)格可以接受。
如果總體不服從正態(tài)分布,或者不知道總體的分布形式,但具有方差σ2,則根據中心根限定理,在滿足大樣本的情況下,可以近似用Z統(tǒng)計量作為檢驗統(tǒng)計量。
若σ2未知,可用樣本方差S2代替。
2.兩個總體均值之差的假設檢驗。如果兩個樣本分別抽自兩個方差已知的正態(tài)總體,即,檢驗統(tǒng)計量為:
解:H0:μA=μB
H1:μA≠μB
根據已知條件,計算檢驗統(tǒng)計量
查正態(tài)分布表,臨界值zα/2=±1.96
因為-1.96<z=0.66<1.96,落入接受域,所以接受原假設,即有理由認為A、B兩廠生產的圓鋼平均抗拉強度不存在顯著差異。
若兩個樣本均為樣本量n≥30的大樣本,也可以近似用Z統(tǒng)計量進行檢驗。
解:根據題意,建立如下假設:
H0:μA=μB
H1:μA≠μB
根據已知條件,計算
查t分布表,得臨界值tα/2(n1+n2-2)=tα/2(18)=±2.10。
因為-2.1<t=0.06<2.1,落入接受域,所以接受原假設,即兩廠生產的圓鋼平均抗拉強度不存在顯著差異。
如果兩個樣本分別抽自方差未知的非正態(tài)總體或不知分布形式的總體,大樣本情況下,根據中心極限定理,可近似采用Z統(tǒng)計量進行檢驗:
(二)總體成數的假設檢驗
1.一個總體成數的假設檢驗。當樣本量足夠大時,可選擇檢驗統(tǒng)計量:
例6-19:在例6-2中,如果質量標準要求該種圓鋼抗拉強度的合格率不得低于80%,試確定這批圓鋼是否滿足標準(α=0.05)。
解:根據題意,建立如下假設:
H0:P≥80%
H1:P<80%
根據已知條件,計算
查正態(tài)分布表,得臨界值zα=-1.64。
因為z=1.41>-1.64,落入接受域,所以,接受原假設,即該批圓鋼能夠滿足標準。
2.兩個總體成數之差的假設檢驗。如果兩個樣本獨立地抽自兩個獨立的總體,在滿足大樣本的情況下,可選擇Z統(tǒng)計量進行檢驗:
例6-20:在例6-17中,若根據質量標準,抗拉強度小于30kg/mm2為不合格品,抽樣檢查結果在A廠的100件樣本中有5件不合格,B廠的100件樣本中不合格品為7件,問:若α=0.05,兩廠圓鋼抗拉強度合格率是否有差異?
解:H0:P1=P2
H1:P1≠P2
根據已知條件,計算檢驗統(tǒng)計量:
查標準正態(tài)分布表,得臨界值zα/2=±1.96。
由于-1.96<z=-0.60<1.96,落入接受域,所以接受原假設,即兩廠圓鋼抗拉強度合格率不存在顯著差異。
(三)總體方差的假設檢驗
如果總體X~N(μ,σ2),若要檢驗總體方差是否等于某一數值,可采用檢驗統(tǒng)計量:
例6-21:通過計算電子元件使用壽命的方差,可以了解該產品壽命指標的穩(wěn)定性。已知上季度某電子元件使用壽命的方差為5534,現從本季度生產的電子元件中隨機抽取40件進行壽命檢測,測得使用壽命的方差為5344。若α=0.05,問該電子元件壽命指標的穩(wěn)定性是否有顯著變化。
解:H0:σ2=5534
H1:σ2≠5534
查χ2分布表,得,由于23.654<χ2=37.66<58.12,所以接受原假設,即該電子元件壽命指標的穩(wěn)定性沒有顯著變化。
免責聲明:以上內容源自網絡,版權歸原作者所有,如有侵犯您的原創(chuàng)版權請告知,我們將盡快刪除相關內容。