連續(xù)型隨機(jī)變量的抽樣方法
連續(xù)型隨機(jī)變量的隨機(jī)抽樣有兩種情況:一是當(dāng)隨機(jī)變量的概率分布函數(shù)的反函數(shù)可以用顯式表示時(shí),可以采用直接抽樣方法;二是當(dāng)隨機(jī)變量的概率分布函數(shù)的反函數(shù)不能用顯式表達(dá)時(shí),可以用舍取抽樣方法。
7.4.1 直接抽樣方法
所謂直接抽樣方法是建立在下述定理基礎(chǔ)上的。
定理:設(shè)隨機(jī)變量ξ具有單調(diào)遞增連續(xù)分布函數(shù)F(x),則z=F(ξ)是[0,1]上均勻分布的隨機(jī)變量。
證:因F(x)是概率分布函數(shù),則F(x)在[0,1]上取值。又F(x)是單調(diào)遞增連續(xù)函數(shù),所以,當(dāng)ξ在[-∞,x]內(nèi)取值時(shí),隨機(jī)變量Z則在[0,F(xiàn)(x)]上取得值。因而,當(dāng)Z在[0, 1]上取得一個(gè)值z(mì)時(shí),至少有一個(gè)x滿足
z=F(x)=p{ξ≤x} (7-41)
由上式取反函數(shù)得
x=F-1(z)(7-42)
用F1(z)表示隨機(jī)變量Z的分布函數(shù),根據(jù)定義有
F1(z)=P{Z≤z} (7-43)
則
F1(z)=P{F(ξ)≤z}=P{ξ≤F-1(z)} (7-44)
將式(7-42)代入上式,有
F1(z)=P{ξ≤x} (7-45)
又Z在[0,1]上取值,則
上式即是在[0,1]上服從均勻分布的隨機(jī)變量的分布函數(shù)。定理由此得證。
由上述定理得知,若z為[0,1]上均勻分布的隨機(jī)變量,F(xiàn)(x)為某一隨機(jī)變量ξ的分布函數(shù),且單調(diào)遞增連續(xù),則
ξ=F1(z)(7-47)
是以F(x)為分布函數(shù)的隨機(jī)變量。這樣,就可以用均勻分布隨機(jī)抽樣產(chǎn)生ξ的抽樣。
例7.2 產(chǎn)生[a,b]上均勻分布的隨機(jī)變量ξ的隨機(jī)抽樣值。
解:ξ的分布函數(shù)F(x)為
則有
解得
ξ=F-1(z)=(b-a)z+a
將z的隨機(jī)抽樣值η代入上式,即可求出分布函數(shù)為F(x)的隨機(jī)變量ξ的隨機(jī)抽樣值XF(ξ):
XF(ξ)=F-1(η)=(b-a)η+a
7.4.2 舍取抽樣法
當(dāng)有的分布函數(shù)的反函數(shù)不存在顯式或是不容易求出時(shí),可以采用舍取法進(jìn)行抽樣。這種方法的實(shí)質(zhì)是從許多隨機(jī)數(shù)序列中選取一部分,使之成為具有給定分布的隨機(jī)抽樣值。那么,哪一些可舍,哪一些該取呢?
設(shè)隨機(jī)變量在有限區(qū)間[a,b]上取值,其分布密度函數(shù)在[a,b]上有限,即
f(x)≤f0 (7-48)
又f(x)定義于[a,b]區(qū)間,故有
這種情況如圖7-3所示,在[a,b]范圍內(nèi),曲線f(x)以下的面積R為1。顯然,要抽取的隨機(jī)變量可以理解為是分布在橫軸上的,問題也可以直觀地理解為橫軸上哪一點(diǎn)的函數(shù)值越大,哪一點(diǎn)被抽到的概率也就越大。這就意味著在如圖7-3所示的面積R中(陰影中)進(jìn)行均勻隨機(jī)投點(diǎn),就可以獲得ξ的隨機(jī)抽樣值。在投點(diǎn)過程中,落入R中的則取,落到R外的則舍,這是唯一的原則。
圖7-3 舍取抽樣
設(shè)投點(diǎn)值用S(x′,f′)表示,為了進(jìn)行隨機(jī)均勻投點(diǎn),可取兩隨機(jī)數(shù)列:{η1},{η2}。則
x′=(b-a)η1+a(7-49)
若
f′=f0η2(7-50)
f′<f(x′)(7-51)
或
f0η2<f[(b-a)η1+a](7-52)
成立,則說明點(diǎn)S(x′,f′)是落在R中的,x′即為所求的ξ的隨機(jī)抽樣值XF(ξ):
XF(ξ)=x′=(b-a)η1+a(7-53)
否則說明點(diǎn)S(x′,f′)在面積R之外,應(yīng)予以舍去。另取一組η1、η2,并看其是否滿足式(7- 51)或式(7-52),繼續(xù)作假設(shè)試驗(yàn)。由此可以得到服從分布密度函數(shù)為f(x)的隨機(jī)變量ξ的隨機(jī)抽樣序列。表7-6是常見分布隨機(jī)變量的抽樣公式。
表7-6 常見隨機(jī)變量的抽樣公式
以上是在假定ξ是在有限區(qū)間[a,b]內(nèi)取值的情況下進(jìn)行的。如果ξ不是在有限區(qū)間內(nèi)取值,那么,總可以選擇某一個(gè)有限區(qū)間[a1,b1],且
式中ε是任意小的正數(shù)。
然后,再利用上述方法在[a1,b1]內(nèi)進(jìn)行抽樣,即可得到所需的隨機(jī)抽樣序列。
由上述方法可以看到,在舍取抽樣的諸多投點(diǎn)中,有許多投點(diǎn)是舍去的。因而,在舍取抽樣中存在著一個(gè)效率問題。對(duì)舍取抽樣的效率B可以用下式來加以定義:
B=n/N(7-54)
式中:N為進(jìn)行隨機(jī)投點(diǎn)的總次數(shù);n為S點(diǎn)落入R之中的次數(shù)。
由于隨機(jī)投點(diǎn)是在以b-a為長(zhǎng),f0為高的矩形(見圖7-3)中均勻進(jìn)行的,因而,當(dāng)N足夠大時(shí),有顯然,B也表示每一次隨機(jī)投點(diǎn)落入面積R之中的概率。不同的隨機(jī)變量具有不同的密度分布函數(shù)f(x),a、b和f0也可能取不同的值。用舍取法進(jìn)行隨機(jī)抽樣時(shí)可以用B值來衡量其各自的抽樣效率。
例7.3 設(shè)隨機(jī)變量ξ具有分布密度函數(shù):
求其舍取抽樣B。
解:
由式(7-55)有
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。