濾波和預(yù)測(cè)
15.2.1 濾波和預(yù)測(cè)
讓我們從濾波開始。我們將證明濾波可以通過一種聯(lián)機(jī)的方式實(shí)現(xiàn):已知直到時(shí)刻t的濾波結(jié)果,可以很容易地根據(jù)新的證據(jù)et+1來(lái)計(jì)算時(shí)刻t+1的濾波結(jié)果。也就是說,存在某個(gè)函數(shù)f滿足:
P(Xt+1|e1 : t+1) = f (et+1, P(Xt|e1 : t))
這個(gè)過程通常稱為遞歸估計(jì)(recursive estimation)。我們可以把相應(yīng)的計(jì)算視為實(shí)際上由兩部分構(gòu)成:首先,將當(dāng)前的狀態(tài)分布由時(shí)刻t向前投影到時(shí)刻t+1;然后通過新的證據(jù)et+1進(jìn)行更新。這個(gè)兩步的過程能夠很容易得到:
P(Xt+1|e1 : t+1) = P(Xt+1|e1 : t, et+1) (證據(jù)分解)
= α P(et+1|Xt+1, e1 : t)P(Xt+1|e1 : t) (使用貝葉斯法則)
= α P(et+1|Xt+1) P(Xt+1|e1 : t) (根據(jù)證據(jù)的馬爾可夫特性)
在這里以及貫穿本章,α 都表示一個(gè)歸一化常數(shù)以保證所有概率的和為1。式中的第二項(xiàng),P(Xt+1|e1 : t)表示的是對(duì)下一個(gè)狀態(tài)的一個(gè)單步預(yù)測(cè),而第一項(xiàng)則通過新證據(jù)對(duì)其進(jìn)行更新;注意P(et+1|Xt+1)是從傳感器模型中直接得到的?,F(xiàn)在我們可以通過對(duì)當(dāng)前狀態(tài)Xt進(jìn)行條件化,得到下一個(gè)狀態(tài)的單步預(yù)測(cè)結(jié)果:
在這個(gè)求和式中,第一個(gè)因子就是轉(zhuǎn)移模型,第二個(gè)因子則是當(dāng)前狀態(tài)分布。因此,我們得到了所想要得到的遞歸公式。我們可以認(rèn)為濾波估計(jì)P(Xt|e1 : t)是沿著變量序列向前傳播的“消息”f1 : t,它在每次轉(zhuǎn)移時(shí)得到修正,并根據(jù)每個(gè)新的證據(jù)進(jìn)行更新。這個(gè)過程是:
f1 : t+1= α FORWARD(f1 : t, et+1)
其中函數(shù)FORWARD實(shí)現(xiàn)了公式(15.3)中描述的更新過程。
當(dāng)所有的狀態(tài)變量都是離散的,每次更新所需要的時(shí)間就是常數(shù)(也就是說,不依賴于t),并且所需要的空間也是常數(shù)。(當(dāng)然,這個(gè)常數(shù)取決于狀態(tài)空間的大小以及問題中的特定類型的時(shí)序模型)。如果一個(gè)存儲(chǔ)器有限的智能體要在一個(gè)無(wú)界的觀察序列上記錄當(dāng)前的狀態(tài)分布,更新所需的時(shí)間和空間都必定是常數(shù)。
讓我們以前面基本的雨傘世界為例說明這個(gè)兩步濾波過程(參見圖15.2)。我們假設(shè)在觀察序列開始之前,關(guān)于第 0 天的天氣是否下雨,我們的警衛(wèi)已經(jīng)有一些先驗(yàn)的信度。讓我們假設(shè)這個(gè)概率為P(R0) = <0.5, 0.5>。現(xiàn)在我們處理兩次觀察結(jié)果如下:
在第1天,傘出現(xiàn)了,所以U1= true。從t = 0到t = 1的預(yù)測(cè)結(jié)果為:
根據(jù)t = 1時(shí)刻的證據(jù)可將其更新,得到:
在第2天,雨傘又出現(xiàn)了,則有U2= true。由t = 1到t = 2的預(yù)測(cè)結(jié)果為:
根據(jù)t = 2 時(shí)刻的證據(jù)將其更新,得到:
直觀上看,由于降雨的持續(xù),下雨的概率從第1天到第2天提高了。習(xí)題15.2(a)要求你進(jìn)一步研究這個(gè)趨勢(shì)。
預(yù)測(cè)的任務(wù)可以被簡(jiǎn)單地視為沒有增加新證據(jù)的條件下的濾波。事實(shí)上,濾波過程中已經(jīng)合并了一個(gè)單步預(yù)測(cè)的結(jié)果,并且根據(jù)對(duì)時(shí)刻t+k的預(yù)測(cè)就能夠很容易地推導(dǎo)出對(duì)時(shí)刻t+k+1的狀態(tài)的遞歸計(jì)算過程如下:
自然地,這個(gè)計(jì)算只涉及轉(zhuǎn)移模型而與傳感器模型無(wú)關(guān)。
考慮在我們對(duì)越來(lái)越久的未來(lái)進(jìn)行預(yù)測(cè)時(shí)可能發(fā)生什么事情是非常有意思的。習(xí)題15.2(b)表明,是否下雨的預(yù)測(cè)結(jié)果分布會(huì)收斂到一個(gè)不動(dòng)點(diǎn)?0.5, 0.5?,之后就一直保持不變。這就是由轉(zhuǎn)移模型所定義的馬爾可夫過程的穩(wěn)態(tài)分布。(參見第14.5.2節(jié)中“MCMC的工作機(jī)理”。)關(guān)于這個(gè)分布的特性以及混合時(shí)間——粗略地說,就是達(dá)到這個(gè)不動(dòng)點(diǎn)需要花費(fèi)的時(shí)間——我們已經(jīng)有了很多了解。從現(xiàn)實(shí)角度說,對(duì)真實(shí)狀態(tài)進(jìn)行時(shí)間步數(shù)長(zhǎng)度超過混合時(shí)間的小片段的預(yù)測(cè)是注定要失敗的。轉(zhuǎn)移模型中的不確定性越多,混合時(shí)間就越短,未來(lái)也就越模糊。
除了濾波和預(yù)測(cè)以外,我們還可以利用一種前向遞歸的方法對(duì)證據(jù)序列P(e1: t)的似然進(jìn)行計(jì)算。如果我們想要比較兩個(gè)可能產(chǎn)生相同證據(jù)序列的時(shí)序模型,這就是一個(gè)很有用的量。例如在第15.6節(jié)中,我們比較了可能產(chǎn)生相同發(fā)音序列的不同單詞。在這個(gè)遞歸過程中我們用到一種似然消息l1 : t= P(Xt, e1 : t)。下式的證明是一個(gè)簡(jiǎn)單的練習(xí):
l1:t+1=FORWARD(l1:t,et+1)
計(jì)算出l1 : t之后,我們通過對(duì)Xt的求和消元得到實(shí)際似然值:
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。