利用計算機從遙感圖像識別植被類型的理論研究
利用計算機從遙感圖像識別植被類型的理論研究[1]
王 錚 梅安新 劉樹人 王學林
利用遙感圖像編制植被圖、監(jiān)測植被動態(tài)、分析以地植物為主體的生態(tài)環(huán)境,是近年來普遍采用的方法;采用計算機完成這一工作具有速度快、信息分析精度高、穩(wěn)定性好、便于與環(huán)境信息系統(tǒng)通訊等優(yōu)點,它正在被植被遙感工作者所普遍應用。然而目前利用計算機識別植被類型,分析植被信息的工作,尚少報導,這是因為計算機識別植被類型的成敗,很大程度上取決于從原始圖像提取特征信息的圖像處理工作和在此基礎上的模式識別工作,因為不適當的圖像處理,可能抑制或破壞植被信息,而不適當的模式識別技術,也可能產生錯誤的分類結果。后者的原因是多方面的,如概率分布函數估計錯誤、非線性問題采用了線性模型等。目前也有一些分類成功的報道,但多限于經驗式的,缺少植被遙感的理論分析。因此發(fā)展植被類型識別的基本理論模型,成了必要的工作。本文的目的就在于介紹這方面的探索。
作者選擇了昆明毗鄰地區(qū)為實驗區(qū),在區(qū)內研究了各種方案的可行性和獲取有關參數。選擇該區(qū)的原因是該區(qū)自然地理環(huán)境分異強烈,包括了中亞熱帶、北亞熱帶、暖溫帶和溫帶4種自然氣候帶,因而植被類型豐富,加上強烈的小地貌差異,植被類型隨地域變化快。這種特殊的復雜地理條件,有助于計算機識別植被的許多問題。試驗選擇的資料是泰國地面站提供的1985年2月18日的MSS圖像的CCT資料。圖像幾何誤差已由計算機作過精校正。為了合理選擇計算機處理模型和檢驗結果,作者與云南地理所有關同志作了三次野外考察。
一、植被信息恢復的模型研究
從傳感器得到的圖像,是整個地面景觀的圖像,它包括了植被、土壤、地貌以及“噪聲”等多種信息。植被遙感的首要任務是從普通的遙感圖像中增強或恢復植被信息。
植被信息的恢復,比較成功的是Tasseled Cap第二主因子矢量與SB、GV矢量之間的關系,結果發(fā)現在所有陸地樣區(qū)中,第一、第二主因子幾乎均與SB、GV矢量方向重合;可能有時第一主因子與GV重合,例如農田樣區(qū),也可能第二主因子方向與GV重合,例如中山山地混交林樣區(qū)。在16個陸地樣區(qū)中,地貌類型包括了中山山地、丘陵山地、石灰?guī)r裸巖山地、沖積湖積平原,植被類型包括針闊混交林、常綠闊葉林與落葉闊葉林、灌木林、灌木草叢、草叢以及不同的作物類型,如:蠶豆和小麥。這些地貌類型與植被類型的組合,構成了復雜的景觀類型。各種景觀類型在地物光譜特征方面,包括各類型各波段上直方圖分布范圍、正態(tài)概率分布逼近個數等,都有較大差異。但是實驗結果卻表明SB、GV與主因子矢量的重合性有驚人的一致性。表1給出了4個樣區(qū)的實驗結果。第一個樣區(qū)的地貌類型是中山山地,它包括的植被類型有針葉林(云南松)、次生的常綠闊葉林、落葉闊葉林等,光譜直方圖在正態(tài)概率紙上呈三段。第二個樣區(qū)是中山山地灌木草從景觀,在光譜直方圖正態(tài)概率紙上呈三段,但不同于樣區(qū)1。樣區(qū)3是丘陵山地環(huán)境,灌木林密布于本區(qū)而不同樣區(qū)2有明顯的草地出露,樣區(qū)的光譜直方圖在正態(tài)概率紙上呈二段。樣區(qū)4是石灰?guī)r基底的丘陵山地,稀疏的草叢隨機地散布乎其間,光譜直方圖呈一段式。4個樣區(qū)無一例外地表明GV方向幾乎就是景觀的某一主因子方向。這里我們從自然地理學的角度證明了GV作為植被信息特征的合理性。
表1 景觀主因子特征與SB、GV的關系
在常用的植物遙感模型中,規(guī)范差ND和波段R是著名的。分析它們的特點是有意義的。規(guī)范差為
這里ρN和ρr分別是近紅外和紅光波段反射率。
(3)式表明R與ND有某種等價性。利用GV、ND與葉面指數ND的經驗估計式,可以得到下列關系:
式中α估計值為0,c、e估計值為1.2,b為0.5/cosη,η為太陽高度角。
注意到c、e的估計值和b是小于1的正數,這時可知當ND較小時,GV比ND增長得慢,當ND較大時,GV比ND增長得快。換言之對GV來說它關于較大蓋度(或較強光合作用)的像元的植被狀況反映比ND敏感。
(6)式表明R比ND敏感,甚至比GV更敏感,這似乎表明R比GV優(yōu)良,其實圖像量化是給定在一定范圍的,由于R圖像量化灰階相對于蓋度增長得太快,結果很可能在較小蓋度時就出現接近最大灰階的情況,這樣對較大蓋度的植被狀況反映欠佳,甚至不能反映這種情況下的植被內部差異,同時由于圖像噪聲的存在,過于敏感的指標R會在較小蓋度的情況下,把隨機誤差增強,最后產生虛假的植被類型。與R不同,GV在低蓋度時增加得慢,這樣保證了不會很快接近最高量化灰階,它的敏感性次于R,對隨機噪聲有一定的抗干擾性,所以我們認為GV是總體上優(yōu)于ND和R的植被狀況遙感指標的。
Wall的植物亮度指標為〔8〕
式中,Bi為第i波段信號強度,n為波段數。由實驗我們發(fā)現對地貌巖性為代表的因子來說,變換的各波段權幾乎都位于(0.25,0.26),即接近是等權的。Wall模型是賦予各波段相等的一個權1來定義一個測度(實際上是數學上的范數),所以本質上講EB是地貌巖性控制的景觀特征的描寫,不是植被景觀的直接描寫,但由于地植物學研究的結果,地貌巖性景觀控制著或影響著植物群落的分異,所以EB是植被景觀的一種粗結構測度。
為了反映植被狀況的內部細微差異,使細節(jié)信息得以表露,本文建議采用最大離散度距離測度,這一測度使各植被類型信息特點在Bayes意義下具有最大距離,最后可以化作類似于K-L變換的線性變換,并按最大離散度選擇采用的變換式。在我們的實驗例子中,有
MD=0.561MSS 4-0.077MSS 5-0.658MSS 6+0.496MSS7
最后我們討論了各種植被信息恢復模型的相互關系,結果見表2。
表2 各種植被信息恢復模型的相關矩陣
表中EB2是EB的二次方。從表2可以看出MD與其他指標有不同的信息特點,這正是意料之中的,因為EB反映的是植被狀況的粗結構,ND對植被狀況不太敏感。GV與ND相關性也很差,這里由于整個研究區(qū)植被類型、蓋度差距很大,ND變化范圍大,它們之間的非線性關系就突出了。值得一提的是Galla在美國Lafayette的一個農場研究各種植物指標關系時發(fā)現ND與GV的相關系數達0.91。這里呈現了事實上的假象,因該研究區(qū)位于印第安納州,所謂大平原地區(qū),地貌及土壤類型單調,加上是農場經營,農作物以單一的玉米為主,所以ND和GV變化不大,它們的非線性關系在一個小的數值范圍內可用線性關系逼近;但是我國多山、農作物品種在小范圍內變化大,自然植被因生境變異大而結構復雜的條件下,各種模型之間的非線性關系就明顯了。這就表明一些國外的經驗公式未必適應我國情況,針對我國自然地理條件發(fā)展相應的模型是必要的。
用MD、EB2、GV礦和ND的不同組合合成的假彩色影像表明,這種經過理論分析而得到的植物信息圖像比標準假彩色片提供出了更大量的植被細節(jié)信息。例如,在農田環(huán)境中明顯地可識別出蠶豆、小麥、油菜及蔬菜、撂荒地,在標準假彩色片上,滇池原為一片黑色,而在新合成的圖像中滇池呈橙、紅、黑三色,分別表示沿岸水生植物帶、藻類生物污染地區(qū)和水面,山地的針葉林和闊葉林分別呈淺藍和紫紅色,而標準假彩色片上均呈紅色。
二、植被類型的計算機識別研究
在完成了植被特征信息恢復后,我們就得到了植被類型識別的基礎圖像,這種圖像可供計算機識別用。
要對植被特征圖像完成類型的機器識別,首先碰到的是采用何種識別方法。試驗工作表變換,規(guī)范差變換和波段比,以及Wall提出的植物亮度指標,其中Tasseled Cap變換的兩個分量SB和GV有著特別重要的意義。SB稱背景亮度,反映了景觀圖像的背景特征。從地理學上看,本質上是地貌巖性特征,因為它們控制了局部地區(qū)地理景觀的分異。另一特征GV與SB垂直,經驗證明它與植被的光合作用相關,稱作綠度。本文的工作就是要從理論上分析各植被特征恢復模型的優(yōu)良性,以提高圖像處理的科學性,有助于計算機在嚴格的地植物學基礎上識別植被類型。
首先一個地理景觀主要包括地貌和植被,至少遙感景觀圖像是這樣。這個景觀圖像可以看做由地貌巖性特征SB和植被特征組成的空間的矢量,后者是否就是綠度GV呢?因此我們選了樣區(qū),研究了樣區(qū)景觀圖像的因子分析表明采用監(jiān)督分類方法是不適應的,這主要表現在下面幾個困難上:
1.訓練樣區(qū)選擇困難。單一植物群落在圖像中的點一般較小,要在區(qū)內選擇一個樣區(qū)是十分困難的;樣區(qū)中又往往含有許多“野點”,野點的摻入會使分類器參數估計發(fā)生錯誤。根據統(tǒng)計決策理論,用正態(tài)分布的貝葉斯分類器,其“魯棒性”是較差的,參數估計錯誤可能使分類風險迅速變大,分類效果變壞。
2.采用貝葉斯決策,涉及光譜分布的分布函數形式,常用算法是采用正態(tài)分布函數的。我們的實驗工作卻發(fā)現,許多小單元在正態(tài)概率坐標圖上呈不穩(wěn)定狀態(tài),有人證實甚至在128×128這樣一個單元內,圖像的光譜統(tǒng)計分布已經更為接近X2分布或別的形式了。所以實際的分類工作者難于為分類器提供一個合理的算法和簡單的概率分布。
3.貝葉斯分類器要求輸入地物類型ωi出現的先驗概率P(ωi),這在一般情況下是未掌握的知識,經常的做法是設各種地物出現在各種地理環(huán)境中的概率是相等,顯然這與生態(tài)學關于優(yōu)勢種或優(yōu)勢種群的基本原理相矛盾,它忽視了地理環(huán)境對生態(tài)條件的分異作用。
針對上述困難,本文采用了ISODATA算法對(MD、EB2、GV、ND)圖像作非監(jiān)督分類,這一非監(jiān)督分類方法與常用的集類法、C-平均法相比具有了初步的人工智能的水平,是國外近年來頗受重視的方法,它的缺點是由于多次迭代,計算速度較慢。
對上述圖像分類的結果,發(fā)現了下面的現象,對(MD、EB2、GV、ND)實行ISODATA算法分類,與貝葉斯分類結果比較,更多的植被細節(jié)被分析了出來,例如在山地中,可以識別出針葉林、落葉闊葉林、常綠闊葉林和混交林,有的地方小片的竹林也有反映,灌木林與草地也明顯地分開,特別是那些石漠化土地(無植被)從草山草坡中檢測了出來。而采用貝葉斯分類器,卻只能分出針葉林、闊葉林、混交林、灌木林、草地—荒蕪地。局部地區(qū)的抽樣調查表明,局部環(huán)境內的樹種差異也有被識別出來的現象,這對于貝葉斯分類器來說幾乎不可能,因為訓練樣區(qū)是無法取得的。
另一方面,ISODATA分類卻使背景特征喪失了,地貌的控制作用很不明顯,不同地貌單元內的不同樹種可能被識別為同一地物,但這個缺陷可以配以地貌識別來克服。將上述圖像作K-L變換后再采用ISODATA算法分類,結果發(fā)現,新的分類結果在揭示植被分布的總體輪廓方面比原始圖像的分類結果為好,但細微結構喪失了,有的類型并成了一類,如落葉闊葉林與灌木林有混淆現象,常綠闊葉林也與針葉林有混為一類的現象,總之分類性能變差了。
試驗結果還表明,ISODATA算法占用機時間較多,完成一幅圖像(1 024×1 024像元、4特征圖像)的分類,約需在PDP-11主機上運算8.5h,這個時間約是最大似然比算法的5倍,最小距離算法的7倍。
三、結論與討論
研究表明,在植被類型的機器識別方面,有下面幾點內容是值得注意的:
1.GV特征是一個較好的反映植被信息的特征,它對圖像信息反映適中,本身是線性變換,處理方便。
2.各種恢復植被信息的模型之間的相關關系,因地理環(huán)境不同而異,在我國復雜的地理環(huán)境結構條件下,這種關系趨于復雜化。
3.對植被類型識別來說,由于我國地理環(huán)境分異大,土地利用形式復雜,監(jiān)督分類方法不太適合,而非監(jiān)督分類方法是較好的。
4.為了反映植被的細微結構,不宜對圖像作K-L變換,以免植被內部結構信息在這種處理過程中被壓縮而損失。
參考文獻
[1]云南農業(yè)區(qū)劃委員會.云南省不同氣候帶和坡度的土地面積.昆明:云南科學技術出版社,1987.
[2]李介谷,等.計算機模式識別技術.上海:上海交通大學出版社,1986.
[3]Edward,G.A.,etc..Light,Interception and Leaf Area Estimates.IEEE trans,1986.
[4]Huete,A.R..Separation of Soil-plant Spectral Mixtures by Factor Analysis.Remote Sensing:of Environment,1986,19(3):237-251.
[5]Asrar,G.E.,etc..Spectral Estimation of leaf Area Index.Remote Sensing of Enviro-nment,1985,17(1):1-12.
[6]Wall,S.l..Landsat-Based Inventory System for Agriculture in California.Remote Sensing of Environment,1984,14(1—3):267-278.
[7]Galla,K.P.,etc..Spectral Estimation of Canopy Light Interception Remote.Sensing of Environment,17(3):221-232.
[8]Crist,E.P.,etc..A Physically-Based Transformation of Thematic Mapper Data-The TM Tasseled Cap.IEEE trans.Geos,1984,GE—22(3),256-263.
[9]Berger.Statistical decision Theory.Springs-Verlag,Inc,1980.
[10]Lowitz,G.E..The Fourier Transform and Clustering.Pattern Recognition,1984,17(6),657-665.
[11]Ismall,M.A..Fuzzy C-Means.Pattern Recognition,1986,19(6):481-485.
【注釋】
[1]本文得到了云南省地理所盧培澤,云南計算中心高原、楊昌洪、陳國棟、王慶慶等同志的幫助。
免責聲明:以上內容源自網絡,版權歸原作者所有,如有侵犯您的原創(chuàng)版權請告知,我們將盡快刪除相關內容。