視覺認知論
在人與計算機進行交互時,視覺是用戶使用的主要感官。人的視覺系統(tǒng)能完成許多復(fù)雜的信息處理功能。視覺問題是一個復(fù)雜的問題,對視覺的研究需要探索這樣一些問題:視覺系統(tǒng)如何獲得圖像豐富的信息,如何進行壓縮編碼,又如何在大腦中表示這些信息,最后又如何做出決策和行為。視覺運動處理研究表明人腦有運動處理的特長,并可通過訓(xùn)練來增強(Peterson,1994)。因此人們對動態(tài)現(xiàn)象的理解較容易,對靜態(tài)現(xiàn)象的理解則相對困難。所以視覺運動處理研究對時空地學(xué)可視化具有非常重要的意義。
1.人腦對信息的處理(認知)模型
認知心理學(xué)運用信息加工的觀點來研究認知活動,其研究范圍主要包括知覺、注意、表象、學(xué)習(xí)、記憶、思維和語言等心理過程。一種認知心理學(xué)理論認為人腦對信息處理由感官記錄(Sense Record)、短期記憶(Short Time Memory)、長期記憶(Long Time Memory)三個記憶存儲組成。在視覺信息處理中,這三種記憶存儲被稱為圖標記憶(Iconic Memory)、短期視覺記憶(STVM)和長期視覺記憶(LTVM)。
人類視覺信息處理是從圖標記憶開始的,信息存儲在感官中大約有500ms,足夠感官用來進行初始識別。圖標記憶是視網(wǎng)膜上的一種自然圖像,視網(wǎng)膜具有無限制的能力并且不受模式復(fù)雜性的影響。把信息從圖標記憶階段轉(zhuǎn)到STVM需要使用注意力,也就是人類辨別特殊信息排除其他信息的能力,這種能力以LTVM中存儲的信息為基礎(chǔ)。LTVM信息被用來猜測所看到的是什么,這種猜測可以控制注意力的過程。確切地說,視覺感知以模式識別為基礎(chǔ),視覺模式識別把圖標記憶中的信息與LTVM中的信息相匹配。目前主要有三個模式識別模型:模板匹配、特征檢測和符號描述。STVM被稱為視覺緩沖區(qū),可以被圖標記憶或LTVM激活,經(jīng)過“排演”的信息不被延遲地送到LTVM中。LTVM被稱為長期倉庫,其中的信息是不會被丟失的,所謂“遺忘”只不過是信息檢索出了問題。
認知是一個信息獲取、選擇和存儲的復(fù)雜過程。這一過程可以用圖2-11的模型來表達。人們周圍環(huán)境中的信息通過人的不同感覺器官來獲取和選擇,這些信息主要由聲音、語言等聽覺信息和圖形圖畫等視覺信息構(gòu)成。選擇后的信息被送到短期記憶中,短期記憶由控制機制、聲音語言存儲器和視覺信息存儲器構(gòu)成。短期記憶的容量是有限的,一般只能同時處理7±2個項目,如果信息沒有被增加或沒有被重復(fù),這些信息在幾秒鐘之后被控制機制消除;經(jīng)過重復(fù)和促進的信息則被送到長期記憶中,聲音語言信息創(chuàng)建一個文本基礎(chǔ),視覺信息則創(chuàng)建一個類似圖畫的基礎(chǔ),兩種信息的處理過程形成一個雙編碼系統(tǒng)。兩種編碼后的信息隨后被集成為思維模型或稱為心像模型。思維模型能夠處理各種信息之間的關(guān)系,它的形成與個人記憶中的現(xiàn)有知識和聯(lián)系點(Contact Point)有關(guān),現(xiàn)有知識和聯(lián)系點越多,思維模型則越容易被集成到長期記憶中去,現(xiàn)有知識可以促進思維模型的形成,長期記憶中的信息也通過思維模型來促進。
圖2-11 人的認知過程(信息處理)模型
(據(jù)Hasebrook,1995)
值得一提也很有意義的是,明顯的證據(jù)說明位置信息在LTVM中是不需要注意力和意識的,雖然我們可能有意識地來了解這種信息,但卻不可能有目的地把這些信息送到記憶中去。
2.人類信息處理的計算模型
在過去的20多年中,構(gòu)造人類信息處理的計算模型是認知心理學(xué)的一個重要領(lǐng)域,大量研究被集中在視覺感知的人類神經(jīng)模型上。這種模型有神經(jīng)模糊性特點,可以提供一種機制來模擬視覺信息處理的并行算法,很多心理學(xué)家提出了自己的理論,Marr理論是其中一個比較有特色的理論。
Marr(1982)認為感知是以“世界是真實的”假定為基礎(chǔ)的,這些假定具體包括“表面是光滑的”,視覺系統(tǒng)不是從經(jīng)驗中發(fā)現(xiàn)的,而是生來就有的。觀察Marr理論的一個重要部分是從視網(wǎng)膜上的圖像信息中構(gòu)造大量不同的再現(xiàn)(Representation)。第一個再現(xiàn)階段稱為“最初框架”,主要獲取視網(wǎng)膜圖像的二維結(jié)構(gòu);第二個階段稱為“2.5D框架”,描述平面是如何導(dǎo)向的;最后一個階段稱為“3D模型”,用以構(gòu)建空間目標的三維形狀。在這一理論的基礎(chǔ)上, Marr and Nishihara(1988)提出了目標識別理論,認為目標及其組成部分可以由無特點的圓錐體或柱體構(gòu)成,其各自的長度及軸的排列可用于目標識別,從視網(wǎng)膜上獲得圓錐體或圓柱體的外觀與不同目標種類相匹配,根據(jù)目標組成部分的數(shù)目和排列來區(qū)分所觀察的目標。
3.表象研究
表象(Mental Image)由記憶表象和想象表象構(gòu)成。心理學(xué)將表象和知覺聯(lián)系在一起,把已經(jīng)存儲(記憶中)的知覺信息的再現(xiàn)稱為記憶表象,將經(jīng)過加工改造而形成的新的形象稱為想象表象。為了充分揭示表象的特殊性和機制,心理學(xué)家考察了有關(guān)“心理旋轉(zhuǎn)”和“心理掃描”等具體的表象研究。
(1)表象的“心理旋轉(zhuǎn)”實驗:20世紀70年代,Shepard及其同事開展了“心理旋轉(zhuǎn)”的研究。將計算機生成的三維圖形對(圖2-12)呈現(xiàn)給被試者,被試者的任務(wù)是判定兩個圖形是否相同。圖形對有三種情況,一是兩個圖形相同而方位不同,其中一個相對于另一個在平面(紙張)上轉(zhuǎn)動了一定角度[圖2-12(a)],稱為平面對;第二種情況是圖形相同,但其中一個相對于另一個在與紙張垂直的平面上轉(zhuǎn)動一定角度,即在三維空間中作了轉(zhuǎn)動,稱為立體對[圖2-12(b)];第三種情況是兩個不同的圖形,它們是鏡像對稱的[圖2-12(c)]。實驗結(jié)果表明,無論是平面對還是立體對,如果兩個圖形的形狀和方位都相同,被試者只需要1s就能看出兩者是相同的;當(dāng)其中一個圖形轉(zhuǎn)動一個角度形成方位差,反應(yīng)時間增加,并且與方位差成正比。因此,Shepard等指出,“心理旋轉(zhuǎn)”的速率是相對穩(wěn)定的,每秒53°;同時表象不僅可以表征圖形的二維特征,也可以表征物體的三維結(jié)構(gòu),證明了“心理旋轉(zhuǎn)”的漸進性和空間性。
圖2-12 表象的“心理旋轉(zhuǎn)”實驗
(據(jù)Shepard等,1978)
(2)表象的“心理掃描”實驗:Kosslyn及其同事也在20世紀70年代初對表象進行了“心理掃描”的實驗研究,認為視覺表象中的客體同樣有大小、方位等的空間特性,是可以被“心理掃描”到的。他們要求被試者構(gòu)成一個視覺表象并加以審視,以確定其中的客體及其空間特性,記錄所需的時間。實驗表明視覺表象是類似圖畫的,表象包含空間信息、表象的各部分描述所表征的客體的對應(yīng)部分、所表象的客體各部分間的空間聯(lián)系保留在表象的相應(yīng)部分的空間聯(lián)系中;評定其主觀表象較小的客體要難于評定其主觀表象較大的客體,小的客體總不如大的客體容易觀察清楚。
(3)表象在人類認知中的重要作用:①表象與知覺的機能等價不僅會導(dǎo)致表象對知覺的干涉,而且會出現(xiàn)表象對知覺的促進;②圖像信息在表象系統(tǒng)中儲藏和加工,對于聯(lián)想學(xué)習(xí)和記憶具有重要的作用;③人在解決某些問題時,主要依賴于視覺表象操作和表象過程,有助于科學(xué)家、藝術(shù)家、機械設(shè)計師等的創(chuàng)造性的思維活動,而聽覺表象對于音樂家具有重要的意義。
4.視覺認知與信息技術(shù)
視覺認知心理學(xué)隨著認知心理學(xué)的興起而迅速發(fā)展起來,它以人的視覺信息處理過程為研究對象。廣義信息理論和符號邏輯學(xué)是視覺認知心理學(xué)的兩個理論基礎(chǔ)。信息技術(shù)的發(fā)展為視覺認知心理學(xué)的發(fā)展提供了堅實的研究與應(yīng)用手段。從概率統(tǒng)計論到泛函分析,從計算機分布系統(tǒng)到軟件工程,從邏輯推理到專家系統(tǒng),所有新興的信息技術(shù)為視覺認知心理學(xué)的研究提供了技術(shù)手段。視覺心理學(xué)的研究著重以模擬人復(fù)雜的視覺行為為出發(fā)點,有機地將知覺、注意、記憶、學(xué)習(xí)、表象、思維、概念形成、問題求解、語言、情緒、個性差異等行為聯(lián)系起來。視覺認知心理學(xué)主要研究內(nèi)容為影像中拓撲性質(zhì)、形狀輪廓、三維物體和運動物體及其內(nèi)在規(guī)律和行為過程的視覺化認知規(guī)律。
在傳統(tǒng)的地圖制作方法的低層視覺認知和以模擬左腦邏輯思維為主的視覺認知心理模型基礎(chǔ)上,加強模擬眼睛視網(wǎng)膜成像系統(tǒng)和右腦大規(guī)模神經(jīng)元并行地解決復(fù)雜而模糊視覺問題的生理機制,達到形象思維的能力,這樣就形成比較完整的視覺認知思維和想象功能,在最大程度上使人的復(fù)雜而模糊的視覺行為和計算機技術(shù)的強大計算功能融合起來,使人的視覺認知達到快速、精確、知識無遺忘等境界。
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請告知,我們將盡快刪除相關(guān)內(nèi)容。