語義網(wǎng)的基礎(chǔ)和核心
1.3 語義網(wǎng)的基礎(chǔ)和核心
1.3.1 語義網(wǎng)的基礎(chǔ)
通過對(duì)語義網(wǎng)體系結(jié)構(gòu)各層含義以及它們之間邏輯關(guān)系的分析,可以看出該體系結(jié)構(gòu)所體現(xiàn)的語義網(wǎng)的基礎(chǔ)和核心。語義網(wǎng)的基礎(chǔ)包括三個(gè)方面,即技術(shù)基礎(chǔ)、知識(shí)基礎(chǔ)和邏輯基礎(chǔ)。
·技術(shù)基礎(chǔ)
語義網(wǎng)體系結(jié)構(gòu)各層的內(nèi)容共同構(gòu)成了語義網(wǎng)的技術(shù)基礎(chǔ)。該體系結(jié)構(gòu)的每一層都包含了為實(shí)現(xiàn)語義網(wǎng)構(gòu)想所必需的一系列技術(shù),不同的技術(shù)層完成不同的功能。簡(jiǎn)單地說,Unicode和URI技術(shù)層負(fù)責(zé)完成Web資源的編碼和定位;XML+NS+xmlschema技術(shù)層負(fù)責(zé)提供結(jié)構(gòu)化的語法;資源描述和本體層負(fù)責(zé)Web上的數(shù)據(jù)、資源和知識(shí)的表示;邏輯、證明和信任層負(fù)責(zé)提供語義網(wǎng)所需要的規(guī)則、推理和驗(yàn)證。各層逐級(jí)擴(kuò)展,相互融合、補(bǔ)充,為實(shí)現(xiàn)語義網(wǎng)構(gòu)想提供了堅(jiān)實(shí)的技術(shù)基礎(chǔ)。
·知識(shí)基礎(chǔ)
從抽象的觀點(diǎn)看,語義網(wǎng)就像是一個(gè)大的知識(shí)表現(xiàn)系統(tǒng)。語義網(wǎng)可以描述三個(gè)層次的知識(shí)類型:事實(shí)性知識(shí)、術(shù)語知識(shí)和推理知識(shí)。
事實(shí)性知識(shí)是對(duì)客觀實(shí)在的簡(jiǎn)單陳述,如由XML標(biāo)簽描述的信息、由RDF三元組描述的一個(gè)簡(jiǎn)單陳述等,這類知識(shí)簡(jiǎn)單清晰、一目了然。
術(shù)語知識(shí)是指由本體所描述的關(guān)于概念以及它們之間關(guān)系的語義信息。術(shù)語知識(shí)可以描述比事實(shí)性知識(shí)更加復(fù)雜的語義和對(duì)象信息。對(duì)于開放式的Web而言,它更加適合描述那些不同種類、分布式的結(jié)構(gòu)化或半結(jié)構(gòu)化信息。
推理知識(shí)是指那些隱藏在事實(shí)性知識(shí)或術(shù)語知識(shí)之中的需要借助一定的推理規(guī)則才能獲得的隱性知識(shí)。例如,對(duì)于事實(shí)性知識(shí)“Nimo的父親是Tom”和“Tom和Jack是兄弟”,雖然我們可以很容易地推斷出Jack是Nimo的叔叔,但對(duì)于計(jì)算機(jī)而言,只有通過相應(yīng)的規(guī)則定義才能得出這一推理知識(shí)。
·邏輯基礎(chǔ)
只有通過形式化的方法才能顯性地揭示和描述語義網(wǎng)中的語義,因此必須借助強(qiáng)有力的形式化工具——邏輯。實(shí)際上,語義網(wǎng)的描述語言包括RDF和OWL都可以看做是謂詞邏輯的特殊形式,因?yàn)樗鼈兣c謂詞邏輯之間以邏輯公理的形式存在著語義上的對(duì)應(yīng)關(guān)系。其核心是為了實(shí)現(xiàn)機(jī)器的“理解與處理”。在語義網(wǎng)的三個(gè)基礎(chǔ)層面中,技術(shù)基礎(chǔ)是該體系結(jié)構(gòu)所直接體現(xiàn)的基礎(chǔ)層面;知識(shí)基礎(chǔ)和邏輯基礎(chǔ)則是隱藏在該體系結(jié)構(gòu)中間接體現(xiàn)的深層次的基礎(chǔ)層面。語義網(wǎng)將在網(wǎng)頁中加入方便機(jī)器“理解和處理”的內(nèi)容,并為人們提供各種智能服務(wù)。因此,語義網(wǎng)的核心就是對(duì)語義的揭示與表達(dá)。
1.3.2 語義網(wǎng)實(shí)現(xiàn)的關(guān)鍵技術(shù)
(1)元數(shù)據(jù)獲取
目前,Web內(nèi)容是按照讓人讀懂而不是讓機(jī)器讀懂的方式組織的,Web語言主要是HTML,HTML只負(fù)責(zé)數(shù)據(jù)的顯示方式而不關(guān)心數(shù)據(jù)的內(nèi)容。元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),它的作用是以一種機(jī)器可以處理的方式來描述Web的內(nèi)容。比如Web中一篇文章的標(biāo)題用<標(biāo)題>標(biāo)記,文章的作者用<作者>標(biāo)記,文章的內(nèi)容用<段落>標(biāo)記,那么標(biāo)記<標(biāo)題>、<作者>、<段落>就是Web中這篇文章的元數(shù)據(jù)。XML是目前使用最多的元數(shù)據(jù)表示語言,它允許各組織和個(gè)人建立適合自己需要的標(biāo)記集合(元數(shù)據(jù)集合),并且這些標(biāo)記可以迅速地投入使用。
(2)本體
用XML表示的元數(shù)據(jù)可以由各組織和個(gè)人建立,在Web中就存在同一個(gè)元數(shù)據(jù)表示不同的含義和不同的元數(shù)據(jù)表示相同含義的問題,語義Web采用本體技術(shù)來解決這一問題。本體是領(lǐng)域共享概念的明確的形式化規(guī)范說明。
不同的領(lǐng)域和應(yīng)用根據(jù)領(lǐng)域知識(shí)建立起自己的本體,即用本體描述語言描述共享概念及概念之間的關(guān)系,使這些概念表示明確的語義。
本體中的主要元素包括概念(也稱類)、屬性、實(shí)例、關(guān)系和公理。概念是共享概念的定義,屬性用來描述概念所具備的性質(zhì),實(shí)例是概念的具體化,是符合某個(gè)概念屬性的對(duì)象,關(guān)系用來描述不同概念之間的相互聯(lián)系,公理是領(lǐng)域中的規(guī)則。
W3C根據(jù)技術(shù)發(fā)展,提出了針對(duì)語義Web的本體語言棧。由下向上分別是RDF、OIL(Ontology Inference Layer)、DAML (DARPA Agent Markup Language)以及OWL。目前OWL是W3C推薦的標(biāo)準(zhǔn)。RDF模式RDL提供了定義詞匯表,是一種分類的結(jié)構(gòu),RDF-S對(duì)描述資源的元數(shù)據(jù)進(jìn)行約束,從而擴(kuò)展了RDF的表達(dá)能力。OIL是RDFS的一個(gè)擴(kuò)展,通過XML的文檔類型定義來增加定義完善的語法實(shí)現(xiàn),DAML是Web本體論的擴(kuò)展,允許語言表達(dá)規(guī)則。OWL是目前W3C組織推薦的本體描述語言,其目的在于提供一種語言以描述嵌在Web文檔和應(yīng)用中的類及這些類之間的關(guān)系。OWL相對(duì)于XML和RDFS擁有更多的機(jī)制來表達(dá)語義,從而超越了XML和RDFS僅僅能夠表達(dá)網(wǎng)上機(jī)器可讀的文檔內(nèi)容的能力。
本體的研究是人工智能長(zhǎng)期進(jìn)行的一項(xiàng)難題,其中本體的自動(dòng)構(gòu)建、不同本體之間的匹配、本體的自動(dòng)演化問題是近幾年本體研究的熱點(diǎn),也是語義Web研究中的熱點(diǎn)問題。
(3)邏輯
邏輯提供了知識(shí)的形式化表示方法,也提供了從已知的知識(shí)推出未知知識(shí)的推理機(jī)制。利用邏輯推理,我們可以知道本體所表示的知識(shí)庫中隱含的知識(shí),隱含的關(guān)系,以及判斷本體中的知識(shí)是否互相沖突,檢驗(yàn)本體的一致性。描述邏輯(Description Logic)是本體描述語言O(shè)WL的邏輯基礎(chǔ),它是一階謂詞邏輯的可判定子集,能夠提供可判定的推理服務(wù),并且具有語義特征。在經(jīng)過二十多年的研究與發(fā)展之后,描述邏輯已經(jīng)基本趨于成熟并走向應(yīng)用,它是知識(shí)表示的形式化工具。但是描述邏輯主要還只能處理靜態(tài)的知識(shí),在對(duì)動(dòng)態(tài)世界的表示與推理上卻無能為力,尤其是對(duì)智能主體的內(nèi)部知識(shí)庫的表示顯得乏力,也不能對(duì)服務(wù)的動(dòng)態(tài)性與交互性進(jìn)行刻畫。動(dòng)態(tài)邏輯最開始是用來進(jìn)行程序正確性驗(yàn)證的,后來人們也用它來對(duì)動(dòng)態(tài)世界進(jìn)行表示與推理,有的也用在邏輯程序設(shè)計(jì)上。它們能對(duì)動(dòng)作、狀態(tài)、動(dòng)態(tài)關(guān)系進(jìn)行較好的刻畫,在靜態(tài)知識(shí)上的表達(dá)力卻很弱,且推理較為復(fù)雜。如何將動(dòng)態(tài)與靜態(tài)結(jié)合起來,這是需要研究的關(guān)鍵問題。
(4)智能主體
智能主體是分布式環(huán)境下軟件智能化的重要技術(shù)。自20世紀(jì)50年代就已經(jīng)提出,但真正的發(fā)展是在20世紀(jì)80年代之后,在20世紀(jì)90年代成為研究的高潮,直到現(xiàn)在仍然是人工智能研究的熱點(diǎn)?,F(xiàn)在關(guān)于智能主體的研究主要側(cè)重在以下幾個(gè)方面:主體的認(rèn)知模型和理論、多主體系統(tǒng)的體系結(jié)構(gòu)、主體的協(xié)作與協(xié)商、面向主體的軟件方法學(xué)以及主體技術(shù)的應(yīng)用等。經(jīng)過二十多年的研究,主體的理論與技術(shù)有了長(zhǎng)足的發(fā)展,已經(jīng)在很多領(lǐng)域中得到了應(yīng)用。而對(duì)于用戶來講,語義網(wǎng)應(yīng)該提供一種豐富完善的服務(wù),一種在知識(shí)表示與推理之上的服務(wù),這些服務(wù)由具有智能的主體來提供。
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。