本體的分類與分類
3.1 本體概述
3.1.1 本體的分類
知識系統(tǒng)中存在不同種類的本體,根據(jù)不同的分類標(biāo)準(zhǔn),可以將本體分成不同的種類。Mizoguchi等人[2]根據(jù)語境相關(guān)和語境無關(guān)的分類標(biāo)準(zhǔn)將本體分為:領(lǐng)域本體、常識本體、元本體和任務(wù)本體。而Van Heijst等人[3]則將本體按概念結(jié)構(gòu)的數(shù)量和類型及概念的主題兩個維度來分類。若按第一個維度來分,本體可分為:術(shù)語本體、信息本體和知識建模本體;若按第二個維度來分,本體又可分為:應(yīng)用本體、領(lǐng)域本體、通用本體和表示本體。綜合上述有關(guān)本體的分類結(jié)果,知識系統(tǒng)的較常用的本體類型有[4]:
(1)知識表示本體(Knowledge Representation ontolotgies)
獲取用于基于框架語言的表示原語,這些原語包括類、子類、屬性、屬性值、關(guān)系和公理。典型的例子是Ontoligua項目中的Frame-Ontology。
(2)通用本體(General ontologies)
包含與事物、事件、時間、空間、因果關(guān)系、行為、功能等相關(guān)的詞匯。典型的通用本體是CYC本體。
(3)頂級本體(Top-Level ontologies/Upper Level ontologies
包含可以被其他本體使用的通用概念。例如,Sowa’s boolean lattice PANGLOSS、Penman Upper Level、CYC、Mikrokosmos、Guarino’s top level proposal。
(4)領(lǐng)域本體(Domain ontologies)
給定與一個領(lǐng)域的概念、概念之間的關(guān)系、原理和基本法則有關(guān)的詞匯。本研究中所構(gòu)建的農(nóng)學(xué)本體就屬于這種本體。
(5)任務(wù)本體(Task ontologies)
提供用于解決某一特定任務(wù)的術(shù)語,這個任務(wù)可以是領(lǐng)域無關(guān)的,也可以是領(lǐng)域有關(guān)的。
(6)領(lǐng)域——任務(wù)本體(Domain—Task ontologies)
只能在一個給定領(lǐng)域重用的任務(wù)本體。
(7)方法本體(Method ontologies)
為完成某一特定任務(wù)的具體推理過程所用到的概念及概念之間的關(guān)系提供定義。方法本體和領(lǐng)域本體通常用來定義PSM (problem-solving methods)。
(8)應(yīng)用本體(Application ontologies)
包含一個特定應(yīng)用系統(tǒng)建模的必要知識。
(9)元本體(Meta—ontologies)
元本體也被稱為類本體(Generic ontologies)或者核心本體(Core ontologies)。它定義了“part-of”關(guān)系和其上的屬性,這個關(guān)系可以用來說明一個裝置上的各種組件的集合,每個組件又可分解成子組件。元本體可以在不同的領(lǐng)域中被重用。
圖3-1 本體的分類圖[4]
3.1.2 本體的描述語言
本體描述語言是用特定的形式化語言對本體模型進(jìn)行描述,使得機(jī)器和用戶都能達(dá)到統(tǒng)一的理解?,F(xiàn)有本體表示語言可以分為兩類,一類是基于一階謂詞邏輯的,如框架邏輯(Frame-logic)等。第二類基于XML標(biāo)準(zhǔn)的、W3C推薦的本體語言,這些語言主要包括:XML、RDF/RDFS、DAML+OIL、OWL等。
1.XML[5][6]
XML是嚴(yán)格符合SGML的結(jié)構(gòu)化語言,其實現(xiàn)了文檔的顯示和數(shù)據(jù)分離,這種結(jié)構(gòu)化的數(shù)據(jù)易于使用、攜帶和傳遞,是Web數(shù)據(jù)交換的較好的語法格式。XML提供DTD、XML Schema對文檔結(jié)構(gòu)進(jìn)行有效性驗證,通過描述/約束文檔邏輯結(jié)構(gòu)實現(xiàn)數(shù)據(jù)的語義。XML對本體的描述,就是利用DTD或XML Schema對本體所表達(dá)的領(lǐng)域知識進(jìn)行結(jié)構(gòu)化定義,然后再利用XML文檔結(jié)構(gòu)與XML內(nèi)容之間的關(guān)系對本體知識進(jìn)行描述,從而提供對數(shù)據(jù)內(nèi)容的語義描述。
但是DTD自身描述能力、數(shù)據(jù)類型的支持、約束定義的能力是有限的,無法對XML實例文檔做出更細(xì)致的語義限制。因此,通過DTD表示的本體,無法表達(dá)概念間的繼承關(guān)系,XML Schema雖然解決了DTD存在的問題,例如定義了更為豐富的語法結(jié)構(gòu)、可以定義元素類型、提供了包含和繼承機(jī)制等,但是DTD、XML Schema為XML文檔提供的約束機(jī)制只是用限定XML文檔所用到的標(biāo)記和這些標(biāo)記之間的結(jié)構(gòu)關(guān)系,通過DTD和XML Schema可以解決對數(shù)據(jù)的詞匯和用途的說明,其語義仍然是隱含的。因此,XML所表示的本體是輕量級的本體,只能保證人們是用相同的詞匯,是一種較低層次的本體的應(yīng)用,本體中不包含語義信息。
2.RDF和RDFS[7][8]
W3C的資源描述框架(Resource Description Framework,RDF)為基于元數(shù)據(jù)的語義表示提供了基礎(chǔ),RDF為在Web上應(yīng)用系統(tǒng)間進(jìn)行機(jī)器可理解的信息交換提供了互操作能力。
RDF對資源描述基于如下思想:利用當(dāng)前現(xiàn)有的Web體系結(jié)構(gòu)中的標(biāo)識符URIs作為標(biāo)識符系統(tǒng)來標(biāo)識事物,用簡單的屬性(Property)以及屬性值(Value)來聲明資源(Resource),這里的資源指Web上任何可以被標(biāo)識的事物,可以創(chuàng)建URIs來引用聲明中需要被標(biāo)識的任何資源,例如,一份電子文檔、一個圖片、一個聲音文件等網(wǎng)絡(luò)可訪問資源;或者如人、公司、圖書館中的圖書等非網(wǎng)絡(luò)可訪問資源;或者如“作者”、“主席”這樣非物理存在的抽象概念。
RDF的基本構(gòu)造為陳述(或者叫做聲明,statement)了一個資源—資源具有的屬性—屬性值(主體—屬性—客體)的三元組。它表現(xiàn)的是一個數(shù)據(jù)模型,通俗地說一個陳述就是一個什么事物(資源)具有什么屬性(屬性),這個屬性是怎樣的屬性(屬性值)。為數(shù)據(jù)模型提供了簡單的語義,這些數(shù)據(jù)模型能夠用XML語法進(jìn)行表達(dá)。例如:描述“中國農(nóng)業(yè)遺產(chǎn)研究室位于南京”,用RDF圖來表示為:
圖3-2 RDF三元組示意圖
采用RDF語法表示為:
但是,RDF只是提供了一個用于領(lǐng)域無關(guān)的機(jī)制來描述元數(shù)據(jù),描述資源屬性及其相關(guān)關(guān)系,沒有提供按照類的機(jī)制描述信息資源、聲明屬性、描述屬性語義及其與資源之間的關(guān)系。也就是說RDF不能描述領(lǐng)域相關(guān)的語義關(guān)系,如同義詞、一詞多義等,因此,提出了RDFS。
RDFS是RDF的擴(kuò)展,在RDF基礎(chǔ)上增加了許多語義原語。提供了一種機(jī)制來定義相關(guān)領(lǐng)域的資源的屬性、類型及其關(guān)系,用來更進(jìn)一步增加對資源的描述能力。如,核心類rdfs:Resource、rdfs:Property、rdfs:Class;核心特性rdf:Type、rdfs:subClassOf、rdfs:subPropertyOf;核心約束rdfs:ConstraintResource、rdfs:ConstraintProperty、rdfs:domain、rdfs:range。
RDFS雖然提供了簡單的機(jī)器可理解語義模型,解決了RDF中存在的一些問題,如屬性、概念間的繼承關(guān)系,但是對語義描述的深度仍然不夠,只是進(jìn)一步提高了計算機(jī)處理的自動化程度,還無法表達(dá)概念間的合取、析取、不相關(guān)等關(guān)系。在RDFS建模的基礎(chǔ)上,針對RDFS在語義方面表示的不足,一些研究團(tuán)體提出了其他的本體表示語言XOL、OIL、DAML,在此基礎(chǔ)上,W3C發(fā)布了Web標(biāo)準(zhǔn)本體表示語言O(shè)WL,在機(jī)器間實現(xiàn)本體的共享和重用,實現(xiàn)對Web信息的智能化處理。
3.OWL[9][10]
OWL全稱Web Ontology Language,是W3C推薦的語義互聯(lián)網(wǎng)中本體描述語言的標(biāo)準(zhǔn)。它是從歐美一些研究機(jī)構(gòu)的一種結(jié)合性的描述語言DAML+OIL發(fā)展起來的,其中DAML來自美國的提案DAML-ONT,OIL來自歐洲的一種本體描述語言。在W3C提出的本體語言棧中,OWL處于最上層。
OWL能夠清晰地表達(dá)詞匯表中的詞條(term)的含義以及這些詞條之間的關(guān)系。而這種對詞條和它們之間的關(guān)系的表達(dá)就稱作Ontology。OWL相對XML、RDF和RDFSchema擁有更多的機(jī)制來表達(dá)語義,從而OWL超越了XML、RDF和RDFSchema僅僅能夠表達(dá)網(wǎng)上機(jī)器可讀的文檔內(nèi)容的能力。和XML Schema相比,OWL語言是知識表示,不是信息表示格式;和RDFS相比,OWL不僅可以用更復(fù)雜的方法描述類,如disjoint,而且擴(kuò)展了RDFS屬性,允許表示屬性的transitive、symmetric以及functional性質(zhì),表達(dá)了更強(qiáng)的概念語義信息,支持描述邏輯推理。OWL語言提供了三種表達(dá)能力不同的子語言O(shè)WL Lite、OWL DL、OWL Full,分別滿足不同的需要,見下表簡要描述。
表3-1 OWL的三個子語言描述
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請告知,我們將盡快刪除相關(guān)內(nèi)容。