多語(yǔ)種敘詞本體的構(gòu)建
4.4 多語(yǔ)種敘詞本體的構(gòu)建
敘詞表對(duì)于構(gòu)建表示和檢索信息的主題索引具有十分重要的作用。目前國(guó)際多語(yǔ)種信息的交流越來(lái)越廣泛,需要多語(yǔ)種敘詞表來(lái)進(jìn)行多語(yǔ)種標(biāo)引和檢索工作。這樣用戶就可以用母語(yǔ)或至少用其所熟悉的一種語(yǔ)言來(lái)進(jìn)行信息檢索等。因此編制多語(yǔ)種敘詞對(duì)促進(jìn)世界范圍的信息交流具有重要作用。
多語(yǔ)種敘詞表是在普通敘詞表的術(shù)語(yǔ)及關(guān)系中,加入了不同語(yǔ)種的映射。本體是“一個(gè)概念模型的明確的規(guī)范說(shuō)明”,在應(yīng)用上,本體對(duì)概念及其關(guān)系的描述更加精細(xì),這一點(diǎn)特別適合于多語(yǔ)種的映射。
研究敘詞表新的構(gòu)建理論與新的應(yīng)用模式,直接將敘詞表構(gòu)建成敘詞本體,有別于目前的主流研究思路,對(duì)促進(jìn)本學(xué)科領(lǐng)域的同類(lèi)理論研究有重要學(xué)術(shù)參考價(jià)值。按照上一節(jié)所提出的敘詞本體的構(gòu)建方法,本節(jié)以一個(gè)實(shí)驗(yàn)系統(tǒng),即結(jié)合《中國(guó)圖書(shū)館分類(lèi)主題詞表》和《管理科學(xué)主題詞表》中的情報(bào)學(xué)領(lǐng)域敘詞來(lái)具體構(gòu)建多語(yǔ)種敘詞本體,從而詳細(xì)地闡述敘詞本體的建模過(guò)程。
4.4.1 確定多語(yǔ)種敘詞本體的應(yīng)用目的
構(gòu)建多語(yǔ)種敘詞本體,完全保留敘詞表的功用,同時(shí)又全面地利用本體理論的研究成果,使之成為有效的跨語(yǔ)言語(yǔ)義詞典,成為一種知識(shí)共享工具,極大地拓展應(yīng)用領(lǐng)域。
多語(yǔ)種敘詞本體可以成為跨語(yǔ)言信息檢索的語(yǔ)料庫(kù),實(shí)現(xiàn)多語(yǔ)種信息的高效組織,提高用戶檢索的查全率和查準(zhǔn)率。多語(yǔ)種敘詞表也可以作為各個(gè)聯(lián)機(jī)數(shù)據(jù)庫(kù)的語(yǔ)料庫(kù)。各聯(lián)機(jī)數(shù)據(jù)庫(kù)服務(wù)公司可以利用多語(yǔ)種敘詞表來(lái)擴(kuò)展他們的業(yè)務(wù),使在用戶對(duì)國(guó)內(nèi)外期刊會(huì)議論文都有需求的情況下,輸出滿足用戶需求的國(guó)內(nèi)外命中的文獻(xiàn)。
4.4.2 多語(yǔ)種敘詞本體的整體設(shè)計(jì)
(1)設(shè)計(jì)概念范圍
經(jīng)過(guò)相關(guān)的信息收集及需求分析,結(jié)合實(shí)際情況,筆者選取了情報(bào)學(xué)領(lǐng)域?yàn)榻⒍嗾Z(yǔ)種敘詞本體的對(duì)象。通過(guò)構(gòu)建情報(bào)學(xué)敘詞本體,探索、認(rèn)識(shí)情報(bào)學(xué)學(xué)科的規(guī)律,為情報(bào)學(xué)敘詞表、本體服務(wù)提供可以借鑒的框架和成果。整理現(xiàn)有的情報(bào)學(xué)知識(shí)體系,發(fā)現(xiàn)其中的缺陷與不足。利用本體的思想和方法可以重新檢視知識(shí)體系,并且對(duì)其中的所有部分都進(jìn)行嚴(yán)格的邏輯驗(yàn)證,從而發(fā)現(xiàn)現(xiàn)有知識(shí)體系中應(yīng)當(dāng)涉及但未能涉及的部分以及體系中存在的邏輯謬誤,使得學(xué)科體系結(jié)構(gòu)更為合理化。
(2)開(kāi)發(fā)工具的選擇(Protégé)
一個(gè)良好的本體編輯工具應(yīng)能在本體建模過(guò)程中提供書(shū)寫(xiě)本體、一致性檢查、可視化、查詢、推理,以及將建模結(jié)果轉(zhuǎn)換為不同本體語(yǔ)言表示格式等功能。
目前國(guó)際上已經(jīng)有許多本體的建模工具,能夠自動(dòng)地生成各種不同形式的本體語(yǔ)言。如Ontolingua、OntoSaurus、Protégé、KAON、0ilEd等工具。其中由斯坦福大學(xué)醫(yī)學(xué)院開(kāi)發(fā)的Protégé,它是用Java開(kāi)發(fā)的一個(gè)開(kāi)放源碼的本體編輯器。Protégé有良好的用戶界面,容易學(xué)習(xí)使用,支持多重繼承,對(duì)新數(shù)據(jù)進(jìn)行一致性檢查,并且具有很強(qiáng)的可擴(kuò)展性。
由于Protégé所具有的優(yōu)點(diǎn),它基本上成為國(guó)內(nèi)外眾多本體研究機(jī)構(gòu)的首選工具。在我們的本體編碼過(guò)程中選擇Protégé作為本體建模工具,用來(lái)構(gòu)建初始的敘詞本體。
(3)本體描述語(yǔ)言的確定(OWL)
本體的描述語(yǔ)言比較多,如XML,XML Schema,RDF,RDF Schema。其中XML(http://www.w3.org/XML/)提供了一種結(jié)構(gòu)化文檔的表層語(yǔ)法,但沒(méi)有對(duì)這些文檔的含義施加任何語(yǔ)義約束;而XML Schema(http://www.w3.org/XML/Schema)是一個(gè)約束XML文檔結(jié)構(gòu)和為XML擴(kuò)充了數(shù)據(jù)類(lèi)型的語(yǔ)言; RDF(http://www.w3.org/TR/2002/WD-rdf-concepts-20021108)是一個(gè)描述RDF資源的屬性(property)和類(lèi)(class)的詞匯表,提供了關(guān)于這些屬性和類(lèi)的層次結(jié)構(gòu)的語(yǔ)義。RDF是一個(gè)三元組,用(資源,資源所具有的屬性,屬性值,即主體-屬性-客體)來(lái)表示。RDF表現(xiàn)的是一個(gè)數(shù)據(jù)模型,描述事物也即資源的屬性,以及屬性所具備的值。而OWL比RDF的含義更廣,是RDF的擴(kuò)張,即為我們提供了更廣泛的定義RDFS詞匯的功能,可以定義詞匯之間的關(guān)系,類(lèi)與類(lèi)之間的關(guān)系,屬性與屬性之間的關(guān)系等。它旨在用于那些需要由應(yīng)用程序而不是由人類(lèi)來(lái)處理文檔中信息的情形。OWL可被用來(lái)明確表示詞匯表中術(shù)語(yǔ)的含義以及術(shù)語(yǔ)間的關(guān)系。如此表示的術(shù)語(yǔ)及術(shù)語(yǔ)間關(guān)系被稱為本體(ontology)。OWL較之于XML,XML Schema,RDF,RDF Schema添加了更多的用于描述屬性和類(lèi)的詞匯,例如類(lèi)之間的不相交性(disjointness),基數(shù)(cardinality,剛好一個(gè))、等價(jià)性、屬性的更豐富類(lèi)型、屬性特征(例如對(duì)稱性)以及枚舉類(lèi)型(enumerated classes)。因此在表達(dá)含義和語(yǔ)義方面,OWL比XML,RDF和RDFS有更多的表達(dá)手段,在Web上表達(dá)機(jī)器可理解內(nèi)容的能力也比這些語(yǔ)言強(qiáng)。由于OWL的這種優(yōu)勢(shì),我們的敘詞本體采用OWL語(yǔ)言來(lái)描述本體。
本書(shū)第2章中介紹過(guò)網(wǎng)絡(luò)本體語(yǔ)言的三個(gè)子語(yǔ)言: OWL Lite、OWL DL和OWL Full。這三個(gè)語(yǔ)言的表達(dá)能力和推理能力是逐漸增強(qiáng)的。這里在構(gòu)建敘詞本體選擇的是OWL DL。OWL DL包含了所有網(wǎng)絡(luò)本體語(yǔ)言的元素,在這三個(gè)子語(yǔ)言中擁有較強(qiáng)的表達(dá)性卻又不失計(jì)算力,很符合本研究的要求。因?yàn)楸疚倪M(jìn)行本體構(gòu)建的目的是為了更準(zhǔn)確、更完備地表達(dá)領(lǐng)域知識(shí)。所以語(yǔ)言的表達(dá)能力非常重要。OWL DL符合描述邏輯,同時(shí)又不失計(jì)算完整性,并能進(jìn)行推理。綜合考慮,OWL DL最符合需求。
(4)多語(yǔ)種構(gòu)建方案的確定
根據(jù)前面對(duì)于多語(yǔ)種映射方案的討論,這里將兩種構(gòu)建方法的實(shí)現(xiàn)過(guò)程都介紹給讀者,以便根據(jù)具體項(xiàng)目的需求予以選擇。構(gòu)造方法的不同對(duì)后面敘詞本體的演化機(jī)制有著很大的影響,方案的實(shí)現(xiàn)過(guò)程將在后面章節(jié)里面詳細(xì)說(shuō)明。
(5)相關(guān)原則
敘詞本體的創(chuàng)建是一個(gè)工程問(wèn)題,需要科學(xué)準(zhǔn)則去指導(dǎo)這個(gè)創(chuàng)建過(guò)程。人們?cè)诳偨Y(jié)已有成功和失敗經(jīng)驗(yàn)基礎(chǔ)上,歸納出一些有用的本體創(chuàng)建準(zhǔn)則,用于指導(dǎo)創(chuàng)建。韓韌、黃永忠等學(xué)者在《OWL本體構(gòu)建方法的研究》中曾提到,最有影響的是T.R.Gruber在1995年提出了5條準(zhǔn)則:
①明確性和客觀性:本體應(yīng)用自然語(yǔ)言對(duì)術(shù)語(yǔ)給出明確客觀的語(yǔ)義定義。
②完整性:所給出的定義是完整的,能表達(dá)特定術(shù)語(yǔ)的含義。
③一致性:知識(shí)推理產(chǎn)生的結(jié)論與術(shù)語(yǔ)本身的含義不會(huì)產(chǎn)生矛盾。
④最大單項(xiàng)可擴(kuò)展性:向本體中添加通用或?qū)S玫男g(shù)語(yǔ)時(shí),通常不需要修改已有的內(nèi)容。
⑤最少約束:對(duì)待建模對(duì)象應(yīng)該盡可能少地列出約束限定條件。
實(shí)際上,這5條設(shè)計(jì)準(zhǔn)則在使用過(guò)程中往往需要進(jìn)行權(quán)衡,難以全部滿足。
4.4.3 詞間關(guān)系的預(yù)處理
這一步是基于敘詞表建立敘詞本體的最核心、最關(guān)鍵的步驟,是敘詞本體建立的基礎(chǔ)。雖然敘詞表的敘詞和敘詞間的關(guān)系有明確的語(yǔ)義,這使得敘詞表可以作為向敘詞本體轉(zhuǎn)換的基礎(chǔ)。但是大部分的敘詞表所表述的詞間關(guān)系太過(guò)寬泛,不能達(dá)到本體中精確的語(yǔ)義的要求。因此,從敘詞表向敘詞本體模型轉(zhuǎn)換的第一步,也是最關(guān)鍵的一步,就是對(duì)敘詞表中的敘詞及敘詞間的關(guān)系進(jìn)行預(yù)處理和精煉。通過(guò)對(duì)敘詞表中敘詞及詞間關(guān)系進(jìn)行預(yù)處理和精煉,將敘詞轉(zhuǎn)變成領(lǐng)域本體中的概念,將敘詞表中寬泛、不準(zhǔn)確的詞間關(guān)系精煉為明確的概念間關(guān)系,使敘詞表真正成為轉(zhuǎn)換成敘詞本體或作為敘詞本體建設(shè)的基礎(chǔ)資源。這里我們參考《中國(guó)圖書(shū)館分類(lèi)主題詞表》和《管理科學(xué)主題詞表》對(duì)敘詞及詞間關(guān)系進(jìn)行預(yù)處理。
4.4.4 多語(yǔ)種敘詞本體的詳細(xì)設(shè)計(jì)
(1)定義類(lèi)和類(lèi)的等級(jí)體系
首先根據(jù)敘詞表確定該領(lǐng)域與最重要的概念相關(guān)的其他重要概念,以建立核心概念集。由于我們是參照《中圖法》思想來(lái)定義我們的類(lèi)體系結(jié)構(gòu),因此我們采用自頂向下法來(lái)構(gòu)建,即將《中圖法》中的學(xué)科體系結(jié)構(gòu)嵌入到這個(gè)敘詞本體中,充當(dāng)敘詞本體的主干結(jié)構(gòu)。對(duì)于其中不足部分進(jìn)行添加和修改。根據(jù)敘詞本體的定義以及結(jié)構(gòu),我們可以以《中國(guó)圖書(shū)館分類(lèi)主題詞表》為藍(lán)本來(lái)構(gòu)建敘詞本體?!吨袊?guó)圖書(shū)館分類(lèi)主題詞表》主表中的左部分是分類(lèi)法,給出了學(xué)科分類(lèi),右部分則是對(duì)應(yīng)于該分類(lèi)的敘詞。因此,我們可以用學(xué)科分類(lèi)來(lái)構(gòu)建敘詞本體中的概念C,用敘詞來(lái)構(gòu)建敘詞本體中的術(shù)語(yǔ)I。
Protégé構(gòu)建的本體描述的是某個(gè)特定領(lǐng)域中重要的概念和聯(lián)系;這樣不僅為該領(lǐng)域提供了一部詞匯表,同時(shí)也為詞表中詞語(yǔ)含義提供了一種計(jì)算機(jī)可操作的規(guī)范。Protégé構(gòu)建本體時(shí),客觀世界或某個(gè)領(lǐng)域是用類(lèi)(Classes)來(lái)劃分的,而且允許在最低層類(lèi)別之下添加實(shí)例(Instances),通過(guò)定義屬性(Properties)將相關(guān)的類(lèi)和實(shí)例聯(lián)系起來(lái),然后用圖形表示出來(lái),顯示類(lèi)和實(shí)例,并表示出它們之間的各種關(guān)系。目前Protégé提供了幾個(gè)插件來(lái)實(shí)現(xiàn)可視化功能,例如TGVizTab采用的是網(wǎng)狀圖結(jié)構(gòu)(見(jiàn)圖4-4),將類(lèi)、實(shí)例、屬性節(jié)點(diǎn)與節(jié)點(diǎn)相連,形成一張動(dòng)態(tài)的語(yǔ)義相關(guān)的網(wǎng)絡(luò)。
圖4-4 網(wǎng)狀圖結(jié)構(gòu)參考劉俊、李華等學(xué)者的《敘詞表詞間關(guān)系可視化實(shí)驗(yàn)研究》)
通過(guò)構(gòu)建情報(bào)學(xué)敘詞本體的整體框架,使大家了解Protégé建立OWL的基礎(chǔ)用法。本實(shí)驗(yàn)系統(tǒng)采用的是Protégé3.3beta版本,其安裝文件可以在Standford大學(xué)的網(wǎng)站http:// protege.stanford.edu上下載得到。
步驟1:建立新的項(xiàng)目。打開(kāi)Protege,然后會(huì)出現(xiàn)對(duì)話框,點(diǎn)擊Create New Project,出現(xiàn)Create New Project對(duì)話框后,在提示框選擇生成文件的格式,見(jiàn)圖4-5(a)。本研究選擇OWL Flies(.owl or. rdf)后,點(diǎn)擊Next,選擇OWL DL語(yǔ)言,見(jiàn)圖4-5(b)。
圖4-5 在Protégé中建立新項(xiàng)目
步驟2:建立類(lèi)。Protégé的主頁(yè)面會(huì)出現(xiàn),OWL Classes(OWL類(lèi)),Properties(屬性),F(xiàn)orms(表單),Individuals(個(gè)體),Metedata(元類(lèi))這幾個(gè)標(biāo)簽。我們選擇OWL Classes來(lái)編輯。在Asserted Hierarchy(添加階層)中,會(huì)有所有類(lèi)的超類(lèi)OWL Thing上點(diǎn)擊As-serted Hierarchy旁邊的Create subclass,見(jiàn)圖4-6(a),或者在OWL Thing,點(diǎn)擊右鍵選擇Create subclass,會(huì)出現(xiàn)Protege自動(dòng)定義名為Class_ 1的類(lèi)。在右邊的CLASS EDITOR(類(lèi)編輯器)的Name選項(xiàng)中,輸入“科學(xué)_科學(xué)研究”對(duì)該類(lèi)重命名,見(jiàn)圖4-6(b)。
圖4-6 在Protégé中創(chuàng)建類(lèi)
步驟3:建立科學(xué)_科學(xué)研究的子類(lèi),在科學(xué)_科學(xué)研究點(diǎn)擊上右鍵,選擇Create subclass,并按照上述方法將其名字變?yōu)橄鄳?yīng)的子類(lèi)名字。
步驟4:然后按照上面的方法,建立Science and Science Research的其他子類(lèi),以及子類(lèi)的子類(lèi)。狀態(tài)如圖4-7所示。
圖4-7 在Protégé中建立子類(lèi)
其中,概念之間的定義方式如下:
<rdfs:Class rdf:about="http://www.domain2. com#情報(bào)學(xué)與情報(bào)工作">
<rdfs:subClassOf rdf: resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
</rdfs:Class>
(2)定義類(lèi)的屬性
圖4-8是屬性的編輯界面,可以在左邊的瀏覽框中新建屬性,然后在右端的編輯框?qū)@個(gè)屬性作限定。在編輯框中選擇這個(gè)屬性的使用范圍,也可以設(shè)定屬性的性質(zhì)。從圖中可以看到右下角有一些選項(xiàng),如Transticive代表這個(gè)屬性可以傳遞,InverseFunetional代表這個(gè)屬性是可逆的??梢栽谙旅娴腄omain和Range框選定其應(yīng)用的范圍。Protégé中已經(jīng)存在五個(gè)注釋類(lèi)的屬性如下: owl: versionlnfo,rdfs: label,rdfs: comment,rdfs: seeAlso,rdfs: isDefinedBy。
圖4-8 Protégé中屬性編輯界面
類(lèi)只是描述了一個(gè)框架,一定程度上,還不能夠確切地描述一個(gè)領(lǐng)域。因此還需要繼續(xù)定義這個(gè)類(lèi)的內(nèi)部結(jié)構(gòu)。在上述步驟中,我們已經(jīng)確定了一些重要術(shù)語(yǔ),那么我們接下來(lái)的任務(wù)就是確定哪些可以成為其中類(lèi)的屬性了。
類(lèi)的屬性包括數(shù)據(jù)類(lèi)型屬性和對(duì)象屬性。數(shù)據(jù)類(lèi)型屬性(DataType Property)在本實(shí)驗(yàn)系統(tǒng)中包括敘詞含義描述has description,敘詞的中圖分類(lèi)號(hào)has class number,以及其他的一些信息。
類(lèi)的內(nèi)在屬性確定后,還需要確定類(lèi)之間的關(guān)系,又被稱為“外在屬性”。本書(shū)將接下來(lái)介紹如何在類(lèi)之間建立關(guān)系。屬性的一個(gè)重要功能就是描述概念間關(guān)系或?qū)嵗g關(guān)系,在Protégé中關(guān)系也是通過(guò)屬性來(lái)表示的。Protégé自定義了一些比較普遍的描述性的關(guān)系,在圖中列出了大部分Protégé自定義的關(guān)系。
建立對(duì)象屬性。新建一個(gè)ObjectProperty(注意不是DataProperty)選擇Properties標(biāo)簽,建立一個(gè)對(duì)象屬性(owl: ObjectProperty) S(屬),然后再建立一個(gè)屬性F(分),它是屬性S的逆關(guān)系(owl: inverseOf),在右下角Inverser框中選擇S屬性,如圖4-9、圖4-10所示。
圖4-9 建立對(duì)象屬性
其他的對(duì)象屬性建立過(guò)程與上述步驟類(lèi)似,這里不再重復(fù)的介紹。建立數(shù)據(jù)類(lèi)型屬性。新建一個(gè)Data Property。選擇Properties標(biāo)簽,建立一個(gè)數(shù)據(jù)類(lèi)型屬性(owl: DataProperty)。數(shù)據(jù)類(lèi)型屬性(DataType Property)在本實(shí)驗(yàn)系統(tǒng)中包括敘詞含義描述has description,敘詞的中圖分類(lèi)號(hào)has class number,以及其他的一些信息。
雖然敘詞本體可以繼承本體自定義無(wú)限概念關(guān)系的特性,但是為了讓敘詞本體不至于太過(guò)復(fù)雜,我們決定目前的研究范圍還是僅限于“用,代,屬,分,參”這五種基本關(guān)系和語(yǔ)種關(guān)系,概念關(guān)系的預(yù)處理和確定參照《管理科學(xué)主題詞表》(見(jiàn)表4-5)。
圖4-10 建立屬性間的互逆關(guān)系
表4-5 《管理科學(xué)主題詞表》中部分?jǐn)⒃~及詞間關(guān)系
①上下位關(guān)系
Protégé系統(tǒng)提供了一個(gè)基本大類(lèi)owl: Thing,在此類(lèi)之下,允許用戶自定義各大類(lèi),再一級(jí)級(jí)細(xì)分出小類(lèi),最后一級(jí)小類(lèi)之下可以添加具體實(shí)例。由于這里選取的都是抽象名詞(見(jiàn)表4-5),沒(méi)有實(shí)例名詞,因而在Protégé中編輯敘詞表時(shí),一個(gè)敘詞就作為一個(gè)類(lèi)。這樣類(lèi)的上下位關(guān)系就反映著敘詞間的等級(jí)關(guān)系。
②等同關(guān)系
Protégé提供兩種類(lèi)型屬性:對(duì)象屬性(Object Property)和數(shù)據(jù)屬性(Datatype Property)。對(duì)象屬性用來(lái)表示類(lèi)或?qū)嵗g的相互聯(lián)系,即關(guān)系,包含翻轉(zhuǎn)屬性、傳遞屬性、對(duì)稱屬性和函數(shù)屬性四種類(lèi)型。數(shù)據(jù)屬性反映的是某類(lèi)或?qū)嵗旧砭哂械膶傩?,例如圖書(shū)的數(shù)據(jù)屬性有開(kāi)本、頁(yè)碼等。不難看出,在表現(xiàn)敘詞間等同關(guān)系和相關(guān)關(guān)系時(shí),需要定義對(duì)象屬性。只要在屬性編輯頁(yè)面中選定一種對(duì)象屬性,然后再添加該屬性的定義域和值域,就可將存在此類(lèi)關(guān)系的類(lèi)或?qū)嵗?lián)系起來(lái)。
《管理科學(xué)主題詞表》在處理同義詞時(shí),通常指定其中一個(gè)常用的詞語(yǔ)為正式敘詞,其余詞均為非正式敘詞,表示方法為“正式敘詞D非正式敘詞,非正式敘詞Y正式敘詞”。根據(jù)D和Y的互逆關(guān)系,在Protégé屬性界面中新建兩個(gè)對(duì)象屬性D和Y,并定義Y是D的翻轉(zhuǎn)屬性。只要類(lèi)1用屬性D聯(lián)系到類(lèi)2,系統(tǒng)就自動(dòng)地從類(lèi)2用屬性Y聯(lián)系到類(lèi)1。參考劉俊、李華等學(xué)者編寫(xiě)的論文《敘詞表詞間關(guān)系可視化實(shí)驗(yàn)研究》,筆者畫(huà)出了對(duì)象屬性設(shè)置的表4-6。
表4-6 對(duì)象屬性設(shè)置
③相關(guān)關(guān)系
相關(guān)關(guān)系C是一種特殊的翻轉(zhuǎn)屬性,是一種自逆關(guān)系。筆者新建一種對(duì)象屬性SA(See Also)(見(jiàn)表4-6)作為屬性C的翻轉(zhuǎn)屬性,這樣敘詞1若與敘詞2相關(guān),可以從敘詞1用屬性C聯(lián)系到敘詞2,相應(yīng)地?cái)⒃~2用屬性SA反向聯(lián)系到敘詞1。在此基礎(chǔ)上,與等同關(guān)系可視化操作一樣,為每一組相關(guān)關(guān)系建立一對(duì)翻轉(zhuǎn)子屬性,并相應(yīng)定義每個(gè)子屬性的定義域和值域,即添加有相關(guān)關(guān)系的兩類(lèi)或多個(gè)類(lèi)。
④自定義詞間關(guān)系
在《漢表》中等級(jí)關(guān)系只包括屬種關(guān)系,而并未揭示整體與部分的關(guān)系以及列舉關(guān)系。而利用Protégé的屬性設(shè)置功能,我們就可以自定義一對(duì)翻轉(zhuǎn)屬性BTP和NTP來(lái)揭示整體—部分關(guān)系,同時(shí)通過(guò)在類(lèi)下設(shè)置實(shí)例(instance)就可以來(lái)揭示列舉關(guān)系(BTI和NTI)。BTP和NTP是ANSI/NISO Z39.19-2005標(biāo)準(zhǔn)中建議使用的,BTP是Broader Term(Partitive)的縮寫(xiě),NTP是Narrower Term(Partitive)的縮寫(xiě)。其中BTP指向包括各組成部分的整體,NTP指向構(gòu)成整體的組成部分。例如,數(shù)據(jù)庫(kù)是信息系統(tǒng)的一個(gè)重要組成部分,可以表示為:數(shù)據(jù)庫(kù)BTP信息系統(tǒng),信息系統(tǒng)NTP數(shù)據(jù)庫(kù)。由于Protégé可以在最底層的類(lèi)下添加實(shí)例,因而很容易實(shí)現(xiàn)列舉關(guān)系的可視化,不再贅述。
敘詞概念之間的關(guān)系用、代、屬、分、參、族作為概念間的關(guān)系定義:
<o(jì)wl:ObjectProperty rdf:ID="D">
<o(jì)wl:inverseOf>
<o(jì)wl:ObjectProperty rdf:ID="Y"/>
</owl:inverseOf>
<rdfs:range rdf: resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
<rdfs:domain rdf:resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
</owl:ObjectProperty>
<o(jì)wl:ObjectProperty rdf:ID="Z">
<rdfs:range rdf:resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
<rdfs:domain rdf:resource="http://www.domain2.com#科學(xué)_科學(xué)研究"/>
</owl:ObjectProperty>
<o(jì)wl:ObjectProperty rdf:ID="S">
<o(jì)wl:inverseOf>
<o(jì)wl:ObjectProperty rdf:ID="F"/>
</owl:inverseOf>
<rdfs:range rdf:resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
<rdfs:domain rdf:resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
</owl:ObjectProperty>
<o(jì)wl:ObjectProperty rdf:about="#F">
<o(jì)wl:inverseOf rdf:resource="#S"/>
<rdfs:range rdf:resource="http://www.domain2.com#科學(xué)_科學(xué)研究"/>
<rdfs:domain rdf:resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
</owl:ObjectProperty>
<o(jì)wl:ObjectProperty rdf:about="#Y">
<rdfs:domain rdf:resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
<rdfs:range rdf:resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
<o(jì)wl:inverseOf rdf:resource="#D"/>
</owl:ObjectProperty>
<o(jì)wl:DatatypeProperty rdf:about="http://www.domain2. com#hasChineseTerm">
<rdfs: range rdf: resource=" http://www.w3.org/2001/ XMLSchema#string"/>
<rdfs:domain rdf:resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
</owl:DatatypeProperty>
<o(jì)wl:SymmetricProperty rdf:ID="C">
<o(jì)wl:inverseOf rdf:resource="#C"/><rdf:type rdf:resource="http://www.w3.org/2002/07/owl# ObjectProperty"/>
<rdfs:domain rdf:resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
<rdfs: range rdf:resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
</owl:SymmetricProperty>代是可以逆轉(zhuǎn)的,定義成逆反屬性,而屬、分也是可以逆轉(zhuǎn)的,因此也定義成逆反屬性,而參為對(duì)稱的,因此定義成對(duì)稱屬性。而所有的對(duì)象屬性的值域和定義域都是所有的概念,因此為最上位類(lèi)的概念。
隸屬于某種概念的(敘詞)術(shù)語(yǔ)在本體中則以概念實(shí)例的形式呈現(xiàn),用OWL表示如下:
<thes:情報(bào)檢索rdf:about="http://www.domain2.com#查全率">
<thes:hasChineseTerm rdf:datatype="http://
www.w3.org/2001/XMLSchema#string">查全率
</thes:hasChineseTerm>
</thes:情報(bào)檢索>
這表示查全率是情報(bào)檢索的一個(gè)敘詞,其中thes:hasChinese-Term是查全率的一個(gè)值屬性,而<thes:hasChineseTerm></thes: hasChineseTerm>之間的查全率是屬性值。這樣做的好處是:可以增加更多的值屬性來(lái)描述此敘詞,比如用英語(yǔ)來(lái)描述這個(gè)術(shù)語(yǔ),就可以增加一個(gè)值屬性<thes:hasEnglishTerm>,用法和中文的用法一樣。這樣有助于構(gòu)建多語(yǔ)種敘詞本體。
⑤語(yǔ)種關(guān)系
a.建立等同關(guān)系基于概念,用“等同關(guān)系”把不同語(yǔ)種的敘詞聯(lián)系起來(lái)。界面右下角是“Asserted Conditions”框,其中包含“NECESSARY”項(xiàng)和“NECESSARY&SUFFICIENT”,而該框的右上角有三個(gè)按鈕,分別可以添加表達(dá)式、限制和具名類(lèi)。首先選定“情報(bào)”,然后選“NECESSARY&SUFFICIENT”,最后點(diǎn)擊“Add named class”。然后,在彈出框中選擇“Information”,按確定鍵,即可把“情報(bào)”和“Information”等同起來(lái),結(jié)果如圖4-11(a),圖4-11(b),圖4-11(c)??梢钥吹皆陬?lèi)檢索框和“Asserted Conditions”框均顯示出來(lái)。
b.語(yǔ)種屬性定義語(yǔ)種屬性,是采用的固定中心方法,即以某一種語(yǔ)言為中心語(yǔ)言,以此語(yǔ)言構(gòu)成敘詞表,其他語(yǔ)種作為實(shí)例的一個(gè)屬性。這里將中文作為中心語(yǔ)言,其他語(yǔ)種作為實(shí)例的一個(gè)屬性。首先在屬性編輯界面,建立對(duì)象屬性hasEnglishTerm,以敘詞“情報(bào)”為例,多語(yǔ)種關(guān)系的建立如圖4-12(a),圖4-12(b),圖4-12(c)所示。
圖4-11 基于概念的多語(yǔ)種等同
圖4-12 語(yǔ)種屬性的建立
(3)創(chuàng)建實(shí)例
實(shí)例是本體的重要組成部分,可以在Protégé工具中為類(lèi)添加實(shí)例。在完成了上述定義后,我們的最后階段是將這些類(lèi)實(shí)例化。圖中的菱形圖標(biāo)代表Individuals框,點(diǎn)擊該圖標(biāo)就可以進(jìn)入實(shí)例界面進(jìn)行編輯。例如,為“情報(bào)檢索”添加一個(gè)實(shí)例“專題檢索”。首先,在CLASS BROWSER框中選擇“情報(bào)檢索”,然后在INSTANCE EDITOR中對(duì)這個(gè)實(shí)例進(jìn)行編輯,可以為它取名、定義等。結(jié)果如圖4-13所示。
圖4-13 創(chuàng)建實(shí)例
4.4.5 敘詞本體的表示
首先,我們根據(jù)《中國(guó)圖書(shū)館分類(lèi)主題詞表》構(gòu)建了“科學(xué)與科學(xué)研究”類(lèi)目下的一部分?jǐn)⒃~,由于是實(shí)驗(yàn)系統(tǒng),因此我們并沒(méi)有將所有的分類(lèi)和術(shù)語(yǔ)都創(chuàng)建起來(lái),而是選擇了其中的一部分。其結(jié)構(gòu)如圖4-14所示。
在圖4-14中,左邊區(qū)域?yàn)閿⒃~本體的類(lèi)屬結(jié)構(gòu):科學(xué)—科學(xué)研究→情報(bào)學(xué)與情報(bào)工作→情報(bào)學(xué),情報(bào)檢索;而中間區(qū)域則是類(lèi)目下的實(shí)例,這里就是屬于該類(lèi)目的敘詞,從圖中可以看到,情報(bào)學(xué)下有24個(gè)敘詞,而信息檢索下有15個(gè)敘詞;最右邊是中間敘詞所對(duì)應(yīng)的關(guān)系,包括用(Y),代(D),屬(S),分(F),參(C),族(Z)以及值屬性,如中文術(shù)語(yǔ)等。
圖4-14用Protégé構(gòu)建的敘詞本體結(jié)構(gòu)
4.4.6 多語(yǔ)種敘詞本體的評(píng)價(jià)
利用《中國(guó)圖書(shū)館分類(lèi)主題詞表》和《管理科學(xué)主題詞表》構(gòu)建的情報(bào)學(xué)敘詞本體,有非常好的可擴(kuò)展性和權(quán)威性,也可以很方便地對(duì)其進(jìn)行擴(kuò)展。接下來(lái)的工作是請(qǐng)熟悉該領(lǐng)域的專家對(duì)這個(gè)敘詞本體進(jìn)行評(píng)價(jià),評(píng)價(jià)內(nèi)容包括類(lèi)、屬性以及類(lèi)之間關(guān)系的明確性和準(zhǔn)確性,提出指導(dǎo)意見(jiàn),根據(jù)所提出的指導(dǎo)意見(jiàn)返回到前面,重新對(duì)其進(jìn)行反復(fù)修改,直至最后形成情報(bào)學(xué)敘詞本體原型。
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。