本體庫構(gòu)建
10.2 本體庫構(gòu)建
根據(jù)敘詞本體的定義以及結(jié)構(gòu),我們可以以《中國圖書館分類主題詞表》為藍本來構(gòu)建敘詞本體?!吨袊鴪D書館分類主題詞表》主表中的左部分是分類法,給出了學(xué)科分類,右部分則是對應(yīng)于該分類的敘詞。因此,我們可以用學(xué)科分類來構(gòu)建敘詞本體中的概念C,用敘詞來構(gòu)建敘詞本體中的術(shù)語I。學(xué)科分類關(guān)系就是概念類屬關(guān)系HC,而敘詞表中的敘詞之間的“用、代、屬、分、參、族”關(guān)系就是敘詞本體中術(shù)語關(guān)系RI。另外需要制定一些規(guī)則即公理O,以便于之后演化過程需要的推理。
在本體庫中,以類表示敘詞。由于敘詞與敘詞之間的關(guān)系是多對多的關(guān)系,本體中類與類的關(guān)系也應(yīng)是多對多的網(wǎng)狀關(guān)系。如圖10-4所示,圖10-4(1)和圖10-4(2)表示的是《中醫(yī)藥主題詞表》中的幾對敘詞的“屬”關(guān)系。圖10-4(1)中敘詞“白睛病證”與敘詞“眼科癥狀”都為敘詞“白睛溢血”的上位詞,而圖10-4(2)中顯示敘詞“眼科癥狀”仍然是敘詞“胞瞼腫脹”的上位詞,敘詞與敘詞之間在“屬”的關(guān)系上呈現(xiàn)多對多的關(guān)系。同樣在“用”、“代”等其他關(guān)系上也是如此,敘詞與敘詞之間是多對多的關(guān)系。因此,本體中類與類之間為多對多的關(guān)系。如圖10-4(2)所示,上位類與下位類在“屬”的關(guān)系上為多對多的關(guān)系。類與類之間的關(guān)系通過類的對象屬性來實現(xiàn)。在本體中定義“用”、“代”、“屬”、“族”、“分”、“參”六個對象屬性,用以表示類與類之間的關(guān)系。
圖10-4 敘詞的關(guān)系模型
按照本體中敘詞和敘詞關(guān)系的表示方式,我們利用本體構(gòu)建工具Protégé手工構(gòu)建情報學(xué)與情報工作領(lǐng)域的初始本體庫,作為該領(lǐng)域敘詞本體演化的原始版本。Protégé工具構(gòu)建出的本體是用本體描述語言O(shè)WL表示。其中,概念之間的定義方式如下:
<rdfs:Class rdf:about="http://www.domain2. com#情報學(xué)與情報工作">
<rdfs:subClassOf rdf:resource="http://www.domain2.com#科學(xué)_科學(xué)研究"/>
</rdfs:Class>
敘詞概念之間的關(guān)系用、代、屬、分、參、族作為概念間的關(guān)系定義:
<owl:ObjectProperty rdf:ID="D">
<owl:inverseOf>
<owl:ObjectProperty rdf:ID="Y"/>
</owl:inverseOf>
<rdfs:range rdf:resource="http://www.domain2.com#科學(xué)_科學(xué)研究"/>
<rdfs:domain rdf:resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
</owl:ObjectProperty>
<owl:ObjectProperty rdf:ID="Z">
<rdfs:range rdf:resource="http://www.domain2.com#科學(xué)_科學(xué)研究"/>
<rdfs:domain rdf:resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
</owl:ObjectProperty>
<owl:ObjectProperty rdf:ID="S">
<owl:inverseOf>
<owl:ObjectProperty rdf:ID="F"/>
</owl:inverseOf>
<rdfs:range rdf:resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
<rdfs:domain rdf:resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
</owl:ObjectProperty>
<owl:ObjectProperty rdf:about="#F">
<owl:inverseOf rdf:resource="#S"/>
<rdfs: range rdf:resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
<rdfs:domain rdf:resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
</owl:ObjectProperty>
<owl:ObjectProperty rdf:about="#Y">
<rdfs:domain rdf:resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
<rdfs:range rdf:resource="http://www.domain2.com#科學(xué)_科學(xué)研究"/>
<owl:inverseOf rdf:resource="#D"/>
</owl:ObjectProperty>
<owl:DatatypeProperty rdf:about="http://www.domain2. com#hasChineseTerm">
<rdfs: range rdf: resource=" http://www.w3.org/2001/ XMLSchema#string"/>
<rdfs:domain rdf:resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
</owl:DatatypeProperty>
<owl:SymmetricProperty rdf:ID="C">
<owl:inverseOf rdf:resource="#C"/>
<rdf: type rdf: resource="http://www.w3.org/2002/07/ owl#ObjectProperty"/>
<rdfs:domain rdf:resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
<rdfs:range rdf:resource="http://www.domain2. com#科學(xué)_科學(xué)研究"/>
</owl:SymmetricProperty>用,代是可以逆轉(zhuǎn)的,定義成逆反屬性,而屬、分也是可以逆轉(zhuǎn)的,因此也定義成逆反屬性,而參為對稱的,因此定義成對稱屬性。而所有的對象屬性的值域和定義域都是所有的概念,因此為最上位類的概念。
而隸屬于某種概念的(敘詞)術(shù)語在本體中則以概念實例的形式呈現(xiàn),用OWL表示如下:
<thes:情報檢索rdf:about="http://www.domain2. com#查全率">
<thes:hasChineseTerm rdf:datatype="http://www.w3.org/ 2001/XMLSchema#striaqg">查全率</thes:hasChineseTerm>
</thes:情報檢索>
這表示查全率是情報檢索的一個敘詞,其中thes: hasChinese-Term是查全率的一個值屬性,而<thes: hasChineseTerm></thes: hasChineseTerm>之間的查全率是屬性值。這樣做的好處是:可以增加更多的值屬性來描述此敘詞,比如用英語來描述這個術(shù)語,就可以增加一個值屬性<thes: hasEnglishTerm>,用法和中文的用法一樣。這樣有助于構(gòu)建多語種敘詞本體。
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請告知,我們將盡快刪除相關(guān)內(nèi)容。