精品欧美无遮挡一区二区三区在线观看,中文字幕一区二区日韩欧美,久久久久国色αv免费观看,亚洲熟女乱综合一区二区三区

        ? 首頁 ? 理論教育 ?敘詞本體的定義

        敘詞本體的定義

        時間:2023-02-26 理論教育 版權(quán)反饋
        【摘要】:③在關(guān)系定義方面,本體模型中關(guān)系的定義不像敘詞表中有具體的規(guī)定,本體的關(guān)系具有靈活性及可擴(kuò)展性。④在詞匯的組織方面,本體的語詞除了有規(guī)范化的語言之外,還包括自然語言和半自然語言,這表明本體與敘詞表相比,在規(guī)范化方面表現(xiàn)較差。下面各章節(jié)將詳細(xì)介紹敘詞本體的定義,功用,結(jié)構(gòu)以及擴(kuò)展敘詞本體的概念,提出多語種敘詞本體。
        敘詞本體的定義_多語種敘詞本體

        3.1 敘詞本體的定義

        3.1.1 敘詞表與本體的比較

        敘詞表主要用于檢索時的后控制和標(biāo)引時索引詞的選擇,是提高查全率和查準(zhǔn)率,實現(xiàn)多語種檢索和智能化概念檢索的重要途徑。而本體提供了一個用來表達(dá)和交流某些主題知識的詞表,它包含一個關(guān)系集,關(guān)系集描述了詞表中這些術(shù)語間的聯(lián)系。敘詞表和本體都是可以描述主題知識的詞表。兩者到底有什么樣的區(qū)別與聯(lián)系呢?

        中國農(nóng)科院的李景和錢平專門論述了敘詞表與本體的區(qū)別和聯(lián)系,主要體現(xiàn)在以下六個方面。

        ①敘詞表中的術(shù)語是規(guī)范的學(xué)科術(shù)語,而ontology中的概念和術(shù)語則是自然語言或者半自然語言。

        ②二者在組織結(jié)構(gòu)上也存在著區(qū)別,敘詞表中分布的知識點是線性一維的,而ontology中的知識概念分布則是網(wǎng)狀的,在四維空間中伸縮。

        ③本體的知識庫與概念集可以隨著學(xué)科領(lǐng)域的發(fā)展會不斷地進(jìn)行修正和更新,這一點大大地強(qiáng)于敘詞表。

        ④敘詞表中只有“用、代、屬、分、參、族”六種簡單的語義關(guān)系,而ontology中的概念間關(guān)系則被表述得更加廣泛、深入、細(xì)致和全面。

        ⑤敘詞表是一個詞匯庫(即語料庫),但不是知識庫;而ontology不僅僅是概念集、語料庫,而且還是知識庫。

        ⑥敘詞表相對穩(wěn)定,結(jié)構(gòu)保守而單一,不可能經(jīng)常修訂。而ontology的結(jié)構(gòu)應(yīng)該是基于xml的開放體系,可以被復(fù)用,可以增加或減少枝節(jié),可以對每個枝節(jié)處進(jìn)行修改和校驗,可以對原有的模式進(jìn)行保存,還可以“溫故知新”。

        學(xué)者趙煥洲和唐愛明也對敘詞表與ontology進(jìn)行了比較研究,除了上述的區(qū)別之外,他們認(rèn)為二者的區(qū)別還體現(xiàn)在以下幾個方面:

        ①在表示語言方面,敘詞表沒有表示語言,而ontology可以采用Ontolingua,Loom,F(xiàn)logic,SHOE,RDF,OIL,DAML+ OIL等語言來對其進(jìn)行表示。

        ②敘詞表沒有采用數(shù)學(xué)語言,ontology采用了數(shù)學(xué)語言中的一階謂詞邏輯。

        ③在構(gòu)建流程方面,敘詞表的編制一般按以下流程進(jìn)行,即總體設(shè)計、選詞、對詞匯進(jìn)行處理、編表、審核和試標(biāo)引。而ontology構(gòu)建時通常采用或參考enterprise方法、Grunninger&Fox的評價法、Berneras等人的方法、MethOntology方法以及基于SENSUS的方法等。

        ④在應(yīng)用方面,敘詞表一般用自然語言詞語作為表示,直觀表達(dá)信息主題概念,是以直接標(biāo)引信息為目的。而ontology的作用則是澄清知識的結(jié)構(gòu),從而為知識表示打好基礎(chǔ),實現(xiàn)知識的共享。

        除了上述區(qū)別之外,我們認(rèn)為敘詞表和本體之間還存在著以下幾點區(qū)別:

        ①敘詞表可以直觀表達(dá)信息主題概念,可以直接用以標(biāo)引信息,但是其結(jié)構(gòu)不清晰,查詢比較困難,而本體在此方面就做得比較好,能夠更加清晰地表示知識的結(jié)構(gòu),查詢更加容易。

        ②在組織結(jié)構(gòu)方面,敘詞表是線性一維的,而本體呈現(xiàn)網(wǎng)狀結(jié)構(gòu),能夠?qū)⒅R之間的關(guān)系表達(dá)得更加清晰。

        ③在關(guān)系定義方面,本體模型中關(guān)系的定義不像敘詞表中有具體的規(guī)定,本體的關(guān)系具有靈活性及可擴(kuò)展性。這一點可以認(rèn)為是本體的優(yōu)勢。但在構(gòu)建本體時,如何定義關(guān)系卻是一件困難的事,而敘詞表給出了一個實用的具體方案。從應(yīng)用效果上看,由于概念間的關(guān)系比概念本身更復(fù)雜,因而清晰的關(guān)系更能幫助人們對知識的理解,所以目前許多本體項目是基于敘詞表構(gòu)建的。知識組織中概念之間的關(guān)系是非常重要的內(nèi)容,敘詞表所規(guī)定的詞間關(guān)系是一個優(yōu)秀的方案??梢哉f,敘詞表是一種表現(xiàn)形式,而實際上它是一種方法:敘詞法。敘詞法是知識組織與表示的一種綜合方法。從這層意義上講,敘詞表(法)與本體的研究內(nèi)容與重點不在一個層次。

        ④在詞匯的組織方面,本體的語詞除了有規(guī)范化的語言之外,還包括自然語言和半自然語言,這表明本體與敘詞表相比,在規(guī)范化方面表現(xiàn)較差。而在信息標(biāo)引時,用自然語言進(jìn)行處理,顯然缺乏學(xué)科的專業(yè)性。信息組織的大量工作必須依賴手工的錄入和標(biāo)引,機(jī)器標(biāo)引和自動編目存在很大的局限性,其精確度尚無法和手工標(biāo)引媲美。低效率的手工標(biāo)引成為制約本體系統(tǒng)構(gòu)建和完善更新的最大瓶頸。而且研究本體構(gòu)建的技術(shù)體系與研究檢索的技術(shù)體系之間存在脫節(jié)問題。這導(dǎo)致了本體工程的生命周期不能順利進(jìn)行。

        ⑤在應(yīng)用效果方面,敘詞表的應(yīng)用效果是得到公認(rèn)的,而本體的應(yīng)用并不如預(yù)期的那么廣泛。

        ⑥敘詞表的更新維護(hù)功能相對較困難,而本體技術(shù)的自學(xué)習(xí)以及自演化的相關(guān)研究已經(jīng)有所突破,況且加上其描述語言的開發(fā)性,增加、修改本體都相對比較容易。隨著世界上交通技術(shù)以及通信技術(shù)的快速發(fā)展,世界各地學(xué)術(shù)交流也越來越容易,因此,整個學(xué)術(shù)以及發(fā)展“欣欣向榮”,新術(shù)語以及新關(guān)系的涌現(xiàn)層出不窮。傳統(tǒng)的敘詞表的結(jié)構(gòu)和組織方式嚴(yán)重地阻礙了敘詞表的更新和維護(hù)。在這方面,由于本體構(gòu)建技術(shù)以及描述語言的特點,使其更新和維護(hù)都相對容易。

        從上述的區(qū)別和聯(lián)系中,我們可以看到敘詞表以及本體都各自存在優(yōu)缺點,那為什么不結(jié)合使用兩者,使其充分發(fā)揮其優(yōu)點,為知識組織以及表示更好的服務(wù)呢?答案當(dāng)然是肯定的,基于這種想法,我們提出了敘詞本體的思想,即利用本體技術(shù)來構(gòu)建敘詞表。下面各章節(jié)將詳細(xì)介紹敘詞本體的定義,功用,結(jié)構(gòu)以及擴(kuò)展敘詞本體的概念,提出多語種敘詞本體。

        3.1.2 敘詞本體的定義

        定義1(敘詞本體)令TO={C,I,HC,RI,O},其中TO(Thesauri Ontology)為敘詞本體,它由一系列概念集C,從屬于概念集下的實例(敘詞與非敘詞) I,概念的類分關(guān)系HC,敘詞術(shù)語之間的關(guān)系RI,以及一些公理O組成。

        這里的概念集是指表示學(xué)科范疇的概念,即學(xué)科分類,利用本體技術(shù)進(jìn)行構(gòu)建時,使用本體原語“類”進(jìn)行構(gòu)建。I是術(shù)語詞集,對應(yīng)于敘詞表中的語詞,包括規(guī)范化的敘詞以及非規(guī)范化的非敘詞,利用本體技術(shù)進(jìn)行構(gòu)建時,使用本體原語“實例”進(jìn)行構(gòu)建。公理O與本體概念中的含義相同,代表永真斷言,如概念乙屬于概念甲的范圍。它主要用于敘詞術(shù)語隱式關(guān)系推理之用。HC為概念類分關(guān)系,而敘詞術(shù)語之間的關(guān)系RI將在下面的內(nèi)容中詳細(xì)介紹。

        定義2(概念的類屬關(guān)系) HC是指敘詞本體中概念的類屬關(guān)系,HC(C1,C2)表示C1是C2的子概念。

        例如HC(“情報學(xué)”,“情報學(xué)、情報工作”),“情報學(xué)”是“情報學(xué)、情報工作”的子概念。在敘詞本體構(gòu)建中,主要是通過定義類之間的對象關(guān)系得以實現(xiàn),一般情況下為“is part of”關(guān)系。

        定義3(術(shù)語關(guān)系) RI={Y,D,S,F(xiàn),C,Z}是指概念下敘詞術(shù)語之間的關(guān)系,這種關(guān)系引用了敘詞表里的六種關(guān)系,即用(Y),代(D),屬(S),分(F),參(C),族(Z)的關(guān)系。

        Y(I1,I2)表示I1是I2的非敘詞表示,D(I2,I1)表示I2是I1的敘詞表示,S(I1,I2)表示I1是I2的下位詞,F(xiàn)(I2,I1)表示I2是I1的上位詞,C(I1,I2)表示I1,I2是相關(guān)關(guān)系,Z(I1,I2)表示I2是I1的族首詞。

        同敘詞表的關(guān)系一樣,可以將這六種關(guān)系概括為三大類關(guān)系,即等同關(guān)系,等級關(guān)系以及相關(guān)關(guān)系。等同關(guān)系即指用(Y)、代(D)關(guān)系;等級關(guān)系指屬(S),分(F)以及族(Z);相關(guān)關(guān)系即指參(C)。而相關(guān)關(guān)系所包括的具體關(guān)系有很多,如對立關(guān)系、交叉關(guān)系等。如果從網(wǎng)絡(luò)資源中提取出的關(guān)系可以精確到這些更具體的關(guān)系,那么我們可以擴(kuò)展敘詞本體的關(guān)系。在相關(guān)關(guān)系即參(C)下增加一些子關(guān)系,如對立關(guān)系,交叉關(guān)系等。

        在敘詞本體的構(gòu)建中,術(shù)語關(guān)系也是通過定義對象屬性進(jìn)行定義的。而相關(guān)關(guān)系的子關(guān)系則是通過定義參(C)的子屬性得以實現(xiàn)的。

        由此,敘詞本體可以將敘詞表中所有的內(nèi)容都包含進(jìn)來,并有機(jī)結(jié)合了學(xué)科分類成為分類法與主題法相結(jié)合的一種解決方案。同時對關(guān)系進(jìn)行了擴(kuò)展,使其能夠更加準(zhǔn)確地表現(xiàn)敘詞術(shù)語之間的關(guān)系,使用敘詞本體中的敘詞進(jìn)行標(biāo)引,能夠更準(zhǔn)確地描述概念;同理,選擇敘詞本體中的敘詞作檢索詞,也能夠更容易且更加準(zhǔn)確的檢索出與此詞相關(guān)的信息。例如,如果敘詞術(shù)語A1與敘詞術(shù)語A2存在對立關(guān)系,在敘詞本體中對A1、A2進(jìn)行了定義,那么在檢索時,提供檢索詞A1以及選擇了檢索出其對立關(guān)系的選項,那么敘詞本體將會把其存在對立關(guān)系的敘詞術(shù)語A2也一同檢索出來。

        免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請告知,我們將盡快刪除相關(guān)內(nèi)容。

        我要反饋