精品欧美无遮挡一区二区三区在线观看,中文字幕一区二区日韩欧美,久久久久国色αv免费观看,亚洲熟女乱综合一区二区三区

        ? 首頁 ? 理論教育 ?常用知識組織系統(tǒng)構(gòu)建標(biāo)準(zhǔn)

        常用知識組織系統(tǒng)構(gòu)建標(biāo)準(zhǔn)

        時間:2023-02-27 理論教育 版權(quán)反饋
        【摘要】:目前,各種知識組織系統(tǒng)構(gòu)建標(biāo)準(zhǔn)基本都是針對某種類型的語義工具而制定的,尚不具備普遍適用性。
        常用知識組織系統(tǒng)構(gòu)建標(biāo)準(zhǔn)_網(wǎng)絡(luò)環(huán)境中知識組織系統(tǒng)構(gòu)建與應(yīng)用研究

        3.2 常用知識組織系統(tǒng)構(gòu)建標(biāo)準(zhǔn)

        標(biāo)準(zhǔn)通常按其使用范圍劃分為國際標(biāo)準(zhǔn)、區(qū)域標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)、專業(yè)標(biāo)準(zhǔn)和企業(yè)標(biāo)準(zhǔn)等。與知識組織系統(tǒng)構(gòu)建與管理相關(guān)的機(jī)構(gòu)主要有ISO下的TC37分會(術(shù)語及其他語言與內(nèi)容資源技術(shù)委員會)、TC46分會(信息與文獻(xiàn)技術(shù)委員會)、IFLA、W3C以及各國的標(biāo)準(zhǔn)化組織。

        目前,各種知識組織系統(tǒng)構(gòu)建標(biāo)準(zhǔn)基本都是針對某種類型的語義工具而制定的,尚不具備普遍適用性。下面將按照具體的語義工具類型,分類別簡單介紹常用的編制或構(gòu)建、管理標(biāo)準(zhǔn)。

        3.2.1 術(shù)語表編制標(biāo)準(zhǔn)

        術(shù)語表編制標(biāo)準(zhǔn)主要是指導(dǎo)術(shù)語標(biāo)準(zhǔn)化工作,成立于1951年的ISO/TC37為世界范圍內(nèi)術(shù)語的協(xié)調(diào)和統(tǒng)一做出了巨大的貢獻(xiàn)。ISO/TC37下設(shè)4個分技術(shù)委員會:SC1“Principles and methods”(原則與方法);SC2“Terminographical and lexicographical working methods”(術(shù)語與辭書編纂工作方法);SC3“Systems to manage terminology,knowledge and content”(術(shù)語、知識與內(nèi)容管理);SC4“Language resource management”(語言資源管理)。該委員會指導(dǎo)和協(xié)調(diào)世界范圍內(nèi)術(shù)語標(biāo)準(zhǔn)化工作,建立了一套較為全面和完整的術(shù)語工作體系,包括術(shù)語學(xué)理論與方法的工作體系、術(shù)語工作的專家體系以及術(shù)語的查詢系統(tǒng)等。

        其中相關(guān)的術(shù)語編制國際標(biāo)準(zhǔn)主要有:

        ●ISO 704:2000Terminology work—Principles and methods(術(shù)語工作 原則與方法)

        ●ISO 860:1996Terminology work—Harmonization of concepts and terms(術(shù)語工作 概念與術(shù)語的協(xié)調(diào))

        ●ISO 1087-1:2000Terminology work—Vocabulary-Part 1:Theory and application(術(shù)語工作詞表第一部分:理論與應(yīng)用)

        ●ISO 1087-2:2000Terminology work—Vocabulary-Part 2: Computer applications(術(shù)語工作詞表第二部分:計(jì)算機(jī)應(yīng)用)

        ●ISO/TR 12618:1994Computer aids in terminology—Creation and use of terminological databases and text corpora(術(shù)語工作計(jì)算機(jī)應(yīng)用術(shù)語數(shù)據(jù)庫和文本語料的建設(shè)和使用)

        ●ISO 12620:1999Computer applications in terminology—Data categories(術(shù)語工作 計(jì)算機(jī)應(yīng)用數(shù)據(jù)類目)

        ●ISO 12200:1999Computer applications in terminology-Machine-readable terminology interchange format(MARTIF)—Negotiated interchange[術(shù)語工作 計(jì)算機(jī)應(yīng)用 機(jī)器可讀術(shù)語交換格式(MARTIF)協(xié)商交換]

        ●ISO 16642:2003Computer applications in terminology—Terminological markup framework(術(shù)語工作 計(jì)算機(jī)應(yīng)用術(shù)語的標(biāo)記框架)

        ●ISO 10241:1992International terminology standards—Preparation and layout(國際術(shù)語標(biāo)準(zhǔn) 準(zhǔn)備與顯示)

        ●ISO 12616:2002Translation-oriented terminography(面向翻譯的術(shù)語編纂)

        在ISO國際標(biāo)準(zhǔn)基礎(chǔ)上,全國術(shù)語標(biāo)準(zhǔn)化技術(shù)委員會(SAC/TC 62)制定了相應(yīng)的我國術(shù)語編制國家標(biāo)準(zhǔn),主要有:

        ●GB/T 10112-1999術(shù)語工作 原則與方法

        ●GB/T 15237.1-2000術(shù)語工作 詞匯 第1部分:理論與應(yīng)用

        ●GB/T 16785-1997術(shù)語工作 概念與術(shù)語的協(xié)調(diào)

        ●GB/T 16786-1997術(shù)語工作 計(jì)算機(jī)應(yīng)用 數(shù)據(jù)類目

        ●GB/T 17532-1998術(shù)語工作 計(jì)算機(jī)應(yīng)用 詞匯

        ●GB/T 18155-2000術(shù)語工作 計(jì)算機(jī)應(yīng)用 機(jī)器可讀術(shù)語交換格式(MARTIF)協(xié)商交換

        ●GB/T 19100-2003術(shù)語工作 概念體系的建立

        ●GB/T 13725-2001建立術(shù)語數(shù)據(jù)庫的一般原則與方法

        ●GB/T 15387.1-2001術(shù)語數(shù)據(jù)庫開發(fā)文件編制指南

        ●GB/T 15387.2-2001術(shù)語數(shù)據(jù)庫開發(fā)指南

        ●GB/T 15625-2001術(shù)語數(shù)據(jù)庫技術(shù)評價指南

        ●GB/T 19101-2003建立術(shù)語語料庫的一般原則與方法

        ●GB/T 19102-2003術(shù)語部件庫的信息描述規(guī)范

        ●GB/T 11617-2000辭書編纂的一般原則與方法

        ●GB/T 11617-2000辭書編纂符號

        ●GB/T 18895-2002面向翻譯的術(shù)語編纂

        ●GB/T 19099-2003術(shù)語標(biāo)準(zhǔn)化項(xiàng)目管理指南

        語詞是各種知識組織系統(tǒng)標(biāo)識的基礎(chǔ),術(shù)語的標(biāo)準(zhǔn)化是其他知識組織工具標(biāo)準(zhǔn)化建設(shè)的前提和基礎(chǔ)。術(shù)語標(biāo)準(zhǔn)化工作經(jīng)過多年積淀,已經(jīng)形成了比較成熟的術(shù)語表構(gòu)建流程,如圖3-1所示。

        img12

        圖3-1 術(shù)語表構(gòu)建基本流程

        圖表來源:劉春燕,沈玉蘭.信息與文獻(xiàn)術(shù)語標(biāo)準(zhǔn)現(xiàn)狀及修訂建議[J].情報雜志,2008(11):107~110.

        由此可知,術(shù)語表的編制重點(diǎn)體現(xiàn)在收詞來源的權(quán)威性和全面性,考慮到網(wǎng)絡(luò)流行語出現(xiàn)頻繁,新詞新語不斷涌現(xiàn),收詞時還應(yīng)具有一定的前瞻性;同時,要盡可能建立豐富的術(shù)語元數(shù)據(jù)信息,將術(shù)語的各種來源和定義進(jìn)行存儲。此外,還要實(shí)現(xiàn)術(shù)語的規(guī)范化處理,實(shí)現(xiàn)術(shù)語本地化、雙語或多語術(shù)語翻譯轉(zhuǎn)換、詞匯排序和顯示、同一概念對應(yīng)的不同術(shù)語的聚類等多種目的。

        3.2.2 分類表編制標(biāo)準(zhǔn)

        分類法是目前最常用的知識組織系統(tǒng)之一,不論是在傳統(tǒng)圖書館環(huán)境中,還是網(wǎng)絡(luò)信息環(huán)境中都占有著重要的地位。雖然目前各種各樣的分類法、分類表成百上千,分類法的標(biāo)準(zhǔn)化問題也一直深受國際圖書館界的關(guān)注,但令人遺憾的是至今尚未有國際通用的分類法編制的專門技術(shù)標(biāo)準(zhǔn)。

        MARC 21是結(jié)合加拿大機(jī)讀編目格式(CAN/MARC)與美國機(jī)讀編目格式(USMARC)相似,再排除相異性而形成;它基于美國國家標(biāo)準(zhǔn)學(xué)會(American National Standards Institute,簡稱ANSI)的Z39.2格式整合了各國的MARC格式,利用網(wǎng)絡(luò)與各種通信技術(shù),打破各國疆界,使書目格式的交換更加便利。MARC21的設(shè)計(jì)是為重新定義MARC格式,增進(jìn)其檢索功能,以求適用于21世紀(jì)的網(wǎng)絡(luò)環(huán)境。其中《MARC21分類數(shù)據(jù)格式》是MARC21 的5種執(zhí)行格式之一(MARC21書目數(shù)據(jù)格式、MARC21館藏?cái)?shù)據(jù)格式、MARC21規(guī)范數(shù)據(jù)格式、MARC21分類數(shù)據(jù)格式、MARC21社會信息格式)[3]。它是一個傳統(tǒng)的分類表描述標(biāo)準(zhǔn),是類號、類名等類目信息的規(guī)范化描述格式,即用MARC格式分字段記錄和描述分類表的類目信息,包括類目的類號、類目、類目注釋、索引詞、類號的組成等等,這是一部分類表的描述和管理標(biāo)準(zhǔn)規(guī)范,但也涉及一部分內(nèi)容構(gòu)建的信息。

        我國國家標(biāo)準(zhǔn)局頒布了幾項(xiàng)信息分類編碼方面的標(biāo)準(zhǔn),實(shí)際上是分類法編制技術(shù)標(biāo)準(zhǔn),具體標(biāo)準(zhǔn)有:[4]

        ●GB/T 7027《信息分類編碼的基本原則和方法》,1986年發(fā)布,目前使用的是其2002年版本GB/T 7027-2002。

        ●GB/T 20001.3-2001《標(biāo)準(zhǔn)編寫規(guī)則第3部分:信息分類編碼》,這個標(biāo)準(zhǔn)確立了分類法的結(jié)構(gòu)和編寫規(guī)則,適用于信息分類編碼國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、地方標(biāo)準(zhǔn)的編寫,于2001年頒布實(shí)施,取代了原來的GB/T 7026-1986。

        ●GB/T 10113《分類與編碼通用術(shù)語》,1988年發(fā)布第1版GB 10113-1988,最新版為GB 10113-2003。

        隨著各種知識組織工具的集成共用,分類表作為一種典型的受控詞表形式,其編制規(guī)范在一些受控詞表或結(jié)構(gòu)化詞表的新修標(biāo)準(zhǔn)中多有論述,如在新修訂的BS8723標(biāo)準(zhǔn)中分類表作為一種敘詞表以外的詞表形式進(jìn)行論述[5]。

        3.2.3 敘詞表標(biāo)準(zhǔn)

        敘詞表編制標(biāo)準(zhǔn)在各種類型知識組織系統(tǒng)標(biāo)準(zhǔn)中最受關(guān)注,不僅有國際標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn),還有行業(yè)標(biāo)準(zhǔn)。本文僅羅列了關(guān)注比較多的ISO國際標(biāo)準(zhǔn)、英美國家標(biāo)準(zhǔn)以及我國的相關(guān)標(biāo)準(zhǔn)等。

        (1)敘詞表編制標(biāo)準(zhǔn)

        早先單語種敘詞表和多語種敘詞表分別設(shè)立編制標(biāo)準(zhǔn),主要的單語種敘詞表編制標(biāo)準(zhǔn)有:

        ●聯(lián)合國教科文組織(United Nations Educational,Scientific and Cultural Organization,簡稱UNESCO)的《單語種敘詞表編制準(zhǔn)則》(1970年),這應(yīng)該是最早關(guān)于敘詞表編制的規(guī)范。

        ●ISO的ISO 2788(Guidelines for the establishment and development of monolingual thesauri,《單語種敘詞表編制和開發(fā)指南》,1986年),是在UNESCO的《單語種敘詞表編制準(zhǔn)則》的基礎(chǔ)上修訂而成國際標(biāo)準(zhǔn)。

        ●英國的國家標(biāo)準(zhǔn)BS5723-1987,等同于ISO 2788,目前正在被新修的BS8723所取代。

        ●美國的國家標(biāo)準(zhǔn)Z39.19自1974年由ANSI首次出版,先后于1980、1988、1993、1998、2003、2005年多次修訂。2005版是完全的新版,修改篇幅很大,提供了單語種受控詞表(包括同義詞環(huán)、分類表和敘詞表等)的內(nèi)容、顯示、構(gòu)建、維護(hù)和管理等方面的原則和規(guī)范,充分考慮了非紙質(zhì)文獻(xiàn)的標(biāo)引要求,也提出網(wǎng)絡(luò)環(huán)境中的內(nèi)容和結(jié)構(gòu)展示要求。

        ●我國的國家標(biāo)準(zhǔn)GB/T 13190-1991(《漢語敘詞表編制規(guī)則》,1991年),是在ISO 2788的基礎(chǔ)上,結(jié)合漢語特點(diǎn)制定的漢語敘詞表編制規(guī)范,我國絕大多數(shù)敘詞表都是依照其編制而成。

        除了單語種敘詞表的編制標(biāo)準(zhǔn)外,還有專門針對多語種敘詞表編制的標(biāo)準(zhǔn),主要有:

        ●ISO的ISO 5964(Guidelines for the establishment and development of multilingual thesauri,《多語種敘詞表編制與開發(fā)指南》,1985年)

        ●英國的國家標(biāo)準(zhǔn)BS6723-1985,等同于ISO 5964。

        ●IFLA的多語種敘詞表編制指南(Guidelines for Multilingual Thesauri,簡稱IFLA指南),由IFLA的分類與標(biāo)引分會下設(shè)的多語種敘詞表指南工作組專家2005年起草,通過增補(bǔ)多語種受控詞表編制最新資料以完善ISO 5964[6]。

        ●我國的國家標(biāo)準(zhǔn)GB/T 15417-1994(《多語種敘詞表編制規(guī)則》,1994年),在ISO 5964的基礎(chǔ)上完成的。

        多語種敘詞表的編制標(biāo)準(zhǔn)主要包括構(gòu)建的方法,如自底向上直接構(gòu)建或者從其他單語種詞表轉(zhuǎn)換或合并;詞匯控制、語詞選擇、顯示等;重點(diǎn)關(guān)注多語種詞匯之間的等同關(guān)系的建立、類型、衡量和表示等。

        最近,隨著知識組織系統(tǒng)日漸深入人心、敘詞表的電子化、網(wǎng)絡(luò)化等因素的影響,在敘詞表標(biāo)準(zhǔn)的基礎(chǔ)上修訂適用于網(wǎng)絡(luò)環(huán)境的知識組織系統(tǒng)標(biāo)準(zhǔn)呼聲日高,一些標(biāo)準(zhǔn)化機(jī)構(gòu)也聞風(fēng)而動,比如英國BSI將BS 5723和BS 8723進(jìn)行合并,并新增其他類型結(jié)構(gòu)化詞表和互操作等內(nèi)容,形成一個用于信息檢索的結(jié)構(gòu)化詞表標(biāo)準(zhǔn)BS 8723,其中第一、第二部分已經(jīng)公布,用來取代BS 5723和BS 6723;第三、第四、第五部分為新增內(nèi)容,涉及其他類型知識組織工具及互操作相關(guān)內(nèi)容,還處于草案階段;另外,ISO于2007年4月發(fā)布了敘詞表國際標(biāo)準(zhǔn)修訂的計(jì)劃,開始著手以BS 8723為基礎(chǔ)將ISO 2788和ISO 5964更新和擴(kuò)展為ISO 25964(Thesauri and Interoperability with other Vocabularies,《敘詞表及與其他詞表的互操作》)。圖3-2簡單揭示了幾部常用的敘詞表編制標(biāo)準(zhǔn)的演進(jìn)和關(guān)聯(lián)。

        img13

        圖3-2 常用敘詞表編制標(biāo)準(zhǔn)關(guān)聯(lián)圖

        注:方框表示單語種敘詞表編制標(biāo)準(zhǔn),圓圈表示多語種敘詞表編制標(biāo)準(zhǔn),橢圓方框表示單語種、多語種敘詞表共用,連線及連接詞表示各標(biāo)準(zhǔn)之間的關(guān)系。

        當(dāng)然,除了上述標(biāo)準(zhǔn)外,其他國家或組織也有相應(yīng)的編制標(biāo)準(zhǔn)或規(guī)范,本文不作論述。

        (2)敘詞表標(biāo)準(zhǔn)修訂新變化

        隨著敘詞表編制環(huán)境、管理水平、應(yīng)用環(huán)境的變化,各部敘詞表編制標(biāo)準(zhǔn)也相應(yīng)進(jìn)行了修訂,如前所述,BSI將BS 5723和BS 6723合并,修訂BS 8723,將適用對象從敘詞表轉(zhuǎn)變?yōu)榻Y(jié)構(gòu)化詞表;Z 39.19適用對象從敘詞表轉(zhuǎn)變?yōu)槭芸卦~表;ISO 25964擬取代ISO 2788和ISO 5964,由ISO 25964-1用于信息檢索的敘詞表,包括單語種和多語種敘詞表;ISO 25964-2與其他詞表的互操作,包括其他詞表以及敘詞表與它們之間的互操作兩部分。這些修訂反映了敘詞表編制標(biāo)準(zhǔn)與時俱進(jìn),面向電子化、網(wǎng)絡(luò)化編制和應(yīng)用轉(zhuǎn)變,走通用知識組織系統(tǒng)標(biāo)準(zhǔn)路線的變化。具體表現(xiàn)在:

        ①超越了敘詞表的界限,從敘詞表拓展到結(jié)構(gòu)化詞表、受控詞表,將詞單、同義詞環(huán)、分類表、本體等收納進(jìn)來,擴(kuò)大了其適用對象的范圍;

        ②突破紙質(zhì)詞表的限制,考慮詞表編制的電子化和網(wǎng)絡(luò)化特征,尤其是詞表數(shù)字環(huán)境下的顯示和管理;

        ③擴(kuò)大了詞表在電子環(huán)境下和網(wǎng)絡(luò)環(huán)境中的應(yīng)用,而非僅局限在文獻(xiàn)標(biāo)引和文摘;

        ④互操作問題成為詞表編制的一個重要組成部分;

        ⑤不再區(qū)分單語種、多語種,而是把多語種詞表編制作為詞表互操作的一個特例;

        ⑥引入分面分析在詞表內(nèi)容構(gòu)建和顯示中的應(yīng)用,提出了相應(yīng)的應(yīng)用原則;

        ⑦強(qiáng)調(diào)了詞表的管理工作,包括管理系統(tǒng)的建設(shè)、編制業(yè)務(wù)流程的管理、詞表更新維護(hù)機(jī)制等等;

        ⑧增加了企業(yè)用戶參與標(biāo)準(zhǔn)編制,這點(diǎn)可以從Z39.19-2005的編委會成員中看出,有微軟、有專門的數(shù)據(jù)庫內(nèi)容供應(yīng)商Pre-Quest。

        由目前的修訂可以看出,傳統(tǒng)敘詞表編制標(biāo)準(zhǔn)中增補(bǔ)了分類法、本體等其他語義工具以及不同的詞匯控制工具間的互操作、協(xié)議、格式等問題,提供了對電子詞表的功能設(shè)計(jì)、詞表管理軟件、在數(shù)字環(huán)境下的顯示和分面分析等諸多規(guī)范和建議,越來越接近于一部通用的知識組織系統(tǒng)構(gòu)建標(biāo)準(zhǔn)。

        3.2.4 其他知識組織系統(tǒng)構(gòu)建標(biāo)準(zhǔn)

        除了上文述及的針對傳統(tǒng)知識組織工具的編制標(biāo)準(zhǔn)外,一些新型的知識組織系統(tǒng)也陸續(xù)制定了相應(yīng)的編制和描述標(biāo)準(zhǔn)。

        (1)主題圖及其編制標(biāo)準(zhǔn)

        主題圖是一套用來組織信息的方法,使用這種方法可以提供最佳的信息導(dǎo)航[7]。主題圖是由主題、關(guān)聯(lián)和資源實(shí)體構(gòu)成的集合體。主題圖產(chǎn)生在2000年前后,一開始就與HyTime和XML等描述語言相關(guān)聯(lián)。主題圖最核心的內(nèi)容仍體現(xiàn)在概念(主題)和關(guān)系上,其編制標(biāo)準(zhǔn)主要有[8]

        ●ISO/IEC13250 Topic Maps(主題圖),2000年由ISO/IEC(國際標(biāo)準(zhǔn)化組織/國際電工委員會)的第一聯(lián)合技術(shù)委員會JTC1下設(shè)第34分會(文檔描述與處理語言分技術(shù)委員會)制定,2003年修訂2版,此后陸續(xù)完善,形成了一個有關(guān)主題圖的標(biāo)準(zhǔn)家族,由七個部分組成,規(guī)定了主題圖的數(shù)據(jù)模型、語法規(guī)范及基于Hy-Time的meta-DTD和基于XML的DTD等一系列規(guī)范:

        第一部分:概述和基本概念(ISO/IEC13250:2003);

        第二部分:數(shù)據(jù)模型(ISO/IEC13250-2:2006);

        第三部分:XML句法(ISO/IEC13250-3:2007);

        第四部分:規(guī)范化(ISO/IEC13250:2009);

        第五部分:參考模型(ISO/IEC13250:2003);

        第六部分:簡潔性語法(ISO/IEC13250:2003);

        第七部分:圖示法(ISO/IEC13250:2003)。

        ●ISO/IEC18048:Topic Maps Query Language(主題圖查詢語言)

        ●ISO/IEC19756:Topic Maps Constraint Language(主題圖約束語言)

        ●XML Topic Maps(XTM)1.0,2001年在ISO/IEC13250:2000的基礎(chǔ)上,結(jié)合當(dāng)時XML語言的興起,TopicMaps.Org采用XML編制主題圖XTM,形成的規(guī)范。XTM1.0詳細(xì)規(guī)定了用于創(chuàng)建主題圖的XML標(biāo)簽集和相應(yīng)的語法規(guī)范。此后,XTM1.0被加入到ISO/IEC13250:2003中,由JTC1/SC34負(fù)責(zé)修訂。

        (2)本體相關(guān)標(biāo)準(zhǔn)

        共享復(fù)用是本體最主要的特征之一,應(yīng)該本體的構(gòu)建或形式化的表示應(yīng)遵循約定的規(guī)范或標(biāo)準(zhǔn)。目前的本體相關(guān)標(biāo)準(zhǔn)主要是關(guān)于本體描述語言的,主要有RDF/RDFS、DAML+OIL、CycL及網(wǎng)絡(luò)本體語言(Web Ontology Language,OWL)等。

        總的說來,由于傳統(tǒng)知識組織系統(tǒng)發(fā)展歷史較長,大多形成了內(nèi)容較為全面的編制標(biāo)準(zhǔn),包括內(nèi)容構(gòu)建、顯示與描述、管理等,有較完善的流程指導(dǎo);而新型的知識組織系統(tǒng)標(biāo)準(zhǔn)目前大多是針對其描述、數(shù)據(jù)交換的,其內(nèi)容構(gòu)建還缺乏相應(yīng)的規(guī)范指導(dǎo)。

        免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請告知,我們將盡快刪除相關(guān)內(nèi)容。

        我要反饋