3.3 知識組織系統(tǒng)描述標準
知識組織系統(tǒng)是實現(xiàn)知識組織和知識服務的重要支撐工具,因此,不同國家、不同組織機構花費大量人力、物力和財力來構建各種各樣的知識組織系統(tǒng),有的應用廣泛,蜚聲國際,譬如DDC、 LCC、LCSH等;有的僅內部使用,從未見諸報端。對這些知識組織系統(tǒng)資源進行管理應列入國家信息資源儲備,具有重要意義。國外有一些專門的組織機構或企業(yè)展開了這類注冊管理服務,如道瓊斯公司2001年建立的Taxonomy Warehouse,管理了670余部詞表、分類法資源,涉及73個領域,39種語言[9]?;谶@樣一個注冊管理,能夠實現(xiàn)資源共享,避免重復建設,減少建設成本。目前,國內知識組織系統(tǒng)資源管理明顯不足,沒有專門機構負責,有多少中文知識組織系統(tǒng)資源,有多少術語詞匯、涉及哪些領域,由誰擁有和修訂維護,怎么獲取,向誰咨詢都是未知,這成為我國知識組織系統(tǒng)資源建設面臨的最大障礙。因此,非常有必要建立知識組織系統(tǒng)注冊管理機制,交由專門機構負責統(tǒng)計管理。
知識組織系統(tǒng)描述模型是實現(xiàn)其注冊管理的依據(jù),知識組織系統(tǒng)的注冊管理一般分為四個層次:元數(shù)據(jù)體系注冊、術語注冊、服務注冊及數(shù)據(jù)標準注冊[10]。因此,知識組織系統(tǒng)的描述也可從資源整體描述、單個術語概念描述、服務描述、數(shù)據(jù)標準描述四個方面展開。
3.3.1 知識組織系統(tǒng)整體描述
知識組織系統(tǒng)資源整體描述是將一個分類法、一個詞表或一個本體等作為一個整體資源來描述,是為實現(xiàn)對各種具體知識組織系統(tǒng)的管理。2001年,OCLC依據(jù)DC元數(shù)據(jù)的核心元素集,提出了知識組織系統(tǒng)注冊元數(shù)據(jù)草案(目前為第3版),從整體上描述每個知識組織系統(tǒng)資源[11],見表3-1。
該描述模型分別從宏觀和微觀兩方面整體描述了知識組織系統(tǒng)的內容、結構和相關信息,基于此,可實現(xiàn)知識組織系統(tǒng)的初步注冊和管理,從而便于知識組織系統(tǒng)的發(fā)現(xiàn)、評價、共享、復用和協(xié)作。當然,該草案只提供了知識組織系統(tǒng)資源整體注冊元數(shù)據(jù)的核心元素,還可以仿照DC通過限定詞、修飾語等方式建立更詳盡的知識組織系統(tǒng)整體描述元數(shù)據(jù)體系。
表3-1 知識組織系統(tǒng)描述元數(shù)據(jù)
續(xù)表3-1
圖表來源:Networked Knowledge Organization Systems(NKOS)Registry Reference Document for Data Elements[OL].http://staff.oclc.org/~vizine/NKOS/Thesaurus_Registry_version3_rev.htm.
3.3.2 術語概念描述
除了知識組織系統(tǒng)資源整體描述外,從應用角度出發(fā),更應對其實體單元(語詞或概念)進行描述注冊,即目前深受關注的術語注冊服務。W3C組織推薦的SKOS標準,是一種基于概念建模的知識組織系統(tǒng)形式化表示框架,亦可作為知識組織系統(tǒng)概念描述模型。
各類型知識組織系統(tǒng)雖然各有特點,但它們之間很難清晰劃分界限,因此SKOS最關注的是求同存異,將這些知識組織系統(tǒng)共同的地方提取出來進行表示,以便于他們在計算機環(huán)境下進行數(shù)據(jù)交換和共享。SKOS建立在資源描述框架(Resource Description Frame,簡稱RDF)的基礎上,擴展了RDF Schema的描述能力。作為RDF的一個應用,SKOS數(shù)據(jù)可以采用抽象的RDF句法,如RDF/XML來表示成RDF三元組,因此,通過SKOS描述方式知識組織系統(tǒng)可以被表示成機器可讀、可理解的數(shù)據(jù)。SKOS的推廣和應用對于促進知識組織系統(tǒng)在網(wǎng)絡環(huán)境下的應用、推動語義web的發(fā)展具有非常重要的實踐意義。
SKOS被設計成模塊化、可擴展的語言家族,由三部分組成:SKOS核心(SKOS Core)、SKOS映射(SKOS Mapping)和SKOS擴展(SKOS Extensions)。SKOS Core是一個表示概念體系基本結構和內容的模型,SKOS Mapping用于描述不同概念體系的概念間的映射,SKOS Extensions用戶描述SKOS的特定應用。目前SKOS Core基本發(fā)展成熟,形成了相應的語法標準和應用標準,后兩種還處于研發(fā)階段。
其中SKOS Core提供了一套RDF詞匯表(如表3-2所示),可用作術語概念及其屬性關系以及與具體知識組織系統(tǒng)資源之間關聯(lián)的描述模型[12]。
表3-2 SKOS Core詞匯表
而正在發(fā)展的SKOS Mapping試圖提供不同知識組織系統(tǒng)的術語概念之間的映射表示,分別提供了skos:closeMatch,skos:exactMatch,skos:broadMatch,skos:narrowMatch和skos:related-Match五種映射屬性來描述來自不同概念體系中的概念的對應關系。
當然,除了采用SKOS格式表示,還可以采用MARC、Zthes等標準格式來描述,但其基本描述元素大同小異。對知識組織系統(tǒng)中的術語概念進行注冊,目的是將表達概念的詞匯、體系及關系轉換成機器可處理、可理解的關聯(lián)數(shù)據(jù)資源,使其成為語義網(wǎng)中的一部分資源,從而實現(xiàn)術語概念的注冊、管理、查詢?yōu)g覽、鏈接和匹配[10]。
3.3.3 知識組織系統(tǒng)的服務與數(shù)據(jù)標準描述
知識組織系統(tǒng)服務注冊是對其所能提供的各種網(wǎng)絡服務web services的描述,包括提供給用戶的檢索、鏈接、瀏覽和識別服務以及提供給機器用戶的諸如各種可用的web services及其API、web services的類型、訪問協(xié)議、檢索與獲取方式、可用格式等,知識組織系統(tǒng)服務注冊實現(xiàn)了其應用的共享。
知識組織系統(tǒng)數(shù)據(jù)標準注冊主要是對其數(shù)據(jù)字典、數(shù)據(jù)模型、體系和編碼集的描述,將有助于知識組織系統(tǒng)的標準化、規(guī)范化,推動其復用、共享與互操作。
目前,知識組織系統(tǒng)的描述,尤其是其元數(shù)據(jù)體系注冊和術語注冊受到了OCLC、JISC、W3C等多個組織機構的關注。從列席在JCDL、ECDL及DC等國際會議上NKOS Workshop討論中可知,一方面這些機構正在制定各種描述規(guī)范,另一方面已開始提供各種注冊系統(tǒng)和注冊服務來管理和描述現(xiàn)有的各種知識組織系統(tǒng)資源。
免責聲明:以上內容源自網(wǎng)絡,版權歸原作者所有,如有侵犯您的原創(chuàng)版權請告知,我們將盡快刪除相關內容。