1.3.4 集成詞表
最早出現(xiàn)的集成詞表是世界上幾個主要聯(lián)機檢索中心編制的數(shù)據(jù)庫索引,如美國DIALOG的DIALINDEX和BRS的CROSS。它們分別列出了所收集的數(shù)以百計的數(shù)據(jù)庫上出現(xiàn)的全部詞匯及其標引頻率,以便用戶選擇最適合的數(shù)據(jù)庫進行檢索。然而,這些數(shù)據(jù)庫只是把眾多的敘詞表的詞匯及其標引頻率匯集在一起,而沒有顯示這些詞匯之間的關系。
美國婦女教育交流網(wǎng)(WEECN)從許多機讀數(shù)據(jù)庫中抽出關于婦女教育機會均等方面的文獻條目,編成“第三代數(shù)據(jù)庫”?!霸~表指南”將每個詞的同義詞、近義詞和相關詞都排列出來。這種類型的詞表指南結構松散,但是用途很廣。利用它查詢原始數(shù)據(jù)庫以及衍生的第三級數(shù)據(jù)庫都很方便,并且有助于把各個數(shù)據(jù)庫中的兼容轉換為教育資源情報中心(ERIC)的檢索詞匯。
1976年,美國巴特爾哥倫布實驗室通過建立一個協(xié)議轉換指南(即一個同義詞表),將10種能源詞匯表自動集成,形成一個較為精致的詞表——“兼容轉換系統(tǒng)”(VSS)。用戶利用VSS,可以選擇合適的詞匯在數(shù)據(jù)庫中進行檢索。后來,VSS的收錄范圍由10個數(shù)據(jù)庫發(fā)展到16個,而且用于多個語種,整個工作于1983年完成。VSS最初的目標是想建立一個轉換指南或“同義詞表”,可以使一個能源方面的數(shù)據(jù)庫向另一個數(shù)據(jù)庫進行聯(lián)機轉換。通過實驗發(fā)現(xiàn),詞表的大量協(xié)調工作都可用計算機自動進行。多語種轉換可達到與單語種轉換相同的兼容水平,不同學科領域的兼容轉換效率不一樣,如社會科學詞匯比其他學科詞匯容易實現(xiàn)轉換。VSS通過單復數(shù)、詞形和同義詞等轉換,使敘詞表的轉換水平大幅度提高,從而實現(xiàn)敘詞表之間的自動轉換。VSS方法的最大優(yōu)點在于簡單,容易實現(xiàn),能夠充分發(fā)揮計算機的性能,盡可能減少人工判斷工作量[14]。
1980年,UNESCO倡導“建立社會科學情報檢索語言兼容性的指南”,召開了編制社會科學集成詞表專家咨詢會議,討論了UNESCO建立社會科學集成詞表的計劃。1981年,Riggs對社會科學概念術語進行了較為深入的研究。之后,多位專家發(fā)表了一系列關于社會科學檢索語言兼容性的論文。其中最有影響力的是International Classification上發(fā)表的三篇文章[15]。但由于經(jīng)費等原因,社會科學集成詞表最終未能完成。
1982年Dahlberg提出了概念兼容(Conceptual Compatibili ty)理論,設計了一種新的兼容工具——“兼容矩陣”(Compatibili ty Matrix),把若干種檢索語言與BC2(《布利斯書目分類法》第2版)的類目對照,列出等值兼容及近似兼容的概念。其目的主要是建立不同檢索語言詞匯的動態(tài)兼容,不同等級關系的概念兼容。這種工具曾應用于社會科學和文化科學領域的檢索語言兼容轉換。1994年,波蘭用這種方法進行了三個國際檢索系統(tǒng)四個學科領域的對比分析。“兼容矩陣”有較好的應用效果,但其實現(xiàn)非常復雜。以上系統(tǒng)只是用于解釋這種方法如何應用,并沒有完善成一個真正的實用系統(tǒng)。
1987年,美國醫(yī)學圖書館報道了其一體化醫(yī)學語言系統(tǒng)(UMLS)的進展情況,進行了包括MESH、SNOMED、CMIT和PDQ詞表的聯(lián)結實驗,構造了一個超級敘詞表。這種超級敘詞表既保留了源詞表中的詞匯,又增加了一些源詞表所沒有的信息。UMLS除超級敘詞表外還建有語義網(wǎng)絡和知識資源。1996年增加了專家詞典,并增補了源詞表、語義類型和知識資源。UMLS系統(tǒng)已在國際上具有較大的影響,但其實現(xiàn)相當復雜。
從1991年起,Stella等人開始設計一個包含CAB、AGRIS和AGRICOLA三個詞匯表的集成詞表系統(tǒng)。他們用了近五年的時間將三個詞匯表改造成分類主題一體化詞表,然后再將三表進行比較分析[16]。1993年,波蘭國會圖書館建立了STEBIS集成詞表,用來幫助用戶對該機構的檢索系統(tǒng)進行跨數(shù)據(jù)庫檢索。STEBIS將10個詞匯表(以EUROVOC為基礎編制)中的詞匯集中到一個文件中,每個詞匯的后面都指示含有該詞匯的詞表,用戶可直接查閱某詞匯表中該詞匯的上下級關系等情況[17]。
1995年9月,ISKO和TIP(International Society for Knowl edge Organization and the Society for Professional Information)組織召開了由12個國家、60多位專家參加的信息檢索系統(tǒng)兼容性與一體化研究國際學術研討會(The Research Seminar on Compat ibility and Integration of Order Systems)。這是自1971年以后召開的又一次專門討論檢索語言兼容性的國際會議。這次會議總結了過去40年來情報檢索語言兼容性問題的研究狀況,提出了一些新的檢索語言兼容理論和方法,介紹了一些已經(jīng)投入使用的集成詞表和集成詞表軟件。這次會議的召開意味著情報檢索語言的兼容性問題又成為研究熱點。集成詞表被認為是聯(lián)網(wǎng)環(huán)境下解決敘詞表之間轉換的最實用、最有效的工具。
免責聲明:以上內容源自網(wǎng)絡,版權歸原作者所有,如有侵犯您的原創(chuàng)版權請告知,我們將盡快刪除相關內容。