教育集成詞庫(kù)的構(gòu)建系統(tǒng)研究
第4章 教育集成詞庫(kù)的構(gòu)建系統(tǒng)研究
受控詞表的互操作,已經(jīng)成為信息資源開發(fā)、利用中的一個(gè)全球性問題。我國(guó)自20世紀(jì)80年代中后期以來在這一方面進(jìn)行了大量的研究和探索。究竟應(yīng)當(dāng)采用哪種互操作的方法,建立什么樣的兼容體系,已經(jīng)成為一個(gè)亟待解決的重要課題。
縱觀國(guó)外正在研究或已運(yùn)作的項(xiàng)目,如CAMed、MACS、HEREIN、HILT、UMLS等,都是以集合詞表或敘詞詞庫(kù)的形式來實(shí)現(xiàn)各種受控詞表之間的互操作;而在國(guó)內(nèi)這方面的研究還很少,90年代初提出的構(gòu)建“國(guó)家敘詞庫(kù)”項(xiàng)目也因故未能完成,目前醫(yī)學(xué)領(lǐng)域在研制的“統(tǒng)一的中國(guó)醫(yī)學(xué)語言系統(tǒng)”和“中醫(yī)藥一體化語言系統(tǒng)”可以說是這一方面的一個(gè)實(shí)例,但該項(xiàng)目的實(shí)施更多地依賴手工操作完成,不具有推廣性。針對(duì)這些問題進(jìn)行初步探討,結(jié)合目前的計(jì)算機(jī)技術(shù),提出建立以《中分表》為核心的集成詞庫(kù),從而實(shí)現(xiàn)各種受控詞表之間的互操作。
集成詞庫(kù)主要是將某一特定主題領(lǐng)域的若干敘詞表或分類法匯編在一起,通過識(shí)別等價(jià)詞及準(zhǔn)等價(jià)詞建立一個(gè)詞匯轉(zhuǎn)換系統(tǒng),用于在聯(lián)合分類或標(biāo)引活動(dòng)中實(shí)現(xiàn)分類法和敘詞表之間的互操作1。采用集成詞庫(kù)的方式實(shí)現(xiàn)受控詞表之間的互操作,首先,可以將各種詞表或類表全部收集、利用起來;其次,不需要對(duì)原詞表和類表進(jìn)行加工,主要通過發(fā)揮計(jì)算機(jī)聯(lián)機(jī)顯示、統(tǒng)計(jì)及轉(zhuǎn)換等功能,實(shí)現(xiàn)互操作;第三,也無須建立完全等價(jià)的對(duì)應(yīng)關(guān)系,只要表現(xiàn)出所有相關(guān)及同義關(guān)系即可;最后,還可以隨時(shí)添加新的兼容詞表,不斷擴(kuò)充詞庫(kù)。
本系統(tǒng)以教育類為實(shí)驗(yàn)對(duì)象,收集現(xiàn)有的各種詞表(含分類表、主題詞表、關(guān)鍵詞等)的教育數(shù)據(jù),以《中分表》為核心,通過一定的方法實(shí)現(xiàn)其與分類語言、主題語言及自然語言三者之間的互操作,從而構(gòu)建一個(gè)教育集成詞庫(kù)。
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。