檢索系統(tǒng)框架
1.3.1 標(biāo)準化
長期以來,標(biāo)準化一直被認為是解決檢索語言兼容性的最理想方法。都柏林核心集(DC)、杜威十進制分類法(DDC)和國際十進制分類法(UDC)等都是典型的標(biāo)準規(guī)范。毫無疑問,推行標(biāo)準化可以明顯提高信息共享能力。但是,并不是所有的檢索系統(tǒng)都愿意放棄過去應(yīng)用的檢索語言。即使選擇放棄,也同樣面臨標(biāo)準與原有檢索語言的兼容性問題[1]。另外,當(dāng)同一種檢索語言應(yīng)用于不同文獻系統(tǒng)時,也往往規(guī)定不同的詞匯解釋規(guī)則和標(biāo)引規(guī)則。在這種情況下,檢索語言的兼容性問題仍然存在。有的專家認為,UDC可以作為標(biāo)準。但是,UDC最初是作為一個等級式先組配系統(tǒng)而編制的,準備用于手工檢索。在機檢系統(tǒng)的組配式中采用UDC,似乎未見到很大的希望,而且UDC的更新也是非常繁瑣和混亂的[9]。迄今為止,尚未見到一種適于一切系統(tǒng)、能滿足一切需要的標(biāo)準化檢索語言[10]。
考慮到標(biāo)準化的種種難度,人們開始關(guān)注情報檢索語言的兼容轉(zhuǎn)換研究。兼容轉(zhuǎn)換是在不改變原有檢索語言的情況下,采用人工或者自動方式建立異構(gòu)檢索語言的詞匯之間的語義映射關(guān)系,而不是創(chuàng)建一種新的檢索語言或者標(biāo)準。雖然只能實現(xiàn)檢索語言的部分兼容,但是能夠達到較好的檢索,具有較強的可行性和現(xiàn)實意義[11]。
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請告知,我們將盡快刪除相關(guān)內(nèi)容。