計算機(jī)實現(xiàn)分類號與對應(yīng)主題詞標(biāo)引的必要性
6.2.1 研究綜述
1997年,戴晶萍在侯漢清教授指導(dǎo)下,在其學(xué)位論文中指出計算機(jī)實現(xiàn)分類號與對應(yīng)主題詞標(biāo)引的必要性[3]。
1998年,Goetz具體說明了Log L方法,并將其用于對《美國國會圖書館標(biāo)題表》(LCSH)標(biāo)題詞與《杜威十進(jìn)分類法》(DDC)分類號的自動匹配,并進(jìn)行了實驗研究,說明利用Log L方法可以過濾LCSH與DDC對照數(shù)據(jù)庫中的錯誤記錄[4]。
1999年,張雪英在研究經(jīng)濟(jì)分類表-敘詞表轉(zhuǎn)換系統(tǒng)時,采用MI和Log L方法對標(biāo)引詞-分類號進(jìn)行統(tǒng)計分析,得出某一標(biāo)引詞或詞串所對應(yīng)的最相關(guān)的分類號,試驗結(jié)果論證了Log L方法優(yōu)于MI方法。Log L的篩選標(biāo)準(zhǔn)為:將樣本庫中標(biāo)引詞小于3的記錄刪除。實驗結(jié)果表明,利用MI方法,分類號與標(biāo)引詞的對應(yīng)正確率可達(dá)72.3%;利用Log L方法,正確率達(dá)80.3%[5]。
2001年,薛鵬軍在進(jìn)行網(wǎng)頁的自動分類研究時,繼續(xù)采用MI 和Log L方法,結(jié)果論證了后者優(yōu)于前者。在此基礎(chǔ)上有所改進(jìn)的是采用新的篩選標(biāo)準(zhǔn),他認(rèn)為:分類號、主題詞頻次對MI和Log L值的影響程度遠(yuǎn)不如共現(xiàn)頻次顯著,即共現(xiàn)頻次與MI、Log L值的關(guān)聯(lián)程度較大,所以通過共現(xiàn)頻次來進(jìn)行篩選更具有合理性和科學(xué)性。實驗結(jié)果表明,利用MI方法,分類號與標(biāo)引詞的對應(yīng)正確率可達(dá)57.4%,利用Log L方法正確率達(dá)74.5%[6]。
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請告知,我們將盡快刪除相關(guān)內(nèi)容。