自動構(gòu)建敘詞表
2.2.3 自動構(gòu)建敘詞表
如上所述,計算機輔助編制詞表雖然提高了編表效率和詞表的質(zhì)量,但未涉及詞匯控制的核心——詞間關(guān)系的識別。其實,早在20世紀(jì)70年代,信息檢索專家就已開始探索自動構(gòu)建詞間關(guān)系的方法。美國學(xué)者Salton在1974年提出自動構(gòu)建詞表的設(shè)想,以詞匯同現(xiàn)為依據(jù),假設(shè)在某一主題領(lǐng)域的文獻中語詞同現(xiàn)的頻率越高,這些語詞的含義相關(guān)的可能性越大。從顯示每個詞對同現(xiàn)強度的語詞—語詞矩陣中,可以生成各種類型的聚類,如詞團、詞串、詞星、詞束[17]。1983年,他與學(xué)者McGill實踐了這一想法,從工程文獻庫中自動抽詞編成敘詞表,并在其著作《現(xiàn)代情報檢索導(dǎo)論》中提供了該詞表的實例。后來,一批學(xué)者進行了大量研究和試驗,嘗試多種途徑自動構(gòu)建敘詞表,如從用戶檢索式中提取詞間關(guān)系、通過語法分析等語言學(xué)知識獲取詞間關(guān)系、從現(xiàn)有語義詞典構(gòu)建詞表等,但探討和應(yīng)用最多的方法當(dāng)屬同現(xiàn)分析方法。
為了適應(yīng)聯(lián)機和網(wǎng)絡(luò)檢索的需要,自動構(gòu)建的敘詞表在結(jié)構(gòu)和詞匯組織方式上與傳統(tǒng)敘詞表存在很大差別,類似于Roget型敘詞表,且大多用于檢索,只有少數(shù)同時用于標(biāo)引文獻。不過,不管計算機生成的敘詞表與人工編制的敘詞表有多么大的差別,如果在全自動化的系統(tǒng)中,它可以明顯改善檢索性能,那么它就是值得采用的。
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請告知,我們將盡快刪除相關(guān)內(nèi)容。