精品欧美无遮挡一区二区三区在线观看,中文字幕一区二区日韩欧美,久久久久国色αv免费观看,亚洲熟女乱综合一区二区三区

        ? 首頁(yè) ? 理論教育 ?館藏文獻(xiàn)數(shù)字化的基本方法

        館藏文獻(xiàn)數(shù)字化的基本方法

        時(shí)間:2023-04-12 理論教育 版權(quán)反饋
        【摘要】:索引可以用數(shù)據(jù)庫(kù)方式建立,以某條記錄所揭示的對(duì)應(yīng)頁(yè)的圖像文件名為地址與該頁(yè)圖像相聯(lián)接。該方式的優(yōu)點(diǎn)是可以保存文獻(xiàn)的原貌,制作技術(shù)相對(duì)簡(jiǎn)單,可用于保真度要求較高的古籍、檔案、手稿、照片等資料的數(shù)字化。采用文本方式存儲(chǔ)文獻(xiàn)內(nèi)容,輔之以全文檢索系統(tǒng)構(gòu)成全文檢索數(shù)據(jù)庫(kù)。掃描錄入與文本方式的結(jié)合是將掃描形成的圖像文件經(jīng)OCR軟件處理成文本,并將圖像文件與文本文件疊加,形成全文版掛接掃描版。

        (一)掃描錄入

        掃描錄入法是使用掃描儀或數(shù)碼相機(jī)形成原始文獻(xiàn)的數(shù)字圖像文件,也就是將文獻(xiàn)或圖書(shū)資料按原貌逐頁(yè)存儲(chǔ)為圖像文件,并為其編制題名、責(zé)任者、分類、主題詞或關(guān)鍵詞、人物等索引,利用索引可以檢索并顯示索引詞所在頁(yè)面的圖像文件。圖像文件的存儲(chǔ)、處理、壓縮等可以通過(guò)適當(dāng)?shù)能浖?lái)實(shí)現(xiàn)。索引可以用數(shù)據(jù)庫(kù)方式建立,以某條記錄所揭示的對(duì)應(yīng)頁(yè)的圖像文件名為地址與該頁(yè)圖像相聯(lián)接。該方式的優(yōu)點(diǎn)是可以保存文獻(xiàn)的原貌,制作技術(shù)相對(duì)簡(jiǎn)單,可用于保真度要求較高的古籍、檔案、手稿、照片等資料的數(shù)字化。缺點(diǎn)是占據(jù)存儲(chǔ)空間較大,即使采用較完善的數(shù)據(jù)壓縮技術(shù),所能存儲(chǔ)的文獻(xiàn)內(nèi)容也遠(yuǎn)遠(yuǎn)小于文本方式存儲(chǔ)的內(nèi)容,標(biāo)引工作量大且技術(shù)要求高,不能逐字、詞檢索到某字詞所在的句段。

        (二)文本方式

        文本是文獻(xiàn)傳播的內(nèi)容和受眾闡釋的對(duì)象,是以標(biāo)準(zhǔn)化的編碼形式表達(dá)整體意義的符號(hào)系統(tǒng),是經(jīng)過(guò)人類加工處理,付諸一定載體形式的社會(huì)文獻(xiàn)信息。采用文本方式存儲(chǔ)文獻(xiàn)內(nèi)容,輔之以全文檢索系統(tǒng)構(gòu)成全文檢索數(shù)據(jù)庫(kù)。這里的全文檢索,既可通過(guò)對(duì)數(shù)據(jù)庫(kù)的全部字詞編制索引的方式對(duì)數(shù)據(jù)庫(kù)中的文字進(jìn)行逐字詞檢索,也可不編字詞索引,而是采取逐字詞遍歷的方式從文庫(kù)中查找相應(yīng)的字詞,前者的缺點(diǎn)是索引占據(jù)的存儲(chǔ)空間較大(中文全文數(shù)據(jù)庫(kù)字詞索引所占空間大約是原文本所占空間的5倍),但檢索速度較快;后者則可以節(jié)省編制索引所占據(jù)的空間,但檢索速度較慢。全文檢索數(shù)據(jù)庫(kù)除可以對(duì)全文庫(kù)進(jìn)行逐字詞檢索外,還可以配以題名、責(zé)任者等輔助索引,也可以對(duì)文庫(kù)中的人名、地名、關(guān)鍵詞等編制規(guī)范文檔,進(jìn)行后控,以提高查全率和查準(zhǔn)率。

        (三)掃描錄入與文本方式結(jié)合

        掃描錄入與文本方式的結(jié)合是將掃描形成的圖像文件經(jīng)OCR軟件處理成文本,并將圖像文件與文本文件疊加,形成全文版掛接掃描版。理想的制作方式是先制作掃描版,然后利用OCR技術(shù)(光學(xué)字符識(shí)別技術(shù))將其轉(zhuǎn)換為文本格式,從而建立文本與頁(yè)面的一一對(duì)應(yīng)關(guān)系。使用時(shí),用戶可用全文版檢索到特定字、詞所在的句段,必要時(shí)可調(diào)閱句段所對(duì)應(yīng)的掃描版頁(yè)面文件,用以觀看文獻(xiàn)原貌或校對(duì)文字識(shí)別錯(cuò)誤。

        免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。

        我要反饋