元搜索引擎與獨(dú)立搜索引擎比較
6.4.1 元搜索引擎
隨著網(wǎng)絡(luò)的發(fā)展,網(wǎng)上的信息越來(lái)越多,如何在海量的信息中發(fā)現(xiàn)自已需要的資料,成為了一個(gè)網(wǎng)絡(luò)發(fā)展至關(guān)重要的問(wèn)題。搜索引擎就是在這種背景下產(chǎn)生的。但是伴隨著搜索引擎的發(fā)展,各種搜索如雨后春筍般涌現(xiàn)而出,每一種搜索引擎都有各自的特點(diǎn),如何選擇搜索引擎又成為了一個(gè)新的問(wèn)題。在實(shí)際的操作中我們會(huì)發(fā)現(xiàn),要得到一個(gè)滿(mǎn)意的結(jié)果,往往要使用多個(gè)搜索引擎,綜合搜索的結(jié)果,這就降低了查找資料的效率,沒(méi)有體現(xiàn)出信息化社會(huì)的特點(diǎn),也會(huì)影響整個(gè)工作的進(jìn)度。在這種情況下元搜索引擎應(yīng)運(yùn)而生。元搜索引擎綜合了各個(gè)搜索引擎的搜索結(jié)果,節(jié)省了使用搜索引擎的時(shí)間,提高了效率,也保證了搜索結(jié)果的滿(mǎn)意度。
6.4.2 基本構(gòu)成方面的比較分析
搜索引擎被國(guó)內(nèi)外互聯(lián)網(wǎng)領(lǐng)域廣泛使用,但是它所包含的意義并不完全相同。在我國(guó)搜索引擎通常指的是基于網(wǎng)絡(luò)目錄的搜索服務(wù)或者是特定網(wǎng)站的搜索服務(wù)。比如新浪、網(wǎng)易等公司開(kāi)發(fā)的網(wǎng)站服務(wù)。在國(guó)外搜索引擎通常指的是基于互聯(lián)網(wǎng)上成千上萬(wàn)乃至數(shù)億個(gè)網(wǎng)頁(yè),且對(duì)于每個(gè)網(wǎng)頁(yè)上的每個(gè)詞都被搜索引擎所收錄,這就是大家所說(shuō)的全文檢索,其中具有代表性的搜索引擎如First、Search、Google和Infoseek等。這些網(wǎng)站大多數(shù)提供的是全文檢索服務(wù)。元搜索引擎與獨(dú)立搜索引擎的構(gòu)成方面的差異表現(xiàn)在以下幾個(gè)方面。
(1)獨(dú)立搜索引擎。
獨(dú)立搜索引擎的工作原理和基本構(gòu)成是根據(jù)用戶(hù)的查詢(xún)請(qǐng)求,按照一定的算法從索引數(shù)據(jù)庫(kù)中查找對(duì)應(yīng)的信息返回給用戶(hù)。為了保護(hù)用戶(hù)查詢(xún)信息的精度和新鮮度,搜索引擎需要建立并維護(hù)一個(gè)龐大的索引數(shù)據(jù)庫(kù)。獨(dú)立搜索引擎中索引數(shù)據(jù)庫(kù)中的信息是通過(guò)一種叫做網(wǎng)絡(luò)蜘蛛(spider)的程序從互聯(lián)網(wǎng)中采集得到的網(wǎng)頁(yè)。因此,一般獨(dú)立搜索引擎主要由網(wǎng)絡(luò)蜘蛛、索引數(shù)據(jù)庫(kù)和搜索引擎軟件等部分組成。
(2)元搜索引擎。
與獨(dú)立搜索引擎相比,元搜索引擎不需要維護(hù)龐大的索引數(shù)據(jù)庫(kù),也不需要網(wǎng)絡(luò)蜘蛛去采集網(wǎng)頁(yè)。具體來(lái)講,元搜索引擎主要由三部分組成,即請(qǐng)求提交代理、檢索接口代理和結(jié)果顯示代理?!罢?qǐng)求提交代理”是負(fù)責(zé)實(shí)現(xiàn)用戶(hù)“個(gè)性化”的檢索設(shè)置要求,包括調(diào)用哪些搜索引擎、檢索時(shí)間限制和結(jié)果數(shù)量限制?!皺z索接口代理”是負(fù)責(zé)將用戶(hù)的檢索請(qǐng)求“翻譯”成滿(mǎn)足不同搜索引擎“本地化”要求格式?!敖Y(jié)果顯示代理”是負(fù)責(zé)所有元搜索引擎檢索結(jié)果的去重、合并和輸出處理等。
6.4.3 結(jié)構(gòu)特點(diǎn)方面的比較分析
(1)獨(dú)立搜索引擎的結(jié)構(gòu)中各有各的優(yōu)缺點(diǎn)和側(cè)重。
比如Altavista是以快速、強(qiáng)有力的關(guān)鍵詞搜索引擎,能完成極復(fù)雜的搜索,且搜索結(jié)果令人滿(mǎn)意;搜狐的站點(diǎn)內(nèi)容豐富、搜索功能較強(qiáng);雅虎對(duì)于多數(shù)人較熟悉,比較權(quán)威;若是一名科技人員,Infoseek在學(xué)術(shù)資料的查詢(xún)方面則更加有利。但它們各有信息覆蓋面上的局限性。
(2)元搜索引擎的結(jié)構(gòu)中技術(shù)重心在查詢(xún)前的處理(檢索請(qǐng)求提交機(jī)制和檢索接口代理)和結(jié)果的集成。
元搜索引擎可以靈活地選擇所要采用的獨(dú)立搜索引擎。它通過(guò)選擇那些典型的、性能優(yōu)越的獨(dú)立搜索引擎。這種強(qiáng)強(qiáng)聯(lián)合的結(jié)果保證了搜索結(jié)果的權(quán)威性和可靠性。它還可以充分發(fā)揮各個(gè)獨(dú)立搜索引擎在某個(gè)搜索領(lǐng)域的功能,彌補(bǔ)獨(dú)立搜索引擎信息覆蓋面上的局限性。
(3)信息覆蓋面廣。
元搜索引擎通常調(diào)用它自己認(rèn)為比較好的幾個(gè)搜索引擎,并且提供給用戶(hù)在一定范圍內(nèi)選擇搜索引擎的功能。還有些元搜索引擎為用戶(hù)支持更加專(zhuān)業(yè)的搜索引擎,比如MP3,各種專(zhuān)業(yè)的論文查找等。這使用戶(hù)可以根據(jù)自己的喜好和要查詢(xún)的內(nèi)容選擇相應(yīng)的搜索引擎。
(4)搜索結(jié)果的權(quán)威性和可靠性。
獨(dú)立搜索引擎需要一定的周期來(lái)更新索引數(shù)據(jù)庫(kù),它所收集的信息各有側(cè)重面,元搜索引擎選調(diào)多個(gè)獨(dú)立搜索引擎獲取搜索結(jié)果,這不但獲得了信息的互補(bǔ)性,而且,與獨(dú)立搜索引擎相比增加了信息的精度和新鮮度。如果獨(dú)立搜索引擎中同時(shí)出現(xiàn)同樣的搜索結(jié)果,這可以確定所搜索的結(jié)果是尤為重要的。同時(shí)也顯示了搜索結(jié)果的排序之公正。更加保證了用戶(hù)所得到的元搜索結(jié)果的可靠性。
(5)易維護(hù)性。
元搜索引擎省掉了獨(dú)立搜索引擎中的收集和存儲(chǔ)網(wǎng)頁(yè)、建立索引數(shù)據(jù)庫(kù)的工作。它本身不需要去維護(hù),只需知道它的調(diào)用接口。它可以把主要精力放在搜索引擎的選擇、查詢(xún)請(qǐng)求的優(yōu)化和搜索結(jié)果的優(yōu)化上。通常的元搜索引擎都提供了相對(duì)應(yīng)的優(yōu)化機(jī)制。
以上比較了元搜索引擎和獨(dú)立搜索引擎,可以看出,元搜索引擎主要用于提高搜索的廣度。當(dāng)用戶(hù)使用獨(dú)立搜索引擎查詢(xún)時(shí)得不到所需資料時(shí),可以用元搜索引擎。當(dāng)用戶(hù)需快速查詢(xún)到某領(lǐng)域的某課題的概述時(shí),也可以用元搜索引擎。當(dāng)用戶(hù)對(duì)其他搜索引擎不熟悉的時(shí)候,還可以使用元搜索引擎作為通向其他搜索引擎的門(mén)戶(hù)。下面就詳細(xì)介紹一下Dogpile,以深入了解元搜索引擎的特點(diǎn)與構(gòu)造。
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。