利用引文庫構(gòu)造同被引矩陣的原理及特殊數(shù)據(jù)的處理
5.2.1 利用引文庫構(gòu)造同被引矩陣的原理及特殊數(shù)據(jù)的處理
收集著者同被引數(shù)據(jù)的過程就是統(tǒng)計(jì)兩兩著者之間的同被引強(qiáng)度、形成同被引矩陣的過程。
需要注意的是,關(guān)于著者之間的同被引強(qiáng)度,國內(nèi)的文獻(xiàn)計(jì)量學(xué)方面的著作很多都把兩個(gè)著者的同被引強(qiáng)度解釋為同時(shí)引用這兩個(gè)著者發(fā)表的文獻(xiàn)的作者的數(shù)量,這是不符合實(shí)際的。根據(jù)McCain 1990年所做的關(guān)于著者同被引分析技術(shù)的綜述[1],通過SCI獲取兩個(gè)著者的同被引頻次時(shí),解釋為同時(shí)引用這兩個(gè)著者的文獻(xiàn)的篇數(shù)。因此,著者同被引頻次(強(qiáng)度)應(yīng)該以論文數(shù)量來計(jì)量,而不應(yīng)該以著者數(shù)量來計(jì)量。同樣地,期刊同被引強(qiáng)度、類目同被引強(qiáng)度都應(yīng)該以同時(shí)引用它們的論文的數(shù)量來計(jì)量,實(shí)際上,《期刊引證報(bào)告》(JCR)對某一類目被其他類目引用的頻次也是以文獻(xiàn)數(shù)量來計(jì)量的。
統(tǒng)計(jì)著者同被引強(qiáng)度的原理可歸結(jié)為:
①找出引用了著者i的文獻(xiàn)集合DBi;
②找出引用了著者j的文獻(xiàn)集合DBj;
③比較DBi與DBj中的對象,相同的文獻(xiàn)數(shù)目即為著者i與j的同被引強(qiáng)度。
為了便于分析,我們統(tǒng)計(jì)到N個(gè)著者兩兩之間的同被引強(qiáng)度后,常把這些數(shù)據(jù)排列成規(guī)定的形式,表的上方從左到右、表的左方從上到下依次列出分析對象序號1,2,…,N,表中的數(shù)據(jù)Xij表示第i個(gè)與第j個(gè)著者的同被引強(qiáng)度(i,j=1,2,…,N),如表5-3所示。
在進(jìn)行數(shù)據(jù)處理時(shí),如果不考慮表頭,將表中數(shù)據(jù)單獨(dú)列出就是同被引數(shù)據(jù)的矩陣。顯然,同被引矩陣是對稱方陣(行數(shù)與列數(shù)相同)(Xij=Xji;i,j=1,2,…,N)。當(dāng)i=j(luò)時(shí),Xij也就是主對角線中的數(shù)據(jù),實(shí)際上表示的是著者自己與自己之間的同被引強(qiáng)度。究竟應(yīng)該怎么算著者和自己之間的同被引強(qiáng)度,剛開始并沒有一個(gè)明確的共識。H.D.White和B.C.Griffith在1981年發(fā)表的文章中,用他們的矩陣中最高的同被引頻次來替代全部對角線中的數(shù)據(jù)[17]。隨著著者同被引分析的發(fā)展,更多的學(xué)者認(rèn)為把其計(jì)零或作為缺失值比較合適[1]。
表5-3 著者之間同被引統(tǒng)計(jì)表樣例
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請告知,我們將盡快刪除相關(guān)內(nèi)容。