一種新的期刊評價指標特征因子原理及實證研究_第1頁
一種新的期刊評價指標特征因子原理及實證研究_第2頁
一種新的期刊評價指標特征因子原理及實證研究_第3頁
一種新的期刊評價指標特征因子原理及實證研究_第4頁
一種新的期刊評價指標特征因子原理及實證研究_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

一種新的期刊評價指標特征因子原理及實證研究

1alrak算法及改進的研究方法如何評價科學(xué)期刊是一個關(guān)系文學(xué)、新聞、出版和科學(xué)的主題。文獻計量專家從不同角度提出了許多計量指標,如傳統(tǒng)的載文量、被引次數(shù)、影響因子以及近些年提出的h指數(shù)以及g指數(shù)、A指數(shù)、r指數(shù)等類h指數(shù)。2008年,Nature報道了Scopus數(shù)據(jù)庫的期刊評價新指數(shù)SCImagoJournalRank(SJR),SJR使用類似于Google網(wǎng)頁和排名的PageRank算法,計算時給予來自高聲望期刊的引用更高的權(quán)重,是一個同時衡量了期刊被引數(shù)量和質(zhì)量的指標。2009年1月18日,PLoS(PublicLibraryofScienceONE)推出“單篇文章影響力”,新的“文章級指標計劃”將為PLoS數(shù)千篇文章中的每一篇都標上一系列數(shù)據(jù)指標,這些指標包括使用數(shù)據(jù)、頁面瀏覽量、從Scopus和CrossRef獲得的引用次數(shù)、社會網(wǎng)絡(luò)鏈接、媒體報道、評論以及讀者評分。這兩個新的評價方式被認為是對湯姆森路透科技集團JournalCitationReport(JCR)影響因子的挑戰(zhàn)。作為回應(yīng),湯姆森路透科技集團于2009年1月22日推出了JCR的增強功能,2007版的JCR報告除了增加五年影響因子、五年影響因子趨勢圖、影響因子箱線圖、分類排名表等功能外,還新增了兩個評價指標:EigenfactorScore和ArticleInfluenceScore。2期刊影響力評價Eigenfactor中的詞頭“eigen-”來源于德語,是characteristic(本征、特征、固有)的意思,國內(nèi)學(xué)者任勝利將其翻譯為“特征因子”,本文也沿用這一譯名。特征因子由華盛頓大學(xué)的CarlBergstrom和JevinWest等人提出,它的基本思路是:影響因子在計算期刊的引用次數(shù)時,將來自所有刊物的引用都平等看待,而實際上,對于像Nature和Science這樣有影響力的大刊,來自它們的引用顯然比一些小刊的引用分量要大得多。特征因子的制定就是考慮到不同層次期刊的引用權(quán)重,通過引文構(gòu)建起文獻引用網(wǎng)絡(luò),對期刊的影響力進行評價。特征因子的工作原理是這樣的:假設(shè)一位研究者隨機選擇某年(比如2007年)出版的一份刊物的某篇文章,任意選擇該文章的一篇參考文獻,跟隨引文鏈接進入下一份期刊,然后從2007年版的這份期刊中再任意選擇文章,繼續(xù)隨機選擇引文進入下一份期刊,研究者不停地重復(fù)這個行為,很顯然,如果這個動作無限地進行下去,越是影響力大的期刊,研究者進入的次數(shù)越多。研究者進入某個期刊幾率的百分值,就是該期刊的特征因子分值。例如,2008年Nature的特征因子分值是1.76407,這表明研究者在JCR收錄的SCI和SSCI文章中按照上述的模式進行漫游,有1.76407%的幾率進入Nature。從特征因子的工作原理可以看出:特征因子分值評價的是期刊的整體影響力,會受到期刊刊文數(shù)量的影響,如果兩種期刊的質(zhì)量相當,一種期刊的刊文數(shù)量是另一種的2倍,那么它的特征因子也會是后者的2倍。2008年度影響因子最高的JCR期刊是CA-CANCERJCLIN,高達74.575,但是由于它的刊文量只有19篇,因此它的特征因子分值只有0.03648。為了評價期刊論文的平均影響力,JCR還提出了論文影響分值(ArticleInfluenceScore)指標,論文影響分值和傳統(tǒng)的影響因子相對應(yīng),它的計算方法是用特征因子除以期刊所發(fā)表論文的規(guī)范化比值(即該刊發(fā)表論文占所有論文的比例)。論文影響分值的平均值為11,分值大于1表明期刊中每篇論文的影響力高于平均水平,反之則表明期刊中每篇論文的影響力低于平均水平。Nature雜志2008年度的論文影響分值為17.278,這說明Nature每篇文章的影響力是JCR收錄期刊平均值的17倍左右。3小期刊群的研究過程通過數(shù)學(xué)方法,可以模擬上述研究者在文獻網(wǎng)絡(luò)的漫游過程,從而計算出期刊的特征因子。West和Bergstrom以湯姆森路透科技集團的《期刊引證報告》(JCR)為數(shù)據(jù)源,構(gòu)建了JCR收錄期刊(包括自然科學(xué)和社會科學(xué)期刊)剔除自引的5年期引文矩陣,用類似于PageRank的算法迭代計算出期刊的權(quán)重影響值,通過權(quán)重影響值計算出期刊的特征因子。下面我們就采用這個算法,計算2008-2009年度CSSCI收錄的18種圖書情報學(xué)期刊的特征因子分值和論文影響分值。由于2008年后的數(shù)據(jù)還不完整,我們采用2007年度的數(shù)據(jù)。具體方法是:從“中國引文數(shù)據(jù)庫”分別查得18種期刊2007年對其他期刊2002-2006年度文章的引用情況,將結(jié)果用Excel進行處理之后,得到18種期刊排除自引后的互引矩陣和2002-2006年發(fā)表文章總數(shù),如表1所示:為了方便顯示,在下面的計算中,我們僅取前五種期刊的互引數(shù)據(jù)為例,具體步驟如下:(1)構(gòu)造互引矩陣Z,Zi,j表示期刊j對期刊i的引用次數(shù)。由于排除了自引,所以Z的對角線上全為0。(2)對Z進行規(guī)范化,也就是用每列被引數(shù)除以該列的總和,即:Hi,j表示期刊i被期刊j的引用次數(shù)占期刊j總引用數(shù)的比例,由此得到規(guī)范化矩陣:(3)處理懸點(DanglingNodes)。有些期刊從未引用過其他期刊,這些期刊對應(yīng)的列全是0,這就是懸點。懸點所在列可以用一個由0或1組成的行向量d表示,其中1對應(yīng)懸點所在列,0對應(yīng)非懸點所在列。由于我們的例子中不存在懸點,所以該行向量d=(4)計算文章向量。設(shè)A是所有期刊發(fā)表的文章數(shù),文章向量a是在5年內(nèi)每個期刊發(fā)表文章比例的列向量(用每個期刊發(fā)表的文章總數(shù)除以A,總值為1)。在本例中:A=799+854+768+2438+949=5808,文章向量就是:(5)將矩陣H中的懸點用文章向量替代,構(gòu)建隨機矩陣H′,矩陣H′對應(yīng)著模型研究者在科學(xué)文獻中隨機漫游的過程。由于本例中沒有懸點,所以H′和H是相等的:(6)構(gòu)建過渡矩陣P。P=αH′+(1-α)a.eT在上式中,eT是一個全為1的行向量,a是規(guī)范化的文章向量,因而a.eT就是擁有同樣列a的矩陣。α是阻尼因子,一般取0.85,矩陣P同google用來計算PageRank的google矩陣相類似,對應(yīng)著如下的隨機過程:研究者以α的概率跟隨鏈接進入下一個期刊,以1-α的概率隨機跳轉(zhuǎn)到另外的期刊,這個期刊的選擇是根據(jù)其刊發(fā)文章總數(shù)占所有文章的比例而定的。之所以增加突然跳轉(zhuǎn)的隨機過程,是為了處理類似懸點的小期刊群,比如某個小期刊群和整個引用網(wǎng)絡(luò)只通過少數(shù)鏈接相連,那么一旦漫游行為進入這個小圈子,就會陷入其中很久,從而高估了這個小期刊群的影響力,增加跳轉(zhuǎn)的行為則可以減少這方面的影響。從矩陣P的構(gòu)建可以知道它是一個不可約的、非周期性馬爾科夫鏈,根據(jù)Perron-Frobenius定理,它有一個唯一的主特征向量π*,π*對應(yīng)著在矩陣P表示的隨機過程中,研究者在每個期刊停留的時間比例,因此可以作為評價期刊影響力的權(quán)重,也稱影響向量。設(shè)π(0)=[1/5,1/5,1/5,1/5,1/5],通過下面的方程進行迭代計算,可以收斂到矩陣P的主特征向量:π(k+1)=αHπ(k)+[αd.π(k)+(1-α)]a取ε=0.00001,每次迭代之后,檢查π(k+1)-π(k)是否小于ε,如果小于,那么π*≈π(k+1)就是影響向量。在本例中,經(jīng)過12次迭代,會得到穩(wěn)定的影響向量:(7)計算特征因子分值和論文影響分值特征因子的值向量是矩陣H和π*的點積,經(jīng)過規(guī)范化之后乘以100,換算為百分值,即:本例中的特征因子分值向量就是:期刊論文影響分值由下式計算:其中EFi是期刊i的特征因子值,ai是規(guī)范化后的文章向量對應(yīng)于期刊i的分量。從論文影響分值的計算公式可以看出:分子是期刊i的特征向量,乘以0.01之后就是研究者通過引文在文獻網(wǎng)絡(luò)之間隨機漫游時進入期刊i的幾率,分母代表該期刊發(fā)表文章總數(shù)占所有文章數(shù)的比例。顯然,對于一篇平均水平的期刊,這個比值應(yīng)該等于1。本例中的論文影響分值向量是:通過上面的描述的算法可以看出,特征因子具有很多優(yōu)點:(1)對引文的處理方式更先進,同時體現(xiàn)了引文的數(shù)量和質(zhì)量。(2)以五年作為引文時段,更全面地反映在引文產(chǎn)生時間上各具特點的不同學(xué)科論文的被引情況。(3)對特征因子的計算排除了自引,避免了期刊為了提高排名而鼓勵自引。(4)發(fā)文量較少的綜述類期刊的影響力有可能被影響因子所夸大,特征因子的計算中用引用期刊的影響力除以期刊的總引文數(shù),調(diào)整了不同學(xué)科和不同類型期刊之間的引用差異。(5)特征因子算法對懸點和類懸點,也就是那些和網(wǎng)絡(luò)其他部分聯(lián)系很少的點或者點集進行了特殊處理,避免了懸點和類懸點期刊對結(jié)果的影響。4期刊特征因子與綜合指數(shù)的關(guān)系相對于其他傳統(tǒng)期刊評價指標,特征因子分值和論文影響分值的計算比較復(fù)雜。為方便計算,我們用軟件實現(xiàn)了上述算法,計算軟件可以在/files/EFCalculator.rar下載。通過該軟件,我們計算出2008-2009年CSSCI收錄的18種圖書情報學(xué)期刊的特征因子分值和論文影響分值,如表2所示。表2還列出了其他一些期刊評價指標,其中CSSCI排名由中國社會科學(xué)研究評價中心根據(jù)各學(xué)科期刊總被引次數(shù)、2004-2006三年他引影響因子及其加權(quán)值數(shù)據(jù)得出,綜合指數(shù)由5項傳統(tǒng)指標和5項新指標加權(quán)歸一化處理后得出,h指數(shù)的數(shù)值取自趙基明等人的論文,影響因子來源于中國科學(xué)技術(shù)信息研究所發(fā)布的2006年度《中國期刊引證報告》。從表2可以看到,CSSCI排名前7的期刊論文影響分值都在1以上,其余期刊的論文影響分值都在1以下,這表明論文影響分值對期刊質(zhì)量的評價和CSSCI是大體一致的。此外還可以發(fā)現(xiàn),情報和偏情報類的期刊的特征因子分值普遍較高,這與我們?nèi)訕颖据^少有關(guān),由于情報類期刊發(fā)文數(shù)量相對較多,導(dǎo)致情報類期刊特征因子分值偏高,而情報類期刊之間較多的互引又增加了對情報類期刊特征因子分值的正反饋。有國內(nèi)研究者通過分析我國大陸地區(qū)被SCI(E)收錄的64種期刊的數(shù)據(jù),得出結(jié)論:特征因子與期刊論文數(shù)量、總被引以及h指數(shù)具有較強的相關(guān)性。但論文影響分值和其他期刊評價指標的關(guān)系還未見報道。我們利用表2的數(shù)據(jù),通過SPSS軟件進行分析,得到特征因子分值和綜合指數(shù)以及論文影響分值和影響因子、綜合指數(shù)、h指數(shù)的皮爾遜相關(guān)矩陣,如表3、表4所示。從表3和表4可以看出,特征因子分值與綜合指數(shù)具有較強的相關(guān)性,可見特征因子分值和綜合指數(shù)一樣,可以用于評價期刊的總體影響力。論文影響分值和影響因子的相關(guān)性最強,與h指數(shù)、綜合指數(shù)也具有較強的線性相關(guān)性,不過由于我們的樣本數(shù)量不大,未能包含所有類型的期刊,因此論文影響分值和h指數(shù)、綜合指數(shù)的相關(guān)性只代表期刊文章數(shù)相差不大情況下的結(jié)論。5缺少有影響的研究文獻總被引次數(shù)和論文數(shù)量學(xué)術(shù)文獻通過引文形成文獻網(wǎng)絡(luò),通過研究者在文獻網(wǎng)絡(luò)中每種期刊停留時間,可以計算出期刊的特征因子和論文影響分值。特征因子兼顧引文的數(shù)量和質(zhì)量,能夠很好地反映優(yōu)秀期刊的真實學(xué)術(shù)地位。但是,特征因子也有不足之處:首先,特征因子分值和論文數(shù)量、總被引次數(shù)相關(guān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論