一種新的期刊評價(jià)指標(biāo)特征因子原理及實(shí)證研究_第1頁
一種新的期刊評價(jià)指標(biāo)特征因子原理及實(shí)證研究_第2頁
一種新的期刊評價(jià)指標(biāo)特征因子原理及實(shí)證研究_第3頁
一種新的期刊評價(jià)指標(biāo)特征因子原理及實(shí)證研究_第4頁
一種新的期刊評價(jià)指標(biāo)特征因子原理及實(shí)證研究_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

一種新的期刊評價(jià)指標(biāo)特征因子原理及實(shí)證研究

1alrak算法及改進(jìn)的研究方法如何評價(jià)科學(xué)期刊是一個(gè)關(guān)系文學(xué)、新聞、出版和科學(xué)的主題。文獻(xiàn)計(jì)量專家從不同角度提出了許多計(jì)量指標(biāo),如傳統(tǒng)的載文量、被引次數(shù)、影響因子以及近些年提出的h指數(shù)以及g指數(shù)、A指數(shù)、r指數(shù)等類h指數(shù)。2008年,Nature報(bào)道了Scopus數(shù)據(jù)庫的期刊評價(jià)新指數(shù)SCImagoJournalRank(SJR),SJR使用類似于Google網(wǎng)頁和排名的PageRank算法,計(jì)算時(shí)給予來自高聲望期刊的引用更高的權(quán)重,是一個(gè)同時(shí)衡量了期刊被引數(shù)量和質(zhì)量的指標(biāo)。2009年1月18日,PLoS(PublicLibraryofScienceONE)推出“單篇文章影響力”,新的“文章級指標(biāo)計(jì)劃”將為PLoS數(shù)千篇文章中的每一篇都標(biāo)上一系列數(shù)據(jù)指標(biāo),這些指標(biāo)包括使用數(shù)據(jù)、頁面瀏覽量、從Scopus和CrossRef獲得的引用次數(shù)、社會(huì)網(wǎng)絡(luò)鏈接、媒體報(bào)道、評論以及讀者評分。這兩個(gè)新的評價(jià)方式被認(rèn)為是對湯姆森路透科技集團(tuán)JournalCitationReport(JCR)影響因子的挑戰(zhàn)。作為回應(yīng),湯姆森路透科技集團(tuán)于2009年1月22日推出了JCR的增強(qiáng)功能,2007版的JCR報(bào)告除了增加五年影響因子、五年影響因子趨勢圖、影響因子箱線圖、分類排名表等功能外,還新增了兩個(gè)評價(jià)指標(biāo):EigenfactorScore和ArticleInfluenceScore。2期刊影響力評價(jià)Eigenfactor中的詞頭“eigen-”來源于德語,是characteristic(本征、特征、固有)的意思,國內(nèi)學(xué)者任勝利將其翻譯為“特征因子”,本文也沿用這一譯名。特征因子由華盛頓大學(xué)的CarlBergstrom和JevinWest等人提出,它的基本思路是:影響因子在計(jì)算期刊的引用次數(shù)時(shí),將來自所有刊物的引用都平等看待,而實(shí)際上,對于像Nature和Science這樣有影響力的大刊,來自它們的引用顯然比一些小刊的引用分量要大得多。特征因子的制定就是考慮到不同層次期刊的引用權(quán)重,通過引文構(gòu)建起文獻(xiàn)引用網(wǎng)絡(luò),對期刊的影響力進(jìn)行評價(jià)。特征因子的工作原理是這樣的:假設(shè)一位研究者隨機(jī)選擇某年(比如2007年)出版的一份刊物的某篇文章,任意選擇該文章的一篇參考文獻(xiàn),跟隨引文鏈接進(jìn)入下一份期刊,然后從2007年版的這份期刊中再任意選擇文章,繼續(xù)隨機(jī)選擇引文進(jìn)入下一份期刊,研究者不停地重復(fù)這個(gè)行為,很顯然,如果這個(gè)動(dòng)作無限地進(jìn)行下去,越是影響力大的期刊,研究者進(jìn)入的次數(shù)越多。研究者進(jìn)入某個(gè)期刊幾率的百分值,就是該期刊的特征因子分值。例如,2008年Nature的特征因子分值是1.76407,這表明研究者在JCR收錄的SCI和SSCI文章中按照上述的模式進(jìn)行漫游,有1.76407%的幾率進(jìn)入Nature。從特征因子的工作原理可以看出:特征因子分值評價(jià)的是期刊的整體影響力,會(huì)受到期刊刊文數(shù)量的影響,如果兩種期刊的質(zhì)量相當(dāng),一種期刊的刊文數(shù)量是另一種的2倍,那么它的特征因子也會(huì)是后者的2倍。2008年度影響因子最高的JCR期刊是CA-CANCERJCLIN,高達(dá)74.575,但是由于它的刊文量只有19篇,因此它的特征因子分值只有0.03648。為了評價(jià)期刊論文的平均影響力,JCR還提出了論文影響分值(ArticleInfluenceScore)指標(biāo),論文影響分值和傳統(tǒng)的影響因子相對應(yīng),它的計(jì)算方法是用特征因子除以期刊所發(fā)表論文的規(guī)范化比值(即該刊發(fā)表論文占所有論文的比例)。論文影響分值的平均值為11,分值大于1表明期刊中每篇論文的影響力高于平均水平,反之則表明期刊中每篇論文的影響力低于平均水平。Nature雜志2008年度的論文影響分值為17.278,這說明Nature每篇文章的影響力是JCR收錄期刊平均值的17倍左右。3小期刊群的研究過程通過數(shù)學(xué)方法,可以模擬上述研究者在文獻(xiàn)網(wǎng)絡(luò)的漫游過程,從而計(jì)算出期刊的特征因子。West和Bergstrom以湯姆森路透科技集團(tuán)的《期刊引證報(bào)告》(JCR)為數(shù)據(jù)源,構(gòu)建了JCR收錄期刊(包括自然科學(xué)和社會(huì)科學(xué)期刊)剔除自引的5年期引文矩陣,用類似于PageRank的算法迭代計(jì)算出期刊的權(quán)重影響值,通過權(quán)重影響值計(jì)算出期刊的特征因子。下面我們就采用這個(gè)算法,計(jì)算2008-2009年度CSSCI收錄的18種圖書情報(bào)學(xué)期刊的特征因子分值和論文影響分值。由于2008年后的數(shù)據(jù)還不完整,我們采用2007年度的數(shù)據(jù)。具體方法是:從“中國引文數(shù)據(jù)庫”分別查得18種期刊2007年對其他期刊2002-2006年度文章的引用情況,將結(jié)果用Excel進(jìn)行處理之后,得到18種期刊排除自引后的互引矩陣和2002-2006年發(fā)表文章總數(shù),如表1所示:為了方便顯示,在下面的計(jì)算中,我們僅取前五種期刊的互引數(shù)據(jù)為例,具體步驟如下:(1)構(gòu)造互引矩陣Z,Zi,j表示期刊j對期刊i的引用次數(shù)。由于排除了自引,所以Z的對角線上全為0。(2)對Z進(jìn)行規(guī)范化,也就是用每列被引數(shù)除以該列的總和,即:Hi,j表示期刊i被期刊j的引用次數(shù)占期刊j總引用數(shù)的比例,由此得到規(guī)范化矩陣:(3)處理懸點(diǎn)(DanglingNodes)。有些期刊從未引用過其他期刊,這些期刊對應(yīng)的列全是0,這就是懸點(diǎn)。懸點(diǎn)所在列可以用一個(gè)由0或1組成的行向量d表示,其中1對應(yīng)懸點(diǎn)所在列,0對應(yīng)非懸點(diǎn)所在列。由于我們的例子中不存在懸點(diǎn),所以該行向量d=(4)計(jì)算文章向量。設(shè)A是所有期刊發(fā)表的文章數(shù),文章向量a是在5年內(nèi)每個(gè)期刊發(fā)表文章比例的列向量(用每個(gè)期刊發(fā)表的文章總數(shù)除以A,總值為1)。在本例中:A=799+854+768+2438+949=5808,文章向量就是:(5)將矩陣H中的懸點(diǎn)用文章向量替代,構(gòu)建隨機(jī)矩陣H′,矩陣H′對應(yīng)著模型研究者在科學(xué)文獻(xiàn)中隨機(jī)漫游的過程。由于本例中沒有懸點(diǎn),所以H′和H是相等的:(6)構(gòu)建過渡矩陣P。P=αH′+(1-α)a.eT在上式中,eT是一個(gè)全為1的行向量,a是規(guī)范化的文章向量,因而a.eT就是擁有同樣列a的矩陣。α是阻尼因子,一般取0.85,矩陣P同google用來計(jì)算PageRank的google矩陣相類似,對應(yīng)著如下的隨機(jī)過程:研究者以α的概率跟隨鏈接進(jìn)入下一個(gè)期刊,以1-α的概率隨機(jī)跳轉(zhuǎn)到另外的期刊,這個(gè)期刊的選擇是根據(jù)其刊發(fā)文章總數(shù)占所有文章的比例而定的。之所以增加突然跳轉(zhuǎn)的隨機(jī)過程,是為了處理類似懸點(diǎn)的小期刊群,比如某個(gè)小期刊群和整個(gè)引用網(wǎng)絡(luò)只通過少數(shù)鏈接相連,那么一旦漫游行為進(jìn)入這個(gè)小圈子,就會(huì)陷入其中很久,從而高估了這個(gè)小期刊群的影響力,增加跳轉(zhuǎn)的行為則可以減少這方面的影響。從矩陣P的構(gòu)建可以知道它是一個(gè)不可約的、非周期性馬爾科夫鏈,根據(jù)Perron-Frobenius定理,它有一個(gè)唯一的主特征向量π*,π*對應(yīng)著在矩陣P表示的隨機(jī)過程中,研究者在每個(gè)期刊停留的時(shí)間比例,因此可以作為評價(jià)期刊影響力的權(quán)重,也稱影響向量。設(shè)π(0)=[1/5,1/5,1/5,1/5,1/5],通過下面的方程進(jìn)行迭代計(jì)算,可以收斂到矩陣P的主特征向量:π(k+1)=αHπ(k)+[αd.π(k)+(1-α)]a取ε=0.00001,每次迭代之后,檢查π(k+1)-π(k)是否小于ε,如果小于,那么π*≈π(k+1)就是影響向量。在本例中,經(jīng)過12次迭代,會(huì)得到穩(wěn)定的影響向量:(7)計(jì)算特征因子分值和論文影響分值特征因子的值向量是矩陣H和π*的點(diǎn)積,經(jīng)過規(guī)范化之后乘以100,換算為百分值,即:本例中的特征因子分值向量就是:期刊論文影響分值由下式計(jì)算:其中EFi是期刊i的特征因子值,ai是規(guī)范化后的文章向量對應(yīng)于期刊i的分量。從論文影響分值的計(jì)算公式可以看出:分子是期刊i的特征向量,乘以0.01之后就是研究者通過引文在文獻(xiàn)網(wǎng)絡(luò)之間隨機(jī)漫游時(shí)進(jìn)入期刊i的幾率,分母代表該期刊發(fā)表文章總數(shù)占所有文章數(shù)的比例。顯然,對于一篇平均水平的期刊,這個(gè)比值應(yīng)該等于1。本例中的論文影響分值向量是:通過上面的描述的算法可以看出,特征因子具有很多優(yōu)點(diǎn):(1)對引文的處理方式更先進(jìn),同時(shí)體現(xiàn)了引文的數(shù)量和質(zhì)量。(2)以五年作為引文時(shí)段,更全面地反映在引文產(chǎn)生時(shí)間上各具特點(diǎn)的不同學(xué)科論文的被引情況。(3)對特征因子的計(jì)算排除了自引,避免了期刊為了提高排名而鼓勵(lì)自引。(4)發(fā)文量較少的綜述類期刊的影響力有可能被影響因子所夸大,特征因子的計(jì)算中用引用期刊的影響力除以期刊的總引文數(shù),調(diào)整了不同學(xué)科和不同類型期刊之間的引用差異。(5)特征因子算法對懸點(diǎn)和類懸點(diǎn),也就是那些和網(wǎng)絡(luò)其他部分聯(lián)系很少的點(diǎn)或者點(diǎn)集進(jìn)行了特殊處理,避免了懸點(diǎn)和類懸點(diǎn)期刊對結(jié)果的影響。4期刊特征因子與綜合指數(shù)的關(guān)系相對于其他傳統(tǒng)期刊評價(jià)指標(biāo),特征因子分值和論文影響分值的計(jì)算比較復(fù)雜。為方便計(jì)算,我們用軟件實(shí)現(xiàn)了上述算法,計(jì)算軟件可以在/files/EFCalculator.rar下載。通過該軟件,我們計(jì)算出2008-2009年CSSCI收錄的18種圖書情報(bào)學(xué)期刊的特征因子分值和論文影響分值,如表2所示。表2還列出了其他一些期刊評價(jià)指標(biāo),其中CSSCI排名由中國社會(huì)科學(xué)研究評價(jià)中心根據(jù)各學(xué)科期刊總被引次數(shù)、2004-2006三年他引影響因子及其加權(quán)值數(shù)據(jù)得出,綜合指數(shù)由5項(xiàng)傳統(tǒng)指標(biāo)和5項(xiàng)新指標(biāo)加權(quán)歸一化處理后得出,h指數(shù)的數(shù)值取自趙基明等人的論文,影響因子來源于中國科學(xué)技術(shù)信息研究所發(fā)布的2006年度《中國期刊引證報(bào)告》。從表2可以看到,CSSCI排名前7的期刊論文影響分值都在1以上,其余期刊的論文影響分值都在1以下,這表明論文影響分值對期刊質(zhì)量的評價(jià)和CSSCI是大體一致的。此外還可以發(fā)現(xiàn),情報(bào)和偏情報(bào)類的期刊的特征因子分值普遍較高,這與我們?nèi)訕颖据^少有關(guān),由于情報(bào)類期刊發(fā)文數(shù)量相對較多,導(dǎo)致情報(bào)類期刊特征因子分值偏高,而情報(bào)類期刊之間較多的互引又增加了對情報(bào)類期刊特征因子分值的正反饋。有國內(nèi)研究者通過分析我國大陸地區(qū)被SCI(E)收錄的64種期刊的數(shù)據(jù),得出結(jié)論:特征因子與期刊論文數(shù)量、總被引以及h指數(shù)具有較強(qiáng)的相關(guān)性。但論文影響分值和其他期刊評價(jià)指標(biāo)的關(guān)系還未見報(bào)道。我們利用表2的數(shù)據(jù),通過SPSS軟件進(jìn)行分析,得到特征因子分值和綜合指數(shù)以及論文影響分值和影響因子、綜合指數(shù)、h指數(shù)的皮爾遜相關(guān)矩陣,如表3、表4所示。從表3和表4可以看出,特征因子分值與綜合指數(shù)具有較強(qiáng)的相關(guān)性,可見特征因子分值和綜合指數(shù)一樣,可以用于評價(jià)期刊的總體影響力。論文影響分值和影響因子的相關(guān)性最強(qiáng),與h指數(shù)、綜合指數(shù)也具有較強(qiáng)的線性相關(guān)性,不過由于我們的樣本數(shù)量不大,未能包含所有類型的期刊,因此論文影響分值和h指數(shù)、綜合指數(shù)的相關(guān)性只代表期刊文章數(shù)相差不大情況下的結(jié)論。5缺少有影響的研究文獻(xiàn)總被引次數(shù)和論文數(shù)量學(xué)術(shù)文獻(xiàn)通過引文形成文獻(xiàn)網(wǎng)絡(luò),通過研究者在文獻(xiàn)網(wǎng)絡(luò)中每種期刊停留時(shí)間,可以計(jì)算出期刊的特征因子和論文影響分值。特征因子兼顧引文的數(shù)量和質(zhì)量,能夠很好地反映優(yōu)秀期刊的真實(shí)學(xué)術(shù)地位。但是,特征因子也有不足之處:首先,特征因子分值和論文數(shù)量、總被引次數(shù)相關(guān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論