作者共被引分析方法進(jìn)展研究(_第1頁(yè)
作者共被引分析方法進(jìn)展研究(_第2頁(yè)
作者共被引分析方法進(jìn)展研究(_第3頁(yè)
作者共被引分析方法進(jìn)展研究(_第4頁(yè)
作者共被引分析方法進(jìn)展研究(_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、作者共被引分析方法進(jìn)展研究*苑彬成中國(guó)科學(xué)院研究生院北京1()0049 國(guó)家科學(xué)圖書館成都分館成都610041 方曙國(guó)家科學(xué)圖卩館成都分館 成都610041摘要本文綜述了近兒年來(lái)作者共被引分析在研究方法上而臨的挑戰(zhàn),歸納了其最新的研究進(jìn)展和發(fā)展方 向,并就新的發(fā)展階段下該方法的優(yōu)化問(wèn)題提出了兒點(diǎn)注意事項(xiàng)。垠后我們指出,不論是間接法還是直接 法,任何一種方法的突破都能進(jìn)一步擴(kuò)展作者共被引分析的應(yīng)用范由,并將作者共被引分析推向深入,也 將使最后得到的分析結(jié)果更客觀、更可靠。關(guān)鍵詞作者共被引分析徳瑞克賽模式相似性度量網(wǎng)絡(luò)尋址定位分類號(hào)g350research in developments of a

2、uthor co-citation analysisyuan binchcnggraduate university of chinese academy of science, beijing 100049 chengdu library of chinese academy of science, chengdu 610041 fang shuchengdu library of chinese academy of science, chengdu 610041abstract in this article, we summarize new challenges in author

3、co-citation analysis (aca) in recent years, and summarize its latest developments and trends; finally we provide some suggestions for its optimization under the new phase we believe that no matter direct methods oindirect ones, any progress in these methods would enlarge the applying area of aca, an

4、d advance the development of aca, and by applying it we can get more object and reliable results.keywords author co-citation analysis drexel model similarity measures pfnets1. 作者共被引分析概述1981年,美國(guó)費(fèi)城的德瑞克賽人學(xué)成為作者共被引分析(authorco-citationanalysis, aca)技術(shù)誕生的搖籃。該校的white和griffith合作發(fā)表了作者共被引:科學(xué)結(jié)構(gòu)的文 獻(xiàn)測(cè)量方法一文,從而開創(chuàng)了作

5、者共被引的先河叭1990年,mccain將aca的分析步 驟歸納為選擇作者、檢索共被引頻次、構(gòu)造共被引矩陣、轉(zhuǎn)化為皮爾遜相關(guān)系數(shù)矩陣、多元 分析和解釋結(jié)果及效度分析6個(gè)步驟(見圖1),人們稱其為傳統(tǒng)aca或徳瑞克賽模式。 該模式以spss、sas等統(tǒng)計(jì)學(xué)軟件為工具,利用聚類分析(cluster analysis, ca)、多維定 標(biāo)(multidimensional scaling, mds)和因子分析(factor analysis, fa)等多元分析技術(shù),以映 射地圖的方式來(lái)定量地刻畫科學(xué)結(jié)構(gòu),尋找科學(xué)范式,為后來(lái)學(xué)者進(jìn)行aca分析提供了良 好的范例?,F(xiàn)在,作者共被引分析己成為一種潛在多產(chǎn)

6、的分析方法,不僅可以用它來(lái)揭示科 學(xué)結(jié)構(gòu)的發(fā)展現(xiàn)狀乃至變化情況,還可以用它來(lái)進(jìn)行前沿分析、領(lǐng)域分析、科研評(píng)價(jià)等,進(jìn) 而為宏觀科技決策提供先行支持,為科技規(guī)劃與評(píng)估提供基礎(chǔ)?;痦?xiàng)目:本文系中國(guó)科學(xué)院國(guó)家科學(xué)圖書館戰(zhàn)略研究項(xiàng)目“悄報(bào)計(jì)最學(xué)發(fā)展與應(yīng)用趨勢(shì)戰(zhàn)略掃描”(項(xiàng) 目編號(hào):nsl-001-<0503>)課題成果之一。圖1作者共被引分析的步套2. 作者共被引分析方法面臨的挑戰(zhàn)自1981年以來(lái)的2()多年里,人們一玄按照這種約定俗成的步驟來(lái)進(jìn)行aca分析。然 而2003年以來(lái),不斷冇研究人員向傳統(tǒng)的aca分析方法發(fā)起挑戰(zhàn),隨z也引發(fā)了大量關(guān) 于優(yōu)化共引分析的討論。這些討論大致可以分為兩

7、個(gè)階段:第一個(gè)階段始于2003,討論的焦點(diǎn)主要集中在共被引矩陣轉(zhuǎn)化為相似系數(shù)矩陣方血(圖 i第4步),特別是對(duì)皮爾遜相關(guān)系數(shù)r是否適合應(yīng)用到aca屮這一問(wèn)題展開,由此也引發(fā) 了共被引矩陣對(duì)角線如何取值的爭(zhēng)論。支持使用皮爾遜相關(guān)系數(shù)r來(lái)測(cè)度作者之間的和關(guān)性 的代表人物冇white、mccain和bcnsman等,反對(duì)使用皮爾遜相關(guān)系數(shù)i的代表人物ahlgrcn、 schneider和borlund等。反對(duì)一方的主要依據(jù)是:(dr不符合在aca中應(yīng)用相似性度量的兩個(gè)基本條件從理論上說(shuō)往兩個(gè)變量里增 添0應(yīng)該會(huì)增加它們的相似性,但是ahlgren等人(2003)通過(guò)實(shí)例演示通過(guò)測(cè)度出的 相似系數(shù)反而

8、變小了。(2) 應(yīng)用r的前提是數(shù)據(jù)要符合二元正態(tài)分布,而引文數(shù)據(jù)則是高度斜交的。(3) r對(duì)于共被引矩陣屮的0非常敏感,當(dāng)被轉(zhuǎn)化的矩陣為稀疏矩陣吋會(huì)使測(cè)度結(jié)果 扭曲。(4) 在通常的統(tǒng)計(jì)應(yīng)川里,r測(cè)度的是兩個(gè)隨機(jī)變量線性關(guān)系的強(qiáng)度,而線性關(guān)系不 等于和似性。若兩變量關(guān)系是非線性的,可以預(yù)見由給出的和其他度錄給出的和似程度不 會(huì)相同,因此將r當(dāng)作相似性度量是冇問(wèn)題的。(5) 在檢驗(yàn)的顯箸性時(shí),要求所選取的數(shù)據(jù)樣本必須是隨機(jī)捕樣的和b由觀察的, 而一般我們所使用的數(shù)據(jù)集合都是人為限定了多重條件后選収的。因此,反方認(rèn)為r不是測(cè)度相似性的最佳選擇,建議使川cosine卡方距離或是jaccard 等相似

9、性度量作為替代。作為冋應(yīng),支持一方為在aca里使用進(jìn)行了辯護(hù):(l) white (2003)從實(shí)用性的角度出發(fā),利用ahlgrcn等人的數(shù)據(jù),基于r, cosine, 卡方距離三個(gè)相關(guān)性度最在排序和聚類得到的結(jié)果上幾乎一樣,認(rèn)為在研究實(shí)踐里使用不同 的度量造成的區(qū)別可以忽略。此前,leydesdorff和zaal (1988)也曾發(fā)現(xiàn)使用r, jaccard, 歐幾里德幾何距離和cosine來(lái)度量相似性只有微小的差別。(2 ) bensman (2004)指出:不同于cosine等度量,i被嵌入多元統(tǒng)計(jì)軟件中(如spss), 因此是個(gè)額外的和有力的分析工具。雖然cosine等度量有作為相似性

10、度量?jī)?yōu)勢(shì),然而無(wú)法 用作統(tǒng)計(jì)用途。(1)當(dāng)往原共被引矩陣加入新的與原來(lái)作者間無(wú)共被引在的作者時(shí),原矩陣中作者間的關(guān)系不應(yīng)該被 減弱。(2)在給定的數(shù)據(jù)集合理,若abz間的共被引強(qiáng)度大于cd的,那么擴(kuò)展之后這種關(guān)系仍然存在。(3) r這種度量的取值區(qū)間為卜1,1,允許冇負(fù)值,中間點(diǎn)0意味著共被引強(qiáng)度為0, 正負(fù)號(hào)代表著關(guān)系的類型。cosine和jaccard取值區(qū)間為0,1,屮間點(diǎn)0.5無(wú)法解釋相似性關(guān) 系的大小,也無(wú)從區(qū)分關(guān)系的方向。(4) r對(duì)0敏感和所選數(shù)據(jù)不服從正態(tài)分布的問(wèn)題可以通過(guò)對(duì)數(shù)變換解決;而針對(duì)非 隨機(jī)抽樣和非自由觀察的數(shù)據(jù),在對(duì)r進(jìn)行顯著性檢驗(yàn)時(shí)則可以使用置換檢驗(yàn)。此外,還冇學(xué)

11、者持不同的意見,例如carroll (1961)認(rèn)為當(dāng)作為一個(gè)描述變量間關(guān) 系的度量時(shí),計(jì)算它是不需要任何假設(shè)的,但是要解釋它的意義還要依賴于數(shù)據(jù)符合相應(yīng)統(tǒng) 計(jì)模型的程度。即使如此,leydesdorff (2005)岡和leydesdorff & bensman (2006)研究 了在使用r前對(duì)原始數(shù)據(jù)進(jìn)行對(duì)數(shù)轉(zhuǎn)換,使數(shù)據(jù)大致服從正態(tài)分布,結(jié)果卻發(fā)現(xiàn)轉(zhuǎn)換后的數(shù) 據(jù)在映射地圖上沒(méi)有任何顯著改觀。這樣的爭(zhēng)論由最初的正反兩方激烈辯論,態(tài)度涇渭分明,發(fā)展到后來(lái)一些研究人員開始 研究各種相似性度量z間的相互關(guān)系,思考各種相似性度雖:是否以及在何種程度上可以相互 替代,怎樣來(lái)評(píng)價(jià)各種相關(guān)性度量的

12、表現(xiàn)等。例如,gmur (2003)基于組織科學(xué)里194 篇高被引文獻(xiàn)的共被引數(shù)對(duì)6種不同的相關(guān)性度量進(jìn)行了比較,得到的結(jié)果明顯受到相似性 度暈種類的影響,但基于皮爾遜相關(guān)系數(shù)r得到的聚類或結(jié)合另外兩種標(biāo)準(zhǔn)化度量效果最 佳;klavans和boyack (2006)【山提出了一種全新的框架來(lái)評(píng)價(jià)相關(guān)性度量和可視化算法, 該框架包括4個(gè)因素:準(zhǔn)確率,覆蓋率,可擴(kuò)展性和穩(wěn)定性。該方法被應(yīng)用到10種測(cè)度期 刊期刊相似性的度量上,借此來(lái)判定哪種度量是最優(yōu)的。結(jié)果顯示,在較低的覆蓋率下 (小于50%),皮爾遜相關(guān)系數(shù)r是準(zhǔn)確率最高的度量。但是,總的來(lái)說(shuō)最好的卻是cosine, 因?yàn)樗扔兄^高的覆蓋率又

13、在降維示保持了較高的穩(wěn)定性;schneider和borlund (2007) 2則對(duì)相似性度量的表達(dá)式進(jìn)行了比較,認(rèn)為相似度量的組成成份(分了與分母)對(duì)相互 之間的單調(diào)程度有著潛在的影響。從理論上來(lái)說(shuō),若彼此成份類似,兩相似度量十有八九有 著高度的單調(diào)性,高度的單調(diào)性意味著利用不同度量牛成的排序和聚類結(jié)果不會(huì)有顯著差 異。他們還認(rèn)為對(duì)于相似度量成份的基本理解會(huì)不僅有助丁選擇度量,而且有助于選擇替代 度最進(jìn)行效度檢驗(yàn)。在隨示的一篇文章屮,他們還介紹和徹底演示了兩種矩陣比較技術(shù)一一 mantel檢驗(yàn)和procmstcs統(tǒng)計(jì)分析。在情報(bào)計(jì)量學(xué)里可以將它們作為統(tǒng)計(jì)效度檢驗(yàn)工具來(lái)比 較和評(píng)價(jià)不同的相似性

14、度雖或由它們生成的排序結(jié)果間的單調(diào)程度,幫助我們選擇合適的相 似性度量w最近,leydesdoi-ff(2008)1141還建議稱在處理共被引矩陣時(shí)使用jaccard比cosine 有優(yōu)勢(shì),但是egghe (2008)川相同的數(shù)據(jù)集合演示這些相似性度量在功能上彼此相關(guān), 并得到了 cosine與所有其他度量(除了 r)的函數(shù)關(guān)系模型。稍后egghe和leydesdorff(2008) 何又利用leydesdorff (2008)的數(shù)據(jù)繼續(xù)構(gòu)建了 i和cosine關(guān)系的模型,雖然該關(guān)系并非 純函數(shù)關(guān)系,但是二者的散點(diǎn)圖可以用-束肓線來(lái)擬合。他們還基于該模型利用一個(gè)數(shù)據(jù)集 合確定了一個(gè)cosine

15、閥值,在該值之上相應(yīng)的值都大于0,二者能夠達(dá)到一一對(duì)應(yīng)的關(guān)系。除此之外,在信息檢索和情報(bào)計(jì)量學(xué)里還有很多關(guān)于相似性度量的成份和利用的研究, 例如ellis, furner-hines, willett (1993)切等。從特征上說(shuō),這些研究雖然都得到了不同 的結(jié)論,但都促進(jìn)了相似性度量的選擇都是與具體數(shù)據(jù)相關(guān)的觀點(diǎn)。gower和legendre(1986)岡總結(jié)說(shuō):我們不可能給出在哪種情況下使用哪種度量最合適的確定答案。因此, 選擇一個(gè)相似性度量在很大程度上是主觀的,要么基于傳統(tǒng)的方法,要么基于后驗(yàn)的標(biāo)準(zhǔn)(例 如結(jié)果的町解釋性),而非理論、數(shù)學(xué)上的效度以及可比較的實(shí)證研究結(jié)果。eck和walt

16、man (2008)刖】等人也認(rèn)為相似性度量的選擇不僅有著理論上的意義,還與被處理的具體數(shù)據(jù) 相關(guān),要根據(jù)具體數(shù)據(jù)來(lái)選擇度量。盡管第一個(gè)階段正反雙方在選擇相似性系數(shù)上存在爭(zhēng)論,但他們有一個(gè)共同點(diǎn):都認(rèn)為 原始共被引矩陣應(yīng)該轉(zhuǎn)化為相似系數(shù)矩陣(即由相似性系數(shù)對(duì)原始共彼引數(shù)據(jù)標(biāo)準(zhǔn)化),只 是在使用何種相似性度量上存在分歧而己。第二個(gè)階段始于2006年,討論的焦點(diǎn)主要集中在該使用何種矩陣來(lái)生成相似系數(shù)矩陣 方面(圖1第3、4步)。該階段的爭(zhēng)論源于2006年leydesdorff和vaughan發(fā)表的共現(xiàn)分 析及具在信息科學(xué)中的應(yīng)用20文,他認(rèn)為相似性度量(r或cosine等)可以在aca里 使用,但

17、只能用于非對(duì)稱的引文矩陣進(jìn)而派生出相似系數(shù)矩陣,而非用于對(duì)稱的共被引矩陣。 該文還探討了共被引矩陣和引文矩陣的區(qū)別,以及分別用于這些矩陣的合適的多元統(tǒng)計(jì)技 術(shù)。他認(rèn)為把r用到對(duì)稱的共被引矩陣是頗冇問(wèn)題的,盡管whitc(2003)提及davision(1983) 0墩科書里的mds操作方法,但在該書中r 一直是被用做從不是臨近度量的數(shù)據(jù)里構(gòu)建臨 近矩陣。共被引矩陣已經(jīng)是一個(gè)臨近矩陣1所以沒(méi)有必要使用相似性度量來(lái)從一個(gè)臨近矩 陣轉(zhuǎn)化成另外一個(gè)臨近矩陣(傳統(tǒng)做法),否則只會(huì)扭曲數(shù)據(jù)。leydesdorff述以美國(guó)各大城 市的距離數(shù)據(jù)進(jìn)行了演示說(shuō)明。隨后,leydesdorff (2008)又發(fā)表了

18、關(guān)于aca數(shù)據(jù)的標(biāo) 準(zhǔn)化和可視化:cosine vs. jaccard一文,他認(rèn)為:當(dāng)可以獲得引文矩陣時(shí),cosine度屋為我 們提供了理解和關(guān)結(jié)構(gòu)最好的可視化地圖。但當(dāng)我們無(wú)法得到引文矩陣,只有共被引矩陣可 用時(shí),在共被引矩陣的主対角線添加上引文總數(shù),然后jaccard相似系數(shù)則能為我們提供一 種次優(yōu)選擇。schneider和borlund (2007)就不同的矩陣生成方式會(huì)導(dǎo)致不同的排序和聚類結(jié)果進(jìn)行 了討論,他們認(rèn)為引文矩陣和共被引矩陣的區(qū)別在于:前者可以生成后者,而反之則不可逆 %這說(shuō)明,在前者向后者的轉(zhuǎn)化過(guò)程屮存在著信息的丟失。他們還拿dcalaca進(jìn)行了 比較,認(rèn)為“德瑞克賽模式”

19、的aca是非常規(guī)的(即在使川何種矩陣來(lái)生成相似系數(shù)矩陣 的問(wèn)題上),還應(yīng)對(duì)對(duì)角線值給了關(guān)注。因?yàn)樵诠脖灰仃囧?,?duì)角線上的數(shù)值一方面代表 了該作者的兩篇文獻(xiàn)被同時(shí)引用的次數(shù),另一方面它還代表了該作者同自己的和似程度。從 邏輯上說(shuō),作者同木人是最相似的,若該數(shù)值小于同行或同列的最大值,就不符合邏輯。為 了處理對(duì)角線問(wèn)題,先是由white和griffith 議用引文數(shù)最高的前三位求均值,mccain 建議設(shè)置為缺省效果最佳,ahlgren等人認(rèn)為應(yīng)該使用自己與自己的實(shí)際共被引次數(shù),white 建議用該行或列的最大值來(lái)代替,邱均平、馬瑞敏等人(2008) i22h23認(rèn)為川該行或列的最 大值還不足以

20、凸顯,應(yīng)該用最大值+1來(lái)定義對(duì)角線的収值,miguel等(2008)創(chuàng)】更是建議 用行或列的最大值乘以1.5來(lái)保證比其它數(shù)人,最近leydesdorff (2008) 乂提議在上面填寫 引文總數(shù)。這些解決方案雖各有優(yōu)缺點(diǎn),但都說(shuō)明了對(duì)角線值含義是非常豐富的。如果處理 不當(dāng)無(wú)疑會(huì)引起矩陣中信息的扭曲,也會(huì)影響最后的排序或者聚類結(jié)果。因此,schneider和 borlund (2007)認(rèn)為若aca多采用一些dca程序(使川引文矩陣來(lái)生成相似系數(shù)矩陣) 的話,那么由傳統(tǒng)方法所引發(fā)一系列問(wèn)題就可以避免。然而對(duì)leydesdorff提出的關(guān)于相似系數(shù)矩陣生成方式的質(zhì)疑,waltman和eck(200

21、8) i絢卻認(rèn)為廣泛被采用的“徳瑞克賽模式”沒(méi)有任何錯(cuò)誤。他們指出leydesdorff和vaughan (2006)捉出的觀點(diǎn)是根據(jù)不匸確的mds地圖做出的,這是因?yàn)閟pss低版木(14.0.0 z 前的版本)屮proxscal程序存在錯(cuò)誤。leydesdorff (2008)刑反過(guò)來(lái)卻對(duì)反駁的意見并 不十分認(rèn)同,他指出自己所提出的觀點(diǎn)是基于分析得出的,而不僅僅根據(jù)此前得出的可視化 圖形得出的結(jié)論,因此可視化地圖的錯(cuò)誤并不能完全否定他的觀點(diǎn)。他認(rèn)為比起對(duì)稱的共被 引矩陣而言,非對(duì)稱引文矩陣?yán)锏臄?shù)據(jù)包含更多的信息。前者可以由后者派生出來(lái),反z則 不行,因?yàn)樵谵D(zhuǎn)換中信息丟失了。最后他利用paje

22、k里的kamada-kawai算法,再次解釋了 基于原始共被引數(shù)得出的町視化地圖更具有町取性。雖然我們還看不到更新的相關(guān)文獻(xiàn)的評(píng) 論,但是leydesdorff等人的新穎思路無(wú)疑會(huì)給共被引分析帶來(lái)更人范i韋i的討論。*臨近矩陣(proximity matrix): 一組表示兩兩h標(biāo)之.間相似程度或者不相似程度的數(shù)字組成的矩陣,它是 沿對(duì)角線對(duì)稱的方陣。共被引矩陣是臨近矩陣,相似系數(shù)爐陣是由相似系數(shù)對(duì)共被引矩陣標(biāo)準(zhǔn)化后得到的 臨近矩陣。mds和ca分析中都必須輸入臨近矩陣。"若引文矩陣為a, a的轉(zhuǎn)置為八,那么共被引矩陣b=4af ,反之則不可逆。此外,關(guān)于傳統(tǒng)的共被引分析還存在著一些

23、方法的擴(kuò)展,例如在分析對(duì)象的選取上,先 后有persson (2001) 1271, rousseau和zuccala (2003) 28 zhao (2006) 29, eom (2007) 30, zhao和strotmann (2008)対笫一作者aca和所有作者aca研究進(jìn)行了對(duì)比研究;在 共被引計(jì)數(shù)規(guī)則上,有傳統(tǒng)的()-1二元計(jì)數(shù),也有研究人員如bojarneving (2(x)7)陽(yáng)捉岀了 -種不同于二元統(tǒng)計(jì)法的乘法計(jì)算規(guī)則;在多元分析里普遍存在的怎樣確定聚類、因子、分 組、維度等的數(shù)冃難題上,small和sweeney (1985)厲】提出“可變水平聚類”和“以類聚 類”的方法,

24、leydesdorff (2005)也引進(jìn)了信息理論的方法對(duì)聚類進(jìn)行解構(gòu),此外在社會(huì)網(wǎng) 絡(luò)分析里也有大量關(guān)于解構(gòu)的文章存在。3. 作者共被引分析研究方法的新進(jìn)展最近幾年,在aca里關(guān)于選擇合適的相似性度量來(lái)評(píng)價(jià)目標(biāo)之間的和似性以及選擇合 適的短陣來(lái)生成相關(guān)系數(shù)矩陣的爭(zhēng)論突出了對(duì)更清晰的、無(wú)偏見的方法論的盂要。針對(duì)aca 目前面臨的困境,和關(guān)的研究人員在探索aca方法的優(yōu)化上止朝著兩個(gè)方向發(fā)展:一個(gè)方向是繼續(xù)沿著傳統(tǒng)方法進(jìn)行aca分析,在相關(guān)的步驟上進(jìn)行漸進(jìn)性和嘗試性的 改革,比如根據(jù)具體數(shù)據(jù)選擇合適的相似性度量,選擇更優(yōu)的相似矩陣牛成方式,由通過(guò)傳 統(tǒng)的多元分析技術(shù)擴(kuò)展到引入社會(huì)網(wǎng)絡(luò)分析軟件如

25、pajek,ucient,vxord等來(lái)生成可視化地 圖。這是目詢大多數(shù)研究人員采用的方法,我們稱之間接法。因?yàn)樵撏緩接玫氖情g接的相似 強(qiáng)度,即原始共被引數(shù)經(jīng)過(guò)相似系數(shù)標(biāo)準(zhǔn)化了的,上面在傳統(tǒng)aca面臨的挑戰(zhàn)部分所舉的 實(shí)例都是対間接法的優(yōu)化案例。另外一個(gè)方向是使用的是直接的相似強(qiáng)度,即共被引矩陣屮的原始共被引數(shù),我們稱之 肓接法。針對(duì)傳統(tǒng)aca屮存在的相關(guān)系數(shù)選擇難題和共被引矩陣屮對(duì)角線值設(shè)定問(wèn)題,以 及在依賴多元分析技術(shù)牛成二維可視化地圖后,還要通過(guò)肉眼觀察人工為散點(diǎn)劃定邊界形成 研究社區(qū)等等,不但增加了aca的復(fù)雜性,而且也嚴(yán)重阻礙了aca的廣泛應(yīng)用。為此,人 們開始尋找新的技術(shù)方法替代傳

26、統(tǒng)方法。例如,white (2003)將網(wǎng)絡(luò)尋址定位(pathfinder network scaling, pfnets)引入aca,直接使川共被引矩陣屮的原始共被引數(shù)據(jù),將aca 分析推進(jìn)到網(wǎng)絡(luò)分析:在pfnets生成的可視化地圖里,節(jié)點(diǎn)代表作者,節(jié)點(diǎn)z間的實(shí)線連 接代表加權(quán)路徑,權(quán)數(shù)在這里即共引數(shù)。比起傳統(tǒng)的aca, pfnets可直接產(chǎn)牛于原始數(shù)據(jù) 矩陣,而不需要再將原始矩陣轉(zhuǎn)化為pearson相關(guān)系數(shù)矩陣,減少了aca的計(jì)算強(qiáng)度,結(jié)果 也更為可信。2003年white采用此法對(duì)1998年的同一實(shí)驗(yàn)數(shù)據(jù)進(jìn)行了第二次分析,得到了更 為準(zhǔn)確??康姆治鼋Y(jié)果。此外,wallace和gingra

27、s (2008)利用了最近由blondel等研發(fā)的一 門新技術(shù)來(lái)從作者共被弓i網(wǎng)絡(luò)里探索科學(xué)范式。它使用的也是原始的共被引數(shù)據(jù),繞開了使 用相似性度量。相比起之詢大多數(shù)聚類方法來(lái),它只依賴于加權(quán)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),而且能擴(kuò) 展到應(yīng)用到相對(duì)較人的網(wǎng)絡(luò)上。最重要的是它不需要設(shè)定任何白由參數(shù),不需要對(duì)數(shù)據(jù)前置 或者后置處理,也不需要對(duì)共被引數(shù)據(jù)或者被發(fā)現(xiàn)的社區(qū)進(jìn)行主觀解釋,也具有一定的優(yōu)越 性。4 .總結(jié)本文討論了近兒年來(lái)作者共被引分析方法而臨的挑戰(zhàn),以及由此所衍生出來(lái)的新探索和 新進(jìn)展。隨著研究的深入,我們相信會(huì)有更多的優(yōu)化思路和方法出現(xiàn),鑒于口前有將aca 分析推進(jìn)到網(wǎng)絡(luò)分析階段,我們認(rèn)為要注意以下

28、幾個(gè)問(wèn)題:首先,作者間連接的權(quán)垂(共被 引次數(shù))非常關(guān)鍵,這里也是人多數(shù)信息存儲(chǔ)的地方。因此,任何基于網(wǎng)絡(luò)的方法必須不僅 考慮到作者間聯(lián)系的存在,而且述包括聯(lián)系的強(qiáng)度。第二,考慮到要識(shí)別的聚類(學(xué)派、社 區(qū)或范式),研究人員不應(yīng)做出任何選擇,也不該提前對(duì)社區(qū)的數(shù)h或總體的數(shù)屋作出限制。 第三,除了極大的網(wǎng)絡(luò)外,對(duì)于網(wǎng)絡(luò)的規(guī)?;蛲?fù)浣Y(jié)構(gòu)不該有任何限制。若有些網(wǎng)絡(luò)比其他 網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)更清晰,那么這應(yīng)該在輸出的結(jié)果里被反映出來(lái)。最后,対于網(wǎng)絡(luò)本身,不該 有任何的前捉假設(shè)。換句話說(shuō),在應(yīng)用算法前數(shù)據(jù)不應(yīng)變動(dòng),只有它們的內(nèi)部結(jié)構(gòu)才是決定 它們?nèi)绾畏指畹年P(guān)鍵??傊覀兿嘈?,不論是間接法還是肓接法,任何一種

29、方法的突破都能 進(jìn)一步擴(kuò)展aca的應(yīng)用范圍,將aca分析推向深入,也將使最后得到的分析結(jié)果更客觀更 可靠。1 white, h.d., griffith, b.c. author co-citation: a literature measure of intellectual structure j. journal of the american society for information science, 1981,32(3), 163-17l2 mccain, k.w. mapping authors in intellectual space: a technical overv

30、iew j. journal of the american society for information science, 1990, 41(6), 433-443.3 ahlgrcn, p, jarnevi ng, b,rousseau, r. requirements for a cocitation similarity measure, with special reference to pearson9s corrclation cocfficicnt j. journal of the american society for information science and t

31、echnology, 2003, 54(6), 550-560|4j white, hd. author co-citation analysis and pearson's r jj. journal of the american society for information science and technology, 2003, 54(13), 1250-1259.5 leydesdorft l, zaal, r cowords and citations relations between document sets and environments j in l. eg

32、ghe & r. rousseau (eds.), 1988, informetrics 87/88 (pp. 105-119). amsterdam: elsevier.6 bensman, s j pearson's r and author co-citation analysis: a commentary on the controversy j journal of the american society for information science and technology, 2004, 55(10), 935.7 carroll, j,b the nat

33、ure of the data, or how to choose a correlation coefficient j. psychometrika, 1961, 26(4), 347-372.8 leydesdorff, l. similarity measures, author cocitation analysis, and information theory jj. journal of the american society for information science and technology, 2005, 56(7), 769-7729 leydesdorff l

34、., bensman, s classification and powerlaws: the logiirithmic transformation j. journal of the american society for information science and technology, 2006, 57(11), 1470-148610 gmiir, m. co-citation analysis and the search for invisible colleges: a methodological evaluation j scientometrics, 2003, 5

35、7(1), 27-57.11 klavans, r,boyack, k.w. (2006). identifying a better measure of relatedness for mapping science j. journal of the american society for information science and technology, 57(2), 251-26312 schneider, j. w,borlund, p. matrix comparison, part 1: motivation and important issues for measur

36、ing the resemblance between proximity measures and ordination results j. journal of the american society for information science and technology, 2007, 58(11)j 586-1595.13 schneider, j.w. & borlund, p. matrix comparison, part 2: measuring the resemblance between proximity measures or ordination r

37、esults by use of the mantel and proemstes statistics j. journal of the american society for information science and technology, 2007, 58(11), 1596-1609114j lcydcsdorff, l on the normalization and visualization of author co-citation data: saltoivs cosine versus the jaccard index j. journal of the ame

38、rican society for information science and technology, 2008, 59(1), 77-85.15 l. egghe new relations between similarity measures for vectors based on vector norms j. journal of the american society for information science and technology, 200&60(2), 232-239.16j l. egghe, leydesdorff, l the relation

39、 between pearson's correlation coefficient r and saltoifs cosine measure j jo umal of the american society for in formation science and technology, 200& 60(5).117) ellis, d,fumer-hines, j., willett, p. measuring the degree of similarity between objects in text retrieval systems jj. perspecti

40、ves in information management, 1993,3(2), 128-149.18 gower, jc,& legendre, p. metric and euclidean properties of dissimilarity coefficients j joumal of classification, 1986,3(1), 5-4&19 nees jan van eck, ludo waltman. appropriate simikirity measures for author co-citation analysis j.journal

41、of the american society for information science and technology, 2008, 59(10), 1653-1661.20 leydesdorff. l., vaughan, l. co-occurrence matrices and their applications in information science: extending aca to the web environment j. journal of the american society for information science and technology

42、, 2006, 57(12), 1616-162&21 davison, m.l. multidimensional scaling mj. new york: john wiley. 198322 邱均平,馬瑞繳,李曄君.關(guān)于共被引分析方法的再認(rèn)識(shí)和再思考j.借報(bào)學(xué)報(bào).200& 27(1):69-74.23 邱均平,馬瑞繳.網(wǎng)絡(luò)環(huán)境下aca方法的應(yīng)用研j.圖書情報(bào)工作.200& 52 (2):85-87.24 sandra, migual. ell. a new approach to institutional domain analysis: multilevel research fronts structure j scientomelrics, 200& 74(3),331-344.|25 ludo waltman, nees jan van eck. some comments on the question whether co-occurren

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論