信息資源管理實驗報告_第1頁
信息資源管理實驗報告_第2頁
信息資源管理實驗報告_第3頁
信息資源管理實驗報告_第4頁
信息資源管理實驗報告_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、信 息 資 源 管 理實 驗 報 告目錄1、實驗目的12、實驗準備13、布拉德福定律的驗證13.1布拉德福定律簡介13.2云計算期刊列表13.3 分區(qū)33.4 結果驗證33.5 結果解釋44、洛特卡定律的驗證44.1 洛特卡定律簡介44.2洛特卡分布曲線的繪制45、普賴斯定律的驗證751 普賴斯定律簡介752 驗證過程76、文獻資源的時間分布特征76.1.指數(shù)增長律76.1.1 普萊斯曲線76.1.2 生長曲線86.2.逐漸過時規(guī)律97、齊夫定律的驗證1071齊夫定律簡介107.2.齊夫定律內(nèi)容107.3驗證手段111、實驗目的1、 檢驗布拉德福定律,分別采用區(qū)域、圖形表示法表示,并結合主題進

2、行解釋;2、 統(tǒng)計作者、作者單位,獲取核心或高產(chǎn)作者以及核心機構,檢驗洛特卡定律和普賴斯定律;3、 繪制年度發(fā)文量曲線,獲取文獻資源的時間分布特征;4、 選擇論文,通過分詞軟件進行分詞,再畫出詞頻分布曲線,驗證zipf定律或zipf修正定律,檢驗論文關鍵詞是否為高頻詞,并進行解釋。2、實驗準備選擇主題:云計算 選擇數(shù)據(jù)庫:CNKI中國知網(wǎng)3、布拉德福定律的驗證3.1布拉德福定律簡介20世紀30年代,英國著名文獻信息學家布拉德福提出了有名的“布拉德福分散定律”(Bradfords law of scattering),簡稱布拉德福定律或布氏定律。該定律描述了文獻分散和集中的經(jīng)驗定律,其主要內(nèi)容是

3、:如果將科學期刊按其刊載某個學科主題的論文數(shù)量以遞減順序排列起來,就可以在所有這些期刊中區(qū)分出載文率最高的“核心”部分和包含著與核心部分同等數(shù)量論文的隨后幾區(qū),這時核心區(qū)和后繼各區(qū)中所含的期刊數(shù)成1:a :a2的關系(a1)。3.2云計算期刊列表云計算序號期刊名稱文獻量1LECTURE NOTES IN COMPUTER SCIENCE21872電腦知識與技術9683PROCEEDINGS OF THE SPIE THE INTERNATIONAL SOCIETY FOR OPTICAL ENGINEERING9524PROCEEDINGS OF SPIE8365通信世界 8176APPLIE

4、D MECHANICS AND MATERIALS8157ARXIV7188通訊世界6929FUTURE GENERATION COMPUTER SYSTEMS THE INTERNATIONAL JOURNAL OF ESCIENCE59710FUTURE GENERATION COMPUTER SYSTEMS59611中國新通信58212ASTRONOMY ASTROPHYSICS57813中國信息化57114PROCEDIA COMPUTER SCIENCE55415INTERNATIONAL CONFERENCE ON CLOUD COMPUTING TECHNOLOGY AND SC

5、IENCE55016COMMUNICATIONS IN COMPUTER AND INFORMATION SCIENCE54517ASTROPHYSICAL JOURNAL54218JOURNAL OF GEOPHYSICAL RESEARCH ATMOSPHERES51819計算機光盤軟件與應用50220網(wǎng)絡安全技術與應用49521IEEE INTERNATIONAL CONFERENCE ON CLOUD COMPUTING48422IEEE ACCESS46523ADVANCED MATERIALS RESEARCH43324信息與電腦43125數(shù)字技術與應用41526IEEE INTE

6、RNATIONAL SYMPOSIUM ON GEOSCIENCE AND REMOTE SENSING IGARSS40527信息通信39828無線互聯(lián)科技38829信息系統(tǒng)工程38730數(shù)字通信世界37831JOURNAL OF PHYSICS CONFERENCE SERIES37432PROCEEDINGS OF THE SPIE36633計算機與網(wǎng)絡35634ADVANCES IN INTELLIGENT SYSTEMS AND COMPUTING34935計算機科學34836Information week: The magazine for information systems

7、 management34537CONCURRENCY AND COMPUTATION PRACTICE EXPERIENCE34338電腦迷33539電子世界33540MONTHLY NOTICES OF THE ROYAL ASTRONOMICAL SOCIETY33241CONCURRENCY AND COMPUTATION PRACTICE AND EXPERIENCE32242IEEE TRANSACTIONS ON PARALLEL AND DISTRIBUTED SYSTEMS31743JOURNAL OF SUPERCOMPUTING31544信息安全與通信保密309表1 期刊

8、列表3.3 分區(qū)將選取的論文按其總數(shù)23545除以3,得到平均數(shù)235453=7848,計算得出核心區(qū)的期刊數(shù)為7種,論文數(shù)約為7293篇;相關區(qū)期刊數(shù)為15種,論文數(shù)約為8271篇;外圍區(qū)期刊數(shù)為22種,論文數(shù)約為7981篇(詳見表3)。其中核心區(qū)的期刊列表如下表所示:序號期刊名稱文獻量1LECTURE NOTES IN COMPUTER SCIENCE21872電腦知識與技術9683PROCEEDINGS OF THE SPIE THE INTERNATIONAL SOCIETY FOR OPTICAL ENGINEERING9524PROCEEDINGS OF SPIE8365通信世界8

9、176APPLIED MECHANICS AND MATERIALS8157ARXIV718合計7293表2 核心區(qū)期刊列表3.4 結果驗證(1)區(qū)域表示法:分區(qū)云計算期刊數(shù)量論文數(shù)量a(核心區(qū))77293b(相關區(qū))158271c(外圍區(qū))227981表3 “云計算”主題論文的布拉德福分布根據(jù)期刊論文列表以及分區(qū)列表可得,三個區(qū)中的期刊數(shù)量有以下比例關系n1:n2:n3=7:15:221:2:4(2)圖形表示法:3.5 結果解釋各學科專業(yè)文獻除了密集地登載于本學科的專業(yè)期刊,即“核心期刊”外,還登載于大量本專業(yè)的邊緣期刊,即“相關期刊”,以及更一般化的其他學科的期刊上。由于后兩者期刊的分散,

10、難以查找特定專業(yè)的論文。此外,二次文獻在摘錄某一專業(yè)論文的時候,往往注重學科影響較大的“核心類”期刊,而忽視了非核心類的相關期刊,造成大量論文的重復摘錄,因此,任何學科的絕大多數(shù)專業(yè)文獻都集中于少數(shù)的本專業(yè)期刊內(nèi),但同時也散布于其他的相關期刊中,這是文獻離散性的體現(xiàn)。而文獻的集中性主要是由于“馬太效應”,或者說是成功產(chǎn)生成功的原則:一種期刊的文獻量越大、質量越高,作者就越愿意將自己的文章刊登在這些期刊上,形成了一種堆加效應。但是由于核心期刊發(fā)表文章的難度較大、各期刊文章數(shù)目眾多,所以核心區(qū)、相關區(qū)、外圍區(qū)的期刊數(shù)量才會在統(tǒng)計上呈現(xiàn)布拉德福所闡述的那種規(guī)律4、洛特卡定律的驗證4.1 洛特卡定律簡

11、介洛特卡定律是由美國學者A.J.洛特卡在20世紀20年代率先提出的描述科學生產(chǎn)率的經(jīng)驗規(guī)律,它描述的是科學工作者人數(shù)與其所著論文之間的關系:寫兩篇論文的作者數(shù)量約為寫一篇論文的作者數(shù)量的1/4;寫三篇論文的作者數(shù)量約為寫一篇論文作者數(shù)量的1/9;寫N篇論文的作者數(shù)量約為寫一篇論文作者數(shù)量的1/ n,而寫一篇論文作者的數(shù)量約占所有作者數(shù)量的60.79%。該平方反比定律可表示為:(c為常數(shù),約為60.79)4.2洛特卡分布曲線的繪制(1)以“云計算”為主題的論文數(shù)和作者數(shù)對應關系:具體數(shù)據(jù)如下表(表4)所示:論文數(shù)作者數(shù)15692267312846451069核心高產(chǎn)作者7485921021111

12、21131141161211221311表4 論文作者對應關系(2)以論文數(shù)x的對數(shù)為橫軸,以作者數(shù)Yx的對數(shù)為縱軸作圖,我們可以得到洛特卡分布曲線如下圖所示:(3)用最小二乘法計算擬合直線的斜率:xylog xlog ylog x * log y(log x)2156902.0022670.2.0.0.31280.2.107211.0.4640.1.806181.0.5100.10.0.690.0.0.0.740.0.602060.0.850.0.698970.0.920.0.301030.0.10210.301030.11111.001.1211.001.1311.001.1411.001

13、.1611.001.2111.001.2211.001.3111.002.平均值0.0.0.0.通過計算我們可以得出:斜率k值=-2.,接近于洛特卡定律-2的斜率值,由此我們驗證了洛特卡定律與事實具有很好的吻合度。核心作者篇數(shù)核心機構篇數(shù)陳臣31北京郵電大學374馬曉亭22南京郵電大學191張云勇21電子科技大學164龔強16西安電子科技大學148龔強14武漢大學123于炯13華南理工大學113房秉毅12華中科技大學100馬建峰11吉林大學99 陳俊10上海交通大學97王鵬10華北電力大學97陳清金9南京大學91王鳳領9國防科技大學84葛世倫8北京交通大學82王汝傳8北京工業(yè)大學82張少茹8東

14、北大學78胡新平8哈爾濱工業(yè)大學77戰(zhàn)非8武漢理工大學76楊庚7湖南大學76趙莉7清華大學74高能7重慶郵電大學74Euiin Choi7重慶大學73彭志平6合肥工業(yè)大學71李陶深6東南大學65鄧仲華6中國科學技術大學60張云勇6胡志剛6吳吉義6馬錫坤6潘郁6馬洪江6表5 核心作者及機構的分布5、 普賴斯定律的驗證51 普賴斯定律簡介普萊斯(Price)是著名的科學家與科學史學家,他在其代表名著小科學,大科學一書中曾有如下的論述:“在同一主題中,半數(shù)的論文為一群高生產(chǎn)能力作者所撰,這一作者集合的數(shù)量上約等于全部作者總數(shù)的平方根”。因此普賴斯定律也被俗稱為核心生產(chǎn)者分布的“平方根定律”。52 驗

15、證過程由以“云計算”為主題的論文數(shù)和作者數(shù)的對應關系圖表,我們可以得到以下信息:作者數(shù)量統(tǒng)計全部作者數(shù)高產(chǎn)作者數(shù)106830由于1068的平方根約等于32.68,與30很接近,所以普萊斯定律得到驗證。6、 文獻資源的時間分布特征6.1.指數(shù)增長律6.1.1普萊斯曲線6.1.1.1普萊斯曲線的描述普賴斯曲線(Places curve)是指揭示科學文獻指數(shù)增長規(guī)律的曲線,是美國科技史學家普賴斯綜合、分析了大量的統(tǒng)計資料,以科學文獻量為縱軸,以歷史年代為橫軸,把各不同年代的科學文獻量在坐標系中逐點描繪出來,通過平滑方法所得出的一條曲線。它近似地表征了科學文獻隨時間增長的規(guī)律,即科學文獻量的增長與時間

16、成指數(shù)函數(shù)關系(在普通直角坐標中呈指數(shù)曲線,在單對數(shù)坐標系中呈一直線),其數(shù)學公式表示為:F(t)表示t時刻的文獻量,a為統(tǒng)計初始時刻的文獻量,b是時間常數(shù)。6.1.1.2驗證手段第一步:統(tǒng)計2007至2011年文獻發(fā)表量,繪制散點圖。第二步:利用表格工具選擇指數(shù)趨勢擬合,得到對應擬合的普萊斯函數(shù) 6.1.2生長曲線6.1.2.1生長曲線描述文獻信息量的增長更趨近于生物的生長曲線,最開始時信息增長速度很快,符合指數(shù)增長規(guī)律;當文獻信息量增至最大值一半時,增長速率開始變慢;隨著時間推移,增長速度越來越慢,最終增長的極限為k值。數(shù)學方程為:、其中,F(xiàn)(t)為文獻量,是時間t的函數(shù),k表示文獻增長的

17、最大值。6.1.2.2驗證手段第一步:收集相關文獻信息,統(tǒng)計2007至今年度發(fā)文量并繪制年度發(fā)文量曲線。第二步:比對生長曲線和繪制的年度發(fā)文量曲線。一般情況下,學科文獻在不同時期的增長態(tài)勢有所不同。學科處于起步階段時,文獻量呈指數(shù)增長,這個時期的文獻壽命較短,如圖中起點至紅色數(shù)據(jù)點之間所示;在學科相對成熟階段,文獻指數(shù)增長率逐漸變小,曲線漸變平緩,這個時期的文獻壽命相對變長,如圖中紅色數(shù)據(jù)點所示,當文獻數(shù)量增加到約k/2(8901/2)時,曲線開始變緩,增長速率放慢;最終學科文獻將會進入一個穩(wěn)定時期,如圖中紅色數(shù)據(jù)點至終點之間所示,當文獻數(shù)量增加到最大值k(8901)時,不再增長,甚至在之后的

18、幾年內(nèi)有所下降。附:年度發(fā)文量數(shù)據(jù)圖表(單位:篇)20079200838620091238201031592011638720127496201379602014872320158901201684092017759720188006(預測)6.2.逐漸過時規(guī)律6.2.1文獻老化的描述科技文獻隨著其年齡的增長,其內(nèi)容日益變得陳舊過時,失去了作為科學情報源的價值,以及因此越來越少被科學工作者和專家們利用的過程??茖W文獻老化既是一種客觀的社會現(xiàn)象,又是一個復雜的動態(tài)過程。文獻老化速度一般用半衰期進行衡量,引用(引文)半衰期被定義為某期刊或學科現(xiàn)時引用的全部文獻(即參考文獻)中,較新的一半是在多長時

19、間內(nèi)發(fā)表的”。6.2.2驗證手段為研究驗證文件老化規(guī)律,我們選取了2009年發(fā)表的云計算:系統(tǒng)實例與研究現(xiàn)狀,被引用次數(shù)2609次,知網(wǎng)被引用記錄1211條。第一步:以文獻現(xiàn)在正被引用次數(shù)為縱軸,以文獻出版年齡為橫軸,繪制曲線。第二步:對照文獻信息老化曲線分析所繪曲線。已知文獻信息老化曲線方程:其中,k是常數(shù),隨學科的不同而不同;a為老化率,C(t)表示發(fā)表了t年的文獻的被引次數(shù)。顯然,文獻自2014年以后的走勢符合文獻信息老化曲線。具體數(shù)據(jù)和根據(jù)每年引用次數(shù)繪制的折線圖如下圖所示: 其中:文章發(fā)表于2009年末,所以2009年被引用次數(shù)并不高。2010年才算是云計算正式在中國落腳的第一年,所以2010和2011年被引用頻次上升較快但起點不高。7、 齊夫定律的驗證71齊夫定律簡介齊夫定律是美國哈佛大學教授齊夫(G.K.Zipf)在1935年對文獻詞頻規(guī)律的研究得出的,他認為把一篇較長的文章中每個詞出現(xiàn)的頻次按遞減的順序排列,其數(shù)量關系特征呈雙曲線分布。該定律是計量學的基本定律,廣泛應用于

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論