信息計量學復習_第1頁
信息計量學復習_第2頁
信息計量學復習_第3頁
信息計量學復習_第4頁
信息計量學復習_第5頁
已閱讀5頁,還剩11頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一章緒論信息計量學定義:采用定量的方法來描述和研究情報(信息)的現(xiàn)象、過程和規(guī)律的一門學科。它是數(shù)學和統(tǒng)計學與情報學廣發(fā)結合而形成的情報學的一個新興的定量性分支學科。 廣義信息計量學主要探討以廣義信息論為基礎的廣義信息的計量問題。 狹義信息計量學主要研究情報信息(或文獻情報)的計量問題。產生信息計量學是在傳統(tǒng)文獻計量學及科學計量學的基礎上擴展和演變而成的。 情報的數(shù)量遠遠大于文獻的數(shù)量,其計量方法也遠遠大于文獻的計量方法。 (文獻激增一一產生矛盾一一促使對文獻的管理和使用; 緩解矛盾一一產生情報學一一產生情報(信息)計量學)信息計量學是情報學發(fā)展的需要和必然產物。定量化研究是情報學發(fā)展的重要方向和必然趨勢之一。這是因為情報學必然要從定性階段向定量階段發(fā)展; 只有加強情報學的定量化研究,才能不斷提高其科學性和精確性,從而有助于確立和提高它在整個科學體系中的學科地位?!鲆慌佑|的學科帶頭人和骨干力量推動了信息計量學的發(fā)展。發(fā)展±萌芽時期(1917~1933)文獻計量研究比較分散,規(guī)模不大;■發(fā)展時期(1934~1978)機全面發(fā)展時期(1978至今)■發(fā)展趨勢:從文獻向信息計量發(fā)展;向自動化方向發(fā)展;向網(wǎng)絡計量學方向發(fā)展信息計量學與文獻計量學(1)文獻計量學是以文獻信息體系為研究對象,采用數(shù)學、統(tǒng)計學定量方法來研究文獻 信息的分布結構、數(shù)量關系和變化規(guī)律,并進而探討科學技術的發(fā)展規(guī)律的一門新興的分支學科。(2)從信息計量學的概念和內容體系來看,信息計量學與文獻計量學彼此交叉滲透,既有著許多共同的研究內容,又有著不盡相同的地方。信息計量學著眼于信息本身的計量問題,文獻計量學主要以作為情報載體的文獻為計量對象。信息計量學較之文獻計量學來說,其研究范圍更廣泛一些。除文獻信息之外,還存在著其他形式的信息。但是,文獻信息是整個科學情報的主題。再次,從任務和方法上來看,信息計量學研究的任務更為艱巨, 更難找到恰當?shù)亩糠椒巴緩?。信息計量學與科學計量學科學計量學是用定量方法研究科學學的一門學科,用以用戶研究科學發(fā)展過程的各種定量方法的總和。信息計量學與科學計量學有聯(lián)系也有區(qū)別。聯(lián)系表現(xiàn)為:從研究目的來看,兩者都是要探討學科活動之間的內在聯(lián)系, 都把科學發(fā)展的特性和規(guī)律作為自己研究的基本任務之一。 (科學計量學主要是從定量的角度來探討學科發(fā)展的內在規(guī)律,最終促進科學技術的進步。而信息計量學的研究目的也在于探明科學文獻本身的規(guī)律提高信息管理的科學性,通過信息規(guī)律的探討進而解釋科學技術的規(guī)律性。 )從研究對象和方法來看,兩者極為類似??茖W計量學研究的科學文獻及其數(shù)量, 也是信息計量學的研究對象之一。在方法上,兩者都要用數(shù)學和統(tǒng)計學的定量方法, 對科學文獻等信息進行定量的分析研究。在研究內容上,二者在很大范圍內都是彼此交叉的。但是應該指出信息計量學和科學計量學有很大的區(qū)別-信息計量學的范圍比科學計量學的范圍廣得多。 科學計量學仍然局限在科學文獻及其數(shù)量和非正式科學交流的消息、事件、實物等,而“狹義信息計量學”除了科學計量學的內容外還包括正式交流的事物信息?!鲅芯磕康牟煌?。信息計量學研究目的是“服務信息科學的研究需求” ,而科學計量學研究的目的是“研究并驗證科學的產生、傳播、利用的量的規(guī)律性” 。前者目的廣泛,后者目的比較單一。-應用領域不同。信息計量學在文獻、人才、學科、單位、數(shù)據(jù)評價方面發(fā)揮了很大的作用、可以涉及的面非常廣泛;而科學計量學在科學機制和科技政策的制定方面發(fā)揮了非常重要和獨特的作用。(4)由上面可知科學計量學必然向信息計量學方向發(fā)展,這和它研究內容和目的比較單一有關。信息計量學的研究目的和內容包含了科學計量學的研究目的和內容。4網(wǎng)絡信息計量學*Webometrics和cybermetrics可以直譯為“網(wǎng)絡計量學”和“賽博計量學” 。由于計量的對象是網(wǎng)上的信息或計算機控制的信息,而非“網(wǎng)絡”或“電腦”本身,因此直譯為網(wǎng)絡信息計量學或者網(wǎng)上信息計量學。-網(wǎng)絡信息計量學是采用數(shù)學、統(tǒng)計學等各種定量方法,對網(wǎng)上信息的組織、存儲、分布、傳遞、相互引證和開發(fā)利用等進行定量描述和統(tǒng)計分析, 以便揭示其數(shù)量特征和內在規(guī)律的一門新興分支學科。主要是由網(wǎng)絡技術、網(wǎng)絡管理、信息資源管理與信息計量學等相互結合、交叉滲透而形成的一門交叉性邊緣學科, 也是信息計量學的一個新的發(fā)展方向和重要的研究領域,具有廣闊的應用前景。5我國信息計量學的進展(7條)(1) 每年發(fā)表的文獻量增長較快,并逐步形成了本學科的核心情報源;(2) 確立并提高學科的地位;(3) 主要分支領域的研究取得了重要成果;(4) 文獻計量工具和手段的現(xiàn)代化取得了重要進展;(5) 專業(yè)教育起步快,發(fā)展迅速;(6)形成了一支骨干隊伍(核心研究隊伍已經(jīng)基本形成);(7) 國際交流與合作發(fā)展勢頭良好。6信息計量學的研究內容和研究方法(論述題)(1) 信息計量學的內容體系*信息計量學若干基本問題的探討■信息的基本測度'幾個基本定律的研究'信息流模型的研究'信息及量化方法的探討'信息計量方法和工具的自動化實現(xiàn)方面的研究'在圖書情報工作、信息資源管理、信息檢索、 信息分析與預測、科學學與科學評價等領域的應用(2) 信息計量的方法體系信息計量的方法體系主要有統(tǒng)計分析法、數(shù)學模型分析法、引文分析發(fā)、詞頻分析法、共現(xiàn)分析法、聚類分析法、計算機輔助信息計量分析法。'統(tǒng)計分析法:主要包括兩個部分,一是信息計量的一些專業(yè)統(tǒng)計術語,二是數(shù)理統(tǒng)計。數(shù)理統(tǒng)計的研究主要是兩個方面:一是研究如何從總體中抽取樣本,抽多少,怎樣抽的問題,即抽樣方法的問題。二是研究如何對抽樣的結果(樣本數(shù)據(jù))進行合理的分析,做出科學的推斷,即統(tǒng)計推斷問題。.數(shù)學模型分析法:用某種數(shù)學語言描述系統(tǒng)的結構和行為而構造出來的,除了從宏觀的角度模擬出系統(tǒng)的結構和運動規(guī)律外,主要是從微觀上、定量的方向描述出系統(tǒng)的結構、聯(lián)系以及運動規(guī)律?!疽姆治龇ǎ阂姆治鼍褪怯酶鞣N數(shù)學及統(tǒng)計學的方法和比較、歸納、抽象、概括等邏輯方法,對科學期刊、論文、著者等各種分析對象的引證與被引證現(xiàn)象進行分析,以揭示其數(shù)量特征和內在規(guī)律的一種計量分析方法。E計算機輔助信息計量分析法:研究在理論分析的基礎上,著重進行了計算機輔助信息計量軟件的設計與開發(fā)工作,實現(xiàn)了套錄資料重組建庫以及多種資料統(tǒng)計分析的功能。該方法的建立標志著我國信息計量研究的方法體系已基本形成并日趨完善??贠第二章文獻信息增長規(guī)律1文獻信息流在信息計量學中,通常把文獻所含信息的匯流成為文獻信息流。由于文獻是信息的最基本的載體形式,文獻信息流是一系列主題特征的科學文獻的集合, 所以有時將文獻信息流簡稱為文獻流。2文獻信息流的特性(動態(tài)特性和靜態(tài)特性)主要有兩個方面:文獻信息流的靜態(tài)特性和動態(tài)特性(1)靜態(tài)特性一一在一定時間內科學文獻在空間的分布性質,如集中 一一離散分布、文獻按著者分布、詞匯在文獻中的分布、引文分布、主題相關分布等的規(guī)律性。(2) 動態(tài)特性一一指科學文獻隨時間的延續(xù)而增長和老化的性質??茖W文獻既增長又老化,在增長中不斷老化,在老化之中又不斷增長;增長是文獻信息流的主要趨勢。第三章文獻信息老化規(guī)律1文獻信息老化一般而言,“老化”問題包括文獻老化和情報(信息)老化。情報的老化是相對于情報對象而言,而文獻的老化則是相對于情報用戶而言的。科學文獻老化一一指科學文獻隨其“年齡”的增長, 其內容日益變得陳舊過時,作為情報源的價值不斷減小,甚至完全喪失其利用價值。既是一種客觀的社會現(xiàn)象,又是一個復雜的動態(tài)過程。文獻信息老化的度量指標(1) 半衰期一一指某學科(專業(yè))現(xiàn)實尚在利用的全部文獻中較新的一半是在多長一段時間內發(fā)表的(共時半衰期)。這與該學科一半文獻時效所經(jīng)歷的時間(歷時半衰期)大體相當。半衰期適用性:共時半衰期通常是評價某一學科領域或專業(yè)文獻的老化趨勢, 而不是指個別文獻;而歷時半衰期,可以是某一學科文獻老化的半衰期,也可以是一種期刊,甚至一篇文獻老化的半衰期。半衰期的計算:作圖法將統(tǒng)計數(shù)據(jù)制成引文分布表, 以引文累積量或引文百分累積量為縱坐標, 以被引文出版的年齡為橫坐標作圖,在圖中找出與縱坐標上引文累積量或百分累積量一半處的對應點的橫坐標,即為所求結果。定量模型計算法對統(tǒng)計數(shù)據(jù)建立文獻老化模型,再根據(jù)定義找出半衰期的計算公式,將相應數(shù)據(jù)代入求得結果。(2)普賴斯指數(shù)一一在幾個知識領域內,把對年限不超過 5年的文獻的引文數(shù)量與引

文總量之比當作指數(shù),用以量度文獻的老化速度和程度。計算公式為:比出版年限不超過5年的被引文獻數(shù)量

普賴八斤指數(shù)=被引文獻總量 *100%普賴斯指數(shù)和半衰期比較:一般說來,某一學科或領域文獻的“普賴斯指數(shù)”越大,半衰期就越短,說明文獻的老化速度就越快。它們都是從文獻被利用的角度出發(fā),但是以不同的方式來反映文獻老化的情況。文獻的半衰期只能籠統(tǒng)地衡量某一學科領域全部文獻的老化情況, 而“普賴斯指數(shù)”既可用于某一學科領域的全部文獻,也可用于評價某種期刊、某一機構,甚至某一作者或某篇文章的老化特點。半衰期概念可以適用于一般的情報老化, 而普賴斯指數(shù)只適用于文獻情報。(3) 剩余有益性指標期刊有益性一一某一年份某一期刊被用戶所利用的文獻數(shù)。剩余有益性一一經(jīng)過若干年后,期刊還保留的有益性。只是對與滿足一定類型和內容的情報需求的幾種期刊來說,才是有用的。(4) 中值引文年齡第四章文獻信息集中與離散分布規(guī)律一一布拉德夫定律1布拉德夫定律的基本內容(圖像、文字描述)一般認為,布拉德福定律的基本原理是由其區(qū)域描述和圖像描述兩個部分組成的。(1) 區(qū)域描述如果將一定時間內(通常一年)的按某學科載文量等級排列的期刊劃分為三個區(qū), 使每一個區(qū)所包含的相關論文數(shù)量相等,即恰好等于全部期刊發(fā)表的該學科文章總數(shù)的三分之一,便可發(fā)現(xiàn):第一區(qū)(核心區(qū))所涉及的文章來自數(shù)量不多但效率很高的 n1中期刊;第二區(qū)(相關區(qū))包括數(shù)量較大、效率中等的n2中期刊;第三區(qū)(外圍區(qū))包括數(shù)量最大而效率很低的n3中期刊。那么這三個區(qū)中的期刊數(shù)量成下列關系: n1:n2:n3=1:a:a2(a>0)(1)式中:a即布拉德福常數(shù),或稱比例系數(shù)。就布拉德福所分析過的數(shù)據(jù)而言, a值大約為5.0。上式即為布拉德福定量的區(qū)域表述形式,經(jīng)過維克利的研究,可以把三個區(qū)討論的文獻離散規(guī)律推廣到任意多個區(qū)的情況。各區(qū)的期刊的載文量是逐區(qū)下降, 而各區(qū)期刊數(shù)量則是逐區(qū)上升的。核心區(qū)情報密度最高,相關區(qū)次之,夕卜圍區(qū)情報密度最低。(2) 圖像描述(書107和111)如果取上述等級排列的期刊數(shù)量的對數(shù) (lgn)為橫坐標,以相應的論文累計數(shù)R(n)為縱坐標進行圖像描述,便可得到一條曲線一一布拉德福分散曲線。分散曲線AB由兩部分組成:對應核心區(qū)的上升的一段曲線 AC和對于相繼各區(qū)的直線CB,后來研究表明,拐點C點為核心區(qū)的分界點。布拉德福在研究時發(fā)現(xiàn),從圖像出發(fā)還可以得到另一個結論,即:n1:(n1+n2):(n1+n2+n3)=1:b:b2記n1-2=n1+n2,n1-3=n1+n2+n3,則可將上式改為:(2n1:(2)其中,n1其中,n1--核心區(qū)的期刊數(shù)量n1-2--核心區(qū)和第二區(qū)的期刊累積數(shù)n1-3--全部三個區(qū)中的期刊累積數(shù),即期刊總數(shù) N b--分散系數(shù)區(qū)域描述和圖像描述的關系區(qū)域描述方法是根據(jù)實際統(tǒng)計的具體數(shù)據(jù), 取近似值而概略地歸納出的,嚏箜種近似的經(jīng)驗方法。從許多統(tǒng)計數(shù)據(jù)中都可以發(fā)現(xiàn),幾乎每一組統(tǒng)計數(shù)據(jù)都近似地滿足( 1)式,而且每一組數(shù)據(jù)也只能近似地滿足( 1)式。圖像描述方法所依據(jù)的是與區(qū)域描述完全相同的統(tǒng)計數(shù)據(jù), 只是圖像描述將統(tǒng)計的期刊數(shù)取對數(shù),并利用了三個區(qū)中相關論文量相等這一近似條件而得到 (2)式的結論的。因此,從數(shù)學觀點來看,圖像描述的可行的,從實際應用看來,圖像描述也非常接近于反映文獻的實際分布情況,甚至其近似程度比( 1)式更為精確。按布拉德福區(qū)域描述公式所產生的理論曲線與圖像描述的經(jīng)驗曲線基本上是一致的, 兩種表現(xiàn)形式之間沒有歧異性,而具有一致性。布氏分布理論的組成和模型(1) 布拉德福分布理論的基本內容是研究科學論文在期刊中的分布規(guī)律及其應用,目前主要包括:一個定律,十來個經(jīng)驗公式和四個數(shù)學模型。(2) 布拉德福文獻分散定律是布氏分布理論的核心內容。有兩個基本點:一是等級排列,形成主體來源(期刊)的有序目錄; 二是確定相關論文在主體來源中的分布規(guī)律。 具體研究方法包括區(qū)域分析法和圖像分析法。 布氏定律是布氏分布理論的最基本定律, 是這一理論賴以存在的必要基礎。(3) 布氏分布經(jīng)驗公式:布魯克斯的直線分布公式、肯德爾的“布拉德福一齊普夫定律”的一般公式、萊姆庫勒的所謂規(guī)范化公式、斯馬利科夫的統(tǒng)一方程(4) 分布模型:布魯克斯的混合泊松分布模型、納蘭南的序性流模型、阿拉麥斯庫的科學擴散模型布氏分布理論的發(fā)展趨勢(1) 從目前情況來看,工作主要集中在兩個方面。一是進行具體統(tǒng)計,驗證布氏定律,并試圖應用于實踐。二是尋求普遍而精確的經(jīng)驗分布公式的理論解釋,并取得了較大進展。(2) 科學論文的分布受到很多因素的影響和客觀條件的限制,帶有主觀性和模糊性。如果取得了數(shù)學表現(xiàn)上的突破后,就會更加完備、 更具有普遍的指導意義。因此,今后發(fā)展的趨勢將是更多的運用概率論、隨機過程理論和模糊數(shù)學等工具,同時考慮多種因素的綜合影響,結合文獻工作實際,尋求更為精確、更為普遍適用的分布公式和數(shù)學模型。 當前研究主要方向和要解決的問題是:'運用大量的統(tǒng)計數(shù)據(jù),以嚴密的數(shù)學方法,對布氏定律進行嚴格的檢驗, 比較各公式的優(yōu)劣,以盡快確立或尋求更為精確的規(guī)范化的數(shù)學模型。'深入研究布氏分布的機理,以尋求科學的統(tǒng)一的理論解釋?!龇治龊脱芯科溥m用條件及局限性, 并努力結合實際,大力開展應用研究;真正將理論用于指導文獻情報工作,以節(jié)約經(jīng)費,節(jié)省時間,切實提高文獻情報服務的效率。第五章文獻詞頻分布規(guī)律一一齊普夫定律齊普夫定律的理論基礎一一最省力法則每一個人的運動都是在一定的道路上進行的, 而且受一個簡單的基本法則的制約, 千方百計的選擇一條最省力的途徑,這樣一個法則稱為最省力法則。齊普夫定律-齊普夫定律的文字表述在任何一篇文章中,詞的出現(xiàn)頻率都服從如下規(guī)律: 如果把一篇較長文章(約5000字)中每個詞出現(xiàn)的頻次統(tǒng)計起來,按照高頻詞在前、低頻詞在后的遞減順序排列,并用自然數(shù)給這些詞編上等級序號,即頻次最高的詞等級為 1,頻次次之的等級為2,”,頻次最小的詞等級為D(或L)、若用%表示頻次,r表示等級序號,則有: F「*r=C(3)稱為齊普夫定律的絕對頻數(shù)表示法或頻次表示法。 式中C為常數(shù)。但這里的常數(shù)并不是絕對不變的恒量,而是圍繞一個中心數(shù)值上下波動。齊普夫定律不僅可以用詞的絕對頻數(shù) (頻次)表示,而且也可以用此的相對頻數(shù)(頻率)表示:令N為文章所包含的詞匯總數(shù) (詞容量),fr為第r級詞的相對頻率,則有耳=cr-i(4)稱為齊普夫定律的相對頻數(shù)表示法或頻率表示法。其中, c仍為常量,且C=C/N,而fr=Fr/N齊普夫運用其“最省力法則”解釋了這個定律。認為,在任何語言中,凡是使用頻率高的詞,功能總是不會太大。因為詞義本身在這個場合中價值小, 因而傳遞它們所需要的“力”就不大,所以,此的出現(xiàn)頻率與等級序號的乘積基本上穩(wěn)定于一個常數(shù)?!鳊R普夫定律的圖像描述一一齊普夫分布曲線(書141)根據(jù)文獻中出現(xiàn)的詞頻與等級序號的統(tǒng)計數(shù)據(jù), 建立F『與r的直角坐標系,用橫坐標表示詞的等級序號r,縱坐標表示相應的頻次 F『,就可以得到一條雙曲線,即齊普夫分布曲線(a)。如果等級序號r與頻次%都取對數(shù)坐標,則圖像就變成一條直線了, 即齊普夫分布對數(shù)曲線(b)。齊普夫定律的一般數(shù)學形式(2)中的曲線若用等價的數(shù)學式表示,則為:lgr+lgFr=lgC一般的,由解析幾何知,斜率為 b的任一直線可表示為:blgr+lgFr=lgC如果將這一方程改寫成類似(1)式的形式,則得:Fr*rb=C (5)若b=1,則(3)式和(5)式相同,這與后來朱斯提出的齊普夫定律的修正式的一致的。第六章文獻信息作者分布規(guī)律一一洛特卡定律1洛特卡定律文字表述(P167)檢驗發(fā)現(xiàn),生產2篇文章的作者大約是生產1篇文章作者數(shù)的1/4,生產3篇文章的作者數(shù)是生產1篇文章作者的1/9”,寫n篇文章的作者數(shù)是生產1篇文章作者數(shù)的1/n2;且生產1篇文章的作者數(shù)的全體作者的60%左右。可表述為:y(x)=y(1)/x2 (6)y(1)為寫1篇文章的作者數(shù),y(x)為寫乂篇文章的作者數(shù)。圖像描述(書168)洛特卡定律的特點洛特卡定律實際上是科學論文在作者上集中與分散的分布現(xiàn)象,具有兩個特點:洛特卡采用頻次排序的方法,即按某類作者出現(xiàn)的頻次大小排位,而非按照作者所寫的論文多少來對作者進行等級排序;論文在作者上的集中與分散程度只限于平方反比關系,即只給出了這種集中與分散程度的單一描述。2科學生產力第八章文獻信息統(tǒng)計分析法1文獻信息統(tǒng)計的原則和指標±指標:說明同類社會現(xiàn)象的某種數(shù)量特征的量。例如期刊量、相關論文量、流通量。指標體系是指一系列相互聯(lián)系的統(tǒng)計指標的集合。 統(tǒng)計指標的設置原則:確定性原則、可獲取性原則、簡便性原則、單位要明確文獻信息統(tǒng)計的原則要求(P259)針對性:對不同的具體統(tǒng)計項目不同的要求,如統(tǒng)計的內容、指標的設置、數(shù)據(jù)處理的方法等,都要有針對性,不能千篇一律。準確性:數(shù)據(jù)和結果的準確性是文獻信息統(tǒng)計的核心要求。只有文獻數(shù)據(jù)準確,才能得出可靠的分析結論。統(tǒng)計中,很多工作都是為了這個目標服務的, 如明確規(guī)定統(tǒng)計界限、指標含義、統(tǒng)計工具要有代表性、數(shù)據(jù)來源要廣泛等,都是保證數(shù)據(jù)準確,使之更接近于實際。代表性:抽樣統(tǒng)計的代表性較強的樣本,要能代表總體,提高統(tǒng)計結果的可靠性和分析結論的可信度。(4) 可比性:文獻信息統(tǒng)計數(shù)據(jù)是分析判斷的基礎,設置文獻指標和統(tǒng)計數(shù)據(jù)時,必須注意數(shù)據(jù)的可比性。這樣才便于比較分析,得出有說服力的結論。(5)累積性:累積數(shù)據(jù)可以是絕對數(shù)也可以使相對數(shù)。 在文獻信息統(tǒng)計研究中,常利用文獻的累積數(shù)來說明問題。文獻數(shù)據(jù)的累計時間越長,累積量越大,則越有理由提高文獻統(tǒng)計的準確性。文獻信息統(tǒng)計的類型和基本步驟(1) 類型E出版物統(tǒng)計:出版物包括圖書、期刊、期刊報告、專利文獻等各種類型的文獻。它是文獻統(tǒng)計的主要對象,對其數(shù)量進行統(tǒng)計分析是文獻計量學的重要內容和途徑。包括按國別、學科、語種對書刊等文獻量的統(tǒng)計,對科學期刊中登載某學科的文獻量的統(tǒng)計、對各出版社的書刊發(fā)行量的統(tǒng)計、對某學術團體或可研機構發(fā)表的專著、論文、專利等文獻量的統(tǒng)計。'著者統(tǒng)計:統(tǒng)計著者的論文數(shù)有利于掌握科技發(fā)展的水平; 同時也為人才學、科學學研究提供數(shù)據(jù)。主要有:杰出著者量的統(tǒng)計;分別統(tǒng)計各學科或專業(yè)的文獻的著者數(shù)比例,以便分析它們的研究峰期及發(fā)展趨勢, 為科學學和未來學的研究提供依據(jù)。■科技用語統(tǒng)計:專業(yè)術語的組成和數(shù)量變化在一定程度上反映者科學技術的交叉滲透、興衰起伏。.引文統(tǒng)計:對科學論文或著作所附的被引文獻數(shù)量進行統(tǒng)計, 或者利用引文索引工具來統(tǒng)計有關引文量。以引文數(shù)據(jù)為基礎的引文分析是很重要的常用的一種計量研究方法。■其他有關文獻信息利用的統(tǒng)計:主要指圖書情報單位的業(yè)務統(tǒng)計,包括藏書統(tǒng)計、溝通統(tǒng)計、讀者統(tǒng)計以及其他文獻情報項目的數(shù)量統(tǒng)計等。(2) 基本步驟*統(tǒng)計調查,確定具體方法、選準統(tǒng)計工具、明確指標項目、統(tǒng)計原始數(shù)據(jù)鼻統(tǒng)計整理,即對原始數(shù)據(jù)資料進行分門別類的加工整理, 工作內容包括:計算、排序、表示'統(tǒng)計分析,它是整個文獻統(tǒng)計分析的關鍵步驟, 包括統(tǒng)計數(shù)據(jù)的結論分析和誤差分析,分析方法有:理論指導下的分析、數(shù)值分析、圖像分析。第十章引文分析法1引文分析法:就是利用各種數(shù)學及統(tǒng)計學的方法和比較、歸納、抽象、概括等邏輯方法,對科學期刊、論文、著者等各種分析對象的引證與被引證現(xiàn)象進行分析, 以便揭示其數(shù)量特征和內在規(guī)律的一種文獻計量分析方法。2引文分析法的基本步驟(1) 選取研究對象:根據(jù)所要研究的學科的具體情況,選擇該學科中有代表性的較為權威的雜志,確定若干期及若干篇相關論文作為統(tǒng)計的對象。(2) 統(tǒng)計引文數(shù)據(jù):在選取的若干篇論文中,分項統(tǒng)計每篇論文后面的引文數(shù)量,引文的出版年代、語種、類型、論文作者的自引量等。根據(jù)研究的目的和要求,靈活掌握,自行確(3) 引文分析:在獲取的引文的數(shù)據(jù)的基礎上,根據(jù)研究目的,從引文的各種指標或其他不同的角度進行分析。(4) 作出結論。根據(jù)引文分析原理和其他一般原則進行判斷和預測,從而做出相應的分析結論。3引文分析法的主要工具結構功能和特點(SCI-E和ESD(1)SCI-E結構簡介簡易檢索提供三種檢索途徑一一主題、人名和地名,通過一系列簡單的提示符或者提問式引導檢索。全面檢索一一可以根據(jù)需要設定不同的限制條件, 使用戶可以查到最新、最全、最準確的信息,是比較專業(yè)的檢索方法。一般檢索主題、著者、來源期刊名、著者地址四個檢索途徑被引文獻檢索 被引著者、被引著作、引文年代檢索c?結構檢索用于檢索化學反應和化合物的化學結構d.高級檢索允許使用檢索項標記進行更復雜的檢索,并能進行檢索系列組合SCI-E特點和其他版本一樣,SCI網(wǎng)絡版主要也是用以檢索論文被收錄和被引證的情況。特色鏈接內部鏈接一被引次數(shù)、參考文獻和相關記錄的鏈接夕卜部鏈接一與ISIChemistryServer(SM、DerwentInnovationsIndex 、WebofScieneeProceedings、BIOSISPreviews的鏈接充分利用WW網(wǎng)羅天下的強大威力,SCI網(wǎng)絡版徹底改變了傳統(tǒng)的文獻檢索方式:通用的瀏覽器界面,無需安裝任何其他軟件;全新的超文本格式,所有的信息都相互關聯(lián)。SCI網(wǎng)絡版每周更新,并且每次更新即更新整個系統(tǒng)中的所有鏈接,包括被引次數(shù)、參考文獻、相關文獻的鏈接。SCI網(wǎng)絡版允許檢索整個數(shù)據(jù)庫或指定檢索年份,目前數(shù)據(jù)可回溯到 1945年,并且可檢索所有被引證的著者,而非僅僅是第一著者。SCI網(wǎng)絡版可以直接收錄純電子期刊,便于及時反映相關研究成果。ESI(美國《基本科學指標》)結構ESI的主要內容包括引文排位、高被引論文以及引文分析三大主要模塊。'引文排位,包括科學家、機構、國家和期刊排名表■高被引論文,包括高被引論文和熱門論文排名1引文分析,包括基線和研究前沿列表'對各種表格和數(shù)據(jù)進行評論的內容,包括 In-Cites、特殊話題、科學觀察。弓I文排位頁面和高被引論文頁面還提供了與頂尖論文頁面、時間序列圖的鏈接。美國ESI特點基本的分析工具服務對象的廣泛深入綜合全面的數(shù)據(jù)、論文和課題與其他信息資源的鏈接和整合美國ESI的評價功能:分析某個公司、研究機構、國家以及期刊的科學研究績效;跟蹤自然科學和社會科學領域內的研究發(fā)展趨勢; 分析評價員工、合作者、評論家以及競爭對手的能力;測定某一專業(yè)研究領域內科學研究成果的產量和影響力; 進行學科結構、學科關系以及學科發(fā)展史的研究;為科學評價提供重要的數(shù)據(jù)源。評價期刊的主要測度指標:期刊載文量、期刊引證率、期刊被引率、平均引文率(包括平均引證率和平均被引率)、影響因子、即年指標、期刊自引率、期刊自被引率。(1)影響因子:評價和比較一種期刊相對于同學科中其他期刊的影響力和重要性的指標。計算公式:影響因子=某刊前兩年發(fā)表論文在該年的被引證次數(shù) /該刊前兩年發(fā)表論文總數(shù)。即年指標(ImmediacyIndex,也稱當年被引指數(shù)):評價期刊中的論文被引證的速度,或者在同一年內期刊中的論文被引證的頻率。即年指標 二該刊某年發(fā)表的論文在當年的被引次數(shù)/當年發(fā)表論文的篇數(shù)。5引文耦合與同被引的異同(1)引文耦合:指引證文獻通過其參考文獻(被引證文獻)建立的耦合關系。具體來說,如果A和B兩篇文獻共同引證了一篇或多篇參考文獻,或者說它們共同具有某一篇或多篇同樣的參考文獻,則稱 A和B兩篇文獻具有引文上的耦合關系。(2)同被引:同被引一一指兩篇(或多篇)論文同時被后來的一篇或多篇論文所引證,則稱這兩篇論文(被弓I證論文)具有“同被引“關系。(3)異同7相同都是指兩篇論文通過另外一篇或多篇論文建立起來的關系, 所以都可以反映出文獻之間的聯(lián)系程度和結構關系,在引文分析中屬于同一種類型:即以文獻之間的聯(lián)系程度作為計量單位的網(wǎng)絡結構分析,從引文角度揭示論文的主題相似性,以及相互之間作用和聯(lián)系。這兩種分析方法都可用于研究文獻關系,進行文獻檢索和揭示學科結構等。■區(qū)別引文耦合反映的是兩篇引證文獻之間的關系,同被引反映的是兩篇被引證文獻之間的關系。前者由兩篇文獻的作者共同建立的,后者是由引證它們的作者各自建立的。引文耦合強度是固定不變的(因為對于任意兩篇已發(fā)表的論文來說,其后的參考文獻是固定不變的),同被引強度則隨時有可能發(fā)生變化(處于被動地位,等著其它文獻來建立) 。引文耦合反映的文獻間的關系是一種固定的長久的關系, 而同被引反映的則是變化的或暫時的關系。因此,引文耦合形成的模型的靜態(tài)結構模型,而同被引則是動態(tài)結構模型。引文耦合是回溯的,屬于“回向引證”,而同被引則是展望性的,屬于“前向引證” 。對于研究和解釋科學文獻的內在聯(lián)系與規(guī)律,描繪科學發(fā)展的動態(tài)結構來說, 同被引比引文耦合更具有優(yōu)越性,更適合當代情報科學研究的對象是不斷變化和發(fā)展的特點。6引文的聚類分析:文獻聚類分析是聚類分析技術在引文分析領域的具體利用。文獻聚類分析根據(jù)引文的不同特征,進行引文的分群聚類和分析研究。 是指分析對象根據(jù)彼此之間的相關程度分成類群,使群內盡量相似,群間盡量相關,然后進行分析研究的過程。7引文分析法的局限性著者引證文獻是一個人為控制的思維和判斷過程, 而作為其表現(xiàn)形式的引證文獻, 僅僅是宏觀的、表面的測度。(1) 文獻被引證并不完全等于重要(2) 著者選用引文受到可獲得性的影響文獻地理分布、著者語言能力、文獻本身年齡和流通狀況等影響(3) 引文關系上假聯(lián)系的影響引證文獻的原因多種多樣,兩篇論文可能出于完全不同的原因或從不同的角度引證同一篇早期文獻,一篇可能是引證其方法,另一篇可能是引證其結果, 這樣這兩篇文獻在內容上的聯(lián)系就可能是虛假的;引文有些是發(fā)生在前言和篇名中, 有些是在正文中,有些發(fā)生在結論或討論中。(4) 馬太效應的影響人們往往以“名著”、“權威”作為選擇引文的標注,有的確是出于需要,有的則是為了裝飾門面、太高自己論文的身價,從而掩蓋和影響著文獻引證的真實性。第十二章信息計量學在信息資源管理與研究中的應用(論述)核心期刊的定義及形成機理-指針對某一學科或專業(yè)領域來說, 刊載大量專業(yè)論文和利用率較高的少數(shù)重要期刊, 就成為該學科(專業(yè))的核心期刊。各種期刊的情報價值有大有小, 在情報信息交流中所發(fā)揮的作用各不相同。這種情報價值交流作用的大小往往取決于相關論文在期刊中的分布狀況。對于某一特定期刊而言,少數(shù)期刊的相關學科或專業(yè)來說, 少數(shù)期刊所含的相關情報量很大,而多數(shù)期刊的相關情報量卻很少。.從文獻分布的集中與離散規(guī)律出發(fā),對核心期刊的形成機理至少和作兩個方面的理論解釋:(1)

受科學發(fā)展觀客觀規(guī)律的制約。 因為科學期刊的產生和發(fā)展是由學科發(fā)展客觀需要所決定的,而且每一種期刊都有自己的學科和專業(yè)性質, 使得該學科論文高度集中于少數(shù)期刊上,形成文獻分布的“堆加效應”。(2)某些人為控制的主觀因素也會影響文獻的分布和核心期刊的產生及發(fā)展。例如“馬太效應”的影響,使大量的文獻“堆力『在少數(shù)期刊上,形成文獻分布的集中現(xiàn)象,同時在文獻生產和交流過程中,許多現(xiàn)象要受到人為選擇因素的影響,而人的選擇要受“最省力法則”的支配。核心期刊的測定概念核心期刊的測定是文獻信息計量學實際應用中的一項重要內容。研究和評價期刊質量,科學地確定核心期刊的范圍,對于獲得高密度的情報源,對于圖書情報單位建立基本的核心館藏,對廣大科學工作者重點閱讀本專業(yè)期刊內容等具有重要意義。核心期刊測定的重要意義(1) 圖書情報管理單位科學管理上的需要沒有必要也沒有可能,只能有選擇地因此,研究和評價期刊的質量、科沒有必要也沒有可能,只能有選擇地因此,研究和評價期刊的質量、科是圖情領域的重要研究課題,也是提(2) 科技工作者重點閱讀的需要據(jù)不完全統(tǒng)計,目前科技期刊6萬種,每年發(fā)表的論文400萬篇以上,一個科學家或工程技術人員,面對數(shù)量如此龐大的文獻,想要將本學科范圍內的文獻全部瀏覽或是閱讀一遍幾乎不可能,毫無疑問,科研人員只能有選擇性的重點閱讀本專業(yè)的核心文獻。(3) 提高信息檢索和文獻信息服務效率的需要只有了解各種期刊的特點和優(yōu)缺點,掌握重要論文的出現(xiàn)規(guī)律與搜集途徑,把握一批高質量的核心期刊,才能有針對性的做好信息檢索和文獻情報服務公司。 在解決咨詢和定題服務時,也必須充分利用各專業(yè)的核心期刊,提高文獻情報服務的工作效率。核心期刊的測定方法(1)利用信息計量學工具和指標直接選定各學科的核心期刊,如 SCI及其副產品《期刊引證報告》JCR提供的期刊被引量、影響因子等;(2)利用文獻計量學方法,按一定基本步驟測定。如果從測定的標準來劃分,包括:*以載文量為標準的方法, 包括布氏定律法及百分比補償和累積百分比法'以摘引率為標準的方法,包括文摘法和引文法'以流通量為標準的方法、信息計量學與人有哪幾方面內容(科學預測、技術預測、)、信息計量學與人有哪幾方面內容(科學預測、技術預測、)P502)1、信息計量學與科學學研究的基本原理與基本內容(科學學是門研究科學本身發(fā)展規(guī)律和組織結構的學科??茖W學的發(fā)展規(guī)律,在很大程度上是有人才、經(jīng)費、成果的消長演變、增長速度、學科構成及其比例關系來體現(xiàn),而這方面的變化又反映在科學文獻的各種變化上。 這是因為科學文獻是科技知識和成果的客觀記錄, 是科學存在的表現(xiàn)形式??茖W文獻的數(shù)量和所量是對科學技術水平的一種度量。根據(jù)科學文獻的內容構成和數(shù)量的變化規(guī)律, 可以歸納總結、分析或評價科學技術的歷史和現(xiàn)狀, 以及預測整個科學系統(tǒng)發(fā)展趨勢和發(fā)展規(guī)律?;緝热荩嚎茖W發(fā)展特點①科學發(fā)展速度加快②具有繼承性③階段性④交叉滲透性⑤科學發(fā)展重點的轉移⑥科學勞動的集中性科學結構①利用書目分析法a書目結構反映學科結構b書目數(shù)量變化反映學科發(fā)展的動態(tài)特性②利用引文分析法a?靜態(tài)研究,如引文聚類形成的網(wǎng)絡圖b?動態(tài)比較研究c?超結構的微觀研究,利用二維空間來描繪跨學科的宏觀聚類 ③利用詞頻分析法研究學科發(fā)展結構科技史(4)科技政策2、 信息計量學評價人才的原理與方法(P513)原理(1)科技人員的成就與學術造詣與其發(fā)表的文獻數(shù)量有關。一般而言,科學人員的發(fā)明越多,成就越大,他的文獻,特別是專利文獻以及在重要刊物上發(fā)表的文獻就越多。(2)科技人員的成就和學術造詣與其發(fā)表文獻的被引次數(shù)有關。文獻的被引次數(shù)的多少,在一定程度上反映了文獻的質量和價值, 從總體上反映了該文作者在學術界的影響和地位以/r

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論