![文獻信息中的離散分布規(guī)律_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/4/4454e8fa-6087-4dcf-aa48-f810a6b9bb6d/4454e8fa-6087-4dcf-aa48-f810a6b9bb6d1.gif)
![文獻信息中的離散分布規(guī)律_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/4/4454e8fa-6087-4dcf-aa48-f810a6b9bb6d/4454e8fa-6087-4dcf-aa48-f810a6b9bb6d2.gif)
![文獻信息中的離散分布規(guī)律_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/4/4454e8fa-6087-4dcf-aa48-f810a6b9bb6d/4454e8fa-6087-4dcf-aa48-f810a6b9bb6d3.gif)
![文獻信息中的離散分布規(guī)律_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/4/4454e8fa-6087-4dcf-aa48-f810a6b9bb6d/4454e8fa-6087-4dcf-aa48-f810a6b9bb6d4.gif)
![文獻信息中的離散分布規(guī)律_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/4/4454e8fa-6087-4dcf-aa48-f810a6b9bb6d/4454e8fa-6087-4dcf-aa48-f810a6b9bb6d5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、一一. .布拉德福定律布拉德福定律二二. .齊普夫定律齊普夫定律三三. .洛特卡定律洛特卡定律四四. .布布- -洛洛- -齊分布系齊分布系文獻信息中的離散分布規(guī)律一、布拉德福定律 布拉德福定律的產(chǎn)生背景布拉德福定律的形成布拉德福定律的基本原理布拉德福定律的理論發(fā)展1.布拉德福定律 的產(chǎn)生背景l(fā)布拉德福Samuel Clement Bradford ,1878-1948著名的文獻學(xué)家和化學(xué)家創(chuàng)立了布拉德福文獻分散經(jīng)驗法則,是文獻計量學(xué)的主要奠基人多產(chǎn)作家,著有大量關(guān)于分類理論與實踐,編目理論的著作1948年,完成巨作文獻學(xué)文獻分散規(guī)律的系統(tǒng)概述1.布拉德福定律 的產(chǎn)生背景l(fā)文獻分散是普遍的客觀
2、現(xiàn)象一門學(xué)科的論文分散在其他學(xué)科的期刊雜志上屢見不鮮。如何找出其分散的規(guī)律性是關(guān)鍵所在。l科學(xué)統(tǒng)一性原則每一門學(xué)科都或多或少與其他任何一門學(xué)科相關(guān)聯(lián)對一個專家有用的論文,不僅出現(xiàn)在這個專家所在學(xué)科的專業(yè)期刊上,也可以出現(xiàn)在“其他學(xué)科”的期刊上。1.布拉德福定律 的產(chǎn)生背景現(xiàn)象:300種文摘和索引期刊每年摘登的750000篇文章,由于漏摘、漏標(biāo)和同時存在的無意義重復(fù),致使僅載有250000篇不同的文章,而兩倍于此數(shù)量的500000篇文章則全部漏摘、漏標(biāo)而與讀者絕緣。猜測:專業(yè)文獻除密集地登載于相應(yīng)的專業(yè)期刊(約1/3),還登載于大量的專業(yè)邊緣(相關(guān)的)期刊(約1/3)和更一般化的期刊(約1/3)
3、 ,后兩者過于分散而難以查找等原因?qū)е挛墨I大量丟失。假設(shè):任何一學(xué)科的絕大部分專業(yè)文獻都集中于少數(shù)的相應(yīng)專業(yè)期刊內(nèi),但是同時也散布于其它的相關(guān)期刊之中,其散布的態(tài)勢則與該學(xué)科研究范圍的大小有關(guān)。2.布拉德福定律 的形成1933年,科學(xué)博物館樣本:期刊應(yīng)用地球物理學(xué)潤滑學(xué)領(lǐng)域2.布拉德福定律 的形成右表為科技期刊按其載文量遞減順序排列的表格統(tǒng)計結(jié)果A為期刊數(shù)量B為相應(yīng)期刊所載的論文 數(shù)量C為A項的累積和AD為B項的累積和BE為期刊累積量的對數(shù) 即lgC=lgA。3.布拉德福定律 的基本原理布拉德福的兩種處理方法:區(qū)域表示法(文字表述法)圖形表示法(經(jīng)驗法)3.布拉德福定律 的基本原理區(qū)域表示法(
4、文字表述法)布拉德福根據(jù)專業(yè)論文載于三類不同期刊的設(shè)想將表中的數(shù)據(jù)經(jīng)加和后按載文累積量劃分為a、b、c大致相等的三個區(qū)域,即每一區(qū)域所包含的相關(guān)論文數(shù)量相等。兩個領(lǐng)域的期刊分區(qū)表兩個領(lǐng)域的期刊分區(qū)表分區(qū)期刊載文數(shù)數(shù)量(篇/年)應(yīng)用地球物理學(xué)潤滑作用期刊數(shù)量論文數(shù)量期刊數(shù)量論文數(shù)量a94298110b5949929133c2584041271524N14NN13.布拉德福定律 的基本原理發(fā)現(xiàn)相應(yīng)期刊的累積量(C) 之比近似構(gòu)成等比數(shù)列;即: 第一區(qū)(核心區(qū)):數(shù)量不多但效率最高的 種期刊第二區(qū)(相關(guān)區(qū)):數(shù)量較大、效率中等的 種期刊第三區(qū)(邊緣區(qū)):數(shù)量最大而效率最低的 種期刊三個區(qū)域中的期刊數(shù)
5、量關(guān)系 a為布氏系數(shù) 1p2p3p2321:1:aannn(潤滑作用)應(yīng)用地球物理學(xué)224:4:1127:29:8)(5:5:1258:59:93.布拉德福定律 的基本原理布氏定律的表示發(fā)現(xiàn):各區(qū)的期刊數(shù),逐區(qū)上升每種期刊的載文量逐區(qū)下降核心區(qū)信息密度最高,每種期刊平均刊載27.5篇論文相關(guān)區(qū)次之,每種期刊平均載文5.5篇論文邊緣區(qū)最低,每種期刊平均刊載1篇論文分區(qū)分區(qū)期刊數(shù)期刊數(shù)論文量論文量1(核心區(qū))82202(相關(guān)區(qū))40=8 52203(邊緣區(qū))2202582003.布拉德福定律 的基本原理布氏定律的文字描述如果將科技期刊按其刊載某專業(yè)論文數(shù)量多少,以遞減順序排列,則可分出一個核心區(qū)和
6、相繼的幾個領(lǐng)域,每區(qū)刊載的論文量相等,此時核心期刊和相繼區(qū)域期刊數(shù)量呈 的關(guān)系.:12nn)(:1:2321為公比nnnnnn3.布拉德福定律 的基本原理圖形表示法取期刊累積量的對數(shù)為橫坐標(biāo),以相應(yīng)論文的積累量為縱坐標(biāo),得到了圖中的AB兩條曲線。通過觀察,布拉德福認為這兩條曲線除下彎部分外,上半部分可以認為是一條直線。3.布拉德福定律 的基本原理設(shè)P1為該曲線的直線部分與曲線部分的分界點; 且令 則, 因為橫軸為對數(shù)坐標(biāo),所以有:rOXOYYYYY111223,SXXXX2312)(102lg)(10lg)(10lg2rrr的累積期刊數(shù)為第一、第二、第三區(qū)或刊數(shù)為第一、第二區(qū)累積期或為第一區(qū)的
7、期刊數(shù)或)()(sssrsrr)(:110:10:10:A102)2()(s為公比,得令A(yù)AAsrsrr3.布拉德福定律 的基本原理結(jié)論如果將某專業(yè)刊載文獻按載文量的遞減順序排列,并將其劃分為三個載文量相等的區(qū)域,則相應(yīng)的期刊累積數(shù)量呈等比關(guān)系。顯然第一區(qū),即P1以下的下彎部分,其載文密度最大,布拉德福將其稱為核心區(qū)域。)(:1:2為公比AAA3.布拉德福定律 的基本原理布拉德福認為造成這種文獻離散分布勢態(tài)的根本原因在于:科學(xué)的整體性原則科學(xué)是在時間上先后相繼、各個專業(yè)間內(nèi)容相聯(lián)的整體。作為科學(xué)知識載體的各專業(yè)文獻之間也必然會存在這樣的聯(lián)系,文獻的增長與老化是前者的體現(xiàn),而專業(yè)文獻散布于相關(guān)專
8、業(yè)期刊中的事實卻是后者的反映學(xué)科專業(yè)之間聯(lián)系的緊密程度不一整體性原則還認為科學(xué)中各個學(xué)科專業(yè)之間聯(lián)系的緊密程度不一。此在文獻中的表現(xiàn)就是刊載文獻在相應(yīng)期刊中的不均勻分布3.布拉德福定律 的基本原理格魯斯下垂:格魯斯(Q.V.Groos)認為布氏定律的圖形應(yīng)該為三個部分。上升的曲線部分直線部分彎曲下垂部分下垂部分稱為布魯斯下垂加拿大的波普(Adrew Pope)進行統(tǒng)計分析也證明了圖形由三部分組成反映理論值與實際值的差異期刊數(shù)和文獻量統(tǒng)計不足,未能代表全部文獻3.布拉德福定律 的基本原理區(qū)域描述與圖形描述的比較經(jīng)過數(shù)學(xué)證明布氏定律的兩種形式存在著不能統(tǒng)一的矛盾從數(shù)學(xué)和實際觀察來看,圖像描述更接近
9、于文獻的實際分布情況就文獻計量學(xué)的規(guī)律說明,不論是區(qū)域描述還是圖像描述,都只能近似的揭示文獻分布的規(guī)律,無法精確的符合統(tǒng)計數(shù)據(jù)4.布拉德福定律的理論發(fā)展l創(chuàng)立階段1934年,布拉德福的論文特定主題的信息源(Sources of Information on Specific Subject)1934-1948年,無人問津1948年,文獻學(xué)的出版,使其理論開始傳播l理論研究階段(60年代)“布拉德福熱”:相關(guān)研究空前活躍形成兩個學(xué)派:區(qū)域派和圖像派l全面發(fā)展階段(60年代以后)由純粹的理論研究向應(yīng)用領(lǐng)域滲透理論與應(yīng)用并列的全面發(fā)展情形4.布拉德福定律的理論發(fā)展l維克立的兩個推論布氏定律不只局限于
10、劃分三個區(qū)域,其證明可將等級排列的期刊劃分為任意多個區(qū)域圖像表達式的推論(維氏公式) 為第一區(qū)到第k區(qū)的期刊累積數(shù)量 m為劃分的區(qū)域數(shù) v為分散系數(shù)布氏公式的推廣形式(布氏公式) 12131211.:1.:mmVVVnnnn),.3,2(1mknk12321.:1.:mmaaannnn4.布拉德福定律的理論發(fā)展l萊姆庫勒對布氏定律的描述發(fā)展了區(qū)域描述方法從布氏定律的文字描述(區(qū)域描述)出發(fā),推導(dǎo)出按等級排列的期刊中論文分布的規(guī)范式公式萊姆庫勒累積分布函數(shù)的推導(dǎo) F(x)表示在x的比例下,期刊論文數(shù)與期刊論文總數(shù)的比例。p例如,如果要得到比例為80%的論文,將F(x)=0.8和相應(yīng)的 的值代入,
11、反求出x,即所需期刊的最少數(shù)量 ,a是布拉德福系數(shù), =b-1x表示用來定義全部期刊中含有某一指定數(shù)量相關(guān)論文的最少期刊與期刊總數(shù)之比 )1ln()1ln()(xxF11)(bbfXf2ab 4.布拉德福定律的理論發(fā)展l布魯克斯對布氏定律的描述1969年,英國著名情報學(xué)家布魯克斯利用數(shù)學(xué)公式描述了布氏定律R(n):對應(yīng)于n的相關(guān)論文累積數(shù)n:期刊等級排列的序號a:第一級期刊中相關(guān)論文數(shù)R(1)c:核心區(qū)的期刊數(shù)N:等級排列的期刊總數(shù)k:參數(shù),分散曲線中直線部分的斜率, 當(dāng)n足夠大時,k=Ns:參數(shù),其數(shù)值等于圖形直線部分反 向延長線與橫軸交叉點的n值4.布拉德福定律的理論發(fā)展l例子右表為所收集
12、的有關(guān)維生素學(xué)論文 在相應(yīng)在期刊中分布的統(tǒng)計數(shù)據(jù)和 以布魯克斯公式為數(shù)學(xué)模型的計算 值。表中n為按載文量遞減順序排列 的期刊序號,R(n)為前n種期刊的論 文累積量。預(yù)期的預(yù)期的全檢數(shù)全檢數(shù)量量4.布拉德福定律的理論發(fā)展驗證實際統(tǒng)計數(shù)據(jù)是否符合布拉德福定律: 由布魯克斯公式可得:查表知R(5)=269,若滿足布拉德福定律,則查表可知R(25)=537,R(52) R(25)因此可初步認定上述數(shù)據(jù)符合布拉德福定律。)(2ln2ln)(22nRsnksnknR5382692)5(2)5(2 RR4.布拉德福定律的理論發(fā)展驗證查驗該項統(tǒng)計的完整性: 經(jīng)統(tǒng)計已知,有關(guān)維生素論文在相應(yīng)期刊中分布的s值為
13、1,在表中, 選 n=25為參考點,則有: R(25)=Nln25/1=537 所以 N=537/ln25=167(種) 則有論文的理論值總量為: R(167)=167ln167/1=853(篇) 與表中的實際查到值比較,實際查到期刊總量為146種,實際查到文獻 總量為730篇,則統(tǒng)計結(jié)果的完整性是值懷疑的。 4.布拉德福定律的理論發(fā)展l布氏分布理論的發(fā)展趨勢主要的研究工作進行具體分析,驗證布氏經(jīng)驗法則,并實際應(yīng)用尋求普遍而精確的經(jīng)驗分布公式和理論解釋,并取得了較大的發(fā)展當(dāng)前研究方向和有待解決的問題運用大量的統(tǒng)計數(shù)據(jù)、嚴(yán)密的數(shù)學(xué)方法,確立或?qū)で蟾鼮榫_的規(guī)范化的數(shù)學(xué)模型深入研究布氏分布的機制,
14、尋求科學(xué)統(tǒng)一的理論解釋努力結(jié)合實際,開展應(yīng)用研究,提高圖書情報服務(wù)的效率 二、文獻信息詞頻分布規(guī)律齊普夫定律l齊氏定律形成的基礎(chǔ)頻率詞典(詞表)每一個詞在一定長度的文件中出現(xiàn)的頻率兩個最基本的數(shù)量指標(biāo)(詞的出現(xiàn)頻率、詞的序號)艾斯杜(J. Estoup,速記員)1916發(fā)現(xiàn)較長的文章中,詞頻分布的定量化形式Nrr=C(常數(shù))詞的序號:1,2,r,D (1:絕對頻率最大的詞,D:絕對頻率最小的詞)詞的絕對頻率:n1,n2,nr,nD 二、文獻信息詞頻分布規(guī)律齊普夫定律l齊氏定律的內(nèi)容齊普夫定律fr r=c fr:頻次,r:等級序號齊普夫定律的“最省力法則”的解釋任何語言中,凡是使用頻率最高的詞,
15、功能總是不會太大;因為其本身在這個場合中價值小,因而傳遞它們所需要的“力”就不大。 二、文獻信息詞頻分布規(guī)律齊普夫定律l齊氏定律的圖像描述 橫坐標(biāo):等級序號r縱坐標(biāo):相應(yīng)的頻率f等級r與頻率f均取對數(shù)虛線:lnr+lnf=lnc實線:blnr+lnf=lnc斜率為b二、文獻信息詞頻分布規(guī)律齊普夫定律l齊氏定律的應(yīng)用文獻標(biāo)引和詞表編制信息檢索在圖書情報管理中的應(yīng)用 三、文獻信息作者分布規(guī)律洛特卡定律l洛特卡定律概述誕生1926年,洛特卡最先研究了科學(xué)文獻數(shù)量與著作數(shù)量之間的關(guān)系,并創(chuàng)造性地提出“科學(xué)生產(chǎn)率”的概念,即指在一定時間內(nèi)科學(xué)工作者在科學(xué)上所表現(xiàn)出的能力和工作效果,通常用其生產(chǎn)的科學(xué)文獻
16、數(shù)量來衡量。 在提出科學(xué)生產(chǎn)率概念的同時,洛特卡就圍繞它進行了統(tǒng)計研究。選用化學(xué)文摘與物理學(xué)史一覽表來研究科學(xué)家的著述數(shù)量,以此經(jīng)過數(shù)據(jù)統(tǒng)計、歸納分析及運用數(shù)學(xué)工具的推算得出洛特卡定律,即寫有x篇論文的作者頻率與x的平方呈反比。 頻數(shù)頻數(shù)頻率頻率三、文獻信息作者分布規(guī)律洛特卡定律l洛特卡定律公式表述設(shè)f(x)為寫x篇論文的作者數(shù)占作者總數(shù)的比例,c為某主題領(lǐng)域的特性常數(shù),洛特卡統(tǒng)計的指數(shù)a大約為2,對于倒冪法則的這個特例式變?yōu)檫@就是科學(xué)生產(chǎn)率的“平方反比定律”的表達式 axcxf/)(2/)(xcxf三、文獻信息作者分布規(guī)律洛特卡定律l洛特卡定律理論意義1926年洛特卡(Darka)定律創(chuàng)立至
17、今已整整80年,是文獻計量學(xué)中創(chuàng)立最早的一個定律,洛特卡定律也是文獻信息計量學(xué)的經(jīng)典定律之一。為文獻計量學(xué)的誕生奠定了一定的基礎(chǔ),其創(chuàng)立是值得紀(jì)念的。l洛特卡定律的命運由于多種原因,洛特卡定律沉睡了30多年,后來由于普賴斯等人的發(fā)掘,自60年代起引起人們的重視。今天,洛特卡定律仍然經(jīng)常被科學(xué)學(xué)家、情報學(xué)家等引證和研究。 引自科學(xué)的計量研究 三、文獻信息作者分布規(guī)律洛特卡定律l洛特卡定律的基本應(yīng)用反映科技勞動成果狀況可從統(tǒng)計或估算著者數(shù)量來預(yù)測文獻數(shù)量的增長速度和文獻流向科學(xué)估計勞動規(guī)模預(yù)測科學(xué)家數(shù)量的增長和科學(xué)家發(fā)展的規(guī)模及趨勢掌握科學(xué)論文的作者隊伍研究科學(xué)家的活動規(guī)律,研究人才的著述特征,合
18、理編制著者索引,規(guī)劃檢索刊物體系 四.布-洛-齊分布系l布拉德福定律、齊普夫定律和洛特卡定律是三個最基本的定律, 被人們喻之為文獻計量學(xué)的“三巨頭”,多年來一直受到圖書情報工作者的高度重視。值得指出的是, 這三個定律之間有很多相似之處, 存在著一定的聯(lián)系。研究對象期刊上刊載的論文文章中每個詞的出現(xiàn)頻次科學(xué)工作者的著述分析單元期刊數(shù) 單詞量 著者群計量方法都是通過對文獻的調(diào)查和統(tǒng)計,取得數(shù)據(jù)并進行分析歸納來定量地認識文獻情報流。四.布-洛-齊分布系數(shù)學(xué)表達式同一類型布拉德福定律:R(n)= klog(n/s)齊普夫定律f(x)= k/r 及其修正式f= k/rn洛特卡定律f(x)= k/x2如果
19、把數(shù)學(xué)式中的主體看作箱, 把某一特定量看作投入箱中的球, 那么對于布拉德福分布、齊普夫分布、洛特卡分布來說, 箱好比雜志、詞匯、著者; 球好比相關(guān)論文、單詞、著者所寫的論文。四.布-洛-齊分布系布拉德福分布是積累分布,R(n)表示n以前的累積數(shù)對R(n)= klog(n/s)微分dR(n)/dn= k/n與齊普夫公式一致,齊普夫修正式f= k/rn 作變換r=(k/f)1/a微分得dr/df =(k1/a /a) f-(1+1/a)取絕對值若a=1,即狹義的齊普夫形式與洛特卡定律一致。因此,這種類型的分布可統(tǒng)一用下式來表示: f(n) = k/nn 式中k,a為常數(shù),一般來說,1a2; f(n)為含有n個具體事項的主體來源數(shù)的分布密度。由此可知, 布拉德福分布、齊普夫分布、洛特卡分布的一致性是顯而易見的 四.布-洛-齊分布系情報分布模型相似:由上述三定律的數(shù)學(xué)表達式可以看出,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 設(shè)計類合同協(xié)議書
- 軟件產(chǎn)品開發(fā)與生命周期管理作業(yè)指導(dǎo)書
- 2025年聊城道路貨運駕駛員從業(yè)資格證考試
- 2025年咸寧道路貨運駕駛員從業(yè)資格證考試題庫
- 2024-2025學(xué)年高中政治課時作業(yè)12博大精深的中華文化含解析新人教版必修3
- 2024-2025學(xué)年度九年級物理全冊15.3串聯(lián)和并聯(lián)教學(xué)設(shè)計3新版新人教版
- 2024-2025學(xué)年高中英語Unit2LanguageSectionⅦWriting-調(diào)查報告教案含解析牛津譯林版必修3
- 2024年春八年級物理下冊第十章浮力章末小結(jié)與提升分層精煉新版新人教版
- 2024年新教材高中生物課時素養(yǎng)評價十八6.3.2隔離在物種形成中的作用含解析新人教版必修2
- 蘇科版數(shù)學(xué)八年級上冊聽評課記錄《1-3探索三角形全等的條件(1)》
- 國庫集中支付培訓(xùn)班資料-國庫集中支付制度及業(yè)務(wù)操作教學(xué)課件
- 詩詞寫作入門課件
- 2023年上海青浦區(qū)區(qū)管企業(yè)統(tǒng)一招考聘用筆試題庫含答案解析
- 2023版押品考試題庫必考點含答案
- 植物之歌觀后感
- 空氣能熱泵安裝示意圖
- 建筑工程施工質(zhì)量驗收規(guī)范檢驗批填寫全套表格示范填寫與說明
- 2020年中秋國慶假日文化旅游市場安全生產(chǎn)檢查表
- 昆明天大礦業(yè)有限公司尋甸縣金源磷礦老廠箐-小凹子礦段(擬設(shè))采礦權(quán)出讓收益評估報告
- 心有榜樣行有力量 -從冬奧冠軍徐夢桃身上感受青春奮斗初中主題班會
- 七年級英語下冊閱讀理解10篇
評論
0/150
提交評論