信息檢索與存儲_第1頁
信息檢索與存儲_第2頁
信息檢索與存儲_第3頁
信息檢索與存儲_第4頁
信息檢索與存儲_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、信息檢索與存儲第一章學(xué)習(xí)目標(biāo):1、信息資源的含義及國內(nèi)外的主要觀點2、信息資源的基本特征3、信息資源的類型及網(wǎng)絡(luò)信息的劃分4、紙質(zhì)文獻(xiàn)的類型與價值第1章 信息資源概論1.1信息資源1.2電子信息資源1.3紙制文獻(xiàn)資源1.1.1 信息資源的基本概念信息的涵義:廣義信息是物質(zhì)、能量存在和運動狀態(tài)的表征。狹義信息是人類社會共享的一切知識、學(xué)問以及從客觀現(xiàn)象中提煉出來的各種消息的總和,即現(xiàn)代信息。資源的涵義:資源是一切被人類開發(fā)和利用的客觀存在。如土地、森林、礦產(chǎn)、海洋、石油、人力、信息等資源信息資源的涵義:狹義指文獻(xiàn)資源或數(shù)據(jù)資源,抑或各種媒介和形式的信息的集合,包括文字、聲像、印刷品、電子信息、數(shù)

2、據(jù)庫等。這都是限于信息的本身。廣義信息資源是信息活動中各種要素的總稱。這既包含了信息本身,也包括了與信息相關(guān)的人員、設(shè)備、技術(shù)和資金等各種資源。(1)原始數(shù)據(jù)與信息的區(qū)別 原始數(shù)據(jù)經(jīng)過加工處理變?yōu)樾畔ⅲ?)信息與信息資源的區(qū)別 經(jīng)過加工、可被利用的信息稱為信息資源。information resource為復(fù)數(shù)時,常指信息及與信息有關(guān)的設(shè)備、人員等集合。信息資源的內(nèi)涵:是經(jīng)過人類選取、組織、序化的有用信息的集合信息資源是信息的集體;信息資源是經(jīng)過人類選擇、獲取的有用信息 的集合;信息資源是經(jīng)過人類組織序化的信息的集合。信息的基本性質(zhì):(1)信息是內(nèi)容是客觀的(2)信息的形式是主觀的(3)信息是

3、一切物質(zhì)的基本屬性與信息有關(guān)的概念:(1)知識。是對客觀事物規(guī)律性認(rèn)識,是系統(tǒng)化和精煉化的信息。知識的三種存在方式:大腦、實物、文獻(xiàn)知識的七個特征:不可替代性不可相加性不可逆性不可磨損性不可分性可共享性無限增值性知識分類: 4W 事實知識(Know What)原理知識( Know why)技能知識( Know how)人力知識( Know who)知識分類: 6W+1Q 事實知識( Know What)原理知識( Know Why)技能知識( Know How)人力知識( Know Who)時間知識( Know When) 空間知識( Know Where)數(shù)量知識( Know Quantit

4、y )(2)文獻(xiàn)。是記錄知識的一切載體,即用文字、圖形、符號、或聲視頻等記錄方式在一定介質(zhì)上所生成的物質(zhì)成果文獻(xiàn)的三要素:記錄、知識、載體文獻(xiàn)的功能:存儲功能傳遞功能認(rèn)識功能(3)情報。指為一定目的而搜集和傳遞的有特定效用的知識情報的基本屬性:傳遞性、效用性1.1.2 信息的基本特征:(1)普遍性(2)傳遞性(3)時效性(4)價值性(5)可轉(zhuǎn)換性(6)可利用性(7)可共享性1.1.3 信息資源的類型:按性質(zhì)劃分:(1)自然信息資源(2)社會信息資源按信息包含范圍劃分:(1)廣義信息資源(2)狹義信息資源按信息資源的載體:(1)印刷型信息資源(2)微縮型信息資源 (3)聲像性信息資源(4)電子型

5、信息資源按內(nèi)容:(1)文獻(xiàn)型信息資源(2)數(shù)據(jù)型信息資源(3)多媒體信息資源按保密程度:(1)公開性信息資源(2)半公開性信息資源(3)非公開性信息資源按表現(xiàn)形式:(1)文字性信息(2)圖像性信息(3)數(shù)值數(shù)據(jù)性信息(4)語音性信息按信息資源的加工程度:(1)一次信息(2)二次信息(3)三次信息按傳輸方式:(1)網(wǎng)絡(luò)信息資源(2)非網(wǎng)絡(luò)信息資源按數(shù)據(jù)資源信息的生產(chǎn)途徑和發(fā)布范圍分:(1)商用電子資源(2)網(wǎng)絡(luò)公開學(xué)術(shù)資源(3)特色信息資源1.1.4 信息意識:(1)認(rèn)識到信息和信息活動的功能和作用(2)認(rèn)識到信息對我們學(xué)習(xí)和課余科研活動的效用(3)認(rèn)識到各種信息源的價值和信息機構(gòu)提供的產(chǎn)品和服

6、務(wù)。(4)形成對信息的積極體驗,進(jìn)而產(chǎn)生相應(yīng)的信息需求和信息行為傾向。1.1.5 信息素質(zhì)教育:是從各種信息資源中檢索、評價使用信息的能力。是培養(yǎng)信息意識的一條重要的途徑。意識到準(zhǔn)確和完整的信息是決策的基礎(chǔ)信息素質(zhì)教育內(nèi)涵:1、了解信息需求及問題所在2、制定信息檢索策略3、掌握信息檢索技術(shù)4、能評價信息5、能根據(jù)實際用途組織信息6、使用信息,將新信息融會到知識結(jié)構(gòu)中1.2 電子信息資源電子信息資源發(fā)展的歷史:文本超文本多媒體超文本1.2.1電子信息資源含義與特點:1、存儲形式多樣化。文本、超文本、多媒體、超媒體2、資源數(shù)字化。3、交流程度高4、提高利用率5、內(nèi)容豐富6、載體容量大??傊娮淤Y源

7、數(shù)據(jù)庫具有冗余度小、共享性和安全性好、更新速度快、檢索手段多等優(yōu)點。1.2.2 網(wǎng)絡(luò)信息資源的類型1、按照網(wǎng)絡(luò)傳輸協(xié)議不同分(1)Web信息資源:通過HTTP在網(wǎng)上傳輸(2)Telnet信息資源:基于網(wǎng)絡(luò)通訊協(xié)議(3)FTP信息資源:通過FTP協(xié)議可完成完整的文件拷貝(4)用戶服務(wù)組信息資源:由一組對某一特定主題有共同興趣的網(wǎng)絡(luò)用戶組成的電子論壇。(5)Gopher信息資源:Gopher是一種基于菜單的網(wǎng)絡(luò)服務(wù),允許用戶以一種簡單的、一致的方式快速找到并訪問所 需的網(wǎng)絡(luò)資源。2、按信息傳播交流過程分:(1)穩(wěn)定的電子信息資源(2)不穩(wěn)定的電子信息資源3、按網(wǎng)絡(luò)信息資源的表現(xiàn)形式分:(1)電子圖

8、書型(2)電子期刊型(3)電子報紙型(4)聯(lián)機系統(tǒng)與聯(lián)機數(shù)據(jù)庫(5)數(shù)字圖書館4、按照存取方式分(1)郵件型(2)電話型(3)揭示板型(4)廣播型(5)圖書館型(6)書目型(7)交互型5、按電子數(shù)據(jù)庫內(nèi)容分:(1) 參考數(shù)據(jù)庫(2) 源數(shù)據(jù)庫 (3)混合型數(shù)據(jù)庫(1)參考數(shù)據(jù)庫指導(dǎo)用戶到另一個信息源中獲取原文或其他細(xì)節(jié)的數(shù)據(jù)庫。分為:書目數(shù)據(jù)庫 指南數(shù)據(jù)庫(2)源數(shù)據(jù)庫(source databases):直接提供原始資料和具體數(shù)據(jù)的數(shù)據(jù)庫全文數(shù)據(jù)庫 數(shù)值數(shù)據(jù)庫 科學(xué)技術(shù)數(shù)據(jù)庫 統(tǒng)計數(shù)據(jù)庫 文本-數(shù)值數(shù)據(jù)庫 公司信息庫 產(chǎn)品市場數(shù)據(jù)庫 術(shù)語數(shù)據(jù)庫 漢語主題詞數(shù)據(jù)庫 圖象數(shù)據(jù)庫建筑圖紙數(shù)據(jù)庫(3

9、)混合型數(shù)據(jù)庫:磁媒體數(shù)據(jù)庫 、光盤數(shù)據(jù)庫 、 多媒體數(shù)據(jù)庫1.2.3網(wǎng)絡(luò)信息資源的特征:1、信息內(nèi)容豐富2、信息變化頻繁3、信息結(jié)構(gòu)復(fù)雜4、格式多樣化5、信息價值不一1.2.4網(wǎng)絡(luò)信息資源的發(fā)展變化:1、網(wǎng)絡(luò)信息資源數(shù)量規(guī)模的急劇增大2、信息資源內(nèi)容趨于規(guī)范1.2.5 網(wǎng)絡(luò)信息資源的評價:(1)資源內(nèi)容評價指標(biāo):數(shù)據(jù)庫的規(guī)模數(shù)據(jù)庫的范圍數(shù)據(jù)庫的質(zhì)量控制數(shù)據(jù)庫的實效性(2) 信息組織管理的評價指標(biāo):信息收集方法信息更新周期信息管理方式(3)信息檢索功能的評價指標(biāo):布爾邏輯檢索精確檢索截詞檢索(4)檢索結(jié)果評價指標(biāo):結(jié)果滿意度相關(guān)性排序顯示內(nèi)容形式1.3 紙質(zhì)文獻(xiàn)資源1.3.1印刷型信息資源的性

10、質(zhì):(1) 紙質(zhì)文獻(xiàn)是知識的存在形式(2) 傳遞信息知識(3) 紙質(zhì)文獻(xiàn)資源可以多次重復(fù)使用(4) 紙質(zhì)文獻(xiàn)所載的是相對固化的信息1.3.1印刷型信息資源的特點:(1)實用性:攜帶、書寫、保存方便(2)直觀性:閱讀不需借助計算機等工具。(3)不可替代性:以紙質(zhì)為載體的藝術(shù)作品的不可替代性(4)增值性:質(zhì)文獻(xiàn)作為收藏品的不可替代性1.3.1印刷型信息資源的來源:(1) 個人(2) 出版社(3) 教育科研機構(gòu)(4) 公司企業(yè)(5) 學(xué)術(shù)團體(6) 政府部門及各類社會組織(7) 文獻(xiàn)信息部門1.3.2 紙質(zhì)文獻(xiàn)資源的類型與情報價值:見教材P211、按文獻(xiàn)編撰方法和出版特點劃分(1)圖書(2)期刊 (

11、3)報紙(4)會議文獻(xiàn)(5)科技報告(6)標(biāo)準(zhǔn)文獻(xiàn) (7)專利文獻(xiàn)(8)學(xué)問論文(9)產(chǎn)品說明書(10)政府出版物(11)技術(shù)報告(12)特種文獻(xiàn) (1)圖書:國際標(biāo)準(zhǔn)書號由13位數(shù)字組成。前三位數(shù)字代表圖書中間的9個數(shù)字分為三組:分別表示組號、出版社號和書序號,最后一個數(shù)字是校驗碼。國際標(biāo)準(zhǔn)書號第一組號碼段:第一組號碼段是地區(qū)號,又叫組號(GroupIdentifier),最短的是一位數(shù)字,最長的達(dá)五位數(shù)字,大體上兼顧文種、國別和地區(qū)美國所出版的書國家代碼為0,1代表英語使用這兩個代碼的國家有:澳大利亞、加拿大、愛爾蘭新西蘭、波多黎各、南非、英國、美國、津巴布韋等;2代表法語,法國、盧森堡以

12、及比利時、加拿大和瑞士的法語區(qū)使用該代碼;3代表德語,德國、奧地利和瑞士德語區(qū)使用該代碼;4是日本出版物的代碼;5是俄語系國家出版物的代碼;7為中國大陸出版物使用的代碼等等。國家領(lǐng)域最長可能為5位數(shù)字(如不丹為99936)10位數(shù)字的中國標(biāo)準(zhǔn)書號校驗碼13位數(shù)字的中國標(biāo)準(zhǔn)書號校驗碼所得數(shù)值結(jié)果可能不同如下所示:10位數(shù)字中國標(biāo)準(zhǔn)書號:ISBN 7-5064-2595-513位數(shù)字中國標(biāo)準(zhǔn)書號:ISBN 978-7-5064-2595-7EAN校驗碼,具體算法是:用1分別乘ISBN的前12位中的奇數(shù)位(從左邊開始數(shù)起),用3乘以偶數(shù)位,成績之和以10為模,10與模值的差值即可得到校驗位的值,其值

13、范圍應(yīng)該為09。 韓國的89-8172-105-X 98年978-89-7050-565-7 2007年978-89-8172-106-0 98年第一次,2008年第6次印刷澳大利亞ISBN 978-192156425-3;ISBN 0-340-62222-9條碼下面978-0-340-62222-3年1998。圖書的情報價值:內(nèi)容成熟、系統(tǒng),是獲得基礎(chǔ)知識的重要途徑。周期長,不新穎,適用對陌生領(lǐng)域的初步了解(10)政府出版物:由政府機構(gòu)制作出版、或政府機構(gòu)制作并指定出版社出版的文獻(xiàn)。包括:法律、法令、議案、通知、統(tǒng)計資料等行政性文獻(xiàn)和科技文獻(xiàn)(11)技術(shù)檔案:指生產(chǎn)建設(shè)和科學(xué)技術(shù)部門在技術(shù)活

14、動中所形成的有一定具體工程對象或科研對象的技術(shù)文件的總稱包括任務(wù)書、協(xié)議書、技術(shù)經(jīng)濟指標(biāo)、審批文件、研究計劃等(12)特種文獻(xiàn):有特定的內(nèi)容、特定用途、特定讀者。 特定出版發(fā)行方式的文獻(xiàn)。包括:學(xué)位論文、研究報告、專利、標(biāo)準(zhǔn)、產(chǎn)品樣本、會議錄、檔案、政府出版物。2、 按文獻(xiàn)的加工深度劃分:零次文獻(xiàn)、一次文獻(xiàn)、 二次文獻(xiàn)、三次文獻(xiàn)(1)零次文獻(xiàn)(灰色文獻(xiàn))指未經(jīng)公開交流的最原始的文獻(xiàn)。如論文手稿、新聞稿、未審核的工程圖紙、實驗記錄、會議記錄。特點:內(nèi)容龐雜、來源真實、成熟度差(2)一次文獻(xiàn)(原始文獻(xiàn)):特點:零散、無序、難獲取。第一,創(chuàng)造性;第二,原始性;第三,多樣性(3)二次文獻(xiàn):特點:第一,

15、集中性;第二,工具性;第三,系統(tǒng)性(4)三次文獻(xiàn)(參考性):三次文獻(xiàn)源于一次文獻(xiàn)有高于一次文獻(xiàn)。三次文獻(xiàn)分為綜述研究類和參考工具類三次文獻(xiàn)特點:第一,綜合性;第二,針對性;第三,科學(xué)性3、按文獻(xiàn)獲取難易度劃分:白色文獻(xiàn) 灰色文獻(xiàn) 黑色文獻(xiàn)(1)白色文獻(xiàn):指已正式出版并在社會上公開流通的文獻(xiàn)。如圖書、報紙、期刊(2)灰色文獻(xiàn):指信息內(nèi)容沒有完全公開的文獻(xiàn)。如內(nèi)部刊物、內(nèi)部技術(shù)報告、內(nèi)部教材、會議材料特點:第一,流通渠道特殊,發(fā)行量少,不加入正式的出版行列第二,出版形式多樣,沒有固定的形態(tài)、固定的名稱第三,有特殊的參考價值(3)黑色文獻(xiàn):指信息內(nèi)容完全不公開的文獻(xiàn)。如政府為解密的文件、內(nèi)部檔案、具

16、有保存價值的個人日記和信件4、其他載體文獻(xiàn)信息資源:(1)印刷型文獻(xiàn)信息資源:以紙張為介質(zhì),以印刷為記錄手段的文獻(xiàn)形式。特點:存儲密度小、占據(jù)空間大、閱讀攜帶方便(2)微縮型文獻(xiàn)信息資源:以感光材料為介質(zhì),以攝影為記錄手段將文獻(xiàn)影像固化在微縮平片或微縮膠卷上形成的文獻(xiàn)形式特點:存儲密度小、占據(jù)空間大、閱讀攜帶方便(3)聲像型文獻(xiàn)信息資源:以感光和磁性材料為介質(zhì),使用聲、光、磁、電等技術(shù)將聲像信息記錄下樓來形成的文獻(xiàn)形式特點:直觀、形象。(4)電子型文獻(xiàn)信息資源:通過編碼和程序設(shè)計將信息轉(zhuǎn)換成機讀語言 ,存儲到計算機外存設(shè)備上而形成的文獻(xiàn)。特點:存儲密度高、存取快、數(shù)據(jù)可修改、刪除、更新紙質(zhì)文獻(xiàn)

17、按文獻(xiàn)編撰方法和出版特點劃分:(1)圖書定義:是一種全面而系統(tǒng)地闡述某一學(xué)科的理論與發(fā)展并傳授各種技術(shù)專長以及用來查閱某種知識的文獻(xiàn)形式。組成:國際標(biāo)準(zhǔn)書號由13位數(shù)字組成。前三位數(shù)字代表圖書;中間的9個數(shù)字分為三組,分別表示組號、出版社號和書序號;最后一個數(shù)字是校驗碼。第一組號碼段是地區(qū)號,又叫組號(GroupIdentifier),最短的是一位數(shù)字,最長的達(dá)五位數(shù)字,大體上兼顧文種、國別和地區(qū)。美國所出版的書國家代碼為0,1代表英語。使用這兩個代碼的國家有:澳大利亞、加拿大、愛爾蘭新西蘭、波多黎各、南非、英國、美國、津巴布韋等;2代表法語,法國、盧森堡以及比利時、加拿大和瑞士的法語區(qū)使用該

18、代碼;3代表德語,德國、奧地利和瑞士德語區(qū)使用該代碼;4是日本出版物的代碼;5是俄語系國家出版物的代碼;7為中國大陸出版物使用的代碼等等。國家領(lǐng)域最長可能為5位數(shù)字(如不丹為99936)(2)期刊定義:是有統(tǒng)一名稱定期或不定期出版的連續(xù)出版物。特點:周期短、報道及時、數(shù)量大、內(nèi)容新穎。情報價值:ü 有些發(fā)明和發(fā)現(xiàn)最初并不是成熟、穩(wěn)定和可靠的,他們往往不能被圖書接納,卻被期刊采用。ü 世界上所有主要的檢索工具都以期刊為主要的收錄對象(90%),可以比圖書更方便的查到資料。特點:具有統(tǒng)一國際標(biāo)準(zhǔn)連續(xù)出版物號ISSN,通常作為檢索字段期刊,通常每年至少出一期、每周至多出一期,它包

19、括周刊、旬刊、半月刊、月刊、雙月刊、季刊、半年刊等。(3)報紙定義:以報道新聞及其評論為主、出版周期比期刊更頻繁、多為活頁的連續(xù)出版物。分類:按級別分:全國性報紙和地方性報紙按內(nèi)容分:綜合性報紙和專業(yè)性報紙按發(fā)行時間分為:日報、隔日報、三日報、晨報、晚報、周報、旬報等。情報價值:內(nèi)容豐富、信息量大、出版迅速、發(fā)行面廣、讀者眾多缺點:資料龐雜零散、不易積累保存(4)會議論文定義:指國內(nèi)外各種學(xué)術(shù)會議和專業(yè)會議上宣讀或發(fā)表的論文和報告情報價值:代表該領(lǐng)域的最新成就、最新水平、發(fā)展趨勢(5)科技報告定義:指科研過程進(jìn)展情況的階段性紀(jì)錄或科研成果的報告按發(fā)行范圍分為:絕密報告、機密報告、秘密報告、非密

20、報告、解密報告。情報價值:新穎詳盡,常附有大量的數(shù)據(jù)、圖表、原始紀(jì)錄。第一,迅速反映新的科技成果,一般比期刊早一年左右第二,內(nèi)容多樣化,幾乎涉及到各個領(lǐng)域。 第三,基本上都是一次文獻(xiàn)。(6)標(biāo)準(zhǔn)文獻(xiàn)定義:有權(quán)威機構(gòu)批準(zhǔn)、頒布的、可供人們執(zhí)行的技術(shù)規(guī)格的規(guī)范性文獻(xiàn)。情報價值:具有約束性。這是其他文獻(xiàn)所有沒有的。(7)專利文獻(xiàn)定義:廣義指與工業(yè)產(chǎn)權(quán)有關(guān)的所有文獻(xiàn)的統(tǒng)稱,它不僅包括專利說明書,還有各種檢索工具、專利公報以及與專利有關(guān)的法律文件及其訴訟資料。狹義指專利說明書,它是專利申請人向政府說明其發(fā)明創(chuàng)造的文件,在說明書中常論述其發(fā)明目的、發(fā)明的技術(shù)背景、發(fā)明的詳細(xì)內(nèi)容及發(fā)明創(chuàng)造的效果等。情報價值

21、:新穎、可靠、實用、具體技術(shù)開發(fā)中最重要的參考資料 第一,詳盡。第二,內(nèi)容廣泛。第三,專利說明書既是技術(shù)文件又是法律文件在一定年限內(nèi)發(fā)明所有者享有制造、使用、銷售的法律文獻(xiàn)(8)學(xué)位論文定義:是高等學(xué)?;蜓芯繖C構(gòu)的畢業(yè)生為評定各級學(xué)位而撰寫的學(xué)術(shù)論文。包括學(xué)士論文、碩士論文、博士論文。情報價值:比較專一、深入(9)產(chǎn)品說明書定義:廠商為介紹推銷其產(chǎn)品而印發(fā)的文獻(xiàn)。包括產(chǎn)品說明書、產(chǎn)品目錄、企業(yè)介紹等情報價值:內(nèi)容詳盡、可靠性好、直觀性強、其新穎程度不如專利文獻(xiàn)、但成熟性較之強(10)政府出版物定義:由政府機構(gòu)制作出版、或政府機構(gòu)制作并指定出版社出版的文獻(xiàn)。包括法律、法令、議案、通知、統(tǒng)計資料等

22、行政性文獻(xiàn)和科技文獻(xiàn)(11)技術(shù)檔案定義:指生產(chǎn)建設(shè)和科學(xué)技術(shù)部門在技術(shù)活動中所形成的有一定具體工程對象或科研對象的技術(shù)文件的總稱分類:按內(nèi)容分:政治檔案、經(jīng)濟檔案、科技檔案按表現(xiàn)形式分:書面檔案、形象檔案、聲音檔案情報價值:檔案是歷史的原始記錄,有重要的憑證價值和情報價值(12)特種文獻(xiàn):定義:有特定的內(nèi)容、特定用途、特定讀者而特定出版發(fā)行方式的文獻(xiàn)。包括學(xué)位論文、研究報告、專利、標(biāo)準(zhǔn)、產(chǎn)品樣本、會議錄、檔案、政府出版物。第2章 信息存儲與檢索基礎(chǔ)一、信息檢索定義:廣義指將信息按有序的方式組織和貯存,并根據(jù)用戶的需求查找出有關(guān)信息的過程。包括存入和輸出兩個方面。狹義指查尋信息的過程,即從信息

23、集合之中查尋出所需要的符合要求的信息的過程?;驹? 查詢語言(檢索提問)和系統(tǒng)標(biāo)識語言所進(jìn)行的“相符性比較”與“匹配運算”。直接檢索:直接從信息源或信息文獻(xiàn)載體中獲取信息間接檢索:通過檢索工具指引來獲取所需信息。類型: 一是關(guān)于文獻(xiàn)的檢索;二是關(guān)于某事實或事項的知識檢索;三是關(guān)于數(shù)值或數(shù)據(jù)的情報檢索;四是關(guān)于圖象信息的信息檢索。信息檢索模型(1)基于文檔內(nèi)容的檢索模型布爾邏輯模型:采用布爾代數(shù)中的邏輯“與”“或”“非”等算符,來制定檢索詞中必需存在的條件或不能出現(xiàn)的條件概率統(tǒng)計模型:利用概率論的原理,通過賦予標(biāo)引詞概率值來表示該詞在相關(guān)文檔集合或無關(guān)文檔集合中出現(xiàn)的概率。向量空間模型:通過

24、計算兩個向量的相似度對返回的結(jié)果進(jìn)行排序。(2)基于文檔結(jié)構(gòu)的檢索模型并列鏈表模型:首先將文檔劃分為平列,即非重疊的章、節(jié)、段落區(qū)域,并采用鏈表的方式將同一區(qū)域中元組連接起來,以此表示文檔的結(jié)構(gòu),再為鏈表建立倒排索引,就可以實施對鏈表的檢索模型。層次鄰接模型:是以一種建立在分層的文檔結(jié)構(gòu)之上的基于鄰接節(jié)點的模型,在該模型中,節(jié)點即指文檔的結(jié)構(gòu)要素(章、節(jié)、段落)。允許在相同的文檔上定義獨立的分層索引結(jié)構(gòu)。二、信息存儲定義: 是按主題詞表或分類表及使用原則對原始信息資源進(jìn)行處理,形成信息特征標(biāo)識,為檢索提供整序(即提供檢索途徑的)的信息集合的過程。類型:印刷存儲指將數(shù)字、圖形等原稿信息經(jīng)過一定的

25、工藝操作成批量復(fù)制出來的活動。特點:直觀易讀、攜帶方便缺點:存儲信息密度低、存儲傳輸慢,難以長期保存微縮存儲指只利用攝影機將印刷資料微縮拍攝到感光膠片上、沖洗微縮膠片后保存起來以供復(fù)制、發(fā)行、檢索閱讀只用。特點:容量大、密度高,忠實于信息原件、不出差錯;成本低、保存時間長磁存儲:包括計算機磁帶、硬盤、軟盤、光盤、溫盤特點:(1) 能存儲一切可轉(zhuǎn)換成電信號信息(2) 可長久保存、重復(fù)使用、可擦寫(3) 可同時進(jìn)行多路信息存儲,并保證信息之間的時間和位相關(guān)系(4) 存儲頻帶寬廣(5) 可高速存儲高頻信息慢速播放或慢速存入低頻信息快速播放半導(dǎo)體存儲是采用集成化的技術(shù)將存儲單元電路及其外圍電路直接置放

26、在半導(dǎo)體芯片上支撐的。特點:信息存儲密度高;價格低;方便存取、方便與計算機連接;顯示信息種類多;堅固耐用,存儲壽命長三、信息檢索類型1.按檢索活動的執(zhí)行主體:手工檢索:利用人工信息存取系統(tǒng)檢索信息的活動,如各類紙質(zhì)書目、索引、文摘、卡片。檢索過程: 人工的手翻、眼看、大腦分析和判斷優(yōu)點:不需要輔助設(shè)備,適應(yīng)性好成本低,檢索工具可長期無限制使用檢索前隨時獲得反饋信息,及時修改檢索策略可以把幾種檢索工具進(jìn)行對比參照。缺點:費時費力檢索工具提供檢索點有限,主題專深文獻(xiàn)難以查詢半機械化檢索用選卡機對機器穿孔卡片進(jìn)行檢索??s微膠卷檢索是通過光電原理而實現(xiàn)匹配的。計算機檢索:利用計算機技術(shù)進(jìn)行信息存儲和檢

27、索的過程兩者區(qū)別:2.按檢索信息的特征:書目檢索:利用文獻(xiàn)檢索系統(tǒng),從一個特定的書目集合中查找特定用戶所需的特定主題、特定區(qū)域、特定時間的文獻(xiàn)的程序與方法數(shù)據(jù)檢索:對具體數(shù)據(jù)的查尋,它能回答信息用戶的數(shù)據(jù)提問,查尋結(jié)果為具體數(shù)據(jù)。數(shù)據(jù)檢索:包括數(shù)值形式數(shù)據(jù)和非數(shù)值形式數(shù)據(jù)。前者如年平均氣溫,經(jīng)濟增長率,各種科學(xué)參數(shù)、常數(shù)、系數(shù)等;后者如化學(xué)結(jié)構(gòu)式,化合物分子式,工業(yè)產(chǎn)品的技術(shù)規(guī)格,各種經(jīng)濟模型,數(shù)學(xué)表達(dá)式等事實檢索:查尋某項事實的檢索,它能回答信息用戶的事實提問全文檢索:是將存儲與數(shù)據(jù)庫中整本書、整篇文章中的任意內(nèi)容信息查找出來的檢索。全文檢索可以根據(jù)需要獲得全文中有關(guān)章、節(jié)、段、句、詞等信息

28、,也可進(jìn)行統(tǒng)計和分析。圖像檢索:包括基于文本形式和基于內(nèi)容形式兩種。前者人工根據(jù)圖像進(jìn)行關(guān)鍵詞標(biāo)引。后者根據(jù)圖像的顏色、形狀和紋理等信息檢索多媒體信息檢索:分基于文本方式和基于內(nèi)容特征的多媒體信息檢索3.按檢索系統(tǒng)的工作方式劃分脫機存?。涸缙谟嬎銠C檢索沒有終端設(shè)備,利用磁帶檢索,利用穿孔卡片或紙袋輸入數(shù)據(jù)或命令。聯(lián)機存?。河脩艨梢允褂媒K端設(shè)備直接與計算機進(jìn)行“人機對話”,計算機能對用戶的提問及時處理并顯示結(jié)果的查詢。光盤存?。河脩糁苯邮褂脦в泄獗P驅(qū)動器的計算機,檢索光盤上所記錄于存儲的信息資源因特網(wǎng)存?。褐饕槍nternet上的信息資源進(jìn)行的計算機檢索活動。4.依照檢索策略劃分布爾邏輯存取

29、(邏輯算符):采用布爾代數(shù)中的邏輯“與”“或”“非”等算符,來制定檢索詞中必需存在的條件或不能出現(xiàn)的條件。截詞存取(截詞符):它是利用計算機固有的指定位的對比判斷功能,使不完整的詞能與標(biāo)引此進(jìn)行比較、匹配的一種檢索位置邏輯存?。ㄎ恢盟惴涸跈z索詞之間使用位置算符,規(guī)定兩邊的詞出現(xiàn)在信息中的位置。限定存取(限制符):作用是限制檢索詞或檢索式在數(shù)據(jù)庫記錄中出現(xiàn)的字段位置。加權(quán)存取:判定檢索詞或字符串在滿足檢索邏輯后對文獻(xiàn)命中與否的影響程度5.依照系統(tǒng)載體劃分 印刷型文本檢索 微縮磁帶檢索 光盤系統(tǒng)檢索 計算機存取信息查詢檢索6.按檢索工具類型目錄與題錄檢索目錄:也稱書目,指一批相關(guān)文獻(xiàn)的記錄,其

30、基本功能是反映某一地區(qū)、某一時期在某一領(lǐng)域中出版物的信息。 書目:可以是描述性的,著者姓名,作品全名、出版時間、版本、價格等??梢允窃u論性的,對出版物的使用價值提出看法,導(dǎo)讀作用可以是注釋性的,簡述內(nèi)容,寫作風(fēng)格。 題錄:是在目錄工具的基礎(chǔ)上發(fā)展起來的檢索工具。不同的是題錄揭示整部圖書或期刊的單篇文章。文摘檢索:是一種既揭示文獻(xiàn)外部特征、又通過摘錄文獻(xiàn)要點報道文獻(xiàn)內(nèi)容的檢索工具。是二次文獻(xiàn)的核心文摘分類:報道性文摘;指示性文摘;評論性文摘。字典型檢索:分語言性和知識性參考工具。按編撰目的可分為語文詞典、專科詞典和綜合性詞典(百科詞典)語文詞典按語種可分為單語詞典和雙語、多語詞典按收詞量可分為大

31、型詞典、中型詞典、小型詞典和袖珍詞典。 專科詞典:匯集不同學(xué)科的詞匯,有的側(cè)重語文角度對各種術(shù)語給予簡略的解釋,有的偏重知識角度 綜合性詞典:兼有語文詞典和??圃~典的功能,又稱為百科詞典,從這類詞典中既可以查到普通的語文字詞,也可以查到人、地、事等百科性詞條。交互式檢索:包括搜索引擎和主題目錄索引:指示知識點在正文或文獻(xiàn)款目中的位置。索引舊稱“通檢”、“備檢”,也有英文Index音譯為“引得” 是將信息集合中有重要檢索意義的事物名稱及特征( 如字、詞、人名、書名、刊名、篇名、內(nèi)容主題名等 ) 分別抽取出來,注明其出處頁數(shù) , 按一定的方式(字順或分類)排列,附在一書之后或單獨編輯成冊。它是檢索

32、圖書資料的一種工具。四、索引的款目結(jié)構(gòu)及類型1. 索引款目結(jié)構(gòu)索引款目:是有關(guān)信息資源所涉及的主題、事物及其特征的信息單元,并指向其地址的一條記錄。組成: 索引標(biāo)題詞:亦稱標(biāo)目、索引鍵、索引標(biāo)題等。一般處于索引款目最醒目位置,是索引款目核心,它決定著一條索引款目在整個索引中的排列位置,是索引款目的檢索入口。索引標(biāo)題詞可以為單一標(biāo)題詞,也可以為帶有副標(biāo)題的多級標(biāo)題詞 說明語:也稱上下文或修飾語,通常位于索引標(biāo)題詞的右邊或下面,用來說明、解釋、限定索引標(biāo)題詞含義的輔助項目。 地址參照項:位于索引標(biāo)題詞和說明語之后,索引地址所指明的是索引標(biāo)題詞所在的頁碼或在檢索系統(tǒng)中的文獻(xiàn)順序號、分類號或文獻(xiàn)號等,

33、即索引標(biāo)題詞的出處。索引參考項有時用于引導(dǎo)用戶使用正式索引標(biāo)題詞。2. 索引類型索引系統(tǒng):從形式上講是成千上萬件索引款目的集合; 從內(nèi)容上看是信息單元的指南。索引系統(tǒng)的排序:按照索引標(biāo)題的順序組織而成,不同性質(zhì)的索引標(biāo)題詞構(gòu)成了不同類型的索引。依據(jù)索引標(biāo)題詞的性質(zhì)劃分:揭示信息資源內(nèi)容主題索引、分類索引、關(guān)鍵詞索引、分子式索引、結(jié)構(gòu)式索引;揭示信息資源形式題名索引、人名索引、物名索引、代碼索引、引文索引。 依據(jù)索引標(biāo)題詞的排序方式劃分: 按照標(biāo)題詞字順組織主題索引、題名索引、人名索引、關(guān)鍵詞索引、語詞索引; 按照文獻(xiàn)代碼組織報告號索引、合同號索引、標(biāo)準(zhǔn)號索引等; 按其它排序方式組織網(wǎng)絡(luò)信息自動

34、索引、重量索引、速度索引、專用索引。依據(jù)檢索方式劃分:先組式索引、后組式索引。 依據(jù)索引所包括的對象劃分: 綜合索引、專門索引。(1) 題名索引是將信息資源的題名特征(書名、刊名、篇名)選作為索引標(biāo)題詞所編制的索引系統(tǒng)。題名索引常采用字順排序法組織款目。(2) 人名索引是以文獻(xiàn)上署名的著者、譯者、編撰者、注釋者以及文獻(xiàn)中所論述的人物名稱作為索引標(biāo)題詞所編制的一種索引。此類索引一般按照人物名稱的字順組織。英、德、法、西班牙等語種的著者索引姓在前、名在后,與其在文獻(xiàn)中出現(xiàn)的姓名形式不同,用戶檢索時應(yīng)注意掌握其排列規(guī)則。(3) 文獻(xiàn)序列號索引是根據(jù)信息資源的外表特征文獻(xiàn)序號所編制的索引。在一些特定類

35、型的文獻(xiàn)資源中,每一份文獻(xiàn)都有一個特定的專門排序號。如科技報告號、合同號、技術(shù)標(biāo)準(zhǔn)的標(biāo)準(zhǔn)號、專利說明書的專利號,圖書的國際標(biāo)準(zhǔn)書號(ISBN)等。(4) 引文索引是從被引論文檢索引用論文的索引工具。即以某較早公發(fā)發(fā)表的論文為起點,逐一查詢那些引用過該論文的文獻(xiàn),隨后還可以利用檢索到的引用文獻(xiàn)為被引文獻(xiàn)進(jìn)行循環(huán)檢索,逐步擴大檢索范圍,以了解和掌握一大批具有相關(guān)關(guān)系的科學(xué)文獻(xiàn)。組織方式:按照被引論文的作者排列,在被引論文之下,在按年代列舉引用過該文獻(xiàn)的全部論文。(5) 分類索引是以文獻(xiàn)內(nèi)容的學(xué)科范圍的分類標(biāo)識(又稱分類號)為依據(jù)編制而成的引文系統(tǒng)。本索引可提供按學(xué)科專業(yè)系統(tǒng)檢索文獻(xiàn)的途徑。編制原理

36、:概念的劃分與概括。在概念劃分與概括的原理基礎(chǔ)上建立起來的等級體系分類系統(tǒng)是一種先組式的索引語言。 (6) 主題索引是將表征文獻(xiàn)主題內(nèi)容的主題詞作為索引標(biāo)題詞,其后注明地址(或頁碼)編制而成的索引系統(tǒng)。此處所指的主題詞是經(jīng)過規(guī)范,有詞表控制的標(biāo)題詞以及詞組和短語先組式的索引語言。主題語言:一種以規(guī)范化的自然語言為標(biāo)識符號,來標(biāo)識文獻(xiàn)中心內(nèi)容的一種排檢方法。類型:根據(jù)選詞原則分為標(biāo)題詞語言、單元詞語言、序詞語言、關(guān)鍵詞語言,但基本原理大體相同主題語言優(yōu)缺點:1) 能把屬于不同學(xué)科、不同知識體系中論述的同一主題的資源集中標(biāo)引出來,屆時資料比較深入、廣泛。2) 查考文獻(xiàn)資料時,需要正確選取主題詞,否

37、則難以準(zhǔn)確查到(7) 關(guān)鍵詞索引又稱鍵詞索引,屬于廣義的主題索引。這是從文獻(xiàn)題名、文摘、原文或網(wǎng)站、網(wǎng)頁、網(wǎng)址甚至網(wǎng)頁正文中抽取對于表述信息資源的主題內(nèi)容具有關(guān)鍵意義的名詞或名詞性詞組,作為索引標(biāo)題詞,其后標(biāo)明出處所組成的索引。關(guān)鍵詞是信息資源的責(zé)任者(包括著者、編者、譯者、專利權(quán)擁有者等)所直接使用的詞語,是一種未經(jīng)規(guī)范的自然語言。類型:題內(nèi)關(guān)鍵詞索引、題外關(guān)鍵詞索引、雙重關(guān)鍵詞索引、輪排關(guān)鍵詞索引、單純關(guān)鍵詞索引、掛接主題詞索引關(guān)鍵詞標(biāo)識自然語言檢索標(biāo)識和規(guī)范語言檢索標(biāo)識自然語言檢索標(biāo)識多指關(guān)鍵詞,直接從文獻(xiàn)篇名、正文或文摘中抽取,未經(jīng)優(yōu)選和規(guī)范化優(yōu)點:不受詞表控制,能及時檢索到最新概念的

38、各類文獻(xiàn);可任意選取專指性強的語言,提高查準(zhǔn)率;非受控詞具有數(shù)量大的特點,比敘詞表大23個數(shù)量級;避免在標(biāo)引人員和用戶之間造成不必要的交流障礙缺點:不規(guī)范,存在大量同義詞、多義詞和含義模糊現(xiàn)象;沒有顯示詞語之間的關(guān)系基本原理:任何一個復(fù)雜的概念都可以劃分出若干個單義概念,而若干個單義概念又可構(gòu)成一個復(fù)雜概念。特點:在建立索引系統(tǒng)時,首先有將文獻(xiàn)的主題分解成一些單獨的概念單元進(jìn)行分別記錄與標(biāo)識,而在檢索時,根據(jù)檢索課題的需要,將若干有關(guān)概念單元綜合組配成各種檢索提問實施檢索?!盎瘜W(xué)纖維工業(yè)”這個復(fù)雜概念可以分解為“化學(xué)”、“纖維”“工業(yè)”三個概念單元,其三者的邏輯關(guān)系如下圖:按組配方式劃分:1)

39、 先組式檢索語言指檢索前,檢索詞已被預(yù)先組配好的一種檢索語言。先組式定組型檢索語言是編制檢索語言詞表的時已經(jīng)預(yù)先固定組配詞表中也有特別指明某些符號需由兩個或兩個以上的概念來組配進(jìn)行標(biāo)引與索引,這稱為組代,用符號USEAB表示先組式散組型檢索語言是編制檢索語言詞表的時并不預(yù)先固定組配,而在標(biāo)引文獻(xiàn)時,根據(jù)文獻(xiàn)的主題內(nèi)容予以組配。2) 后組式檢索語言是指表達(dá)文獻(xiàn)信息主題的標(biāo)識,在編制檢索語言詞表和標(biāo)引文獻(xiàn)的時候,都不預(yù)先固定組配,而是在檢索進(jìn)行時根據(jù)檢索的實際需要,按照組配規(guī)則臨時進(jìn)行組配的檢索語言先后組式檢索語言評價:1) 先組式有利于提高檢索詞的專指度,減少標(biāo)引到每個詞的文獻(xiàn)數(shù)量,減少和避免假

40、組配,從而有利于查準(zhǔn)率2) 先組式的詞在數(shù)量上是有限的,不能適應(yīng)各種角度和深度的符合概念檢索3) 后組式便于各種角度和深度的檢索,有利于查準(zhǔn)率的提高,但有可能出現(xiàn)假組配,致使誤檢的增多。(8) 組培索引是根據(jù)敘詞及單元詞的后組式原理建立起來的索引系統(tǒng)。(9) PRECIS索引又稱保留上下文關(guān)系索引系統(tǒng)、保留正文索引系統(tǒng)、保留愿意索引、上下文前后關(guān)聯(lián)索引。PRECIS 為了明確無誤地描述文獻(xiàn)主題,力求每條索引款目都按照“上下文從屬”的原則排定詞語的次序。索引方式:(10) 網(wǎng)絡(luò)信息自動索引目前,Internet上的搜索索引(又稱搜索引擎 )就是一種網(wǎng)絡(luò)資源自動索引的檢索工具。特點:使用自動索引軟

41、件來發(fā)現(xiàn)、收集和標(biāo)引網(wǎng)頁建立查詢數(shù)據(jù)庫,并以Web形式給用戶提供檢索界面,供用戶輸入檢索關(guān)鍵詞、詞組或短語等檢索項,代替用戶在數(shù)據(jù)庫中查找與提問相匹配的記錄,并按相關(guān)度排序輸出檢索結(jié)果。目前,比較有影響的中英文搜索引擎有Alta Vista、Excite、Lycos、Hotbot、Sohu、Yahoo、etang、Sina等。3. 文摘與索引的異同點文摘:指對一篇文獻(xiàn)內(nèi)容所作的簡略、準(zhǔn)確的摘錄 , 一般不包含有對原文補充、解釋或評論。文摘款目:由題錄和文摘兩部分組成。 著錄項目包括文摘號、文獻(xiàn)篇名、語種及文獻(xiàn)類型、著者及其單位、文獻(xiàn)出處文摘內(nèi)容、參考文獻(xiàn)數(shù)目等。共同點:以論文、文章、報告為主要

42、報道對象不同點:1)索引報道文獻(xiàn)的外表特征為主,文摘報道文獻(xiàn)的內(nèi)容特征為主2)從形式上,索引一般沒有摘錄,文摘沒有原文評價3)文摘很少收錄綜合性的文獻(xiàn),按分類編排,不按主題和著者。4)文摘比索引報到時間慢,文摘比索引少。5)索引告訴讀者文章位置,沒有論文的內(nèi)容,是否有價值。二、填空題 1.按使用范圍,標(biāo)準(zhǔn)可劃分為國際標(biāo)準(zhǔn)、區(qū)域標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)和企業(yè)標(biāo)準(zhǔn)。2.國際上最重要的兩個標(biāo)準(zhǔn)化組織是ISO和IEC。3.我國把標(biāo)準(zhǔn)分為國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、地方標(biāo)準(zhǔn)、企業(yè)標(biāo)準(zhǔn)4個等級。4.參考數(shù)據(jù)庫包括:書目數(shù)據(jù)庫、文摘數(shù)據(jù)庫和索引數(shù)據(jù)庫。5.源數(shù)據(jù)庫包括:數(shù)值型數(shù)據(jù)庫、(事實性數(shù)據(jù)庫)和(全

43、文數(shù)據(jù)庫)。6.文獻(xiàn)信息源按出版形式分為常規(guī)文獻(xiàn)和特種文獻(xiàn),特種文獻(xiàn)包括學(xué)位論文、會議論文、專利、標(biāo)準(zhǔn)、科技報告、產(chǎn)品資料、技術(shù)檔案等。 7.信息檢索是以信息的存儲與檢索之間的相符性為基礎(chǔ)的。8.針對檢索課題發(fā)展特點,抓住學(xué)科發(fā)展迅速、發(fā)表文獻(xiàn)較多的一段時期,逐年進(jìn)行查找的方法,稱為抽查法,該種方法能以較少的時間獲得較多的文獻(xiàn)信息。9.著名的國際三大索引:SCI、EI和ISTP。10.CSSCI是南京大學(xué)研制,教育部人文、社會科學(xué)重大研究項目,CSSCI的中文全稱是(中文社會科學(xué)引文索引)。11.IPC 是國際專利分類號,其作用是(提供從分類途徑查找專利)。12.中國將專利

44、劃分為3類:(發(fā)明)專利、(實用新型)專利和(外觀設(shè)計)專利13.在中國國家知識產(chǎn)權(quán)局的網(wǎng)站上可以檢索并免費下載到中國的各種專利說明書全文。14.在許多數(shù)據(jù)庫中,都有“在結(jié)果中進(jìn)行檢索”功能,“在結(jié)果中進(jìn)行檢索”指:在前一次檢索基礎(chǔ)上再檢索。 15.一個典型的搜索引擎的系統(tǒng)架構(gòu)基本上由信息采集、信息組織和信息查詢服務(wù)3個模塊組成。 16.依檢索內(nèi)容不同,信息檢索的類型劃分為:文獻(xiàn)信息檢索、數(shù)據(jù)信息檢索、事實信息檢索,其中數(shù)據(jù)信息檢索和事實信息檢索屬于確定性檢索。 17.ISBN對應(yīng)中文為(國際標(biāo)準(zhǔn)書號);ISSN對應(yīng)中文為(國際標(biāo)準(zhǔn)連續(xù)出版物編號);CN對應(yīng)中文為

45、(國內(nèi)統(tǒng)一刊號)。18.下列英文單詞對應(yīng)的中文分別為,Abstract:(摘要)、References:(參考文獻(xiàn))、Advanced Search:(高級檢索)、Expert Search:(專業(yè)檢索)、Browse:(瀏覽)。 19.文獻(xiàn)是記錄知識的載體,其三要素為:文獻(xiàn)信息、文獻(xiàn)載體、記錄方式。20. 專利號“ZL 2004214062.7"代表該專利為()專利。21.維普的中文科技期刊全文數(shù)據(jù)庫就內(nèi)容加工深度來說,屬于(二次)文獻(xiàn)。22.手工檢索工具一般分為5大類:目錄、題錄,文摘,索引信息資料指南()23.從已有的文獻(xiàn)后所列

46、的參考文獻(xiàn)入手,逐一追查原文、不斷擴檢的方法叫回溯法。三、簡答題 1. 簡述信息檢索的三個層次。 信息檢索的分為3個層次,如下: 第一層次:知道在哪里能找到信息,即了解不同的信息源;第二層次:能從信息源中檢索出合適的信息,即掌握一定的課題分析和檢索技術(shù);第三層次:能對檢索結(jié)果進(jìn)行評價和分析,即評價、選擇、綜合利用信息資源的能力。簡述信息,知識,文獻(xiàn)的關(guān)系2.簡述一次文獻(xiàn)、二次文獻(xiàn)、三次文獻(xiàn)的關(guān)系 從一次文獻(xiàn)到二次文獻(xiàn),再到三次文獻(xiàn),是一個從分散的原始文獻(xiàn)到系統(tǒng)化、密集化的過程。  一次文獻(xiàn):是所有文獻(xiàn)的基礎(chǔ);是檢索利用的主要

47、對象。            v 二次文獻(xiàn):是檢索一次文獻(xiàn)的工具,又稱為檢索工具。               v 三次文獻(xiàn):是一次文獻(xiàn)內(nèi)容的高度濃縮,也是我們利用的一種重要情報源。 3. 簡述查全率、查準(zhǔn)率及二者之間的關(guān)系。 (1)查全率是衡量信息檢索系統(tǒng)檢出相關(guān)文獻(xiàn)能力的尺度

48、。 (2) 查準(zhǔn)率是衡量信息檢索系統(tǒng)檢出文獻(xiàn)準(zhǔn)確度的尺度。  (3)查全率與查準(zhǔn)率之間存在互逆關(guān)系。 4. 簡述搜索引擎排序算法的發(fā)展。 搜索引擎排序算法經(jīng)歷了3代: 第一代搜索引擎-基于詞位置加權(quán)的排序算法;   第二代搜索引擎-基于鏈接分析的排序算法;     第三代搜索引擎-基于智能化排序的排序算法。   5. 簡述鏈接分析排序算法的原理。 (1)鏈接分析排序的思想起源于文獻(xiàn)引文索引機制。 (2)文獻(xiàn)引文索引機制:論文被引用的次數(shù)越多或被越權(quán)威的論文引用,其論文就越有價值。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論