![信息檢索基礎(chǔ)理論_第1頁(yè)](http://file4.renrendoc.com/view/54c0918e042904fd222a203ff6b54c54/54c0918e042904fd222a203ff6b54c541.gif)
![信息檢索基礎(chǔ)理論_第2頁(yè)](http://file4.renrendoc.com/view/54c0918e042904fd222a203ff6b54c54/54c0918e042904fd222a203ff6b54c542.gif)
![信息檢索基礎(chǔ)理論_第3頁(yè)](http://file4.renrendoc.com/view/54c0918e042904fd222a203ff6b54c54/54c0918e042904fd222a203ff6b54c543.gif)
![信息檢索基礎(chǔ)理論_第4頁(yè)](http://file4.renrendoc.com/view/54c0918e042904fd222a203ff6b54c54/54c0918e042904fd222a203ff6b54c544.gif)
![信息檢索基礎(chǔ)理論_第5頁(yè)](http://file4.renrendoc.com/view/54c0918e042904fd222a203ff6b54c54/54c0918e042904fd222a203ff6b54c545.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、信息檢索基礎(chǔ)理論第1頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一信息源是指信息的來(lái)源,熟悉信息源的分布情況,有利于信息用戶高效得獲取信息。1.信息源的類型文獻(xiàn)信息源文獻(xiàn)是知識(shí)的一切載體,因此,文獻(xiàn)是重要的信息源。了解文獻(xiàn)出版的類型及特點(diǎn),熟悉文獻(xiàn)載體及制作方式,對(duì)于及時(shí)有效的獲取信息至關(guān)重要。文獻(xiàn)的類型第2頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一2.按照文獻(xiàn)的結(jié)構(gòu)等級(jí)(文獻(xiàn)的加工程度)劃分即是按文獻(xiàn)中信息量變化情況來(lái)劃分,可分為四個(gè)等級(jí)(1)零次文獻(xiàn):指那些未來(lái)得及記錄下來(lái),尚未發(fā)表或不宜公開(kāi)和大范圍內(nèi)交流的比較原始的素材、底稿、手稿、工作總結(jié)、考察記錄、調(diào)查稿
2、、原始統(tǒng)計(jì)教據(jù)、科技檔案及各種口法交流的知識(shí)、經(jīng)驗(yàn)、情報(bào)、意見(jiàn)以及各種操作規(guī)范性方面的知識(shí)等。如實(shí)驗(yàn)記錄、手稿、原始錄音、原始錄像、談話記錄等。零次文獻(xiàn)在原始文獻(xiàn)的保存、原始數(shù)據(jù)的核對(duì)、原始構(gòu)思的核定(權(quán)利人)等方面有著重要的作用。第3頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一特點(diǎn):不拘形式、成文迅速、大多為原始素材、記錄,可直接與當(dāng)事人接觸、具有很強(qiáng)的針對(duì)性,并且直觀形象,更具有啟發(fā)性,也更容易接受。但也因其自身原因,造成傳播途徑少、流通范圍窄,或因保密或限制使用,使其極少被人們關(guān)注。近幾年,隨著信息業(yè)飛速發(fā)展,人們開(kāi)始重視它的存在與價(jià)值。例如:錄音、錄像、圖片、圖表等第4頁(yè)
3、,共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一(2)一次文獻(xiàn)primary document):是指人們以自己的經(jīng)驗(yàn)、研究成果為基本素材而創(chuàng)作或撰寫的文獻(xiàn),不管創(chuàng)作時(shí)是否參考或引用了他人的著作,也不管該文獻(xiàn)以何種物質(zhì)形式出現(xiàn),均屬一次文獻(xiàn)。大部分期刊上發(fā)表的文章和在科技會(huì)議上發(fā)表的論文均屬一次文獻(xiàn)。特點(diǎn):一般論述比較詳細(xì)、具體而系統(tǒng),有觀點(diǎn)、有事實(shí)、有結(jié)論。他直接在科研、教學(xué)中祈禱參考和借鑒作用,是主要的情報(bào)源。包括:期刊論文、科技報(bào)告、專利說(shuō)明書(shū)、會(huì)議論文等。例如:維普中文科技期刊數(shù)據(jù)庫(kù)第5頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一(3)二次文獻(xiàn)(secondary
4、 document):是指文獻(xiàn)工作者對(duì)一次文獻(xiàn)進(jìn)行加工、提煉和壓縮和組織之后,形成的系統(tǒng)的、便于管理和利用一次文獻(xiàn)而編輯、出版和累積起來(lái)的工具性文獻(xiàn)。檢索工具書(shū)和網(wǎng)上檢索引擎是典型的二次文獻(xiàn)。特點(diǎn):有組織、有系統(tǒng)包括:目錄、題錄、文摘、索引等例如:工程索引Ei,科技會(huì)議錄索引ISTP等第6頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一(4)三次文獻(xiàn)tertiary document):在利用二次文獻(xiàn)的基礎(chǔ)上,對(duì)檢索到的一次文獻(xiàn)進(jìn)行廣泛、深入的分析研究后,選用先關(guān)一次文獻(xiàn)再次經(jīng)加工編寫出來(lái)的成果。如綜述、述評(píng)等。特點(diǎn):從新的高度和深度揭示相關(guān)一次文獻(xiàn),是一次文獻(xiàn)的濃縮,是情報(bào)信息重要
5、來(lái)源。例如:各種詞典、百科全書(shū)、年鑒、綜述、專題述評(píng)等。第7頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一文獻(xiàn)間的相互關(guān)系零次文獻(xiàn):文獻(xiàn)形成其它文獻(xiàn)的基礎(chǔ)一次文獻(xiàn):是文獻(xiàn)的基本形式,是檢索的主要對(duì)象,是二次和三次文獻(xiàn)的基礎(chǔ);二次文獻(xiàn):是檢索一次文獻(xiàn)的工具;三次文獻(xiàn):是一次文獻(xiàn)的濃縮,是對(duì)眾多文獻(xiàn)分析、綜合歸納、整理而形成的??傮w來(lái)說(shuō):科技文獻(xiàn)經(jīng)過(guò)加工壓縮,從零次文獻(xiàn)到三次文獻(xiàn),是科技文獻(xiàn)有分散到集中,有無(wú)組織到系統(tǒng)第8頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一3.根據(jù)文獻(xiàn)編輯出版形式劃分(1)圖書(shū): 工具書(shū)、普通圖書(shū)(2)特種文獻(xiàn): 科技報(bào)告、專利文獻(xiàn)、學(xué)位論文、標(biāo)
6、準(zhǔn)文獻(xiàn)、會(huì)議文獻(xiàn)、政府出版物、產(chǎn)品資料(3)連續(xù)出版物: 期刊、報(bào)紙第9頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一圖書(shū):凡篇幅達(dá)48頁(yè)以上,并構(gòu)成一個(gè)書(shū)目單元的文獻(xiàn)成為圖書(shū)。識(shí)別點(diǎn):ISBN號(hào);書(shū)名;作者;出版社名稱、地點(diǎn);出版年;頁(yè)數(shù)期刊:指定期連續(xù)出版,有固定的刊名并編有時(shí)序號(hào)或數(shù)序號(hào)的出版物。識(shí)別點(diǎn):ISSN號(hào);刊名;年、卷、期號(hào);頁(yè)碼期刊論文:是從期刊中析出的文獻(xiàn)識(shí)別點(diǎn):ISSN號(hào);刊名;年、卷、期號(hào);頁(yè)碼第10頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一科技報(bào)告:有關(guān)科研工作記錄或成果的報(bào)告??萍紙?bào)告是科技工作者圍繞某個(gè)課題研究取得成果的正式報(bào)告,或?qū)δ?/p>
7、個(gè)課題研究過(guò)程中各個(gè)階段進(jìn)展情況的實(shí)際記錄。識(shí)別點(diǎn):報(bào)告號(hào)例如:朱家荷,韓調(diào).鐵路區(qū)間通過(guò)能力計(jì)算方法的研究R.北京:鐵道部科學(xué)研究院運(yùn)輸及經(jīng)濟(jì)研究所,1989第11頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一會(huì)議文獻(xiàn):是在各種學(xué)術(shù)、專題會(huì)議上發(fā)表的論文和報(bào)告。識(shí)別點(diǎn):會(huì)議名稱;會(huì)議錄出版時(shí)間;會(huì)議時(shí)間;會(huì)議地址例如:徐竹青.編碼在計(jì)算機(jī)與信息科學(xué)中的地位和作用的新探討A。見(jiàn):2001全國(guó)計(jì)算機(jī)新科技與計(jì)算機(jī)繼續(xù)教育學(xué)術(shù)會(huì)議論文集C.北京:中國(guó)見(jiàn)算計(jì)學(xué)會(huì),2001.166-169第12頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一專利文獻(xiàn):形成過(guò)程中產(chǎn)生的一系列官方文
8、件和有關(guān)出版物的總稱識(shí)別點(diǎn):專利號(hào);專利國(guó)別;專利權(quán)人;專利有限日期等例如:馮其波.一種激光多自由度測(cè)量系統(tǒng)與方法:中國(guó),ZL2003105126.XP.2003-09-03第13頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一標(biāo)準(zhǔn)文獻(xiàn):經(jīng)過(guò)工人的權(quán)威當(dāng)局批準(zhǔn)的以文件形式表達(dá)出的統(tǒng)一規(guī)定。包括技術(shù)標(biāo)準(zhǔn)、技術(shù)規(guī)格和技術(shù)規(guī)則等文獻(xiàn)的總稱。識(shí)別點(diǎn):標(biāo)準(zhǔn)號(hào)例如:GB/T 166642-1996 計(jì)算機(jī)集成制造系統(tǒng)體系結(jié)構(gòu)S.北京:國(guó)家技術(shù)監(jiān)督局,1996.第14頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一學(xué)位論文:高等學(xué)?;蜓芯吭核膶W(xué)生在導(dǎo)師指導(dǎo)下從事某一學(xué)術(shù)課題的研究,未獲
9、得某中學(xué)為而撰寫的學(xué)位論文。識(shí)別點(diǎn):學(xué)位;學(xué)位論文名稱;頒發(fā)學(xué)位的單位及其地址;授予學(xué)位的時(shí)間。例如:阮小波.90年代以來(lái)中國(guó)大眾文化研究的回顧與反思碩士論文.浙江:浙江師范大學(xué),2006.第15頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一政府出版物:指各國(guó)政府部門及其所屬機(jī)構(gòu)所發(fā)表、出版的文件。其內(nèi)容廣泛,概括可以分為行政性文獻(xiàn)和科技文獻(xiàn)兩大類。識(shí)別點(diǎn):有數(shù);報(bào)告;會(huì)議錄等多種形式產(chǎn)品資料:指國(guó)內(nèi)外各廠商為推銷產(chǎn)品而一發(fā)的一種商業(yè)性宣傳資料。包括產(chǎn)品樣本、產(chǎn)品目錄、產(chǎn)品說(shuō)明書(shū)、廠商介紹、技術(shù)座談資料等。第16頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一技術(shù)檔案:指
10、企業(yè)或科研機(jī)構(gòu)在技術(shù)工作中形成的有一定工程對(duì)象的技術(shù)文件。如任務(wù)書(shū)、協(xié)議書(shū)、技術(shù)經(jīng)濟(jì)指標(biāo)和審批文件、研究計(jì)劃方案大綱等。其它文獻(xiàn):包括廣播、電視、報(bào)紙等大眾傳媒、科技電影、衛(wèi)星資料等第17頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一各類型出版物的特點(diǎn)比較內(nèi)容新穎性:科技報(bào)告 專利 期刊 會(huì)議文獻(xiàn) 圖書(shū)信息報(bào)道速度:科技報(bào)告 期刊 會(huì)議論文 專利流通范圍廣度:期刊 圖書(shū) 會(huì)議文獻(xiàn) 專利 政府出版物發(fā)行量:期刊 專利 圖書(shū) 會(huì)議文獻(xiàn)具有法律性:專利、標(biāo)準(zhǔn) 易于獲得程度:期刊 圖書(shū) 會(huì)議文獻(xiàn) 專利 標(biāo)準(zhǔn) 政府出版物 學(xué)位論文 科技報(bào)告第18頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)3
11、8分,星期一2.政府信息源是國(guó)家機(jī)關(guān)及其所屬部門頒發(fā)的文件,包括政府報(bào)告、政策法令、規(guī)章制度、會(huì)議紀(jì)要、調(diào)查統(tǒng)計(jì)資料等。隨著我國(guó)的政府公開(kāi)條例的實(shí)施與電子政府的大力推進(jìn),我國(guó)通過(guò)網(wǎng)絡(luò)公開(kāi)的政府信息資源日漸豐富。中央政府門戶網(wǎng)站(1)中華人民共和國(guó)中央人民政府門戶網(wǎng)站)是國(guó)務(wù)院和國(guó)務(wù)院各部門,以及各省、自治區(qū)、直轄市人民政府在國(guó)際互聯(lián)網(wǎng)上發(fā)布政府信息和提供在線服務(wù)的綜合平臺(tái)。第19頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一中央政府門戶網(wǎng)站第20頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一(2)四個(gè)基礎(chǔ)信息庫(kù)人口基礎(chǔ)數(shù)據(jù)庫(kù)由公安部牽頭,國(guó)家計(jì)生委、國(guó)家統(tǒng)計(jì)局、民政部等
12、部門參與建設(shè),以公民身份標(biāo)志碼為唯一標(biāo)志的人口基礎(chǔ)信息庫(kù)和查詢服務(wù)系統(tǒng),實(shí)現(xiàn)人口信息計(jì)算機(jī)管理和聯(lián)機(jī)查詢,為各電子政務(wù)業(yè)務(wù)系統(tǒng)提供人口信息服務(wù)。法人單位基礎(chǔ)信息庫(kù)自然資源和地理空間基礎(chǔ)信息庫(kù)宏觀經(jīng)濟(jì)基礎(chǔ)數(shù)據(jù)庫(kù)(3)其他的政府信息資源法律法規(guī):專利:標(biāo)準(zhǔn):商標(biāo):統(tǒng)計(jì)數(shù)據(jù)與經(jīng)濟(jì)金融信息:科研信息:企業(yè)信用信息:貿(mào)易信息:產(chǎn)品質(zhì)量信息第21頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一政府信息資源第22頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一統(tǒng)計(jì)數(shù)據(jù)與經(jīng)濟(jì)金融信息第23頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一產(chǎn)品質(zhì)量信息第24頁(yè),共77頁(yè),2022年,
13、5月20日,16點(diǎn)38分,星期一3.行業(yè)協(xié)會(huì)信息源指介于政府、企業(yè)之間,商品生產(chǎn)業(yè)與經(jīng)營(yíng)者之間,并未其提供服務(wù)、咨詢、溝通、監(jiān)督、公正、自律、協(xié)調(diào)的社會(huì)中介組織,是一種民間性組織,它不屬于政府管理機(jī)構(gòu)系列,它是政府與企業(yè)的橋梁和紐帶。據(jù)民政部消息,截至2004年12月,我國(guó)31省(市、區(qū))(未含港澳臺(tái))各類行業(yè)協(xié)會(huì)已達(dá)45 736家。截至2008年8月13日,被中央政府網(wǎng)()收錄的全國(guó)性行業(yè)協(xié)會(huì)共299家。協(xié)會(huì)一般都建有自己的網(wǎng)站,查找該內(nèi)網(wǎng)站的方法是搜索引擎,搜索詞為“行業(yè)名稱協(xié)會(huì)網(wǎng)”;或直接用“行業(yè)名稱網(wǎng)”。第25頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一上海市汽車行業(yè)協(xié)會(huì)
14、第26頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一4.公益信息服務(wù)部門信息源主要包括國(guó)家圖書(shū)館及各省、市、縣、鄉(xiāng)鎮(zhèn)公共圖書(shū)館,各高等院校圖書(shū)館、中國(guó)科學(xué)院幾個(gè)分院文獻(xiàn)中心、中國(guó)社科院幾個(gè)分院文獻(xiàn)中心,中央黨校及各省市黨校圖書(shū)館,中國(guó)科技信息研究所及省市縣科技信息研究所,國(guó)家檔案館所及各個(gè)省市縣檔案館,中央各部委及省市各委局的信息中心等。公益信息服務(wù)機(jī)構(gòu)或聯(lián)合體,擁有大量的信息資源,承擔(dān)為公眾提供服務(wù)的責(zé)任。第27頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一公益信息服務(wù)部門第28頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一公益信息服務(wù)部門第29頁(yè),共77
15、頁(yè),2022年,5月20日,16點(diǎn)38分,星期一公益信息服務(wù)部門第30頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一公益信息服務(wù)部門第31頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一5.內(nèi)容信息服務(wù)商新信息源商業(yè)綜合網(wǎng)站,如搜狐、騰訊、新浪、網(wǎng)易各種電子商務(wù)網(wǎng)站,如淘寶、阿里巴巴、支付寶等搜索引擎,如百度、google等商業(yè)數(shù)據(jù)庫(kù),如維普、萬(wàn)方數(shù)據(jù)庫(kù)等其他內(nèi)容信息服務(wù)商所開(kāi)發(fā)運(yùn)營(yíng)的網(wǎng)站、數(shù)據(jù)庫(kù)等第32頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一綜合網(wǎng)站第33頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一搜索引擎第34頁(yè),共77頁(yè),2022年,
16、5月20日,16點(diǎn)38分,星期一商業(yè)數(shù)據(jù)庫(kù)第35頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一6.信息咨詢及中介咨詢機(jī)構(gòu)信息源會(huì)計(jì)師事務(wù)所律師事務(wù)所市場(chǎng)信息調(diào)查機(jī)構(gòu)咨詢服務(wù)機(jī)構(gòu)(公司)生產(chǎn)力促進(jìn)中心7.個(gè)人信息源是指居民個(gè)人擁有的可為他人提供服務(wù)的信息資源。主要包括個(gè)人學(xué)術(shù)網(wǎng)站、個(gè)人博客、個(gè)人播客、個(gè)人威客、專家在線咨詢、人肉搜索引擎的等。第36頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一 普華永道會(huì)計(jì)師事務(wù)所(Price Waterhouse Coopers PLL) 第37頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一咨詢服務(wù)機(jī)構(gòu)(公司)第38頁(yè),共7
17、7頁(yè),2022年,5月20日,16點(diǎn)38分,星期一個(gè)人信息源第39頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一8.信息保障系統(tǒng)信息源“在圖書(shū)館很難借到你真正需要的書(shū),在internet上總能找到你不需要的東西?!比绾未蚱拼死Ь??答案是信息聯(lián)合保障。中國(guó)高等文獻(xiàn)保障系統(tǒng)()國(guó)家科技圖書(shū)文獻(xiàn)中心()中國(guó)高校人文社科文獻(xiàn)中心高等學(xué)校中英文圖書(shū)數(shù)字化國(guó)際合作計(jì)劃國(guó)家科技基礎(chǔ)條件平臺(tái)全國(guó)文化信息資源共享工程國(guó)際聯(lián)機(jī)計(jì)算機(jī)圖書(shū)中心Google全球數(shù)字圖書(shū)館第40頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一中國(guó)高等文獻(xiàn)保障系統(tǒng)第41頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38
18、分,星期一國(guó)家科技圖書(shū)文獻(xiàn)中()第42頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一全國(guó)文化信息資源共享工程第43頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一高等學(xué)校中英文圖書(shū)數(shù)字化國(guó)際合作計(jì)劃第44頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一尋找信息源的方法1.按信息的生產(chǎn)使用者查詢?cè)撔畔⒌纳a(chǎn)者是誰(shuí)?使用者是誰(shuí)?相關(guān)者是誰(shuí)(管理者)?查找信息可以從上述方面進(jìn)行:比如:鐵路法規(guī),制定者是全國(guó)人大,使用者是鐵道部,相關(guān)者是法院和一些律師事務(wù)所,鐵路法規(guī)就可以從上面網(wǎng)站中分別獲取第45頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一2.從信息收藏
19、與傳播工具進(jìn)行檢索比如,學(xué)術(shù)文章去專業(yè)期刊查,而你不是報(bào)紙和雜志,公開(kāi)、免費(fèi)信息可用網(wǎng)絡(luò)搜索引擎檢索科技商業(yè)信息可用數(shù)據(jù)庫(kù)進(jìn)行檢索第46頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一3.從信息行業(yè)屬性檢索,包括行業(yè)學(xué)會(huì)、行業(yè)協(xié)會(huì)等第47頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一按信息源途徑查詢?nèi)ツ睦锊樵冑Y料?圖書(shū)館搜索引擎(網(wǎng)絡(luò))信息(情報(bào))所(中心)第48頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一信息檢索基礎(chǔ)理論信息檢索(information retrieval)廣義角度看,信息檢索包括信息存儲(chǔ)和信息獲取兩個(gè)過(guò)程。信息存儲(chǔ)指通過(guò)對(duì)大量無(wú)序信息的選
20、擇和收集、著錄和標(biāo)引等方法,建成各種各樣的信息檢索工具或信息檢索系統(tǒng),使之有序化信息集合的過(guò)程。獲取是存儲(chǔ)的逆過(guò)程,其實(shí)質(zhì)是根據(jù)特定的需求,運(yùn)用已組織好的檢索系統(tǒng),將特定的信息查找出來(lái)。存儲(chǔ)是獲取的前提和基礎(chǔ),沒(méi)有存儲(chǔ)就沒(méi)有獲取,而獲取是存儲(chǔ)的目的,二者密切聯(lián)系,互相依存,缺一不可。狹義角度看,從信息集合中迅速、準(zhǔn)確地查找出所需信息的程序和方法,即信息獲取的過(guò)程。第49頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一信息檢索的原理就是將特定的信息需求與存儲(chǔ)在檢索系統(tǒng)中的信息標(biāo)識(shí)進(jìn)行異同的比較與匹配,選取兩者相符的信息予以輸出。無(wú)論手工檢索還是計(jì)算機(jī)檢索,其基本原理都是一樣的。也就是說(shuō)
21、,檢索系統(tǒng)對(duì)所要存儲(chǔ)的信息,按照其外部特征和內(nèi)容特征賦予特征標(biāo)識(shí),然后存入系統(tǒng)。檢索時(shí),將所需信息的特征標(biāo)識(shí)與所存信息的特征標(biāo)識(shí)進(jìn)行比較,凡是兩邊標(biāo)識(shí)一致的,就將具有這些標(biāo)識(shí)的信息從檢索系統(tǒng)中輸出。具體如圖:第50頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一檢索流程圖信息需求信息標(biāo)引表達(dá)檢索提問(wèn)信息標(biāo)知比較與匹配檢索結(jié)果評(píng)價(jià)/反饋第51頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一信息檢索的類型文獻(xiàn)檢索(document retrieval)是以文獻(xiàn)(包括文獻(xiàn)、題錄和全文)為檢索對(duì)象,從以存儲(chǔ)的文獻(xiàn)數(shù)據(jù)查找出特定文獻(xiàn)的過(guò)程,是文獻(xiàn)檢索的核心部分。第52頁(yè),共77頁(yè),2
22、022年,5月20日,16點(diǎn)38分,星期一數(shù)據(jù)檢索Date retrieval以數(shù)據(jù)為檢索對(duì)象,從以收藏?cái)?shù)據(jù)資料中查找特定數(shù)據(jù)的過(guò)程,包括物質(zhì)的各種參數(shù)、電話號(hào)碼、銀行轉(zhuǎn)賬、觀測(cè)數(shù)據(jù)、統(tǒng)計(jì)數(shù)據(jù)等數(shù)字?jǐn)?shù)據(jù),也包括圖表、圖譜、市場(chǎng)行情、化學(xué)分子式、物質(zhì)的各種特性等非線性數(shù)字?jǐn)?shù)據(jù),是一種確定性檢索,信息用戶檢索到各種數(shù)據(jù)是經(jīng)過(guò)專家測(cè)試、評(píng)價(jià)、篩選過(guò)的,可直接用來(lái)進(jìn)行定量分析。例如:檢索2009年中國(guó)國(guó)民生產(chǎn)總值是什么?第53頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一事實(shí)檢索Fact retrieval是通過(guò)對(duì)存儲(chǔ)文獻(xiàn)中已有的基本事實(shí),或?qū)?shù)據(jù)進(jìn)行處理后得出的事實(shí)的過(guò)程。其檢索對(duì)象既包
23、括事實(shí)、概念、思想、知識(shí)等非線性數(shù)值信息,也包括一些數(shù)據(jù)信息,但需要針對(duì)查詢要求,有檢索系統(tǒng)進(jìn)行分析、推理后,再輸出最終結(jié)果。第54頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一信息檢索的演變手工檢索系統(tǒng)計(jì)算機(jī)檢索系統(tǒng)網(wǎng)絡(luò)檢索階段信息檢索的未來(lái)階段第55頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一信息檢索系統(tǒng)信息檢索系統(tǒng):是指根據(jù)特定的信息需求而建立起來(lái)的一種有關(guān)信息搜索、加工、存儲(chǔ)和檢索的程序化系統(tǒng),其主要目的是為人們提供信息服務(wù)。包括:信息、檢索技術(shù)設(shè)備、檢索語(yǔ)言及方法構(gòu)成:輸入功能、存儲(chǔ)功能、處理功能、輸出功能及控制功能。一般來(lái)說(shuō),信息檢索系統(tǒng)包括6各主要的子系
24、統(tǒng):信息選擇子系統(tǒng)信息索引子系統(tǒng)詞表管理子系統(tǒng)檢索子系統(tǒng)用戶同系統(tǒng)之間交互子系統(tǒng)匹配子系統(tǒng)第56頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一檢索語(yǔ)言檢索語(yǔ)言是文獻(xiàn)存貯和檢索所遵循的一種規(guī)范。在文獻(xiàn)組織和檢索中,檢索語(yǔ)言用來(lái)描述文獻(xiàn)外部特征或文獻(xiàn)內(nèi)部特征,對(duì)文獻(xiàn)進(jìn)行排序及檢索提問(wèn)。使信息組織者和檢索者達(dá)到共同理解,實(shí)現(xiàn)存取統(tǒng)一。 檢索語(yǔ)言保證了不同標(biāo)引人員表達(dá)文獻(xiàn)的一致性,保證了檢索提問(wèn)與文獻(xiàn)標(biāo)引的一致性,保證了檢索結(jié)果與檢索要求的一致性。第57頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一檢索語(yǔ)言分類檢索語(yǔ)言非控制語(yǔ)言(非人工語(yǔ)言)控制語(yǔ)言(人工語(yǔ)言)題名、刊名責(zé)任者
25、姓名專利號(hào)、檔案號(hào)等關(guān)鍵詞分類號(hào)主題語(yǔ)言分類語(yǔ)言敘詞第58頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一檢索語(yǔ)言按照何種特征描述劃分檢索語(yǔ)言表述文獻(xiàn)外表特征表述文獻(xiàn)內(nèi)容特征題名、刊名責(zé)任者姓名專利號(hào)、檔案號(hào)等分類號(hào)主題語(yǔ)言分類語(yǔ)言敘詞關(guān)鍵詞第59頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一檢索語(yǔ)言分類檢索語(yǔ)言分類檢索語(yǔ)言主題檢索語(yǔ)言分類主題檢索語(yǔ)言古代分類法現(xiàn)代分類法人大法科圖法中圖法四部分類法中圖法通用復(fù)分表第60頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一分類語(yǔ)言分類是指依據(jù)事物的屬性或特征進(jìn)行區(qū)分和類聚,并將區(qū)分結(jié)果按照一定次序組織起來(lái)的活動(dòng)。 分
26、類語(yǔ)言,(又可稱為信息資源分類法、文獻(xiàn)分類法),是使用分類方法將文獻(xiàn)主題概念區(qū)分、歸納形成類目體系,然后以號(hào)碼為基本字符,用分類號(hào)表達(dá)類目體系中每個(gè)主題概念的檢索語(yǔ)言。按照編制的原理可分為三種類型:體系分類法分面組配式半分面分類法 第61頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一 體系分類法 體系分類法是基于以學(xué)科門類為基礎(chǔ),根據(jù)文獻(xiàn)的內(nèi)部和某些外部特征,運(yùn)用概念劃分的原則,按知識(shí)門類的邏輯次序由總體到分支、由一般到具體、由簡(jiǎn)單至復(fù)雜進(jìn)行層層劃分,逐級(jí)展開(kāi)。一個(gè)大類或上位類每劃分一次產(chǎn)生許多子類目,所有不同級(jí)別的子類目向上層層隸屬,向下級(jí)級(jí)派生,從而形成了一個(gè)嚴(yán)格有序的直線性知
27、識(shí)門類等級(jí)體系。 中國(guó)圖書(shū)館圖書(shū)分類法是最常用的體系分類法。 第62頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一中國(guó)圖書(shū)館圖書(shū)分類法中國(guó)圖書(shū)館圖書(shū)分類法(簡(jiǎn)稱中圖法是目前國(guó)內(nèi)最常用的體系分類語(yǔ)言。 1975年出版第一版 1998年出版第四版 中圖法以各門學(xué)科的特點(diǎn)和規(guī)律為基礎(chǔ),按照知識(shí)門類的邏輯次序,將學(xué)科劃分為五個(gè)基本部類、二十二個(gè)基本大類。 中圖法的五個(gè)部類為:馬克思主義、列寧主義、毛澤東思想;哲學(xué);社會(huì)科學(xué);自然科學(xué);綜合性圖書(shū)。 第63頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一體系分類法及其原理 優(yōu)點(diǎn):便于檢索、檢全某一學(xué)科、某一專業(yè)方面的文獻(xiàn),可根據(jù)需要
28、擴(kuò)大或縮小檢索范圍;對(duì)于某一個(gè)學(xué)科的檢索方便有效。 缺點(diǎn):現(xiàn)代科技交叉滲透,使得 知識(shí)難以精確細(xì)分,受類目表的限制, 使得查準(zhǔn)率降低,容易漏檢。第64頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一中圖法二十二個(gè)大類A 馬克思主義、列寧主義、毛澤東思想B 哲學(xué)C 社會(huì)科學(xué)總論D 政治、法律E 軍事F 經(jīng)濟(jì) G 文化、科學(xué)、教育、體育H 語(yǔ)言、文字I 文學(xué) J 藝術(shù)K 歷史、地理N 自然科學(xué)總論O 數(shù)理科學(xué)和化學(xué)P 天文學(xué)、地球科學(xué)Q 生物科學(xué)R 醫(yī)藥、衛(wèi)生S 農(nóng)業(yè)科學(xué)T 工業(yè)技術(shù)U 交通運(yùn)輸V 航空、航天X 環(huán)境科學(xué)Z 綜合性圖書(shū)第65頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38
29、分,星期一其它體系分類法1.中國(guó)科學(xué)院圖書(shū)館圖書(shū)分類法(簡(jiǎn)稱科圖法):分為五大部二十五大類。至今仍有使用。2.杜威十進(jìn)分類法(Dewey Decimal Classification an Relative Index,簡(jiǎn)稱DC或DDC)。1876年問(wèn)世,將圖書(shū)分為10個(gè)大類,采用單純阿拉伯?dāng)?shù)字做標(biāo)記。目前有兩個(gè)版本。有電子版和網(wǎng)絡(luò)版。是當(dāng)今世界流行最廣的分類法。3.美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法(Library of Congress Classification,簡(jiǎn)稱LCC):美國(guó)國(guó)會(huì)圖書(shū)館編制。共設(shè)21個(gè)基本大類,采用字母數(shù)字混合號(hào)碼標(biāo)記類目。第66頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)
30、38分,星期一主題檢索語(yǔ)言采用語(yǔ)詞直接作為文獻(xiàn)主題標(biāo)識(shí),按字順排列主題標(biāo)識(shí),提供各種檢索詞語(yǔ)的途徑。類型:標(biāo)題詞語(yǔ)言單元詞語(yǔ)言敘詞語(yǔ)言關(guān)鍵詞語(yǔ)言特點(diǎn):專指性高、直觀性好、靈活性強(qiáng)第67頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一檢索途徑檢索途徑就是檢索文獻(xiàn)的出發(fā)點(diǎn)及路線,有時(shí)也稱“檢索點(diǎn)”,從文獻(xiàn)的特征出發(fā),將其特征值域檢索系統(tǒng)中標(biāo)引數(shù)據(jù)進(jìn)行計(jì)算比較,通過(guò)匹配達(dá)到檢索目的。常用檢索途徑:主題途徑 分類途徑作者途徑 號(hào)碼途徑題名途徑 引文途徑其他途徑第68頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一檢索策略和方法檢索策略:即在分析檢索課題內(nèi)容實(shí)質(zhì)基礎(chǔ)上,選擇檢索系統(tǒng)、檢索途徑、確定檢索詞及其相互間的邏輯關(guān)系等的信息檢索方案。檢索表達(dá)式:檢索表達(dá)式是檢索策略的具體體現(xiàn),簡(jiǎn)稱檢索式。檢索式一般有檢索詞和各種邏輯運(yùn)算符組成,具體來(lái)說(shuō),它將檢索詞之間的邏輯關(guān)系、位置關(guān)系等用檢索系統(tǒng)規(guī)定的各種算符連接起來(lái),成為計(jì)算機(jī)可以識(shí)別和執(zhí)行的命令形式。檢索式構(gòu)造的優(yōu)劣關(guān)系到檢索策略的成敗。第69頁(yè),共77頁(yè),2022年,5月20日,16點(diǎn)38分,星期一檢索表達(dá)式主要有:邏輯表達(dá)式、加權(quán)表達(dá)式、位置檢索表達(dá)式、截詞檢索表達(dá)式,限制檢索表達(dá)式等,其中,最為常用的是邏輯表達(dá)式。邏輯表達(dá)式:是指利用布爾
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 木工支模內(nèi)排架工程勞務(wù)分包合同-4
- 二零二五年度辦事處影視作品推廣合同
- 二零二五年度辦事處設(shè)計(jì)、施工、品牌授權(quán)合同
- 裝修合同清單模板(茶樓)
- 二零二五年度寶寶日間托管與營(yíng)養(yǎng)膳食合同
- 建筑工程施工合同終止協(xié)議年
- 數(shù)據(jù)分析與決策實(shí)戰(zhàn)指南
- 信息科技安全保障體系構(gòu)建
- 企業(yè)融資流程詳解和步驟說(shuō)明
- 酒店行業(yè)智能化客房智能控制系統(tǒng)方案
- AQ/T 2059-2016 磷石膏庫(kù)安全技術(shù)規(guī)程(正式版)
- 四川省宜賓市中學(xué)2025屆九上數(shù)學(xué)期末統(tǒng)考模擬試題含解析
- 2024年包頭市水務(wù)(集團(tuán))有限公司招聘筆試沖刺題(帶答案解析)
- 知識(shí)庫(kù)管理規(guī)范大全
- 2024年贛州民晟城市運(yùn)營(yíng)服務(wù)有限公司招聘筆試參考題庫(kù)附帶答案詳解
- 領(lǐng)導(dǎo)干部報(bào)告?zhèn)€人事項(xiàng)
- 9這點(diǎn)挫折算什么(課件)-五年級(jí)上冊(cè)生命與健康
- 價(jià)格監(jiān)督檢查知識(shí)培訓(xùn)課件
- 駐場(chǎng)保潔方案
- 中國(guó)心理衛(wèi)生協(xié)會(huì)家庭教育指導(dǎo)師參考試題庫(kù)及答案
- 智能廣告投放技術(shù)方案
評(píng)論
0/150
提交評(píng)論