版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
文獻(xiàn)信息檢索與利用
2013.04
緒論課程設(shè)計(jì)一、考核辦法平時(shí)出勤情況+隨堂考試占50%,期末考核50%(提交一份文獻(xiàn)信息檢索報(bào)告),無(wú)故出勤少于1/3者,取消考試資格。二、計(jì)劃學(xué)時(shí):共24學(xué)時(shí),考試2學(xué)時(shí),20學(xué)時(shí)授課,4學(xué)時(shí)實(shí)習(xí)(手檢實(shí)習(xí)2學(xué)時(shí),上機(jī)實(shí)習(xí)2學(xué)時(shí))。
◆課程性質(zhì)
◎一門技術(shù),一門素質(zhì)教育課◎操作性強(qiáng)◎?qū)嵱眯詮?qiáng)
↘
↓
↙核心
如何查尋利用信息課程目的授人以魚只供一飯之需教人以漁則終身受用無(wú)窮有用的信息——魚信息檢索與利用的技能——捕魚法“彼此交換蘋果,你我仍各有一個(gè)蘋果;彼此交換思想,每人各有兩種思想”論文寫作——養(yǎng)魚信息素質(zhì)的培養(yǎng)(informationliteracy)
信息素質(zhì)是指在各種信息交叉滲透、技術(shù)高度發(fā)展的社會(huì)中,人們所具有的信息意識(shí)、信息處理的各種能力或技能,包括信息需求的意識(shí)、查找和利用信息的意愿,信息搜集、鑒別、綜合分析的能力,信息技術(shù)運(yùn)用能力,以及積極的信息心理和良好的信息道德。信息素質(zhì)的構(gòu)成信息意識(shí)信息知識(shí)信息能力信息道德信息素質(zhì)的內(nèi)涵認(rèn)識(shí)準(zhǔn)確和完整的信息是明智決策的基礎(chǔ),認(rèn)識(shí)信息的重要性;認(rèn)識(shí)信息需求及問(wèn)題所在;制訂信息檢索策略,掌握信息檢索(計(jì)算機(jī)檢索)技術(shù);能評(píng)價(jià)信息,根據(jù)實(shí)際用途組織信息;將新信息融會(huì)到現(xiàn)有知識(shí)結(jié)構(gòu)中,在批評(píng)性思考、解決問(wèn)題和交流的過(guò)程中使用信息。信息素質(zhì)教育的意義終生學(xué)習(xí)的需要;是全面提高受教育者自身素質(zhì)的需要有利于緩解信息壓力有利于改善人們的生活質(zhì)量人類社會(huì)各時(shí)期富有的特征原始社會(huì)---占有更多的生活資料奴隸社會(huì)---占有更多的奴隸封建社會(huì)---占有更多的土地資本主義社會(huì)--占有更多的生產(chǎn)資料當(dāng)今社會(huì)---占有更多的信息查詢資料計(jì)劃思考實(shí)驗(yàn)研究撰寫報(bào)告查詢資料50%撰寫報(bào)告10%實(shí)驗(yàn)研究30%計(jì)劃思考10%(美國(guó)科學(xué)基金會(huì)凱斯工學(xué)院基金委員會(huì)和日本國(guó)家統(tǒng)計(jì)局)文獻(xiàn)信息檢索在學(xué)習(xí)研究中所占的比例《文獻(xiàn)信息檢索與利用》課程的發(fā)展20世紀(jì)60-70年代,發(fā)達(dá)國(guó)家開(kāi)設(shè)本課程;80年代后,我國(guó)高等學(xué)校開(kāi)始普及,當(dāng)時(shí)為《文獻(xiàn)檢索》;90年代后,逐漸發(fā)展為《文獻(xiàn)信息檢索與利用》課,引入現(xiàn)代信息技術(shù),如:光盤和網(wǎng)絡(luò)技術(shù);21世紀(jì)以信息素質(zhì)能力培養(yǎng)密切結(jié)合◆教材、教參推薦(G252.7)
[1]安新華.信息檢索基礎(chǔ).西安:地圖出版社,2007[2]王知津.信息存儲(chǔ)與檢索.北京:機(jī)械工業(yè)出版社,2009
[3]焦玉英等.信息檢索.武漢:武漢大學(xué)出版社,2001
[4]陳焱,張龍濱.信息檢索與利用.北京:北京大學(xué)出版社,2011
本課程主要內(nèi)容1、信息概述2、文獻(xiàn)信息檢索3、圖書館的利用4、計(jì)算機(jī)信息檢索5、數(shù)據(jù)庫(kù)應(yīng)用6、學(xué)術(shù)論文的寫作指出每一條農(nóng)諺中哪些是信息?哪些是知識(shí)?天上鉤鉤云,地下雨淋淋蜘蛛結(jié)網(wǎng),天必晴;螞蟻搬家,雨必下天上鯉魚斑,明天曬谷不用翻樹(shù)葉黃了:秋天到了;缺乏微量元素;病害
人類社會(huì)進(jìn)步的三大資源信息、能源、物質(zhì)第一章
信息概論
第一節(jié)
信息、知識(shí)、情報(bào)、文獻(xiàn)
一、信息及其基本屬性“信息”一詞的來(lái)源:在中國(guó)歷史文獻(xiàn)中最早見(jiàn)于唐代詩(shī)人李中的詩(shī)詞《暮春懷故人》中:“夢(mèng)斷美人沉信息,目穿長(zhǎng)路依樓臺(tái)”信息:音訊;消息
《辭源》(2009第六版)中對(duì)“信息”有兩種解釋。其第一種解釋為:音訊;消息。其第二種解釋為:通信系統(tǒng)傳輸和處理的對(duì)象,泛指內(nèi)容和信號(hào)的具體內(nèi)容和意義。泛指人類社會(huì)傳播的一切內(nèi)容。人通過(guò)獲得、識(shí)別自然界和社會(huì)的不同信息來(lái)區(qū)別不同事物,得以認(rèn)識(shí)和改造世界。
“信息”的拉丁詞源是information英文詞義是information20世紀(jì)中葉以后,信息的本質(zhì)才被揭示,并被引入哲學(xué)、信息論、系統(tǒng)論、控制論、傳播學(xué)、情報(bào)學(xué)、管理學(xué)、通信、計(jì)算機(jī)科學(xué)等領(lǐng)域。所以,站在不同的角度,對(duì)信息的定義是不同的。
據(jù)不完全統(tǒng)計(jì),信息的定義有100多種,它們都從不同的側(cè)面、不同的層次揭示了信息的某些特征和性質(zhì)。不同學(xué)科對(duì)信息的解釋(1)信息是通信的內(nèi)容,是“兩次不確定性的差異”,信息的多少反映了消除了的不確定性的大小。(申農(nóng))信息:消除不確定性的因素
——信息論
不同學(xué)科對(duì)信息的解釋(2)信息是人們?cè)谶m應(yīng)外部世界,并使這種適應(yīng)反作用于外部世界的過(guò)程中,同外部世界進(jìn)行相互交換內(nèi)容的名稱。(相互交換的內(nèi)容)
——控制論不同學(xué)科對(duì)信息的解釋(3)信息被定義為事物(thing)或記錄(record)。(巴克蘭德)圖書情報(bào)領(lǐng)域
信息是事物運(yùn)動(dòng)的狀態(tài)與方式,是物質(zhì)的一種屬性。(鐘義信)認(rèn)識(shí)論信息是存在于意識(shí)之外的東西,它存在于自然界、印刷品、硬盤以及空氣之中。(桑蓋特)心理學(xué)信息的概念是:信息是對(duì)客觀世界中各種事物的運(yùn)動(dòng)狀態(tài)和變化的反映,是客觀事物之間相互聯(lián)系和相互作用的表征,表現(xiàn)的是客觀事物運(yùn)動(dòng)狀態(tài)和變化的實(shí)質(zhì)內(nèi)容。2、信息的基本屬性
1)客觀性2)可存儲(chǔ)性3)可傳遞性4)時(shí)效性
5)可擴(kuò)散性
6)共享性信息社會(huì)最為基礎(chǔ)的理論體系三大論:信息論申農(nóng)1948年創(chuàng)立控制論維納1984年創(chuàng)立系統(tǒng)論貝塔朗菲1952年創(chuàng)立三者關(guān)系:系統(tǒng)論提出系統(tǒng)概念并揭示其一般規(guī)律,控制論研究系統(tǒng)演變過(guò)程中的規(guī)律性,信息論則研究控制的實(shí)現(xiàn)過(guò)程,因此信息論是控制論的基礎(chǔ),二者共同成為系統(tǒng)論的研究方法。
二、知識(shí)及其基本屬性1、知識(shí)的含義
知識(shí)是人類在認(rèn)識(shí)和改造世界的社會(huì)實(shí)踐中獲得的對(duì)事物本質(zhì)認(rèn)識(shí)的成果、觀點(diǎn)、經(jīng)驗(yàn)等。
知識(shí)可分為理性知識(shí)和感性知識(shí)。
2、知識(shí)的屬性
1)意識(shí)性2)信息性3)實(shí)踐性4)繼承性5)滲透性3、知識(shí)的類型
根據(jù)國(guó)際經(jīng)合組織(OECD)的定義,人類現(xiàn)有的知識(shí)可分為四大類:1)knowwhat(知道是什么)——關(guān)于事實(shí)方面的知識(shí)。2)knowwhy(知道為什么)——關(guān)于自然原理和規(guī)律方面的知識(shí)。3)knowhow(知道怎么做)——關(guān)于技術(shù)或能力方面的知識(shí)。4)knowwho(知道誰(shuí)有知識(shí))——關(guān)于到哪里尋求知識(shí)的知識(shí)。
在這里我們可以看到,知識(shí)的五種演進(jìn)層次,可以雙向演進(jìn)。從噪音中分揀出來(lái)數(shù)據(jù),轉(zhuǎn)化為信息,升級(jí)為知識(shí),升華為智慧。這樣一個(gè)過(guò)程,是信息的管理和分類過(guò)程,讓信息從龐大無(wú)序到分類有序,各取所需。這就是一個(gè)知識(shí)管理的過(guò)程,也是一個(gè)讓信息價(jià)值升華的過(guò)程。
反過(guò)來(lái),隨著信息生產(chǎn)手段的極大豐富,當(dāng)信息達(dá)到一定量的時(shí)候,我們發(fā)現(xiàn)噪音出現(xiàn)了,信息生產(chǎn)的過(guò)程其實(shí)也是一個(gè)不斷衰退的過(guò)程,從智慧-傳播為知識(shí),從知識(shí)普及為信息,從信息變?yōu)橛涗浀臄?shù)據(jù),到數(shù)據(jù)這里已經(jīng)失去了應(yīng)用價(jià)值,只有記錄價(jià)值了,從數(shù)據(jù)衰退到噪音,就已經(jīng)是純粹無(wú)效的東西了。
三、文獻(xiàn)及其基本屬性1、文獻(xiàn)的定義
文獻(xiàn)是記錄有知識(shí)的一切載體,即知識(shí)、信息必須通過(guò)文獻(xiàn)載體進(jìn)行存儲(chǔ)和傳遞。構(gòu)成文獻(xiàn)的三個(gè)最基本的要素是:
1)構(gòu)成文獻(xiàn)內(nèi)核的知識(shí)信息;2)負(fù)載知識(shí)信息的物質(zhì)載體;3)記錄知識(shí)信息的符號(hào)和技術(shù)。
2、文獻(xiàn)的基本屬性
1)知識(shí)性
2)傳遞性
3)動(dòng)態(tài)性
四、情報(bào)
情報(bào):與信息在英文中為同一個(gè)詞“Information”,即人們?cè)谝欢〞r(shí)間內(nèi)為一定目的而傳遞、收集的有使用價(jià)值的知識(shí)或信息。按應(yīng)用范圍可分為:科學(xué)情報(bào)經(jīng)濟(jì)情報(bào)技術(shù)經(jīng)濟(jì)情報(bào)軍事情報(bào)政治情報(bào)情報(bào)的特征:競(jìng)爭(zhēng)性、傳遞性、效用性五、智慧1、智慧的定義:創(chuàng)造性的處理和解決問(wèn)題的能力(智慧就是力量)。包括解決問(wèn)題的方案、廣度、難度、速度。2、特征:動(dòng)態(tài)性、針對(duì)性、多維性、開(kāi)拓性。六、信息知識(shí)情報(bào)文獻(xiàn)的關(guān)系信息>知識(shí)>情報(bào)情報(bào)是對(duì)用戶有效用的知識(shí)信息,而文獻(xiàn)又是記錄有關(guān)知識(shí)信息的一切載體。信息、知識(shí)和文獻(xiàn)的相互關(guān)系圖自然現(xiàn)象社會(huì)想象信息知識(shí)情報(bào)表征反映加工序化傳遞利用文獻(xiàn)記錄記錄記錄第二節(jié)信息資源及其類型
一、信息資源的含義與特點(diǎn)如前所述,信息是事物的一種普遍屬性。信息并非都能成為資源,只有經(jīng)人類開(kāi)發(fā)與重新組織后的信息才能成為信息資源,即信息資源是信息世界中對(duì)人類有價(jià)值的那一部分信息,是附加了人類勞動(dòng)的、可供人類利用的信息。因此,構(gòu)成信息資源的基本要素是:信息、人、符號(hào)、載體。與其他資源相比,具有可再生性和可共享性的特點(diǎn)。
信息資源的使用價(jià)值
一是真實(shí)度??茖W(xué)研究的客觀性和科學(xué)實(shí)驗(yàn)的可再現(xiàn)性,是信息資源真實(shí)度的具體體現(xiàn)。
二是時(shí)效性。信息資源的時(shí)效性主要體現(xiàn)在它的滯后性和超前性。信息資源的滯后性體現(xiàn)了認(rèn)識(shí)總是落后于客觀存在,如不能及時(shí)地使用最新信息,信息的價(jià)值就會(huì)隨其滯后使用的時(shí)差而減值。信息資源的超前性體現(xiàn)出在把握客觀事物規(guī)律的前提下,能夠?qū)赡馨l(fā)生的事物進(jìn)行預(yù)測(cè)。二、信息資源的類型與特點(diǎn)從不同的角度出發(fā)有不同的分類方法:1、以載體材料、存儲(chǔ)技術(shù)和傳遞方式劃分
1)刻寫型古代的甲骨卜辭、帛書,也含現(xiàn)代的篆刻、雕刻、雕塑等等,這類信息資源在研究歷史、藝術(shù)等方面具有很高的價(jià)值
2)印刷型以紙質(zhì)材料為載體,采用各種印刷術(shù)把文字或圖像記錄存儲(chǔ)在紙張上而形成。它既是文獻(xiàn)信息資源的傳統(tǒng)形式也是現(xiàn)代文獻(xiàn)信息資源的主要形式之一。主要特點(diǎn)是便于閱讀和流通,但因載體材料所存儲(chǔ)的信息密度低,占據(jù)空間大,難以實(shí)現(xiàn)加工利用的自動(dòng)化。
3)縮微型
以感光材料為載體,采用光學(xué)縮微技術(shù)將文字或圖像記錄存儲(chǔ)在感光材料上,如縮微膠卷、縮微卡片等。
主要特點(diǎn)有:存儲(chǔ)密度高、體積小、重量輕,便于收藏;生產(chǎn)迅速,成本低廉。但是,其缺點(diǎn)是必須借助縮微閱讀機(jī)才能閱讀,設(shè)備投資較大。4)聲像型
以磁性和光學(xué)材料為載體,采用磁錄技術(shù)和光錄技術(shù)將聲音和圖像記錄存儲(chǔ)在磁性或光學(xué)材料上,主要包括唱片、錄音錄像帶、電影膠卷、幻燈片等。主要特點(diǎn)是存儲(chǔ)信息密度高,內(nèi)容直觀,表達(dá)力強(qiáng),易被接受和理解,但須借助于一定的設(shè)備才能閱讀。
5)電子型
按其載體材料、存儲(chǔ)技術(shù)和傳遞方式,主要有聯(lián)機(jī)型、光盤型和網(wǎng)絡(luò)型。6)網(wǎng)絡(luò)型
是直接利用計(jì)算機(jī)技術(shù)、通信技術(shù)、多媒體技術(shù)相互融合形成的網(wǎng)絡(luò)上出版、流通和傳播的各種信息資源的總和。是電子出版物的高級(jí)形式。
它集中了聲像型、電子型文獻(xiàn)的所有優(yōu)點(diǎn),內(nèi)容表現(xiàn)具有多樣性和直觀性,并有人--機(jī)交互的友好界面。如:多媒體數(shù)據(jù)庫(kù)。2、按文獻(xiàn)的出版形式劃分(十大信息資源)圖書期刊、報(bào)紙連續(xù)出版物科技報(bào)告會(huì)議文獻(xiàn)專利文獻(xiàn)標(biāo)準(zhǔn)文獻(xiàn)政府出版物特種文獻(xiàn)學(xué)位論文產(chǎn)品資料技術(shù)檔案(1)圖書(一次文獻(xiàn)但具有三次文獻(xiàn)的性質(zhì))將文字、圖畫或其它符號(hào)書寫或印刷于紙張上的具有完整裝幀形式的非連續(xù)出版物。特征:內(nèi)容主題突出、系統(tǒng)全面、觀點(diǎn)成熟。但編輯出版周期長(zhǎng),報(bào)道速度相對(duì)較慢。按版本形式有單卷書、叢書、專著、參考書等外在特征:通常由封面、書名頁(yè)、版權(quán)頁(yè)、目次、正文組成。圖書的識(shí)別主要依據(jù):
ISBN號(hào)、書名、作者、出版社名稱、出版地址、出版年、頁(yè)數(shù)等識(shí)別。ISBN國(guó)際標(biāo)準(zhǔn)書號(hào)(InternationalStandardBookNumber)每種書的書號(hào)是唯一的,由13位數(shù)字組成,分5部分,例如:《信息檢索基礎(chǔ)》ISBN978-7-80748-167-6分別為歐洲圖書商品的代碼、語(yǔ)區(qū)號(hào)、出版社號(hào)、書次號(hào)、校驗(yàn)號(hào)。(2)連續(xù)出版物我國(guó)《連續(xù)出版物著錄規(guī)則》中的定義:“印刷或非印刷形式的出版物,具有統(tǒng)一的題名,定期或不定期以連續(xù)分冊(cè)的形式出版,有卷期或年月標(biāo)識(shí),并且計(jì)劃無(wú)限期地連續(xù)出版?!迸c圖書相比,具有出版迅速、內(nèi)容新穎、信息量大、時(shí)效性強(qiáng)的優(yōu)點(diǎn)。①期刊(最重要的一次文獻(xiàn))又稱雜志,它是有比較固定的名稱和出版時(shí)間、比較一致的開(kāi)本及穩(wěn)定的欄目的連續(xù)不斷的出版物。特點(diǎn):出版周期短、有國(guó)際連續(xù)出版序號(hào)、有固定的編輯機(jī)構(gòu)、學(xué)術(shù)觀點(diǎn)新穎、信息含量大、種類多等特點(diǎn)。期刊情報(bào)占整個(gè)信息源的60-70%。所以,受到科技工作者的高度重視。
期刊形成于罷工、罷課或戰(zhàn)爭(zhēng)中的宣傳小冊(cè)子。這種類似于報(bào)紙注重時(shí)效的手冊(cè),兼顧了更加詳盡的評(píng)論。所以一種新的媒體隨著這樣特殊的原因就產(chǎn)生了。其中最早出版的一本期刊是于1665年1月在阿姆斯特丹由法國(guó)人薩羅(DenysdeSallo)出版的《學(xué)者期刊》。1704年,倫敦出版了第一種介于報(bào)紙和期刊之間的定期刊物,發(fā)行者是《魯賓遜漂流記》的作者丹尼·笛福??锩小对u(píng)論》,篇幅為四小頁(yè),共發(fā)行九年。
數(shù)字期刊相比傳統(tǒng)期刊,具有多終端、多渠道發(fā)行,覆蓋更廣闊地域、影響更廣大人群的特點(diǎn),尤其在過(guò)刊內(nèi)容的利用方面也擁有傳統(tǒng)紙媒無(wú)法比擬的優(yōu)勢(shì)。同時(shí),搜索技術(shù)也為數(shù)字期刊提供了良好的應(yīng)用,用戶可以通過(guò)標(biāo)題、人名、關(guān)鍵詞等檢索,找到最符合自己閱覽需求的刊物和文章。
據(jù)數(shù)據(jù)統(tǒng)計(jì),同等時(shí)間內(nèi)數(shù)字內(nèi)容的閱讀效果是傳統(tǒng)閱讀的5倍以上。更重要的一點(diǎn),是數(shù)字期刊具有節(jié)能、降耗、減排的綠色環(huán)保概念。為刊社節(jié)約印刷裝訂成本、物流運(yùn)輸成本、發(fā)行成本、滯銷庫(kù)存風(fēng)險(xiǎn)等。
iebook第一門戶龍?jiān)雌诳W(wǎng)
ISSN(國(guó)際標(biāo)準(zhǔn)連續(xù)出版物編號(hào)InternationalStandardSerialNumber)是根據(jù)國(guó)際標(biāo)準(zhǔn)ISO3297制定的連續(xù)版物國(guó)際標(biāo)準(zhǔn)編碼,其目的是使世界上每一種不同題名、不同版本的連續(xù)出版物都有一個(gè)國(guó)際性的唯一代碼標(biāo)識(shí)。
ISSN有八位數(shù)字組成,前7位是數(shù)字序號(hào),是刊名代號(hào),最后一位是計(jì)算機(jī)校驗(yàn)號(hào)。8位數(shù)字分為前后兩段各4位,中間用連接號(hào)相連,如:Science(printISSN0036-8075;onlineISSN1095-9203),前7位數(shù)字為順序號(hào),最后一位是校驗(yàn)位。ISSN通常都印在期刊的封面或版權(quán)頁(yè)上例如②報(bào)紙以刊載新聞和時(shí)事評(píng)論為主的定期連續(xù)向公眾發(fā)行的連續(xù)出版物,是大眾傳播的重要載體,具有反映和引導(dǎo)社會(huì)輿論的功能。主要特點(diǎn):出版周期短,能以最快的速度報(bào)導(dǎo)國(guó)內(nèi)外發(fā)生的新事件和科技的最新研究成果,信息量大。
初期的報(bào)紙和雜志是混同的,有新聞,也有各種雜文和文學(xué)作品,簡(jiǎn)單地裝訂成冊(cè)。對(duì)于這個(gè)時(shí)期的報(bào)紙和雜志,通?;\統(tǒng)地稱“報(bào)刊”,英國(guó)、法國(guó)、中國(guó)早期的“報(bào)刊”概念,便是在這個(gè)意義上使用的。在我國(guó)出版的第一張漢文日?qǐng)?bào),是1858年在香港創(chuàng)辦的《外中新報(bào)》。林則徐所辦的《澳門新聞紙》,是我國(guó)最早的譯報(bào)?!栋拈T新聞紙》和《澳門月報(bào)》(魏源在《海國(guó)圖志》中所用名)雖然名為報(bào)紙,但不公開(kāi)發(fā)行。
報(bào)紙不論大小,都由報(bào)頭、報(bào)眼、版位、欄目組成。報(bào)頭總是放在最顯著地位,大都放在一版左上角,也有的放在一版頂上面的中間。報(bào)頭上最主要的是報(bào)名,一般由名人書法題寫,也有的作黑體字。報(bào)頭旁邊的一小塊版面,通稱“報(bào)眼”。對(duì)“報(bào)眼”的內(nèi)容安排沒(méi)有定規(guī),有的用來(lái)登內(nèi)容提要、日歷和氣象預(yù)報(bào),有的用來(lái)登重要新聞或圖片,有的用來(lái)登廣告。由于“報(bào)眼”位置顯著廣告費(fèi)特別高。
報(bào)紙的版面位置叫版位。對(duì)一份報(bào)紙來(lái)說(shuō),第一版是要聞版,排在這一版上的新聞比其他版重要。在橫排報(bào)紙的版面上,左上角要比右上角重要。報(bào)紙新聞標(biāo)題所用的字號(hào)大小也能顯示它是否重要。欄目是報(bào)紙定期刊登同類文章的園地,經(jīng)常在報(bào)紙上看到的有“科技天地”、“國(guó)際瞭望”、“讀者來(lái)信”等。除欄目外,還有一些不定期的專版,范圍比專欄更大一些。比如慶祝什么節(jié)日,組織一批征文專版;什么問(wèn)題引起讀者廣泛的興趣,組織一些討論專版。
網(wǎng)絡(luò)報(bào)紙?jiān)谝蛱鼐W(wǎng)上建立網(wǎng)站發(fā)布網(wǎng)絡(luò)版報(bào)紙的實(shí)踐起始于1994年,至1994年底,共有78家報(bào)紙發(fā)行了網(wǎng)絡(luò)版。到1997年,網(wǎng)絡(luò)報(bào)紙已發(fā)展到1900多家。
關(guān)于報(bào)紙的職能,從不同角度,會(huì)得出不同的看法,例如從政黨機(jī)關(guān)報(bào)的角度,報(bào)紙的職能如毛澤東所說(shuō):“報(bào)紙的作用和力量,就在它能使黨的綱領(lǐng)路線,方針政策、工作任務(wù)和工作方法,最迅速最廣泛地同群眾見(jiàn)面?!狈▏?guó)新聞學(xué)者貝爾納.瓦耶納關(guān)于報(bào)紙職能的概括,可以被各方面接受:主要的報(bào)道職能,隨之而來(lái)的辯論職能(即傳播觀點(diǎn)的職能),附帶的娛樂(lè)職能。
(3)學(xué)術(shù)論文學(xué)術(shù)論文:指作者為發(fā)布其學(xué)術(shù)觀點(diǎn)或研究成果而撰寫的論述性文章。論文內(nèi)容一般是某一學(xué)術(shù)課題在理論性、實(shí)踐性或預(yù)測(cè)性上具有新的研究成果或創(chuàng)新見(jiàn)解,或是某種已知原理應(yīng)用于實(shí)踐中取得新進(jìn)展的科學(xué)總結(jié),向使用者提供有所發(fā)現(xiàn)、有所發(fā)明、有所創(chuàng)造的知識(shí)信息。
特點(diǎn):信息新穎、論述專深、學(xué)術(shù)性強(qiáng),是人們交流學(xué)術(shù)思想的主要媒介,也是開(kāi)展科學(xué)研究參考的主要信息源之一。學(xué)術(shù)論文按撰寫的目的可分為以下四種:科學(xué)論文、技術(shù)論文、專題論文、學(xué)位論文(體現(xiàn)畢業(yè)生能力的一次文獻(xiàn))。
(4)專利說(shuō)明書(集技術(shù)、經(jīng)濟(jì)、法律于一體的一次文獻(xiàn))
專利說(shuō)明書特指專利申請(qǐng)人向?qū)@鞴懿块T呈交的有關(guān)發(fā)明創(chuàng)造的詳細(xì)技術(shù)說(shuō)明,是具有知識(shí)產(chǎn)權(quán)特性的信息資源,包含技術(shù)領(lǐng)域、背景技術(shù)、發(fā)明內(nèi)容、附圖說(shuō)明、具體實(shí)施方法等項(xiàng)目。
專利說(shuō)明書的主要作用一是清楚、完整公開(kāi)最新的發(fā)明創(chuàng)造;二是請(qǐng)求或確定法律保護(hù)的范圍。
(5)科技報(bào)告(既像書又像刊的一次文獻(xiàn))
科技報(bào)告:是科研工作的系統(tǒng)總結(jié)。特點(diǎn):連續(xù)出版,內(nèi)容專深具體,數(shù)據(jù)完整;往往是最新技術(shù)研究成果信息的重要信息資源。比期刊論文發(fā)表早。
科技報(bào)告是繼圖書、期刊、檔案等類型文獻(xiàn)之后出現(xiàn)的一種文獻(xiàn),它是人類科技發(fā)展和信息文化發(fā)展的產(chǎn)物,在人類的知識(shí)信息傳播和利用中起著越來(lái)越重要的作用,世界各國(guó)在科技文獻(xiàn)信息交流中都將它列于首位。美國(guó)四大報(bào)告最為著名AD(軍用工程)、PB(民用工程)DOE(能源工程)、NASA(航空航天工程)(6)技術(shù)標(biāo)準(zhǔn)(促進(jìn)社會(huì)產(chǎn)品質(zhì)量的三次文獻(xiàn))
技術(shù)標(biāo)準(zhǔn)是對(duì)產(chǎn)品和工程建設(shè)的各個(gè)方面所作的技術(shù)規(guī)定,是進(jìn)行科研和生產(chǎn)的共同依據(jù)。特點(diǎn):計(jì)劃性、協(xié)調(diào)性、法律約束性。
根據(jù)使用的范圍:國(guó)際標(biāo)準(zhǔn)、區(qū)域標(biāo)準(zhǔn)、國(guó)家標(biāo)準(zhǔn)和企業(yè)(行業(yè))標(biāo)準(zhǔn)。按內(nèi)容:技術(shù)標(biāo)準(zhǔn)包括基礎(chǔ)技術(shù)標(biāo)準(zhǔn)、產(chǎn)品標(biāo)準(zhǔn)、工藝標(biāo)準(zhǔn)、檢測(cè)試驗(yàn)方法標(biāo)準(zhǔn)及安全、衛(wèi)生、環(huán)保標(biāo)準(zhǔn)等。(7)會(huì)議文獻(xiàn)(報(bào)道最新科技動(dòng)向的一次文獻(xiàn))
會(huì)議文獻(xiàn):是指在學(xué)術(shù)會(huì)議上和專業(yè)學(xué)術(shù)會(huì)議上宣讀或交流的論文、材料、討論記錄、會(huì)議紀(jì)要等文獻(xiàn)。特點(diǎn):會(huì)議文獻(xiàn)的特點(diǎn)是傳遞情報(bào)比較及時(shí),內(nèi)容新穎,專業(yè)性和針對(duì)性強(qiáng),種類繁多,出版形式多樣。它是科技文獻(xiàn)的重要組成部分,一般是經(jīng)過(guò)挑選的,質(zhì)量較高,能及時(shí)反映科學(xué)技術(shù)中的新發(fā)現(xiàn)、新成果、新成就以及學(xué)科發(fā)展趨向,是一種重要的情報(bào)源。(8)政府出版物(體現(xiàn)政府科技政策的三次文獻(xiàn))政府出版物:由政府機(jī)關(guān)負(fù)責(zé)編輯印制的,并通過(guò)各種渠道發(fā)送或出售的文字、圖片、以及磁帶、軟件等。是政府用以發(fā)布政令和體現(xiàn)其思想、意志、行為的物質(zhì)載體,同時(shí)也是政府的思想、意志、行為產(chǎn)生社會(huì)效應(yīng)的主要傳播媒介。特點(diǎn):正式性和權(quán)威性,對(duì)了解各國(guó)政治、經(jīng)濟(jì)、科技法有獨(dú)特的參考作用。(9)檔案(最忠實(shí)的一次文獻(xiàn))
檔案:我國(guó)古代的檔案,在各個(gè)朝代有著不同的稱謂。商代稱為“冊(cè)”,周代叫做“中”,秦漢稱作“典籍”,漢魏以后謂之“文書”“文案”“案牘”“案卷”“簿書”,清代以后多用“檔案”,今統(tǒng)一稱作“檔案”。
檔案是直接形成的歷史紀(jì)錄?!爸苯有纬伞闭f(shuō)明檔案繼承了文件的原始性,“歷史紀(jì)錄”說(shuō)明檔案在繼承文件原始性的同時(shí),也繼承了文件的記錄性,是再現(xiàn)歷史真實(shí)面貌的原始文獻(xiàn)。所以檔案具有憑證價(jià)值的重要屬性,并以此區(qū)別于圖書情報(bào)資料和文物。
檔案具有歷史再現(xiàn)性、知識(shí)性、信息性、政治性、文化性、社會(huì)性、教育性、價(jià)值性等特點(diǎn),其中歷史再現(xiàn)性為其本質(zhì)屬性,其他特點(diǎn)為其一般屬性。因此,可將檔案的定義簡(jiǎn)要地表述為:檔案是再現(xiàn)歷史真實(shí)面貌的原始文獻(xiàn)。(10)產(chǎn)品資料(提供產(chǎn)品技術(shù)規(guī)格的一次文獻(xiàn))產(chǎn)品資料:是指國(guó)內(nèi)外廠商為推銷產(chǎn)品而出版發(fā)行的各種商品性宣傳品。如公司介紹、產(chǎn)品目錄、樣本、說(shuō)明書等。意義:開(kāi)發(fā)新產(chǎn)品,進(jìn)行市場(chǎng)競(jìng)爭(zhēng)。小結(jié)上述的十類主要文獻(xiàn)中,除圖書和期刊外,其余八種被稱為特種文獻(xiàn)—非書非刊出版物,一般單獨(dú)成冊(cè),有些不公開(kāi)發(fā)表,難于獲取。有專門的檢索工具和獲取途經(jīng)。3、以加工文獻(xiàn)的深度劃分文獻(xiàn)信息資源以信息加工深度劃分,可分為零次文獻(xiàn)信息、一次文獻(xiàn)信息、二次文獻(xiàn)信息、三次文獻(xiàn)信息和高次文獻(xiàn)信息。
1)零次文獻(xiàn)信息資源
零次文獻(xiàn)信息資源是指未以公開(kāi)形式進(jìn)入社會(huì)流通使用的實(shí)驗(yàn)記錄、會(huì)議記錄、內(nèi)部檔案、論文草稿、設(shè)計(jì)草稿、筆記、手稿、BBS帖子、博客等,記錄在非正規(guī)物理載體上。具有原始性、新穎性、分散性等特征,而且沒(méi)有公開(kāi)交流,難以獲得。
2)一次文獻(xiàn)信息資源一次文獻(xiàn)是人們直接以自己的生產(chǎn)、科研、社會(huì)活動(dòng)等實(shí)踐經(jīng)驗(yàn)為依據(jù)生產(chǎn)出來(lái)的文獻(xiàn),也常被稱為原始文獻(xiàn)(或叫一級(jí)文獻(xiàn))。一次文獻(xiàn)信息資源包含了新觀點(diǎn)、新發(fā)明、新技術(shù)、新成果,提供了新的知識(shí)信息,是創(chuàng)造性勞動(dòng)的結(jié)晶;具有創(chuàng)造性的特點(diǎn),有直接參考、借鑒和使用的價(jià)值,是人們檢索和利用的主要對(duì)象。
一次文獻(xiàn)在整個(gè)文獻(xiàn)中是數(shù)量最大、種類最多、所包括的新鮮內(nèi)容最多、使用最廣、影響最大的文獻(xiàn),如期刊論文、專利文獻(xiàn)、科技報(bào)告、會(huì)議錄、學(xué)位論文等等,這些文獻(xiàn)具有創(chuàng)新性、實(shí)用性和學(xué)術(shù)性等明顯特征。
3)二次文獻(xiàn)信息資源二次文獻(xiàn)又稱二級(jí)次文獻(xiàn),是對(duì)一次文獻(xiàn)進(jìn)行加工整理后的產(chǎn)物,即對(duì)無(wú)序的一次文獻(xiàn)的外部特征如題名、作者、出處等進(jìn)行著錄,或?qū)⑵鋬?nèi)容壓縮成簡(jiǎn)介、提要或文摘,并按照一定的學(xué)科或?qū)I(yè)加以有序化而形成的文獻(xiàn)形式,如目錄、文摘雜志(包括簡(jiǎn)介式檢索刊物)等。
二次文獻(xiàn)信息資源僅是對(duì)一次文獻(xiàn)信息資源進(jìn)行系統(tǒng)化的壓縮,無(wú)新的知識(shí)信息產(chǎn)生,具有匯集性、檢索性和系統(tǒng)性的特點(diǎn)。能系統(tǒng)地反映某個(gè)學(xué)科、專業(yè)或?qū)n}在一定時(shí)空范圍內(nèi)的最新研究成果。它的重要性在于提供了一次文獻(xiàn)信息的線索,是打開(kāi)一次文獻(xiàn)信息知識(shí)庫(kù)的鑰匙,可節(jié)省人們查找知識(shí)信息的時(shí)間。
4)三次文獻(xiàn)信息資源
三次文獻(xiàn)信息資源是根據(jù)一定的目的和需求,在大量利用一、二次文獻(xiàn)信息資源的基礎(chǔ)上,對(duì)有關(guān)知識(shí)信息進(jìn)行綜合、分析、提煉、重組而生成的再生信息資源。如各種教科書、技術(shù)書、參考工具書、綜述等都屬三次文獻(xiàn)信息的范疇。三次文獻(xiàn)信息資源具有綜合性高、針對(duì)性強(qiáng)、系統(tǒng)性好、知識(shí)信息面廣的特點(diǎn),有較高的實(shí)用價(jià)值,能直接提供參考、借鑒和利用。
5)高次文獻(xiàn)信息資源
高次文獻(xiàn)信息資源是在對(duì)大量一、二、三次文獻(xiàn)信息資源中的知識(shí)信息進(jìn)行綜合、分析、提煉、重組的基礎(chǔ)上,加入了作者本人的知識(shí)和智慧,使原有的知識(shí)信息增值,生成比原有知識(shí)品位更高的知識(shí)信息新產(chǎn)品。如專題述評(píng)、可行性分析論證報(bào)告、信息分析研究報(bào)告等,具有參考性強(qiáng)、實(shí)用價(jià)值高、社會(huì)效益和經(jīng)濟(jì)效益顯著的特點(diǎn)。6)零次、一次、二次、三次文獻(xiàn)的的相互關(guān)系A(chǔ)、從零次文獻(xiàn)、一次文獻(xiàn)、二次文獻(xiàn)到三次文獻(xiàn),是一個(gè)從分散到集中由無(wú)序到有序由博到略對(duì)知識(shí)進(jìn)行不同層次加工的過(guò)程。B、零次文獻(xiàn)是一次文獻(xiàn)的素材;C、一次文獻(xiàn)是二次文獻(xiàn)的基本來(lái)源,科技文獻(xiàn)信息檢索的對(duì)象;D、二次文獻(xiàn)是一次文獻(xiàn)的集中、提煉和有序化,是文獻(xiàn)檢索的工具,故又稱之為檢索工具。E、三次文獻(xiàn)是把分散的零次文獻(xiàn)、一次文獻(xiàn)、二次文獻(xiàn),按照某一特定目的進(jìn)行綜合分析,加工而成的成果。三次文獻(xiàn)既是文獻(xiàn)信息檢索和利用的對(duì)象,又可作為檢索文獻(xiàn)的工具。第二章信息檢索信息檢索的基本原理信息檢索系統(tǒng)信息檢索語(yǔ)言第一節(jié)
信息檢索基本原理
一、信息檢索概論
1.信息檢索概念
信息檢索(InformationRetrieval)是指信息按一定的方式組織起來(lái),并根據(jù)信息用戶的需要找出有關(guān)信息的過(guò)程和技術(shù)。狹義的信息檢索就是信息檢索過(guò)程的后半部分,即從信息集合中找出所需信息的過(guò)程,也就是我們常說(shuō)的信息查尋(InformationSearch或InformationSeek)。廣義信息檢索1)信息的標(biāo)引和存儲(chǔ)過(guò)程
對(duì)大量無(wú)序的信息資源進(jìn)行標(biāo)引處理,使之有序化,并按科學(xué)的方法存儲(chǔ),組成檢索工具或檢索文檔,即檢索系統(tǒng)的組織過(guò)程。2)信息的需求分析和檢索過(guò)程分析用戶的信息需求,利用已組織好的檢索系統(tǒng),按照系統(tǒng)提供的方法與途徑檢索有關(guān)信息,即檢索系統(tǒng)的應(yīng)用過(guò)程。2、信息檢索的特點(diǎn)
1)邏輯性信息檢索作為信息管理的核心,具有非常強(qiáng)的邏輯性。檢索語(yǔ)言、檢索策略足以體現(xiàn)。
2)相關(guān)性相關(guān)性表明用戶文獻(xiàn)是否與問(wèn)題相吻合。
3)不確定性在標(biāo)引和檢索詞的選用中都存在不確定性
3.信息檢索的重要意義和作用1、信息檢索是獲取知識(shí)的捷徑美國(guó)普林斯頓大學(xué)物理系一個(gè)年輕大學(xué)生名叫約瀚·菲利普,在圖書館里借閱有關(guān)公開(kāi)資料,僅用四個(gè)月時(shí)間,就畫出一張制造原子彈的設(shè)計(jì)圖。他設(shè)計(jì)的原子彈,體積小(棒球大小)、重量輕(7.5公斤)、威力大(相當(dāng)廣島原子彈3/4的威力),造價(jià)低(當(dāng)時(shí)僅需兩千美元),致使一些國(guó)家(法國(guó)、巴基斯坦等)紛紛致函美國(guó)大使館,爭(zhēng)相購(gòu)買他的設(shè)計(jì)。
2、信息檢索是科學(xué)研究的向?qū)?/p>
美國(guó)在實(shí)施“阿波羅登月計(jì)劃”中,對(duì)阿波羅飛船的燃料箱進(jìn)行壓力實(shí)驗(yàn)時(shí),發(fā)現(xiàn)甲醇會(huì)引起鈦應(yīng)力腐蝕,為此付出了數(shù)百萬(wàn)美元來(lái)研究解決這一問(wèn)題,事后查明,早在十多年前,就有人研究出來(lái)了,方法非常簡(jiǎn)單,只需在甲醇中加入2%的水即可,檢索這篇文獻(xiàn)的時(shí)間是10多分鐘。在科研開(kāi)發(fā)領(lǐng)域里,重復(fù)勞動(dòng)在世界各國(guó)都不同程度地存在。據(jù)統(tǒng)計(jì),美國(guó)每年由于重復(fù)研究所造成的損失,約占全年研究經(jīng)費(fèi)的38%,達(dá)20億美元之巨。日本有關(guān)化學(xué)化工方面的研究課題與國(guó)外重復(fù)的,大學(xué)占40%、民間占47%、國(guó)家研究機(jī)構(gòu)占40%,平均重復(fù)率在40%以上。
3.信息檢索是終身教育的基礎(chǔ)學(xué)校培養(yǎng)學(xué)生的目標(biāo)是學(xué)生的智能:包括自學(xué)能力、研究能力、思維能力、表達(dá)能力和組織管理能力。教育已擴(kuò)大到一個(gè)人的整個(gè)一生,唯有全面的終身教育才能夠培養(yǎng)完善的人,可以防止知識(shí)老化,不斷更新知識(shí),適應(yīng)當(dāng)代信息社會(huì)發(fā)展的需求。二、信息檢索基本原理
是檢索者的檢索提問(wèn)詞與存儲(chǔ)在檢索系統(tǒng)中的檢索標(biāo)引詞進(jìn)行匹配對(duì)比,取得一致即為檢索命中,命中結(jié)果可從檢索系統(tǒng)中以各種方式輸出。檢索者可根據(jù)此線索對(duì)原文進(jìn)行判斷、篩選,以獲取自己所需要的信息。
信息檢索的原理(示意圖)
信息集合需求集合特征化表示表示特征化選擇與匹配存儲(chǔ)查詢
由信息檢索原理可知,信息的存儲(chǔ)是實(shí)現(xiàn)信息檢索的基礎(chǔ)。這里要存儲(chǔ)的信息不僅包括原始文檔數(shù)據(jù),還包括圖片、視頻和音頻等。首先要將這些原始信息進(jìn)行計(jì)算機(jī)語(yǔ)言的轉(zhuǎn)換,并將其存儲(chǔ)在數(shù)據(jù)庫(kù)中,否則無(wú)法進(jìn)行機(jī)器識(shí)別。待用戶根據(jù)意圖輸入查詢請(qǐng)求后,檢索系統(tǒng)根據(jù)用戶的查詢請(qǐng)求在數(shù)據(jù)庫(kù)中搜索與查詢相關(guān)的信息,通過(guò)一定的匹配機(jī)制計(jì)算出信息的相似度大小,并按從大到小的順序?qū)⑿畔⑥D(zhuǎn)換輸出。文獻(xiàn)檢索原理1.文獻(xiàn)替代2.文獻(xiàn)整序3.文獻(xiàn)特征標(biāo)識(shí)與檢索提問(wèn)標(biāo)識(shí)的匹配1.文獻(xiàn)替代一次文獻(xiàn)的文獻(xiàn)特征標(biāo)識(shí)(外部特征和內(nèi)容特征)按一定的標(biāo)準(zhǔn)格式著錄成它的替代文獻(xiàn)(二次文獻(xiàn))的過(guò)程。著錄項(xiàng)目與格式:中圖分類號(hào)題名/著者(著者所在單位郵政編碼)//刊名/主辦單位.—出版年,卷(期).—所在頁(yè)碼文摘……。圖x表x參x(文摘員)2.文獻(xiàn)整序
將雜亂無(wú)章的替代文獻(xiàn)(二次文獻(xiàn))按一定的順序(通常按學(xué)科類目)排列,并編制各種索引的過(guò)程。經(jīng)過(guò)文獻(xiàn)替代和文獻(xiàn)整序后,完成了文獻(xiàn)存儲(chǔ)的過(guò)程。3.文獻(xiàn)特征標(biāo)識(shí)與檢索提問(wèn)標(biāo)識(shí)的匹配文獻(xiàn)檢索的過(guò)程就是文獻(xiàn)特征標(biāo)識(shí)與檢索提問(wèn)標(biāo)識(shí)兩者匹配的過(guò)程為了實(shí)現(xiàn)這種匹配,標(biāo)引人員和檢索人員必須采用一種共同的語(yǔ)言,即檢索語(yǔ)言。
三、信息檢索效率
信息檢索效率是研究信息檢索原理的核心,是評(píng)價(jià)一個(gè)檢索系統(tǒng)性能優(yōu)劣的質(zhì)量標(biāo)準(zhǔn),它始終貫穿信息檢索和信息存儲(chǔ)的全過(guò)程。衡量檢索效率的指標(biāo)有查全率、查準(zhǔn)率、漏檢率、誤檢率、響應(yīng)時(shí)間等。目前,人們通常主要以查全率和查準(zhǔn)率這兩個(gè)指標(biāo)來(lái)衡量。
1、查全率利用檢索系統(tǒng)進(jìn)行某一課題檢索時(shí),檢索出的相關(guān)信息量(w)與該系統(tǒng)信息庫(kù)中存儲(chǔ)的相關(guān)信息量(x)的比率稱為查全率(R),用公式可表示為:
R=×100%2、查準(zhǔn)率利用檢索系統(tǒng)進(jìn)行某一課題檢索時(shí),檢出的相關(guān)信息量(w)與檢出的信息總量(m)的比率稱為查準(zhǔn)率(p),用公式可表示為:
p=×100%
從檢索要求來(lái)說(shuō),希望查全率和查準(zhǔn)率都同時(shí)達(dá)到100%,即系統(tǒng)中存儲(chǔ)的所有相關(guān)信息都被檢索出(w=x=m),這是最為理想的效果。但事實(shí)上很難達(dá)到全部檢出和全部檢準(zhǔn)的要求,而只能達(dá)到某個(gè)百分比,總會(huì)出現(xiàn)一些漏檢和誤檢。因此,在實(shí)際檢索過(guò)程中,必須同時(shí)兼顧查全和查準(zhǔn),不可片面追求某一方面。
四、信息檢索的類型與特點(diǎn)
1.根據(jù)檢索的目的和對(duì)象不同,信息檢索分:文獻(xiàn)檢索(書目信息和全文信息檢索)事實(shí)檢索數(shù)值檢索主要區(qū)別在于:數(shù)據(jù)檢索和事實(shí)檢索是要檢索出包含在文獻(xiàn)中的信息本身,而文獻(xiàn)檢索則檢索出包含所需要信息的文獻(xiàn)即可。
1)書目信息檢索
以標(biāo)題、作者、摘要、來(lái)源出處、專利號(hào)、收藏處所等為檢索的目的和對(duì)象,檢索的結(jié)果是與課題相關(guān)的一系列書目信息線索.
書目信息檢索是一種相關(guān)性檢索。
2)全文信息檢索
以論文或?qū)@f(shuō)明書等的全文為檢索的目的和對(duì)象,檢索的結(jié)果是與課題相關(guān)的論文或?qū)@f(shuō)明書的全部文本,檢索結(jié)果也不直接解答用戶提出的技術(shù)問(wèn)題本身。因此,全文信息檢索也是一種相關(guān)性檢索
3)數(shù)據(jù)信息檢索
以具有數(shù)量性質(zhì),并以數(shù)值形式表示的數(shù)據(jù)為檢索的目的和對(duì)象,檢索的結(jié)果是經(jīng)測(cè)試、評(píng)價(jià)過(guò)的各種數(shù)據(jù),可直接用于比較分析或定量分析。因此,數(shù)據(jù)信息檢索是一種確定性檢索。
4)事實(shí)信息檢索
以事項(xiàng)為檢索的目的和對(duì)象,檢索的結(jié)果是有關(guān)某一事物的具體答案。因此,事實(shí)信息檢索是一種確定性檢索。
相關(guān)性檢索以圖書、期刊、資料、數(shù)據(jù)庫(kù)中的篇章或全文為檢索對(duì)象的一種檢索檢索結(jié)果為文獻(xiàn)線索(包括題名、著者、出處)或全文以二次文獻(xiàn)(檢索刊物或數(shù)據(jù)庫(kù))或全文數(shù)據(jù)庫(kù)為檢索工具
確定性檢索根據(jù)檢索對(duì)象不同又可分為
事實(shí)檢索
數(shù)據(jù)檢索檢索結(jié)果為某一個(gè)具體的答案以三次文獻(xiàn)(參考工具書)為檢索2.按處理信息的手段劃分1)手工檢索,簡(jiǎn)稱手檢,主要是應(yīng)用傳統(tǒng)的檢索工具和手工檢索方法。檢索源包括各種印刷型或縮微型的檢索書刊及參考工具書。2)計(jì)算機(jī)檢索,簡(jiǎn)稱機(jī)檢,是利用計(jì)算機(jī)及各種輔助設(shè)備從計(jì)算機(jī)檢索源中查找所需信息。有聯(lián)機(jī)檢索、光盤檢索、網(wǎng)絡(luò)檢索。
第二節(jié)信息檢索系統(tǒng)
一、信息檢索系統(tǒng)概念信息檢索系統(tǒng)是用來(lái)存儲(chǔ)、報(bào)道、查找文獻(xiàn)的工具。也稱檢索工具。它具有存儲(chǔ)和檢索的功能。四個(gè)基本條件:(1)能夠詳細(xì)著錄文獻(xiàn)的外部特征和內(nèi)容特征(2)具有即定的檢索標(biāo)識(shí)(3)全部文獻(xiàn)必須根據(jù)標(biāo)識(shí),系統(tǒng)科學(xué)地排列成為一個(gè)有機(jī)的整體(4)能夠提供多種檢索途經(jīng)
二、檢索系統(tǒng)的基本類型1.按收錄范圍劃分:綜合性檢索系統(tǒng)
綜合性檢索系統(tǒng)收錄范圍和涉及學(xué)科廣,信息類型和語(yǔ)種多,是科研工作最常用的檢索系統(tǒng)。世界著名的綜合性檢索系統(tǒng)有美國(guó)的《工程索引》、《科學(xué)引文索引》、英國(guó)的《科學(xué)文摘》等。
專業(yè)性檢索系統(tǒng)
專業(yè)性檢索系統(tǒng)的收錄范圍限于某一學(xué)科領(lǐng)域,適應(yīng)于檢索專業(yè)信息。例如,《中國(guó)石油文摘》、《英國(guó)化學(xué)化工文摘》等都是專業(yè)性檢索系統(tǒng)。
單一性檢索系統(tǒng)單一性檢索系統(tǒng)只限于收錄某一種特定類型文獻(xiàn),學(xué)科范圍可寬可窄。檢索特定類型信息,檢索效果往往比綜合性、專業(yè)性檢索系統(tǒng)好。單一性檢索系統(tǒng)包括專利索引、科技報(bào)告文摘、學(xué)位論文索引、會(huì)議文摘、標(biāo)準(zhǔn)目錄等。
網(wǎng)絡(luò)檢索系統(tǒng)是將若干計(jì)算機(jī)檢索系統(tǒng)用通信線路聯(lián)結(jié)以實(shí)現(xiàn)資源共享的有機(jī)體,是現(xiàn)代通信技術(shù)、網(wǎng)絡(luò)技術(shù)和計(jì)算機(jī)技術(shù)結(jié)合并高度發(fā)展的產(chǎn)物,它使各大型計(jì)算機(jī)信息系統(tǒng)變成網(wǎng)絡(luò)中的一個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)又可聯(lián)結(jié)很多終端設(shè)備,依靠通信線路把每個(gè)節(jié)點(diǎn)聯(lián)結(jié)起來(lái),形成縱橫交錯(cuò)、相互利用的信息檢索網(wǎng)絡(luò)。
2.按存儲(chǔ)內(nèi)容劃分目錄型題錄型文摘型全文型索引、參考工具書、搜索引擎
目錄型目錄型檢索工具是以整本圖書或期刊的外部特征為報(bào)道對(duì)象。報(bào)道內(nèi)容:圖書:書名/著者//出版地:出版者,出版時(shí)間期刊:刊名/編著出版地:出版者,創(chuàng)刊年
題錄型
題錄型檢索工具是以書刊中的某篇文獻(xiàn)(或章節(jié))的外部特征為報(bào)道對(duì)象報(bào)道內(nèi)容:文獻(xiàn)篇名/著者//刊名出版年、月(卷、期)、頁(yè)碼文摘型
報(bào)道對(duì)象與題錄相同,但對(duì)文獻(xiàn)內(nèi)容揭示的程度較題錄更深入更具體,增加了文獻(xiàn)的摘要文摘按其內(nèi)容特征可分:指示性文摘、報(bào)道性文摘、指示—報(bào)道性文摘
例:文摘型【題名】中國(guó)淡水蟶(chēng)的形態(tài)學(xué)研究【作者】饒小珍陳寅山
【機(jī)構(gòu)】福建師范大學(xué)生物工程學(xué)院
【刊名】福建師范大學(xué)學(xué)報(bào).1998,14(4).-71-75,102
【ISSN號(hào)】1000-5277
【CN號(hào)】CN35-1074
【關(guān)鍵詞】中國(guó)淡水蟶形態(tài)學(xué)淡水蟶蟶科【分類號(hào)】Q959.194
【文摘】報(bào)道了以解剖法對(duì)中國(guó)淡水蟶外部形態(tài)和內(nèi)部結(jié)構(gòu)研究的結(jié)果。并與蟶科的縊蟶和刀蟶科的尖刀蟶的形態(tài)進(jìn)行了比較索引、參考工具書等索引:揭示具有重要檢索意義的內(nèi)容特征標(biāo)識(shí)或外部特征標(biāo)識(shí),按照一定順序排列,并注明文獻(xiàn)條目線索的檢索工具。
參考工具書:是分析和著錄大量具體常用的科學(xué)數(shù)據(jù)與事實(shí),以備查找使用的各種常用工具書的總稱。搜索引擎:通過(guò)網(wǎng)絡(luò)機(jī)器人建立網(wǎng)絡(luò)數(shù)據(jù)庫(kù)全文型報(bào)道對(duì)象與題錄相同,但增加了文獻(xiàn)的全文按載體不同:
全文數(shù)據(jù)庫(kù)(中文、外文)期刊等印刷型3.按物質(zhì)形態(tài)劃分
印刷型檢索系統(tǒng)它是將科技文獻(xiàn)的各種特征按照一定的規(guī)則和格式,記錄在書上的檢索系統(tǒng)。電子型檢索系統(tǒng)它是經(jīng)數(shù)字存儲(chǔ)技術(shù)為基礎(chǔ)出版的檢索系統(tǒng),目前主要包括光盤檢索系統(tǒng)、學(xué)術(shù)資源數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)檢索系統(tǒng)等。其他類型的檢索系統(tǒng)包括卡片式檢索系統(tǒng)、縮微式檢索系統(tǒng)等三、檢索系統(tǒng)的結(jié)構(gòu)組成:1.編輯使用說(shuō)明
2.目次表
3.正文部分
4.索引
5.附錄第三節(jié)
信息檢索語(yǔ)言
檢索語(yǔ)言是一種人工語(yǔ)言,用于各種檢索工具的編制和使用,并為檢索系統(tǒng)提供統(tǒng)一的、作為基準(zhǔn)的、用于信息交流的符號(hào)化或語(yǔ)詞化的專用語(yǔ)言。它是連接存儲(chǔ)和檢索兩個(gè)過(guò)程的橋梁,也是連接標(biāo)引者和檢索者的橋梁,
檢索語(yǔ)言的結(jié)構(gòu)一、描述文獻(xiàn)的外表特征(書刊篇名——題目索引,著作姓名——著作索引,文獻(xiàn)序號(hào)--序號(hào)索引,引用文獻(xiàn)--引文索引)二、描述文獻(xiàn)內(nèi)容特征1、體系分類語(yǔ)言——分類索引2、主題語(yǔ)言(標(biāo)題詞——標(biāo)題詞索引。單元詞——單元詞索引,關(guān)鍵詞——關(guān)鍵詞索引,敘詞——敘詞索引)3、代碼語(yǔ)言(分子式等——分子式索引等各種專用索引,結(jié)構(gòu)式——結(jié)構(gòu)式索引)檢索語(yǔ)言按表述信息內(nèi)容特征劃分:分類語(yǔ)言和主題語(yǔ)言。分類語(yǔ)言包括體系分類語(yǔ)言、組配分類語(yǔ)言和混合分類語(yǔ)言。主題語(yǔ)言包括標(biāo)題詞語(yǔ)言、單元詞語(yǔ)言、敘詞語(yǔ)言和關(guān)鍵詞語(yǔ)言。在信息的標(biāo)引存儲(chǔ)和檢索應(yīng)用過(guò)程中,目前應(yīng)用得最廣的是體系分類語(yǔ)言和關(guān)鍵詞語(yǔ)言。一.
分類檢索語(yǔ)言用分類號(hào)表達(dá)各種概念,將各種概念按學(xué)科性質(zhì)進(jìn)行分類和系統(tǒng)排列。體系分類語(yǔ)言以《中圖法》為例《中圖法》:以拉丁字母與阿拉伯?dāng)?shù)字相結(jié)合的混合制號(hào)碼作為類目的分類號(hào),將人類的文獻(xiàn)分為五個(gè)基本部類,22個(gè)基本大類?!吨袌D法》組成《中圖法》是一部大型綜合性圖書分類法,有以下五部分組成:
五大部類
二十二個(gè)基本大類
簡(jiǎn)表
詳表
復(fù)分表
《中圖法》基本部類和基本大類表基本部類基本大類1、馬克思主義、列寧主義、毛澤東思想A.馬克思主義、列寧主義、毛澤東思想、鄧小平理論2、哲學(xué)B.哲學(xué)、宗教3、社會(huì)科學(xué)C.社會(huì)科學(xué)總論D.政治、法律E.軍事F.經(jīng)濟(jì)G.文化、科學(xué)、教育、體育H.語(yǔ)言I.文學(xué)J.藝術(shù)K.歷史、地理4、自然科學(xué)N.自然科學(xué)總論0.數(shù)理科學(xué)和化學(xué)P.天文學(xué)、地球科學(xué)Q.生物科學(xué)R.醫(yī)藥、衛(wèi)生S.農(nóng)業(yè)科學(xué)T.工業(yè)技術(shù)U.交通運(yùn)輸V.航空、航天X.環(huán)境科學(xué)、安全科學(xué)5、綜合性圖書Z.綜合性圖書T工業(yè)技術(shù)
TB一般工業(yè)技術(shù)TD礦業(yè)工程TE石油、天然氣工業(yè)TF冶金工業(yè)TG金屬學(xué)與金屬工藝TH機(jī)械、儀表工業(yè)TJ武器工業(yè)TL原子能技術(shù)TK能源與動(dòng)力工程TM電工技術(shù)TN無(wú)線電電子學(xué)、電信技術(shù)TP自動(dòng)化技術(shù)、計(jì)算機(jī)技術(shù)TQ化學(xué)工業(yè)TS輕工業(yè)、手工業(yè)TU建筑科學(xué)TV水利工程簡(jiǎn)表舉例B哲學(xué)、宗教一級(jí)類目B0哲學(xué)理論二級(jí)類目B1世界哲學(xué)二級(jí)類目B2中國(guó)哲學(xué)二級(jí)類目B21古代哲學(xué)三級(jí)類目B22先秦哲學(xué)三級(jí)類目詳表舉例分類號(hào)類目名稱級(jí)次F經(jīng)濟(jì)一級(jí)F7貿(mào)易經(jīng)濟(jì)二級(jí)F71國(guó)內(nèi)貿(mào)易經(jīng)濟(jì)三級(jí)F713商品流通與市場(chǎng)四級(jí)F713.8廣告五級(jí)F713.80廣告理論與方法論六級(jí)復(fù)分表又稱輔助表,附表。是由共同性的子目構(gòu)成,單獨(dú)編制,供有關(guān)類目進(jìn)一步區(qū)分時(shí)共同使用的表。總論復(fù)分表、世界地區(qū)復(fù)分表、中國(guó)地區(qū)表、國(guó)際時(shí)代表、中國(guó)時(shí)代表、世界種族與民族表、中國(guó)民族表、通用時(shí)間、地點(diǎn)表索書號(hào)的組成圖書分類:是圖書分類人員依據(jù)一定標(biāo)準(zhǔn),對(duì)入館圖書進(jìn)行分析、辯別、歸類,結(jié)合本館特色,給每一種文獻(xiàn)一個(gè)索書號(hào)的過(guò)程。索書號(hào)由分類號(hào)+種次號(hào)圖書分類的作用:利于組織分類排架、編排分類目錄、進(jìn)行分類統(tǒng)計(jì)館藏圖書
圖書的分類與排架
C53/126=2:4或C53126=2:4C53:分類號(hào)126:種次號(hào)=2:第二版4:第四輯(叢書)不同類別的圖書按字母順序排列同一類別的圖書按數(shù)字順序排列例如:A561/3、B848/64、C53/12F270/79、F270.4/5、F272.3/67圖書分類排架實(shí)例I242.4I246.5I247.5I712.45213158185第1組TQ2R22K81O13Q956103557第2組圖書分類排架實(shí)H32H33H34H31H3182151818=2第3組TP393.08TP393.08TP393.089807818
第4組高級(jí)查詢?cè)陬}名、著者、叢書名、主題詞、出版社、ISBN(書)、ISSN(刊)、索取號(hào)、起始年代中填入自己確定的內(nèi)容,其余的可以不填寫,然后進(jìn)行檢索。結(jié)果可檢索到所需文獻(xiàn)的題名、著者、出版信息、索取號(hào)查看選中圖書的相關(guān)信息二.
主題檢索語(yǔ)言標(biāo)題詞:經(jīng)規(guī)范化處理的詞或詞組,先組式語(yǔ)言,它是以標(biāo)題作為文獻(xiàn)內(nèi)容表示和檢索依據(jù)的一種主題語(yǔ)言,描述文獻(xiàn)內(nèi)容特征的詞和詞組。
敘詞:經(jīng)規(guī)范化處理的詞或詞組,后組式語(yǔ)言,可自由靈活組配,它是以敘詞作為文獻(xiàn)內(nèi)容表示和檢索依據(jù)的一種主題語(yǔ)言,用以表達(dá)文獻(xiàn)基本內(nèi)容的概念單元。
關(guān)鍵詞:未經(jīng)規(guī)范化處理,直接從文獻(xiàn)題名、原文或文摘中選取的能反映原文主題內(nèi)容的自由詞匯。單元詞:是從文獻(xiàn)正文、摘要或題目中抽取出來(lái)的最基本、其概念不可再分的詞,它是以單元詞作為文獻(xiàn)內(nèi)容標(biāo)識(shí)和檢索依據(jù)的一種主題語(yǔ)言。關(guān)鍵詞語(yǔ)言作為信息存儲(chǔ)和檢索依據(jù)的一種檢索語(yǔ)言。運(yùn)用關(guān)鍵詞語(yǔ)言編制的關(guān)鍵詞索引,其關(guān)鍵詞按字順排列構(gòu)成索引款目,所抽選的關(guān)鍵詞都可以作為標(biāo)引詞在索引中進(jìn)行輪排,作為檢索“入口詞”進(jìn)行檢索。但是,關(guān)鍵詞索引不顯示詞間關(guān)系,不能進(jìn)行縮檢和擴(kuò)檢,對(duì)提高檢索效率有一定的限制。關(guān)鍵詞表達(dá)事物、概念直接、準(zhǔn)確,不受詞表控制,能及時(shí)反映新事物、新概念。目前,關(guān)鍵詞語(yǔ)言已被廣泛地應(yīng)用于手工檢索和計(jì)算機(jī)檢索系統(tǒng)來(lái)編制索引,關(guān)鍵詞索引的主要類型有題內(nèi)關(guān)鍵詞索引、題外關(guān)鍵詞索引、雙重關(guān)鍵詞索引等。如美國(guó)《化學(xué)題錄》(CT)中的“題內(nèi)關(guān)鍵詞索引”,《化學(xué)文摘》(CA)中的“關(guān)鍵詞索引”,就是其主要代表。第三章信息檢索方法、途徑和步驟一、檢索方法檢索方法是為實(shí)現(xiàn)檢索計(jì)劃或方案,而采取的具體操作方法或手段的總稱。信息檢索的方法主要有以下幾種:1.常規(guī)法(檢索工具法)
(1)順查法:以課題研究的起始年代為起點(diǎn),由遠(yuǎn)而近按時(shí)間順序逐年查找的方法(2)倒查法:由近而遠(yuǎn)按時(shí)間順序逐年查找的方法(3)抽查法:針對(duì)學(xué)科發(fā)展的高峰期,選取一定時(shí)間段進(jìn)行查找的方法2.追溯法是指利用已知文獻(xiàn)后所附的參考文獻(xiàn)入手,逐一追查原文,再?gòu)拇嗽暮笏降膮⒖嘉墨I(xiàn)逐一查找下去,直到獲得滿意的結(jié)果。3.分段法又稱循環(huán)法、交替法、綜合法。即利用檢索工具法和追溯法交替使用的一種方法。4.瀏覽法指直接在一次文獻(xiàn)中查找所需的文獻(xiàn),也稱直接檢索法。該方法帶有盲目性,一般只作為對(duì)上述各種檢索方法的補(bǔ)充,主要用于查找新近發(fā)表的文獻(xiàn)。二、檢索途徑1.分類途徑2.主題途徑3.著者途徑4.其它途徑1.分類途徑是從學(xué)科分類角度來(lái)查找文獻(xiàn)的一種途徑。利用目次表或目錄來(lái)查找。檢索文獻(xiàn)的關(guān)鍵:分析課題,確定課題所屬的類目與檢索工具目次表中的類目相匹配,才能查準(zhǔn)。特點(diǎn):族性檢索
(適合從學(xué)科體系出發(fā)泛指性比較強(qiáng)的課題的檢索,但不適合專指度高的課題以及新興學(xué)科、交叉學(xué)科、邊緣學(xué)科的課題的檢索)2.主題途徑從文獻(xiàn)主題內(nèi)容角度來(lái)檢索文獻(xiàn)的一種途徑。利用檢索工具后所附的主題索引,以主題詞作為檢索入口。檢索文獻(xiàn)的關(guān)鍵:分析課題,選準(zhǔn)主題詞,并了解主題索引的結(jié)構(gòu)和編排。特點(diǎn):特性檢索(適合比較具體專深的課題以及新興學(xué)科、交叉學(xué)科、邊緣學(xué)科的課題的檢索)3.著者途徑在已知著者姓名的情況下,利用著者索引作為工具檢索文獻(xiàn)的途徑。一般著者索引(個(gè)人或團(tuán)體)均按著者姓的字母順序編排,姓在前,名在后,姓用全稱,名用縮寫。4.其它途徑分子式途徑序號(hào)途徑文獻(xiàn)題名途徑三、檢索步驟信息檢索過(guò)程是一種邏輯推理的過(guò)程,全過(guò)程分以下幾個(gè)步驟:文獻(xiàn)檢索的具體步驟和方法確定檢索工具檢索匹配制定檢索策略選擇檢索途徑檢索結(jié)果用戶評(píng)價(jià)選擇檢索手段信息需求信息分析用戶檢索輸出不滿意滿意分析研究課題,明確檢索要求
1、分析課題的實(shí)質(zhì)內(nèi)容以及所涉及的學(xué)科范圍及相互關(guān)系,抽出主題概念,確定邏輯組配2、明確需要的文獻(xiàn)種類、語(yǔ)種、年代以及文獻(xiàn)量。3、明確檢索的側(cè)重點(diǎn):對(duì)查新、查準(zhǔn)、查全的指標(biāo)要求。查找文獻(xiàn)線索1、做好檢索記錄2、文獻(xiàn)類型的識(shí)別確定檢索策略1、選擇檢索工具:內(nèi)容、專業(yè)性、技術(shù)手段、更新、性價(jià)比等2、確定檢索途經(jīng)3、優(yōu)選檢索方法4、制定、調(diào)整檢索策略索取原始文獻(xiàn)信息1、掌握兩種還原法:縮寫與全稱轉(zhuǎn)換、非拉丁語(yǔ)系出版物名稱還原2、向著者索取原始文獻(xiàn)3、利用館藏目錄、公共查詢系統(tǒng)、聯(lián)合目錄獲取原始文獻(xiàn)4、利用網(wǎng)上全文數(shù)據(jù)庫(kù)獲取原始文獻(xiàn)5、利用網(wǎng)上全文傳遞服務(wù)檢索原始文獻(xiàn)6、利用網(wǎng)上出版社、雜志7、利用文摘數(shù)據(jù)庫(kù)的原文服務(wù)檢索結(jié)果評(píng)價(jià)1、提高查全率和查準(zhǔn)率2、降低漏檢率和誤檢率檢索時(shí)常見(jiàn)問(wèn)題分析
造成誤檢或漏檢的原因:1)課題分析不透;“學(xué)科歸屬”不清。2)“語(yǔ)言”不通。3)主題概念不是大了,就是小了。4)“同義詞庫(kù)”不全5)核心詞太多6)選擇的檢索工具專業(yè)性不夠。E-journalorsearchengine?
1)課題分析不透;“學(xué)科歸屬”不清對(duì)課題的真正含義和學(xué)科歸屬不清楚,會(huì)造成最大的失誤。如果沒(méi)有認(rèn)真分析課題的真正含義和學(xué)科歸屬,就匆匆著手檢索,往往會(huì)欲速不達(dá),或多走彎路,甚至導(dǎo)致失敗。2)“語(yǔ)言”不通基于計(jì)算機(jī)的文獻(xiàn)檢索的特點(diǎn)與其說(shuō)是人機(jī)對(duì)話,不如說(shuō)是標(biāo)引人員與檢索人員的對(duì)話,只有標(biāo)引人員與檢索人員所表達(dá)的“語(yǔ)言”一致,才能順利實(shí)現(xiàn)文獻(xiàn)檢索。往往檢索工具使用的是標(biāo)引語(yǔ)言,而檢索者使用的多數(shù)是自由詞,未經(jīng)規(guī)范化,這樣在表達(dá)方式上有差異,造成了檢索障礙。3)主題概念不是大了,就是小了檢索者不知道如何正確定位課題的主題概念,往往會(huì)不是大了,就是小了,初學(xué)者更容易把概念偏大。主題概念的范疇太大造成大量沒(méi)用的文獻(xiàn)被誤檢,太小造成重要的的文獻(xiàn)被漏檢。4)“同義詞庫(kù)”不全往往同一件事情或事物,不同作者喜歡用不同的詞來(lái)表達(dá),這就造成了龐大的同義詞庫(kù),如果偏偏你頭腦中的“同義詞庫(kù)”不是那么全,造成漏見(jiàn)就不足為怪了。例:艾滋病——艾滋病、愛(ài)滋病碳纖維——碳纖維、炭纖維設(shè)備——apparatus,equipment,device……汽車——car,automobile,vehicle……5)核心詞太多對(duì)于由A、B、C、D、E多個(gè)主題組合的多主題概念課題,如果將所有主題混在一起同時(shí)組配,會(huì)造成“零結(jié)果”現(xiàn)象。因?yàn)?,只要A、B、C、D、E其中之一的檢索結(jié)果為零,則經(jīng)過(guò)布爾邏輯“和”的運(yùn)算,檢索結(jié)果=A*B*C*D*E=0。6)選擇的檢索工具專業(yè)性不夠E-journals:中文:中國(guó)期刊網(wǎng)、萬(wàn)方數(shù)據(jù)庫(kù)系統(tǒng)、維普…….英文:Elsevier……Searchengine:
北大天網(wǎng),百度,
GooGle,Yahoo!Openfind,…….
解決上述問(wèn)題的方法1、掌握文獻(xiàn)和文獻(xiàn)檢索的基本知識(shí)2、熟悉各種文獻(xiàn)信息的分布3、掌握文獻(xiàn)檢索的基本技巧:檢索算符、檢索語(yǔ)法、常用搜索引擎和數(shù)據(jù)庫(kù)的特殊技巧4、不斷實(shí)踐、不斷歸納總結(jié)
如何提高查全率?選擇上位詞和相關(guān)詞;如:查找關(guān)于孫中山的文獻(xiàn),先用孫中山查,再用孫文、國(guó)父查找。調(diào)節(jié)檢索式的網(wǎng)羅度,刪除不必要的組面,如and(并且);進(jìn)行族性檢索(分類檢索或用or連接相關(guān)檢索詞);截詞檢索;com*代替computer增加檢索途徑。如何提高查準(zhǔn)率?提高專指度(用下位詞或換專指性強(qiáng)的自由詞)
用邏輯乘“*”(and)或not相關(guān)檢索項(xiàng);如查找克林頓,但不要關(guān)于萊溫斯基的信息。檢索式:克林頓not萊溫斯基用文獻(xiàn)外部特征限制輸出結(jié)果(在中文圖書中查找);
用“二次檢索”“條件檢索”排除誤檢
限制檢索字段,指定鄰接和優(yōu)先關(guān)系。
第四章實(shí)體圖書館利用一.圖書的分類及索書號(hào)二.各書庫(kù)的分布及館藏內(nèi)容三.借閱規(guī)則四.網(wǎng)上借還查詢及公共檢索機(jī)的利用第五章網(wǎng)絡(luò)信息資源檢索網(wǎng)絡(luò)信息資源基本知識(shí)點(diǎn):
☆概念和發(fā)展歷程
☆基本技術(shù)☆
常用網(wǎng)絡(luò)搜索引擎的原理和使用技巧一、網(wǎng)絡(luò)信息資源檢索:
是利用計(jì)算機(jī)通過(guò)網(wǎng)絡(luò)來(lái)查找、利用和獲取各種信息資源。包括圖書館的公共書目(OPAC--OnlinePublicAccessCatalogue)、各種聯(lián)機(jī)數(shù)據(jù)庫(kù)、Internet上的信息資源等。
網(wǎng)絡(luò)信息資資源檢索的發(fā)展歷程
脫機(jī)檢索
聯(lián)機(jī)檢索
國(guó)際聯(lián)機(jī)檢索
單機(jī)光盤檢索光盤網(wǎng)絡(luò)檢索網(wǎng)絡(luò)信息資源檢索1.脫機(jī)檢索(50年代末~60年代中期
)是計(jì)算機(jī)檢索的原始時(shí)期。只能進(jìn)行簡(jiǎn)單的檢索。為滿足專業(yè)檢索人員定期批量處理用戶的情報(bào)要求。用戶不能立刻獲得檢索結(jié)果。2.聯(lián)機(jī)檢索(60年代末~70年代初)1963年-1964年間,美國(guó)洛克希德導(dǎo)彈與宇航公司的情報(bào)實(shí)驗(yàn)室建立了”人-機(jī)“對(duì)話的聯(lián)機(jī)情報(bào)檢索系統(tǒng)(DIALOG的前身)
用戶可隨時(shí)瀏覽檢索結(jié)果由于這個(gè)階段的計(jì)算機(jī)網(wǎng)絡(luò)主要是通過(guò)電話線聯(lián)接,因而聯(lián)機(jī)檢索受到地區(qū)的限制3.國(guó)際聯(lián)機(jī)檢索(70年代中期-)衛(wèi)星通訊技術(shù)的出現(xiàn),使得聯(lián)機(jī)檢索系統(tǒng)打破了地域限制。而數(shù)據(jù)庫(kù)生產(chǎn)的迅速發(fā)展及微機(jī)大量的涌現(xiàn),更使得國(guó)際聯(lián)機(jī)檢索蓬勃發(fā)展。聯(lián)機(jī)檢索系統(tǒng)進(jìn)入發(fā)展的黃金時(shí)期。實(shí)現(xiàn)了人類情報(bào)資源的共享。4.單機(jī)光盤檢索(80年代--)CD-ROM技術(shù)促使計(jì)算機(jī)檢索成本迅速下降
(一張光盤可存貯600〔MB〕兆字節(jié)機(jī)讀數(shù)據(jù)、成本價(jià)格便宜,而一張DVD光盤的容量最少可達(dá)4.7G)5.光盤網(wǎng)絡(luò)檢索(90年代-)
光盤網(wǎng)絡(luò)是一種計(jì)算機(jī)網(wǎng)絡(luò),如圖書館局域網(wǎng)實(shí)現(xiàn)多用戶光盤資源共享6.網(wǎng)絡(luò)信息資源檢索(90年代末-)
進(jìn)入90年代后,隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,尤其是互聯(lián)網(wǎng)的迅猛發(fā)展,使計(jì)算機(jī)檢索進(jìn)入一個(gè)嶄新的時(shí)期。檢索方法更簡(jiǎn)單,檢索結(jié)果更全面網(wǎng)絡(luò)信息資源檢索的特點(diǎn)檢索速度快檢索途徑多更新快資源共享檢索更方便靈活檢索結(jié)果可以直接輸出二、網(wǎng)絡(luò)信息檢索系統(tǒng)的構(gòu)成從物理構(gòu)成來(lái)說(shuō),包括計(jì)算機(jī)硬件、軟件和網(wǎng)絡(luò)數(shù)據(jù)庫(kù)、通訊網(wǎng)絡(luò)和檢索終端五部分?jǐn)?shù)據(jù)庫(kù)的結(jié)構(gòu)文檔(file):數(shù)據(jù)庫(kù)中一部分記錄的有序集合記錄(record):數(shù)據(jù)庫(kù)的信息單元,每條記錄描述了一個(gè)原始信息的外部特征和內(nèi)部特征。字段(field):比記錄更小的單位,是組成記錄的數(shù)據(jù)項(xiàng)目
三、網(wǎng)絡(luò)信息資源的類型1.參考數(shù)據(jù)庫(kù)(database):為用戶提供線索的數(shù)據(jù)庫(kù)包含各種數(shù)據(jù)、信息或知識(shí)的原始來(lái)源和屬性的數(shù)據(jù)庫(kù),主要包括書目數(shù)據(jù)庫(kù)、文摘數(shù)據(jù)庫(kù)、索引數(shù)據(jù)庫(kù)
2.全文數(shù)據(jù)庫(kù)(Fulltextdatabase)收錄有原始文獻(xiàn)全文的數(shù)據(jù)庫(kù),以期刊論文、會(huì)議論文、政府出版物、研究報(bào)告、法律條文和案例、商業(yè)信息為主
3.事實(shí)數(shù)據(jù)庫(kù)(Factualdatabase):
指包含大量數(shù)據(jù)、事實(shí),直接提供原始資料的數(shù)據(jù)庫(kù)。又分?jǐn)?shù)值數(shù)據(jù)庫(kù)(Numericdatabase)、指南數(shù)據(jù)庫(kù)(directorydatabase)、術(shù)語(yǔ)數(shù)據(jù)庫(kù)(terminologicaldatabase)等
4.電子圖書(electronicbooks)
指供在電腦上閱讀的一種新型的數(shù)字化書籍,是多媒體技術(shù)和超文本技術(shù)發(fā)展的產(chǎn)物。5.電子報(bào)紙(electronicnewspaper)紐約時(shí)報(bào)(Http://)華盛頓郵報(bào)(http://泰晤士報(bào)(Http://www.thetimes.co.uk)人民日?qǐng)?bào)(Http://)光明日?qǐng)?bào)(Http://)中國(guó)日?qǐng)?bào)(Http://)四、網(wǎng)絡(luò)信息資源檢索的基本技術(shù)
布爾邏輯檢索(booleanlogic)布爾邏輯檢索是通過(guò)布爾邏輯算符來(lái)實(shí)現(xiàn)的,這些運(yùn)算符能把一些具有簡(jiǎn)單概念的檢索詞(或檢索項(xiàng))組配成為一個(gè)具有復(fù)雜概念的檢索式,用以表達(dá)用戶的檢索要求計(jì)算機(jī)檢索式(邏輯表達(dá)式):檢索詞+有關(guān)算符
1、布爾邏輯算符
2、截詞算符
3、位置算符
4、字段限定符
邏輯運(yùn)算符有三種:
邏輯與(AND)邏輯或(OR)邏輯非(NOT)
邏輯與:AND
常用“*”“&”表示,檢索時(shí),命中信息同時(shí)含有兩個(gè)概念,專指性強(qiáng)。可以縮小檢索范圍,提高查準(zhǔn)率
邏輯或:
OR例如:colororcolour常用“+”、“/”表示,檢索時(shí),命中信息包含所有關(guān)于邏輯A或邏輯B或同時(shí)有A和B,可以擴(kuò)大檢索范圍,提高查全率。邏輯非:
NOT例如:humannotanimal常用“-”表示,命中信息包含邏輯A、不包含邏輯B或同時(shí)有A和B的,排除了不需要的檢索詞,可以排除不必要的信息,提高查準(zhǔn)率。優(yōu)先級(jí)運(yùn)算()>NOT>AND>OR截詞檢索
(truncation)—
截詞符
截詞是指將檢索詞在適當(dāng)?shù)牡胤浇財(cái)?,截詞檢索是用截?cái)嘣~的一個(gè)局部進(jìn)行的檢索,凡是滿足這個(gè)截詞所有字符(串)的記錄,系統(tǒng)都為命中。
按截詞的位置劃分前截?cái)啵河址Q左截?cái)?,截詞符在詞的左邊,例如:*magnetic中截?cái)啵航卦~符在詞的中間,例如:organi?ation,可以檢索organisationorganization后截?cái)啵菏乔胺揭恢聶z索,又稱右截?cái)?,截詞符放在被截詞的右邊,是最常用的檢索技術(shù),例如:librar*根據(jù)截?cái)嗟臄?shù)量不同
無(wú)限截?cái)啵翰幌拗票唤財(cái)嗟淖址麛?shù)量有限截?cái)啵合拗票唤財(cái)嗟淖址麛?shù)量,例如educat**,可以檢索educator、educated
*、?、&均可以表示截詞的截?cái)喾?hào),各檢索系統(tǒng)有不同的規(guī)定,沒(méi)有統(tǒng)一標(biāo)準(zhǔn)。詞位置檢索(positionaloperator)
—位置運(yùn)算符
利用布爾邏輯算符對(duì)檢索詞進(jìn)行邏輯組配時(shí),未限定檢索詞之間的位置關(guān)系,會(huì)影響某些課題的查準(zhǔn)率并容易造成誤檢。為了彌補(bǔ)其不足,一般檢索系統(tǒng)都提供文中自由詞檢索功能,也稱全文檢索功能
(Fulltextsearching)。
為了提高檢索的廣度和準(zhǔn)確度,常常需要對(duì)檢索詞之間的位置關(guān)系加以限定。下面介紹幾種數(shù)據(jù)庫(kù)經(jīng)常使用的位置運(yùn)算符:
1.W-With
W算符是With的縮寫,表示在此算符兩側(cè)的檢索詞必須按輸入時(shí)的前后順序排列,不能顛倒。所連接的詞之間除可以有一個(gè)空格、標(biāo)點(diǎn)或連接號(hào)外不得夾有任何其他單詞或字母。
例:intelligent(W)robot?(Ei
CompendexPlus)
Wn(或nW)表示在此算符兩側(cè)的檢索詞必須按輸入時(shí)的前后順序排列,不能顛倒。但允許在連接的兩個(gè)詞之間最多插入n個(gè)單元詞。
例:intelligentw1robot*(OCLCFirstSearch)
2.N–Near
N算符是Near的縮寫,表示此算符兩側(cè)的檢索詞必須緊密相連,所連接的詞之間不允許插入任何其他單詞或字母。但詞序可以顛倒。例:intelligentNEARrobot*(EiCPXWeb)
Nn(或nN)表示在兩個(gè)檢索詞之間最多可插入n個(gè)單詞,且兩詞的詞序任意。
例:intelligentN1robot*(OCLCFirstSearch)3.Adj-adjacency
鄰接算符,表示在此算符兩側(cè)的檢索詞必須按所列詞序排列,不能顛倒,兩詞之間不允許有其他的詞或字母。相當(dāng)于短語(yǔ)檢索。
4.F-Field
同字段鄰接例:
environment(F)protection
5.P-Paragraph
同自然段鄰接
例:
environment(P)protection
6.S-Sentence
同句鄰接詞序可以顛倒,兩詞必須出現(xiàn)在同一句子(子字段)中例:
environment(S)protection五、搜索引擎(searchengine)從1995年開(kāi)始,搜索引擎以一定的策略從網(wǎng)絡(luò)收集、發(fā)現(xiàn)信息,對(duì)信息進(jìn)行理解、提取、組織和處理,并為用戶提供檢索服務(wù),從而起到信息導(dǎo)航的目的。搜索引擎站---“網(wǎng)絡(luò)門戶”搜索引擎的工作原理
信息的收集處理信息的檢索輸出搜索引擎的分類目錄式搜索引擎:以人工或半自動(dòng)方式收集信息,按某種分類法進(jìn)行加工整理機(jī)器人搜索引擎:由一個(gè)稱為Spider的機(jī)器人程序以某種策略來(lái)…….
元搜索引擎
將用戶的查詢請(qǐng)求同時(shí)向多個(gè)搜索引擎遞交,將返回的信息進(jìn)行重復(fù)排除、重新排序等處理后,作為自己的結(jié)果返回用戶。常用的一些搜索引擎網(wǎng)址(一)
http://
雅虎是中國(guó)最著名的目錄索引,是搜索引擎開(kāi)山鼻祖之一。它收錄了全球資訊網(wǎng)上數(shù)以萬(wàn)計(jì)的中文網(wǎng)站,不論你要找的網(wǎng)站是用國(guó)標(biāo)碼簡(jiǎn)體字、大五碼繁體字還是圖形中文,都可以在這里找到
檢索途徑通過(guò)分類目錄、關(guān)鍵詞檢索檢索方法與技巧支持布爾邏輯檢索、可以使用引號(hào),強(qiáng)調(diào)“+”、“-”、指定關(guān)鍵字出現(xiàn)的段落常用的一些搜索引擎網(wǎng)址(二)http://
1998年創(chuàng)立,搜狐“分類與搜索”已收錄網(wǎng)站四十多萬(wàn),已形成龐大的中文網(wǎng)站數(shù)據(jù)庫(kù)。搜狐的目錄導(dǎo)航式搜索引擎完全是由人工加工而成,相比機(jī)器人加工
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 證券公司圍護(hù)樁施工合同
- 道路施工隊(duì)合作協(xié)議
- 農(nóng)村房屋拆遷補(bǔ)償合同
- 劇院排水設(shè)施安裝合同
- 培訓(xùn)零售環(huán)境防疫措施
- 醫(yī)療器械招投標(biāo)規(guī)范解讀
- 無(wú)抵押企業(yè)借款合同
- 通信設(shè)備質(zhì)量管理辦法
- 商業(yè)綜合體二手房交易合同范文
- 制造執(zhí)行系統(tǒng)操作與應(yīng)用課件 3-4-2典型離散制造工藝
- 天津市2024年七年級(jí)上學(xué)期數(shù)學(xué)期中考試試卷【附答案】
- 中國(guó)汽車剎車盤行業(yè)投資分析、市場(chǎng)運(yùn)行態(tài)勢(shì)研究報(bào)告-智研咨詢發(fā)布
- “雙減”政策下作業(yè)設(shè)計(jì)策略4篇
- 普外科重點(diǎn)專科評(píng)審工作匯報(bào)
- 2024-2025學(xué)年初中音樂(lè)九年級(jí)上冊(cè)湘藝版(2024)教學(xué)設(shè)計(jì)合集
- 2024-2025學(xué)年北師大版九年級(jí)數(shù)學(xué)上冊(cè)期中綜合復(fù)習(xí)題
- 第十五屆全國(guó)交通運(yùn)輸行業(yè)“百通科信杯”機(jī)動(dòng)車檢測(cè)工(學(xué)生組)理論知識(shí)題庫(kù)
- 培訓(xùn)學(xué)校與學(xué)生的合同(2篇)
- 小學(xué)高年級(jí)閱讀指導(dǎo)課教案(12篇)
- 2024-2030年中國(guó)EVOH(乙烯-乙烯醇共聚物)行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略分析報(bào)告
- 2024年國(guó)家公務(wù)員考試公共法律知識(shí)考試題庫(kù)及答案(共530題)
評(píng)論
0/150
提交評(píng)論