




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、文 獻 檢 索第九章:計算機檢索 第八章(參考工具書)內容回顧1.參考工具書的概念2.參考工具書的特點3.使用參考工具書的預備知識4.中國大百科全書5.手冊、指南、名錄、大全6.使用參考工具書的基本方法課堂作業(yè):1.計算機檢索系統(tǒng)的物理構成和邏輯構成分別是什么?2.計算機檢索方式有哪幾種?計算機檢索技術包括哪三個方面?課后作業(yè):1.我館有哪些數(shù)據(jù)庫分別可以用來檢索中外文期刊論文全文和數(shù)字化圖書?2.檢索2003年至今你所在系部教師發(fā)表的期刊論文1篇,作業(yè)要求:說明所用數(shù)據(jù)庫名稱、檢索途徑,摘錄篇名、作者姓名、刊名、年卷期 4項信息內容。3.查找一篇有關“大學生心理咨詢”方面的文獻,作業(yè)要求:說
2、明所用數(shù)據(jù)庫名稱、檢索途徑,摘錄篇名、作者姓名、刊名、年卷期 4項信息內容。一、 計算機檢索 指人們在計算機或計算機檢索網(wǎng)絡的終端機上,使用特定的檢索指令、檢索詞和檢索策略,從計算機檢索系統(tǒng)的數(shù)據(jù)庫中檢索出所需的信息,繼而再由終端設備顯示或打印的過程。產生的背景:隨著科技的發(fā)展,手工檢索的局限必性越來越大,計算機檢索能做到全面、準確、實時地獲得所需的信息。上一頁首頁下一頁1.發(fā)展史 世界上第一個計算機檢索系統(tǒng)是美國海軍軍械試驗中心于1954年利用IBM-701型計算機建立的科技文獻檢索系統(tǒng)。隨著計算機技術、通信技術和檢索技術的不斷發(fā)展,經歷了四個發(fā)展階段:批量檢索 50年代末至60年代中期 聯(lián)
3、機檢索時期 60年代末至80年代中期 光盤檢索 80年代中期 網(wǎng)絡檢索 進入90年代,操作平臺Windows化、數(shù)據(jù)庫鏈接超文本化和通信手段互聯(lián)網(wǎng)化已成為當前檢索技術發(fā)展的主要特征上一頁首頁下一頁2.計算機情報檢索系統(tǒng)檢索系統(tǒng)的物理構成硬件部分主計算機、外圍設備、數(shù)據(jù)處理或傳送相關設備軟件部分系統(tǒng)軟件應用軟件:數(shù)據(jù)庫管理系統(tǒng), 檢索程序,記帳統(tǒng)計程序等數(shù)據(jù)庫磁媒體數(shù)據(jù)庫、光盤數(shù)據(jù)庫、多媒體數(shù)據(jù)庫通信網(wǎng)絡檢索終端上一頁首頁下一頁檢索系統(tǒng)的邏輯構成信息檢索系統(tǒng)的邏輯構成主要是指它所包括的功能模塊或子系統(tǒng)及其相互關系。一個完整的信息檢索系統(tǒng),通常由以下幾個功能模塊組成:信息源選擇采集子系統(tǒng)(將各種信
4、息源電子化,為系統(tǒng)提供充足而適用的數(shù)據(jù)來源。)標引子系統(tǒng) (對信息自動賦予分類名稱、分類號和主題詞。 )建庫子系統(tǒng)(任務是建立和維護可直接用于計算機檢索的數(shù)據(jù)庫,包括:數(shù)據(jù)錄入、錯誤檢查與處理、數(shù)據(jù)格式轉換)詞表管理子系統(tǒng)(功能是管理維護系統(tǒng)中已有的主題詞表,使它與標引、建庫等子系統(tǒng)相連接)用戶接口子系統(tǒng)(承擔用戶與系統(tǒng)之間的通訊功能)提問處理子系統(tǒng)(負責處理用戶輸入的檢索詞或提問式,并將它們與數(shù)據(jù)庫中存貯的數(shù)據(jù)進行比較運算,然后把運算結果輸出給用戶。)上一頁首頁下一頁3.計算機信息檢索的方式命令式檢索菜單式檢索超文本檢索上一頁首頁下一頁4.計算機信息檢索原理計算機檢索的實質就是“匹配運算”,
5、即由檢索者把提問變成機器能識別的檢索策略輸入計算機中,由計算機自動對數(shù)據(jù)庫中各文檔的記錄進行掃描和匹配。上一頁首頁下一頁5.計算機檢索工具結構計算機檢索系統(tǒng)(機讀數(shù)據(jù)庫)由主文檔、倒排文檔和使用幫助三部分組成:主文檔:順排文檔相當于手工檢索系統(tǒng)的正文。是將數(shù)據(jù)庫的全部記錄按照記錄號的大小排列而成的文獻集合,它構成了數(shù)據(jù)庫的主體內容。但是順排文檔因為主題詞等特征標識的無序性,如果直接用于檢索,不實用。記錄號 主題詞1計算機,軟件,安全2軟件,網(wǎng)絡 3 網(wǎng)絡,安全,軟件上一頁首頁下一頁倒排文檔的記錄號,或者說按照文獻的屬性列出具有同一屬性的所有記錄,使用倒排文檔可以它把記錄中可檢索字段及其內容提取
6、出來,按其屬性值的某種順序再組織起來,成為可以用作索引的文檔。這種倒排文檔也稱為索引文檔。不同屬性字段組成不同的倒排檔。如對著者字段(著者索引)。 網(wǎng)絡 2,3 安全 1,3 軟件 1,2上一頁首頁下一頁記錄 是構成主文檔的基本信息單元,由若干字段組成,是計算機檢索系統(tǒng)存儲文獻款目和標引的信息載體。一個記錄相當于一篇完整的文獻;在書目數(shù)據(jù)庫中,一個記錄相當于一條文摘或題錄。比較典型的是COMPENDEX,INSPEC,美國專利數(shù)據(jù)庫的記錄。字段 字段是記錄的基本單元。它對應于文獻的各個著錄項目,包括:文摘字段、題名字段、著者字段、語種字段、主題詞字段等。序號篇名作者出版主題詞1主題詞21經貿文
7、獻信息檢索滕穎東南大學出版社經貿滕穎2科技文獻檢索二、計算機檢索技術 實現(xiàn)計算機信息檢索需要具備三方面的技術:根據(jù)檢索要求編制提問檢索式;制定切實可行的檢索策略;使用檢索指令實施檢索。 檢索提問式是計算機信息檢索中用來表達用戶檢索提問的邏輯表達式,由檢索詞和各種布爾邏輯算符、位置算符、截詞符和字段限制符等組成。1檢索詞檢索者根據(jù)檢索課題的要求所制定的用于檢索的詞,用得較多的是關鍵詞。2邏輯算符也稱布爾(Boolean)算符,用來表示兩個檢索詞之間的邏輯關系。常用的有3種:邏輯與(AND)、邏輯或(OR)、邏輯非(NOT)。如果有兩個檢索詞A和B,它們之間的邏輯關系由下表說明。上一頁首頁下一頁檢
8、索舉例:例1 中國學術期刊網(wǎng) 2000-2005 篇名途徑教學課件 303篇電子技術 626篇電子技術 and 教學課件 2篇電子技術 or 教學課件 927篇電子技術 not 教學課件 624篇例2 ASP數(shù)據(jù)庫 篇名途徑solar 6456 sun 1488energy 29100nuclear 14774solar * energy 430 ( solar energy 243)son + solar 7886energy-nuclear 287193.截詞符用“?”號表示截詞符號(一些系統(tǒng)中也有用“*”號等),加在檢索詞的詞干或不完整的詞形后(或中間),用以表達一組概念相關的檢索詞,做
9、到一“詞”多用,防止漏檢,從而達到較高的查全率。截詞的形式可以有前截斷、后截斷和中間截斷,主要包括下列情形:4位置算符1)(W)或()算符 W是with的縮寫,(W)表示其兩側的檢索詞之間不能有其它字母或詞,且順序不能顛倒,只可能有空格或一個標點符號。(W)可簡寫為()。 如:fixed(W)bed(固定床),命中的記錄中將有“fixed bed”或“fixed-bed”等形式。 second (w) world(w)war 2)(nW)算符表示算符兩側的檢索詞之間可以插入n個實詞或虛詞,但順序不能顛倒。(nW)中的n表示兩側的檢索詞中間允許插入的詞量少于或等于n個。 lube(W)oil(1
10、W)refining(潤滑油精制),命中的記錄中除了有“l(fā)ube oil refining”之外,還會有“l(fā)ube oil furfural refining”、“l(fā)ube oil phenol refining”、“l(fā)ube oil solvent refining”等形式。3)(N)算符N是near的縮寫,(N)表示其兩側的檢索詞之間不能插入其它字符或詞,但位置可以倒置, 如:information(N)retrieval(信息檢索),命中的記錄中會有“information retrieval”,不會有“retrieval of information”。4)(nN)算符表示算符兩側的檢
11、索詞之間可以插入n個單詞,且順序可以顛倒。(nN)中的n表示允許插詞的詞量少于或等于n個。如economic (2N) recovery 可以檢出economic recovery, recovery of the economic, recovery from economic5.檢索字段符為了使查找的文獻對某一方面進行選擇,在計算機檢索時可以對檢索詞進行字段限制,使檢索出的文獻達到一定的專指度。檢域限制可針對特定年代、特定類別、特定檢索點等作限制,包括前綴限制符和后綴限制符,對DIALOG系統(tǒng)而言,前綴限制符例如:AU= 限查特定作者JN= 限查特定刊名 LA= 限查特定語種PN= 限查特
12、定專利號PY= 限查特定年代使用字段檢索對檢出文獻的數(shù)量和相關程度有很大的影響。如“computer” Default 142941條 AB 58644條 TI 11691條三、常用的聯(lián)機檢索系統(tǒng) 現(xiàn)在的聯(lián)機檢索系統(tǒng)已改變了過去依靠專線與聯(lián)機檢索中心聯(lián)機的方式,研究者通過Web和Telnet網(wǎng)絡對聯(lián)機檢索系統(tǒng)的數(shù)據(jù)庫進行檢索。目前大型的國際聯(lián)機檢索系統(tǒng)有:Dialog系統(tǒng)、ORBIT系統(tǒng)、ESA-IRS系統(tǒng)、STN系統(tǒng)等。1)Dialog聯(lián)機檢索系統(tǒng)美國的Dialog聯(lián)機檢索系統(tǒng)是當今世界上最大的聯(lián)機檢索系統(tǒng),該系統(tǒng)從1972年起開始服務,到現(xiàn)在已有大約500個數(shù)據(jù)庫,3億篇以上的記錄,包含的
13、專業(yè)內容有社會科學、化學、物理、數(shù)學、醫(yī)學、材料科學、時事、建筑學、教育、經濟學、商業(yè)、公司、人文等。數(shù)據(jù)庫文獻類型有期刊、會議錄、圖書、學位論文、進展中的科技報告、政府文件、市場行情、統(tǒng)計數(shù)據(jù)等方面。2)ORBIT聯(lián)機檢索系統(tǒng)ORBIT(Online Retrieval of Bibliographic Information Timeshared)是美國系統(tǒng)發(fā)展公司(SDC)與美國國防部共同開發(fā)的世界上第二大聯(lián)機檢索系統(tǒng)。ORBIT提供科學、技術、專利、化學、能源、市場、公司、財政等方面的服務,收集了許多專業(yè)領域的信息源。目前ORBIT約有100個數(shù)據(jù)庫,20,000多臺終端,其中有20個
14、以上的數(shù)據(jù)庫和Dialog連通,占世界機存文獻量的25以上。該系統(tǒng)擁有若干個頗具特色的數(shù)據(jù)庫,近些年來,其服務策略有所改變,致力于提供一些其他檢索系統(tǒng)沒有的數(shù)據(jù)庫。3)ESA-IRS系統(tǒng)ESA(European Space Agency)是歐洲空間組織的簡稱, ESA-IRS系統(tǒng)已成為歐洲最大的聯(lián)機檢索中心,是僅次于Dialog和 ORBIT和聯(lián)機檢索系統(tǒng)。擁有可供聯(lián)機檢索的數(shù)據(jù)庫100多個,收錄文獻700多萬篇。特有的數(shù)據(jù)庫有:酸雨(Acid Rain)、冶金(BIIPAM)、遙感信息(LEDA)等。4)STN系統(tǒng) STN(The Scientifical and Technical Inf
15、ormation-Network)全稱為國際科技信息網(wǎng)絡。該系統(tǒng)打破了國際聯(lián)機檢索系統(tǒng)獨家創(chuàng)建和經營的常規(guī),由德國卡爾勞動保護魯厄能源、物理、數(shù)學專業(yè)情報中心、日本化學協(xié)會以及美國化學文摘社三空共同創(chuàng)建,并于1986年開始為用戶提供全面的信息檢索服務。該系統(tǒng)在歐、亞、北美設有三個服務中心,截止20世紀90年代初,三個中心已提供100多個數(shù)據(jù)庫,總計6000多萬條記錄,數(shù)據(jù)庫收錄的專業(yè)范圍包括:化學化工、數(shù)學、物理、能源、冶金、建筑、廠商產品信息以及專利等。四、計算機檢索策略的構造1. 分析檢索課題檢索人員在接到用戶的檢索課題時應首先分析研究課題,全面了解課題的內容以及用戶對檢索的各種要求,從而
16、有助于正確選擇檢索系統(tǒng)及數(shù)據(jù)庫,制定合理的檢索策略等。分析檢索課題時應從以下幾方面進行:(1)弄清信息需求的目的和意圖。(2)分析課題涉及的學科范圍、主題要求。(3)課題所需信息的類型,包括文獻類型、出版類型、年代范圍、語種、著者、機構等。(4)課題對查新、查準、查全的指標要求。 四、計算機檢索策略的構造2.選擇檢索系統(tǒng)和數(shù)據(jù)庫在全面分析檢索課題的基礎上,根據(jù)用戶要求得到的信息類型、時間范圍、課題檢索經費支持等因素綜合考慮后,選擇檢索系統(tǒng)和數(shù)據(jù)庫。正確選擇數(shù)據(jù)庫,是保證檢索成功的基礎。選擇數(shù)據(jù)庫時必須從以下幾個方面考慮:(1) 數(shù)據(jù)庫收錄的信息內容所涉及的學科范圍 ;(2) 數(shù)據(jù)庫收錄的文獻類
17、型、數(shù)量、時間范圍以及更新周期;(3) 數(shù)據(jù)庫所提供的檢索途徑、檢索功能和服務方式。 3.確定檢索詞及檢索途徑(1)先選用主題詞。當所選的數(shù)據(jù)庫具有規(guī)范化詞表時,應優(yōu)先選用該數(shù)據(jù)庫詞表中與檢索課題相關的規(guī)范化主題詞,從而可獲得最佳的檢索效果。(2)選用數(shù)據(jù)庫規(guī)定的代碼。許多數(shù)據(jù)庫的文檔中使用各種代碼來表示各種主題范疇,有很高的匹配性。例如,世界專利文摘數(shù)據(jù)庫中的分類代碼,化學文摘數(shù)據(jù)庫中的化學物質登記號。(3)選用常用的專業(yè)術語。在數(shù)據(jù)庫沒有專用的詞表或詞表中沒有可選的詞時,可以從一些已有的相關專業(yè)文獻中選擇常用的專業(yè)術語作為檢索詞。(4) 選用同義詞與相關詞。同義詞、近義詞、相關詞、縮寫詞、
18、詞形變化等應盡量選全,以提高查全率。4.制定提問檢索式和檢索順序檢索提問式構建得是否合理,將直接影響查全率和查準率。構建檢索提問式時,應正確運用邏輯組配運算符注意位置算符、截詞符等的使用方法,及各個檢索項的限定要求及輸入次序等。 5.調整檢索策略構建完檢索提問式后,就可以上機檢索了。檢索時,應及時分析檢索結果是否與檢索要求一致,根據(jù)檢索結果對檢索提問式作相應的修改和調整,直至得到比較滿意的結果。范圍;1)檢索結果信息量過多產生檢索結果信息量過多的原因可能有以下兩點:一是主題詞本身的多義性導致誤檢;二是對所選的檢索詞的截詞截得太短。在這種情況下,就要考慮縮小檢索范圍,提高檢索結果的查準率。調整檢
19、索策略的方法如下:(1)減少同義詞與同族相關詞;(2)增加限制概念,采用邏輯“與”連接檢索詞;(3)使用字段限定,將檢索詞限定在某個或某些字段(4)使用邏輯”非”算符,排除無關概念;(5)調整位置算符,由松變嚴,(F) (W)。2)檢索結果信息量過少 造成檢索結果信息量少的原因有以下幾點:首先,選用了不規(guī)范的主題詞或某些產品的俗稱作為檢索詞;其二,同義詞、相關詞、近義詞沒有運用全;其三,上位概念或下位概念沒有完整運用。針對這種情況,就要考慮擴大檢索范圍,提高檢索結果的查全率。調整檢索策略的方法如下:(1)選全同義詞與相關詞并用邏輯“或”將它們連接起來,增加網(wǎng)羅度;(2)減少邏輯“與”的運算,丟
20、掉一些次要的或者太專指的概念;(3)去除某些字段限制;(4)調整位置算符,由嚴變松,(W) (F)。6. 輸出檢索結果 根據(jù)檢索系統(tǒng)提供的檢索結果輸出格式,選擇需要的記錄以及相應的字段(全部字段或部分字段),將結果顯示在顯示器屏幕上、存儲到磁盤或直接打印輸出,網(wǎng)絡數(shù)據(jù)庫檢索系統(tǒng)還提供電子郵件發(fā)送,至此,完成整個檢索過程。 檢索舉例如:單片機在電冰箱智能模糊控制中的應用1.分析檢索課題分析課題所屬學科范圍(電子技術及信息科學自動化技術確定檢索的時間范圍分析所需文獻類型 上一頁首頁下一頁2.選擇檢索工具書目、文摘數(shù)據(jù)庫 廣泛獲取檢索課題相關的學術文獻概況 全文及網(wǎng)絡數(shù)據(jù)平臺檢索重要研究論文或綜述學
21、術全文 網(wǎng)絡檢索引擎、事實、數(shù)值數(shù)據(jù)庫檢索具體數(shù)值、特征、事實信息(如名詞解釋、統(tǒng)計數(shù)據(jù)等)或廣泛的信息概況 上一頁首頁下一頁安徽工程科技學院圖書館數(shù)據(jù)庫檢索環(huán)境(圖書館電子閱覽室、院系辦公室、系部教研室、計算機房、多媒體教室、宿舍區(qū))3.確定檢索途徑4.制定檢索提問式5.調整檢索策略6.輸出檢索結果上一頁首頁下一頁五、 Internet 概述 1.理解Internet 是指將地理上分散分布的具有獨立功能的多臺計算機(系統(tǒng))或由計算機控制的外部設備,利用通信手段通過通信設備和線路連接起來,按照特定的通信協(xié)議進行信息交流,實現(xiàn)資源共享的系統(tǒng)。上一頁首頁下一頁 Internet信息是指Intern
22、et網(wǎng)提供的各類信息,如電子圖書、電子期刊、會議信息、政府信息、法律法規(guī)等。2. Internet特點(1)信息資源豐富;(2)網(wǎng)上信息更新速度快(3)檢索工具齊全,檢索點多;(4)信息互相鏈接,檢索方便快捷。(5)交叉參照、傳遞迅速上一頁首頁下一頁3.Internet的歷史及現(xiàn)狀 Internet起源于20世紀六、七十年代美國國防部高級研究計劃局(ARPA)研制的阿帕網(wǎng)(ARPAnet),當時是一個僅有少數(shù)計算機相聯(lián)、用于軍事目的的計算機網(wǎng)絡。 1983年,ARPA和美國國際通訊局在此基礎上研制成功了用于異構網(wǎng)絡通信的TCP/IP協(xié)議。使Internet網(wǎng)上不同體系的計算機可以互通信息,從而
23、促成誕生了今天的因特網(wǎng)。這是Internet的第一次飛躍。 上一頁首頁下一頁 80年代后期,因特網(wǎng)從純粹的科學教育目的擴展到商業(yè)領域,很多商業(yè)團體發(fā)現(xiàn)了Internet這一廣闊的新天地,開始紛紛加入。擁有雄厚資金的商業(yè)組織的介入,使Internet進入一個快速增長的時期,促使Internet有了第二次飛躍。 目前, Internet已經連接180多個國家和地區(qū)的近10萬個網(wǎng)絡,用戶已達到1億,并已驚人的速度繼續(xù)發(fā)展,網(wǎng)上傳輸?shù)男畔⒘恳苍诓粩嘣鲩L。上一頁首頁下一頁4. Internet在中國的發(fā)展我國因特網(wǎng)的發(fā)展可分為兩個階段。(1)我國與各國Internet連通電子郵件階段(1987年9月20
24、日)第一階段為1987到1993年間。這一階段,一些重點科研部門開始因特網(wǎng)聯(lián)網(wǎng)的研究項目,并通過撥號。實現(xiàn)了因特網(wǎng)電子郵件轉發(fā)功能,由一些重點院校和科研院所向向社會提供因特網(wǎng)電子郵件服務。上一頁首頁下一頁(2)通過TCP/IP連接,實現(xiàn)了Internet全功能服務階段。( 1994年4月20日至今)。 1994年4 月正式以64kbps的傳輸專線連接因特網(wǎng),并以CN作為我國域名在因特網(wǎng)網(wǎng)管中心登記注冊。目前與Internet連接的全國性網(wǎng)絡有:郵電網(wǎng)(CHINANET)、教育科研網(wǎng)(CERNET)、金橋網(wǎng)(CHINAGBN)、科學院網(wǎng)(CASNET)。上一頁首頁下一頁5.Internet的作用
25、檢索信息:通過(WWW)萬維網(wǎng)方式,可以檢索各種類型、各種載體的信息。(文字、圖片、聲音、影像等多媒體信息)相互交流電子郵件:實現(xiàn)遠距離通訊。網(wǎng)上電話:網(wǎng)絡網(wǎng)絡、網(wǎng)絡電話機網(wǎng)絡聊天:通過鍵盤、聲音、圖片、影像方式進行。上一頁首頁下一頁網(wǎng)上商務活動:購物、談判、廣告、銷售、炒股票等。網(wǎng)上商機:利用Internet網(wǎng)進行商業(yè)活動,如進行廣告宣傳、虛擬經營等。上一頁首頁下一頁6.Internet技術術語通信協(xié)議(TCP/IP協(xié)議)這是一個協(xié)議的集合,它包括TCP協(xié)議(Transport Control Protocol)、IP協(xié)議(Internet Protocol)及其他一些協(xié)議,它共包括100多
26、種具體協(xié)議,如支持E-mail功能的SMTP和POP,支持WWW功能的HTTP、支持FTP功能的FTP等,Internet就是靠這些協(xié)議維持運行的,任何了聯(lián)入Internet的計算機都必須遵循至少一種這樣的協(xié)議。上一頁首頁下一頁地址與域名 Internet采用兩種方法來標識網(wǎng)絡上的計算機,它們分別是IP地址和DN(域名),并設置一套域名系統(tǒng)(DNS)來協(xié)助查詢Internet上的IP地址。 IP地址是主機地址的數(shù)字形式,有二進制格式和十進制格式;十進制格式是由二進制翻譯過去的。用十進制表示,是為了使用戶和網(wǎng)管人員便于使用和掌握。 二進制的IP地址共有32位,例如:10000011,011010
27、11,00000011,00011000。 每八位組用一個十進制數(shù)表示,并以點分隔稱為點分法。上例變?yōu)? 11010011 01010110 11100001 00000100()IP地址分為五類等級:A、B、C、D、E。上一頁首頁下一頁(1)分配最高一級IP地址的國際組織NICNetwork Information Center國際網(wǎng)絡信息中心負責分配A類IP地址、授權分配B類IP地址的組織自治區(qū)系統(tǒng)、有權重新刷新IP地址。(2)分配B類IP地址的國際組織Inter NIC、APNIC和ENIC目前全世界有三個自治區(qū)系統(tǒng)組織:ENIC負責歐洲地區(qū)的分配工作,Inter NIC負責北美地區(qū),A
28、PNIC負責亞太地區(qū),設在日本東京大學。我國屬APNIC,被分配B類地址。CERNET網(wǎng)的的華中地區(qū)網(wǎng)管中心設在華中理工大學,獲得一個B類地址。APNIC總共給中國CERNET網(wǎng)10個B類地址。(3)分配C類地址:由CERNET的地區(qū)網(wǎng)絡中心(如東南大學)向清華NIC申請分配。國內其它行業(yè),如建材局等由中國郵電部數(shù)據(jù)局和SPRINT公司向APNIC申請IP地址。 由于數(shù)字地址不便于記憶,人們依照通訊地址給每臺主機取個名字,這就是域名地址,域名地址由25段字符構成,中間用“.”隔開,如上一頁首頁下一頁統(tǒng)一資源定位器(URL)URL(Uniform Resource Locator)是一個文件在因
29、特網(wǎng)上的標準通用地址,是唯一的,用來指示某項信息資源所在位置及存取方法。其格式是由3部分組成:一是協(xié)議(http|、ftp|、telnet、gopher等),二是該資源主機的IP地址,三是主機資源的具體地址。 URL的格式:/ 如,/lb/tongzhi.htm上一頁首頁下一頁通信協(xié)議通常有以下幾種:http:超文本傳輸協(xié)議,訪問WWW的HTTP服務器的超文本文件。ftp:文件傳輸協(xié)議,訪問anonymous FTP服務器。Gopher:訪問Gopher服務器。wais:訪問WAIS服務器。telnet:遠程登錄mail:發(fā)E-MAIL上一頁首頁下一頁(4)超文本標識語言 超文本文件是指含有多
30、個指向其他文本、圖像、聲音或動畫文件的指針,使他們連接在一起的文件。 超文本標識語言(HTML)是為WWW建立超文本文件的語言它通過標記和屬性對一段文本的語義進行描述,進行文件與文件及文件內部不同部分之間的鏈接,由此實現(xiàn)在Internet上的漫游。用HTML語言編寫的超文本文檔必須用WEB瀏覽器才能閱讀。上一頁首頁下一頁六、網(wǎng)絡信息資源檢索1網(wǎng)上信息資源類型聯(lián)機數(shù)據(jù)庫聯(lián)機館藏目錄庫電子圖書電子期刊電子報紙軟件與娛樂游戲類教育培訓類動態(tài)信息上一頁首頁下一頁2.網(wǎng)上信息資源分布及特點公司、企業(yè)單位站點資源的分布及資源特點COM學校、科研院所站點資源分布及資源特點EDU信息服務機構站點資源的分布及資
31、源特點NET、COM或GOV行業(yè)機構站點資源的分布及資源的特點 COM或AC、GOV等網(wǎng)上免費數(shù)據(jù)庫上一頁首頁下一頁3.網(wǎng)絡信息資源檢索工具的類型字典型查詢工具:它用于查詢網(wǎng)上用戶名、E-mail、URL、服務器地址等。如:White pages Directory、Internet Yellow Pages,Whois,Dejanews.FAQArchive等;索引型查詢工具:它為網(wǎng)上信息資源建立索引。如:FTP資源的索引Archie,Gopher資源的索引Verronica,Jughead、網(wǎng)上服務器的索引Wais等。 上一頁首頁下一頁交互式查詢工具:它提供類似商用聯(lián)機檢索的網(wǎng)絡信息查詢服
32、務。這類工具可分為Gopher和WWW兩類。WWW成為人們最常使用的檢索工具,它分為:搜索索引:又稱搜索引擎搜索目錄:又稱主題指南或主題目錄目前許多網(wǎng)站流行的檢索工具是兩者的結合上一頁首頁下一頁4.網(wǎng)絡信息檢索的一般方法要在網(wǎng)上檢索信息,首先要找到提供信息資源的服務器的地址。如何找呢,有三種方法:瀏覽 偶然發(fā)現(xiàn):這是在網(wǎng)上發(fā)現(xiàn)、檢索信息的原始方法。目的性不強,具有不可預見性和偶然性,有點像探寶,有可能會發(fā)現(xiàn)某些特別有價值的網(wǎng)站,但查準率不高,可能浪費時間。上一頁首頁下一頁順鏈而行:指用戶在閱讀超文本文檔時,利用文檔中的鏈接從一網(wǎng)頁轉向另一相關網(wǎng)頁。類似于“追溯法”。這種方法在短時間內可能獲得大
33、量相關信息,但也有可能找到的是一些相關度不高的信息,因此也可能浪費時間。通過網(wǎng)絡資源指南來查找信息利用搜索引擎進行信息檢索 省時省力,檢索速度快,但由于是計算機軟件自動進行信息的加工、處理,準確性沒是很理想上一頁首頁下一頁七、搜索引擎1搜索引擎的定義 搜索引擎(search engines)是一種利用網(wǎng)絡自動搜索技術,對因特網(wǎng)各種資源進行標引,并為檢索者提供檢索的工具。當用戶輸入關鍵詞查詢時,搜索引擎會告訴用戶包含該關鍵詞的所有網(wǎng)站網(wǎng)址,并提供通向該網(wǎng)址的鏈接。搜索引擎既是用于檢索的軟件又是提供查詢、檢索的網(wǎng)站。所以搜索引擎也可以稱為因特網(wǎng)上具有檢索功能的網(wǎng)頁。2搜索引擎的結構一般由搜索軟件、
34、索引軟件和檢索軟件三大部分組成。上一頁首頁下一頁3.搜索引擎的工作過程索引軟件(分類整理,建立索引數(shù)據(jù)庫搜索軟件(spider,robots),訪問網(wǎng)絡中每一個公開的站點檢索軟件(信息查詢界面,用以提問和顯示檢索結果)反饋結果發(fā)出提問,返回結果上一頁首頁下一頁4.搜索引擎的檢索功能分類瀏覽查詢功能網(wǎng)絡分類目錄一般稱之為網(wǎng)絡目錄(Web Directory),提供瀏覽查詢方式。網(wǎng)絡目錄提供Internet上其它站點的列表。這些列表通常按主題目錄和子目錄方式組織。主題檢索利用不同的軟件和技術,采用一些軟件自動地訪問大量Web頁,這些頁面的文本信息被儲存,然后用專門的軟件對它們進行分析,建立起能夠查
35、找相關查詢的索引。 上一頁首頁下一頁5.搜索引擎的一般檢索技術布爾邏輯檢索邏輯“與”:AND &要求檢索結果同時出現(xiàn)所有輸入的檢索詞。邏輯“或”:OR | 要求檢索結果出現(xiàn)輸入檢索詞的任何一個。邏輯“非”:NOT !要求檢索結果出現(xiàn)NOT前的檢索詞,排除含有NOT后的檢索詞。上一頁首頁下一頁空格,括號,引號的作用空格與“AND”相同括號()的作用是使括在其中的運算符優(yōu)先執(zhí)行,如“多媒體 and (計算機 or 網(wǎng)絡)”引號的作用是括在其的多個詞被當作一個短語來檢索。如“electronic magazine”表示把electronic magazine當作一個短語來搜索,如不加引號,搜索引擎就
36、會把兩詞之間的空格按“與(and)”處理,查出包含electronic和magazine的頁面,結果相差甚遠。上一頁首頁下一頁字段限定檢索 即限定檢索詞在搜索引擎數(shù)據(jù)庫中某個字段范圍進行查找,如網(wǎng)頁標題、站點、網(wǎng)址、鏈接等。(1) 標題檢索 題檢索就是在網(wǎng)頁的標題中查找輸入為:title:檢索式 例如:title:mars title:mars landings title:“mars landings” (2) 站點檢索 站點檢索就是在網(wǎng)站地址域名中檢索輸入的詞,以查找用戶指定站點上的所有頁面。使用的命令一般是“host”,其格式為:host:域名中的詞 例如,檢索式“host:”,表示可以
37、檢索出 WWW 服務器中主機名為“”的網(wǎng)頁。 假如想要查找關于火星著陸方面的資料,并且只想在教育網(wǎng)站(后綴為.edu)中查找,可以輸入這樣的檢索式:“mars landings”+ host:edu上一頁首頁下一頁(3) URL檢索 有些搜索引擎提供在 URL的文本中進行檢索的功能,這和站點檢索非常相似。使用的命令一般是“url”,其格式為: url:URL中的詞 例如,檢索式“url:home.html”可以檢索出在網(wǎng)頁地址中含有“home.html”的頁面。 (4) 鏈接檢索 鏈接檢索就是在與特定網(wǎng)頁或域有鏈接的所有網(wǎng)頁中進行檢索。使用的命令一般是“l(fā)ink”,其格式為: link:特定網(wǎng)頁或域中的詞 例如,檢索式“l(fā)ink:”可以檢索出與“”至少有一次鏈接的頁面。 6.幾種主要的搜索引擎Yahoo!()分類目錄檢索關鍵詞檢索Altavisa()分類目錄檢索簡單檢索詞組檢索特殊檢索上一頁首頁下一頁Excite()分類目錄檢索關鍵詞檢索Infoseek(Lycos(http:/www.L)分類目錄檢索主題目錄檢索關鍵詞檢索高級檢索上一頁首頁下一頁Google()分類檢索在Goog
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣告牌場地租賃合同
- 后勤勞務服務承包合同書
- 數(shù)控機床購買合同
- 產品研發(fā)與研發(fā)人員效率表
- 債務債權轉讓協(xié)議書
- 鋪設壓沙土施工方案
- 公路護欄加高施工方案
- 漢蘭達四門隔音施工方案
- (一模)贛州市2025年高三年級摸底考試物理試卷(含標準答案)
- 橋墩鋼筋成品保護方案
- 九年級物理上冊22內燃機省公開課一等獎新課獲獎課件
- 2025年個人向企業(yè)借款合同協(xié)議樣本
- (二調)武漢市2025屆高中畢業(yè)生二月調研考試 英語試卷(含標準答案)+聽力音頻
- 數(shù)學-湖北省武漢市2025屆高中畢業(yè)生二月調研考試(武漢二調)試題和解析
- 中學家長學校工作方案(10篇)
- 高考地理二輪復習【知識精研】大氣運動規(guī)律-大氣受熱過程與氣溫
- 2025年湖南環(huán)境生物職業(yè)技術學院單招職業(yè)傾向性測試題庫完整版
- 日內交易策略(TBQ版)
- 煤礦常用機電設備的日常管理-培訓課件
- 2025年新執(zhí)業(yè)醫(yī)師定期考核真題庫附參考答案
- 部編版九年級道德與法治上冊《第二課創(chuàng)新驅動發(fā)展》同步測試題(附答案)
評論
0/150
提交評論