版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
網(wǎng)絡(luò)信息檢索基礎(chǔ)文獻學(xué)教研室馮勤2004.10Internet簡介
Internet歷史與發(fā)展(因特網(wǎng)、國際互聯(lián)網(wǎng))1.ARPANet(1969年,美國國防部研制)2.NSFNet(1985年美國國家科學(xué)基金會建立,1989年取代ARPANet)3.Internet(1990年后迅速普及)國內(nèi)與Internet直接聯(lián)網(wǎng)的
四大網(wǎng)絡(luò)1.中國教育科研網(wǎng)(CERNET)2.中國科技網(wǎng)(CSTNET)3.中國公用計算機互聯(lián)網(wǎng)(CHINANET)4.中國金橋信息網(wǎng)(CHINAGBNET)Internet的入網(wǎng)方式1.通過局域網(wǎng)方式2.通過ISP接入(ISP是提供Internet入網(wǎng)服務(wù)的機構(gòu))撥號接入:計算機、Modem、電話線、ISP帳號。(ADSL)專線接入:租用數(shù)據(jù)專線或光纜、DDN等以及配套網(wǎng)絡(luò)設(shè)備。ADSL(AsymmetricalDigitalSubscriberLine,非對稱數(shù)字用戶環(huán)路):是一種能夠通過普通電話線提供寬帶數(shù)據(jù)業(yè)務(wù)的技術(shù),是目前極具發(fā)展前景的一種接入技術(shù)。ADSL素有“網(wǎng)絡(luò)快車”之美譽,因其下行速率高、頻帶寬、性能優(yōu)、安裝方便、不需交納電話費等特點而深受廣大用戶的喜愛,成為繼Modem、ISDN之后的又一種全新的、更快捷、更高效的接入方式。Internet的管理1.TCP/IP協(xié)議:是計算機網(wǎng)絡(luò)協(xié)議中最核心的兩個協(xié)議。TCP是傳輸控制協(xié)議,處理由于路徑不同及其它可能原因造成的數(shù)據(jù)包顛倒、數(shù)據(jù)丟失、數(shù)據(jù)失真等問題。IP是網(wǎng)際協(xié)議,利用路由算法解決路由選擇的問題。Internet的管理2.IP地址:是Internet上每臺主機和用戶終端的識別標(biāo)識。IP地址在全球范圍內(nèi)都是唯一的。
IP地址的表示:33.域名系統(tǒng)(DNS):
例:結(jié)構(gòu)為:主機名.機構(gòu)名.網(wǎng)絡(luò)名.最高域名Internet的管理常用網(wǎng)絡(luò)名:com(商業(yè)機構(gòu))、edu(教育機構(gòu))、mil(軍事部門)、gov(政府部門)、org(非盈利組織)、net(網(wǎng)絡(luò)服務(wù)商)最高域名:cn(中國)、uk(英國)、jp(日本)美國享有國家域名默認權(quán)。Internet的管理4.客戶機/服務(wù)器(client/server)模式服務(wù)器:是指向全球Internet用戶提供信息和服務(wù)的高性能計算機,包括Web服務(wù)器、郵件服務(wù)器、文件傳輸服務(wù)器??蛻魴C:是指連接在服務(wù)器上的工作站(網(wǎng)絡(luò)終端)??蛻魴C通過有關(guān)程序(如瀏覽器等)向服務(wù)器發(fā)出指令或請求,服務(wù)器進行處理后將結(jié)果返回。Internet提供的主要服務(wù)電子郵件服務(wù)(E-mail)文件傳輸服務(wù)(FTP)遠程登錄(Telnet)電子論壇(ElectronicForum)信息查詢服務(wù)(
Archie、Gopher、WAIS,WWW)Internet提供的主要服務(wù)
1.電子郵件服務(wù)(
E-mail)E-mail地址格式:用戶名@電子郵件服務(wù)器名如:lyqbs7209@163.com常用電子郵件軟件:OutlookExpress,Eudora,Foxmail等,可管理多個郵件帳號,直接收發(fā)郵件。(將郵件pop到本地)Internet提供的主要服務(wù)2.文件傳輸服務(wù)(FileTransferProtocol,FTP)
是以其遵守的文件傳輸協(xié)議
FTP而命名的。
FTP是Internet上文件傳輸?shù)母鞣N規(guī)程的集合。通過FTP,用戶可將本地文件上載給遠程主機(upload),更多情況是從遠程主機上下載(download)文件。(包括文本、圖像、聲音、多媒體、軟件或數(shù)據(jù)文件等)Internet提供的主要服務(wù)3.遠程登錄(Telnet)
是指本地計算機通過Internet訪問遠程計算機上的硬件資源、軟件資源和信息資源的過程。對于限制公開訪問的遠程主機,登錄時要輸入用戶名和密碼。隨著
www的普及,
Telnet已少有使用。Internet提供的主要服務(wù)4.電子論壇(ElectronicForum)
是Internet用戶在網(wǎng)上討論交流的一種形式,又稱新聞組(Newsgroop)或?qū)n}討論組(Usenet)。電子公告版(BulletinBoardSystem,BBS)與專題討論組功能相似,但其規(guī)模小得多,且BBS上的觀點只留在本地服務(wù)器上。Internet提供的主要服務(wù)5.信息查詢(檢索)服務(wù)在E-Mail、FTP和Telnet基礎(chǔ)上開發(fā)的,比較知名的工具有Archie、Gopher、WAIS等,目前大多數(shù)INTERNET用戶通過WWW瀏覽和WWW信息檢索工具查詢和使用網(wǎng)絡(luò)信息資源。WWW概述萬維網(wǎng)(WorldWideWeb,WWW)
又稱環(huán)球網(wǎng)、全球網(wǎng),起源于1989年歐洲粒子物理研究中心,采用HTTP(超文本傳輸協(xié)議)在Internet上提供全球范圍的多媒體信息服務(wù)。1993年1月,因特網(wǎng)上約有50個WWW服務(wù)器在工作,1999年高達300萬個?,F(xiàn)在WWW有等同于Internet的趨勢。WWW概述超文本(Hypertext)包含兩個含義:其一是信息的表達形式不局限于文字,還可以是圖像、動畫、視頻、音頻、動態(tài)數(shù)據(jù)、軟件等非文本文件;其二是網(wǎng)頁文件內(nèi)部包含鏈接(link)。WWW概述超文本標(biāo)記語言(HyperTextMarkupLanguage,HTML)是制作Web頁面的語言,用來標(biāo)記網(wǎng)頁的標(biāo)題、段落、鏈接、字體、顏色、表格等,并由瀏覽器來解釋這些標(biāo)識。HTML編輯器:Frontpage、DreamWeaver、NetscapeComposer統(tǒng)一資源定位器(UniformResourceLocator,URL)
用來描述信息資源的類型和在網(wǎng)上的位置,即網(wǎng)址。URL格式:/zhaosheng/yjs/index.html
協(xié)議://文件所在服務(wù)器名/目錄路徑和文件名WWW概述WWW概述瀏覽器(Browser)
是使用WWW資源的客戶軟件。常用的瀏覽器有:網(wǎng)景公司的NavigatorCommunicator微軟公司的InternetExplorer(IE)Web檢索工具是指提供萬維網(wǎng)信息查詢的計算機系統(tǒng)。工作原理:1.信息采集:利用網(wǎng)絡(luò)自動搜索軟件Robot或Spider,以一個URL清單為向?qū)?,定期對Internet上的網(wǎng)頁進行掃描搜索,記錄下網(wǎng)頁的有關(guān)事項。2.數(shù)據(jù)標(biāo)引:對采集到的網(wǎng)頁信息數(shù)據(jù),
Robot等會自動抽取表達網(wǎng)頁主題意義的詞作為關(guān)鍵詞來構(gòu)建數(shù)據(jù)庫索引。有的網(wǎng)絡(luò)檢索工具同時采用人工標(biāo)引。Web檢索工具3.數(shù)據(jù)組織:標(biāo)引后的網(wǎng)頁數(shù)據(jù)形成檢索工具數(shù)據(jù)庫中的一條條記錄,每條記錄對應(yīng)于一個網(wǎng)站或一個網(wǎng)頁。記錄內(nèi)容包括網(wǎng)頁標(biāo)題、摘要或關(guān)鍵詞、網(wǎng)址、網(wǎng)站網(wǎng)頁與輸入關(guān)鍵詞的相關(guān)程度等。4.檢索功能:布爾算符檢索(AND+、OR|、NOT-),截詞檢索,詞組檢索,自然語言檢索、概念檢索、分類瀏覽,檢索限定,語種翻譯,自動排序等。Web檢索工具的類型1.搜索引擎(searchengine)自動搜索采集網(wǎng)頁信息,自動標(biāo)引,數(shù)據(jù)量大,關(guān)鍵詞檢索功能強,查全率高,查準(zhǔn)率低。典型:Google2.目錄型檢索工具(Webdirectory,catalog)以分類目錄檢索為主,接受網(wǎng)站推薦,人工參與網(wǎng)頁信息的篩選標(biāo)引,查全率低,查準(zhǔn)率高。代表:Yahoo!、搜狐多數(shù)檢索工具同時具有關(guān)鍵詞檢索和目錄瀏覽功能。Web檢索工具的類型3.多元搜索引擎(metasearchengine)
通過統(tǒng)一的用戶界面,可同時查詢多個獨立的Web檢索工具,然后對這些結(jié)果進行加權(quán)等處理后返回給用戶。例如:
Metacrawler、Turbostart等;
天網(wǎng)搜霸:強大的搜索引擎集成工具。
颶風(fēng)搜索通:整合近百個各類搜索引擎,包含簡體中文,繁體中文,軟件,音樂,股票,新聞等類別的全方位互聯(lián)網(wǎng)信息檢索工具。
國外著名通用搜索引擎Yahoo!()Google()Lycos()Excite()AltaVista()Infoseek()HotBot()Yahoo!
Yahoo!的兩位創(chuàng)始人大衛(wèi)·費羅(DavidFilo)和楊致遠(JerryYang),美國斯坦福大學(xué)電機工程系的博士生,于1994年4月建立。Yahoo!(雅虎)是最早最著名的目錄型檢索工具,在全球共有24個網(wǎng)站,12種語言版本。(參見雅虎中國)檢索途徑:
分類瀏覽:分為14個大類,每個大類下又分若干子類。
專題鏈接:與Shopping、YellowPages、MapsNews、Sports等專題信息鏈接。簡單檢索:直接輸入檢索詞
高級檢索
Google的釋義
Google是由英文單詞“googol”變化而來?!癵oogol”是美國數(shù)學(xué)家
EdwardKasner的侄子MiltonSirotta
創(chuàng)造的一個詞,表示1后邊帶有100個零的數(shù)字。Google使用這個詞代表公司想征服網(wǎng)上無窮無盡資料的雄心。關(guān)于Google
兩位斯坦福大學(xué)的博士生LarryPage和SergeyBrin在1998年創(chuàng)立了Google。Google
開發(fā)出了世界上最大的搜索引擎,提供了最便捷的網(wǎng)上信息查詢方法。通過對30多億網(wǎng)頁進行整理,Google可為世界各地的用戶提供適需的搜索結(jié)果,而且搜索時間通常不到半秒?,F(xiàn)在,Google每天需要提供2億次查詢服務(wù)。Google特點:界面非常簡潔,速度極快;檢索網(wǎng)頁數(shù)量達24億,搜索引擎中排名第一;支持多達132種語言;包括簡體和繁體中文;具有“手氣不錯”、“網(wǎng)頁快照”、圖片搜索、新聞組搜索等功能。運算符:
空格表示邏輯“與”;減號“—”表示邏輯“非”;“OR”表示邏輯“或”;對短語或句子搜索時必須加英文引號。中文通用搜索引擎百度()搜狐()新浪()網(wǎng)易()
于1999年底成立于美國硅谷,它的創(chuàng)建者是資深信息檢索技術(shù)專家、超鏈分析專利的唯一持有人――百度總裁李彥宏,及其好友――在硅谷有多年商界成功經(jīng)驗的百度執(zhí)行副總裁徐勇博士。百度是目前全球最優(yōu)秀的中文信息檢索與傳遞技術(shù)供應(yīng)商。中國所有提供搜索引擎的門戶網(wǎng)站中,超過80%以上都由百度提供搜索引擎技術(shù)支持,現(xiàn)有客戶包括新浪、騰訊、263、21cn、上海熱線、廣州視窗、新華網(wǎng)、北方時空、西部時空、重慶熱線等。百度(B,Inc)使用搜索引擎注意事項分類體系的差異類目設(shè)置和劃分不一:如教育大類,新浪分出44個下位類;搜狐有34個;網(wǎng)易只有24個。類名表述的不同:如新浪用“計算機”;網(wǎng)易用“電腦”。關(guān)鍵詞標(biāo)引高級搜索中運算符的使用空格(AND)、&(AND)、—(NOT)、|(OR)、()“”表示一個整體單元。不同的查詢服務(wù):網(wǎng)站、網(wǎng)頁、新聞、軟件等特殊的:圖片、多媒體網(wǎng)絡(luò)信息資源的獲取Web檢索工具(搜索引擎)網(wǎng)絡(luò)數(shù)據(jù)庫(文摘數(shù)據(jù)庫、全文數(shù)據(jù)庫)專業(yè)網(wǎng)站電子期刊、電子圖書虛擬圖書館學(xué)科專業(yè)導(dǎo)航庫維普《中文科技期刊數(shù)據(jù)庫》中國知網(wǎng)(中國期刊網(wǎng))(CNKI)國家科技圖書文獻中心萬方數(shù)據(jù)
國內(nèi)主要數(shù)據(jù)庫資源國內(nèi)醫(yī)學(xué)搜索引擎和門戶網(wǎng)站眼科搜索三九健康網(wǎng)邁搏搜索中國導(dǎo)醫(yī)網(wǎng)中國金衛(wèi)網(wǎng)37℃醫(yī)學(xué)網(wǎng)中國醫(yī)藥信息網(wǎng)/中國中醫(yī)藥信息網(wǎng)/中國藥網(wǎng)/學(xué)科專業(yè)導(dǎo)航庫CALIS重點學(xué)科導(dǎo)航庫(北大、復(fù)旦等)國家科技圖書文獻中心導(dǎo)航庫NationalInstituteofHealth(美國國立衛(wèi)生研究院)NationalLibraryofMedicine(美國國立醫(yī)學(xué)圖書館)NCBI(美國國家生物技術(shù)信息中心)AAMC(美國醫(yī)學(xué)院協(xié)會)國外醫(yī)學(xué)數(shù)據(jù)庫網(wǎng)站Medscape
MedicalMatrix
Medwebplus
BioMedNet
常用醫(yī)學(xué)搜索引擎Medscape(醫(yī)景):/美國公司Medscape公司19
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年售后服務(wù)工作計劃
- Unit6 Colours(說課稿)-2024-2025學(xué)年譯林版(三起)英語三年級上冊
- 習(xí)作:- 即景(說課稿)-2024-2025學(xué)年統(tǒng)編版語文五年級上冊
- 2025年幼兒園園務(wù)工作計劃范文怎么寫
- 2025年外科護理工作計劃模板
- 七年級上冊·人教·歷史與社會第一單元第一課 我的家在哪里 說課稿
- 2025護士工作人員個人工作計劃
- Unit 8 Wonderland-Welcome to the unit 說課稿 2024-2025學(xué)年譯林版英語七年級下冊
- 2025教師學(xué)期工作計劃
- Unit2 My favourite season (B Read and write)(說課稿)-2023-2024學(xué)年人教PEP版英語五年級下冊
- 《建筑工程QC課題》課件
- 病歷質(zhì)控流程
- 政府采購評審專家考試試題庫(完整版)
- 合作投資酒店意向合同范例
- 安全教育教案大班40篇
- 叉車工安全培訓(xùn)資料
- 九年級英語教學(xué)反思
- 外研新標(biāo)準(zhǔn)初中英語七年級上冊冊寒假提升補全對話短文練習(xí)三附答案解析
- 《旅游消費者行為學(xué)》-課程教學(xué)大綱
- YY/T 1117-2024石膏繃帶
- 蘇教版小學(xué)三年級科學(xué)上冊單元測試題附答案(全冊)
評論
0/150
提交評論