




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
網(wǎng)絡信息檢索基礎
王建濤QQ:47072005Email:nbwangjt@網(wǎng)絡信息檢索:導言與課程必備網(wǎng)絡信息檢索基礎網(wǎng)絡信息檢索工具2導言:網(wǎng)絡社會在第一次課中,我們從教育的未來視頻中所了解到信息技術和網(wǎng)絡迅猛發(fā)展。在現(xiàn)在的網(wǎng)絡信息環(huán)境下,網(wǎng)絡信息資源是我們學習、工作、生活中利用率最高的信息資源之一。對網(wǎng)絡信息資源和網(wǎng)絡的利用是終身學習的需要,也是個人信息素質中的重要內容。相對與圖書館紙本文獻信息資源和數(shù)字資源的檢索利用,其對人的影響更為深遠。
3聚沙成塔:網(wǎng)摘工具收集網(wǎng)頁信息天天網(wǎng)摘:/
先進行免費注冊。然后下載下載并安裝插件(一個注冊表文件)。安裝完后,重啟瀏覽器就能夠使用天天網(wǎng)摘了。使用時,在頁面點右鍵,從彈出菜單中選擇“加入天天網(wǎng)摘”。天極網(wǎng)摘:
使用方法同上。文章按類型整合,閱讀方便。
有文摘、圖摘、閃摘、MP3摘。能制作圖文并茂的網(wǎng)摘,更生動形象。其它:GoogleNotebook4移動網(wǎng)絡導航:網(wǎng)絡收藏夾收集網(wǎng)址央庫
百度收藏:/
Winodwslivefavorites/
四樓/
Googlebookmark(基于google工具欄)
/T4/intl/zh-CN/
首頁網(wǎng)
/抽屜
/socialbookmarking
http://del.icio.us
5個人倉庫:網(wǎng)絡存儲空間、網(wǎng)絡硬盤存儲你的文檔/list/156wangluoyingpan.htm
超大郵箱
Gmail和hotmail
/list/18youxiang.htm
Livemail(原Hotmail)5GB(3個月不登錄將自動清除)其實,有1個G就可以存很多文章了。6推薦:相對完美的解決方案Google帳戶
/Google首頁的“登錄”入口。
Gmail-超大郵箱,很好的反垃圾郵件功能。iGoogle–個性化頁面。
Reader–RSS訂閱
文件
–移動辦公環(huán)境。
其它:網(wǎng)上論壇、網(wǎng)頁歷史記錄、Talk
(即時通訊)、日歷7網(wǎng)絡信息資源檢索基礎網(wǎng)絡基礎網(wǎng)絡信息資源概念、類型及其特點網(wǎng)絡信息資源的評價與選擇網(wǎng)絡信息檢索工具81.1認識IP地址人們?yōu)榱送ㄐ诺姆奖憬o每一臺計算機都事先分配一個類似我們日常生活中的電話號碼一樣的標識地址,稱作網(wǎng)絡協(xié)議地址,是分配給主機的一個32位地址,由4個字節(jié)組成。分為動態(tài)IP地址和靜態(tài)IP地址兩種。動態(tài)IP地址指的是每次連線所取得的地址不同,而靜態(tài)IP地址是指每次連線均為同樣固定的地址。如在圖書館無線上網(wǎng)就是動態(tài)IP地址,每次所取得的地址不同。靜態(tài)地址如學校網(wǎng)站的IP1491.2網(wǎng)絡地址和認識域名雖然可以通過IP地址來訪問每一臺主機,但是要記住那么多枯燥的數(shù)字串顯然是非常困難的,為此,Internet提供了域名(DomainName)。域名也由若干部分組成,各部分之間用小數(shù)點分開,例如我校主機的域名是:“”。域名前加上傳輸協(xié)議信息及主機類型信息就構成了網(wǎng)址(URL),例如我校www主機的URL就是:
“http://”。
通常,進行網(wǎng)絡訪問時,域名的www可以省略。如http:///,可以直接輸入http://。不能省略的與域名服務器的配置有關。域名一般不會變動。101.3網(wǎng)絡地址網(wǎng)址URL網(wǎng)絡地址是URL(Uniform
Resource
Locator)的俗稱,一般由三個部分構成,各個部分如下:
服務器標識符:通過選擇服務器標識符能夠確定將要訪問的服務器的類型,URL中的服務器標識符可以有HTTP://、FTP://、GOPHER://、TELNET://、NWES://等等類型,分別指定為采用超文本傳輸協(xié)議連接、采用文件傳輸協(xié)議連接、與GOPHER服務器連接、與TELNET會話連接、與USENET新聞組相連接。信息資源地址:是由兩部分構成的,一是機器名稱,如是用來指示資源所存在的機器,另一個是通信端口號,如HTTP的標準端口號為80,TELNET的標準端口號為23,F(xiàn)TP的標準端口號為21等等。路徑名:是給出資源在所在機器上的完整文件名.如:http:///index.php111.4域名與網(wǎng)絡信息資源有什么關系?由于Internet最初是在美國發(fā)源的,因此最早的域名并無國家標識,人們按用途把它們分為幾個大類,它們分別以不同的后綴結尾:隨著Internet向全世界的發(fā)展,除了edu、gov、mil、一般只在美國專用外,另外三個大類com、org、net則成為全世界通用,因此這三大類域名通常稱為國際域名。ac代表科研機構由于國際域名資源有限,各個國家、地區(qū)在域名最后加上了國家標識段,由此形成了各個國家、地區(qū)自己的國內域名,如:
.
中國的商業(yè).org.hk
香港的組織.net.jp
日本的網(wǎng)絡對網(wǎng)絡信息資源的獲取與評價有參考作用.com商業(yè)公司.org組織、協(xié)會等.net網(wǎng)絡服務.edu
教育機構.gov.政府部門.mil軍事領域12全世界為美國打工
目前,全世界共有13臺根服務器,其中10臺在美國,而且2臺由美軍使用,1臺由美國國家航空航天局使用。也就是說,每天世界各地的電子郵件有很多要先由美國人“過目”之后才能去它該去的地方。此外,美國私營公司掌握著全世界互聯(lián)網(wǎng)域名的分配大權。假如美國與日本的關系急劇惡化,只要美國通過技術手段刪去日本的域名“.jp”,日本馬上就會成為“網(wǎng)上孤島”,無法通過網(wǎng)絡與外界聯(lián)系。全世界的網(wǎng)絡用戶都要向美國支付費用,“全世界都在為美國打工”。中國已經(jīng)建成了世界第一個同時也是規(guī)模最大的純IPv6網(wǎng)13更多……www指的是什么?
即是萬維網(wǎng)(WWW-WorldWideWeb):是基于超文件的、方便用戶在因特網(wǎng)上搜索和瀏覽信息的信息服務系統(tǒng)。它將位于全世界因特網(wǎng)上不同地點的相關數(shù)據(jù)信息有機地紡織在一起。媒體形式可以是文本、圖片、動畫、聲音等,可以跳轉,“網(wǎng)上沖浪”。瀏覽web信息的網(wǎng)絡瀏覽器有哪些?
微軟IE(InternetExplorer)
遨游(maxthon)
火狐(FireFox
)
網(wǎng)景(Netscape)
騰訊TT瀏覽器14更多……在以后的上機和課余時間,歡迎就更多的計算機基礎知識和網(wǎng)絡話題進行探討,我很樂意同大家一起學習。今后的社會,網(wǎng)絡是一個基本要素,它將對社會經(jīng)濟、科技教育、國防乃至政治產(chǎn)生決定性的影響152網(wǎng)絡信息資源概念、類型、特點2.1概念網(wǎng)絡信息資源是指信息資源以電子數(shù)據(jù)的形式存放在非印刷型的介質中,并通過網(wǎng)絡通信手段,在計算機等終端上再現(xiàn)的信息的總和。162.2網(wǎng)絡信息資源的類型按信息內容的表現(xiàn)形式和內容劃分可分為全文型信息:它指直接在網(wǎng)上發(fā)行的電子期刊,網(wǎng)上報紙,印刷型期刊的電子版,網(wǎng)絡學院的各類教材,政府出版物,標準全文等;事實型信息:天氣預報,節(jié)目預告,火車車次,飛機航班,城市或景點介紹,工程實況、IP地址等;數(shù)值型信息:主要是指各種統(tǒng)計數(shù)據(jù)、實驗數(shù)據(jù);數(shù)據(jù)庫類信息:如DIALOG,萬方等,是傳統(tǒng)數(shù)據(jù)庫的網(wǎng)絡化;微內容(web2.0特征):如博客、播客,BBS,聊天,郵件討論組,網(wǎng)絡新聞組等。其它類型:投資行情和分析,圖形圖象,影視廣告等。17按所采用的網(wǎng)絡傳輸協(xié)議可分為WWW網(wǎng)絡資源:因特網(wǎng)信息資源的主流,它使用http協(xié)議,使用簡單,功能強大,能方便迅速的瀏覽和傳遞分布于網(wǎng)絡各處的文字、圖象、聲音和多媒體超文本信息。FTP信息資源:它使用ftp協(xié)議,該協(xié)議主要用語連網(wǎng)計算機之間傳輸文件。FTP相當于在網(wǎng)絡上兩個主機之間復制文件。目前仍是發(fā)布、傳遞軟件和長文件的主要方法。TELNET信息資源:telnet是遠程登陸協(xié)議。telnet信息資源包括硬件資源和軟件資源。許多機構都提供遠程登陸的信息系統(tǒng),如圖書館的公共目錄系統(tǒng),信息服務機構的綜合信息系統(tǒng)等。用戶服務組資源:包括新聞組,電子郵件組等。這些電子通信組形式所傳遞和交流的信息資源是網(wǎng)絡上最自由、最具有開放性的資源。news182.3網(wǎng)絡信息資源的特點復雜性:網(wǎng)絡信息資源具有大數(shù)量、多類型、多媒體、非規(guī)范、跨時間、跨地域、跨行業(yè)、多語種等特點。
在很大程度上網(wǎng)絡的增長和信息資源的動態(tài)快速增加是由用戶驅動的,但缺乏有效的統(tǒng)一管理機制,信息安全和信息質量的不均衡性。信息分布和構成缺乏結構和組織,信息源不僅分散無序,而且其更跌和消亡也往往無法預測,因此增大了信息資源管理和利用的難度。信息發(fā)布具有很大的自由性和任意性,隱私型信息進入了公共信息傳播渠道;由于缺乏必要的過濾、質量控制和管理機制,不僅學術信息、商業(yè)信息,政府信息、個人信息、不合適(反動、黃色)的信息混為一體,質量良莠不齊。增加了信息識別和利用的難度。19續(xù)正式出版物和非正式信息交流交織在一起,使傳統(tǒng)的人類信息交流鏈的格局被打破,各方在網(wǎng)絡上既可以是信息的生產(chǎn)者、發(fā)布者,也可以是傳播者和使用者,對學術交流環(huán)境和信息利用產(chǎn)生了深刻的影響。網(wǎng)絡營造了“地球村”,既極大地促進了人類信息資源的共享,又帶來了一些意想不到的問題,如文化沖突、信息侵略、信息威懾等。使用成本低
共享程度高
是信息資源的寶庫……202.4網(wǎng)絡信息資源的評價與選擇相同內容的信息資源的載體形態(tài)或利用、獲取的方式不同,可以根據(jù)需要選擇。網(wǎng)絡信息資源的評價與選擇主要是針對信息源。內容因素。內容是評價與選擇的核心和重點,從中可以反映網(wǎng)絡信息資源的本質。評價網(wǎng)絡信息資源的內容因素主要有:權威性、完備性、可靠性、原創(chuàng)性、新穎性、穩(wěn)定性等。形式因素。形式指標反映了外部特征以及操作使用等方面,是為提示內容服務的,主要包括:美觀性、條理性、查檢性、幫助性、快捷性、低耗性等。定量的評價:Google的pagerank;星數(shù)評價等級。21權威性在本學科領域具有一定的影響、具有較高的學術水平、具有較高的知名度;Google網(wǎng)頁級別評價作為重要的指標,非獨特性資源網(wǎng)頁級別需3/10以上。主要關注如下問題:所采集的網(wǎng)站(頁)的主辦者是否為有聲譽的大學、學會/協(xié)會、實驗室?網(wǎng)站是否通過權威評價機構評價過?所選的站點是否被多個internet站點鏈接?網(wǎng)站是由某公司、機構還是某領域的著名的權威或專家贊助?信息提供者的教育背景和職業(yè)背景及其研究方向?責任者有知名的出版物嗎?信息是否經(jīng)過過濾?信息是否經(jīng)同行評議過?資源是否由相關的權威推薦?是否有與權威機構的頁面的共同鏈接?出版社是否知名和有聲望?出版社是否是公認的出版界的權威?出版社是否是大學的出版社?是否有任何原創(chuàng)作品?選擇的資源與其它作品有相關性嗎?22準確性信息資源需嚴肅正規(guī)、準確無誤、完整規(guī)范。一方面是內容的準確性,另一方面是格式和鏈接的準確性。對資源的導航需能正常訪問。主要考慮所選網(wǎng)站(頁)提供的信息是否準確?是否提供了信息的來源和出處以備用戶進一步核查;網(wǎng)頁引證的書目或提供的參考能否證實信息的準確性?頁面的句法和拼寫是否準確?有否排印錯誤?提供的信息是否完整規(guī)范?23穩(wěn)定性信息資源需有較長的穩(wěn)定期或有穩(wěn)定運行的保障機制。主要看所選網(wǎng)站(頁)提供信息的時間、更新頻率、最近的修改日期,鏈接速度,斷線率等。是否能持續(xù)提供給用戶使用?24可獲得性信息資源揭示信息的層次中,至少一個能無障礙地獲得。
主要要考慮的是題名信息還是文摘信息或全文信息?是否有對信息結論的闡述標準?是否給出了表明信息內容的關鍵詞或主題詞?希望在該網(wǎng)頁上找到何種信息?主題的涵蓋面是否全?索引或目次頁是否隱含了綜合性的內容?是否免費?是否注冊?是否國際流量?是否符合標準?是否有其它格式或鏡像?某種類型的信息有使用期限制嗎?訪問資源的方式是否依賴用戶使用的設備?是否需要專門軟件(如瀏覽器)?是否有方便的導航?是否容易鏈接所需的信息?是否有清晰的鏈接標簽?是否能分別打印頁面和文獻的某一部分?是否能發(fā)送到電子郵箱?是否提供多種檢索方式?檢索信息的效率如何?25附:人肉搜索基于大信息環(huán)境觀念的信息搜索、挖掘、選擇、評價、分析、綜合請通過百度百科中的“人肉搜索引擎”詞條了解人肉搜索/view/860941.htm
人肉搜索,其實是情報學中的信息分析和情報調研過程,是信息檢索技能、信息分析方法和情報調研過程的集中應用。其最大的特點是應用web2.0的思路,網(wǎng)聚人力,虛擬與現(xiàn)實結合。263網(wǎng)絡信息檢索工具當已經(jīng)知道地址時直接通過地址訪問。當不知道地址的時候,需要借助檢索工具3.1搜索引擎3.2網(wǎng)絡資源目錄3.3信息門戶3.4搜索軟件273.1搜索引擎搜索引擎指自動從因特網(wǎng)搜集信息,經(jīng)過一定整理以后,提供給用戶進行查詢的系統(tǒng)。
獲取更多定義:define:搜索引擎“機器人”工作機理起始URL
分析頁面
URL列表
新頁面28都有哪些搜索引擎……中文搜索引擎指南網(wǎng)[搜網(wǎng)]:
/
搜索引擎觀察[專業(yè)、元、多媒體、購物]
/links/
著名搜索引擎簡介:
/about-se.htm
293.1.1水平門戶_綜合搜索引擎[中文]中文常用搜索引擎百度中文搜索引擎:http:///
Google中文搜索引擎:/
搜狗搜索:http:///
雅虎:/
騰訊搜搜http:///
中搜http:///
MSN搜索http:///
新浪:/
網(wǎng)易有道:/
TOM搜索:/
北大天網(wǎng)搜索引擎:http:///
奇虎/
303.1.1水平門戶_綜合搜索引擎[英文]國外英文常用搜索引擎Google—以搜索精度高、速度快成為最受歡迎的搜索引擎,是目前搜索界的領軍人物。Fast/AllTheWeb—總部位于挪威的搜索引擎后起之秀,風頭直逼google。AltaVista—曾經(jīng)的搜索引擎巨人,目前仍被認為是最好的搜索引擎之一。Overture—最著名的搜索引擎廣告商,競價排名的始作俑者,也是全文搜索引擎。Lycos—發(fā)源于西班牙的搜索引擎,網(wǎng)絡遍布世界各地。HotBot—隸屬于LycosNetworks,搜索結果來自其他搜索引擎及目錄索引。31Google殺手:Cuilhttp:///32Google殺手?WolframAlpha/,將知識轉化為可計算33Google新的競爭者:必應/
343.1.2垂直搜索引擎垂直搜索引擎:即專業(yè)或專用搜索引擎,它專門用來檢索某一主題范圍或某一類型信息,追求專業(yè)性與服務深度是它的特點。垂直搜索引擎不但可保證此領域信息的收錄齊全與更新及時,而且檢索深度和分類細化遠遠優(yōu)于綜合搜索引擎。垂直搜索引擎的檢出結果雖可能較綜合搜索引擎少,但檢出結果重復率低、相關性強、查準率高,適合于滿足較具體的、針對性強的檢索要求。目前已經(jīng)涉及到購物,旅游,汽車,工作,房產(chǎn),交友等行業(yè)。35垂直搜索引擎舉例:1找工作的搜索引擎:http:///
/
google學術搜索:http:///
google圖書搜索:/
PatentSearch
比價購物搜索引擎:/
http:///
博客與RSS搜索引擎:http:///[中客]
http:///[博客中國人]
http:///
/[八方]
人脈搜索引擎:http:///[交友,找工作,商機]
https:///
http:///[人物、軟件]
論壇搜索引擎:http:///
36垂直搜索引擎舉例:2
TheMusicFinder
Singingfish(只能搜尋聲音和錄像)http://
旅行TripAdvisor
http://
計算機科學研究和文章http://
圖像搜索引擎:http:///[圖像詞典]商業(yè)搜索引擎
Business
生意定向搜索引擎。DailyStocks
http://
可以了解被查詢公司存貨的信息已經(jīng)相關的新聞報導,研究,引述和其他數(shù)據(jù)。
FMLXhttp://
英國定向的關于公司,存貨數(shù)據(jù),分析和研究的搜索引擎。eBizSearch
http://
關于電子商務的文章和報告。373.1.3綜合搜索引擎的專門化趨勢搜狗(Sogou)[人物、音樂、購物、圖片、地圖]
/gengduo.htm
GOOGLE學術搜索:
http:///GOOGLE圖書搜索
/
/
AllTheWeb[能專門對圖像、多媒體信息。]
38參見“搜索引擎觀察”之專門搜索引擎AnswersSearching
|ComputerSearchEngines
DomainSearching
|FinancialSearchEngines
GovernmentSearch
|InvisibleWeb(看不見的網(wǎng)頁)LegalSearchEngines
|MailingLists
MedicalSearchEngines
|NewsgroupSearch
ScienceSearchEngines
|ShoppingSearch
TravelSearchEngines
|WAPSearchEngines
更多搜索引擎:393.1.4元搜索引擎元搜索引擎(matesearch)又稱集合型搜索引擎,將多個單一搜索引擎集成在一起,提供統(tǒng)一的檢索界面,將用戶的檢索提問一次搜索多個搜索引擎,并將結果返回給用戶。有的直接按來源引擎排列搜索結果,如Dogpile,有的則按自定的規(guī)則將結果重新排列組合。優(yōu)點:能同時搜索多個搜索引擎,能在一定程度上提高查詢的廣度。缺點:因為有時后并不能對一個搜索引擎全部查完,有時后也會漏掉一些重要信息。40中文元搜索引擎早期的元搜索引擎metaFisher中文元搜索引擎http:///fish/做的較早,核心功能較弱,沒有現(xiàn)代主流搜索引擎的界面風格。萬緯搜索http:///功能上和第一個元搜索引擎一樣,核心功能很弱,制作一般多元搜索http:///做得較早,雖然號稱整合的搜索引擎最多,但實際使用效果很差,查詢速度也慢,返回結果基本未作處理。
新近出現(xiàn)的元搜索引擎/
集合了Google,Baidu,Sogou,Yahoo四大中文搜索引擎的結果。特色:有深入搜索提示知識搜索http:///search/主要用作學習工具,功能上盡量保證全面實用一家搜http:///對相似結果的處理有點特色bbmao
http://是國內唯一具有自動聚類功能的元搜索引擎,技術和功能上都比較強狠搜http:///可以定制源搜索引擎,同時提供商業(yè)信息搜索,核心功能一般413.2網(wǎng)絡資源目錄由人工采集網(wǎng)上信息,然后按照一定分類標準,比如學科類型、主題等,建立網(wǎng)站分類目錄,并將篩選后的信息分門別類放入各類目中供用戶進行瀏覽。優(yōu)點:
1.信息組織
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年寵物美容師職業(yè)技能考核試卷(寵物健康)
- 2025年人工智能工程師專業(yè)知識考核試卷:人工智能在圖像識別與處理中的應用試題
- 2025年建筑工地安全保衛(wèi)工作計劃
- 八年級語文教學計劃與學生自主學習
- 企業(yè)2025年度員工安全培訓計劃
- 金融科技項目所需物資計劃
- 環(huán)保行業(yè)技術創(chuàng)新與發(fā)展計劃
- 2024-2025家庭教育班主任工作計劃
- 幼兒園中班下學期戶外安全工作計劃
- 2025年交通運輸類行業(yè)市場需求分析報告及未來五至十年行業(yè)預測報告
- 七下9《木蘭詩》一輪復習檢測小卷(附答案)
- 綜采工作面乳化液泵檢修工技能理論考試題庫150題(含答案)
- 26 跨學科實踐“制作能升空的飛機模型”(教學設計)2024-2025學年初中物理項目化課程案例
- 數(shù)控刀片合金知識
- 2025屆上海市(春秋考)高考英語考綱詞匯對照表清單
- 內蒙古赤峰市松山區(qū)2023-2024學年八年級下學期期中考試數(shù)學試卷(含答案)
- 大型設備吊裝地基處理方案
- 2025年公開招聘衛(wèi)生系統(tǒng)工作人員歷年管理單位筆試遴選500模擬題附帶答案詳解
- 智能垃圾桶產(chǎn)品介紹
- 2025深圳勞動合同下載
- 建筑工地住房安全協(xié)議書(2篇)
評論
0/150
提交評論