版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第六章網(wǎng)絡(luò)信息資源檢索網(wǎng)絡(luò)信息資源概述網(wǎng)絡(luò)資源檢索的基本工具搜索引擎第一節(jié)網(wǎng)絡(luò)信息資源概述一信息資源的概念信息資源是人類存儲與載體(包括人腦)上的已知或未知的可利用的信息。信息中的載體信息和主體信息是信息資源的最基本的組成部分。按照信息資源的開發(fā)程度來區(qū)分,可分為潛在信息資源與現(xiàn)實(shí)信息資源兩大類?,F(xiàn)實(shí)信息資源又可分為口語信息資源、體語信息資源、實(shí)物信息資源、文獻(xiàn)信息資源、網(wǎng)絡(luò)信息資源和多媒體信息資源。二信息資源的特點(diǎn)客觀性寄載性傳遞性動態(tài)性信息不是能源,也不是物質(zhì),無論是否認(rèn)識到,信息總是存在著。信息必須借助于一定的符號存儲與一定的載體中(包括人腦),才能被表現(xiàn),沒有載體,就沒有信息。信息與載體,兩者不能割裂開。信息可以通過一定的載體在空間、時(shí)間上傳遞,從近到遠(yuǎn),從古到今都能傳遞。信息是對事物存在方式及運(yùn)動方式的反映,隨著事物的變化,信息也將變化。這里動態(tài)性也是指信息的時(shí)效性。相對性增長性共享性人們認(rèn)識能力與認(rèn)識條件不同,信息接受者(信宿)獲得信息與信息量的多寡不同,從這個(gè)意義上說,信息的價(jià)值具有相對性。信息資源的使用,不但不會使信息資源減少,在利用中,還會產(chǎn)生更多的信息。信息資源可以共享,信息資源共享的雙方或多方均不會損失信息內(nèi)容,相反還會產(chǎn)生新的信息。三信息資源的類型體載信息資源文獻(xiàn)信息資源實(shí)物信息資源網(wǎng)絡(luò)信息資源(一)體載信息資源體載信息資源指以人體為載體并能為他人識別的信息資源,按其表達(dá)方式又可分為口語信息資源和體語信息資源??谡Z信息資源是人類以口頭語言表達(dá)出來但未被記錄下來的信息資源,如談話、授課、講演、討論等;體語信息資源是以人的體態(tài)表達(dá)出來的信息資源,如表情、手勢、姿態(tài)、舞蹈等。(二)文獻(xiàn)信息資源按信息資源出版類型按加工層次文獻(xiàn)信息資源是以文獻(xiàn)為載體的信息資源。①科技圖書;②科技期刊;③科技報(bào)告;④會議文獻(xiàn);⑤專利文獻(xiàn);⑥學(xué)位論文;⑦標(biāo)準(zhǔn)文獻(xiàn);⑧政府出版物;⑨產(chǎn)品樣本;⑩技術(shù)檔案①一次信息資源。②二次信息資源。③三次信息資源。④零次信息資源。(三)實(shí)物信息資源實(shí)物信息資源是指以實(shí)物為載體的信息資源。(四)網(wǎng)絡(luò)信息資源按信息表現(xiàn)形式分有電子出版物和非電子出版物信息資源。按信息的媒體形式分本為文本信息資源、超文本信息資源、多媒體信息資源和超媒體信息資源。按網(wǎng)絡(luò)信息資源加工層次,可以分為網(wǎng)絡(luò)資源指南和搜索引擎、聯(lián)機(jī)館藏目錄、數(shù)據(jù)庫信息資源、電子出版物、網(wǎng)上參考工具和其它動態(tài)信息。按照用戶采用的不同的網(wǎng)絡(luò)協(xié)議來劃分,可以分為基于超文本傳輸協(xié)議(HTTP)的信息資源、基于文件傳輸協(xié)議(FTP)的信息資源、基于遠(yuǎn)程登錄(TELNET)的信息資源、新聞組(Usenet/Newsgroups)資源和電子郵件(E-mail)信息資源。根據(jù)信息的提供者不同,可以將網(wǎng)絡(luò)信息分為個(gè)人提供的信息、組織(政府、公司等)提供的信息兩大類,根據(jù)訪問信息的權(quán)限不同,可以將網(wǎng)絡(luò)信息分為開放信息與保密信息兩大類。根據(jù)信息涉及的領(lǐng)域不同,可以將網(wǎng)絡(luò)信息分為教育類、文化類、科研類、娛樂休閑類、政策類信息。四信息資源檢索的意義為滿足知識創(chuàng)新和終身學(xué)習(xí)的需求,培養(yǎng)適應(yīng)21世紀(jì)現(xiàn)代化建設(shè)需要的新型人才,發(fā)達(dá)國家和地區(qū)紛紛將信息素養(yǎng)或信息能力教育作為21世紀(jì)人才能力的重要內(nèi)容。人們越來越清楚地認(rèn)識到,知識就是力量,信息就是財(cái)富,信息資源在社會生產(chǎn)和人類生活中將發(fā)揮日益重要的作用。人們通過開發(fā)信息資源促進(jìn)了科學(xué)技術(shù)的進(jìn)步和社會的發(fā)展。信息的占有和使用已成為國家興衰和個(gè)人成敗的關(guān)鍵。誰優(yōu)先掌握了有價(jià)值的信息,誰就能在激烈的競爭中立于不敗之地。第二節(jié)網(wǎng)絡(luò)資源檢索的基本工具一網(wǎng)絡(luò)資源檢索工具的特點(diǎn)開放性鏈接性簡便性提供大量免費(fèi)信息資源和檢索工具,允許用戶隨時(shí)查詢,并提供大量信息交換場所,如獲得公用共享軟件,查詢相關(guān)的事實(shí)和數(shù)據(jù)信息,還可隨時(shí)查閱個(gè)圖書館目錄和文獻(xiàn)資料,使用遠(yuǎn)距離的信息資源。網(wǎng)絡(luò)資源的鏈接性主要體現(xiàn)在環(huán)球網(wǎng)(WWW,WorldWideWeb)上,由于不受時(shí)間和空間的限制,世界各地的用戶可以實(shí)時(shí)低、全天候地檢索并獲取各種形式的信息,因特網(wǎng)以交互方式,提供豐富、方便、界面友好的信息檢索工具,通過這些工具的使用,用戶可以獲取所需的信息資源。二網(wǎng)絡(luò)資源檢索工具因特網(wǎng)提供的信息檢索工具有:E-mail,WAIS,BBS,Gopher,Telnet,FIPArchie等,其中,WWW界面極為方便,每個(gè)人都可以通過瀏覽器瀏覽和檢索信息。因特網(wǎng)還提供各種類型、功能強(qiáng)大的搜索引擎,極大地方便了網(wǎng)絡(luò)信息的檢索。因特網(wǎng)發(fā)展迅速,新技術(shù)、新工具層出不窮,一些傳統(tǒng)的工具至今仍在使用,一些則被新的工具所代替。第三節(jié)搜索引擎一搜索引擎的類型按資源的搜集、索引方法及檢索特點(diǎn)與用途來分,搜索引擎可分為分類目錄型、全文索引型和文摘型;按檢索方式分,搜索引擎可分為單獨(dú)型和匯集型;按覆蓋范圍分,搜索引擎可分為通用搜索引擎、專業(yè)搜索引擎;按功能分,搜索引擎可分為常規(guī)搜索引擎和多元搜索引擎、獨(dú)立搜索引擎和集成搜索引擎。(一) 分類目錄型(二) 全文檢索型(三) 多元集成型(四) 圖像搜索型(五)智能搜索引擎(一)分類目錄型
該類型提供一份按類別編排因特網(wǎng)站點(diǎn)的目錄,各類下面,排列這一類網(wǎng)站的站名和網(wǎng)址鏈接,就像一本電話號碼簿,有的還提供各個(gè)網(wǎng)站的內(nèi)容提要。分類目錄搜索引擎的特點(diǎn)是由系統(tǒng)先將網(wǎng)絡(luò)資源信息系統(tǒng)地歸類,用戶可以清晰方便地查找到某一類信息,用戶只要查詢該搜索引擎的分類體系,層層深入即可,與傳統(tǒng)的信息分類查找方式十分形似。不足之處在于搜索范圍比以全文為主的搜索引擎的范圍要小得多,加之這類搜索引擎沒有統(tǒng)一的分類體系,用戶對類目的判斷和選擇直接影響到檢索效果,同類目之間的交叉,又導(dǎo)致許多內(nèi)容的重復(fù),類目太細(xì),用戶無所適從,目錄庫也相對較小,更新較慢,影響使用。目錄型檢索工具Yahoo!創(chuàng)建于1994年的Yahoo!(也稱“雅虎”)(Yahoo!將網(wǎng)絡(luò)資源按內(nèi)容分為10多個(gè)大類:藝術(shù)與人文、商業(yè)與經(jīng)濟(jì)、電腦與因特網(wǎng)、教育、娛樂、健康與醫(yī)藥、政府與政治、休閑與生活、參考資料、區(qū)域、科學(xué)、社會科學(xué)、社會與文化、新聞與媒體等。每個(gè)大類下又逐級鏈接多個(gè)小類,最后與相應(yīng)的Web頁相連。Yahoo!除了提供目錄方式鏈接瀏覽檢索外,還提供關(guān)鍵字檢索,并具備高級檢索功能。使用雅虎搜索信息的主要有按分類目錄搜索和關(guān)鍵詞搜索兩種方法。(二)全文檢索型
全文檢索型搜索引擎通過使用大型的信息數(shù)據(jù)庫來搜集和組織因特網(wǎng)資源,大多都具有:收集記錄、索引記錄、搜索索引和提交搜索結(jié)果等功能,用戶用所選的“關(guān)鍵詞”進(jìn)行搜索,文本數(shù)據(jù)庫即以匹配或關(guān)聯(lián)的用戶給定的請求,返回給用戶一個(gè)與這些文本相連的列表清單。查詢結(jié)果都應(yīng)包括頁面標(biāo)題及其網(wǎng)址,檢索結(jié)果可能出現(xiàn)其他內(nèi)容如簡短總結(jié)、大綱或文摘頁面首段的一部分或全部,表明頁面與待查詢項(xiàng)目向關(guān)聯(lián)的數(shù)字、百分率、日期、文本大小,與檢索詞具有類似性的主體鏈接等。全文檢索型搜索引擎的特點(diǎn)是信息量很大,索引數(shù)據(jù)庫規(guī)模大,更新較快,因特網(wǎng)上新的或更新的頁面常在短時(shí)間內(nèi)被檢索到,而過期的鏈接會及時(shí)移去。該搜索引擎不足之處在于檢索結(jié)果反饋的信息往往較多、太濫,用戶很難從中篩選出自己真正感興趣的內(nèi)容,要得到理想的檢索結(jié)果,還要借助必要的語法規(guī)則和限制符號,(三)多元集成型
建立在多個(gè)搜索引擎基礎(chǔ)之上的多元集成型搜索引擎,在一定程度上滿足用戶更多、更快地獲得網(wǎng)絡(luò)信息的要求。這類搜索引擎可將用戶的請求迅速發(fā)送給其他獨(dú)立的搜索引擎,并將反饋的結(jié)果進(jìn)行處理后提供給用戶,或者讓用戶選擇其中的某幾個(gè)搜索引擎進(jìn)行工作。多元集成型搜索引擎有串行處理和并行處理兩種方式。(四)圖像搜索型
面向因特網(wǎng)上嵌入式圖像或被鏈接的圖形,它通常要實(shí)現(xiàn)以下功能:允許用關(guān)鍵詞搜索圖像內(nèi)容、日期及制作人;能通過顏色、形狀和其他形式上的屬性進(jìn)行搜索;把圖像作為搜索結(jié)果的一部分顯示。圖像搜索引擎通過顯示一張略圖、圖像的URL、存放圖像站點(diǎn)的URL以及有關(guān)圖像的某些信息的方式顯示搜索結(jié)果,用戶可據(jù)信息確定該圖像是否適合搜索要求、查出源站點(diǎn),并弄清圖像存放的地點(diǎn)。(五)智能搜索引擎
智能搜索引擎是結(jié)合了人工智能技術(shù)的新一代搜索引擎,它使因特網(wǎng)信息檢索從基于關(guān)鍵詞提高到基于知識或概念,并對知識有一定的理解和處理能力,能夠?qū)崿F(xiàn)分詞技術(shù)、同義詞技術(shù)、概念搜索、短語識別及機(jī)器翻譯技術(shù)等。智能搜索在研究機(jī)器翻譯(MT)的領(lǐng)域中,使用戶可以用母語搜索非母語的網(wǎng)頁,并以母語瀏覽搜索結(jié)果。因特網(wǎng)是一個(gè)巨大的信息庫,知識庫是實(shí)現(xiàn)智能搜索的基礎(chǔ)和核心,信息庫是知識庫存在和發(fā)展的空間,智能搜索引擎必須把信息庫和知識庫結(jié)合起來,需要做到3點(diǎn):語義分析、知識管理、知識檢索。二搜索引擎的特點(diǎn)使用方便檢索方法多樣檢索結(jié)果形式多樣三著名搜索引擎的使用著名的搜索引擎有Yahoo,Google,Sohu(全文搜索引擎代表性的有:VltaVista,OpenText,Infoseek。以文摘為主的搜索引擎有:Excite,Lycos,Webcrawler,Magellan.專業(yè)搜索引擎有:CSTR,DejaNews,InternetMovieDatabase,Medical,MedicalWorldSearch等。Yahoo,以網(wǎng)站為主要搜索目標(biāo),共收錄了50萬條網(wǎng)站信息,將其分布在2.5萬個(gè)主題(類目)之中,用戶通過分類目錄去瀏覽相關(guān)主題,也可通過關(guān)鍵詞來檢索。Headline提供每小時(shí)頭條新聞報(bào)道特別是有關(guān)國際時(shí)事、商業(yè)、娛樂、和體育方面的新聞。優(yōu)點(diǎn)是數(shù)據(jù)庫每日更新,系統(tǒng)反應(yīng)速度較快,通過分類目錄查準(zhǔn)率高。缺點(diǎn)是查全率低,相關(guān)性排序質(zhì)量一般,會檢索到很多不相關(guān)的文章。四搜索引擎的局限沒有一個(gè)搜索引擎包含的WWW頁超過了全球總WWW頁面的16%,而對因特網(wǎng)資源的覆蓋面還明顯下降,也受限于數(shù)據(jù)庫更新的速度,可能影響搜索有價(jià)值的信息。搜索引擎自動巡視軟件在搜集因特網(wǎng)信息時(shí),通常要
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年醫(yī)藥生物行業(yè)投資策略報(bào)告:看好創(chuàng)新和出海關(guān)注基本面向上細(xì)分賽道-國元證券
- 中國結(jié)腸鏡行業(yè)市場深度分析及發(fā)展前景預(yù)測報(bào)告
- 項(xiàng)目開發(fā)總結(jié)報(bào)告(合集五)
- 方型太陽能警示樁行業(yè)行業(yè)發(fā)展趨勢及投資戰(zhàn)略研究分析報(bào)告
- 商場項(xiàng)目可行性報(bào)告
- 2024河南其他電氣機(jī)械及器材制造市場前景及投資研究報(bào)告
- 2025年秋千項(xiàng)目可行性研究報(bào)告
- 2025年半導(dǎo)體封裝行業(yè)研究報(bào)告(附下載)
- 2025辦公設(shè)備維修合同
- 供應(yīng)商可持續(xù)發(fā)展計(jì)劃
- 方案所需費(fèi)用測算
- 《吉利集團(tuán)財(cái)務(wù)共享中心的優(yōu)化研究》11000字
- 生姜的產(chǎn)地分布
- 普通高中學(xué)業(yè)水平合格性考試(會考)語文試題(附答案)
- 統(tǒng)編語文八上文言文過關(guān)小測驗(yàn)-《愚公移山》
- 12、口腔科診療指南及技術(shù)操作規(guī)范
- 醫(yī)藥電商行業(yè)發(fā)展趨勢報(bào)告
- 2020年10月自考00020高等數(shù)學(xué)一高數(shù)一試題及答案含評分標(biāo)準(zhǔn)
- 勞務(wù)派遣方案
- 電費(fèi)異常問題篩選及處理途徑
評論
0/150
提交評論