《網(wǎng)上信息搜索》_第1頁(yè)
《網(wǎng)上信息搜索》_第2頁(yè)
《網(wǎng)上信息搜索》_第3頁(yè)
《網(wǎng)上信息搜索》_第4頁(yè)
《網(wǎng)上信息搜索》_第5頁(yè)
已閱讀5頁(yè),還剩70頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

多媒體文化基礎(chǔ)

網(wǎng)上信息搜索清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系5/16/20231.第9章網(wǎng)上信息搜索9.1信息搜索工具9.2信息搜索方法9.3網(wǎng)頁(yè)評(píng)估方法9.4網(wǎng)頁(yè)搜索方法9.5圖像搜索方法9.6影視搜索方法9.7音樂搜索方法9.8多媒體搜索引擎5/16/20232.概要網(wǎng)上信息是網(wǎng)上文件所含內(nèi)容的描述網(wǎng)上信息(web-basedinformation)網(wǎng)上信息搜索是查找多媒體文件信息的過程文字搜索(textsearch[1])——搜索文字文件的信息圖像搜索(imagesearch)——搜索圖像文件的信息聲音搜索(audiosearch)——搜索聲音文件的信息視像搜索(videosearch)——搜索影視文件的信息信息搜索的必備知識(shí)搜索工具有哪些搜索工具的特性搜索信息的方法搜索工具的使用5/16/20233.9.1信息搜索工具(1)兩種類型的搜索信息方法主題搜索(subjectsearch)主題是用簡(jiǎn)明的術(shù)語(yǔ)或短語(yǔ)描述信息資源的標(biāo)題主題搜索是搜索編輯人員(如圖書管理員)賦予信息資源的標(biāo)題,搜索范圍限定到描述信息資源的術(shù)語(yǔ)或短語(yǔ)關(guān)鍵字搜索(keywordsearch)關(guān)鍵字是用于概括信息資源核心內(nèi)容的字詞關(guān)鍵字詞可出現(xiàn)在標(biāo)題、摘要和正文的任何地方關(guān)鍵字搜索是搜索包含關(guān)鍵字的信息資源5/16/20234.9.1信息搜索工具(2)四種類型的信息搜索工具

(informationsearchtool)網(wǎng)頁(yè)目錄——主題搜索工具網(wǎng)頁(yè)目錄像書前面的目錄,列出每一篇、每一章、每一節(jié)的標(biāo)題和相應(yīng)的頁(yè)碼網(wǎng)頁(yè)索引——關(guān)鍵字搜索工具網(wǎng)頁(yè)索引像英文書后面的索引[1],列出書中所有關(guān)鍵詞和每個(gè)關(guān)鍵字所在的所有頁(yè)碼專題數(shù)據(jù)庫(kù)——基本屬于關(guān)鍵字搜索工具網(wǎng)頁(yè)搜索門戶——主題搜索和關(guān)鍵字搜索相結(jié)合的搜索工具5/16/20235.9.1信息搜索工具(3)1.網(wǎng)頁(yè)索引索引(index)是由關(guān)鍵字和關(guān)聯(lián)數(shù)據(jù)組成的列表,說明信息及其存儲(chǔ)位置網(wǎng)頁(yè)索引(Webindex)是萬維網(wǎng)上的網(wǎng)頁(yè)或網(wǎng)站信息的列表如果把萬維網(wǎng)看成是一本“超大型的書”,那么網(wǎng)頁(yè)索引就是這本書后面的“索引”網(wǎng)頁(yè)索引放在“索引數(shù)據(jù)庫(kù)”里網(wǎng)頁(yè)索引包含“所有”網(wǎng)頁(yè)的關(guān)鍵字和每個(gè)關(guān)鍵字所在的“所有”網(wǎng)頁(yè)地址和簡(jiǎn)短說明按照網(wǎng)頁(yè)索引提供的信息,可找到包含這個(gè)關(guān)鍵字的所有網(wǎng)頁(yè)5/16/20236.9.1信息搜索工具(4)網(wǎng)頁(yè)索引用搜索引擎創(chuàng)建搜索引擎的工作原理搜索引擎(searchengine)是由網(wǎng)爬蟲、索引器、數(shù)據(jù)庫(kù)、查詢和網(wǎng)頁(yè)排名等部件組成的程序

5/16/20237.9.1信息搜索工具(5)搜索網(wǎng)頁(yè):使用網(wǎng)爬蟲(crawlers)/網(wǎng)蜘蛛(spiders)不停地在網(wǎng)上搜索網(wǎng)頁(yè),并將搜索到網(wǎng)頁(yè)暫時(shí)存放到網(wǎng)頁(yè)庫(kù)創(chuàng)建索引:通過索引器(indexer)分析網(wǎng)頁(yè)、抽出詞匯、創(chuàng)建索引,并將索引存入索引數(shù)據(jù)庫(kù),以備用戶查詢接收查詢:當(dāng)用戶查詢時(shí),把查詢請(qǐng)求告訴查詢引擎(queryengine),將查詢結(jié)果返回給用戶搜索引擎可分成兩種類型獨(dú)立搜索引擎(individualsearchengine),簡(jiǎn)稱為搜索引擎,擁有自己的網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù),如Google、必應(yīng)和百度元搜索引擎(metasearchengine),沒有自己的網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù)5/16/20238.9.1信息搜索工具(6)網(wǎng)頁(yè)索引的性能查全率(recall)搜索引擎返回的匹配文檔數(shù)量占所有相匹配文檔總量的比例。例如,總共有100個(gè)相匹配的文檔,搜索引擎只返回其中的80個(gè)文檔,則其查全率是80%查準(zhǔn)率(precision)搜索引擎列出的文檔與查詢內(nèi)容相匹配的程度。列出的匹配文檔越多,說明查準(zhǔn)率越高。例如,搜索引擎列出80個(gè)文檔,若其中有20個(gè)文檔包含搜索字詞,則其查準(zhǔn)率為25%查詢速度查詢速度的衡量比較困難5/16/20239.9.1信息搜索工具(7)網(wǎng)頁(yè)索引的特點(diǎn)網(wǎng)頁(yè)索引是查找網(wǎng)頁(yè)的最好工具,尤其是查找包含關(guān)鍵字(keyword)、短語(yǔ)(phrase)和引述(quote)的網(wǎng)頁(yè)網(wǎng)頁(yè)索引是用搜索引擎創(chuàng)建的,能較及時(shí)地對(duì)新創(chuàng)建和更新的網(wǎng)頁(yè)做索引給用戶返回的查詢結(jié)果中,通常有與查詢請(qǐng)求不相關(guān)或相關(guān)性很小的網(wǎng)頁(yè)雖然創(chuàng)建網(wǎng)頁(yè)索引的原理相同,但各個(gè)公司開發(fā)的搜索引擎的性能不同,包括搜索速度、搜索范圍、搜索算法和排名算法,呈現(xiàn)給用戶的結(jié)果也就不同。雖然差別不是很大,但比較明顯5/16/202310.9.1信息搜索工具(8)2.網(wǎng)頁(yè)目錄(Webdirectory)網(wǎng)頁(yè)目錄主要是由編輯人員按主題人工創(chuàng)建的網(wǎng)頁(yè)分類目錄,不是用網(wǎng)上機(jī)器人自動(dòng)生成的網(wǎng)頁(yè)分類目錄,也稱主題目錄(subjectdirectory)編輯人員按照某些準(zhǔn)則,對(duì)網(wǎng)站進(jìn)行審核,確定是否要編入到目錄,并按主題對(duì)網(wǎng)頁(yè)進(jìn)行分類,然后輸入到數(shù)據(jù)庫(kù),以供用戶使用主題目錄是網(wǎng)頁(yè)搜索工具,但不是網(wǎng)頁(yè)索引工具主題目錄是圖書館中早已有之的圖書資料管理方法如把萬維網(wǎng)看成是一本超大型圖書,網(wǎng)頁(yè)目錄就是這本書前面的目錄網(wǎng)頁(yè)目錄的編排和布局則不一定像書目錄那樣千篇一律5/16/202311.9.1信息搜索工具(9)網(wǎng)頁(yè)目錄的結(jié)構(gòu)網(wǎng)頁(yè)目錄通常采用分層結(jié)構(gòu)層次越高的主題,覆蓋的網(wǎng)頁(yè)范圍越大層次越低的主題,覆蓋的網(wǎng)頁(yè)范圍越小最低層的主題就是具體的網(wǎng)頁(yè)信息,包括網(wǎng)頁(yè)名稱、說明和網(wǎng)址網(wǎng)頁(yè)目錄在網(wǎng)頁(yè)上呈現(xiàn)的形式基本上都是二維的有的主題(主目錄)在窗口的左側(cè),列表(子目錄)在窗口右側(cè)有的主題(主目錄)在窗口上部,列表(子目錄)在窗口的下部有的主題放在按鈕上,而列表(子目錄)在下拉菜單上5/16/202312.9.1信息搜索工具(10)網(wǎng)頁(yè)目錄示例(2010年2月)(/)5/16/202313.9.1信息搜索工具(11)網(wǎng)頁(yè)目錄的特點(diǎn)可更有針對(duì)性地快速獲取某個(gè)主題的概貌需要高水平的編輯人員、選編網(wǎng)頁(yè)時(shí)不抱成見信息質(zhì)量比較高,與查詢請(qǐng)求的相關(guān)性比較大網(wǎng)頁(yè)目錄結(jié)構(gòu)很清晰,瀏覽很方便呈現(xiàn)給用戶的網(wǎng)頁(yè)數(shù)目比搜索引擎提供的少瀏覽網(wǎng)頁(yè)目錄時(shí),需要多次點(diǎn)擊連接對(duì)象才能找到具體的網(wǎng)頁(yè)信息網(wǎng)頁(yè)目錄更新周期長(zhǎng),而網(wǎng)頁(yè)地址變動(dòng)快5/16/202314.9.1信息搜索工具(12)3.專題數(shù)據(jù)庫(kù)1.數(shù)據(jù)庫(kù)是什么數(shù)據(jù)庫(kù)(database)由數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMS)創(chuàng)建和管理的數(shù)據(jù)集合,可快速和準(zhǔn)確地搜索和獲取所需的信息DBMS是數(shù)據(jù)庫(kù)和用戶之間的接口軟件,用于組織、創(chuàng)建、存儲(chǔ)、修改、查詢、搜索、分類、備份、格式和打印數(shù)據(jù)庫(kù)中的數(shù)據(jù),維護(hù)數(shù)據(jù)的安全和數(shù)據(jù)的完整性數(shù)據(jù)庫(kù)中的數(shù)據(jù)以記錄(record)形式組織每一個(gè)記錄包含若干個(gè)域(field),每個(gè)域都有自己的名稱和數(shù)據(jù)類型[1]優(yōu)點(diǎn)是便于搜索、排序、重新組合或其他操作5/16/202315.9.1信息搜索工具(13)數(shù)據(jù)庫(kù)中的記錄組成示例域名(field)作者(author)書名(title)出版商(publisher)出版地(placeofpublication)日期(date)頁(yè)數(shù)(page)記錄1………………記錄2……………………記錄n………………5/16/202316.9.1信息搜索工具(14)2.專題數(shù)據(jù)庫(kù)(specializeddatabase)也稱專業(yè)數(shù)據(jù)庫(kù),垂直門戶——vortal(verticalportal的簡(jiǎn)寫)針對(duì)某個(gè)題目收集的資料庫(kù)由各行各業(yè)的專家、教授、研究人員、政府機(jī)構(gòu)、商業(yè)團(tuán)體創(chuàng)建,他們對(duì)某個(gè)特定題目有專門的知識(shí)和深入的研究提供的信息和資料極具權(quán)威性專題數(shù)據(jù)庫(kù)類型公共數(shù)據(jù)庫(kù)(publicdatabase):包含公共資料,由政府機(jī)構(gòu)和非營(yíng)利組織管理和維護(hù),通常出現(xiàn)在Web上私有數(shù)據(jù)庫(kù)(proprietarydatabase)/商業(yè)數(shù)據(jù)庫(kù)(businessdatabase):包含公共數(shù)據(jù)庫(kù)中沒有的專業(yè)資料,由公司管理和維護(hù),通常需要賬戶或授權(quán)的IP地址才能登錄和使用5/16/202317.9.1信息搜索工具(15)3.專題數(shù)據(jù)庫(kù)示例ScienceDirect/

/

世界著名的學(xué)術(shù)期刊出版商荷蘭Elsevier公司出版的全文數(shù)據(jù)庫(kù)收錄1995年以來Elsevier出版的1600多種電子期刊,原文以html和pdf格式存儲(chǔ)該數(shù)據(jù)庫(kù)涵蓋20多個(gè)學(xué)科,包括數(shù)學(xué)、物理學(xué)、化學(xué)、天文學(xué)、醫(yī)學(xué)、生物化學(xué)、生命科學(xué)、計(jì)算機(jī)科學(xué)、環(huán)境科學(xué)、材料科學(xué)、社會(huì)科學(xué)、工程和技術(shù)、能源和動(dòng)力等既可搜索又可瀏覽,打印也很方便5/16/202318.9.1信息搜索工具(16)WebofScience數(shù)據(jù)庫(kù)WebofScience的用戶界面(2010-01-26)5/16/202319.9.1信息搜索工具(17)5.網(wǎng)頁(yè)搜索門戶網(wǎng)頁(yè)門戶(Webportal)企業(yè)創(chuàng)建和維護(hù)的按主題分類的網(wǎng)頁(yè)目錄向用戶提供的服務(wù)包括新聞、天氣預(yù)報(bào)、電子郵件、討論組、在線購(gòu)物、娛樂站點(diǎn)和與其他站點(diǎn)的鏈接門戶網(wǎng)站(Webportal('s)site)支持“網(wǎng)頁(yè)門戶”的網(wǎng)站它將各種應(yīng)用系統(tǒng)、數(shù)據(jù)資源集成到服務(wù)機(jī)上國(guó)內(nèi)的門戶網(wǎng)站:新浪、網(wǎng)易、搜狐、騰訊QQ、Tom、鳳凰網(wǎng)、新華網(wǎng)、阿里巴巴、中華網(wǎng)和中國(guó)網(wǎng)絡(luò)電視臺(tái)等Web網(wǎng)站[1]都應(yīng)屬于“門戶網(wǎng)站”,有大有小5/16/202320.9.1信息搜索工具(18)網(wǎng)頁(yè)搜索門戶(Websearchportal)網(wǎng)頁(yè)門戶和網(wǎng)頁(yè)索引相結(jié)合的信息搜索工具,如GoogleDirectory

/MSN

/,/Yahoo!Search

/,/

Gigablast

/5/16/202321.9.2信息搜索方法成功的信息搜索需要兩個(gè)方面的努力,一個(gè)是提高搜索工具的性能,另一個(gè)是提高使用搜索工具的技能在提高搜索工具性能方面,科學(xué)技術(shù)人員已經(jīng)做了非常出色的工作,而且還在孜孜不倦地繼續(xù)努力在提高使用搜索工具的水平方面,除了要理解搜索工具的知識(shí)外,還要靠自己在實(shí)踐中不斷地摸索、總結(jié)和提高5/16/202322.9.2信息搜索方法(1)信息搜索過程信息搜索過程可歸納為五個(gè)步驟:充分準(zhǔn)備、明智決策、細(xì)心構(gòu)思、用好工具和反復(fù)查詢信息搜索的概念5/16/202323.9.2信息搜索方法(2)1.充分準(zhǔn)備:信息描述語(yǔ)句描述語(yǔ)句:用關(guān)鍵字詞描述要搜索的信息搜索范圍:可添加時(shí)間、地點(diǎn)或其他條件,使描述語(yǔ)句更接近你的查詢意圖2.明智決策:用什么搜索工具瀏覽主題概貌宜先用網(wǎng)頁(yè)目錄查找特定信息宜先用網(wǎng)頁(yè)索引查找專業(yè)信息宜先用專題數(shù)據(jù)庫(kù),如中國(guó)國(guó)家圖書館(/)北京大學(xué)圖書館(/)清華大學(xué)圖書館(/)5/16/202324.9.2信息搜索方法(3)3.精心構(gòu)思:查詢語(yǔ)句查詢語(yǔ)句是由描述性短語(yǔ)由運(yùn)算符/操作符/標(biāo)識(shí)符和操作對(duì)象組成查詢語(yǔ)句是表達(dá)查詢請(qǐng)求/查詢條件的方法如選擇網(wǎng)頁(yè)目錄(即主題搜索),無需構(gòu)思查詢語(yǔ)句如選擇關(guān)鍵字搜索,則需構(gòu)思查詢語(yǔ)句查詢請(qǐng)求英文中文查詢語(yǔ)句網(wǎng)頁(yè)數(shù)查詢語(yǔ)句網(wǎng)頁(yè)數(shù)同時(shí)包含“貓”和“老鼠”catmouse貓老鼠包含“貓”或“老鼠”catORmouse貓OR老鼠包含“貓”但不含“老鼠”cat–mouse貓-老鼠“貓”和“老鼠”彼此相鄰catADJmouse貓ADJ老鼠5/16/202325.9.2信息搜索方法(4)4.巧用域名:限定搜索范圍在只用一二個(gè)關(guān)鍵字搜索信息時(shí),返回給用戶的信息可能遠(yuǎn)遠(yuǎn)多于想要的信息限定搜索范圍的選項(xiàng)——限定域(limitfield),其名稱叫“域名(fieldname)”。常見域名,語(yǔ)言域:限定使用的語(yǔ)言,如中文,英文,日文文件格式域:限定文件類型,如.doc,.pdf,.ppt,.xls時(shí)間域:限定日期,如年限,時(shí)間段網(wǎng)域:限定網(wǎng)站的域名,如.com,.edu,.gov限定出版類型,如圖書,期刊,文章摘要不同搜索工具支持的限定域的數(shù)目和類型相差較大5/16/202326.9.2信息搜索方法(5)5.反復(fù)推敲:精練查詢結(jié)果一次搜索就獲得滿意的查詢結(jié)果往往做不到查找信息需要用戶不斷調(diào)整查詢策略和查詢語(yǔ)句,通過多次查詢以改善查詢結(jié)果返回信息太多可用前面介紹的方法,調(diào)整查詢請(qǐng)求后再搜索返回信息太少可重新選擇搜索術(shù)語(yǔ),如選擇與關(guān)鍵字詞同義的字詞,調(diào)整查詢請(qǐng)求后再搜索5/16/202327.9.2信息搜索方法(6)搜索引擎數(shù)學(xué)(searchenginemath)構(gòu)造查詢語(yǔ)句的數(shù)學(xué)目的是精煉和控制查詢語(yǔ)句,以改進(jìn)搜索結(jié)果主要是布爾邏輯查詢語(yǔ)句中的字詞用運(yùn)算符連接,連接方法直接輸入:在搜索工具的搜索框中,輸入搜索字詞的同時(shí)輸入運(yùn)算符使用對(duì)話框:在搜索工具的對(duì)話框中,讓用戶選擇選項(xiàng),無需直接輸入運(yùn)算符網(wǎng)頁(yè)索引工具(如Google、必應(yīng)和百度)對(duì)以上兩種方法都支持,但筆者感覺使用Google最方便,效果最好,其次是必應(yīng)5/16/202328.9.2信息搜索方法(7)1.使用運(yùn)算符構(gòu)造查詢語(yǔ)句運(yùn)算符給多個(gè)對(duì)象施加運(yùn)算的符號(hào)或字符兩種運(yùn)算符布爾運(yùn)算符:AND(與)、OR(或)、NOT(非)、NEAR(相近)和ADJ(相鄰)。算術(shù)運(yùn)算符:加號(hào)(+)和減號(hào)(-)大多數(shù)搜索引擎都使用5/16/202329.運(yùn)算符查找的文件(查詢意圖)使用舉例加號(hào)(+)

或AND包含所有搜索字詞蘋果AND香蕉;appleANDbanana+蘋果

+香蕉;+apple+banana減號(hào)(-)

或NOT不包含指定搜索字詞水果NOT香蕉;fruitNOTbanana水果–香蕉;fruit-bananaOR搜索包含任一個(gè)搜索字詞蘋果OR香蕉;appleORbananaNEAR*包含兩個(gè)字詞彼此相近,次序不限糧食NEAR浪費(fèi)

multimediaNEARWindowsADJ*包含兩個(gè)字詞彼此相鄰,次序不限糧食ADJ浪費(fèi)

multimediaADJtutorial布爾運(yùn)算符和算術(shù)運(yùn)算符的含義及使用示例9.2信息搜索方法(8)5/16/202330.9.2信息搜索方法(9)2.使用引號(hào)標(biāo)識(shí)特定短語(yǔ)使用雙引號(hào)標(biāo)識(shí)特定短語(yǔ)是非常有效的方法【例1】在Google的搜索框中,分別輸入帶雙引號(hào)的“少壯不努力老大徒傷悲”和不帶雙引號(hào)的少壯不努力老大徒傷悲,查詢結(jié)果差別很大【例2】在必應(yīng)搜索框中,分別輸入帶英文雙引號(hào)“multimedialiteracy”和不帶雙引號(hào)的multimedialiteracy,查詢結(jié)果差別很大3.使用圓括號(hào)構(gòu)造復(fù)雜查詢語(yǔ)句當(dāng)兩個(gè)搜索字詞(如W和X)用運(yùn)算符連接而又想把W和X當(dāng)作一組看待時(shí),可用圓括號(hào)表示【例】如想搜索包含W不包含X,但同時(shí)包含Y的網(wǎng)頁(yè),查詢語(yǔ)句可為(W-X)+Y。讀者可分別在Google、必應(yīng)和百度的搜索框中鍵入(貓-老鼠)游戲,比較查詢結(jié)果5/16/202331.9.2信息搜索方法(10)4.注意關(guān)鍵字的次序把最重要的關(guān)鍵字放在查詢條件前面【例】使用Google分別查詢“貓和老鼠”與“老鼠和貓”的網(wǎng)頁(yè),將得到不同的查詢結(jié)果5.使用通配符構(gòu)造查詢語(yǔ)句在查詢語(yǔ)句中可使用通配符。通配符有兩個(gè)問號(hào)(?):表示任何其他單個(gè)字符星號(hào)(*):表示一個(gè)或多個(gè)字符【例1】查詢掃除?盲將返回包含“掃除科盲”和“掃除網(wǎng)盲”的網(wǎng)頁(yè)信息【例2】查詢掃除*盲將返回包含“掃除科盲”、“掃除電腦盲”和“掃除理財(cái)盲”的網(wǎng)頁(yè)信息5/16/202332.9.2信息搜索方法(11)信息搜索概念圖概念(concept)從事物或事件中抽象出來加以概括得到的一般性想法概念圖(conceptmap)用圖形方法表達(dá)想法的方法,它包含一個(gè)核心思想、若干個(gè)相關(guān)想法以及它們之間的關(guān)系信息搜索概念圖(conceptmapforinformationsearching)用圖形方式表達(dá)搜索信息的方法,在查找信息過程中,可幫助我們做決策和構(gòu)思查詢語(yǔ)句注意事項(xiàng)不要在第一次查詢時(shí)就用復(fù)雜的查詢語(yǔ)句,而是要用最重要的概念或關(guān)鍵字詞構(gòu)造的比較簡(jiǎn)單的查詢語(yǔ)句,根據(jù)第一次查詢結(jié)果,逐漸調(diào)整查詢策略和查詢語(yǔ)句5/16/202333.9.2信息搜索方法(12)信息搜索概念圖5/16/202334.9.3網(wǎng)頁(yè)評(píng)估方法(1)評(píng)估的重要性傳統(tǒng)出版物的特點(diǎn)傳統(tǒng)出版物包括報(bào)紙、雜志和圖書等來源比較可靠,質(zhì)量相對(duì)較高。經(jīng)過反復(fù)審查、多次校對(duì)后才允許印刷和發(fā)行,而且都有名有姓、圖書編號(hào)(ISBN)、責(zé)任編輯、責(zé)任校對(duì)、出版社、通信地址等至于造假和抄襲等問題,則另當(dāng)別論網(wǎng)頁(yè)的創(chuàng)建和傳播特點(diǎn)誰(shuí)都可以寫網(wǎng)頁(yè),誰(shuí)都可以發(fā)表文章,你看到的網(wǎng)頁(yè)往往是無名無姓,無年月日,沒有出處,其內(nèi)容是真是假、來源是否可靠、信息是否有用等都是要考慮的問題在利用所獲內(nèi)容之前,搞清楚這些問題非常有必要,而且目前主要還得要靠自己去把握5/16/202335.9.3網(wǎng)頁(yè)評(píng)估方法(2)網(wǎng)頁(yè)評(píng)估方法網(wǎng)頁(yè)評(píng)估需要綜合分析至少五個(gè)方面的信息1.查看網(wǎng)頁(yè)來源根據(jù)網(wǎng)頁(yè)所在網(wǎng)站的域名,分析網(wǎng)站所屬國(guó)家或地區(qū),網(wǎng)站類型,目的是查看網(wǎng)站的信譽(yù)度網(wǎng)頁(yè)來源可在瀏覽器的地址欄(URL)中看到。例如/:屬美國(guó),商業(yè)類,微軟在中國(guó)的網(wǎng)站/:屬中國(guó),教育類,教育網(wǎng)站/:屬美國(guó),教育類,麻省理工學(xué)院網(wǎng)站/:屬美國(guó),政府類,白宮網(wǎng)站網(wǎng)站版權(quán)和介紹對(duì)分析來源及其可靠性也很重要回答的問題:該網(wǎng)站的信譽(yù)度如何?需要該網(wǎng)站提供的內(nèi)容嗎?5/16/202336.9.3網(wǎng)頁(yè)評(píng)估方法(3)2.查看網(wǎng)頁(yè)作者查看網(wǎng)頁(yè)作者可輔助評(píng)估網(wǎng)頁(yè)的真實(shí)性網(wǎng)頁(yè)作者應(yīng)是負(fù)責(zé)任的個(gè)人、公司、政府機(jī)構(gòu)或其他組織負(fù)責(zé)任的作者和較有名的網(wǎng)站,通常可找到網(wǎng)頁(yè)作者的署名,包括所在單位聯(lián)系方式:電話、地址、電子郵箱(mailto)網(wǎng)頁(yè)最后修改日期回答的問題:作者對(duì)此主題有專門研究嗎?5/16/202337.9.3網(wǎng)頁(yè)評(píng)估方法(4)3.查看網(wǎng)頁(yè)內(nèi)容衡量準(zhǔn)則因人而異網(wǎng)頁(yè)內(nèi)容各種各樣,每個(gè)人的文化背景和經(jīng)歷不同,對(duì)網(wǎng)頁(yè)內(nèi)容的看法自然就有差別要盡力做到不抱成見每個(gè)人都有偏見,自然傾向于接受支持自己觀點(diǎn)的信息,這是常人的特性。如抱偏見閱讀網(wǎng)頁(yè),就容易上當(dāng)受騙回答的問題:網(wǎng)頁(yè)上的論述言之有理嗎?信息是客觀的還是主觀的?信息是片面的還是全面的?5/16/202338.9.3網(wǎng)頁(yè)評(píng)估方法(5)4.查看類似網(wǎng)頁(yè)對(duì)于同樣一件事情、同樣一個(gè)問題,往往有很多類似的網(wǎng)頁(yè)許多類似網(wǎng)頁(yè)的作者是同行,他們的網(wǎng)頁(yè)可能發(fā)表在相同的普通頂級(jí)域名(如edu)的網(wǎng)站上同行內(nèi)的能人很多,多看幾個(gè)這種作者的網(wǎng)頁(yè),對(duì)網(wǎng)頁(yè)內(nèi)容的理解和評(píng)估會(huì)更全面,理解更深入,看法更準(zhǔn)確“外行”作者的見解可能更客觀,對(duì)網(wǎng)頁(yè)內(nèi)容的評(píng)估也很有幫助回答的問題:還有哪些網(wǎng)頁(yè)值得參考?5/16/202339.9.3網(wǎng)頁(yè)評(píng)估方法(6)5.查看網(wǎng)頁(yè)變動(dòng)對(duì)原理性、基本知識(shí)和基本事實(shí)的介紹,通常經(jīng)得起時(shí)間考驗(yàn),網(wǎng)頁(yè)變動(dòng)也不大。例如,許多大學(xué)的輔助教學(xué)網(wǎng)站,幾年前創(chuàng)建的網(wǎng)頁(yè)保留到現(xiàn)在如研究課題的時(shí)效性很強(qiáng),就要查看網(wǎng)頁(yè)發(fā)表的時(shí)間,網(wǎng)頁(yè)修改的時(shí)間,利用這些信息可輔助網(wǎng)頁(yè)的評(píng)估。許多網(wǎng)頁(yè)都沒有提供這種信息,但在主頁(yè)底部的版權(quán)信息中,往往有“Copyright?20??”,利用這些信息也可推斷網(wǎng)頁(yè)的創(chuàng)建日期和修改日期回答的問題:網(wǎng)頁(yè)是什么時(shí)候?qū)懙模烤W(wǎng)頁(yè)內(nèi)容最近有無變動(dòng)?參考或引用是否合適?5/16/202340.9.4網(wǎng)頁(yè)搜索方法網(wǎng)頁(yè)搜索使用網(wǎng)頁(yè)搜索工具查找包含所需信息的網(wǎng)頁(yè)的過程網(wǎng)頁(yè)搜索工具指網(wǎng)頁(yè)目錄、網(wǎng)頁(yè)索引和網(wǎng)頁(yè)搜索門戶網(wǎng)頁(yè)目錄的操作相對(duì)容易,而網(wǎng)頁(yè)索引的操作相對(duì)復(fù)雜5/16/202341.9.4網(wǎng)頁(yè)搜索方法(1)部分常見網(wǎng)頁(yè)搜索引擎1.國(guó)內(nèi)常見網(wǎng)頁(yè)搜索工具百度()必應(yīng)()谷歌(.hk/)搜狗()搜狐(/)網(wǎng)易(/)新浪(/)5/16/202342.9.4網(wǎng)頁(yè)搜索方法(2)2.國(guó)外常見網(wǎng)頁(yè)搜索工具AOL(),支持中文AskJeeves(/),支持中文DuckDuckGo(/)Google(/),在英文瀏覽器中使用,支持中文Lycos()OpenDirectoryProject(ODP)(/)Yahoo(/search/)5/16/202343.9.4網(wǎng)頁(yè)搜索方法(3)一般操作1.養(yǎng)成閱讀幫助文件的習(xí)慣網(wǎng)頁(yè)索引工具都有一些自己定義的使用規(guī)則,“幫助”文件是了解使用規(guī)則最直接的“老師”。不少用戶忽視幫助文件,自認(rèn)為搜索工具用得很好一般操作示例5/16/202344.9.4網(wǎng)頁(yè)搜索方法(4)高級(jí)搜索查找“我國(guó)教育域名下計(jì)算機(jī)文化課程的ppt文件”5/16/202345.9.5圖像搜索方法圖像搜索圖像搜索通過圖像搜索工具查找所需圖像文件的過程圖像搜索工具主要是指圖像目錄和圖像索引搜索圖像與搜索網(wǎng)頁(yè)類似目前搜索圖像主要是通過描述圖像文件的關(guān)鍵字通過描述圖像的可視特性來搜索圖像的技術(shù)還不太成熟,可作為搜索圖像的輔助手段5/16/202346.9.5圖像搜索方法(1)圖像目錄圖像目錄是以人工為主創(chuàng)建的圖像主題分類目錄網(wǎng)站導(dǎo)航或網(wǎng)頁(yè)搜索門戶幾乎都有“圖片[1]”、“圖片瀏覽”或“壁紙圖片”等圖片目錄許多圖像目錄工具還有“搜索”或“檢索”功能,但通常局限于搜索當(dāng)前目錄下的圖片典型的圖片目錄都是用分層結(jié)構(gòu)來組織圖片,一層表示一個(gè)主題,層次越低,主題覆蓋的范圍越窄

5/16/202347.9.5圖像搜索方法(2)百度的圖片目錄5/16/202348.9.5圖像搜索方法(3)Google的圖像目錄5/16/202349.9.5圖像搜索方法(4)專題圖像數(shù)據(jù)庫(kù)針對(duì)某個(gè)主題專門收集的圖像集合,也稱專業(yè)圖像數(shù)據(jù)庫(kù)。例如全球著名的醫(yī)學(xué)圖像庫(kù)——Theonlineencyclopediaofmedicalimage,從2010元旦開始成為SpringerImages[2]圖像庫(kù)的一部分華盛頓州立大學(xué)的獸醫(yī)和動(dòng)物圖像數(shù)據(jù)庫(kù)——ImageDataBase,CollegeofVeterinaryMedicine,WashingtonStateUniversity使用關(guān)鍵字查找時(shí),找到的圖像在這個(gè)圖像數(shù)據(jù)庫(kù)中,無需訪問其他網(wǎng)站5/16/202350.9.5圖像搜索方法(5)醫(yī)學(xué)圖像百科全書(/imagesMD/)專題圖像數(shù)據(jù)庫(kù)示例(2010年1月27日)5/16/202351.9.5圖像搜索方法(6)獸醫(yī)和動(dòng)物圖像數(shù)據(jù)庫(kù)(/)專題圖像數(shù)據(jù)庫(kù)示例(2010年1月27日)5/16/202352.9.5圖像搜索方法(7)圖像索引方法1.使用文字編輯圖像索引使用描述圖像的文字編輯圖像索引的學(xué)術(shù)名稱叫做“基于文字的(text-based)圖像索引”,其核心思想是用描述圖片的文字來編輯圖像索引由于網(wǎng)頁(yè)上的圖片通常有圖片名稱,在圖片周圍有文字說明,在其相應(yīng)的HTML文檔中,有圖片文件的名稱、圖像存儲(chǔ)格式和網(wǎng)址等信息,根據(jù)這些信息就可用文字對(duì)圖片進(jìn)行標(biāo)注,如圖片的名稱、網(wǎng)址和大小,這就是圖像文件信息的索引5/16/202353.9.5圖像搜索方法(8)5/16/202354.9.5圖像搜索方法(9)2.使用可視特性做索引使用可視特性做圖像索引的學(xué)術(shù)名稱叫做“基于內(nèi)容的圖像索引(content-basedimageindexing)”/根據(jù)圖像內(nèi)容編索引可視特性/圖像內(nèi)容指圖像的顏色、紋理、形狀、對(duì)象間的空間關(guān)系的統(tǒng)計(jì)數(shù)據(jù)讓計(jì)算機(jī)替我們描述圖像內(nèi)容和自動(dòng)編索引,需要開發(fā)自動(dòng)識(shí)別圖像內(nèi)容的算法——基于內(nèi)容的圖像檢索(content-basedimageretrieval,CBIR)實(shí)現(xiàn)CBIR的系統(tǒng)叫做“基于內(nèi)容的圖像搜索引擎(content-basedimagesearchengine)”5/16/202355.9.5圖像搜索方法(10)圖像索引工具1.部分圖像索引工具圖像索引工具很多。例如,Google和必應(yīng)的圖像索引對(duì)中英文都支持得很好,雅虎、百度和搜狗等搜索引擎都有圖像索引的功能Picsearch:Picsearch公司開發(fā)的圖像搜索引擎,提供圖像、影視和音樂搜索服務(wù),2005年首次推出,支持中文TinEye:IdéeInc公司開發(fā)的圖像搜索引擎,這個(gè)搜索引擎是“逆向圖像搜索(TinEyeReverseImageSearchEngine[1])”。2008年5月開始為用戶提供圖像搜索服務(wù)。搜索圖像時(shí)不是輸入關(guān)鍵字,而是上載圖像,目的是查找與上載圖像類似的或被修改過的圖像5/16/202356.9.5圖像搜索方法(11)Picsearch圖像索引界面

(/,/)圖像索引工具示例(2010年1月27日)5/16/202357.9.5圖像搜索方法(12)(b)TinEye圖像索引界面(/)圖像索引工具示例(2010年1月27日)5/16/202358.9.5圖像搜索方法(13)2.圖像索引工具的操作搜索圖像的操作與搜索網(wǎng)頁(yè)的操作類似在使用圖像索引工具之前先看幫助文件,因不同圖像索引工具支持的搜索引擎數(shù)學(xué)和限定搜索范圍的域名不同Google圖片搜索工具的用法(2010年1月27日)5/16/202359.9.5圖像搜索方法(14)查詢“兔子”圖片必應(yīng)圖片搜索工具的用法(2010年1月27日)5/16/202360.9.5圖像搜索方法(15)有關(guān)兔子的介紹必應(yīng)圖片搜索工具的用法(2010年1月27日)5/16/202361.9.6影視搜索方法(1)影視目錄(videodirectory)[1]以人工為主創(chuàng)建的主題分類目錄影視目錄下的文件主要是電影、連續(xù)劇和電視節(jié)目等網(wǎng)站導(dǎo)航的主頁(yè)都有“視頻”、“影視”或“電視”選項(xiàng)網(wǎng)上影視的目錄結(jié)構(gòu)網(wǎng)站導(dǎo)航\影視\影視網(wǎng)站\影視目錄\影視節(jié)目,其中的“網(wǎng)站導(dǎo)航”為影視節(jié)目的根目錄影視目錄通常也有“搜索”功能,但只是搜索網(wǎng)站內(nèi)部的影視節(jié)目搜索影視節(jié)目使用關(guān)鍵字詞,如影視節(jié)目的名稱、演員或其他關(guān)鍵字詞5/16/202362.9.6影視搜索方法(2)網(wǎng)站導(dǎo)航-影視(視頻)-影視網(wǎng)站目錄示例(/Shipin_Boke/)(2010年1月27日)

5/16/202363.9.6影視搜索方法(3)影視的索引方法影視索引是影視搜索引擎(videsearchengine)創(chuàng)建的索引影視搜索引擎是專門在網(wǎng)上收集影視文件并對(duì)其編索引的系統(tǒng)創(chuàng)建影視索引的方法有兩種使用文字使用影視的視聽特性5/16/202364.9.6影視搜索方法(4)1.使用文字編輯影視索引影視索引使用文字使用文字編輯影視索引的學(xué)術(shù)名稱,其核心思想是用描述影視文件的文字編輯影視索引影視節(jié)目通常都有比較詳細(xì)的文字說明,包括影視名稱、內(nèi)容簡(jiǎn)介和演員列表,這些內(nèi)容都會(huì)出現(xiàn)在其相應(yīng)的HTML文檔中。根據(jù)這些信息就可用文字對(duì)影視進(jìn)行標(biāo)注,如節(jié)目名稱和網(wǎng)址,這樣就得到影視節(jié)目的索引用描述影視的文字編索引是對(duì)整部影視節(jié)目的,對(duì)其內(nèi)部鏡頭[1]的描述需用影視的視聽特性5/16/202365.9.6影視搜索方法(5)2.使用視聽特性做影視索引可視特性影視由連續(xù)圖像構(gòu)成,具有空間和時(shí)間的可視特性空間可視特性體現(xiàn)在圖像的顏色、紋理和形狀時(shí)間可視特性體現(xiàn)在圖像隨時(shí)間發(fā)生的變化【例】球場(chǎng)上的運(yùn)動(dòng)員在不停跑動(dòng),新聞聯(lián)播中播音員的嘴和表情在不斷變化,電視連續(xù)劇中的背景變化比較緩慢可聽特性影視或錄像通常有對(duì)話、解說、音樂和背景等聲音,這是聽覺系統(tǒng)可感知的信息讓配音參與影視索引的基本想法是把聲音轉(zhuǎn)換

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論