版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
多媒體文化基礎(chǔ)
網(wǎng)上信息搜索清華大學(xué)計算機科學(xué)與技術(shù)系5/16/20231.第9章網(wǎng)上信息搜索9.1信息搜索工具9.2信息搜索方法9.3網(wǎng)頁評估方法9.4網(wǎng)頁搜索方法9.5圖像搜索方法9.6影視搜索方法9.7音樂搜索方法9.8多媒體搜索引擎5/16/20232.概要網(wǎng)上信息是網(wǎng)上文件所含內(nèi)容的描述網(wǎng)上信息(web-basedinformation)網(wǎng)上信息搜索是查找多媒體文件信息的過程文字搜索(textsearch[1])——搜索文字文件的信息圖像搜索(imagesearch)——搜索圖像文件的信息聲音搜索(audiosearch)——搜索聲音文件的信息視像搜索(videosearch)——搜索影視文件的信息信息搜索的必備知識搜索工具有哪些搜索工具的特性搜索信息的方法搜索工具的使用5/16/20233.9.1信息搜索工具(1)兩種類型的搜索信息方法主題搜索(subjectsearch)主題是用簡明的術(shù)語或短語描述信息資源的標(biāo)題主題搜索是搜索編輯人員(如圖書管理員)賦予信息資源的標(biāo)題,搜索范圍限定到描述信息資源的術(shù)語或短語關(guān)鍵字搜索(keywordsearch)關(guān)鍵字是用于概括信息資源核心內(nèi)容的字詞關(guān)鍵字詞可出現(xiàn)在標(biāo)題、摘要和正文的任何地方關(guān)鍵字搜索是搜索包含關(guān)鍵字的信息資源5/16/20234.9.1信息搜索工具(2)四種類型的信息搜索工具
(informationsearchtool)網(wǎng)頁目錄——主題搜索工具網(wǎng)頁目錄像書前面的目錄,列出每一篇、每一章、每一節(jié)的標(biāo)題和相應(yīng)的頁碼網(wǎng)頁索引——關(guān)鍵字搜索工具網(wǎng)頁索引像英文書后面的索引[1],列出書中所有關(guān)鍵詞和每個關(guān)鍵字所在的所有頁碼專題數(shù)據(jù)庫——基本屬于關(guān)鍵字搜索工具網(wǎng)頁搜索門戶——主題搜索和關(guān)鍵字搜索相結(jié)合的搜索工具5/16/20235.9.1信息搜索工具(3)1.網(wǎng)頁索引索引(index)是由關(guān)鍵字和關(guān)聯(lián)數(shù)據(jù)組成的列表,說明信息及其存儲位置網(wǎng)頁索引(Webindex)是萬維網(wǎng)上的網(wǎng)頁或網(wǎng)站信息的列表如果把萬維網(wǎng)看成是一本“超大型的書”,那么網(wǎng)頁索引就是這本書后面的“索引”網(wǎng)頁索引放在“索引數(shù)據(jù)庫”里網(wǎng)頁索引包含“所有”網(wǎng)頁的關(guān)鍵字和每個關(guān)鍵字所在的“所有”網(wǎng)頁地址和簡短說明按照網(wǎng)頁索引提供的信息,可找到包含這個關(guān)鍵字的所有網(wǎng)頁5/16/20236.9.1信息搜索工具(4)網(wǎng)頁索引用搜索引擎創(chuàng)建搜索引擎的工作原理搜索引擎(searchengine)是由網(wǎng)爬蟲、索引器、數(shù)據(jù)庫、查詢和網(wǎng)頁排名等部件組成的程序
5/16/20237.9.1信息搜索工具(5)搜索網(wǎng)頁:使用網(wǎng)爬蟲(crawlers)/網(wǎng)蜘蛛(spiders)不停地在網(wǎng)上搜索網(wǎng)頁,并將搜索到網(wǎng)頁暫時存放到網(wǎng)頁庫創(chuàng)建索引:通過索引器(indexer)分析網(wǎng)頁、抽出詞匯、創(chuàng)建索引,并將索引存入索引數(shù)據(jù)庫,以備用戶查詢接收查詢:當(dāng)用戶查詢時,把查詢請求告訴查詢引擎(queryengine),將查詢結(jié)果返回給用戶搜索引擎可分成兩種類型獨立搜索引擎(individualsearchengine),簡稱為搜索引擎,擁有自己的網(wǎng)頁索引數(shù)據(jù)庫,如Google、必應(yīng)和百度元搜索引擎(metasearchengine),沒有自己的網(wǎng)頁索引數(shù)據(jù)庫5/16/20238.9.1信息搜索工具(6)網(wǎng)頁索引的性能查全率(recall)搜索引擎返回的匹配文檔數(shù)量占所有相匹配文檔總量的比例。例如,總共有100個相匹配的文檔,搜索引擎只返回其中的80個文檔,則其查全率是80%查準(zhǔn)率(precision)搜索引擎列出的文檔與查詢內(nèi)容相匹配的程度。列出的匹配文檔越多,說明查準(zhǔn)率越高。例如,搜索引擎列出80個文檔,若其中有20個文檔包含搜索字詞,則其查準(zhǔn)率為25%查詢速度查詢速度的衡量比較困難5/16/20239.9.1信息搜索工具(7)網(wǎng)頁索引的特點網(wǎng)頁索引是查找網(wǎng)頁的最好工具,尤其是查找包含關(guān)鍵字(keyword)、短語(phrase)和引述(quote)的網(wǎng)頁網(wǎng)頁索引是用搜索引擎創(chuàng)建的,能較及時地對新創(chuàng)建和更新的網(wǎng)頁做索引給用戶返回的查詢結(jié)果中,通常有與查詢請求不相關(guān)或相關(guān)性很小的網(wǎng)頁雖然創(chuàng)建網(wǎng)頁索引的原理相同,但各個公司開發(fā)的搜索引擎的性能不同,包括搜索速度、搜索范圍、搜索算法和排名算法,呈現(xiàn)給用戶的結(jié)果也就不同。雖然差別不是很大,但比較明顯5/16/202310.9.1信息搜索工具(8)2.網(wǎng)頁目錄(Webdirectory)網(wǎng)頁目錄主要是由編輯人員按主題人工創(chuàng)建的網(wǎng)頁分類目錄,不是用網(wǎng)上機器人自動生成的網(wǎng)頁分類目錄,也稱主題目錄(subjectdirectory)編輯人員按照某些準(zhǔn)則,對網(wǎng)站進行審核,確定是否要編入到目錄,并按主題對網(wǎng)頁進行分類,然后輸入到數(shù)據(jù)庫,以供用戶使用主題目錄是網(wǎng)頁搜索工具,但不是網(wǎng)頁索引工具主題目錄是圖書館中早已有之的圖書資料管理方法如把萬維網(wǎng)看成是一本超大型圖書,網(wǎng)頁目錄就是這本書前面的目錄網(wǎng)頁目錄的編排和布局則不一定像書目錄那樣千篇一律5/16/202311.9.1信息搜索工具(9)網(wǎng)頁目錄的結(jié)構(gòu)網(wǎng)頁目錄通常采用分層結(jié)構(gòu)層次越高的主題,覆蓋的網(wǎng)頁范圍越大層次越低的主題,覆蓋的網(wǎng)頁范圍越小最低層的主題就是具體的網(wǎng)頁信息,包括網(wǎng)頁名稱、說明和網(wǎng)址網(wǎng)頁目錄在網(wǎng)頁上呈現(xiàn)的形式基本上都是二維的有的主題(主目錄)在窗口的左側(cè),列表(子目錄)在窗口右側(cè)有的主題(主目錄)在窗口上部,列表(子目錄)在窗口的下部有的主題放在按鈕上,而列表(子目錄)在下拉菜單上5/16/202312.9.1信息搜索工具(10)網(wǎng)頁目錄示例(2010年2月)(/)5/16/202313.9.1信息搜索工具(11)網(wǎng)頁目錄的特點可更有針對性地快速獲取某個主題的概貌需要高水平的編輯人員、選編網(wǎng)頁時不抱成見信息質(zhì)量比較高,與查詢請求的相關(guān)性比較大網(wǎng)頁目錄結(jié)構(gòu)很清晰,瀏覽很方便呈現(xiàn)給用戶的網(wǎng)頁數(shù)目比搜索引擎提供的少瀏覽網(wǎng)頁目錄時,需要多次點擊連接對象才能找到具體的網(wǎng)頁信息網(wǎng)頁目錄更新周期長,而網(wǎng)頁地址變動快5/16/202314.9.1信息搜索工具(12)3.專題數(shù)據(jù)庫1.數(shù)據(jù)庫是什么數(shù)據(jù)庫(database)由數(shù)據(jù)庫管理系統(tǒng)(DBMS)創(chuàng)建和管理的數(shù)據(jù)集合,可快速和準(zhǔn)確地搜索和獲取所需的信息DBMS是數(shù)據(jù)庫和用戶之間的接口軟件,用于組織、創(chuàng)建、存儲、修改、查詢、搜索、分類、備份、格式和打印數(shù)據(jù)庫中的數(shù)據(jù),維護數(shù)據(jù)的安全和數(shù)據(jù)的完整性數(shù)據(jù)庫中的數(shù)據(jù)以記錄(record)形式組織每一個記錄包含若干個域(field),每個域都有自己的名稱和數(shù)據(jù)類型[1]優(yōu)點是便于搜索、排序、重新組合或其他操作5/16/202315.9.1信息搜索工具(13)數(shù)據(jù)庫中的記錄組成示例域名(field)作者(author)書名(title)出版商(publisher)出版地(placeofpublication)日期(date)頁數(shù)(page)記錄1………………記錄2……………………記錄n………………5/16/202316.9.1信息搜索工具(14)2.專題數(shù)據(jù)庫(specializeddatabase)也稱專業(yè)數(shù)據(jù)庫,垂直門戶——vortal(verticalportal的簡寫)針對某個題目收集的資料庫由各行各業(yè)的專家、教授、研究人員、政府機構(gòu)、商業(yè)團體創(chuàng)建,他們對某個特定題目有專門的知識和深入的研究提供的信息和資料極具權(quán)威性專題數(shù)據(jù)庫類型公共數(shù)據(jù)庫(publicdatabase):包含公共資料,由政府機構(gòu)和非營利組織管理和維護,通常出現(xiàn)在Web上私有數(shù)據(jù)庫(proprietarydatabase)/商業(yè)數(shù)據(jù)庫(businessdatabase):包含公共數(shù)據(jù)庫中沒有的專業(yè)資料,由公司管理和維護,通常需要賬戶或授權(quán)的IP地址才能登錄和使用5/16/202317.9.1信息搜索工具(15)3.專題數(shù)據(jù)庫示例ScienceDirect/
/
世界著名的學(xué)術(shù)期刊出版商荷蘭Elsevier公司出版的全文數(shù)據(jù)庫收錄1995年以來Elsevier出版的1600多種電子期刊,原文以html和pdf格式存儲該數(shù)據(jù)庫涵蓋20多個學(xué)科,包括數(shù)學(xué)、物理學(xué)、化學(xué)、天文學(xué)、醫(yī)學(xué)、生物化學(xué)、生命科學(xué)、計算機科學(xué)、環(huán)境科學(xué)、材料科學(xué)、社會科學(xué)、工程和技術(shù)、能源和動力等既可搜索又可瀏覽,打印也很方便5/16/202318.9.1信息搜索工具(16)WebofScience數(shù)據(jù)庫WebofScience的用戶界面(2010-01-26)5/16/202319.9.1信息搜索工具(17)5.網(wǎng)頁搜索門戶網(wǎng)頁門戶(Webportal)企業(yè)創(chuàng)建和維護的按主題分類的網(wǎng)頁目錄向用戶提供的服務(wù)包括新聞、天氣預(yù)報、電子郵件、討論組、在線購物、娛樂站點和與其他站點的鏈接門戶網(wǎng)站(Webportal('s)site)支持“網(wǎng)頁門戶”的網(wǎng)站它將各種應(yīng)用系統(tǒng)、數(shù)據(jù)資源集成到服務(wù)機上國內(nèi)的門戶網(wǎng)站:新浪、網(wǎng)易、搜狐、騰訊QQ、Tom、鳳凰網(wǎng)、新華網(wǎng)、阿里巴巴、中華網(wǎng)和中國網(wǎng)絡(luò)電視臺等Web網(wǎng)站[1]都應(yīng)屬于“門戶網(wǎng)站”,有大有小5/16/202320.9.1信息搜索工具(18)網(wǎng)頁搜索門戶(Websearchportal)網(wǎng)頁門戶和網(wǎng)頁索引相結(jié)合的信息搜索工具,如GoogleDirectory
/MSN
/,/Yahoo!Search
/,/
Gigablast
/5/16/202321.9.2信息搜索方法成功的信息搜索需要兩個方面的努力,一個是提高搜索工具的性能,另一個是提高使用搜索工具的技能在提高搜索工具性能方面,科學(xué)技術(shù)人員已經(jīng)做了非常出色的工作,而且還在孜孜不倦地繼續(xù)努力在提高使用搜索工具的水平方面,除了要理解搜索工具的知識外,還要靠自己在實踐中不斷地摸索、總結(jié)和提高5/16/202322.9.2信息搜索方法(1)信息搜索過程信息搜索過程可歸納為五個步驟:充分準(zhǔn)備、明智決策、細(xì)心構(gòu)思、用好工具和反復(fù)查詢信息搜索的概念5/16/202323.9.2信息搜索方法(2)1.充分準(zhǔn)備:信息描述語句描述語句:用關(guān)鍵字詞描述要搜索的信息搜索范圍:可添加時間、地點或其他條件,使描述語句更接近你的查詢意圖2.明智決策:用什么搜索工具瀏覽主題概貌宜先用網(wǎng)頁目錄查找特定信息宜先用網(wǎng)頁索引查找專業(yè)信息宜先用專題數(shù)據(jù)庫,如中國國家圖書館(/)北京大學(xué)圖書館(/)清華大學(xué)圖書館(/)5/16/202324.9.2信息搜索方法(3)3.精心構(gòu)思:查詢語句查詢語句是由描述性短語由運算符/操作符/標(biāo)識符和操作對象組成查詢語句是表達查詢請求/查詢條件的方法如選擇網(wǎng)頁目錄(即主題搜索),無需構(gòu)思查詢語句如選擇關(guān)鍵字搜索,則需構(gòu)思查詢語句查詢請求英文中文查詢語句網(wǎng)頁數(shù)查詢語句網(wǎng)頁數(shù)同時包含“貓”和“老鼠”catmouse貓老鼠包含“貓”或“老鼠”catORmouse貓OR老鼠包含“貓”但不含“老鼠”cat–mouse貓-老鼠“貓”和“老鼠”彼此相鄰catADJmouse貓ADJ老鼠5/16/202325.9.2信息搜索方法(4)4.巧用域名:限定搜索范圍在只用一二個關(guān)鍵字搜索信息時,返回給用戶的信息可能遠遠多于想要的信息限定搜索范圍的選項——限定域(limitfield),其名稱叫“域名(fieldname)”。常見域名,語言域:限定使用的語言,如中文,英文,日文文件格式域:限定文件類型,如.doc,.pdf,.ppt,.xls時間域:限定日期,如年限,時間段網(wǎng)域:限定網(wǎng)站的域名,如.com,.edu,.gov限定出版類型,如圖書,期刊,文章摘要不同搜索工具支持的限定域的數(shù)目和類型相差較大5/16/202326.9.2信息搜索方法(5)5.反復(fù)推敲:精練查詢結(jié)果一次搜索就獲得滿意的查詢結(jié)果往往做不到查找信息需要用戶不斷調(diào)整查詢策略和查詢語句,通過多次查詢以改善查詢結(jié)果返回信息太多可用前面介紹的方法,調(diào)整查詢請求后再搜索返回信息太少可重新選擇搜索術(shù)語,如選擇與關(guān)鍵字詞同義的字詞,調(diào)整查詢請求后再搜索5/16/202327.9.2信息搜索方法(6)搜索引擎數(shù)學(xué)(searchenginemath)構(gòu)造查詢語句的數(shù)學(xué)目的是精煉和控制查詢語句,以改進搜索結(jié)果主要是布爾邏輯查詢語句中的字詞用運算符連接,連接方法直接輸入:在搜索工具的搜索框中,輸入搜索字詞的同時輸入運算符使用對話框:在搜索工具的對話框中,讓用戶選擇選項,無需直接輸入運算符網(wǎng)頁索引工具(如Google、必應(yīng)和百度)對以上兩種方法都支持,但筆者感覺使用Google最方便,效果最好,其次是必應(yīng)5/16/202328.9.2信息搜索方法(7)1.使用運算符構(gòu)造查詢語句運算符給多個對象施加運算的符號或字符兩種運算符布爾運算符:AND(與)、OR(或)、NOT(非)、NEAR(相近)和ADJ(相鄰)。算術(shù)運算符:加號(+)和減號(-)大多數(shù)搜索引擎都使用5/16/202329.運算符查找的文件(查詢意圖)使用舉例加號(+)
或AND包含所有搜索字詞蘋果AND香蕉;appleANDbanana+蘋果
+香蕉;+apple+banana減號(-)
或NOT不包含指定搜索字詞水果NOT香蕉;fruitNOTbanana水果–香蕉;fruit-bananaOR搜索包含任一個搜索字詞蘋果OR香蕉;appleORbananaNEAR*包含兩個字詞彼此相近,次序不限糧食NEAR浪費
multimediaNEARWindowsADJ*包含兩個字詞彼此相鄰,次序不限糧食ADJ浪費
multimediaADJtutorial布爾運算符和算術(shù)運算符的含義及使用示例9.2信息搜索方法(8)5/16/202330.9.2信息搜索方法(9)2.使用引號標(biāo)識特定短語使用雙引號標(biāo)識特定短語是非常有效的方法【例1】在Google的搜索框中,分別輸入帶雙引號的“少壯不努力老大徒傷悲”和不帶雙引號的少壯不努力老大徒傷悲,查詢結(jié)果差別很大【例2】在必應(yīng)搜索框中,分別輸入帶英文雙引號“multimedialiteracy”和不帶雙引號的multimedialiteracy,查詢結(jié)果差別很大3.使用圓括號構(gòu)造復(fù)雜查詢語句當(dāng)兩個搜索字詞(如W和X)用運算符連接而又想把W和X當(dāng)作一組看待時,可用圓括號表示【例】如想搜索包含W不包含X,但同時包含Y的網(wǎng)頁,查詢語句可為(W-X)+Y。讀者可分別在Google、必應(yīng)和百度的搜索框中鍵入(貓-老鼠)游戲,比較查詢結(jié)果5/16/202331.9.2信息搜索方法(10)4.注意關(guān)鍵字的次序把最重要的關(guān)鍵字放在查詢條件前面【例】使用Google分別查詢“貓和老鼠”與“老鼠和貓”的網(wǎng)頁,將得到不同的查詢結(jié)果5.使用通配符構(gòu)造查詢語句在查詢語句中可使用通配符。通配符有兩個問號(?):表示任何其他單個字符星號(*):表示一個或多個字符【例1】查詢掃除?盲將返回包含“掃除科盲”和“掃除網(wǎng)盲”的網(wǎng)頁信息【例2】查詢掃除*盲將返回包含“掃除科盲”、“掃除電腦盲”和“掃除理財盲”的網(wǎng)頁信息5/16/202332.9.2信息搜索方法(11)信息搜索概念圖概念(concept)從事物或事件中抽象出來加以概括得到的一般性想法概念圖(conceptmap)用圖形方法表達想法的方法,它包含一個核心思想、若干個相關(guān)想法以及它們之間的關(guān)系信息搜索概念圖(conceptmapforinformationsearching)用圖形方式表達搜索信息的方法,在查找信息過程中,可幫助我們做決策和構(gòu)思查詢語句注意事項不要在第一次查詢時就用復(fù)雜的查詢語句,而是要用最重要的概念或關(guān)鍵字詞構(gòu)造的比較簡單的查詢語句,根據(jù)第一次查詢結(jié)果,逐漸調(diào)整查詢策略和查詢語句5/16/202333.9.2信息搜索方法(12)信息搜索概念圖5/16/202334.9.3網(wǎng)頁評估方法(1)評估的重要性傳統(tǒng)出版物的特點傳統(tǒng)出版物包括報紙、雜志和圖書等來源比較可靠,質(zhì)量相對較高。經(jīng)過反復(fù)審查、多次校對后才允許印刷和發(fā)行,而且都有名有姓、圖書編號(ISBN)、責(zé)任編輯、責(zé)任校對、出版社、通信地址等至于造假和抄襲等問題,則另當(dāng)別論網(wǎng)頁的創(chuàng)建和傳播特點誰都可以寫網(wǎng)頁,誰都可以發(fā)表文章,你看到的網(wǎng)頁往往是無名無姓,無年月日,沒有出處,其內(nèi)容是真是假、來源是否可靠、信息是否有用等都是要考慮的問題在利用所獲內(nèi)容之前,搞清楚這些問題非常有必要,而且目前主要還得要靠自己去把握5/16/202335.9.3網(wǎng)頁評估方法(2)網(wǎng)頁評估方法網(wǎng)頁評估需要綜合分析至少五個方面的信息1.查看網(wǎng)頁來源根據(jù)網(wǎng)頁所在網(wǎng)站的域名,分析網(wǎng)站所屬國家或地區(qū),網(wǎng)站類型,目的是查看網(wǎng)站的信譽度網(wǎng)頁來源可在瀏覽器的地址欄(URL)中看到。例如/:屬美國,商業(yè)類,微軟在中國的網(wǎng)站/:屬中國,教育類,教育網(wǎng)站/:屬美國,教育類,麻省理工學(xué)院網(wǎng)站/:屬美國,政府類,白宮網(wǎng)站網(wǎng)站版權(quán)和介紹對分析來源及其可靠性也很重要回答的問題:該網(wǎng)站的信譽度如何?需要該網(wǎng)站提供的內(nèi)容嗎?5/16/202336.9.3網(wǎng)頁評估方法(3)2.查看網(wǎng)頁作者查看網(wǎng)頁作者可輔助評估網(wǎng)頁的真實性網(wǎng)頁作者應(yīng)是負(fù)責(zé)任的個人、公司、政府機構(gòu)或其他組織負(fù)責(zé)任的作者和較有名的網(wǎng)站,通??烧业骄W(wǎng)頁作者的署名,包括所在單位聯(lián)系方式:電話、地址、電子郵箱(mailto)網(wǎng)頁最后修改日期回答的問題:作者對此主題有專門研究嗎?5/16/202337.9.3網(wǎng)頁評估方法(4)3.查看網(wǎng)頁內(nèi)容衡量準(zhǔn)則因人而異網(wǎng)頁內(nèi)容各種各樣,每個人的文化背景和經(jīng)歷不同,對網(wǎng)頁內(nèi)容的看法自然就有差別要盡力做到不抱成見每個人都有偏見,自然傾向于接受支持自己觀點的信息,這是常人的特性。如抱偏見閱讀網(wǎng)頁,就容易上當(dāng)受騙回答的問題:網(wǎng)頁上的論述言之有理嗎?信息是客觀的還是主觀的?信息是片面的還是全面的?5/16/202338.9.3網(wǎng)頁評估方法(5)4.查看類似網(wǎng)頁對于同樣一件事情、同樣一個問題,往往有很多類似的網(wǎng)頁許多類似網(wǎng)頁的作者是同行,他們的網(wǎng)頁可能發(fā)表在相同的普通頂級域名(如edu)的網(wǎng)站上同行內(nèi)的能人很多,多看幾個這種作者的網(wǎng)頁,對網(wǎng)頁內(nèi)容的理解和評估會更全面,理解更深入,看法更準(zhǔn)確“外行”作者的見解可能更客觀,對網(wǎng)頁內(nèi)容的評估也很有幫助回答的問題:還有哪些網(wǎng)頁值得參考?5/16/202339.9.3網(wǎng)頁評估方法(6)5.查看網(wǎng)頁變動對原理性、基本知識和基本事實的介紹,通常經(jīng)得起時間考驗,網(wǎng)頁變動也不大。例如,許多大學(xué)的輔助教學(xué)網(wǎng)站,幾年前創(chuàng)建的網(wǎng)頁保留到現(xiàn)在如研究課題的時效性很強,就要查看網(wǎng)頁發(fā)表的時間,網(wǎng)頁修改的時間,利用這些信息可輔助網(wǎng)頁的評估。許多網(wǎng)頁都沒有提供這種信息,但在主頁底部的版權(quán)信息中,往往有“Copyright?20??”,利用這些信息也可推斷網(wǎng)頁的創(chuàng)建日期和修改日期回答的問題:網(wǎng)頁是什么時候?qū)懙??網(wǎng)頁內(nèi)容最近有無變動?參考或引用是否合適?5/16/202340.9.4網(wǎng)頁搜索方法網(wǎng)頁搜索使用網(wǎng)頁搜索工具查找包含所需信息的網(wǎng)頁的過程網(wǎng)頁搜索工具指網(wǎng)頁目錄、網(wǎng)頁索引和網(wǎng)頁搜索門戶網(wǎng)頁目錄的操作相對容易,而網(wǎng)頁索引的操作相對復(fù)雜5/16/202341.9.4網(wǎng)頁搜索方法(1)部分常見網(wǎng)頁搜索引擎1.國內(nèi)常見網(wǎng)頁搜索工具百度()必應(yīng)()谷歌(.hk/)搜狗()搜狐(/)網(wǎng)易(/)新浪(/)5/16/202342.9.4網(wǎng)頁搜索方法(2)2.國外常見網(wǎng)頁搜索工具AOL(),支持中文AskJeeves(/),支持中文DuckDuckGo(/)Google(/),在英文瀏覽器中使用,支持中文Lycos()OpenDirectoryProject(ODP)(/)Yahoo(/search/)5/16/202343.9.4網(wǎng)頁搜索方法(3)一般操作1.養(yǎng)成閱讀幫助文件的習(xí)慣網(wǎng)頁索引工具都有一些自己定義的使用規(guī)則,“幫助”文件是了解使用規(guī)則最直接的“老師”。不少用戶忽視幫助文件,自認(rèn)為搜索工具用得很好一般操作示例5/16/202344.9.4網(wǎng)頁搜索方法(4)高級搜索查找“我國教育域名下計算機文化課程的ppt文件”5/16/202345.9.5圖像搜索方法圖像搜索圖像搜索通過圖像搜索工具查找所需圖像文件的過程圖像搜索工具主要是指圖像目錄和圖像索引搜索圖像與搜索網(wǎng)頁類似目前搜索圖像主要是通過描述圖像文件的關(guān)鍵字通過描述圖像的可視特性來搜索圖像的技術(shù)還不太成熟,可作為搜索圖像的輔助手段5/16/202346.9.5圖像搜索方法(1)圖像目錄圖像目錄是以人工為主創(chuàng)建的圖像主題分類目錄網(wǎng)站導(dǎo)航或網(wǎng)頁搜索門戶幾乎都有“圖片[1]”、“圖片瀏覽”或“壁紙圖片”等圖片目錄許多圖像目錄工具還有“搜索”或“檢索”功能,但通常局限于搜索當(dāng)前目錄下的圖片典型的圖片目錄都是用分層結(jié)構(gòu)來組織圖片,一層表示一個主題,層次越低,主題覆蓋的范圍越窄
5/16/202347.9.5圖像搜索方法(2)百度的圖片目錄5/16/202348.9.5圖像搜索方法(3)Google的圖像目錄5/16/202349.9.5圖像搜索方法(4)專題圖像數(shù)據(jù)庫針對某個主題專門收集的圖像集合,也稱專業(yè)圖像數(shù)據(jù)庫。例如全球著名的醫(yī)學(xué)圖像庫——Theonlineencyclopediaofmedicalimage,從2010元旦開始成為SpringerImages[2]圖像庫的一部分華盛頓州立大學(xué)的獸醫(yī)和動物圖像數(shù)據(jù)庫——ImageDataBase,CollegeofVeterinaryMedicine,WashingtonStateUniversity使用關(guān)鍵字查找時,找到的圖像在這個圖像數(shù)據(jù)庫中,無需訪問其他網(wǎng)站5/16/202350.9.5圖像搜索方法(5)醫(yī)學(xué)圖像百科全書(/imagesMD/)專題圖像數(shù)據(jù)庫示例(2010年1月27日)5/16/202351.9.5圖像搜索方法(6)獸醫(yī)和動物圖像數(shù)據(jù)庫(/)專題圖像數(shù)據(jù)庫示例(2010年1月27日)5/16/202352.9.5圖像搜索方法(7)圖像索引方法1.使用文字編輯圖像索引使用描述圖像的文字編輯圖像索引的學(xué)術(shù)名稱叫做“基于文字的(text-based)圖像索引”,其核心思想是用描述圖片的文字來編輯圖像索引由于網(wǎng)頁上的圖片通常有圖片名稱,在圖片周圍有文字說明,在其相應(yīng)的HTML文檔中,有圖片文件的名稱、圖像存儲格式和網(wǎng)址等信息,根據(jù)這些信息就可用文字對圖片進行標(biāo)注,如圖片的名稱、網(wǎng)址和大小,這就是圖像文件信息的索引5/16/202353.9.5圖像搜索方法(8)5/16/202354.9.5圖像搜索方法(9)2.使用可視特性做索引使用可視特性做圖像索引的學(xué)術(shù)名稱叫做“基于內(nèi)容的圖像索引(content-basedimageindexing)”/根據(jù)圖像內(nèi)容編索引可視特性/圖像內(nèi)容指圖像的顏色、紋理、形狀、對象間的空間關(guān)系的統(tǒng)計數(shù)據(jù)讓計算機替我們描述圖像內(nèi)容和自動編索引,需要開發(fā)自動識別圖像內(nèi)容的算法——基于內(nèi)容的圖像檢索(content-basedimageretrieval,CBIR)實現(xiàn)CBIR的系統(tǒng)叫做“基于內(nèi)容的圖像搜索引擎(content-basedimagesearchengine)”5/16/202355.9.5圖像搜索方法(10)圖像索引工具1.部分圖像索引工具圖像索引工具很多。例如,Google和必應(yīng)的圖像索引對中英文都支持得很好,雅虎、百度和搜狗等搜索引擎都有圖像索引的功能Picsearch:Picsearch公司開發(fā)的圖像搜索引擎,提供圖像、影視和音樂搜索服務(wù),2005年首次推出,支持中文TinEye:IdéeInc公司開發(fā)的圖像搜索引擎,這個搜索引擎是“逆向圖像搜索(TinEyeReverseImageSearchEngine[1])”。2008年5月開始為用戶提供圖像搜索服務(wù)。搜索圖像時不是輸入關(guān)鍵字,而是上載圖像,目的是查找與上載圖像類似的或被修改過的圖像5/16/202356.9.5圖像搜索方法(11)Picsearch圖像索引界面
(/,/)圖像索引工具示例(2010年1月27日)5/16/202357.9.5圖像搜索方法(12)(b)TinEye圖像索引界面(/)圖像索引工具示例(2010年1月27日)5/16/202358.9.5圖像搜索方法(13)2.圖像索引工具的操作搜索圖像的操作與搜索網(wǎng)頁的操作類似在使用圖像索引工具之前先看幫助文件,因不同圖像索引工具支持的搜索引擎數(shù)學(xué)和限定搜索范圍的域名不同Google圖片搜索工具的用法(2010年1月27日)5/16/202359.9.5圖像搜索方法(14)查詢“兔子”圖片必應(yīng)圖片搜索工具的用法(2010年1月27日)5/16/202360.9.5圖像搜索方法(15)有關(guān)兔子的介紹必應(yīng)圖片搜索工具的用法(2010年1月27日)5/16/202361.9.6影視搜索方法(1)影視目錄(videodirectory)[1]以人工為主創(chuàng)建的主題分類目錄影視目錄下的文件主要是電影、連續(xù)劇和電視節(jié)目等網(wǎng)站導(dǎo)航的主頁都有“視頻”、“影視”或“電視”選項網(wǎng)上影視的目錄結(jié)構(gòu)網(wǎng)站導(dǎo)航\影視\影視網(wǎng)站\影視目錄\影視節(jié)目,其中的“網(wǎng)站導(dǎo)航”為影視節(jié)目的根目錄影視目錄通常也有“搜索”功能,但只是搜索網(wǎng)站內(nèi)部的影視節(jié)目搜索影視節(jié)目使用關(guān)鍵字詞,如影視節(jié)目的名稱、演員或其他關(guān)鍵字詞5/16/202362.9.6影視搜索方法(2)網(wǎng)站導(dǎo)航-影視(視頻)-影視網(wǎng)站目錄示例(/Shipin_Boke/)(2010年1月27日)
5/16/202363.9.6影視搜索方法(3)影視的索引方法影視索引是影視搜索引擎(videsearchengine)創(chuàng)建的索引影視搜索引擎是專門在網(wǎng)上收集影視文件并對其編索引的系統(tǒng)創(chuàng)建影視索引的方法有兩種使用文字使用影視的視聽特性5/16/202364.9.6影視搜索方法(4)1.使用文字編輯影視索引影視索引使用文字使用文字編輯影視索引的學(xué)術(shù)名稱,其核心思想是用描述影視文件的文字編輯影視索引影視節(jié)目通常都有比較詳細(xì)的文字說明,包括影視名稱、內(nèi)容簡介和演員列表,這些內(nèi)容都會出現(xiàn)在其相應(yīng)的HTML文檔中。根據(jù)這些信息就可用文字對影視進行標(biāo)注,如節(jié)目名稱和網(wǎng)址,這樣就得到影視節(jié)目的索引用描述影視的文字編索引是對整部影視節(jié)目的,對其內(nèi)部鏡頭[1]的描述需用影視的視聽特性5/16/202365.9.6影視搜索方法(5)2.使用視聽特性做影視索引可視特性影視由連續(xù)圖像構(gòu)成,具有空間和時間的可視特性空間可視特性體現(xiàn)在圖像的顏色、紋理和形狀時間可視特性體現(xiàn)在圖像隨時間發(fā)生的變化【例】球場上的運動員在不停跑動,新聞聯(lián)播中播音員的嘴和表情在不斷變化,電視連續(xù)劇中的背景變化比較緩慢可聽特性影視或錄像通常有對話、解說、音樂和背景等聲音,這是聽覺系統(tǒng)可感知的信息讓配音參與影視索引的基本想法是把聲音轉(zhuǎn)換
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024污水處理廠運營合同書(范本)
- 2024幼兒園租房合同協(xié)議書樣本
- 房產(chǎn)抵押擔(dān)保借款合同書范例
- 2024貨船租賃合同范本范文
- 股權(quán)抵押借款合同范文2024年
- 店面租房門面房租房合同協(xié)議
- 商業(yè)鋪租賃合同格式
- 項目合作協(xié)議書模板示例
- 2024居間合同,居間合同范例
- 技術(shù)合作協(xié)議樣式
- 精品堆垛機安裝指導(dǎo)書
- 前臺月度績效考核表(KPI)
- 雞的飼養(yǎng)管理-優(yōu)質(zhì)課件
- 德育課(共19張PPT)
- 歷史幽憤的現(xiàn)代回響——《記念劉和珍君》課堂實錄
- 化學(xué)微生物學(xué)第7章 微生物轉(zhuǎn)化
- 《少年正是讀書時》-完整版PPT課件
- 四、貼標(biāo)機基本調(diào)整法1
- 船舶建造方案
- 35KV集電線路鐵塔組立專項方案
- 不銹鋼管規(guī)格表大全以及理論重量表大全
評論
0/150
提交評論