互聯(lián)網(wǎng)搜索新發(fā)展課件 2024-2025學(xué)年人教版(2024)初中信息科技七年級上冊_第1頁
互聯(lián)網(wǎng)搜索新發(fā)展課件 2024-2025學(xué)年人教版(2024)初中信息科技七年級上冊_第2頁
互聯(lián)網(wǎng)搜索新發(fā)展課件 2024-2025學(xué)年人教版(2024)初中信息科技七年級上冊_第3頁
互聯(lián)網(wǎng)搜索新發(fā)展課件 2024-2025學(xué)年人教版(2024)初中信息科技七年級上冊_第4頁
互聯(lián)網(wǎng)搜索新發(fā)展課件 2024-2025學(xué)年人教版(2024)初中信息科技七年級上冊_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第14課互聯(lián)網(wǎng)搜索新發(fā)展第三單元便捷的互聯(lián)網(wǎng)服務(wù)義務(wù)教育信息科技課程資源七年級

第14課學(xué)習(xí)目標(biāo)123了解搜索引擎的工作原理。學(xué)習(xí)目標(biāo)知道搜索引擎的簡單工作過程。了解網(wǎng)絡(luò)爬蟲等自動(dòng)化技術(shù)給搜索帶來的影響。第14課課堂導(dǎo)入學(xué)校讀書節(jié)活動(dòng)正在如火如荼地開展著,有些同學(xué)想通過網(wǎng)絡(luò)了解更多圖書的信息,有些同學(xué)想查找資料制作讀書海報(bào)。如何在網(wǎng)絡(luò)中簡單、高效地尋找想要的信息呢?問題情境相信大家會(huì)不約而同地選擇搜索引擎。下面,就帶領(lǐng)同學(xué)們深入了解搜索引擎。第14課學(xué)習(xí)內(nèi)容二

搜索系統(tǒng)的創(chuàng)新改進(jìn)學(xué)習(xí)內(nèi)容一

搜索引擎的工作思路一、搜索引擎的工作思路第14課學(xué)習(xí)內(nèi)容想象一下,互聯(lián)網(wǎng)上有難以計(jì)數(shù)的網(wǎng)站,搜索引擎需要從這些網(wǎng)站中尋找與關(guān)鍵詞相匹配的網(wǎng)頁,然后返回搜索結(jié)果,應(yīng)該需要花費(fèi)很長時(shí)間。但實(shí)際上,在搜索引擎中輸入問題或關(guān)鍵詞后,很快就能看到結(jié)果,為什么能搜得這么快?第14課學(xué)習(xí)內(nèi)容實(shí)驗(yàn)?zāi)康氖煜に阉饕娴墓ぷ鬟^程實(shí)驗(yàn)條件《簡易搜索系統(tǒng)》軟件、配套資源中的Web文件夾實(shí)驗(yàn)步驟1.運(yùn)行《簡易搜索系統(tǒng)》軟件,啟動(dòng)搜索服務(wù),然后嘗試用關(guān)鍵詞“中國探月”進(jìn)行搜索,查看搜索結(jié)果?!跛训较嚓P(guān)信息□未搜到相關(guān)信息√一、搜索引擎的工作思路第14課學(xué)習(xí)內(nèi)容2.把老師提供的Web文件夾復(fù)制到搜索服務(wù)軟件所在的文件夾中。3.重新運(yùn)行搜索服務(wù)軟件后,再次以“中國探月”為關(guān)鍵詞進(jìn)行搜索。一、搜索引擎的工作思路第14課學(xué)習(xí)內(nèi)容6.繼續(xù)進(jìn)行搜索,看看能否搜到剛剛保存的內(nèi)容。4.瀏覽一些網(wǎng)頁,并把網(wǎng)頁保存到Web文件夾中。5.打開Web文件夾中的pages.csv,記錄網(wǎng)頁文件的文件名和對應(yīng)的網(wǎng)址。一、搜索引擎的工作思路實(shí)驗(yàn)結(jié)論1.搜索引擎搜到的信息是(□搜索前放進(jìn)去的□實(shí)時(shí)在網(wǎng)絡(luò)中獲取的)。2.網(wǎng)頁數(shù)據(jù)都保存在:3.網(wǎng)頁文件跟實(shí)際網(wǎng)址的關(guān)系保存在:4.當(dāng)前網(wǎng)頁排序用的算法是:第14課學(xué)習(xí)內(nèi)容√Web文件夾pages.csv根據(jù)關(guān)鍵詞出現(xiàn)的次數(shù)進(jìn)行排序,次數(shù)越多越靠前一、搜索引擎的工作思路第14課學(xué)習(xí)內(nèi)容5.梳理搜索系統(tǒng)的結(jié)構(gòu)組成,把下圖補(bǔ)充完整。A.網(wǎng)頁數(shù)據(jù)B.建立索引C.網(wǎng)頁索引D.獲取信息E.網(wǎng)頁排序DABCE一、搜索引擎的工作思路第14課學(xué)習(xí)內(nèi)容搜索引擎提前把海量信息保存下來,耗費(fèi)了大量的存儲(chǔ)空間,換來了對查詢需求的快速響應(yīng)。這種工作方式體現(xiàn)了“以空間換時(shí)間”的思想。一、搜索引擎的工作思路第14課學(xué)習(xí)內(nèi)容如果讓計(jì)算機(jī)替代人工操作,會(huì)極大提升工作效率。例如,用網(wǎng)絡(luò)爬蟲自動(dòng)獲取相關(guān)的網(wǎng)頁以備查詢。通過人工操作來擴(kuò)充搜索系統(tǒng)中的網(wǎng)頁數(shù)據(jù)比較煩瑣,有沒有辦法更高效地完成相關(guān)操作呢?二、搜索系統(tǒng)的創(chuàng)新改進(jìn)第14課學(xué)習(xí)內(nèi)容1.運(yùn)行《網(wǎng)絡(luò)爬蟲測試》軟件,輸入一個(gè)網(wǎng)址后,單擊窗口中的按鈕,看看能否自動(dòng)獲取相應(yīng)的網(wǎng)頁。2.把spider.pyc文件復(fù)制到搜索系統(tǒng)文件夾中,然后重新運(yùn)行《簡易搜索系統(tǒng)》軟件,觀察界面的變化。二、搜索系統(tǒng)的創(chuàng)新改進(jìn)第14課學(xué)習(xí)內(nèi)容二、搜索系統(tǒng)的創(chuàng)新改進(jìn)3.輸入一個(gè)網(wǎng)址,然后單擊“啟動(dòng)網(wǎng)絡(luò)爬蟲”按鈕。4.嘗試用相應(yīng)的關(guān)鍵詞搜索,對比一下搜索到的結(jié)果有什么不同。第14課學(xué)習(xí)內(nèi)容5.對照搜索引擎工作流程,梳理網(wǎng)絡(luò)爬蟲對搜索引擎的改進(jìn)?!詣?dòng)→自動(dòng)二、搜索系統(tǒng)的創(chuàng)新改進(jìn)

1.搜索引擎提前把信息保存下來,以供用戶搜索。2.搜索引擎的工作流程包含獲取信息、建立索引、網(wǎng)頁排序等步驟。3.搜索引擎通過自動(dòng)爬取網(wǎng)頁等技術(shù)提高效率。第14課課堂總結(jié)1.運(yùn)行《分詞測試》軟件,輸入一個(gè)短語進(jìn)行分詞,感受分詞的效果。第14課拓展與提升2.把tokenizer.pyc文件復(fù)制到搜索系統(tǒng)文件夾中,然后運(yùn)行《簡易搜索系統(tǒng)》軟件,看看搜索結(jié)果的變化。進(jìn)一步創(chuàng)新改進(jìn)搜索系統(tǒng)3.搜索結(jié)果是根據(jù)關(guān)鍵詞出現(xiàn)的次數(shù)進(jìn)行排序的。請思考:除了“關(guān)鍵詞出現(xiàn)次數(shù)”這一指標(biāo)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論