互聯(lián)網(wǎng)搜索新發(fā)展課件 2024-2025學(xué)年人教版(2024)初中信息科技七年級上冊_第1頁
互聯(lián)網(wǎng)搜索新發(fā)展課件 2024-2025學(xué)年人教版(2024)初中信息科技七年級上冊_第2頁
互聯(lián)網(wǎng)搜索新發(fā)展課件 2024-2025學(xué)年人教版(2024)初中信息科技七年級上冊_第3頁
互聯(lián)網(wǎng)搜索新發(fā)展課件 2024-2025學(xué)年人教版(2024)初中信息科技七年級上冊_第4頁
互聯(lián)網(wǎng)搜索新發(fā)展課件 2024-2025學(xué)年人教版(2024)初中信息科技七年級上冊_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第14課互聯(lián)網(wǎng)搜索新發(fā)展第三單元便捷的互聯(lián)網(wǎng)服務(wù)義務(wù)教育信息科技課程資源七年級

第14課學(xué)習(xí)目標(biāo)123了解搜索引擎的工作原理。學(xué)習(xí)目標(biāo)知道搜索引擎的簡單工作過程。了解網(wǎng)絡(luò)爬蟲等自動化技術(shù)給搜索帶來的影響。第14課課堂導(dǎo)入學(xué)校讀書節(jié)活動正在如火如荼地開展著,有些同學(xué)想通過網(wǎng)絡(luò)了解更多圖書的信息,有些同學(xué)想查找資料制作讀書海報。如何在網(wǎng)絡(luò)中簡單、高效地尋找想要的信息呢?問題情境相信大家會不約而同地選擇搜索引擎。下面,就帶領(lǐng)同學(xué)們深入了解搜索引擎。第14課學(xué)習(xí)內(nèi)容二

搜索系統(tǒng)的創(chuàng)新改進學(xué)習(xí)內(nèi)容一

搜索引擎的工作思路一、搜索引擎的工作思路第14課學(xué)習(xí)內(nèi)容想象一下,互聯(lián)網(wǎng)上有難以計數(shù)的網(wǎng)站,搜索引擎需要從這些網(wǎng)站中尋找與關(guān)鍵詞相匹配的網(wǎng)頁,然后返回搜索結(jié)果,應(yīng)該需要花費很長時間。但實際上,在搜索引擎中輸入問題或關(guān)鍵詞后,很快就能看到結(jié)果,為什么能搜得這么快?第14課學(xué)習(xí)內(nèi)容實驗?zāi)康氖煜に阉饕娴墓ぷ鬟^程實驗條件《簡易搜索系統(tǒng)》軟件、配套資源中的Web文件夾實驗步驟1.運行《簡易搜索系統(tǒng)》軟件,啟動搜索服務(wù),然后嘗試用關(guān)鍵詞“中國探月”進行搜索,查看搜索結(jié)果?!跛训较嚓P(guān)信息□未搜到相關(guān)信息√一、搜索引擎的工作思路第14課學(xué)習(xí)內(nèi)容2.把老師提供的Web文件夾復(fù)制到搜索服務(wù)軟件所在的文件夾中。3.重新運行搜索服務(wù)軟件后,再次以“中國探月”為關(guān)鍵詞進行搜索。一、搜索引擎的工作思路第14課學(xué)習(xí)內(nèi)容6.繼續(xù)進行搜索,看看能否搜到剛剛保存的內(nèi)容。4.瀏覽一些網(wǎng)頁,并把網(wǎng)頁保存到Web文件夾中。5.打開Web文件夾中的pages.csv,記錄網(wǎng)頁文件的文件名和對應(yīng)的網(wǎng)址。一、搜索引擎的工作思路實驗結(jié)論1.搜索引擎搜到的信息是(□搜索前放進去的□實時在網(wǎng)絡(luò)中獲取的)。2.網(wǎng)頁數(shù)據(jù)都保存在:3.網(wǎng)頁文件跟實際網(wǎng)址的關(guān)系保存在:4.當(dāng)前網(wǎng)頁排序用的算法是:第14課學(xué)習(xí)內(nèi)容√Web文件夾pages.csv根據(jù)關(guān)鍵詞出現(xiàn)的次數(shù)進行排序,次數(shù)越多越靠前一、搜索引擎的工作思路第14課學(xué)習(xí)內(nèi)容5.梳理搜索系統(tǒng)的結(jié)構(gòu)組成,把下圖補充完整。A.網(wǎng)頁數(shù)據(jù)B.建立索引C.網(wǎng)頁索引D.獲取信息E.網(wǎng)頁排序DABCE一、搜索引擎的工作思路第14課學(xué)習(xí)內(nèi)容搜索引擎提前把海量信息保存下來,耗費了大量的存儲空間,換來了對查詢需求的快速響應(yīng)。這種工作方式體現(xiàn)了“以空間換時間”的思想。一、搜索引擎的工作思路第14課學(xué)習(xí)內(nèi)容如果讓計算機替代人工操作,會極大提升工作效率。例如,用網(wǎng)絡(luò)爬蟲自動獲取相關(guān)的網(wǎng)頁以備查詢。通過人工操作來擴充搜索系統(tǒng)中的網(wǎng)頁數(shù)據(jù)比較煩瑣,有沒有辦法更高效地完成相關(guān)操作呢?二、搜索系統(tǒng)的創(chuàng)新改進第14課學(xué)習(xí)內(nèi)容1.運行《網(wǎng)絡(luò)爬蟲測試》軟件,輸入一個網(wǎng)址后,單擊窗口中的按鈕,看看能否自動獲取相應(yīng)的網(wǎng)頁。2.把spider.pyc文件復(fù)制到搜索系統(tǒng)文件夾中,然后重新運行《簡易搜索系統(tǒng)》軟件,觀察界面的變化。二、搜索系統(tǒng)的創(chuàng)新改進第14課學(xué)習(xí)內(nèi)容二、搜索系統(tǒng)的創(chuàng)新改進3.輸入一個網(wǎng)址,然后單擊“啟動網(wǎng)絡(luò)爬蟲”按鈕。4.嘗試用相應(yīng)的關(guān)鍵詞搜索,對比一下搜索到的結(jié)果有什么不同。第14課學(xué)習(xí)內(nèi)容5.對照搜索引擎工作流程,梳理網(wǎng)絡(luò)爬蟲對搜索引擎的改進?!詣印詣佣⑺阉飨到y(tǒng)的創(chuàng)新改進

1.搜索引擎提前把信息保存下來,以供用戶搜索。2.搜索引擎的工作流程包含獲取信息、建立索引、網(wǎng)頁排序等步驟。3.搜索引擎通過自動爬取網(wǎng)頁等技術(shù)提高效率。第14課課堂總結(jié)1.運行《分詞測試》軟件,輸入一個短語進行分詞,感受分詞的效果。第14課拓展與提升2.把tokenizer.pyc文件復(fù)制到搜索系統(tǒng)文件夾中,然后運行《簡易搜索系統(tǒng)》軟件,看看搜索結(jié)果的變化。進一步創(chuàng)新改進搜索系統(tǒng)3.搜索結(jié)果是根據(jù)關(guān)鍵詞出現(xiàn)的次數(shù)進行排序的。請思考:除了“關(guān)鍵詞出現(xiàn)次數(shù)”這一指標(biāo)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論