網(wǎng)絡(luò)爬蟲開發(fā)智慧樹知到課后章節(jié)答案2023年下楊凌職業(yè)技術(shù)學(xué)院

上傳人：題*** IP屬地：浙江上傳時間：2023-11-10 格式：DOCX 頁數(shù)：21 大?。?6.12KB 積分：7.2 舉報 版權(quán)申訴

網(wǎng)絡(luò)爬蟲開發(fā)智慧樹知到課后章節(jié)答案2023年下楊凌職業(yè)技術(shù)學(xué)院_第2頁

網(wǎng)絡(luò)爬蟲開發(fā)智慧樹知到課后章節(jié)答案2023年下楊凌職業(yè)技術(shù)學(xué)院_第3頁

網(wǎng)絡(luò)爬蟲開發(fā)智慧樹知到課后章節(jié)答案2023年下楊凌職業(yè)技術(shù)學(xué)院_第4頁

網(wǎng)絡(luò)爬蟲開發(fā)智慧樹知到課后章節(jié)答案2023年下楊凌職業(yè)技術(shù)學(xué)院_第5頁

已閱讀5頁，還剩16頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

網(wǎng)絡(luò)爬蟲開發(fā)智慧樹知到課后章節(jié)答案2023年下楊凌職業(yè)技術(shù)學(xué)院楊凌職業(yè)技術(shù)學(xué)院

項目一測試

下列不屬于常見爬蟲類型的是（）。

A:淺層網(wǎng)絡(luò)爬蟲

B:通用網(wǎng)絡(luò)爬蟲

C:聚焦網(wǎng)絡(luò)爬蟲

D:增量式網(wǎng)絡(luò)爬蟲

答案:淺層網(wǎng)絡(luò)爬蟲

下列不屬于聚焦網(wǎng)絡(luò)爬蟲的常用策略的是（）。

A:基于深度優(yōu)先的爬取策略

B:基于語境圖的爬取策略

C:基于內(nèi)容評價的爬取策略

D:基于鏈接結(jié)構(gòu)評價的爬取策略

答案:基于深度優(yōu)先的爬取策略

下列不屬于常用反爬手段的是（）。

A:驗證碼校驗

B:人工篩選

C:賬號權(quán)限

D:反爬頻度

答案:人工篩選

下列屬于反爬蟲目的的是（）。

A:變換網(wǎng)頁結(jié)構(gòu)

B:限制用戶訪問權(quán)限

C:防止網(wǎng)站信息被競爭對手隨意獲取

D:限制訪問人數(shù)

答案:防止網(wǎng)站信息被競爭對手隨意獲取

下列屬關(guān)于Python爬蟲庫的功能描述不正確的是（）。

A:通用爬蟲庫urllib3

B:HTML/XML解析器pycurl`

C:通用爬蟲庫Requests

D:爬蟲框架Scrapy

答案:HTML/XML解析器pycurl`

搜索引擎使用了網(wǎng)絡(luò)爬蟲不停地從互聯(lián)網(wǎng)抓取網(wǎng)站數(shù)據(jù)，并將網(wǎng)站鏡像保存在本地。（）

A:錯B:對

答案:對

robots.txt文件中，User-agent后面跟的是爬蟲的名稱，Disallow后面跟著的是可以爬蟲的網(wǎng)頁。（）

A:對B:錯

答案:錯

爬蟲是手動請求萬維網(wǎng)網(wǎng)站且提取網(wǎng)頁數(shù)據(jù)的程序。（）

A:錯B:對

答案:錯

每個網(wǎng)站都有robots.txt文件。（）

A:錯B:對

答案:錯

爬蟲爬取的是網(wǎng)站后臺的數(shù)據(jù)。（）

A:錯B:對

答案:錯

項目二測試

吉多設(shè)計Python的靈感來源于（）。

A:Unixshell

B:ABC語言

C:C語言

D:Java語言

答案:ABC語言

下列關(guān)于Python語言的特點說法中，錯誤的是（）。

A:Python語言是跨平臺語言

B:ANSIC

C:Python語言是非開源語言

D:Go

答案:Python語言是非開源語言

Python源代碼文件的后綴名是（）

A:doc

B:py

C:png

D:pdf

答案:py

列表list=[1,2,3,4,5]，下列選項中為空的是（）

A:list[:-2]

B:list[1:]

C:list[1:-1]

D:ist[1:1]

答案:ist[1:1]

Python語言中用來定義函數(shù)的關(guān)鍵字是（）

A:function

B:return

C:def

D:class

答案:def

在安裝Python時，需要根據(jù)已有的系統(tǒng)來選擇相應(yīng)的安裝程序。安裝后，也需要配置環(huán)境變量。（）

A:對B:錯

答案:對

elif語句可以單獨使用。（）

A:錯B:對

答案:錯

元組的元素不能修改。（）

A:對B:錯

答案:對

下列選項中，不能創(chuàng)建元組的語句是（）。

A:tup=(1,2,98)

B:tup=(2)

C:tup=[1,2,3]

D:tup=tuple([1,2,3])

答案:tup=(2)

;tup=[1,2,3]

項目三測試

如果站點服務(wù)器支持安全套接層(SSL)，那么連接到安全站點上的所有URL開頭是()。

A:HTTPS

B:SHTTP

C:HTTP

D:SSL

答案:HTTPS

body元素用于背景顏色的屬性是()。

A:background-color

B:vlink

C:color

D:alink

答案:background-color

為了標(biāo)識一個HTML文件開始應(yīng)該使用的HTML標(biāo)記是()。

＜table＞

B:＜html＞

C:＜body＞

D:＜a＞

答案:＜html＞

在HTML中，單元格的標(biāo)記是()。

A:＜span＞

B:＜td＞

C:＜tr＞

D:＜body＞

答案:＜td＞

CSS中的選擇器不包括包括（）

A:ID選擇器

B:元素選擇器

C:超文本標(biāo)記選擇器

D:類選擇器

答案:超文本標(biāo)記選擇器

()是網(wǎng)頁與網(wǎng)頁之間聯(lián)系的紐帶，也是網(wǎng)頁的重要特色。

A:導(dǎo)航條

B:框架

C:表格

D:超鏈接

答案:超鏈接

在HTML中，下面是段落標(biāo)簽的是：（）。

A:＜html＞＜/html＞

B:＜body＞＜/body＞

C:＜head＞＜/head＞

D:＜p＞＜/p＞

答案:＜p＞＜/p＞

（）標(biāo)簽可以應(yīng)用于〈head〉中。

A:＜image＞

B:＜html＞

C:＜title＞

D:＜body＞

答案:＜title＞

下列哪一項是css添加背景圖片的正確語法構(gòu)成？（）

A:background-image

B:background-position

C:background-color

D:background-size

答案:background-image

在HTML開發(fā)中,制作網(wǎng)站時首先需要考慮內(nèi)容是()

A:頁面布局

B:圖片色彩

C:文字字體

第四章

D:頁面內(nèi)容

答案:頁面布局

項目四測試

HTTPError是URLError的子類，專門用來處理HTTP請求錯誤，比如認(rèn)證請求失敗等。它有3個屬性，下列選項哪一個不是它的屬性（）。

A:code

B:headers

C:Response

D:reason

答案:Response

下列屬于HTTP必須實現(xiàn)的請求方法的是（）。

A:POST與DELE

B:TRACE和OPTIONS

C:GET與HEAD

D:OPTIONS和CONNECT

答案:GET與HEAD

下列關(guān)于HTTP狀態(tài)碼類型描述錯誤的是（）。

A:3XX表示客戶端的請求需采取進一步操作

B:4XX表示客戶端可能發(fā)生錯誤

C:1XX表示請求已被服務(wù)器接受，無須后續(xù)處理

D:5XX表示服務(wù)器可能發(fā)生錯誤

答案:1XX表示請求已被服務(wù)器接受，無須后續(xù)處理

通過加入特定的____，可以將爬蟲發(fā)出的請求偽裝成瀏覽器。（）

A:Headers

B:opener

C:User_Agent

D:Request

答案:User_Agent

urlopen方法中的data參數(shù)可以不是bytes類型。（）

A:對B:錯

答案:錯

requests庫中的requests.get(url)方法是請求目標(biāo)網(wǎng)站，類型是一個HTTPresponse類型。（）

A:錯B:對

答案:對

如果訪問某網(wǎng)站的頻率太高，則這個網(wǎng)站可能會禁止訪問。（）

A:錯B:對

答案:對

requests庫中的requests.get(url)方法中包括兩個（對象）請求，其中一個為Request請求，即向服務(wù)器請求資源的request對象，第二個是Response請求，即包含從服務(wù)器返回的所有資源。（）

A:錯B:對

答案:對

Response類用于動態(tài)地響應(yīng)客戶端的請求，控制發(fā)送給用戶的信息，并且將動態(tài)地生成響應(yīng)，包括狀態(tài)碼、網(wǎng)頁的內(nèi)容等。（）

A:對B:錯

答案:對

項目五測試

下列不屬于HTTP請求過程的是（）。

A:生成請求

B:搜索文檔

C:超時設(shè)置

D:請求重定向

答案:搜索文檔

下列關(guān)于Chrome開發(fā)者工具描述錯誤的是（）

A:網(wǎng)絡(luò)面板無法查看HTML源碼

B:源代碼面板可查看HTML源碼

C:網(wǎng)絡(luò)面板可查看HTTP頭部信息

D:元素面板可查看元素在頁面的對應(yīng)位置

答案:網(wǎng)絡(luò)面板無法查看HTML源碼

下列關(guān)于Xpah中功能函數(shù)描述錯誤的是（）

A:and方法可用于選取同時包含兩種指定值的節(jié)點

B:text函數(shù)可用于選取包含指定文本內(nèi)容的節(jié)點

C:text函數(shù)可提取節(jié)點文本內(nèi)容

D:contains方法可用于選取以指定值開頭的節(jié)點

答案:contains方法可用于選取以指定值開頭的節(jié)點

下列關(guān)于Beautifulsoup中對象類型描述錯誤的是（）

A:name方法可以獲取及修改Tag對象名稱

B:NavigableString對象無法被編輯，但可以進行替換

C:string方法可獲取Tag對象中的文本字符串內(nèi)容

D:attrs方法可獲取Tag對象的HTML屬性，返回值為列表形式

答案:attrs方法可獲取Tag對象的HTML屬性，返回值為列表形式

下列選項中，屬于非結(jié)構(gòu)化數(shù)據(jù)的是：（）

A:圖像

B:XML

C:HTML

D:JSON

答案:圖像

對服務(wù)器端來說，它返回給客戶端的數(shù)據(jù)格式可分為非結(jié)構(gòu)化和結(jié)構(gòu)化兩種。（）

A:對B:錯

答案:對

網(wǎng)頁中的非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整，沒有預(yù)定義的數(shù)據(jù)模型，不方便使用數(shù)據(jù)庫二維邏輯來表現(xiàn)的數(shù)據(jù)，包括所有格式的辦公文檔、文本、圖像等。（）

A:對B:錯

答案:對

結(jié)構(gòu)化數(shù)據(jù)就是能夠用數(shù)據(jù)或統(tǒng)一的結(jié)構(gòu)加以表示，具有模式的數(shù)據(jù)，包括HTML、XML和JSON等。（）

A:錯B:對

答案:對

正則表達式、XPath和BeautifulSoup都是基于HTML/XML文檔的層次結(jié)構(gòu)來確定到達指定節(jié)點的路徑。（）

A:對B:錯

答案:錯

XPath是一門在XML文檔中查找信息的語言。XPath可用來在XML文檔中對元素和屬性進行遍歷。（）

A:錯B:對

答案:對

項目六測試

使用以下哪個函數(shù)可以打開一個已經(jīng)存在的文件？()

A:file

B:close

C:open

D:read

答案:open

文件訪問的默認(rèn)模式為()。

A:r

B:a

C:ab

D:w

答案:r

以二進制格式打開一個文件用于追加的訪問模式為()。

A:r+

B:ab

C:r

D:w

答案:ab

改變文件目錄所用的方法是()。

A:read()

B:remove()

C:rename()

D:chdir()

答案:chdir()

文件刪除所用的方法是（）

A:read()

B:rename()

C:readlines()

D:remove()

答案:remove()

使用withas語法。在with控制塊結(jié)束時，文件會自動關(guān)閉（）。

A:對B:錯

答案:對

JSON也就是JavaScript對象標(biāo)記（）。

A:對B:錯

答案:對

使調(diào)用dumps()方法將JSON字符串轉(zhuǎn)化為對象()。

A:對B:錯

答案:錯

使用readines（）方法不可以把整個文件中的內(nèi)容進行一次性讀?。ǎ?/p>

A:錯B:對

答案:錯

向文件中寫入數(shù)據(jù)，需要使用write方法()。

A:對B:錯

答案:對

項目七測試

以下哪個技術(shù)不是Ajax技術(shù)體系的組成部分？()

A:CSS

B:DOM

C:XMLHttpRequest

D:DHTML

答案:DHTML

下列哪些方法或?qū)傩允荳eb標(biāo)準(zhǔn)中規(guī)定的？()

A:getElementsByTagName()

B:all()

C:innerHTML

D:innerText

答案:getElementsByTagName()

下列selenium庫的方法中，通過元素名稱定位的是()。

A:find_element_by_class_name

B:find_element_by_name

C:find_element_by_tag_name

D:find_element_by_id

答案:find_element_by_name

下面方法中，進行瀏覽器頁面前進的方法是()。

A:driver.go()

B:driver.back()

C:driver.refresh()

D:driver.forward()

答案:driver.forward()

關(guān)閉當(dāng)前頁面的方法是（）

A:driver.back()

B:driver.close()

C:driver.forward()

D:driver.quit()

答案:driver.close()

Ajax不能實現(xiàn)頁面的交互（）。

A:對B:錯

答案:錯

可以使用request向服務(wù)器發(fā)送請求，然后得到響應(yīng)（）。

A:錯B:對

答案:對

使用driver.get()方法可以得到網(wǎng)頁窗口的位置()。

A:對B:錯

答案:錯

使用Ajax解析內(nèi)容時，得到響應(yīng)后，觸發(fā)onreadystatechange屬性對應(yīng)的方法（）。

A:錯B:對

答案:對

DOM操作，即對Document網(wǎng)頁文檔進行操作，如更改、刪除等()。

A:錯B:對

答案:對

項目八測試

下列不屬于Scrapy框架的基本組成部分的是（）

A:ItemPipelines

B:引擎與調(diào)度器

C:下載器與Spiders

D:解析中間件

答案:引擎與調(diào)度器

下列對于Scrapy數(shù)據(jù)流向描述錯誤的是（）

A:調(diào)度器返回下一個要爬取的URL給引擎，引擎將URL通過下載器中間件（請求方向）轉(zhuǎn)發(fā)給下載器Download

B:一旦網(wǎng)頁下載完畢,下載器會生成一個該網(wǎng)頁的響應(yīng),并將其通過下載器中間件（返回響應(yīng)方向）發(fā)送給引擎

C:引擎僅負(fù)責(zé)打開一個網(wǎng)站，并找到該網(wǎng)站的Spiders，并向該Spiders請求第一個要爬取的URL

D:Spiders處理響應(yīng)并返同爬取到的Items及(跟進的)新的請求給引擎解析中間件

答案:Spiders處理響應(yīng)并返同爬取到的Items及(跟進的)新的請求給引擎解析中間件

下列對于Scrapy常用命令及其作用描述正確的是（）

A:startproject是一個全局命令，主要用于運行一個獨立的爬蟲

B:crawl是一個項目命令，主要用于啟動限蟲

C:genspider是一個項目命令，主要用于創(chuàng)建爬蟲模板

D:List是一個全局命令，主要用于列出項目中所有可用的爬蟲

答案:startproject是一個全局命令，主要用于運行一個獨立的爬蟲

下列對于Scrapy蟲項目目錄說法錯誤的是（）。

A:items腳本定義了一個Item類，能夠存儲爬取的數(shù)據(jù)

B:settings腳本用于設(shè)置參數(shù)

C:Spiders目錄用于

人人文庫> 全部分類> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

網(wǎng)絡(luò)爬蟲開發(fā)智慧樹知到課后章節(jié)答案2023年下楊凌職業(yè)技術(shù)學(xué)院

文檔簡介

溫馨提示

最新文檔

評論

網(wǎng)絡(luò)爬蟲開發(fā)智慧樹知到課后章節(jié)答案2023年下楊凌職業(yè)技術(shù)學(xué)院

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔