




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
網(wǎng)絡(luò)爬蟲開發(fā)智慧樹知到課后章節(jié)答案2023年下楊凌職業(yè)技術(shù)學(xué)院楊凌職業(yè)技術(shù)學(xué)院
項目一測試
下列不屬于常見爬蟲類型的是()。
A:淺層網(wǎng)絡(luò)爬蟲
B:通用網(wǎng)絡(luò)爬蟲
C:聚焦網(wǎng)絡(luò)爬蟲
D:增量式網(wǎng)絡(luò)爬蟲
答案:淺層網(wǎng)絡(luò)爬蟲
下列不屬于聚焦網(wǎng)絡(luò)爬蟲的常用策略的是()。
A:基于深度優(yōu)先的爬取策略
B:基于語境圖的爬取策略
C:基于內(nèi)容評價的爬取策略
D:基于鏈接結(jié)構(gòu)評價的爬取策略
答案:基于深度優(yōu)先的爬取策略
下列不屬于常用反爬手段的是()。
A:驗證碼校驗
B:人工篩選
C:賬號權(quán)限
D:反爬頻度
答案:人工篩選
下列屬于反爬蟲目的的是()。
A:變換網(wǎng)頁結(jié)構(gòu)
B:限制用戶訪問權(quán)限
C:防止網(wǎng)站信息被競爭對手隨意獲取
D:限制訪問人數(shù)
答案:防止網(wǎng)站信息被競爭對手隨意獲取
下列屬關(guān)于Python爬蟲庫的功能描述不正確的是()。
A:通用爬蟲庫urllib3
B:HTML/XML解析器pycurl`
C:通用爬蟲庫Requests
D:爬蟲框架Scrapy
答案:HTML/XML解析器pycurl`
搜索引擎使用了網(wǎng)絡(luò)爬蟲不停地從互聯(lián)網(wǎng)抓取網(wǎng)站數(shù)據(jù),并將網(wǎng)站鏡像保存在本地。()
A:錯B:對
答案:對
robots.txt文件中,User-agent后面跟的是爬蟲的名稱,Disallow后面跟著的是可以爬蟲的網(wǎng)頁。()
A:對B:錯
答案:錯
爬蟲是手動請求萬維網(wǎng)網(wǎng)站且提取網(wǎng)頁數(shù)據(jù)的程序。()
A:錯B:對
答案:錯
每個網(wǎng)站都有robots.txt文件。()
A:錯B:對
答案:錯
爬蟲爬取的是網(wǎng)站后臺的數(shù)據(jù)。()
A:錯B:對
答案:錯
項目二測試
吉多設(shè)計Python的靈感來源于()。
A:Unixshell
B:ABC語言
C:C語言
D:Java語言
答案:ABC語言
下列關(guān)于Python語言的特點說法中,錯誤的是()。
A:Python語言是跨平臺語言
B:ANSIC
C:Python語言是非開源語言
D:Go
答案:Python語言是非開源語言
Python源代碼文件的后綴名是()
A:doc
B:py
C:png
D:pdf
答案:py
列表list=[1,2,3,4,5],下列選項中為空的是()
A:list[:-2]
B:list[1:]
C:list[1:-1]
D:ist[1:1]
答案:ist[1:1]
Python語言中用來定義函數(shù)的關(guān)鍵字是()
A:function
B:return
C:def
D:class
答案:def
在安裝Python時,需要根據(jù)已有的系統(tǒng)來選擇相應(yīng)的安裝程序。安裝后,也需要配置環(huán)境變量。()
A:對B:錯
答案:對
elif語句可以單獨使用。()
A:錯B:對
答案:錯
元組的元素不能修改。()
A:對B:錯
答案:對
下列選項中,不能創(chuàng)建元組的語句是()。
A:tup=(1,2,98)
B:tup=(2)
C:tup=[1,2,3]
D:tup=tuple([1,2,3])
答案:tup=(2)
;tup=[1,2,3]
項目三測試
如果站點服務(wù)器支持安全套接層(SSL),那么連接到安全站點上的所有URL開頭是()。
A:HTTPS
B:SHTTP
C:HTTP
D:SSL
答案:HTTPS
body元素用于背景顏色的屬性是()。
A:background-color
B:vlink
C:color
D:alink
答案:background-color
為了標(biāo)識一個HTML文件開始應(yīng)該使用的HTML標(biāo)記是()。
A:
<table>
B:<html>
C:<body>
D:<a>
答案:<html>
在HTML中,單元格的標(biāo)記是()。
A:<span>
B:<td>
C:<tr>
D:<body>
答案:<td>
CSS中的選擇器不包括包括()
A:ID選擇器
B:元素選擇器
C:超文本標(biāo)記選擇器
D:類選擇器
答案:超文本標(biāo)記選擇器
()是網(wǎng)頁與網(wǎng)頁之間聯(lián)系的紐帶,也是網(wǎng)頁的重要特色。
A:導(dǎo)航條
B:框架
C:表格
D:超鏈接
答案:超鏈接
在HTML中,下面是段落標(biāo)簽的是:()。
A:<html></html>
B:<body></body>
C:<head></head>
D:<p></p>
答案:<p></p>
()標(biāo)簽可以應(yīng)用于〈head〉中。
A:<image>
B:<html>
C:<title>
D:<body>
答案:<title>
下列哪一項是css添加背景圖片的正確語法構(gòu)成?()
A:background-image
B:background-position
C:background-color
D:background-size
答案:background-image
在HTML開發(fā)中,制作網(wǎng)站時首先需要考慮內(nèi)容是()
A:頁面布局
B:圖片色彩
C:文字字體
第四章
D:頁面內(nèi)容
答案:頁面布局
項目四測試
HTTPError是URLError的子類,專門用來處理HTTP請求錯誤,比如認(rèn)證請求失敗等。它有3個屬性,下列選項哪一個不是它的屬性()。
A:code
B:headers
C:Response
D:reason
答案:Response
下列屬于HTTP必須實現(xiàn)的請求方法的是()。
A:POST與DELE
B:TRACE和OPTIONS
C:GET與HEAD
D:OPTIONS和CONNECT
答案:GET與HEAD
下列關(guān)于HTTP狀態(tài)碼類型描述錯誤的是()。
A:3XX表示客戶端的請求需采取進一步操作
B:4XX表示客戶端可能發(fā)生錯誤
C:1XX表示請求已被服務(wù)器接受,無須后續(xù)處理
D:5XX表示服務(wù)器可能發(fā)生錯誤
答案:1XX表示請求已被服務(wù)器接受,無須后續(xù)處理
通過加入特定的____,可以將爬蟲發(fā)出的請求偽裝成瀏覽器。()
A:Headers
B:opener
C:User_Agent
D:Request
答案:User_Agent
urlopen方法中的data參數(shù)可以不是bytes類型。()
A:對B:錯
答案:錯
requests庫中的requests.get(url)方法是請求目標(biāo)網(wǎng)站,類型是一個HTTPresponse類型。()
A:錯B:對
答案:對
如果訪問某網(wǎng)站的頻率太高,則這個網(wǎng)站可能會禁止訪問。()
A:錯B:對
答案:對
requests庫中的requests.get(url)方法中包括兩個(對象)請求,其中一個為Request請求,即向服務(wù)器請求資源的request對象,第二個是Response請求,即包含從服務(wù)器返回的所有資源。()
A:錯B:對
答案:對
Response類用于動態(tài)地響應(yīng)客戶端的請求,控制發(fā)送給用戶的信息,并且將動態(tài)地生成響應(yīng),包括狀態(tài)碼、網(wǎng)頁的內(nèi)容等。()
A:對B:錯
答案:對
項目五測試
下列不屬于HTTP請求過程的是()。
A:生成請求
B:搜索文檔
C:超時設(shè)置
D:請求重定向
答案:搜索文檔
下列關(guān)于Chrome開發(fā)者工具描述錯誤的是()
A:網(wǎng)絡(luò)面板無法查看HTML源碼
B:源代碼面板可查看HTML源碼
C:網(wǎng)絡(luò)面板可查看HTTP頭部信息
D:元素面板可查看元素在頁面的對應(yīng)位置
答案:網(wǎng)絡(luò)面板無法查看HTML源碼
下列關(guān)于Xpah中功能函數(shù)描述錯誤的是()
A:and方法可用于選取同時包含兩種指定值的節(jié)點
B:text函數(shù)可用于選取包含指定文本內(nèi)容的節(jié)點
C:text函數(shù)可提取節(jié)點文本內(nèi)容
D:contains方法可用于選取以指定值開頭的節(jié)點
答案:contains方法可用于選取以指定值開頭的節(jié)點
下列關(guān)于Beautifulsoup中對象類型描述錯誤的是()
A:name方法可以獲取及修改Tag對象名稱
B:NavigableString對象無法被編輯,但可以進行替換
C:string方法可獲取Tag對象中的文本字符串內(nèi)容
D:attrs方法可獲取Tag對象的HTML屬性,返回值為列表形式
答案:attrs方法可獲取Tag對象的HTML屬性,返回值為列表形式
下列選項中,屬于非結(jié)構(gòu)化數(shù)據(jù)的是:()
A:圖像
B:XML
C:HTML
D:JSON
答案:圖像
對服務(wù)器端來說,它返回給客戶端的數(shù)據(jù)格式可分為非結(jié)構(gòu)化和結(jié)構(gòu)化兩種。()
A:對B:錯
答案:對
網(wǎng)頁中的非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整,沒有預(yù)定義的數(shù)據(jù)模型,不方便使用數(shù)據(jù)庫二維邏輯來表現(xiàn)的數(shù)據(jù),包括所有格式的辦公文檔、文本、圖像等。()
A:對B:錯
答案:對
結(jié)構(gòu)化數(shù)據(jù)就是能夠用數(shù)據(jù)或統(tǒng)一的結(jié)構(gòu)加以表示,具有模式的數(shù)據(jù),包括HTML、XML和JSON等。()
A:錯B:對
答案:對
正則表達式、XPath和BeautifulSoup都是基于HTML/XML文檔的層次結(jié)構(gòu)來確定到達指定節(jié)點的路徑。()
A:對B:錯
答案:錯
XPath是一門在XML文檔中查找信息的語言。XPath可用來在XML文檔中對元素和屬性進行遍歷。()
A:錯B:對
答案:對
項目六測試
使用以下哪個函數(shù)可以打開一個已經(jīng)存在的文件?()
A:file
B:close
C:open
D:read
答案:open
文件訪問的默認(rèn)模式為()。
A:r
B:a
C:ab
D:w
答案:r
以二進制格式打開一個文件用于追加的訪問模式為()。
A:r+
B:ab
C:r
D:w
答案:ab
改變文件目錄所用的方法是()。
A:read()
B:remove()
C:rename()
D:chdir()
答案:chdir()
文件刪除所用的方法是()
A:read()
B:rename()
C:readlines()
D:remove()
答案:remove()
使用withas語法。在with控制塊結(jié)束時,文件會自動關(guān)閉()。
A:對B:錯
答案:對
JSON也就是JavaScript對象標(biāo)記()。
A:對B:錯
答案:對
使調(diào)用dumps()方法將JSON字符串轉(zhuǎn)化為對象()。
A:對B:錯
答案:錯
使用readines()方法不可以把整個文件中的內(nèi)容進行一次性讀?。ǎ?/p>
A:錯B:對
答案:錯
向文件中寫入數(shù)據(jù),需要使用write方法()。
A:對B:錯
答案:對
項目七測試
以下哪個技術(shù)不是Ajax技術(shù)體系的組成部分?()
A:CSS
B:DOM
C:XMLHttpRequest
D:DHTML
答案:DHTML
下列哪些方法或?qū)傩允荳eb標(biāo)準(zhǔn)中規(guī)定的?()
A:getElementsByTagName()
B:all()
C:innerHTML
D:innerText
答案:getElementsByTagName()
下列selenium庫的方法中,通過元素名稱定位的是()。
A:find_element_by_class_name
B:find_element_by_name
C:find_element_by_tag_name
D:find_element_by_id
答案:find_element_by_name
下面方法中,進行瀏覽器頁面前進的方法是()。
A:driver.go()
B:driver.back()
C:driver.refresh()
D:driver.forward()
答案:driver.forward()
關(guān)閉當(dāng)前頁面的方法是()
A:driver.back()
B:driver.close()
C:driver.forward()
D:driver.quit()
答案:driver.close()
Ajax不能實現(xiàn)頁面的交互()。
A:對B:錯
答案:錯
可以使用request向服務(wù)器發(fā)送請求,然后得到響應(yīng)()。
A:錯B:對
答案:對
使用driver.get()方法可以得到網(wǎng)頁窗口的位置()。
A:對B:錯
答案:錯
使用Ajax解析內(nèi)容時,得到響應(yīng)后,觸發(fā)onreadystatechange屬性對應(yīng)的方法()。
A:錯B:對
答案:對
DOM操作,即對Document網(wǎng)頁文檔進行操作,如更改、刪除等()。
A:錯B:對
答案:對
項目八測試
下列不屬于Scrapy框架的基本組成部分的是()
A:ItemPipelines
B:引擎與調(diào)度器
C:下載器與Spiders
D:解析中間件
答案:引擎與調(diào)度器
下列對于Scrapy數(shù)據(jù)流向描述錯誤的是()
A:調(diào)度器返回下一個要爬取的URL給引擎,引擎將URL通過下載器中間件(請求方向)轉(zhuǎn)發(fā)給下載器Download
B:一旦網(wǎng)頁下載完畢,下載器會生成一個該網(wǎng)頁的響應(yīng),并將其通過下載器中間件(返回響應(yīng)方向)發(fā)送給引擎
C:引擎僅負(fù)責(zé)打開一個網(wǎng)站,并找到該網(wǎng)站的Spiders,并向該Spiders請求第一個要爬取的URL
D:Spiders處理響應(yīng)并返同爬取到的Items及(跟進的)新的請求給引擎解析中間件
答案:Spiders處理響應(yīng)并返同爬取到的Items及(跟進的)新的請求給引擎解析中間件
下列對于Scrapy常用命令及其作用描述正確的是()
A:startproject是一個全局命令,主要用于運行一個獨立的爬蟲
B:crawl是一個項目命令,主要用于啟動限蟲
C:genspider是一個項目命令,主要用于創(chuàng)建爬蟲模板
D:List是一個全局命令,主要用于列出項目中所有可用的爬蟲
答案:startproject是一個全局命令,主要用于運行一個獨立的爬蟲
下列對于Scrapy蟲項目目錄說法錯誤的是()。
A:items腳本定義了一個Item類,能夠存儲爬取的數(shù)據(jù)
B:settings腳本用于設(shè)置參數(shù)
C:Spiders目錄用于
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 消防設(shè)施事故處理試題及答案
- 學(xué)生藝術(shù)團的音樂鑒賞與創(chuàng)作能力
- 2024年消防設(shè)施操作員考試真題及答案分享
- 2024年圖書管理員考試考前注意事項試題及答案
- 如何布置有效的幼兒園活動場景
- 獸醫(yī)倫理與動物實驗的實踐問題試題及答案
- 理論與實踐結(jié)合:2024年試題及答案
- 消防設(shè)施操作員考試應(yīng)試技巧與試題及答案
- 獸醫(yī)臨床選藥原則試題及答案
- 2024年消防設(shè)施操作員考前試題及答案
- 壓瘡課件教學(xué)課件
- 北師大六年級下冊數(shù)學(xué)全冊教案
- 《中電聯(lián)團體標(biāo)準(zhǔn)-220kV變電站并聯(lián)直流電源系統(tǒng)技術(shù)規(guī)范》
- 合理用藥知識健康講座(完美版)課件
- 抗震支吊架安裝及驗收規(guī)程
- MOOC 創(chuàng)業(yè)基礎(chǔ)-暨南大學(xué) 中國大學(xué)慕課答案
- 第7課 結(jié)字章法 課件-2023-2024學(xué)年高中美術(shù)人教版(2019)選擇性必修2 中國書畫
- 高端私人會所策劃方案
- 急停開關(guān)使用培訓(xùn)課件
- 《期權(quán)的基本知識》課件
- 6.1認(rèn)識經(jīng)濟全球化(上課)公開課
評論
0/150
提交評論