




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、拿答案:1144766066答案來源:雅寶題庫網(wǎng)()-南開大學(xué)(本部)20 秋學(xué)期(1709、1803、1809、1903、1909、2003、2009)網(wǎng)絡(luò)爬蟲與信息提取在線作業(yè)試卷總分:100 得分:100第 1 題,()是 Scrapy 官方開發(fā)的,用來部署、運(yùn)行和管理 Scrapy 爬蟲的工具A、ScrapydB、ScrapyDeployC、DeployDScrapy_Deploy 正確答案:第 2 題,當(dāng)爬蟲創(chuàng)建好了之后,可以使用scrapy()”命令運(yùn)行爬蟲。A、startupB、starwarC、drawlDcrawl 正確答案:第 3 題,在 Scrapy 的目錄下,哪個(gè)文件負(fù)
2、責(zé)存放爬蟲的各種配置信息?()A、spiders 文件夾B、item.pyC、pipeline.pyDsettings.py 正確答案:第 4 題,使用 UIAutomatorr 根據(jù)坐標(biāo)來滑動(dòng)桌面的操作是得到相應(yīng)控件后使用命令()A、swipeB、moveC、scrollDsfly 正確答案:答案來源:雅寶題庫網(wǎng)(),windows 中創(chuàng)建定時(shí)任務(wù)的命令為A、 taskB、schtasksC、createtasksDmaketasks:第 6 題,MongoDB 中數(shù)據(jù)存儲(chǔ)的形式類似于()AB、C、D、正確答案:第 7 題,requests 中 post 請(qǐng)求方法的使用為 requests.
3、post (data 為 ()A、B、C、D、正確答案:第 8 題,Python 中把列表轉(zhuǎn)換為集合需要使用#函數(shù)A、setB、listC、convertDchange正確答案:第 9 題, 使用了 RedisSpider 作為爬蟲的父類以后, 爬蟲會(huì)直接監(jiān)控()中的數(shù)據(jù), 并不讀取 start_urls中的數(shù)據(jù)。A、RedisB、RedisSpiderC、SpiderD.MongoDB正確答案:表組典合列元字集網(wǎng)址,data=data)中的表組典合列元字集答案來源:雅寶題庫網(wǎng)(),在 MacOS 下安裝 MongoDB用命令()installmongodbA、brewB、apt-getC、s
4、udoDapt正確答案:第 11 題,當(dāng)需要把 Python 里面的數(shù)據(jù)發(fā)送給網(wǎng)頁時(shí),應(yīng)先將其轉(zhuǎn)換成()AJson 字符串B、GETC、POSTDRequest正確答案:答案來源:雅寶題庫網(wǎng)(),服務(wù)器端記錄信息確定用戶身份的數(shù)據(jù)是A、sessionB、cookiesC、moonpiesDlocalstorage正確答案:第 13 題,下列說法錯(cuò)誤的是()A、小程序的請(qǐng)求極其簡(jiǎn)單,基本上沒有驗(yàn)證信息B、 用 Python 來請(qǐng)求小程序的后臺(tái)接口從而獲取數(shù)據(jù), 比請(qǐng)求異步加載網(wǎng)頁的后臺(tái)接口要復(fù)雜很多。C、如果目標(biāo)網(wǎng)站有小程序,那么一定要優(yōu)先調(diào)查能否通過小程序的接口來抓取數(shù)據(jù)。Dk 小程序的反爬蟲
5、能力比網(wǎng)頁版的低很多。使用小程序的接口來爬數(shù)據(jù),能極大提高爬蟲的開發(fā)效率。正確答案:第 14 題,下面 Python 代碼輸出為():defdefault_para_trap(para=口,value=0):para.append(value)returnparaprint(第步:.format(default_para_trap(value=100)print(第二步:。.format(default_para_trap(value=50)A 第一步:100第二步:100,50B、第一步:100第二步:50C、第一步:100第二步:口DK 第一步:100第二步:100正確答案:答案來源:雅寶
6、題庫網(wǎng)(),在 Scrapy 的目錄下,哪個(gè)文件負(fù)責(zé)存放爬蟲文件?()A、spiders 文件夾B、item.pyC、pipeline.pyDsettings.py正確答案:第 16 題,xpath 中 extractA方法返回值類型是()B、C、D表組典合列元字集正確答案:第 17 題,參數(shù) headers=(),把請(qǐng)求頭添加到 Scrapy 請(qǐng)求中, 使爬蟲的請(qǐng)求看起來像是從瀏覽器發(fā)起的。AHEADERB、HEADERSC、HEADDBODY正確答案:第 18 題,Python 中 Object=(1,2,3,4,5),A、B、C、D則 Objcet 是()表組典合列元字集正確答案:第 1
7、9 題,在 Scrapy 的目錄下,哪個(gè)文件負(fù)責(zé)定義需要爬取的數(shù)據(jù)?()A、spiders 文件夾B、item.pyC、pipeline.pyDsettings.py正確答案:答案來源: 雅寶題庫網(wǎng)(以()形式生成AB、C、D.表組典合列元字集正確答案:),Scrapy 中使用 Xpath 狄得的結(jié)果調(diào)用了.extract 方法,結(jié)果第 21 題,Python 中的容器有()A、B、C、D.表組典合列元字集正確答案:,B,C,D第 22 題,使用 Selennium 狄取網(wǎng)頁中元素的方法有A、find_element_by_nameB、find_element_by_idC、find_elem
8、ents_by_nameDfind_elements_by_id正確答案:,B,C,D第 23 題,一個(gè)可行的自動(dòng)更換代理的爬蟲系統(tǒng),應(yīng)該下列哪些功能?A、有一個(gè)小爬蟲 ProxySpider 去各大代理網(wǎng)站爬取免費(fèi)代理并驗(yàn)證,將可以使用的代理 IP保存到數(shù)據(jù)庫中B、在發(fā)現(xiàn)某個(gè)請(qǐng)求已經(jīng)被設(shè)置過代理后,什么也不做,直接返回C、在 ProxyMiddlerware 的 process_request 中,每次從數(shù)據(jù)庫里面隨機(jī)選擇一條代理地址使用DK 周期性驗(yàn)證數(shù)據(jù)庫中的無效代理,及時(shí)將其刪除正確答案:,C,D第 24 題,下列關(guān)于在 IOS 上配置 Charles 的說法正確的是()A、不同 io
9、s 設(shè)備之間會(huì)有比較大的差別,所以配置的時(shí)候需要找到對(duì)應(yīng)的安裝證書的入口。B、手機(jī)和電腦需要在同一個(gè)局域網(wǎng)下。C、HTTP 代理可以使用自動(dòng)選項(xiàng)。D 安裝好證書以后,打開 iOS 設(shè)備上的任何一個(gè) App,可以看到 Charles 中有數(shù)據(jù)包在流動(dòng)正確答案:,D答案來源:雅寶題庫網(wǎng)(),下列說法錯(cuò)誤的是()A、mitmproxy 的強(qiáng)大之處在于它還自帶一個(gè) mitmdump 命令。這個(gè)命令可以用來運(yùn)行符合一定規(guī)則的 Python 腳本,并在 Python 腳本里面直接操作 HTT可口 HTTPS 勺請(qǐng)求,以及返回的數(shù)據(jù)包。B、命令行中執(zhí)行 mitmdump-sparse_request.py
10、即可運(yùn)行 python 腳本C、使用 python 可以自定義返回的數(shù)據(jù)包,如 response.headers,就是返回的頭部信息 Dk 如果返回的是 JSONI 型的字符串,python 無法進(jìn)行解析。正確答案:第 26 題,以下 HTTP 狀態(tài)碼表示服務(wù)器本身發(fā)生錯(cuò)誤的是A、400B、503C、302DK500正確答案:,D第 27 題,Python 中哪種容器生成后可以修改內(nèi)容A 列表B、元組C、字典D集合正確答案:,C,DIP第 28 題,以下 HTTP 狀態(tài)碼表示服務(wù)器沒有正常返回結(jié)果的是A、200B、301C、404D.500正確答案:,C,D第 29 題,如果目標(biāo)網(wǎng)站有反爬蟲聲
11、明,那么對(duì)方在被爬蟲爬取以后,可以據(jù)()來起訴使用爬蟲的公司A、服務(wù)器日志B、數(shù)據(jù)庫日志記錄C、程序日志記錄Dk 服務(wù)器監(jiān)控正確答案:,B,C,D答案來源:雅寶題庫網(wǎng)(),requests 中 post 請(qǐng)求方法的第二個(gè)參數(shù)可以為()A、字典B、列表C、json 數(shù)據(jù)D 字符串正確答案:,C第 31 題,process_spider_output(response,result,output)是在下載器中間件處理完成后,馬上要進(jìn)入某個(gè)回調(diào)函數(shù) parse_xxx()前調(diào)用T、對(duì)F、錯(cuò)正確答案:F第 32 題,需要登錄的網(wǎng)站一般通過 GET 請(qǐng)求就可以實(shí)現(xiàn)登錄。T、對(duì)F、錯(cuò)第 33 題,Pyth
12、on 中相比于 findall 方法,search 方法對(duì)于從超級(jí)大的文本里面只找第 1 個(gè)數(shù)據(jù)特別有用,可以大大提高程序的運(yùn)行效率。T、對(duì)F、錯(cuò)更多答案下載:雅寶題庫網(wǎng)()第 34 題,UIAutomatorViewer 與 Pythonuiautomator 可以同時(shí)使用T、對(duì)F、錯(cuò)正確答案:F第 35 題,device.sleep()方法是使用 UIAutomatorr 關(guān)閉屏幕的命令T、對(duì)F、錯(cuò)更多答案下載:雅寶題庫網(wǎng)()第 36 題,在發(fā)送請(qǐng)求時(shí)需要注意 requests 提交的請(qǐng)求頭不能與瀏覽器的請(qǐng)求頭一致,因?yàn)檫@樣才能隱藏好自己達(dá)到獲取數(shù)據(jù)的目的T、對(duì)F、錯(cuò)正確答案:F第 37
13、題,mitmproxy 的強(qiáng)大之處在于它還自帶一個(gè) mitmdump 命令。這個(gè)命令可以用來運(yùn)行符合一定規(guī)則的 Python 腳本T、對(duì)F、錯(cuò)更多答案下載:雅寶題庫網(wǎng)()第 38 題,MongoDB 是一個(gè)關(guān)系數(shù)據(jù)庫產(chǎn)品T、對(duì)F、錯(cuò)第 39 題,Python 正則表達(dá)式中.*?”是非貪婪模式,獲取最短的能滿足條件的字符串T、對(duì)F、錯(cuò)更多答案下載:雅寶題庫網(wǎng)()第 40 題,Charles 能截獲 HTT 評(píng)口 HTTPS 勺數(shù)據(jù)包,如果網(wǎng)站使用 websocket 就可以截獲T、對(duì)F、錯(cuò)正確答案:F第 41 題,Charles 和 Chrome 開發(fā)者工具相比,只是多了一個(gè)搜索功能T、對(duì)F、錯(cuò)
14、正確答案:第 42 題,爬蟲中間件的激活需要另外寫一個(gè)文件來進(jìn)行T、對(duì)F、錯(cuò)正確答案:F第 43 題,Cookies 一般包含在請(qǐng)求頭 Headers 中T、對(duì)F、錯(cuò)更多答案下載:雅寶題庫網(wǎng)()第 44 題,已經(jīng)創(chuàng)建好的 Scrapy 爬蟲*py 文件可以直接通過 Python 來運(yùn)行T、對(duì)F、錯(cuò)正確答案:F第 45 題,如果目標(biāo)網(wǎng)站本身就是提供公眾查詢服務(wù)的網(wǎng)站,那么使用爬蟲是合法合規(guī)的T、對(duì)F、錯(cuò)更多答案下載:雅寶題庫網(wǎng)()第 46 題,Redis 中使用 Irange 讀取數(shù)據(jù)后數(shù)據(jù)也會(huì)刪除T、對(duì)F、錯(cuò)正確答案:第 47 題,開源庫 pytesseract 的作用是將圖像中文字轉(zhuǎn)換為文本T、對(duì)F、錯(cuò)更多答案下載:雅寶題庫網(wǎng)()第 48 題,Scrapy 每一次發(fā)起請(qǐng)求之前都會(huì)在這里檢查網(wǎng)址是否重復(fù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年時(shí)間頻率計(jì)量標(biāo)準(zhǔn)器具項(xiàng)目申請(qǐng)報(bào)告
- 2025年放射免疫制劑項(xiàng)目規(guī)劃申請(qǐng)報(bào)告
- 2025年體檢服務(wù)項(xiàng)目立項(xiàng)申請(qǐng)報(bào)告模板
- 2025年汽車級(jí)珠光材料項(xiàng)目提案報(bào)告
- 電子產(chǎn)品銷售合同范本
- 國際演出演出排練合同要求
- 2025年中國彩盒吊牌項(xiàng)目投資可行性研究報(bào)告
- 2025年中國實(shí)木臥室家具數(shù)據(jù)監(jiān)測(cè)報(bào)告
- 2025年中國圓形散流器數(shù)據(jù)監(jiān)測(cè)報(bào)告
- 應(yīng)對(duì)2025年汽車芯片短缺汽車企業(yè)產(chǎn)品研發(fā)策略報(bào)告
- 2022年湖南省普通高中學(xué)業(yè)水平考試語文試卷及參考答案
- 傳統(tǒng)節(jié)日端午節(jié)主題班會(huì)PPT模板
- 胎漏、墮胎、滑胎、小產(chǎn)中醫(yī)護(hù)理常規(guī)
- 汽車發(fā)動(dòng)機(jī)電控技術(shù)習(xí)題集答案
- 1389國開電大本科《理工英語4》網(wǎng)上形考任務(wù)(單元自測(cè)1至8)試題及答案(精華版)
- 居家環(huán)境安全評(píng)估量表-Microsoft-Word-文檔
- 高中數(shù)學(xué)導(dǎo)數(shù)知識(shí)點(diǎn)歸納總結(jié)
- 成本管理外文文獻(xiàn)及翻譯(共10頁)
- 電診斷在康復(fù)醫(yī)學(xué)中的應(yīng)用ppt課件
- 杜絕違法分包轉(zhuǎn)包承諾書
- 2021年河北中考理科綜合真題及答案
評(píng)論
0/150
提交評(píng)論