21秋學(xué)期南開(kāi)大學(xué)《網(wǎng)絡(luò)爬蟲(chóng)與信息提取》在線作業(yè)_第1頁(yè)
21秋學(xué)期南開(kāi)大學(xué)《網(wǎng)絡(luò)爬蟲(chóng)與信息提取》在線作業(yè)_第2頁(yè)
21秋學(xué)期南開(kāi)大學(xué)《網(wǎng)絡(luò)爬蟲(chóng)與信息提取》在線作業(yè)_第3頁(yè)
21秋學(xué)期南開(kāi)大學(xué)《網(wǎng)絡(luò)爬蟲(chóng)與信息提取》在線作業(yè)_第4頁(yè)
21秋學(xué)期南開(kāi)大學(xué)《網(wǎng)絡(luò)爬蟲(chóng)與信息提取》在線作業(yè)_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

21秋學(xué)期(1709、1803、1809、1903、1909、2003、2009、2103)《網(wǎng)絡(luò)爬蟲(chóng)與信息提取》在線作業(yè)1:Python中線程池map()方法第二個(gè)參數(shù)是()A、列表B、元組C、字典D、集合答案:A2:通過(guò)()爬取偽裝成異步加載的后端渲染數(shù)據(jù)A、正則表達(dá)式B、Json字符串C、JavaScriptD、Get答案:A3:下面Python代碼輸出為():defdefault_para_without_trap(para=[],value=0):ifnotpara:para=[]para.append(value)returnparaprint('第一步:{}'.format(default_para_trap(value=100)))print('第二步:{}'.format(default_para_trap(value=50)))A、第一步:[100]第二步:[100,50]B、第一步:[100]第二步:[50]C、第一步:[100]第二步:[]D、第一步:[100]第二步:[100]答案:B4:Python中若定義object=(1,2,3,4,5),則print(object[1:3])輸出()A、12B、123C、23D、234答案:C5:在Scrapy的目錄下,哪個(gè)文件負(fù)責(zé)數(shù)據(jù)抓取以后的處理工作?()A、spiders文件夾B、item.pyC、pipeline.pyD、settings.py答案:C6:瀏覽器用來(lái)記錄用戶(hù)狀態(tài)信息的數(shù)據(jù)叫A、sessionB、cookiesC、moonpiesD、selenium答案:B7:PyMongo中查詢(xún)所有age>29的記錄是()A、collection.find({'age':{'$gt':29}})B、collection.find({'age'>29})C、collection.find_all({'age':{'$gt':29}})D、collection.find_all({'age'>29})答案:A8:Redis中往集合中添加數(shù)據(jù),使用關(guān)鍵字()A、saddB、addC、appendD、sappend答案:A9:Redis中如果不刪除列表中的數(shù)據(jù),又要把數(shù)據(jù)讀出來(lái),就需要使用關(guān)鍵字()A、rangeB、lrangeC、srangeD、pop答案:B10:在Python中,為了使用XPath,需要安裝一個(gè)第三方庫(kù)()A、lxmlB、xmlC、xpathD、path答案:A11:Python操作CSV文件可通過(guò)()容器的方式操作單元格A、列表B、元組C、字典D、集合答案:C12:某些網(wǎng)站在發(fā)起Ajax請(qǐng)求時(shí)會(huì)攜帶()字符串用于身份驗(yàn)證A、TokenB、CookieC、ReqTimeD、sum答案:A13:PyMongo中邏輯查詢(xún)表示不等于的符號(hào)是()A、$gtB、$ltC、$eqD、$ne答案:C14:下列說(shuō)法錯(cuò)誤的是()A、Charles只能截獲HTTP和HTTPS的數(shù)據(jù)包,如果網(wǎng)站使用的是websocket或者是flashsocket,那么Charles就無(wú)能為力。B、有一些App會(huì)自帶證書(shū),使用其他證書(shū)都無(wú)法正常訪問(wèn)后臺(tái)接口。在這種情況下,Charles自帶的證書(shū)就不能正常使用,也就沒(méi)有辦法抓取這種App的數(shù)據(jù)C、有一些App的數(shù)據(jù)經(jīng)過(guò)加密,App接收到數(shù)據(jù)以后在其內(nèi)部進(jìn)行解密。Charles無(wú)法獲取這種App的數(shù)據(jù)D、對(duì)于上述情況,Charles能抓取到經(jīng)過(guò)加密的數(shù)據(jù)。但是如果無(wú)法知道數(shù)據(jù)的具體加密方法,就沒(méi)有辦法解讀Charles抓取到的數(shù)據(jù)。答案:C15:使用Xpath獲取文本使用()A、textB、text()C、contentD、content()答案:B16:?jiǎn)?dòng)MongoDB使用命令mongod--()usr/local/etc/mongod.confA、configB、installC、startD、begin答案:A17:Redis中查看一個(gè)列表長(zhǎng)度,使用關(guān)鍵字()A、lenB、lengthC、llenD、count答案:C18:Python中若定義object="12345",則print(object[::-1])輸出()A、1B、5C、54321D、程序報(bào)錯(cuò)答案:C19:在Scrapy的目錄下,哪個(gè)文件負(fù)責(zé)存放爬蟲(chóng)的各種配置信息?()A、spiders文件夾B、item.pyC、pipeline.pyD、settings.py答案:D20:當(dāng)爬蟲(chóng)運(yùn)行到y(tǒng)ieldscrapy.Request()或者yielditem的時(shí)候,下列哪個(gè)爬蟲(chóng)中間件的方法被調(diào)用?A、process_spider_output()B、process_spider_exception()C、process_spider_input()D、process_start_requests()答案:A21:在配置ios使用Charles的操作中,正確的有()A、對(duì)于蘋(píng)果設(shè)備,首先要保證計(jì)算機(jī)和蘋(píng)果設(shè)備聯(lián)在同一個(gè)Wi-Fi上。B、選擇“HTTP代理”下面的“手動(dòng)”選項(xiàng)卡,在“服務(wù)器”處輸入計(jì)算機(jī)的IP地址,在“端口”處輸入8888C、輸入完成代理以后按下蘋(píng)果設(shè)備的Home鍵,設(shè)置就會(huì)自動(dòng)保存。D、安裝完成證書(shū)以后,在設(shè)置中打開(kāi)“關(guān)于本機(jī)”,找到最下面的“證書(shū)信任設(shè)置”,并在里面啟動(dòng)對(duì)Charles證書(shū)的完全信任答案:A,B,C,D22:下載器中間件的作用有哪些?A、更換代理IPB、更換CookiesC、更換User-AgentD、自動(dòng)重試答案:A,B,C,D23:下列關(guān)于在IOS上配置charles的說(shuō)法正確的是()A、不同ios設(shè)備之間會(huì)有比較大的差別,所以配置的時(shí)候需要找到對(duì)應(yīng)的安裝證書(shū)的入口。B、手機(jī)和電腦需要在同一個(gè)局域網(wǎng)下。C、HTTP代理可以使用“自動(dòng)”選項(xiàng)。D、安裝好證書(shū)以后,打開(kāi)iOS設(shè)備上的任何一個(gè)App,可以看到Charles中有數(shù)據(jù)包在流動(dòng)答案:B,D24:如果爬蟲(chóng)爬取的是商業(yè)網(wǎng)站,并且目標(biāo)網(wǎng)站使用了反爬蟲(chóng)機(jī)制,那么強(qiáng)行突破反爬蟲(chóng)機(jī)制可能構(gòu)成()A、非法侵入計(jì)算機(jī)系統(tǒng)罪B、非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)罪C、非法獲取計(jì)算機(jī)數(shù)據(jù)罪D、非法獲取系統(tǒng)罪答案:A,B25:Python中一個(gè)函數(shù)沒(méi)有返回值則可以寫(xiě)()A、沒(méi)有returnB、returnC、returnNoneD、returnNULL答案:A,B,C26:使用BeautifulSoup對(duì)象后可以使用()來(lái)查找內(nèi)容A、find_allB、findC、searchD、search_all答案:A,B27:PyMongo刪除操作有()A、deleteB、delete_allC、delete_oneD、delete_many答案:C,D28:以下哪些方法屬于Python寫(xiě)CSV文件的方法()A、writeheadersB、writeheaderC、writerrowsD、writerow答案:A,C,D29:MongoDB中獲取名字為db的庫(kù)的語(yǔ)句為()A、client.dbB、client('db')C、client['db']D、client{'db'}答案:A,C30:Python中()容器有推導(dǎo)式A、列表B、元組C、字典D、集合答案:A,C,D31:中間人攻擊也是抓包的一種。T、對(duì)F、錯(cuò)答案:F32:在請(qǐng)求頭中設(shè)置User-Agent即可正常請(qǐng)求網(wǎng)站T、對(duì)F、錯(cuò)答案:F33:UIAutomatorViewer與Pythonuiautomator可以同時(shí)使用T、對(duì)F、錯(cuò)答案:F34:device.sleep()方法是使用UIAutomatorr關(guān)閉屏幕的命令T、對(duì)F、錯(cuò)答案:T35:爬蟲(chóng)的源代碼通過(guò)公開(kāi)不會(huì)對(duì)被爬蟲(chóng)網(wǎng)站造成影響T、對(duì)F、錯(cuò)答案:F36:雖然MongoDB相比于MySQL來(lái)說(shuō),速度快了很多,但是頻繁讀寫(xiě)MongoDB還是會(huì)嚴(yán)重拖慢程序的執(zhí)行速度。T、對(duì)F、錯(cuò)答案:T37:打碼平臺(tái)都是靠機(jī)器使用OCR技術(shù)識(shí)別圖片上的文字。T、對(duì)F、錯(cuò)答案:F38:Python中包含字典的列表頁(yè)可以轉(zhuǎn)換成JSON字符串T、對(duì)F、錯(cuò)答案:T39:需要實(shí)名認(rèn)證的打碼網(wǎng)站更加安全可靠。T、對(duì)F、錯(cuò)答案:F40:MongoDBURI的格式為:mongodb://服務(wù)器IP或域名:端口@用戶(hù)名:密碼T、對(duì)F、錯(cuò)答案:F41:MongoDB中ObjectId可以反向恢復(fù)為時(shí)間T、對(duì)F、錯(cuò)答案:T42:驗(yàn)證碼必須通過(guò)手動(dòng)填充識(shí)別。T、對(duì)F、錯(cuò)答案:F43:使用UIAutomatorr操作實(shí)體鍵的命令為device.press.實(shí)體按鍵名稱(chēng)()T、對(duì)F、錯(cuò)答案:T44:在MacOS下若要運(yùn)行Redis可以運(yùn)行解壓以后的文件夾下面的src文件夾中的redis-server文件啟動(dòng)redis服務(wù)src/redis-serverT、對(duì)F、錯(cuò)答案:F45:開(kāi)源庫(kù)pytesseract的作用是將圖像中文字轉(zhuǎn)換為文本。T、對(duì)F、錯(cuò)答案:T46:Redis的集合與Python的集合一樣,沒(méi)有順序,值不重復(fù)T、對(duì)F、錯(cuò)答案:T47:mitmproxy的強(qiáng)大之處在于它還自帶一個(gè)mitmdump命令。這個(gè)命令可以用來(lái)運(yùn)行符合一定規(guī)則的Python腳本T、對(duì)F、錯(cuò)答案:T48:process_spider_input(response,spider)是在爬蟲(chóng)運(yùn)行yield

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論