南開大學(xué)22年春學(xué)期《網(wǎng)絡(luò)爬蟲與信息提取》在線作業(yè)-00003_第1頁(yè)
南開大學(xué)22年春學(xué)期《網(wǎng)絡(luò)爬蟲與信息提取》在線作業(yè)-00003_第2頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、-本頁(yè)為預(yù)覽頁(yè)P(yáng)AGE13-本頁(yè)為預(yù)覽頁(yè)-本頁(yè)為預(yù)覽頁(yè)22春學(xué)期(高起本1709-1803、全層次1809-2103)網(wǎng)絡(luò)爬蟲與信息提取在線作業(yè)-00003第1題. PyMongo中邏輯查詢表示小于的符號(hào)是()選項(xiàng)A:$gt選項(xiàng)B:$lt選項(xiàng)C:$gte$lte參考答案:B第2題. 在Mac OS下安裝MongoDB使用命令() install mongodb選項(xiàng)A:brew選項(xiàng)B:apt-get選項(xiàng)C:sudo選項(xiàng)D:apt參考答案:A第3題. 服務(wù)器端記錄信息確定用戶身份的數(shù)據(jù)是選項(xiàng)A:session選項(xiàng)B:cookies選項(xiàng)C:moonpies選項(xiàng)D:localstorage參考答案:A

2、第4題. 在Scrapy工程的settings.py文件中,哪個(gè)配置項(xiàng),如果設(shè)置為True,那么Scrapy就會(huì)自動(dòng)跳過網(wǎng)站不允許爬取的內(nèi)容()選項(xiàng)A:ROBOTSTXT_ OBEY選項(xiàng)B:ROBOTSTXT_JUDGE選項(xiàng)C:ROBOTSTXT選項(xiàng)D:ROBOTSTXT_ IF參考答案:A第5題. 下列哪項(xiàng)不是HTTP的請(qǐng)求類型()選項(xiàng)A:GET選項(xiàng)B:POST選項(xiàng)C:PUT選項(xiàng)D:SET參考答案:D第6題. 使用UI Automator獲取屏幕上顯示的文本內(nèi)容的操作是得到相應(yīng)控件后使用命令()選項(xiàng)A:content選項(xiàng)B:text選項(xiàng)C:title選項(xiàng)D:body參考答案:B第7題. 當(dāng)爬

3、蟲運(yùn)行到y(tǒng)ield scrapy.Request()或者yield item的時(shí)候,下列哪個(gè)爬蟲中間件的方法被調(diào)用?選項(xiàng)A:process_spider_output()選項(xiàng)B:process_spider_exception()選項(xiàng)C:process_spider_input()選項(xiàng)D:process_start_ requests()參考答案:A第8題. Redis中查看一個(gè)列表長(zhǎng)度,使用關(guān)鍵字()選項(xiàng)A:len選項(xiàng)B:length選項(xiàng)C:llen選項(xiàng)D:count參考答案:C第9題. Python中列表可以用()方法在末尾添加元素選項(xiàng)A:add選項(xiàng)B:append選項(xiàng)C:plus選項(xiàng)D:

4、+參考答案:B第10題. 打開終端,輸入(),屏幕上會(huì)出現(xiàn)Python的路徑選項(xiàng)A:python path選項(xiàng)B:path python選項(xiàng)C:which python選項(xiàng)D:python which參考答案:C第11題. python中可以用來將圖片中的文字轉(zhuǎn)換為文本的第三方類庫(kù)是選項(xiàng)A:lxml選項(xiàng)B:requests選項(xiàng)C:beautifulsoup選項(xiàng)D:pytesseract參考答案:D第12題. Redis中如果不刪除列表中的數(shù)據(jù),又要把數(shù)據(jù)讀出來,就需要使用關(guān)鍵字()選項(xiàng)A:range選項(xiàng)B:lrange選項(xiàng)C:srange選項(xiàng)D:pop參考答案:B第13題. 請(qǐng)問按哪個(gè)鍵可以打

5、開Chrome自帶的開發(fā)者工具()選項(xiàng)A:F10選項(xiàng)B:F1選項(xiàng)C:F11選項(xiàng)D:F12參考答案:D第14題. Python操作CSV文件可通過()容器的方式操作單元格選項(xiàng)A:列表選項(xiàng)B:元組選項(xiàng)C:字典選項(xiàng)D:集合參考答案:C第15題. 當(dāng)需要把Python里面的數(shù)據(jù)發(fā)送給網(wǎng)頁(yè)時(shí),需要先轉(zhuǎn)換成()字符串選項(xiàng)A:Python選項(xiàng)B:Json選項(xiàng)C:正則表達(dá)式選項(xiàng)D:Ajax參考答案:B第16題. Python中Object=1, 2, 3, 4, 5,則Objcet是()選項(xiàng)A:列表選項(xiàng)B:元組選項(xiàng)C:字典選項(xiàng)D:集合參考答案:A第17題. Python中若定義object=12345,則pr

6、int(object:-1)輸出()選項(xiàng)A:1選項(xiàng)B:5選項(xiàng)C:54321選項(xiàng)D:程序報(bào)錯(cuò)參考答案:C第18題. HTTP狀態(tài)碼401表示選項(xiàng)A:請(qǐng)求報(bào)文中可能存在語(yǔ)法錯(cuò)誤選項(xiàng)B:請(qǐng)求需要通過HTTP認(rèn)證選項(xiàng)C:請(qǐng)求資源的訪問被拒絕選項(xiàng)D:服務(wù)器上沒有請(qǐng)求的資源參考答案:B第19題. 如果使用Python的數(shù)據(jù)結(jié)構(gòu)來做類比的話,MongoDB中文檔相當(dāng)于一個(gè)()選項(xiàng)A:列表選項(xiàng)B:元組選項(xiàng)C:字典選項(xiàng)D:集合參考答案:C第20題. 在Python中,為了使用XPath,需要安裝一個(gè)第三方庫(kù)()選項(xiàng)A:lxml選項(xiàng)B:xml選項(xiàng)C:xpath選項(xiàng)D:path參考答案:A第21題. 針對(duì)解析源代碼

7、的BeautifulSoup對(duì)象,構(gòu)造時(shí)BeautifulSoup(網(wǎng)頁(yè)源代碼, 解析器)中的解析器可以為()選項(xiàng)A:html選項(xiàng)B:html.parser選項(xiàng)C:lxml選項(xiàng)D:xml參考答案:A,C第22題. MongoDB中獲取名字為set1的集合的語(yǔ)句為()選項(xiàng)A:database.set1選項(xiàng)B:database(set1)選項(xiàng)C:databaseset1選項(xiàng)D:databaseset1參考答案:A,C第23題. 下列說法錯(cuò)誤的是()選項(xiàng)A:mitmproxy的強(qiáng)大之處在于它還自帶一個(gè)mitmdump命令。這個(gè)命令可以用來運(yùn)行符合一定規(guī)則的Python腳本,并在Python腳本里面直

8、接操作HTTP和HTTPS的請(qǐng)求,以及返回的數(shù)據(jù)包。選項(xiàng)B:命令行中執(zhí)行mitmdump -s parse_request.py即可運(yùn)行python 腳本選項(xiàng)C:使用python可以自定義返回的數(shù)據(jù)包,如 response.headers,就是返回的頭部信息選項(xiàng)D:如果返回的是JSON類型的字符串,python無法進(jìn)行解析。參考答案:A,B,C第24題. 使用BeautifulSoup對(duì)象后可以使用()來查找內(nèi)容選項(xiàng)A:find_all選項(xiàng)B:find選項(xiàng)C:search選項(xiàng)D:search_all參考答案:A,B第25題. 以下哪些可以獨(dú)立成為Python編譯器()選項(xiàng)A:Pycharm選項(xiàng)

9、B:IDLE選項(xiàng)C:Eclipse選項(xiàng)D:Visual Studio 2010參考答案:A,B第26題. Redis中的值可以支持()選項(xiàng)A:列表選項(xiàng)B:哈希選項(xiàng)C:集合選項(xiàng)D:有序集合參考答案:A,B,C,D第27題. 要使用tesseract來進(jìn)行圖像識(shí)別,需要安裝兩個(gè)第三方庫(kù)選項(xiàng)A:requests選項(xiàng)B:beautifulsoup選項(xiàng)C:Pillow選項(xiàng)D:pytesseract參考答案:C,D第28題. 在配置ios使用Charles的操作中,正確的有()選項(xiàng)A:對(duì)于蘋果設(shè)備,首先要保證計(jì)算機(jī)和蘋果設(shè)備聯(lián)在同一個(gè)Wi-Fi上。選項(xiàng)B:選擇“HTTP代理”下面的“手動(dòng)”選項(xiàng)卡,在“服務(wù)

10、器”處輸入計(jì)算機(jī)的IP地址,在“端口”處輸入8888選項(xiàng)C:輸入完成代理以后按下蘋果設(shè)備的Home鍵,設(shè)置就會(huì)自動(dòng)保存。選項(xiàng)D:安裝完成證書以后,在設(shè)置中打開“關(guān)于本機(jī)”,找到最下面的“證書信任設(shè)置”,并在里面啟動(dòng)對(duì)Charles證書的完全信任參考答案:A,B,C,D第29題. 以下HTTP狀態(tài)碼表示服務(wù)器本身發(fā)生錯(cuò)誤的是選項(xiàng)A:400選項(xiàng)B:503選項(xiàng)C:302選項(xiàng)D:500參考答案:B,D第30題. 以下HTTP狀態(tài)碼表示服務(wù)器沒有正常返回結(jié)果的是選項(xiàng)A:200選項(xiàng)B:301選項(xiàng)C:404選項(xiàng)D:500參考答案:B,C,D第31題. Python中字符串切片以后的結(jié)果還是字符串選項(xiàng)A:對(duì)選

11、項(xiàng)B:錯(cuò)參考答案:A第32題. 打碼平臺(tái)都是靠機(jī)器使用OCR技術(shù)識(shí)別圖片上的文字。選項(xiàng)A:對(duì)選項(xiàng)B:錯(cuò)參考答案:B第33題. 驗(yàn)證碼必須通過手動(dòng)填充識(shí)別。選項(xiàng)A:對(duì)選項(xiàng)B:錯(cuò)參考答案:B第34題. 代理中間件的可用代理列表一定要寫在settings.py里面選項(xiàng)A:對(duì)選項(xiàng)B:錯(cuò)參考答案:B第35題. charles配置中,安裝完成證書以后,在設(shè)置中打開“關(guān)于本機(jī)”,找到最下面的“證書信任設(shè)置”,并在里面啟動(dòng)對(duì)Charles證書的完全信任。選項(xiàng)A:對(duì)選項(xiàng)B:錯(cuò)參考答案:A第36題. MongoDB 是一個(gè)基于分布式文件存儲(chǔ)的數(shù)據(jù)庫(kù),速度遠(yuǎn)快過Redis選項(xiàng)A:對(duì)選項(xiàng)B:錯(cuò)參考答案:B第37題.

12、爬蟲的源代碼通過公開不會(huì)對(duì)被爬蟲網(wǎng)站造成影響選項(xiàng)A:對(duì)選項(xiàng)B:錯(cuò)參考答案:B第38題. 一般來說在頁(yè)面都通過GET將用戶登錄信息傳遞到服務(wù)器端。選項(xiàng)A:對(duì)選項(xiàng)B:錯(cuò)參考答案:B第39題. 爬蟲文件無法從Pycharm運(yùn)行和調(diào)試,只能通過命令行的方式運(yùn)行。選項(xiàng)A:對(duì)選項(xiàng)B:錯(cuò)參考答案:B第40題. 通用搜索引擎的目標(biāo)是盡可能大的網(wǎng)絡(luò)覆蓋率,搜索引擎服務(wù)器資源與網(wǎng)絡(luò)數(shù)據(jù)資源互相匹配選項(xiàng)A:對(duì)選項(xiàng)B:錯(cuò)參考答案:B第41題. Python中相比于findall方法,search方法對(duì)于從超級(jí)大的文本里面只找第1個(gè)數(shù)據(jù)特別有用,可以大大提高程序的運(yùn)行效率。選項(xiàng)A:對(duì)選項(xiàng)B:錯(cuò)參考答案:A第42題. M

13、ongoDB URI的格式為:mongodb:/服務(wù)器IP或域名:端口用戶名:密碼選項(xiàng)A:對(duì)選項(xiàng)B:錯(cuò)參考答案:B第43題. Redis中查詢列表長(zhǎng)度命令llen中l(wèi)代表left,即從左側(cè)開始數(shù)選項(xiàng)A:對(duì)選項(xiàng)B:錯(cuò)參考答案:B第44題. middlewares.py是下載器中間件選項(xiàng)A:對(duì)選項(xiàng)B:錯(cuò)參考答案:B第45題. 需要實(shí)名認(rèn)證的打碼網(wǎng)站更加安全可靠。選項(xiàng)A:對(duì)選項(xiàng)B:錯(cuò)參考答案:B第46題. 開源庫(kù)pytesseract的作用是將圖像中文字轉(zhuǎn)換為文本。選項(xiàng)A:對(duì)選項(xiàng)B:錯(cuò)參考答案:A第47題. 要實(shí)現(xiàn)Charles對(duì)Android抓包,其過程比iOS稍微復(fù)雜一點(diǎn)。這是因?yàn)椴煌腁ndorid設(shè)備,安裝證書的入口可能不一樣選項(xiàng)A

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論