22春“計算機科學與技術”專業(yè)《網(wǎng)絡爬蟲與信息提取》在線作業(yè)答案參考9_第1頁
22春“計算機科學與技術”專業(yè)《網(wǎng)絡爬蟲與信息提取》在線作業(yè)答案參考9_第2頁
22春“計算機科學與技術”專業(yè)《網(wǎng)絡爬蟲與信息提取》在線作業(yè)答案參考9_第3頁
22春“計算機科學與技術”專業(yè)《網(wǎng)絡爬蟲與信息提取》在線作業(yè)答案參考9_第4頁
22春“計算機科學與技術”專業(yè)《網(wǎng)絡爬蟲與信息提取》在線作業(yè)答案參考9_第5頁
全文預覽已結(jié)束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、22春“計算機科學與技術”專業(yè)網(wǎng)絡爬蟲與信息提取在線作業(yè)答案參考1. Python中Object=(1,2,3,4,5),則Objcet是( )。A.列表B.元組C.字典D.集合參考答案:B2. 帶上通過Chrome瀏覽器從評論頁面復制而來的( )再發(fā)起請求,可以減少爬蟲被網(wǎng)站封鎖的概率A.CookieB.HtmlC.HeadersD.CSS參考答案:C3. 在Mac OS下安裝MongoDB使用命令( )install mongodb。A.brewB.apt-getC.sudoD.apt參考答案:A4. 下面Python代碼輸出為( ): def default_para_without_t

2、rap(para=, value=0): if not para:下面Python代碼輸出為( ): def default_para_without_trap(para=, value=0): if not para: para = para.append(value) return para print('第一步:'.format(default_para_trap(value=100) print('第二步:'.format(default_para_trap(value=50)A.第一步:100 第二步:100,50B.第一步:100 第二步:50C.第

3、一步:100 第二步:D.第一步:100 第二步:100參考答案:B5. Redis中查詢列表長度命令llen中l(wèi)代表left,即從左側(cè)開始數(shù)。( )A.正確B.錯誤參考答案:B6. 當Charles抓包以后,在Mac OS系統(tǒng)下可以按Command+F組合鍵,在Windows系統(tǒng)下按Ctrl+F組合鍵打開Charles進行搜索。( )T.對F.錯參考答案:T7. ( )是一個傳遞信息的通道。它負責將爬取博文列表頁獲取到的信息傳遞給負責爬取正文頁的方法中。( )是一個傳遞信息的通道。它負責將爬取博文列表頁獲取到的信息傳遞給負責爬取正文頁的方法中。A.metaB.headC.headerD.bo

4、dy參考答案:A8. XPath提取出來的內(nèi)容是一個SelectorList對象,它的第0個元素就是網(wǎng)頁的源代碼。( )T.對F.錯參考答案:F9. 當使用Scarpy創(chuàng)建爬蟲時,當爬取網(wǎng)易云音樂首頁信息時,scrapy genspider的第二個參數(shù)直接輸入就可以了。( )T.對F.錯參考答案:F10. process_spider_input(response,spider)是在爬蟲運行yield item或者yield scrapy.Request( )的時候調(diào)用。( )A.正確B.錯誤參考答案:B11. Python中若定義object="12345",則print

5、(object:-1)輸出( )Python中若定義object="12345",則print(object:-1)輸出( )A.1B.5C.54321D.程序報錯參考答案:C12. 以下哪個命令是linux下解壓縮命令?( )A.curlB.tar-zxvfC.mkdirD.cp參考答案:B13. 常用的會話跟蹤技術是( )A.sessionB.cookiesC.moonpiesD.localstorage參考答案:AB14. 使用UI Automatorr讓屏幕向右滾動的操作是得到相應控件后使用命令scroll.horiz.forward( )。( )T.對F.錯參考答

6、案:F15. Python中有哪些實現(xiàn)多線程方法( )Python中有哪些實現(xiàn)多線程方法( )A.multiprocess.dummyB.threading.ThreadC.processD.PyMongoDB參考答案:AB16. HTTP常用狀態(tài)碼表明服務器不允許訪問那個資源的是( )A.500B.503C.403D.405參考答案:C17. cookies在http請求中是明文傳輸?shù)摹? )T.對F.錯參考答案:T18. Python正則表達式中“.*?”是非貪婪模式,獲取最短的能滿足條件的字符串。( )A.正確B.錯誤參考答案:A19. Python中包含字典的列表頁可以轉(zhuǎn)換成JSON字符串。(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論