版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
【MOOC】Python數(shù)據(jù)爬取與可視化-南華大學中國大學慕課MOOC答案順序結(jié)構(gòu)IPO編程小測驗1、【單選題】269003下列不是IPO程序編寫方法的一部分的是:本題答案:【Program】2、【單選題】關(guān)于Python中eval()函數(shù)的使用,下面代碼執(zhí)行后的輸出結(jié)果是:x=1eval(x+1)本題答案:【2】3、【單選題】Python中用于獲取用戶輸入的函數(shù)是:本題答案:【input()】4、【單選題】下面代碼的輸出結(jié)果是:C1=10print(轉(zhuǎn)換后的溫度是{:.2f}C.format(C1)本題答案:【轉(zhuǎn)換后的溫度是10.00C】分支結(jié)構(gòu)小測驗1、【單選題】以下關(guān)于控制結(jié)構(gòu)的描述,錯誤的是:本題答案:【條件表達式必須是計算結(jié)果為True或False的表達式或函數(shù)】2、【單選題】實現(xiàn)多路分支的最佳控制語句是:本題答案:【if--elif--else】3、【單選題】關(guān)于Python判斷條件及組合,描述錯誤的是????????????????????????????????????????????????????????????????????????????????????????????????:本題答案:【條件表達式==True的值是True】4、【單選題】以下程序的輸出結(jié)果是:????????????????????????????????????????????????????????????????????????????????????????????????t=Pythonprint(tift=pythonelseNone)本題答案:【None】5、【單選題】關(guān)于以下代碼,以下選項中描述錯誤的是:PM=eval(input(請輸入目前PM2.5值:))ifPM75:print(空氣質(zhì)量等級為輕度污染!)ifPM35:print(空氣質(zhì)量等級為優(yōu)!)本題答案:【輸入25,無法得到“空氣質(zhì)量等級為優(yōu)!”】循環(huán)結(jié)構(gòu)小測驗1、【單選題】可以結(jié)束一個循環(huán)的保留字是:本題答案:【break】2、【單選題】下面的循環(huán)語句,i控制的外層循環(huán)每執(zhí)行一次,j控制的內(nèi)層循環(huán)執(zhí)行()次。foriinrange(1,10):forjinrange(1,i+1):print(i,j,i*j)本題答案:【i】3、【單選題】以下打印的九九乘法表最規(guī)范的代碼段是:本題答案:【foriinrange(1,10):forjinrange(1,i+1):print(%d*%d=%2d%(j,i,i*j),end=)print()】集合小測驗1、【單選題】以下不能創(chuàng)建一個集合的是:本題答案:【s={}】2、【單選題】以下語句s={4,by,(10,C),4,5,by}len(s)執(zhí)行后,輸出結(jié)果是:本題答案:【4】3、【單選題】兩個集合:s1={1,3,5,6},s2={2,5,6},則獲取在s1和s2中都有的元素應(yīng)使用:本題答案:【s1s2】列表小測驗1、【單選題】以下代碼的輸出結(jié)果是:list1=[1,2,3,4]list2=list1list3=list2list1.remove(1)print(list3[1])本題答案:【3】2、【單選題】已知x=[1,2,3],則執(zhí)行語句x[1:3]=[4,5]后,x的值為:本題答案:【[1,4,5]】3、【單選題】lst=[1,2,3]lst[1]='abc'上面的代碼執(zhí)行后,lst的值是:本題答案:【[1,'abc',3]】4、【單選題】已知列表x=[1,2,3],那么執(zhí)行語句x.insert(1,4)后,x的值為:本題答案:【[1,4,2,3]】5、【單選題】以下程序的輸出結(jié)果是:nums=[1,2,3,4]nums.append([5,6,7,8])print(len(nums))本題答案:【5】函數(shù)小測驗1、【單選題】關(guān)于函數(shù),以下說法錯誤的是:本題答案:【調(diào)用時需要了解函數(shù)內(nèi)部實現(xiàn)細節(jié)】2、【單選題】Python中定義函數(shù)的關(guān)鍵字是:本題答案:【def】3、【單選題】關(guān)于函數(shù)調(diào)用,描述正確的是:本題答案:【自定義函數(shù)調(diào)用前必須定義】4、【單選題】下面程序的輸出結(jié)果是:deffunc(a,b):a*=breturnas=func(5,2)print(s)本題答案:【10】5、【單選題】以下代碼輸出:defexchange(a,b):a,b=b,areturn(a,b)x=10y=20x,y=exchange(x,y)print(x,y)本題答案:【2010】6、【單選題】defexchange(a,b):a,b=b,areturn(a,b)x=10y=20exchange(x,y)print(x,y)本題答案:【1020】文件小測驗1、【單選題】關(guān)于Python對文件的處理,以下選項中描述錯誤的是:本題答案:【當文件以文本方式打開時,讀寫按照字節(jié)流方式】2、【單選題】Python文件打開模式,錯誤的是:本題答案:【創(chuàng)建寫模式n】3、【單選題】有如下代碼:fname=input(請輸入要打開的文件:)fi=open(fname,r)forlineinfi.readlines():print(line)fi.close()以下描述錯誤的是:本題答案:【通過fi.readlines()方法將文件的全部內(nèi)容讀入到一個字典中】單元測驗-Python語言基礎(chǔ)1、【單選題】以下代碼的執(zhí)行結(jié)果是()if-1:print(True.)else:print(False.)本題答案:【True】2、【單選題】以下代碼的執(zhí)行結(jié)果是()。desserts=['icecream','chocolate','applecrisp','cookies']favorite_dessert='applecrisp'fordessertindesserts:ifdessert==favorite_dessert:print(%sismyfavoritedessert!%dessert.title())本題答案:【AppleCrispismyfavoritedessert!】3、【單選題】以下代碼的執(zhí)行結(jié)果是()。foriinrange(4):print(2**i,end=)本題答案:【1248】4、【單選題】以下代碼的執(zhí)行結(jié)果是()。s=PYTHONwhiles!=:forcins:print(c,end=)s=s[:-1]本題答案:【PYTHONPYTHOPYTHPYTPYP】5、【單選題】關(guān)于Python判斷條件及組合,描述錯誤的是()。本題答案:【==True以上判斷條件的輸出結(jié)果是True】6、【單選題】以下關(guān)于程序控制結(jié)構(gòu)的描述中,錯誤的是()。本題答案:【在Python的程序流程圖中可以用處理框表示計算的輸出結(jié)果】7、【單選題】以下關(guān)于程序循環(huán)結(jié)構(gòu)的描述中,錯誤的是()。本題答案:【遍歷循環(huán)使用for循環(huán)變量in循環(huán)結(jié)構(gòu)語句,其中循環(huán)結(jié)構(gòu)不能是文件】8、【單選題】以下關(guān)于描述中,錯誤的是()。本題答案:【break語句跳出本次循環(huán),而continue跳出整個循環(huán)?!?、【單選題】以下關(guān)于程序控制結(jié)構(gòu)的描述中,正確的是()。本題答案:【Python使用while實現(xiàn)無限循環(huán)】10、【單選題】以下關(guān)于列表和字符串的描述中,錯誤的是()。本題答案:【字符串是單一字符的無序組合】11、【單選題】關(guān)于Python的字典類型,以下選項中描述錯誤的是()。本題答案:【如果想保持一個集合中元素的順序,可以使用字典類型】12、【單選題】關(guān)于Python序列類型的通用操作符和函數(shù),以下選項中描述錯誤的是()。本題答案:【如果s是一個序列,s=[1,kate,True],s[3]返回True】13、【單選題】關(guān)于Python組合數(shù)據(jù)類型,以下選項中描述錯誤的是()。本題答案:【序列類型是二維元素向量,元素之間存在先后關(guān)系,通過序號訪問】14、【單選題】關(guān)于Python組合數(shù)據(jù)類型,以下選項中描述錯誤的是()。本題答案:【組合數(shù)據(jù)類型是用單一的數(shù)據(jù)對象表示多個同類型的數(shù)據(jù)】15、【單選題】關(guān)于Python元組類型,以下選項中描述錯誤的是()。本題答案:【元組中元素不可以是不同類型】16、【單選題】關(guān)于Python列表類型,以下選項中描述錯誤的是()。本題答案:【列表屬于序列類型,不支持成員關(guān)系操作符in和長度計算函數(shù)len】17、【單選題】關(guān)于Python字典類型與JSON格式,以下選項中描述錯誤的是()。本題答案:【JSON格式表達的數(shù)據(jù)都能用字典數(shù)據(jù)結(jié)構(gòu)來表達】18、【單選題】關(guān)于數(shù)據(jù)維度,以下選項中描述錯誤的是()。本題答案:【一維數(shù)據(jù)由對等關(guān)系的有序數(shù)據(jù)組成,不包括無序數(shù)據(jù)】19、【單選題】關(guān)于Python元組類型,以下選項中描述錯誤的是()。本題答案:【元組是可變對象】20、【單選題】關(guān)于函數(shù),以下選項中描述錯誤的是()。本題答案:【函數(shù)使用時需要了解函數(shù)內(nèi)部實現(xiàn)細節(jié)】21、【單選題】關(guān)于函數(shù)的返回值,以下選項中描述錯誤的是()。本題答案:【函數(shù)必須有返回值】22、【單選題】關(guān)于函數(shù)的參數(shù),以下選項中描述錯誤的是()。本題答案:【可選參數(shù)可以定義在非可選參數(shù)的前面】23、【單選題】關(guān)于lambda函數(shù),以下選項中描述錯誤的是()。本題答案:【lambda不是Python的保留字】24、【單選題】關(guān)于函數(shù),以下選項中描述錯誤的是()。本題答案:【函數(shù)把具有獨立功能的代碼組織成一個模塊,重復調(diào)用,可以提高程序的執(zhí)行效率】25、【單選題】以下關(guān)于Python程序格式的描述,描述錯誤的是()。本題答案:【變量用來保存數(shù)據(jù)值,不需要聲明,但可以重命名】26、【單選題】關(guān)于函數(shù),以下選項中描述錯誤的是()。本題答案:【函數(shù)定義中不含return語句,肯定會運行出錯】27、【單選題】以下關(guān)于python內(nèi)置函數(shù)的描述,錯誤的是:本題答案:【sorted()對一個序列類型數(shù)據(jù)進行排序,將排序后的結(jié)果寫回到該變量中】28、【單選題】以下代碼的執(zhí)行結(jié)果是()。defarea(r,pi=3.14159):returnpi*r*rarea(pi=3.14,r=4)本題答案:【50.24】29、【單選題】以下代碼的執(zhí)行結(jié)果是()。deff2(a):ifa33:returnTruelst=[11,22,33,44,55]res=filter(f2,lst)print(list(res))本題答案:【[44,55]】30、【單選題】關(guān)于以下代碼,描述錯誤的是()。lst=[car,truck]deffun(a):lst=[]lst.append(a)returnfun(bus)print(lst)本題答案:【執(zhí)行代碼輸出結(jié)果為['car','truck','bus']】單元測驗-爬蟲基礎(chǔ)1、【單選題】下列第三方庫中,哪個庫可以用于實現(xiàn)模擬瀏覽器發(fā)送請求的()本題答案:【requests】2、【單選題】requests庫中用哪個方法可以模擬瀏覽器發(fā)送請求()本題答案:【get】3、【單選題】下列說法正確的是:本題答案:【使用爬蟲時要注意版權(quán)相關(guān)問題,有作者署名的受版權(quán)保護的內(nèi)容不允許爬取后隨意轉(zhuǎn)載或用于商業(yè)用途。】4、【單選題】關(guān)于HTTP狀態(tài)碼,下列說法正確錯誤的是:本題答案:【5xx表示服務(wù)器在處理請求的過程中沒有錯誤或者沒有異常狀態(tài)發(fā)生,】5、【單選題】HTML是整個網(wǎng)頁的結(jié)構(gòu),相當于整個網(wǎng)站的框架。帶“<”、“>”符號的都是屬于HTML的標簽,并且標簽都是成對出現(xiàn)的。下列說法中,錯誤的是:本題答案:【img../img表示該標簽是標題】6、【單選題】下列第三方庫中,哪個庫可以用于從HTML或XML文件中提取數(shù)據(jù)?本題答案:【BeautifulSoup】7、【單選題】使用BeautifulSoup第三方庫篩選數(shù)據(jù),如果只想找到第一個符合條件的對象,應(yīng)該用以下哪個方法最便捷?本題答案:【find()】8、【判斷題】任何組織、個人收集數(shù)據(jù),應(yīng)當采取合法、正當?shù)姆绞?,不得竊取或者以其他非法方式獲取數(shù)據(jù).本題答案:【正確】9、【判斷題】技術(shù)無罪,我們可以編寫網(wǎng)絡(luò)爬蟲在互聯(lián)網(wǎng)上爬取任何數(shù)據(jù)。本題答案:【正確】10、【判斷題】我們可以編寫網(wǎng)絡(luò)爬蟲程序,無限制并發(fā)訪問網(wǎng)站服務(wù)器。本題答案:【錯誤】11、【判斷題】“robots協(xié)議”并非某一個公司或者組織制定,而是由互聯(lián)網(wǎng)從業(yè)人員討論產(chǎn)生?!皉obots協(xié)議”成為搜索技術(shù)企業(yè)共同遵守的一個規(guī)范。本題答案:【正確】12、【判斷題】我們使用爬蟲抓取數(shù)據(jù)時,應(yīng)審查所抓取的內(nèi)容,不能包含用戶的個人信息、隱私或者他人的商業(yè)機密。本題答案:【正確】13、【判斷題】我們使用爬蟲抓取數(shù)據(jù),在規(guī)避反爬蟲措施的同時,應(yīng)該避免干擾被訪問網(wǎng)站的正常運行。本題答案:【正確】14、【判斷題】我們使用爬蟲抓取數(shù)據(jù)時,不能侵犯作者的著作權(quán)等其他受法律法規(guī)保護的內(nèi)容。本題答案:【正確】15、【判斷題】我們使用爬蟲抓取數(shù)據(jù)時,嚴禁通過“隱瞞事實、虛構(gòu)真相”的方式對數(shù)據(jù)進行訪問。本題答案:【正確】16、【判斷題】HTML是客戶端瀏覽器和Web服務(wù)器之間通信的基礎(chǔ)。本題答案:【錯誤】17、【判斷題】URL指的是統(tǒng)一資源定位符,用來指定Web文檔在互聯(lián)網(wǎng)上所在的位置的。本題答案:【正確】18、【判斷題】HTML語言是一種程序設(shè)計語言。本題答案:【錯誤】19、【判斷題】get與post是兩種常用的HTTP請求方法。本題答案:【正確】20、【判斷題】HTML標簽是由尖括號包圍的關(guān)鍵詞,一般成對出現(xiàn),例如html與/html.本題答案:【正確】單元測驗-靜態(tài)數(shù)據(jù)爬取與詞云制作1、【單選題】Python內(nèi)置的HTTP請求庫是()。本題答案:【urllib】2、【單選題】學習爬蟲,就需要分析網(wǎng)頁的HTML元素,就要學會使用瀏覽器的開發(fā)者工具,打開一些主流瀏覽器(如GoogleChrome或360瀏覽器)開發(fā)者工具的快捷鍵是()。本題答案:【F12】3、【單選題】以下哪一個第三方庫不是用來解析HTML/XML文件的?本題答案:【requests】4、【單選題】使用以下哪一種方法,可以將字符串默認按照空格進行切片操作?本題答案:【split()】5、【單選題】以下關(guān)于lambda函數(shù)的描述中,錯誤的是()。本題答案:【lambda必須要自己先定義,才能使用lambda】6、【單選題】以下關(guān)于Python中導入模塊的幾種方式描述中,錯誤的是()。本題答案:【from模塊名import功能名as別名例如,importmatplotlib.pyplotasplt這里給matplotlib庫中的pyplot這個模塊取了一個別名plt,在使用的時候,直接用pyplot.plt即可。】7、【判斷題】“詞云”是對網(wǎng)絡(luò)文本中出現(xiàn)頻率較高的“關(guān)鍵詞”予以視覺上的突出,形成“關(guān)鍵詞云層”或“關(guān)鍵詞渲染”,從而過濾大量無意義信息,突出文章或者網(wǎng)頁內(nèi)容的主旨。本題答案:【正確】8、【判斷題】urllib庫中的request模塊是最基本的http請求模塊,用來模擬發(fā)送請求的。本題答案:【正確】9、【判斷題】urllib庫中的error模塊是異常處理模塊,可以捕獲由request模塊產(chǎn)生的異常,避免了程序因報錯而終止的問題。本題答案:【正確】10、【判斷題】直接用import導入urllib.request這個模塊后,就可以使用request模塊中的urlopen()這個方法來獲取頁面。本題答案:【正確】11、【判斷題】close()方法用于關(guān)閉一個已打開的文件。關(guān)閉后的文件不能再進行讀寫操作。使用close()方法關(guān)閉文件是一個好的習慣。本題答案:【正確】12、【判斷題】停用詞(StopWords)是指在信息檢索中,為提高搜索效率,在處理文本數(shù)據(jù)之前,會自動過濾掉某些字或詞,這些字或詞被稱為停用詞。本題答案:【正確】13、【判斷題】繪制詞云時,必須要使用matplotlib第三方庫。本題答案:【錯誤】14、【判斷題】使用wordcloud庫對中文文本進行詞云繪制時,必須要使用font_path參數(shù)設(shè)置中文的字體,否則中文顯示會出現(xiàn)亂碼。本題答案:【正確】15、【判斷題】要使用wordcloud庫制作個性化詞云,要從指定的文件讀取圖像,可以使用WordCloud函數(shù)中mask參數(shù)進行圖片設(shè)置。本題答案:【正確】16、【判斷題】使用wordcloud庫繪制詞云時,可以使用WordCloud對象中background_color這個參數(shù),來指定詞云圖片的背景顏色,如果不做設(shè)置,則默認為黑色。本題答案:【正確】17、【判斷題】使用wordcloud庫繪制詞云時,可以使用WordCloud對象中width和height兩個參數(shù),來指定詞云對象生成圖片的寬度、高度,寬度默認400像素,高度默認200像素。本題答案:【正確】18、【判斷題】使用wordcloud庫繪制詞云時,如果文檔中有詞頻數(shù)據(jù),則可以使用WordCloud對象中fit_words()方法或者是generate_frome_frequencies()方法,這兩個方法都可以根據(jù)詞頻來生成詞云。本題答案:【正確】單元測驗-多頁面數(shù)據(jù)爬取1、【單選題】關(guān)于find_all()與find()兩種方法的區(qū)別,以下說法錯誤的是()本題答案:【find()和find_all()都可以直接使用.text獲取返回結(jié)果的文本內(nèi)容】2、【單選題】關(guān)于小說爬取,以下說法不正確的是()本題答案:【如果要爬取的網(wǎng)站有明確聲明禁止爬蟲采集或者采取了反爬措施時,可以采用一些技術(shù)手段,避開反爬措施,繼續(xù)爬取】3、【單選題】如果某個小說網(wǎng)站中,某個小說目錄頁面中的信息,如下圖所示,要獲取每一章小說的完整鏈接,以下做法哪種最合適?本題答案:【目錄頁href中的信息不完整,不是一個完整鏈接,應(yīng)該打開幾個章節(jié)頁面,分析鏈接特點,利用字符串連接的方法,將前面缺失的部分與當前href中的信息進行連接,補齊每個章節(jié)的鏈接,再進行下一步操作。】4、【單選題】打開某個網(wǎng)站,某篇小說中某一章節(jié)的頁面,在開發(fā)者模式下,找到當前章節(jié)的網(wǎng)頁元素,如下圖所示,那么在使用BeautifulSoup庫篩選數(shù)據(jù)時,以下哪種寫法能夠直接篩選出小說的正文內(nèi)容?也就是不含HTML標簽在內(nèi)。本題答案:【content=soup.find(div,id=content).text】5、【單選題】假設(shè)已有函數(shù)getChapterContent(url)實現(xiàn)功能為:根據(jù)url返回每一章小說的內(nèi)容ChapterTitle列表中存儲了所有章節(jié)的名稱ChapterLink列表中存儲了所有章節(jié)的鏈接。爬取多章節(jié)小說存儲到txt文件時,以下做法錯誤的是()。H、寫入當前章節(jié)名稱f.write(getChapterContent(ChapterLink[i]))I、寫入當前章節(jié)內(nèi)容f.close()J、foriinrange(len(ChapterTitle)):f=open('人民的名義.txt','w')f.write(ChapterTitle[i])K、寫入當前章節(jié)名稱f.write(getChapterContent(ChapterLink[i]))L、寫入當前章節(jié)內(nèi)容f.close()本題答案:【foriinrange(len(ChapterTitle)):f=open('人民的名義.txt','w')f.write(ChapterTitle[i])#寫入當前章節(jié)名稱f.write(getChapterContent(ChapterLink[i]))#寫入當前章節(jié)內(nèi)容f.close()】6、【判斷題】網(wǎng)頁中一個標簽Tag可能包含多個字符串或其它的標簽,那么這些內(nèi)部的標簽都可以這個Tag的子節(jié)點。本題答案:【正確】7、【判斷題】第三方庫bs4中,find_all()方法find_all(name,attrs,recursive,string,**kwargs)是用來搜索當前標簽tag的所有tag子節(jié)點,并判斷是否符合過濾器的條件。本題答案:【正確】8、【判斷題】第三方庫bs4中,find_all()方法的返回結(jié)果是值包含一個元素的列表,而find()方法也是直接返回一個搜索結(jié)果的列表。本題答案:【錯誤】9、【判斷題】第三方庫bs4中,find_all(name,attrs,recursive,string,**kwargs)可以設(shè)置name參數(shù),用來查找所有名字為name的tag,字符串對象會被自動忽略掉。本題答案:【正確】10、【判斷題】爬取具有多章節(jié)的小說時,要首先分析目錄頁面,在保存章節(jié)名稱與待爬取章節(jié)鏈接時,要注意名稱與鏈接之間的對應(yīng)關(guān)系。本題答案:【正確】11、【判斷題】如果網(wǎng)頁返回的內(nèi)容是亂碼,則統(tǒng)一使用“utf-8”來對頁面內(nèi)容進行再次編碼就可以了!本題答案:【錯誤】12、【判斷題】寫文件時,可以通過mode參數(shù)設(shè)置文件的讀寫模式為寫模式,這樣可以不改變文件本來的內(nèi)容,在后面追加新的內(nèi)容。本題答案:【錯誤】13、【判斷題】defmain():使用這句話可以定義一個主函數(shù),在python程序設(shè)計中,可以不需要定義主函數(shù),程序也能正常工作本題答案:【正確】14、【判斷題】關(guān)于文件操作,打開文件可以使用withopen()asf:語句,使用該語句時可以不使用f.close()語句來關(guān)閉文件。本題答案:【正確】15、【判斷題】如果要將文本中的一些空白字符去掉,可以使用strip()函數(shù)來去掉空白字符。本題答案:【錯誤】單元測驗-動態(tài)數(shù)據(jù)爬取1、【單選題】pandas主要提供了3種數(shù)據(jù)結(jié)構(gòu),其中()可以表示帶標簽的一維數(shù)組。本題答案:【Series】2、【單選題】pandas主要提供了3種數(shù)據(jù)結(jié)構(gòu):其中()可以用來表示帶標簽且大小可變的二維表格結(jié)構(gòu)。本題答案:【DataFrame】3、【單選題】用字典類型的數(shù)據(jù)來創(chuàng)建一個DataFrame時,它會自動的將()做列名.本題答案:【字典的鍵】4、【單選題】用字典類型的數(shù)據(jù)來創(chuàng)建一個DataFrame,它會自動將()作為單元格內(nèi)容。本題答案:【字典的值】5、【單選題】以下關(guān)于json數(shù)據(jù)的描述中,錯誤的是()本題答案:【json是非常利于人閱讀,但是不太利于機器解析和生成的?!?、【判斷題】輸入城市,查詢該城市的天氣信息時,要手動構(gòu)造該城市的鏈接,如下所示。這就需要提前構(gòu)造{“城市”:“編號”}的字典。website='/weather1d/101250401.shtml#input'本題答案:【正確】7、【判斷題】查找城市天氣數(shù)據(jù)時,若要使用BeautifulSoup中的find()方法,則可以使用網(wǎng)頁標簽及標簽屬性來定位到對應(yīng)的數(shù)據(jù)。例如:soup.find('p',class_=tem).text本題答案:【正確】8、【判斷題】查找城市天氣數(shù)據(jù)時,soup.find('p',class_=tem).text這行代碼的作用,是找到頁面中屬性值為“tem”的‘p’標簽,并利用.text提取出其中的文本,也就是溫度數(shù)據(jù)。本題答案:【正確】9、【判斷題】查找城市天氣數(shù)據(jù)時,soup.find('p',class_=tem).text標簽屬性使用“class_”的原因是class在python中是關(guān)鍵保留字,不能將class作為變量名或過程名使用,所以在寫爬蟲的時候使用class_來表示網(wǎng)頁標簽屬性本題答案:【正確】10、【判斷題】在一些網(wǎng)頁開發(fā)中,后臺人員已經(jīng)整理好了需要展示的數(shù)據(jù),這些數(shù)據(jù)作為API,可以供前端開發(fā)人員直接按需求進行可視化,同時,這個數(shù)據(jù)API還可以供外界使用。數(shù)據(jù)API的設(shè)計簡單高效,這個接口已經(jīng)存儲好大家所需要的數(shù)據(jù),我們不需要再花過多的精力去解析網(wǎng)頁。但數(shù)據(jù)API也有一些缺點。例如有一些API數(shù)據(jù)不是及時更新的,也有許多免費的API對爬取量有很大的限制,如果你的爬取需求很大,是需要付費的。本題答案:【正確】11、【判斷題】Python擴展庫matplotlib包括pylab、pyplot等繪圖模塊,支持線條樣式、字體屬性、軸屬性以及其他屬性的管理和控制,可以使用非常簡潔的代碼繪制出優(yōu)美的各種圖案。本題答案:【正確】12、【判斷題】json.loads()方法可以將字符串數(shù)據(jù)轉(zhuǎn)換成python數(shù)據(jù)本題答案:【正確】13、【判斷題】json.dumps()方法的作用是將一個Python對象進行JSON格式的編碼。本題答案:【正確】14、【判斷題】對于API服務(wù)的使用者來說,必須了解API具體的實現(xiàn)細節(jié),才能夠使用API服務(wù)。本題答案:【錯誤】15、【判斷題】API,也就是ApplicationProgrammingInterface,指的是某個公司想要更多人來使用本公司的數(shù)據(jù)或者產(chǎn)品,決定向外部開放其內(nèi)部應(yīng)用程序的數(shù)據(jù)或者功能,就留出一個接口,供其他人來使用。本題答案:【正確】階段性考試1、【單選題】以下哪一個第三方庫是用來解析HTML/XML文件的?本題答案:【bs4(BeautifulSoup4)】2、【單選題】關(guān)于Python變量的說法錯誤的是()。本題答案:【變量無須先創(chuàng)建和賦值,可以直接使用】3、【單選題】一些主流程序設(shè)計語言(如Java、C語言)是采用大括號“{}”分隔不同代碼塊,那么Python語言是使用()來區(qū)分代碼塊之間的層次邏輯?本題答案:【縮進和冒號:】4、【單選題】導入模塊的方式錯誤的是()。本題答案:【import子模塊from模塊】5、【單選題】關(guān)于Python標準庫和第三方庫的說法,錯誤的是()。本題答案:【Python標準庫與第三方庫的調(diào)用方式是不一樣的,只有第三方庫可以使用import語句調(diào)用?!?、【單選題】學習爬蟲,就需要分析網(wǎng)頁的HTML元素,就要學會使用瀏覽器的開發(fā)者工具,打開一些主流瀏覽器(如GoogleChrome或360瀏覽器)開發(fā)者工具的快捷鍵是()。本題答案:【F12】7、【單選題】下列選項中不是Python序列類型的是????????????????????????????????????????????????????????????????????????????????()。本題答案:【數(shù)組類型】8、【單選題】下列關(guān)于Python中列表的描述,錯誤的是????????????????????????????????????????????????????????????????????????????????()。本題答案:【Python列表的長度不可變】9、【單選題】下列關(guān)于Python中組合數(shù)據(jù)類型的描述,錯誤的是????????????????????????????????????????????????????????????????????????????????()。本題答案:【序列類型是二維元素向量,元素之間存在先后關(guān)系,通過序號訪問】10、【單選題】Python擁有豐富的第三方庫,以下哪一個不屬于Python數(shù)據(jù)可視化的第三方庫?本題答案:【xpath】11、【單選題】以下關(guān)于使用Python實現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)爬取的描述中,錯誤的是()。本題答案:【編寫爬蟲程序,從網(wǎng)頁上抓回的數(shù)據(jù)一定是HTML文件,可以使用bs4、xpath這些第三方庫進行進一步解析。】12、【單選題】進行詞頻統(tǒng)計時,假設(shè)將單詞保存在變量word中,使用一個字典類型counts={},要統(tǒng)計單詞出現(xiàn)的次數(shù),可以采用以下哪一行代碼?本題答案:【counts[word]=count.get(word,0)+1】13、【單選題】無需使用Python的pip工具安裝的庫是()。本題答案:【Python標準庫】14、【單選題】如果要用Python編程畫圖繪制數(shù)據(jù)分析的結(jié)果,要用的第三方庫是()。本題答案:【matplotlib】15、【單選題】以下屬于Python中文分詞方向第三方庫的是()。本題答案:【jieba】16、【單選題】以下用于Python網(wǎng)絡(luò)爬蟲方向的第三方庫是()。本題答案:【requests】17、【單選題】以下關(guān)于requests的描述中,正確的是()。本題答案:【requests庫是處理HTTP請求的第三方庫】18、【單選題】以下關(guān)于JSON(JavaScriptObjectNotation)數(shù)據(jù)格式的描述中,錯誤的是()本題答案:【易于人閱讀和編寫,不利于機器解析和生成。】19、【單選題】以下關(guān)于JSON(JavaScriptObjectNotation)數(shù)據(jù)語法的描述中,錯誤的是()本題答案:【JSON數(shù)據(jù)的書寫格式是:值對/名稱】20、【單選題】以下關(guān)于瀏覽器開發(fā)者模式的描述中,錯誤的是()。本題答案:【常用模塊之一控制臺(Console),用于編輯頁面的內(nèi)容,即時顯示在頁面上?!?1、【判斷題】“詞云”是對網(wǎng)絡(luò)文本中出現(xiàn)頻率較高的“關(guān)鍵詞”予以視覺上的突出,形成“關(guān)鍵詞云層”或“關(guān)鍵詞渲染”,從而過濾大量無意義信息,突出文章或者網(wǎng)頁內(nèi)容的主旨。本題答案:【正確】22、【判斷題】Python內(nèi)置的HTTP請求庫是requests。本題答案:【錯誤】23、【判斷題】urllib庫中的request模塊是最基本的http請求模塊,用來模擬發(fā)送請求的。本題答案:【正確】24、【判斷題】urllib庫中的error模塊是異常處理模塊,一旦捕獲request模塊產(chǎn)生的異常,程序?qū)箦e終止。本題答案:【錯誤】25、【判斷題】當前主流的瀏覽器都包含一套強大的開發(fā)者工具套件,這些工具可以檢查當前加載的HTML、CSS和JavaScript,顯示每個資源頁面的請求以及載入所花費的時間等。本題答案:【正確】26、【判斷題】直接用import導入urllib.request這個模塊后,就可以使用request模塊中的read()這個方法來獲取某個鏈接的頁面數(shù)據(jù)。本題答案:【錯誤】27、【判斷題】字符串split()方法可以默認將字符串按照空格進行切片操作。本題答案:【正確】28、【判斷題】lambda函數(shù)又叫匿名函數(shù),無需使用def來定義函數(shù)名,可以隨時需要隨時定義,但是只能在定義之處臨時使用一次。本題答案:【正確】29、【判斷題】為提高信息檢索效率,在處理文本數(shù)據(jù)之前,會自動過濾掉某些字或詞,這些字或詞被稱為停用詞。本題答案:【正確】30、【判斷題】繪制詞云時,常用的第三方庫是wordcloud。本題答案:【正確】31、【判斷題】matplotlib是一個Python2D繪圖庫,只需幾行代碼就可以生成圖表、直方圖、功率譜、條形圖、誤差圖、散點圖等。本題答案:【正確】32、【判斷題】要使用wordcloud庫制作個性化詞云,要從指定的文件讀取圖像,可以使用WordCloud函數(shù)中mask參數(shù)進行圖片設(shè)置。本題答案:【正確】33、【判斷題】from模塊名import功能名from語句讓你從模塊
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 網(wǎng)絡(luò)渠道合作合同范例
- 食堂勞務(wù)服務(wù)合同范例
- 無錫市勞動局合同范例
- 排污施工合同范例
- 合伙開奶茶合同范例
- 鋼板下料合同范例
- 家長和機構(gòu)合同范例
- 門窗售后質(zhì)保合同范例
- 非洲金礦并購合同范例
- 板材購貨協(xié)議合同范例
- 天津市河北區(qū)2022-2023學年七年級上學期期末地理試題【帶答案】
- 25年同學會策劃案(完整版)
- 高速鐵路竣工驗收培訓
- 河南省平頂山市舞鋼市2023-2024學年九年級上學期期末數(shù)學試題(含答案解析)
- 2024年長沙商貿(mào)旅游職業(yè)技術(shù)學院單招職業(yè)適應(yīng)性測試題庫匯編
- 山西省晉中市2023-2024學年九年級上學期期末語文試題(含答案解析)
- 中國保險行業(yè)協(xié)會官方-2023年度商業(yè)健康保險經(jīng)營數(shù)據(jù)分析報告-2024年3月
- 工業(yè)園區(qū)物業(yè)管理方案
- 學前兒童家庭教育智慧樹知到期末考試答案章節(jié)答案2024年廈門南洋職業(yè)學院
- 免拆底模鋼筋桁架樓承板圖集
- 輕食行業(yè)宏觀環(huán)境分析報告
評論
0/150
提交評論