




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第1章 答案1-1 現(xiàn)在讓你分析月銷量,你會(huì)使用哪種數(shù)據(jù)分析方法?答案:對(duì)比分析1-2 在分析一組數(shù)據(jù)前,發(fā)現(xiàn)并不是所有數(shù)據(jù)都是你需要的,該怎么辦?答案:通過(guò)數(shù)據(jù)處理中的數(shù)據(jù)規(guī)約,減少數(shù)據(jù)規(guī)模1-3 如果發(fā)現(xiàn)數(shù)據(jù)中存在異常數(shù)據(jù),如年齡200,該如何處理?答案:刪除1-4 數(shù)據(jù)中存在值為0的數(shù)據(jù)影響分析結(jié)果嗎?答案:當(dāng)我們有大量完整的數(shù)據(jù)時(shí),刪除少部分值為0的數(shù)據(jù),對(duì)數(shù)據(jù)分析結(jié)果不會(huì)造成太大影響。1-5 Python中與數(shù)據(jù)分析相關(guān)的模塊有哪些?答案:常用模塊有數(shù)值計(jì)算模塊NumPy、數(shù)據(jù)處理分析模塊Pandas、數(shù)據(jù)可視化模塊Matplotlib、機(jī)器學(xué)習(xí)模塊scikit-learn1-6 E
2、xcel數(shù)據(jù)中存在大量空值,你將使用哪個(gè)模塊處理?答案:Pandas模塊1-1 簡(jiǎn)述NumPy模塊的由來(lái)與作用?Numeric模塊是NumPy模塊的前身,在1995年由Jim Hugunin 與其他協(xié)作者共同開(kāi)發(fā)。隨后又出現(xiàn)了Numarray模塊,該模塊與Numeric模塊相似都是用于數(shù)組計(jì)算的,但是這兩個(gè)模塊都有著各自的優(yōu)勢(shì),對(duì)于開(kāi)發(fā)者來(lái)說(shuō),需要根據(jù)不同的需求選擇開(kāi)發(fā)效率更高的模塊。在2006年Travis Oliphant將Numeric模塊中結(jié)合了Numarray模塊的優(yōu)點(diǎn),并加入了其他擴(kuò)展而開(kāi)發(fā)了 NumPy模塊的第一個(gè)版本。NumPy 為開(kāi)放源代碼,使用了BSD許可證授權(quán),并且由眾多
3、開(kāi)發(fā)者共同維護(hù)開(kāi)發(fā)。1-2 numpy 常用的數(shù)據(jù)類型都有哪些?numpy模塊常用的數(shù)據(jù)類型如下表所示。數(shù)據(jù)類型描述np.bool布爾值(True或False)_默認(rèn)的整數(shù)類型(與 C 語(yǔ)言中的 long相同,通常為int32 或 int64)c與 C 的 int 類型一樣,(通常為int32 或 int 64)p用于索引的整數(shù)類型(與 C中 的 size_t相同,通常為是 int32 或 int64)8字節(jié)(-128到127)16整數(shù)(-32768至32767)32整數(shù)(-2147483648至2147483647)64整數(shù)(-9223372036854775808至922337203685
4、4775807)np.uint8無(wú)符號(hào)整數(shù)(0到255)np.uint16無(wú)符號(hào)整數(shù)(0到65535)np.uint32無(wú)符號(hào)整數(shù)(0到4294967295)np.uint64無(wú)符號(hào)整數(shù)(0到18446744073709551615)np.half/np.float16半精度浮點(diǎn)數(shù):1個(gè)符號(hào)位,5位指數(shù)位,10位小數(shù)部分np.float32單精度浮點(diǎn)數(shù),1個(gè)符號(hào)位,8個(gè)指數(shù)位,23 位小數(shù)部分np.float64/np.float_雙精度浮點(diǎn)數(shù),1 個(gè)符號(hào)位,11個(gè)指數(shù)位,52 位小數(shù)部分plex64復(fù)數(shù),表示兩個(gè)32 位浮點(diǎn)數(shù)(實(shí)數(shù)部分和虛數(shù)部分)plex128/plex_復(fù)數(shù),表示兩個(gè)64
5、 位浮點(diǎn)數(shù)(實(shí)數(shù)部分和虛數(shù)部分)1-3 簡(jiǎn)述什么是ndarray()對(duì)象?ndarray()對(duì)象是NumPy模塊的基礎(chǔ)對(duì)象,用于存放同類型元素的多維數(shù)組。ndarray 中的每個(gè)元素在內(nèi)存中都有相同存儲(chǔ)大小的區(qū)域,而數(shù)據(jù)類型是由dtype()對(duì)象所指定的,每個(gè)ndarray只有一種dtype類型。數(shù)組有一個(gè)比較重要的屬性是shape,數(shù)組的維數(shù)與元素的數(shù)量就是通過(guò)shape來(lái)確定的。數(shù)組的形狀(shape)是由N個(gè)正整數(shù),組成的元組來(lái)指定的,元組的每個(gè)元素對(duì)應(yīng)每一維的大小。數(shù)組在創(chuàng)建時(shí)被指定大小后將不會(huì)再發(fā)生改變,而Python中的列表大小是可以改變的,這也是數(shù)組與列表區(qū)別較大的地方。 1-4
6、 通過(guò)哪個(gè)函數(shù)可以快速生成一個(gè)任意維數(shù)的數(shù)組?1. rand()函數(shù)rand()函數(shù)用于生成一個(gè)任意維數(shù)的數(shù)組,數(shù)組的元素取自01上的均分布,如果沒(méi)有設(shè)置參數(shù)的情況下,則生成一個(gè)數(shù)。【例2-8】使用rand()函數(shù)創(chuàng)建一個(gè)隨機(jī)數(shù)組。代碼如下:(實(shí)例位置:資源包Code第2章2-8)import numpy as np # 導(dǎo)入numpy模塊a = np.random.rand(2,3,2) # 創(chuàng)建隨機(jī)數(shù)組print(數(shù)組內(nèi)容為: n,a) # 打印數(shù)組內(nèi)容print(數(shù)組形狀為:,a.shape) # 打印數(shù)組形狀print(數(shù)組維數(shù)為:,a.ndim) # 打印數(shù)組維數(shù)運(yùn)行結(jié)果如下:數(shù)組內(nèi)
7、容為: 0.73907586 0.87176277 0.42022933 0.77297553 0.47148362 0.48561028 0.86624807 0.78783422 0.3208552 0.52580099 0.31325425 0.94394843數(shù)組形狀為: (2, 3, 2)數(shù)組維數(shù)為: 31-5 簡(jiǎn)述什么是廣播機(jī)制?廣播(Broadcast)機(jī)制只有在實(shí)現(xiàn)兩個(gè)形狀不同的數(shù)組計(jì)算時(shí)才會(huì)觸發(fā),例如,數(shù)組a和數(shù)組b的形狀相同,那么數(shù)組a乘以數(shù)組b的結(jié)果就是兩個(gè)數(shù)組對(duì)應(yīng)位相乘,這樣的計(jì)算需要維數(shù)與維度長(zhǎng)度相同。當(dāng)計(jì)算兩個(gè)不同形狀的數(shù)組時(shí),numpy將自動(dòng)觸發(fā)廣播機(jī)制,此時(shí)需要
8、將較小的數(shù)組形狀進(jìn)行擴(kuò)展,讓兩個(gè)數(shù)組形狀相同,以便于進(jìn)行兩個(gè)數(shù)組元素的計(jì)算。 1-1簡(jiǎn)述pandas的數(shù)據(jù)結(jié)構(gòu)?pandas的數(shù)據(jù)結(jié)構(gòu)中有兩大核心,分別是Series與DataFrame。其中Series是一維數(shù)組和Numpy中的一維數(shù)組類似。這兩種一維數(shù)組與Python中基本數(shù)據(jù)結(jié)構(gòu)List相近,Series可以保存多種數(shù)據(jù)類型的數(shù)據(jù),如布爾值、字符串、數(shù)字類型等。DataFrame是一種以表格形式的數(shù)據(jù)結(jié)構(gòu)類似于Excel表格一樣,是一種二維的表格型數(shù)據(jù)結(jié)構(gòu)。1-2 簡(jiǎn)述pandas提供了哪幾個(gè)讀取數(shù)據(jù)庫(kù)信息的函數(shù)并介紹每個(gè)函數(shù)的特點(diǎn)?pandas提供了三個(gè)函數(shù)用于實(shí)現(xiàn)數(shù)據(jù)庫(kù)信息的讀取操作
9、,具體函數(shù)如下:read_sql_query()函數(shù):可以實(shí)現(xiàn)對(duì)數(shù)據(jù)庫(kù)的查詢操作,但是不能直接讀取數(shù)據(jù)庫(kù)中的某個(gè)表,需要在sql語(yǔ)句中指定查詢命令與數(shù)據(jù)表的名稱。read_sql_table()函數(shù):只能實(shí)現(xiàn)讀取數(shù)據(jù)庫(kù)中的某一個(gè)表內(nèi)的數(shù)據(jù),并且該函數(shù)需要在SQLAlchemy模塊的支持下才可以使用。read_sql()函數(shù):該函數(shù)則是一個(gè)比較全能的函數(shù),即可可以實(shí)現(xiàn)讀取數(shù)據(jù)庫(kù)中某一個(gè)表的數(shù)據(jù),也可以實(shí)現(xiàn)具體的查詢操作。1-3 簡(jiǎn)述NaN數(shù)據(jù)是什么?NaN數(shù)據(jù)在numpy模塊中用于表示空缺數(shù)據(jù)。1-4 簡(jiǎn)述什么是分組數(shù)據(jù)?pandas提供了一個(gè)groupby()方法,通過(guò)該方法對(duì)數(shù)據(jù)集分組后將返
10、回一個(gè)(數(shù)據(jù)集為Series對(duì)象時(shí))SeriesGroupBy對(duì)象或(數(shù)據(jù)集為DataFrame對(duì)象時(shí))DataFrameGroupBy對(duì)象,然后通過(guò)該對(duì)象根據(jù)需求調(diào)用不同的計(jì)算函數(shù)來(lái)實(shí)現(xiàn)整組數(shù)據(jù)的計(jì)算功能,例如獲取整組數(shù)據(jù)的總和、平均值等等。1-5 簡(jiǎn)述什么是聚合數(shù)據(jù)?pandas不僅提供了一個(gè)可以實(shí)現(xiàn)對(duì)數(shù)據(jù)進(jìn)行分組的groupby()方法,還提供了agg()方法,該方法可以實(shí)現(xiàn)對(duì)分組后數(shù)據(jù)的聚合功能。從實(shí)現(xiàn)上來(lái)看agg()方法類似于對(duì)DataFrame對(duì)象中列的數(shù)據(jù)進(jìn)行分組,然后再調(diào)用sum()或者是mean()來(lái)實(shí)現(xiàn)數(shù)據(jù)的計(jì)算或統(tǒng)計(jì)。在安裝Matplotlib模塊時(shí)哪種方式比較簡(jiǎn)單?Ma
11、tplotlib模塊的安裝方式有多種,如果使用pip的安裝方式,安裝Matplotlib模塊時(shí),需要先進(jìn)入到cmd命令行窗口當(dāng)中,然后在cmd命令行窗口當(dāng)中執(zhí)行如下代碼:python -m pip install matplotlibpyplot子模塊的繪圖流程是?在學(xué)習(xí)使用pyplot子模塊繪圖時(shí),需要先了解使用該模塊實(shí)現(xiàn)繪圖的業(yè)務(wù)流程,根據(jù)繪圖流程調(diào)用pyplot子模塊中對(duì)應(yīng)的方法即可實(shí)現(xiàn)繪制大多數(shù)常用的圖表。pyplot子模塊繪圖流程如圖4-3所示。 圖4-3 pyplot子模塊的繪圖流程簡(jiǎn)述什么是條形圖?條形圖又叫做直方圖,是一種以長(zhǎng)方形的長(zhǎng)度為變量的統(tǒng)計(jì)圖表。該圖表分為水平與縱向兩種
12、,多數(shù)用于比較多個(gè)項(xiàng)目分類的數(shù)據(jù)大小,通過(guò)該圖表可以比較直觀的看出每個(gè)項(xiàng)目分類的分布狀態(tài)。簡(jiǎn)述什么是多面板圖表?多面板圖表就是將多個(gè)圖表顯示在一個(gè)圖表窗體當(dāng)中。簡(jiǎn)述Matplotlib模塊中哪個(gè)子模塊可以實(shí)現(xiàn)3D繪圖?Matplotlib模塊不僅僅只能繪制2D圖表,實(shí)際上在Matplotlib模塊中還內(nèi)置了一個(gè)mplot3d的子模塊,通過(guò)該子模塊即可實(shí)現(xiàn)繪制3D圖表。但是,在使用 mplot3d子模塊繪制3D圖表時(shí),還是需要通過(guò)pyplot 子模塊中的figure()圖形畫布進(jìn)行展示,所以pyplot 子模塊還是需要導(dǎo)入的。第5章 答案5-1 什么是RFM模型,其中的R、F和M分別代表什么?答
13、案:RFM模型是衡量客戶價(jià)值和客戶潛在價(jià)值的重要工具和手段,大部分運(yùn)營(yíng)人員都會(huì)接觸到該模型。RFM模型是國(guó)際上最成熟、最為容易的客戶價(jià)值分析方法。R:表示最近消費(fèi)時(shí)間間隔RecencyF:表示消費(fèi)頻率FrequencyM:表示消費(fèi)金額Monetary5-2 將客戶分成5類,在代碼中改寫哪個(gè)值?答案:主要修改代碼中k的值,設(shè)置k = 5第6章 答案6-1 按季度統(tǒng)計(jì)銷售收入答案:df1.resample(Q).sum()6-2 統(tǒng)計(jì)2018年1月1日至2018年5月1日廣告費(fèi)用支出情況答案:主要代碼如下:bb=r.dataJDcar.xlsdf=pd.DataFrame(pd.read_exce
14、l(bb)df投放日期 = pd.to_datetime(df投放日期)df1=df投放日期,支出df1=df1.set_index(投放日期,drop=True)df2=df12018-01-01:2018-05-01# 按月度統(tǒng)計(jì)并顯示廣告費(fèi)支出金額dfCar_month=df2.resample(M).sum().to_period(M)print(dfCar_month)6-3 假如7月份投入7.8萬(wàn)元廣告費(fèi),現(xiàn)預(yù)測(cè)7月份的銷售收入。答案:主要代碼如下:x0=78000y0=b+x0*kprint(y0)1-1 簡(jiǎn)述什么是scikit-learn庫(kù)?scikit-learn庫(kù)是機(jī)器學(xué)習(xí)
15、領(lǐng)域中最知名的Python模塊之一,該模塊中整合了多種機(jī)器學(xué)習(xí)算法,可以幫助使用者在數(shù)據(jù)分析的過(guò)程中快速建立模型。在Python中導(dǎo)入該模塊時(shí)需要使用sklearn簡(jiǎn)稱進(jìn)行模塊的導(dǎo)入工作,sklearn模塊可以實(shí)現(xiàn)數(shù)據(jù)的預(yù)處理、分類、回歸、PCA降維、模型選擇等工作。1-2 簡(jiǎn)述清洗數(shù)據(jù)的目的是什么?在實(shí)現(xiàn)數(shù)據(jù)分析前需要先對(duì)數(shù)據(jù)進(jìn)行清洗工作,清洗數(shù)據(jù)的主要目的是為了減小數(shù)據(jù)分析的誤差。清洗數(shù)據(jù)時(shí)首先需要將數(shù)據(jù)內(nèi)容讀取,然后觀察數(shù)據(jù)中是否存在無(wú)用值、空值以及數(shù)據(jù)類型是否需要進(jìn)行轉(zhuǎn)換等。簡(jiǎn)述Pygame模塊主要應(yīng)用于python開(kāi)發(fā)的哪個(gè)方向?Pygame是跨平臺(tái)Python模塊,專為電子游戲設(shè)計(jì)
16、。包含圖像、聲音。創(chuàng)建在SDL(Simple DirectMedia Layer)基礎(chǔ)上,允許實(shí)時(shí)電子游戲研發(fā)而無(wú)需被低級(jí)語(yǔ)言,如C語(yǔ)言或是更低級(jí)的匯編語(yǔ)言束縛。基于這樣一個(gè)設(shè)想,所有需要的游戲功能和理念都(主要是圖像方面)完全簡(jiǎn)化為游戲邏輯本身,所有的資源結(jié)構(gòu)都可以由高級(jí)語(yǔ)言(如Python)提供。Pygame模塊中都有哪些常用的子模塊,列舉五個(gè)以上即可?Pygame常用的子模塊如下表所示。Pygame常用模塊模塊名功能pygame.cdrom訪問(wèn)光驅(qū)pygame.cursors加載光標(biāo)pygame.display訪問(wèn)顯示設(shè)備pygame.draw繪制形狀、線和點(diǎn)pygame.event管理
17、事件pygame.font使用字體pygame.image加載和存儲(chǔ)圖片pygame.joystick使用游戲手柄或者類似的東西pygame.key讀取鍵盤按鍵pygame.mixer聲音pygame.mouse鼠標(biāo)pygame.movie播放視頻pygame.music播放音頻pygame.overlay訪問(wèn)高級(jí)視頻疊加pygame.rect管理矩形區(qū)域pygame.sndarray操作聲音數(shù)據(jù)pygame.sprite操作移動(dòng)圖像pygame.surface管理圖像和屏幕pygame.surfarray管理點(diǎn)陣圖像數(shù)據(jù)pygame.time管理時(shí)間和幀信息pygame.transform縮
18、放和移動(dòng)圖像第9章 案例5:影視作品分析9-1 簡(jiǎn)述jieba模塊提供了哪幾種分詞模式,以及各模式的區(qū)別。答:jieba模塊提供了三種分詞模式,分別是精確模式、全模式和搜索引擎模式。下面對(duì)這三種分詞模式進(jìn)行詳細(xì)介紹。精確模式采用精確模式時(shí),會(huì)將句子進(jìn)行最精確地切割,從而讓結(jié)果更適合文本分析。全模式采用全模式時(shí),分把文本中所有可能的詞語(yǔ)都掃描出來(lái),可能會(huì)有冗余。搜索引擎模式采用搜索引擎模式時(shí),會(huì)在精確模式的基礎(chǔ)上對(duì)長(zhǎng)詞再次切分。9-2 如何使用jieba模塊和wordcloud庫(kù)生成詞云圖?答:使用jieba模塊的cut_for_search()函數(shù)將評(píng)論的內(nèi)容切割成若干個(gè)分詞,然后再使用wor
19、dcloud庫(kù)將其生成云圖圖片,保存到本地,關(guān)鍵代碼如下:# 評(píng)論內(nèi)容tomato_str = .join(tomato_comcomment)words_list = # 分詞word_generator = jieba.cut_for_search(tomato_str)for word in word_generator: words_list.append(word)words_list = k for k in words_list if len(k) 1back_color = imread(d + 詞云背景.jpg) # 解析該圖片wc = WordCloud(background_color=white, # 背景顏色 max_words=200, # 最大詞數(shù) mask=back_color,#以該參數(shù)值繪制詞云,該個(gè)參數(shù)不為空時(shí),width和height會(huì)被忽略 max_font_size=300, # 顯示字體的最大值 font_
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年科信大隊(duì)考試題及答案
- 2025年海底撈培訓(xùn)考試題及答案
- 2025年靜脈營(yíng)養(yǎng)考試試題及答案
- 烤瓷爐操作規(guī)程
- 2025年宣傳講解崗面試題及答案
- 2025年論語(yǔ)六則測(cè)試題及答案
- 2025年社工宣傳崗面試題及答案
- 護(hù)士條例制度復(fù)習(xí)測(cè)試附答案
- 2025年南充初三英語(yǔ)試題及答案
- 2025年地址選址面試試題及答案
- 13詩(shī)第十二-整本書閱讀系列《經(jīng)典常談》名著閱讀與練習(xí)
- 小學(xué)美術(shù)-湘美版四年級(jí)下冊(cè)第10課中國(guó)龍教學(xué)設(shè)計(jì)學(xué)情分析教材分析課后反思
- 一年級(jí)下冊(cè)勞技教案
- 部編版四年級(jí)語(yǔ)文下冊(cè)第4單元大單元整體教學(xué)作業(yè)設(shè)計(jì)(教案配套)
- 大一邏輯學(xué)全部
- 游戲法緩解小班幼兒入園焦慮的個(gè)案研究
- 2023年包頭輕工職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)題庫(kù)及答案解析
- 地下室頂板裂縫防水處理方案(完整資料)
- 宮頸錐切日間手術(shù)臨床路徑(婦科)及表單
- GB/T 23111-2008非自動(dòng)衡器
- GB/T 18877-2020有機(jī)無(wú)機(jī)復(fù)混肥料
評(píng)論
0/150
提交評(píng)論