




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
教案1教師姓名課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周課時(shí)2課型理實(shí)一體化章節(jié)名稱項(xiàng)目一認(rèn)知數(shù)據(jù)分析教學(xué)目的1.了解數(shù)據(jù)分析的基本概念及流程;2.了解數(shù)據(jù)分析的常見應(yīng)用場景;3.了解數(shù)據(jù)分析的常見方法;4.了解常用的數(shù)據(jù)分析工具及其優(yōu)缺點(diǎn)。5.了解Python數(shù)據(jù)分析常用庫。教學(xué)重點(diǎn)1.數(shù)據(jù)分析的基本概念及流程;2.Anaconda發(fā)行版的下載與安裝;3.JupyterNotebook的使用教學(xué)難點(diǎn)1.數(shù)據(jù)分析的常見方法;2.Python數(shù)據(jù)分析常用庫。補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)完成課后復(fù)習(xí)、預(yù)習(xí)課后體會(huì)授課主要內(nèi)容任務(wù)1.1了解數(shù)據(jù)分析的應(yīng)用場景與方法【引入案例】【任務(wù)分析】【知識(shí)準(zhǔn)備】1.1.1數(shù)據(jù)分析概述一、數(shù)據(jù)分析的概念二、數(shù)據(jù)分析的流程三、大數(shù)據(jù)分析的應(yīng)用場景1.1.2數(shù)據(jù)分析方法一、統(tǒng)計(jì)分析類統(tǒng)計(jì)分析類是指以基礎(chǔ)的統(tǒng)計(jì)分析為主,包括基本統(tǒng)計(jì)量計(jì)算、對比分析法、分組分析法、結(jié)構(gòu)分析法、交叉分析法、因素分析法等。二、高級(jí)分析法以建模理論為主,包括相關(guān)分析法、回歸分析法、聚類分析法、判別分析法、主成分分析法、因子分析法、時(shí)間序列分析法等。三、數(shù)據(jù)挖掘類數(shù)據(jù)挖掘類方法主要以機(jī)器學(xué)習(xí)、數(shù)據(jù)倉庫等復(fù)合技術(shù)為主?!景咐馕觥俊救蝿?wù)實(shí)訓(xùn)】任務(wù)1.2Python數(shù)據(jù)分析環(huán)境的搭建【引入案例】【任務(wù)分析】【知識(shí)準(zhǔn)備】1.2.1常用數(shù)據(jù)分析工具一、利用Excel進(jìn)行數(shù)據(jù)分析二、利用Stata進(jìn)行數(shù)據(jù)分析三、利用Python進(jìn)行數(shù)據(jù)分析1.2.2Anaconda發(fā)行版的下載與安裝1.2.3JupyterNotebook的使用1.2.4Python數(shù)據(jù)分析常用庫簡介【案例解析】【任務(wù)實(shí)訓(xùn)】教案2教師姓名課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周課時(shí)2課型理實(shí)一體化章節(jié)名稱項(xiàng)目三利用Numpy進(jìn)行數(shù)值計(jì)算教學(xué)目的1.了解ndarray數(shù)據(jù)類型及其屬性;2.掌握ndarray常用創(chuàng)建函數(shù)的語法格式及參數(shù)含義;3.了解數(shù)組的基本運(yùn)算,掌握數(shù)組常見的基本操作;4.掌握二進(jìn)制文件、文本文件讀寫函數(shù)的語法格式及參數(shù)含義;5.掌握Numpy中常用統(tǒng)計(jì)分析函數(shù)的語法格式及參數(shù)含義。教學(xué)重點(diǎn)1.數(shù)組常見的基本操作;2.Numpy中常用統(tǒng)計(jì)分析函數(shù)。教學(xué)難點(diǎn)1.ndarray常用創(chuàng)建函數(shù)的語法格式及參數(shù)含義;2.Numpy中常用統(tǒng)計(jì)分析函數(shù)的語法格式及參數(shù)含義。補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)完成課后復(fù)習(xí)、預(yù)習(xí)課后體會(huì)授課主要內(nèi)容3.1Numpy數(shù)組對象ndarry【引入案例】【任務(wù)分析】【知識(shí)準(zhǔn)備】1.1.1ndarray概述一、ndarray介紹二、ndarray的數(shù)據(jù)類型三、ndarray數(shù)組屬性1.1.2數(shù)組的創(chuàng)建一、利用array()函數(shù)創(chuàng)建數(shù)組二、利用專門函數(shù)創(chuàng)建數(shù)組三、隨機(jī)數(shù)生成方法1.1.3數(shù)組的基本操作一、數(shù)組索引與切片二、數(shù)組的轉(zhuǎn)置與變形1.1.4數(shù)組的運(yùn)算一、相同形狀數(shù)組的運(yùn)算二、不同形狀數(shù)組的運(yùn)算三、通用函數(shù)(ufunc)【案例解析】【任務(wù)實(shí)訓(xùn)】3.2利用Numpy進(jìn)行統(tǒng)計(jì)分析【引入案例】【任務(wù)分析】【知識(shí)準(zhǔn)備】1.2.1讀寫文件一、二進(jìn)制文件讀寫二、文本文件讀寫1.2.2常用的統(tǒng)計(jì)函數(shù)【案例解析】【任務(wù)實(shí)訓(xùn)】教案3教師姓名課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周課時(shí)2課型理實(shí)一體化章節(jié)名稱任務(wù)4.1掌握Pandas常用操作(1)教學(xué)目的1.掌握Series對象的創(chuàng)建和數(shù)據(jù)查詢;2.掌握DataFrame對象的創(chuàng)建及屬性查詢;3.掌握DataFrame對象的基本操作。教學(xué)重點(diǎn)1.DataFrame對象的屬性查詢操作;2.DataFrame對象的索引操作;3.DataFrame對象的行列的增加和刪除操作。教學(xué)難點(diǎn)1.DataFrame對象的創(chuàng)建2.reindex()、rename()函數(shù)參數(shù)的設(shè)定;3.insert()、drop()函數(shù)的使用。補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)完成課后復(fù)習(xí)、預(yù)習(xí)課后體會(huì)授課主要內(nèi)容任務(wù)4.1掌握Pandas常用操作(1)【引入案例】【任務(wù)分析】【知識(shí)準(zhǔn)備】4.1.1Pandas數(shù)據(jù)結(jié)構(gòu)一、Series數(shù)據(jù)結(jié)構(gòu)1.Series對象的創(chuàng)建2.Series對象的數(shù)據(jù)查詢3.Series對象的修改、增加及刪除二、DataFrame數(shù)據(jù)結(jié)構(gòu)4.1.2DataFrame創(chuàng)建方法與屬性一、DataFrame的創(chuàng)建方法二、DataFrame的屬性4.1.3DataFrame的基本操作一、DataFrame的索引操作1.重排索引reindex()函數(shù)2.還原索引reset_index()函數(shù)3.重設(shè)索引set_index()函數(shù)4.重命名索引rename()函數(shù)5.軸向變換函數(shù)stack()函數(shù)和unstack()函數(shù)二、新增列數(shù)據(jù)1.利用直接賦值新增列2.利用公式計(jì)算新增列3.利用insert()函數(shù)插入新列三、刪除列數(shù)據(jù)1.使用del刪除列2.使用pop()函數(shù)刪除列3.使用drop()函數(shù)刪除列四、增加和刪除行數(shù)據(jù)1.使用索引器loc方法增加行2.使用drop()函數(shù)刪除行五、DataFrame的轉(zhuǎn)置及數(shù)據(jù)類型轉(zhuǎn)換教案4教師姓名課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周課時(shí)2課型理實(shí)一體化章節(jié)名稱任務(wù)4.1掌握Pandas常用操作(2)教學(xué)目的1.掌握DataFrame對象的簡單運(yùn)算;2.掌握常用讀寫外部文件函數(shù)的使用。教學(xué)重點(diǎn)1.DataFrame對象的簡單運(yùn)算;2.使用read_excel()函數(shù)讀取外部Excel文件;3.使用read_csv()函數(shù)讀取外部CSV文件。教學(xué)難點(diǎn)1.正確設(shè)定read_excel()函數(shù)參數(shù);2.正確設(shè)定read_csv()函數(shù)參數(shù)。補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)完成課后復(fù)習(xí)、預(yù)習(xí)課后體會(huì)
授課主要內(nèi)容任務(wù)4.1掌握Pandas常用操作(1)4.1.4DataFrame的簡單運(yùn)算一、DataFrame與Series之間的轉(zhuǎn)化DataFrame單獨(dú)取一列或一行就是一個(gè)Series,也可以將Series轉(zhuǎn)化成單列的DataFrame?!咀鲋袑W(xué)】編寫程序?qū)ataFrame中的一列轉(zhuǎn)化成Series,然后再將該Series轉(zhuǎn)化成DataFrame。二、DataFrame的簡單運(yùn)算Pandas的數(shù)據(jù)對象在進(jìn)行算術(shù)運(yùn)算時(shí),如果有相同索引,按照相同索引配對進(jìn)行算術(shù)運(yùn)算,如果沒有對應(yīng)的索引,則引入缺失值NaN,這就是數(shù)據(jù)自動(dòng)對齊的功能。Pandas數(shù)據(jù)結(jié)構(gòu)之間可以使用運(yùn)算符進(jìn)行運(yùn)算,如obj1-obj2、obj1+obj2、obj1*obj2、obj1/obj2,其中obj1和obj2是兩個(gè)數(shù)據(jù)結(jié)構(gòu),可以是Series或是DataFrame。4.1.5Pandas讀寫外部文件一、讀寫Excel文件1.Excel文件的讀取pandas.read_excel(io,sheet_name=0,header=0,names=None,index_col=None,usecols=None,squeeze=False,dtype=None,engine=None,converters=None,true_values=None,false_values=None,skiprows=None,nrows=None,na_values=None,parse_dates=False,date_parser=None,thousands=None,comment=None,skipfooter=0,convert_float=True,**kwds)2.Excel文件的存儲(chǔ)將DataFrame對象存儲(chǔ)為Excel文件,可以使用to_excel()函數(shù)。其語法格式如下:DataFrame.to_excel(excel_writer,sheet_name='Sheet1',na_rep='',float_format=None,columns=None,header=True,index=True,index_label=None,startrow=0,startcol=0,engine=None,merge_cells=True,encoding=None,inf_rep='inf',verbose=True,freeze_panes=None)二、CSV文件的讀寫1.CSV文件的讀取在Pandas中利用read_csv()函數(shù)讀取CSV文件,其語法格式如下:pandas.read_csv(filepath_or_buffer,sep=',',delimiter=None,header='infer',names=None,index_col=None,usecols=None,dtype=None,…)2.CSV文件的存儲(chǔ)CSV文件的存儲(chǔ)可以通過Pandas庫中的to_csv()函數(shù)實(shí)現(xiàn),其語法格式如下:DataFrame.to_csv(path_or_buf=None,sep=',',na_rep='',float_format=None,columns=None,header=True,index=True,index_label=None,mode='w',encoding=None,…)【案例解析】【任務(wù)實(shí)訓(xùn)】教案5教師姓名課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周課時(shí)2課型理實(shí)一體化章節(jié)名稱任務(wù)4.2利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選(1)教學(xué)目的1.學(xué)會(huì)對DataFrame對象進(jìn)行數(shù)據(jù)直接篩選;2.學(xué)會(huì)對DataFrame對象使用索引器篩選。教學(xué)重點(diǎn)1.直接篩選方式2.索引器篩選方式教學(xué)難點(diǎn)索引器篩選補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)完成課后復(fù)習(xí)、預(yù)習(xí)課后體會(huì)授課主要內(nèi)容任務(wù)4.2利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選(1)【引入案例】【任務(wù)分析】【知識(shí)準(zhǔn)備】4.2.1直接篩選所謂直接篩選,是指DataFrame對象后面直接跟索引(原始索引或自定義索引)標(biāo)簽進(jìn)行數(shù)據(jù)的選取,可以實(shí)現(xiàn)單行、單列和多行多列的篩選?!咀鲋袑W(xué)4.2.1】讀入fin_data.xlsx(位置:E:\file\)中的第一個(gè)表格,使用上表中列舉的篩選方式進(jìn)行數(shù)據(jù)選取。4.2.2索引器篩選所謂索引器篩選,是指采用loc、iloc索引器進(jìn)行數(shù)據(jù)選取的方法。loc索引器優(yōu)先使用自定義索引,如果數(shù)據(jù)中沒有自定義索引,則使用原始索引,根據(jù)行索引和列索引進(jìn)行選取,先行后列,也可以只選取行。教案6教師姓名課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周課時(shí)2課型理實(shí)一體化章節(jié)名稱任務(wù)4.2利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選(2)教學(xué)目的學(xué)會(huì)對DataFrame對象使用條件篩選數(shù)據(jù)教學(xué)重點(diǎn)1.根據(jù)列條件選擇行;2.根據(jù)行索引選擇行。教學(xué)難點(diǎn)條件篩選的使用補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)完成課后復(fù)習(xí)、預(yù)習(xí)課后體會(huì)授課主要內(nèi)容任務(wù)4.2利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)篩選(2)4.2.3條件篩選在DataFrame中,除了可以利用索引選取數(shù)據(jù)外,還可以設(shè)置篩選條件選取數(shù)據(jù),在條件中常用的符號(hào)主要是比較運(yùn)算符和邏輯運(yùn)算符。 條件篩選常用運(yùn)算符種類符號(hào)及含義比較運(yùn)算符<(小于)、<=(小于等于)、>(大于)、>=(大于等于)、!=(不等于)、==(等于)邏輯運(yùn)算符&(與)、|(或)、~(取反)條件篩選方法語法格式及舉例語法格式舉例說明DataFrame[conditon]根據(jù)列條件選擇行df[df[col]==value]表示選取某列滿足一定條件的行。df[(df[col1]==value)&(df[col2]>value)]表示選取多列滿足一定條件的行。根據(jù)行索引選擇行df[df.index==’行索引’]表示選擇單行。df[(df.index==’行索引’)|df.index==’行索引’)]表示選擇兩行,可使用“|”選擇更多行DataFrame.loc[condition,cols]表示選取滿足條件的行及指定列?!菊堊⒁狻織l件表達(dá)式可以使用操作符&、|、~,但是不能使用關(guān)鍵詞and、or、not?!咀鲋袑W(xué)】讀入fin_data.xlsx(位置:E:\file\)中的第一個(gè)表格,并使用上表中列舉的篩選方式進(jìn)行數(shù)據(jù)選取?!景咐馕觥俊救蝿?wù)實(shí)訓(xùn)】
教案7教師姓名課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周課時(shí)2課型理實(shí)一體化章節(jié)名稱任務(wù)4.3利用Pandas高階函數(shù)進(jìn)行數(shù)據(jù)處理教學(xué)目的1.學(xué)會(huì)利用map()函數(shù)進(jìn)行數(shù)據(jù)處理。2.學(xué)會(huì)利用apply()函數(shù)進(jìn)行數(shù)據(jù)處理;3.學(xué)會(huì)利用applymap()函數(shù)進(jìn)行數(shù)據(jù)處理。教學(xué)重點(diǎn)1.map()函數(shù)的使用2.apply()函數(shù)的使用3.applymap()函數(shù)的使用教學(xué)難點(diǎn)map()、apply()函數(shù)的使用補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)完成課后復(fù)習(xí)、預(yù)習(xí)課后體會(huì)授課主要內(nèi)容任務(wù)4.3利用Pandas高階函數(shù)進(jìn)行數(shù)據(jù)處理【引入案例】【任務(wù)分析】【知識(shí)準(zhǔn)備】4.3.1map()函數(shù)map()函數(shù)可以用于Series對象或DataFrame對象的一列,接收函數(shù)或字典對象作為參數(shù),對指定序列逐一映射,返回經(jīng)過函數(shù)或字典映射處理后的值。其語法格式如下:Series.map(functionordict,na_action=None)【做中學(xué)】讀入fin_data.xlsx(位置:E:\file\)中的“利潤表項(xiàng)目”工作表,據(jù)此計(jì)算出凈利潤率,然后進(jìn)行以下操作:(1)根據(jù)凈利率進(jìn)行業(yè)績評價(jià),使用map()函數(shù)將凈利率超過20%的月份標(biāo)記為達(dá)標(biāo),否則不達(dá)標(biāo);(2)根據(jù)業(yè)績評價(jià)結(jié)果確定是否發(fā)放獎(jiǎng)金,業(yè)績達(dá)標(biāo)則發(fā)放,否則不發(fā)放。4.3.2apply()函數(shù)一、Series.apply()Series.apply()函數(shù)在Series值上調(diào)用函數(shù),與Series.map()類似,區(qū)別在于apply()函數(shù)能夠傳入功能更復(fù)雜的函數(shù)。Series.apply()函數(shù)語法格式如下:Series.apply(func,convert_dtype=True,args=(),**kwargs)【做中學(xué)】以前面生成的df數(shù)據(jù)對象為基礎(chǔ),現(xiàn)需要調(diào)整營業(yè)收入金額,而具體調(diào)整的金額未知,請使用Series.apply()函數(shù)實(shí)現(xiàn)營業(yè)收入的調(diào)整。二、DataFrame.apply()對于DataFrame而言,apply()函數(shù)是一個(gè)非常重要的數(shù)據(jù)處理方法,它可以接收各式各樣的函數(shù)(Lambda表達(dá)式、Python內(nèi)置函數(shù)或自定義函數(shù)等)作為它的參數(shù),處理方式很靈活。DataFrame.apply()函數(shù)語法格式如下:DataFrame.apply(func,axis=0,broadcast=None,raw=False,reduce=None,result_type=None,args=(),**kwds)1.axis=0時(shí)apply()函數(shù)的使用【做中學(xué)】讀入fin_data.xlsx(位置:E:\file\)中的“利潤表項(xiàng)目”工作表,使用apply()函數(shù)將營業(yè)收入、營業(yè)成本、凈利潤以“萬元”為單位展示。2.axis=1時(shí)apply()函數(shù)的使用【做中學(xué)4.3.4】讀入fin_data.xlsx(位置:E:\file\)中的“利潤表項(xiàng)目”工作表,利用DataFrame.apply()函數(shù)計(jì)算每個(gè)月的毛利率。4.3.3applymap()函數(shù)applymap()函數(shù)用來對DataFrame中的每個(gè)元素執(zhí)行指定方法(函數(shù)或lambda表達(dá)式)的操作。其語法格式如下:DataFrame.applymap(function)applymap()函數(shù)的用法比較簡單,會(huì)對DataFrame中的每個(gè)元素執(zhí)行指定方法進(jìn)行操作,雖然使用頻率沒有apply()函數(shù)高,但在某些場下還是比較實(shí)用的?!咀鲋袑W(xué)】讀入fin_data.xlsx(位置:E:\file\)中的“利潤表項(xiàng)目”工作表,將DataFrame中的營業(yè)收入、營業(yè)成本和凈利潤統(tǒng)一保留1位小數(shù)顯示?!景咐馕觥俊救蝿?wù)實(shí)訓(xùn)】
教案8教師姓名課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周課時(shí)2課型理實(shí)一體化章節(jié)名稱任務(wù)4.4利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)合并(1)教學(xué)目的1.掌握merge()函數(shù)的使用場合;2.掌握merge()函數(shù)常用參數(shù)的使用;3.能靈活使用merge()函數(shù)進(jìn)行數(shù)據(jù)的合并。教學(xué)重點(diǎn)1.how參數(shù)的使用;2.on參數(shù)的使用;3.left_on、right_on參數(shù)的使用。教學(xué)難點(diǎn)how參數(shù)四種取值代表的含義補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)完成課后復(fù)習(xí)、預(yù)習(xí)課后體會(huì)授課主要內(nèi)容任務(wù)4.4利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)合并(1)【引入案例】【任務(wù)分析】【知識(shí)準(zhǔn)備】4.4.1merge()函數(shù)的運(yùn)用一、merge()函數(shù)的語法格式及參數(shù)說明merge()函數(shù)的語法格式如下:pandas.merge(left,right,how=’inner’,on=None,left_on=None,right_on=None,left_index=False,right_index=False,sort=True,suffixes=(’_x’,’_y’),copy=True,indicator=False,validate=None)二、merge()函數(shù)常用參數(shù)1.how參數(shù)how參數(shù)表示數(shù)據(jù)合并的方式,其取值可以為inner、outer、left、right。2.on參數(shù)3.left_on參數(shù)和right_on參數(shù)
教案9教師姓名課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周課時(shí)2課型理實(shí)一體化章節(jié)名稱任務(wù)4.4利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)合并(2)教學(xué)目的1.學(xué)會(huì)使用join()函數(shù)進(jìn)行數(shù)據(jù)的合并;2.學(xué)會(huì)使用concat()函數(shù)進(jìn)行數(shù)據(jù)的合并;3.學(xué)會(huì)使用append()函數(shù)進(jìn)行數(shù)據(jù)的合并。教學(xué)重點(diǎn)使用concat()函數(shù)進(jìn)行數(shù)據(jù)的合并教學(xué)難點(diǎn)使用concat()函數(shù)進(jìn)行數(shù)據(jù)的合并補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)完成課后復(fù)習(xí)、預(yù)習(xí)課后體會(huì)授課主要內(nèi)容任務(wù)4.4利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)合并(2)4.5.2join()函數(shù)的運(yùn)用一、join()函數(shù)的語法格式及參數(shù)說明join()函數(shù)語法格式如下:DataFrame.join(other,on=None,how='left',lsuffix='',rsuffix='',sort=False)二、join()函數(shù)常用參數(shù)1.on參數(shù)默認(rèn)值None2.on參數(shù)為列名或者包含列名的list或tuple4.5.3concat()函數(shù)的運(yùn)用concat()函數(shù)用來沿特定軸連接兩個(gè)或兩個(gè)以上的DataFrame對象,既可實(shí)現(xiàn)縱向合并也可實(shí)現(xiàn)橫向合并,行列索引均可重復(fù)。一、concat()函數(shù)的語法格式及參數(shù)說明concat()函數(shù)語法格式如下:pandas.concat(objs,axis=0,join='outer',join_axes=None,ignore_index=False,keys=None,levels=None,names=None,verify_integrity=False,copy=True)二、concat()函數(shù)常用參數(shù)在concat()函數(shù)的參數(shù)中,最常用的參數(shù)是objs、axis和join參數(shù),objs參數(shù)比較簡單,下面重點(diǎn)講解axis參數(shù)、join參數(shù)聯(lián)合使用對合并表格的影響。1.axis=1時(shí)實(shí)現(xiàn)橫向堆疊2.axis=0時(shí)實(shí)現(xiàn)縱向堆疊4.5.4append()函數(shù)的運(yùn)用append()函數(shù)用來向DataFrame對象中添加新的行(縱向合并),如果添加的列名不在DataFrame對象中,將會(huì)被當(dāng)作新的列進(jìn)行添加。append()函數(shù)適用場景:兩個(gè)DataFrame縱向連接,是concat()函數(shù)(axis=0)的簡略形式。append()函數(shù)的語法格式如下所示:DataFrame.append(other,ignore_index=False,verify_integrity=False,sort=False)【案例解析】【任務(wù)實(shí)訓(xùn)】教案10教師姓名課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周課時(shí)2課型理實(shí)一體化章節(jié)名稱任務(wù)4.5利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)清洗(1)教學(xué)目的1.掌握檢測和處理重復(fù)項(xiàng)函數(shù)的使用;2.掌握檢測和處理缺失值函數(shù)的使用;教學(xué)重點(diǎn)1.drop_duplicates()函數(shù)的使用;2.dropna()函數(shù)的使用;3.fillna()函數(shù)的使用教學(xué)難點(diǎn)1.drop_duplicates()函數(shù)的使用;2.dropna()函數(shù)的使用。補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)完成課后復(fù)習(xí)、預(yù)習(xí)課后體會(huì)授課主要內(nèi)容任務(wù)4.5利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)清洗(1)【引入案例】【任務(wù)分析】【知識(shí)準(zhǔn)備】4.5.1檢測與處理重復(fù)值一、duplicated()函數(shù)檢測重復(fù)數(shù)據(jù)去除重復(fù)數(shù)據(jù)之前,首先要了解數(shù)據(jù)中的重復(fù)情況,Pandas提供了duplicated()函數(shù),用來檢測數(shù)據(jù)的重復(fù)情況。duplicated()函數(shù)用于檢測Series、DataFrame中是否存在重復(fù)數(shù)據(jù),重復(fù)為True,不重復(fù)為False。該函數(shù)的語法格式如下:Series.duplicated(keep='first')DataFrame.duplicated(subset=None,keep='first')二、drop_duplicates()函數(shù)刪除重復(fù)數(shù)據(jù)drop_duplicates()函數(shù)用于刪除Series、DataFrame中重復(fù)行,并返回刪除重復(fù)后的結(jié)果。該函數(shù)的語法格式如下:Series.drop_duplicates(keep='first',inplace=False)DataFrame.drop_duplicates(subset=None,keep='first',inplace=False,ignore_index=False)4.5.2檢測與處理缺失值一、檢測缺失值Pandas中查找數(shù)據(jù)中缺失值函數(shù)有兩個(gè):一個(gè)是isnull()函數(shù),如果是空值就顯示True;另一個(gè)是notnull()函數(shù),該函數(shù)剛好相反,如果是空值就顯示False。通過isnull()函數(shù)和sum()函數(shù)的結(jié)合,可以獲得Series和DataFrame中缺失值的個(gè)數(shù)。二、刪除缺失值在數(shù)據(jù)分析中,如果數(shù)據(jù)集的樣本很大,并且在刪除含有缺失值的記錄后,不會(huì)影響分析結(jié)果的客觀性和準(zhǔn)確性時(shí),一般是用dropna()函數(shù)直接將空值或缺失值的數(shù)據(jù)刪除。dropna()函數(shù)的語法格式如下:dropna(axis=0,how='any',thresh=None,subset=None,inplace=False)三、填充缺失值在數(shù)據(jù)分析中,如果數(shù)據(jù)集的樣本比較少,或者由于刪除含有缺失值的記錄會(huì)影響到數(shù)據(jù)分析結(jié)果的客觀性和準(zhǔn)確性,就需要根據(jù)數(shù)據(jù)插補(bǔ)的方法來選擇填充值,然后使用fillna()函數(shù)對空值或者缺失值進(jìn)行填充。fillna()函數(shù)的語法格式如下:fillna(value=None,method=None,axis=None,inplace=False,limit=None,downcast=None,**kwargs)教案11教師姓名課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周課時(shí)2課型理實(shí)一體化章節(jié)名稱任務(wù)4.5利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)清洗(2)教學(xué)目的掌握其他異常處理函數(shù)的使用。教學(xué)重點(diǎn)1.刪除特殊字符;2.數(shù)據(jù)的替換。教學(xué)難點(diǎn)replace()函數(shù)的使用補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)完成課后復(fù)習(xí)、預(yù)習(xí)課后體會(huì)授課主要內(nèi)容任務(wù)4.5利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)清洗(2)4.5.3其他異常處理一、刪除特殊字符當(dāng)要?jiǎng)h除字符串頭尾指定的字符(默認(rèn)為空格或換行符)或字符序列時(shí),可以使用strip()函數(shù)。該函數(shù)語法格式如下:Series.str.strip([chars])其中,[chars]用來指定要?jiǎng)h除的字符,可以同時(shí)指定多個(gè),如果不手動(dòng)指定,則默認(rèn)會(huì)刪除空格以及制表符、回車符、換行符等特殊字符。二、數(shù)據(jù)替換在處理數(shù)據(jù)時(shí),經(jīng)常會(huì)遇到批量替換的情況,如果一個(gè)一個(gè)地去修改則效率過低,也容易出錯(cuò)。Pandas提供了replace()函數(shù)和str.replace()函數(shù)來進(jìn)行全部替換和部分替換。1.全部替換全部替換是指將DataFrame全部元素或DataFrame中某一列的全部元素進(jìn)行替換,替換時(shí)可以使用replace()函數(shù)。replace()函數(shù)的一般語法格式為:DataFrame.replace(to_replace,value,inplace)其中,to_replace表示需要替換的值,value表示替換后的值。如果有多個(gè)值需要替換可使用字典,使用方法是:{to_replace1:value1,to_replace2:value2,…}。在DataFrame中,有時(shí)僅僅只針對某一列進(jìn)行替換,其一般語法格式為:DataFrame[col]=DataFrame[col].replace(to_replace,value,inplace)2.部分替換有時(shí)不需要將元素全部替換,而僅僅需要將元素中的某個(gè)字符進(jìn)行替換,此時(shí)就可以使用str.replace()函數(shù),str.replace()函數(shù)的一般用法為:DataFrame[col].str.replace(to_replace,value)其中,to_replace表示需要替換的內(nèi)容,value表示替換后的內(nèi)容。str.replace()是字符串函數(shù),只能針對Series使用,所以如果要在DataFrame中調(diào)用str函數(shù),只能選取DataFrame中的一列才能使用?!咀鲋袑W(xué)】讀入dataClean.xlsx(位置:E:\file\)中的表格,首先刪除重復(fù)項(xiàng)及全為缺失值列,然后刪除其中的空格、逗號(hào)(,)及¥符號(hào),最后用平均值填充缺失值。【案例解析】【任務(wù)實(shí)訓(xùn)】教案12教師姓名課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周課時(shí)2課型理實(shí)一體化章節(jié)名稱任務(wù)5.1利用Pandas進(jìn)行數(shù)據(jù)排序和排名分析教學(xué)目的掌握索引排序函數(shù)sort_index()的使用;掌握數(shù)值排序函數(shù)sort_values()的使用;掌握數(shù)據(jù)排名函數(shù)rank()的使用。教學(xué)重點(diǎn)sort_index()函數(shù)的使用;sort_values()函數(shù)的使用。教學(xué)難點(diǎn)數(shù)值排序函數(shù)sort_values()的使用補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)完成課后復(fù)習(xí)、預(yù)習(xí)課后體會(huì)授課主要內(nèi)容任務(wù)5.1利用Pandas進(jìn)行數(shù)據(jù)排序和排名分析【引入案例】【任務(wù)分析】【知識(shí)準(zhǔn)備】5.1.1數(shù)據(jù)排序數(shù)據(jù)排序是指使數(shù)據(jù)按一定方式進(jìn)行排列,通過數(shù)據(jù)排序可以更為方便地看出數(shù)據(jù)特征。DataFrame排序可以分為按索引排序和按數(shù)值排序。一、按索引排序按索引排序是指按照DataFrame索引的值升序或者降序重新排列數(shù)據(jù),在Pandas中利用sort_index()函數(shù)可以實(shí)現(xiàn)按照索引對數(shù)據(jù)進(jìn)行排序。sort_index()函數(shù)的語法格式如下:DataFrame.sort_index(axis=0,level=None,ascending=True,inplace=False,kind='quicksort',na_position='last',sort_remaining=True,ignore_index=False,key=None)二、按數(shù)值排序按數(shù)值排序是指可以按照DataFrame某一列(行)或幾列(行)的值升序或者降序的方式重新排列數(shù)據(jù),在Pandas中利用sort_values()函數(shù)實(shí)現(xiàn)對數(shù)值的排序。sort_values()函數(shù)的語法格式如下:DataFrame.sort_values(by,axis=0,ascending=Ture,inplace=Flase,kind='quicksort',na_position='last',ignore_index=False,key=None)5.1.2數(shù)據(jù)排名在實(shí)際工作中經(jīng)常需要對數(shù)據(jù)進(jìn)行排名,如對客戶的銷售金額進(jìn)行排名,查看重點(diǎn)客戶名單。排名函數(shù)在很多數(shù)據(jù)分析軟件中都有,如Excel中的rank()函數(shù),而在Pandas中也有類似的rank()函數(shù),該函數(shù)可以對DataFrame按照某列或行進(jìn)行排名。rank()函數(shù)的語法格式如下:DataFrame.rank(axis=0,method='average',numeric_only=None,na_option='keep',ascending=True,pct=False)【案例解析】【任務(wù)實(shí)訓(xùn)】教案13教師姓名課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周課時(shí)2課型理實(shí)一體化章節(jié)名稱任務(wù)5.2利用Pandas進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)與描述分析教學(xué)目的掌握數(shù)值型字段的統(tǒng)計(jì)與描述;掌握分類型字段的統(tǒng)計(jì)與描述。教學(xué)重點(diǎn)直接利用統(tǒng)計(jì)指標(biāo)函數(shù)進(jìn)行統(tǒng)計(jì);利用describe()函數(shù)進(jìn)行描述分析;利用value_counts()函數(shù)進(jìn)行統(tǒng)計(jì)分析。教學(xué)難點(diǎn)describe()函數(shù)的使用補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)完成課后復(fù)習(xí)、預(yù)習(xí)課后體會(huì)授課主要內(nèi)容任務(wù)5.2利用Pandas進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)與描述分析【引入案例】【任務(wù)分析】【知識(shí)準(zhǔn)備】5.2.1數(shù)值型字段的統(tǒng)計(jì)與描述數(shù)值型字段是指該字段是用數(shù)值來描述的,如營業(yè)收入、營業(yè)成本、凈利潤等。數(shù)值型字段的描述性統(tǒng)計(jì)主要包括計(jì)算最小值、最大值、均值、中位數(shù)、四分位數(shù)、極差、方差、標(biāo)準(zhǔn)差等統(tǒng)計(jì)指標(biāo)。一、直接利用統(tǒng)計(jì)指標(biāo)進(jìn)行計(jì)算Pandas提供了很多方法來計(jì)算數(shù)值型字段的各類指標(biāo),常用統(tǒng)計(jì)指標(biāo)如下表所示。直接利用統(tǒng)計(jì)指標(biāo)進(jìn)行計(jì)算的語法格式如下:DataFrame[column].統(tǒng)計(jì)指標(biāo)二、利用describe()函數(shù)進(jìn)行計(jì)算Pandas模塊提供了describe()函數(shù)用來一次性計(jì)算數(shù)值型字段的8個(gè)統(tǒng)計(jì)指標(biāo),如下表所示。5.2.2分類型字段的統(tǒng)計(jì)與描述分類型字段是指該字段具有分類作用,如省份名、城市名、商品類別等,分類型字段的統(tǒng)計(jì)與描述主要是頻數(shù)統(tǒng)計(jì)。一、利用value_counts()函數(shù)進(jìn)行統(tǒng)計(jì)分析Pandas提供了value_counts()函數(shù)用來統(tǒng)計(jì)分類型字段的頻數(shù)。value_counts()函數(shù)的語法格式如下:Series.value_counts(normalize=False,sort=True,ascending=False,bins=None,dropna=True)二、利用describe()函數(shù)進(jìn)行統(tǒng)計(jì)分析Pandas中describe()函數(shù)除了可以對數(shù)值型字段進(jìn)行統(tǒng)計(jì)描述,還可以對分類型字段進(jìn)行統(tǒng)計(jì)描述。對于分類型字段,describe()函數(shù)可以統(tǒng)計(jì)分類數(shù)目、最多頻數(shù)類別等結(jié)果?!景咐馕觥俊救蝿?wù)實(shí)訓(xùn)】教案14教師姓名課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周課時(shí)課型理實(shí)一體化章節(jié)名稱任務(wù)5.3利用Pandas進(jìn)行數(shù)據(jù)的分組與分段分析教學(xué)目的掌握分組函數(shù)groupby()的使用;學(xué)會(huì)靈活使用agg()函數(shù)實(shí)現(xiàn)自定義聚合;掌握分段函數(shù)cut()的使用。教學(xué)重點(diǎn)分組函數(shù)groupby()的使用;agg()函數(shù)的使用。教學(xué)難點(diǎn)不同聚合方式下agg()函數(shù)的參數(shù)設(shè)定補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)完成課后復(fù)習(xí)、預(yù)習(xí)課后體會(huì)授課主要內(nèi)容任務(wù)5.3利用Pandas進(jìn)行數(shù)據(jù)的分組與分段分析【引入案例】【任務(wù)分析】【知識(shí)準(zhǔn)備】5.3.1數(shù)據(jù)分組統(tǒng)計(jì)分析分組統(tǒng)計(jì)分析主要利用分組聚合操作來實(shí)現(xiàn),所謂分組聚合就是將DataFrame對象根據(jù)一列或多列劃分成若干組,然后對分組后的數(shù)據(jù)分別進(jìn)行匯總計(jì)算,并將匯總計(jì)算后的結(jié)果進(jìn)行合并。一、數(shù)據(jù)分組Pandas提供了一個(gè)靈活的groupby()函數(shù),通過groupby()函數(shù)可以對DataFrame對象進(jìn)行分組操作,進(jìn)而再對每一組進(jìn)行統(tǒng)計(jì)分析,如計(jì)算每組最大值、最小值、平均值、中位數(shù)等。通過groupby()函數(shù)執(zhí)行分組操作,只會(huì)返回一個(gè)GroupBy對象,該對象實(shí)際上并沒有進(jìn)行任何的計(jì)算,其僅僅是中間數(shù)據(jù)。groupby()函數(shù)的語法格式如下:DataFrame.groupby(by=None,axis=0,level=None,as_index=True,sort=True,group_keys=True,squeeze=False,observed=False,dropna=True)二、分組統(tǒng)計(jì)在DataFrame中,在按照列進(jìn)行分組以后,還可以利用相關(guān)聚合函數(shù)對指定的列進(jìn)行統(tǒng)計(jì)分析。1.單一聚合方式所謂單一合方式,是指對特定的列每次只能使用一種聚合函數(shù)。其一般語法格式如下:DataFrame.groupby(by=分組列)[統(tǒng)計(jì)列].聚合函數(shù)2.自定義聚合方式使用agg()函數(shù),可以實(shí)現(xiàn)對多列進(jìn)行一種聚合或多種聚合方式,主要有以下三種方式:(1)對指定列同時(shí)使用多個(gè)聚合函數(shù)。這時(shí)必須把由聚合函數(shù)名構(gòu)成的字符串列表作為agg()函數(shù)的參數(shù)。(2)對特定的列使用特定的聚合函數(shù)。這時(shí)可以通過構(gòu)造字典傳入agg()函數(shù)實(shí)現(xiàn),其中字典以列名為鍵,以聚合函數(shù)名的字符串或字符串列表為值。(3)使用自定義的聚合函數(shù)。這時(shí)傳入聚合函數(shù)的參數(shù)是agg()函數(shù)前面數(shù)據(jù)源中的列,逐列進(jìn)行計(jì)算。5.3.2數(shù)據(jù)分段統(tǒng)計(jì)分析在數(shù)據(jù)分析中,常常需要將連續(xù)數(shù)據(jù)離散化,這就是數(shù)據(jù)分段。數(shù)據(jù)分段就是指在連續(xù)數(shù)據(jù)取值范圍內(nèi)設(shè)置一些離散的分段點(diǎn),而連續(xù)數(shù)據(jù)按照這些分段點(diǎn)進(jìn)行分段。在Pandas中cut()函數(shù)可以實(shí)現(xiàn)將連續(xù)型數(shù)據(jù)轉(zhuǎn)換為分段型數(shù)據(jù)。cut()函數(shù)的語法格式如下:pandas.cut(x,bins,right=True,labels=None,retbins=False,precision=3,include_lowest=False,duplicates='raise',ordered=True)【案例解析】【任務(wù)實(shí)訓(xùn)】教案15教師姓名課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周課時(shí)課型理實(shí)一體化章節(jié)名稱任務(wù)5.4利用Pandas進(jìn)行數(shù)據(jù)的交叉與透視分析教學(xué)目的1.掌握交叉分析函數(shù)crosstab()的使用;2.掌握數(shù)據(jù)透視函數(shù)pivot_table()的使用。教學(xué)重點(diǎn)數(shù)據(jù)透視函數(shù)pivot_table()的使用教學(xué)難點(diǎn)數(shù)據(jù)透視函數(shù)pivot_table()的參數(shù)的設(shè)定補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)完成課后復(fù)習(xí)、預(yù)習(xí)課后體會(huì)授課主要內(nèi)容任務(wù)5.4利用Pandas進(jìn)行數(shù)據(jù)的交叉與透視分析【引入案例】【任務(wù)分析】【知識(shí)準(zhǔn)備】5.4.1頻數(shù)交叉分析crosstab()函數(shù)的語法格式如下:pandas.crosstab(index,columns,values=None,rownames=None,colnames=None,aggfunc=None,margins=False,margins_name='All',dropna=True,normalize=False)5.4.2數(shù)據(jù)透視分析pivot_table()函數(shù)的語法格式如下:pandas.pivot_table(data,values=None,index=None,columns=None,aggfunc='mean',fill_value=None,margins=False,dropna=True,margins_name='All',observed=False)或者:DataFrame.pivot_table(values=None,index=None,columns=None,aggfunc='mean',fill_value=None,margins=False,dropna=True,margins_name='All',observed=False)【案例解析】【任務(wù)實(shí)訓(xùn)】教案16教師姓名課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周課時(shí)2課型理實(shí)一體化章節(jié)名稱任務(wù)5.5利用Pandas進(jìn)行數(shù)據(jù)相關(guān)性分析教學(xué)目的學(xué)會(huì)利用散點(diǎn)圖判斷變量間的相關(guān)性;學(xué)會(huì)利用corr()函數(shù)計(jì)算相關(guān)系數(shù)。教學(xué)重點(diǎn)利用散點(diǎn)圖判斷變量間的相關(guān)性;corr()函數(shù)的使用。教學(xué)難點(diǎn)利用散點(diǎn)圖判斷變量間的相關(guān)性補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)完成課后復(fù)習(xí)、預(yù)習(xí)課后體會(huì)授課主要內(nèi)容任務(wù)5.5利用Pandas進(jìn)行數(shù)據(jù)相關(guān)性分析【引入案例】【任務(wù)分析】【知識(shí)準(zhǔn)備】5.5.1相關(guān)分析的概念相關(guān)關(guān)系指事物或現(xiàn)象之間客觀存在但又不具有確定性的依存關(guān)系,比如身高與體重的關(guān)系就是如此。一般來說,身高越高,體重越重,但二者之間的關(guān)系并非嚴(yán)格意義上的對應(yīng)關(guān)系。比如身高1.75米的人,對應(yīng)的體重會(huì)有多個(gè)數(shù)值,因?yàn)橛绊戵w重的因素不只身高而已,它還會(huì)受遺傳、飲食習(xí)慣等因素的制約和影響。社會(huì)經(jīng)濟(jì)現(xiàn)象中大多存在這種非確定的相關(guān)關(guān)系。5.5.2相關(guān)分析的方法一、利用散點(diǎn)圖進(jìn)行相關(guān)分析1.強(qiáng)相關(guān)和弱相關(guān)相關(guān)關(guān)系從強(qiáng)弱程度上分為強(qiáng)相關(guān)和弱相關(guān)。若兩個(gè)變量的關(guān)系較為密切就稱為強(qiáng)相關(guān),若兩個(gè)變量的關(guān)系較為疏遠(yuǎn),就稱為弱相關(guān)。從散點(diǎn)圖來看,如果呈現(xiàn)窄長且密集時(shí),就是強(qiáng)相關(guān);如果散點(diǎn)圖呈現(xiàn)寬松且稀疏時(shí),就是弱相關(guān)。2.正相關(guān)和負(fù)相關(guān)如果散點(diǎn)分布在一條直線附近,則稱為線性相關(guān)。根據(jù)相關(guān)關(guān)系的方向劃分,可分為正相關(guān)和負(fù)相關(guān)。正相關(guān)是指兩個(gè)因素(或變量)之間的變化方向一致,都是呈增長或下降的趨勢,即一個(gè)變量增加(或減少),另一個(gè)變量也相應(yīng)地增加(或減少)。負(fù)相關(guān)指兩個(gè)因素或變量之間變化方向相反,即一個(gè)變量的數(shù)值增大(或減?。?,另一個(gè)變量隨之減?。ɑ蛟龃螅?。二、利用相關(guān)系數(shù)進(jìn)行相關(guān)分析散點(diǎn)圖可以幫助我們直觀了解相關(guān)關(guān)系,但這只是初步的判斷,是相關(guān)分析的開始。為了說明現(xiàn)象之間相關(guān)關(guān)系的密切程度,就要計(jì)算相關(guān)系數(shù)。相關(guān)系數(shù)是定量說明現(xiàn)象間相關(guān)關(guān)系密切程度的統(tǒng)計(jì)分析指標(biāo)。最常見的相關(guān)系數(shù)是皮爾遜相關(guān)系數(shù)。Pearson(皮爾遜)相關(guān)系數(shù)用來描述在線性相關(guān)下兩個(gè)數(shù)值型變量之間相關(guān)的方向和相關(guān)的程度。Pearson(皮爾遜)相關(guān)系數(shù)的計(jì)算公式如下:Pearson(皮爾遜)相關(guān)系數(shù)的性質(zhì)如下:(1)相關(guān)系數(shù)的取值范圍在-1和+1之間,即–1≤r≤1。(2)相關(guān)系數(shù)r為正,則表明兩變量為正相關(guān);若r為負(fù),則表明兩變量為負(fù)相關(guān)。(3)相關(guān)系數(shù)r的數(shù)值越接近于1(–1或+1),表示相關(guān)系數(shù)越強(qiáng);越接近于0,表示相關(guān)系數(shù)越弱。如果r=1或–1,則表示兩個(gè)現(xiàn)象完全直線性相關(guān)。如果r=0,則表示兩個(gè)現(xiàn)象完全不相關(guān)(不是直線相關(guān))。Padnas提供了corr()函數(shù)用來計(jì)算皮爾遜相關(guān)系數(shù),其語法格式如下:DataFrame.corr()【案例解析】【任務(wù)實(shí)訓(xùn)】教案17教師姓名課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周課時(shí)2課型理實(shí)一體化章節(jié)名稱任務(wù)6.1利用Matplotlib進(jìn)行數(shù)據(jù)可視化(1)教學(xué)目的1.掌握創(chuàng)建畫布和子圖的函數(shù);2.掌握添加畫布內(nèi)容的函數(shù);3.掌握圖形的保存與顯示函數(shù);4.掌握線條常用的rc參數(shù)名稱、解釋與取值;5.掌握lines.linestyle參數(shù)取值及意義;6.掌握lines.maker參數(shù)取值及意義;教學(xué)重點(diǎn)1.創(chuàng)建畫布和子圖的函數(shù)2.添加畫布內(nèi)容的函數(shù)3.lines.linestyle參數(shù)取值及意義;4.lines.maker參數(shù)取值及意義。教學(xué)難點(diǎn)添加畫布內(nèi)容的函數(shù);調(diào)節(jié)字體的rc參數(shù)。補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)課后體會(huì)授課主要內(nèi)容任務(wù)6.1利用Matplotlib進(jìn)行數(shù)據(jù)可視化(1)【引入案例】【任務(wù)分析】【知識(shí)準(zhǔn)備】6.1.1Matplotlib簡介6.1.2Matplotlib繪圖流程一、創(chuàng)建畫布和子圖第一部分主要作用是構(gòu)建出一張空白的畫布,并可以選擇是否將整個(gè)畫布劃分為多個(gè)部分,方便在同一幅圖上繪制多個(gè)圖形的情況。最簡單的繪圖可以省略第一部分,而后直接在默認(rèn)的畫布上進(jìn)行圖形繪制。二、添加畫布內(nèi)容第二部分是繪圖的主體部分。其中添加標(biāo)題,坐標(biāo)軸名稱,繪制圖形等步驟是并列的,沒有先后順序,可以先繪制圖形,也可以先添加各類標(biāo)簽。但是添加圖例一定要在繪制圖形之后。三、圖形的保存與顯示6.1.3設(shè)置動(dòng)態(tài)rc參數(shù)一、線條常用的rc參數(shù)名稱、解釋與取值二、lines.linestyle參數(shù)取值及意義三、lines.maker參數(shù)取值及意義四、調(diào)節(jié)字體的rc參數(shù)教案18教師姓名課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周課時(shí)2課型理實(shí)一體化章節(jié)名稱任務(wù)6.1利用Matplotlib進(jìn)行數(shù)據(jù)可視化(2)教學(xué)目的1.掌握散點(diǎn)圖的繪制;2.掌握折線圖的繪制;3.掌握餅形圖的繪制;4.掌握柱狀圖的繪制;5.掌握組合圖形的繪制。教學(xué)重點(diǎn)1.講解散點(diǎn)圖繪制scatter()函數(shù)參數(shù);2.講解折線圖繪制plot()函數(shù)參數(shù);3.餅形圖繪制pie()函數(shù)參數(shù);4.柱狀圖繪制bar()函數(shù)參數(shù);教學(xué)難點(diǎn)散點(diǎn)圖的繪制餅形圖的繪制補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)課后體會(huì)授課主要內(nèi)容任務(wù)6.1利用Matplotlib進(jìn)行數(shù)據(jù)可視化(2)6.1.4利用Matplotlib繪制常見圖形一、折線圖的繪制plot()函數(shù)用來繪制折線圖,其語法格式如下:plt.plot(*args,scalex=True,scaley=True,data=None,**kwargs)具體來說,有如下兩種調(diào)用格式:(1)繪制單條線的語句格式:plt.plot([x],y,[fmt],data=None,**kwargs)(2)繪制多條線的語句格式:plt.plot([x],y,[fmt],[x2],y2,[fmt2],...,**kwargs)二、散點(diǎn)圖的繪制scatter()函數(shù)用來繪制散點(diǎn)圖,其語法格式如下:plt.scatter(x,y,s=None,c=None,marker=None,cmap=None,norm=None,vmin=None,vmax=None,alpha=None,linewidths=None,verts=None,edgecolors=None,hold=None,data=None,**kwargs)三、柱狀圖的繪制bar()函數(shù)用于繪制柱狀圖,其語法格式如下:bar(x,height,width=0.8,bottom=None,*,align='center',data=None,**kwargs)四、餅形圖的繪制pie()函數(shù)用于繪制餅形圖,其語法格式如下:pie(x,explode=None,labels=None,colors=None,autopct=None,pctdistance=0.6,shadow=False,labeldistance=1.1,startangle=0,radius=1,counterclock=True,wedgeprops=None,textprops=None,center=(0,0),frame=False,rotatelabels=False,*,normalize=True,data=None)五、繪制組合圖形有些情況,需要將兩個(gè)及以上圖形繪制在一起,這就用到了表6-1-1中的pyplot模塊中的subplot()函數(shù)和subplots()函數(shù)?!景咐馕觥俊救蝿?wù)實(shí)訓(xùn)】教案19教師姓名徐大詔課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周日課時(shí)2課型理實(shí)一體化章節(jié)名稱任務(wù)6.2利用Pyecharts進(jìn)行數(shù)據(jù)可視化(1)教學(xué)目的掌握Pyecharts繪圖流程;學(xué)會(huì)使用Pyechart配置項(xiàng)。教學(xué)重點(diǎn)Pyecharts繪圖流程中常用語句;Pyecharts配置項(xiàng)的使用。教學(xué)難點(diǎn)Pyecharts配置項(xiàng)的設(shè)置補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)課后體會(huì)授課主要內(nèi)容任務(wù)6.2利用Pyecharts進(jìn)行數(shù)據(jù)可視化(1)【引入案例】【任務(wù)分析】【知識(shí)準(zhǔn)備】6.2.1Pyecharts簡介Matplotlib作為Python中著名的基礎(chǔ)繪圖庫,它具有極其豐富的可視化功能,但仍存在諸多不足,例如圖表無法與用戶交互、API過于復(fù)雜等。為此,Python中引入了數(shù)據(jù)可視化神器——Pyecharts庫,使用Pyecharts可以快速生成效果驚艷的Echarts圖表。6.2.2Pyecharts繪圖流程利用Pyecharts進(jìn)行繪圖的流程如下:①選擇圖表類型;②聲明圖形類并添加數(shù)據(jù);③添加配置項(xiàng);④顯示及保存圖表。一、選擇圖表類型從Pyecharts導(dǎo)入想要繪制的圖形,其語法格式如下:frompyecharts.chartsimport圖表類名具體舉例如下:frompyecharts.chartsimportLine#導(dǎo)入折線圖frompyecharts.chartsimportPie#導(dǎo)入餅圖二、聲明圖形類并添加數(shù)據(jù)1.聲明圖形類2.添加數(shù)據(jù)像散點(diǎn)圖、折線圖等二維數(shù)據(jù)圖形,它既有X軸,又有Y軸,所以不僅要為X軸添加數(shù)據(jù),還要為Y軸添加數(shù)據(jù),一般語法格式如下:add_xaxis(xaxis_data=x_data)#為X軸添加數(shù)據(jù)add_yaxis(series_name='',y_axis=y_data)#為Y軸添加數(shù)據(jù)三、添加配置項(xiàng)Pyechart提供了豐富的配置項(xiàng),包括全局配置項(xiàng)和系列配置項(xiàng),具體函數(shù)如下: set_global_opts():全局配置項(xiàng),可配置標(biāo)題、圖例、坐標(biāo)軸、工具箱等。 set_series_opts():系列配置項(xiàng),可配置圖元樣式、文字樣式、標(biāo)題樣式、點(diǎn)線樣式等。options模塊是Pyecharts最重要模塊之一,里面封裝了幾乎所有全局配置項(xiàng)和系列配置項(xiàng)的相關(guān)對象。在使用配置項(xiàng)之前,必須先導(dǎo)入options模塊,其語法格式如下:frompyechartsimportoptionsasopts四、保存及顯示圖表對于保存及顯示圖表,常用函數(shù)如下:render("a.html")#保存為本地html文件(a為名稱),也可以傳入路徑render_notebook()#jupyternotebook環(huán)境下直接顯示圖表6.2.3Pyechart配置項(xiàng)的使用一、全局配置1.初始化配置項(xiàng)2.標(biāo)題配置項(xiàng)3.圖例配置項(xiàng)4.坐標(biāo)軸配置項(xiàng)5.工具箱配置項(xiàng)二、系列配置系列配置項(xiàng)是一些針對圖表特定元素屬性的配置項(xiàng),包括圖元樣式、文本樣式、標(biāo)簽、線條樣式、標(biāo)記樣式、填充樣式等,其中每個(gè)配置項(xiàng)都對應(yīng)一個(gè)類。教案20教師姓名課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周課時(shí)2課型理實(shí)一體化章節(jié)名稱任務(wù)6.2利用Pyecharts進(jìn)行數(shù)據(jù)可視化(2)教學(xué)目的1.掌握散點(diǎn)圖的繪制;2.掌握折線圖的繪制;3.掌握柱狀圖的繪制;4.掌握餅形圖的繪制。教學(xué)重點(diǎn)四種常見圖形在繪制時(shí)參數(shù)的設(shè)置教學(xué)難點(diǎn)餅形圖的繪制補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)課后體會(huì)授課主要內(nèi)容任務(wù)6.2利用Pyecharts進(jìn)行數(shù)據(jù)可視化(2)6.2.4利用Pyecharts繪制常見圖形一、散點(diǎn)圖的繪制Pyecharts中的Scatter類表示散點(diǎn)圖,EffectScatter類表示帶有漣漪特效的散點(diǎn)圖,這兩個(gè)類中均提供了一個(gè)add_yaxis()方法,使用add_yaxis()方法可以為散點(diǎn)圖添加數(shù)據(jù)和配置項(xiàng)。add_yaxis()方法的語法格式如下:add_yaxis(self,series_name,yaxis,is_selected=True,xaxis_index=None,yaxis_index=None,color=None,symbol=None,symbol_size=10,label_opts=opts.LabelOpts(position="right"),markpoint_opts=None,markline_opts=None,tooltip_opts=None,itemstyle_opts=None)二、折線圖的繪制Pyecharts的Line類表示折線圖,該類中提供了一個(gè)add_yaxis()方法,使用add_yaxis()方法可以為折線添加數(shù)據(jù)和配置項(xiàng)。add_yaxis()方法的語法格式如下所示:add_yaxis(self,series_name,y_axis,is_selected=True,is_connect_nones=False,xaxis_index=None,yaxis_index=None,color=None,is_symbol_show=True,symbol=None,symbol_size=4,stack=None,is_smooth=False,is_step=False,is_hover_animation=True,markpoint_opts=None,markline_opts=None,tooltip_opts=None,label_opts=opts.Label0pts(),linestyle_opts=opts.LinestyleOpts(),areastyle_opts=opts.AreaStyleOpts(),itemstyle_opts=None)三、柱形圖的繪制Pyecharts的Bar類表示柱狀圖,該類中提供了一個(gè)add_yaxis()方法,使用add_yaxis()方法可以為柱狀圖添加數(shù)據(jù)和配置項(xiàng)。add_yaxis()方法的語法格式如下所示:add_yaxis(series_name,y_axis,is_selected=True,xaxis_index=None,yaxis_index=None,is_legend_hover_link=True,color=None,is_show_background=False,background_style=None,stack=None,bar_width=None,bar_max_width=None,bar_min_width=None,bar_min_height=0,category_gap="20%",gap="30%",is_large=False,large_threshold=400,dimensions=None,series_layout_by="column",dataset_index=0,is_clip=True,z_level=0,z=2,label_opts=opts.LabelOpts(),markpoint_opts=None,markline_opts=None,tooltip_opts=None,itemstyle_opts=None,encode=None)四、餅形圖的繪制Pyecharts中的Pie類表示餅形圖,該類中提供了一個(gè)add()方法,使用add()方法可以為餅形圖添加數(shù)據(jù)和配置項(xiàng)。add()方法的語法格式如下:add(series_name,data_pair,color=None,radius=None,center=None,rosetype=None,isclockwise=True,label_opts=opts.Label0pts(),tooltip_opts=None,itemstyle_opts=None)【案例解析】【任務(wù)實(shí)訓(xùn)】教案21教師姓名課程名稱大數(shù)據(jù)技術(shù)在財(cái)務(wù)中的應(yīng)用班級(jí)授課日期年月日第周課時(shí)2課型理實(shí)一體化章節(jié)名稱任務(wù)7.1企業(yè)償債能力與營運(yùn)能力分析(1)教學(xué)目的1.學(xué)會(huì)利用Pandas計(jì)算企業(yè)償債能力指標(biāo)并進(jìn)行可視化;2.能夠利用Pandas進(jìn)行數(shù)據(jù)的綜合處理;3.能夠根據(jù)償債能力指標(biāo)值進(jìn)行分析。教學(xué)重點(diǎn)利用Pandas計(jì)算償債能力指標(biāo)教學(xué)難點(diǎn)根據(jù)償債能力指標(biāo)值進(jìn)行分析補(bǔ)充、刪節(jié)、更新教具計(jì)算機(jī)、極域電子教室、JupyterNotebook軟件課外作業(yè)課后體會(huì)
授課主要內(nèi)容任務(wù)7.1企業(yè)償債能力與營運(yùn)能力分析(1)【引入案例】【任務(wù)分析】【知識(shí)準(zhǔn)備】7.1.1企業(yè)償債能力分析一、短期償債能力分析1.營運(yùn)資金的含義與計(jì)算2.流動(dòng)比率的含義與計(jì)算3.速動(dòng)比率的含義與計(jì)算4.現(xiàn)金比率的含義與計(jì)算【做中學(xué)】講練二、長期償債能力分析1.資產(chǎn)負(fù)債率的含義與計(jì)算2.產(chǎn)權(quán)比率的含義與計(jì)算3.權(quán)益乘數(shù)的含義與計(jì)算4.利息保障倍數(shù)的含義與計(jì)算【做中學(xué)】講練三、影響償債能力的其他因素1.可動(dòng)用的銀行貸款指標(biāo)或授信額度當(dāng)企業(yè)存在可動(dòng)用的銀行貸款指標(biāo)或授信額度時(shí),這些數(shù)據(jù)不在財(cái)務(wù)報(bào)表內(nèi)反映,但由于可以隨時(shí)增加企業(yè)的支付能力,因此可以提高企業(yè)的償債能力。2.資產(chǎn)質(zhì)量在財(cái)務(wù)報(bào)表內(nèi)反映的資產(chǎn)金額為資產(chǎn)的賬面價(jià)值,但由于財(cái)務(wù)會(huì)計(jì)的局限性,資產(chǎn)的賬面價(jià)值與實(shí)際價(jià)值可能存在差異,如資產(chǎn)可能被高估或低估,一些資產(chǎn)無法計(jì)入到財(cái)務(wù)報(bào)表等。此外,資產(chǎn)的變現(xiàn)能力也會(huì)影響償債能力。如果企業(yè)存在很快變現(xiàn)的長期資產(chǎn),會(huì)增加企業(yè)的短期償債能力。3.或有事項(xiàng)和承諾事項(xiàng)如果企業(yè)存在債務(wù)擔(dān)?;蛭礇Q訴訟等或有事項(xiàng),
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣州市家居裝修工程合同范本
- 1《村晚》教學(xué)設(shè)計(jì)-2023-2024學(xué)年五年級(jí)下冊語文統(tǒng)編版
- 全屋定制家具合同范本
- Lesson 5“Days of the Week”(教學(xué)設(shè)計(jì))-2024-2025學(xué)年冀教版(三起)英語四年級(jí)上冊
- 輪椅采購合同范本
- 11仰臥起坐教學(xué)設(shè)計(jì)7-八年級(jí)體育與健康
- 13足球繞桿 教學(xué)設(shè)計(jì)-七年級(jí)上學(xué)期體育與健康
- Unit 1 Myself Fun Time(教學(xué)設(shè)計(jì))-2024-2025學(xué)年人教新起點(diǎn)版英語三年級(jí)上冊
- 2025高考生物備考教學(xué)設(shè)計(jì):課時(shí)3 細(xì)胞呼吸的原理和應(yīng)用
- fob加工合同范本
- 2025年度養(yǎng)老服務(wù)機(jī)構(gòu)場地租賃合同及養(yǎng)老服務(wù)協(xié)議
- 貴州省情知識(shí)考試題庫500題(含答案)
- 大學(xué)生家長陪讀承諾書
- 安全生產(chǎn)事故調(diào)查與案例分析(第3版)課件 呂淑然 第5章 事故案例評析
- 勞動(dòng)法培訓(xùn)課件
- 2024-2025學(xué)年成都市成華區(qū)七年級(jí)上英語期末考試題(含答案)
- 2025年山西杏花村汾酒集團(tuán)限責(zé)任公司人才招聘71名高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年江蘇省環(huán)保集團(tuán)招聘筆試參考題庫含答案解析
- 新修訂中華人民共和國畜牧法全文解讀學(xué)習(xí)
- 學(xué)校提高《規(guī)范書寫水平、傳承漢字文化》活動(dòng)方案3篇
- 幕墻施工現(xiàn)場安全檢查方案
評論
0/150
提交評論