數(shù)據(jù)分析基礎(chǔ)課程-第4章-數(shù)據(jù)的分析_第1頁(yè)
數(shù)據(jù)分析基礎(chǔ)課程-第4章-數(shù)據(jù)的分析_第2頁(yè)
數(shù)據(jù)分析基礎(chǔ)課程-第4章-數(shù)據(jù)的分析_第3頁(yè)
數(shù)據(jù)分析基礎(chǔ)課程-第4章-數(shù)據(jù)的分析_第4頁(yè)
數(shù)據(jù)分析基礎(chǔ)課程-第4章-數(shù)據(jù)的分析_第5頁(yè)
已閱讀5頁(yè),還剩116頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

目錄/Contents4.1數(shù)據(jù)分組4.2描述性統(tǒng)計(jì)第四章數(shù)據(jù)的分析4.3動(dòng)態(tài)數(shù)列的分析與預(yù)測(cè)4.4相關(guān)分析與回歸分析

4.5綜合評(píng)價(jià)分析法

4.6四象限分析法數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第1頁(yè)。4.1數(shù)據(jù)分組4.1.1統(tǒng)計(jì)分組的概念統(tǒng)計(jì)分組是根據(jù)統(tǒng)計(jì)研究的需要,按照一定的標(biāo)志,將總體區(qū)分為若干個(gè)性質(zhì)不同而又有聯(lián)系的組成部分,并計(jì)算各組的頻數(shù)或比重的一種統(tǒng)計(jì)方法。這些組成部分稱為這一總體的“組”。按照每組標(biāo)志表現(xiàn)的多少,統(tǒng)計(jì)分組可以分成單項(xiàng)式分組和組距式分組。1.單項(xiàng)式分組一個(gè)變量值作為一組,稱為單項(xiàng)式分組,一般適用于離散型變量且變量變動(dòng)不大的場(chǎng)合。例如,如果考試成績(jī)以五分制計(jì)算,則全體學(xué)生的成績(jī)可以分為六組,即5分、4分、3分、2分、1分、0分,如表4-1所示。組別人數(shù)5分2304分7603分13892分3401分790分2合計(jì)2800表4-1單項(xiàng)式分組數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第2頁(yè)。1.1數(shù)字通信系統(tǒng)的基本概念2.組距式分組以一個(gè)區(qū)間作為一組,稱為組距式分組,一般適用于連續(xù)型變量或離散數(shù)據(jù)較多的場(chǎng)合。組距式分組又可以分成等距分組和不等距分組。例如,如果學(xué)生的成績(jī)以百分制計(jì)算,則全體學(xué)生的成績(jī)可以采用等距分組分成10組,如表4-2所示;也可以采用不等距分組分成5組,如表4-3所示。4數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第3頁(yè)。組別人數(shù)0~10010~20520~301830~405740~509050~6025060~70121070~80102080~9011890~10032表4-2等距分組數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第4頁(yè)。組別人數(shù)40分以下8040~60分34060~70分121070~80分102080分以上150表4-3不等距分組數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第5頁(yè)。對(duì)于某一個(gè)組(a,b),我們稱a為該組的下限,b為該組的上限;上限與下限之差(b-a)叫組距,

叫組中值。組中值未必是該組數(shù)據(jù)的平均值,但由于其計(jì)算簡(jiǎn)單,常作為該組的代表值。采用組距式分組一般經(jīng)過(guò)以下幾個(gè)步驟。(1)確定組數(shù)。(2)確定各組的組距。(3)統(tǒng)計(jì)各組的頻數(shù)。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第6頁(yè)。3.次數(shù)分布在統(tǒng)計(jì)分組的基礎(chǔ)上,將總體中所有單位按組歸類整理,形成總體中各單位數(shù)在各組間的分配,叫次數(shù)分布。分配在各組的單位數(shù)叫頻數(shù)。各組頻數(shù)與總頻數(shù)的比值叫頻率或比率。各頻率之和為1或100%。各種不同性質(zhì)的總體都有著特殊的次數(shù)分布,概括起來(lái),主要有鐘形分布、U形分布和J形分布。(1)鐘形分布當(dāng)次數(shù)分布出現(xiàn)兩端次數(shù)較少、中間次數(shù)較多的狀態(tài)時(shí),所繪制的曲線就像一口鐘,所以叫鐘形分布。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第7頁(yè)。鐘形分布有對(duì)稱分布和非對(duì)稱分布兩種。對(duì)稱分布的特征是中間變量值分布的次數(shù)最多,兩側(cè)變量值隨著與中間變量值距離的增大而逐漸減少,并且圍繞中心變量值兩端呈對(duì)稱分布,即為正態(tài)分布,如圖4-1所示。圖4-1正態(tài)分布數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第8頁(yè)。在非對(duì)稱的鐘形分布中,又分左偏分布和右偏分布兩種。左偏分布的平均數(shù)在峰值的左邊,右偏分布的平均數(shù)在峰值的右邊,如圖4-2和圖4-3所示。圖4-2左偏分布

圖4-3右偏分布數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第9頁(yè)。(2)U形分布當(dāng)次數(shù)分布出現(xiàn)兩端次數(shù)較多,靠近中間次數(shù)較少的狀態(tài)時(shí),所繪制出來(lái)的曲線如同英文字母“U”字一樣,所以叫U形分布,如圖4-4所示。圖4-4U形分布數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第10頁(yè)。(3)J形分布J形分布有兩種,一種是正J形分布,另一種是反J形分布。當(dāng)次數(shù)隨著變量的增大而增多時(shí),繪制的曲線圖就像英文字母“J”,所以叫正J形分布,如圖4-5所示。當(dāng)次數(shù)隨著變量的增大而減少時(shí),繪制的曲線圖就如反寫的英文字母“J”,所以叫反J形分布,如圖4-6所示。圖4-5正J形分布圖4-6反J形分布數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第11頁(yè)。4.1.2利用“數(shù)據(jù)透視表”分組數(shù)據(jù)透視表可以將Excel數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行分組,建立各種形式的交叉數(shù)據(jù)列表。數(shù)據(jù)透視表將篩選和分類匯總等功能結(jié)合在一起,可根據(jù)不同需要以不同方式查看數(shù)據(jù)。插入透視表的主要步驟如下。(1)單擊數(shù)據(jù)區(qū)域的任意一個(gè)單元格,再選擇“插入”|“數(shù)據(jù)透視表”命令。(2)如果第一步按前面的要求做了,那這一步打開(kāi)的“創(chuàng)建數(shù)據(jù)透視表”對(duì)話框中就會(huì)自動(dòng)選擇所有的數(shù)據(jù)區(qū)域,透視表的位置默認(rèn)為“新工作表”,如圖4-7所示。如果不想更改透視表的位置,只需單擊“確定”按鈕即可。圖4-7確定要分析的數(shù)據(jù)及透視表放置位置數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第12頁(yè)。(3)將分組標(biāo)志(Excel中叫“字段”)拖到“行標(biāo)簽”“列標(biāo)簽”或“報(bào)表篩選”處(首選“行標(biāo)簽”,其次是“列標(biāo)簽”,盡量不要拖到“報(bào)表篩選”),將要統(tǒng)計(jì)的標(biāo)志(字段)全部拖到“數(shù)值”處,如圖4-8所示。圖4-8確定分組標(biāo)志及統(tǒng)計(jì)標(biāo)志數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第13頁(yè)。如果統(tǒng)計(jì)是品質(zhì)標(biāo)志,統(tǒng)計(jì)方式默認(rèn)為“計(jì)數(shù)”;如果統(tǒng)計(jì)的是數(shù)量標(biāo)志,統(tǒng)計(jì)方式默認(rèn)為“求和”。如果要修改統(tǒng)計(jì)方式,可以單擊右邊的下三角形,在彈出的列表框中選擇“值字段設(shè)置”命令,如圖4-9所示,然后在“值字段設(shè)置”對(duì)話框中修改統(tǒng)計(jì)方式,如圖4-10所示。圖4-9修改值字段設(shè)置圖4-10修改統(tǒng)計(jì)方式數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第14頁(yè)。例1:打開(kāi)工作簿“數(shù)據(jù)分組.xlsx”,利用數(shù)據(jù)透視表功能統(tǒng)計(jì)“一月銷售記錄”工作表中每種商品的總銷售額。(1)單擊“一月銷售記錄”工作表數(shù)據(jù)區(qū)域的任意一個(gè)單元格,再選擇“插入”|“數(shù)據(jù)透視表”命令,打開(kāi)“創(chuàng)建數(shù)據(jù)透視表”對(duì)話框,里面自動(dòng)選擇了要分析的數(shù)據(jù)為“一月銷售記錄!$A$1:$C$531”,透視表的位置為“新工作表”,如圖4-11所示。圖4-11確定要分析的數(shù)據(jù)及透視表放置位置數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第15頁(yè)。(2)將“銷售商品”拖至“行標(biāo)簽”處,將“銷售額”拖至“數(shù)值”處,即得到每種商品的總銷售額,如圖4-12所示。圖4-12統(tǒng)計(jì)每種商品的總銷售額數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第16頁(yè)。例2:將工作簿“數(shù)據(jù)分組.xlsx”中的“2015年銷售記錄”工作表的數(shù)據(jù)根據(jù)“日期”字段按季度分組,并統(tǒng)計(jì)每個(gè)季度的“成交商品數(shù)”。(1)單擊“2015年銷售記錄”工作表數(shù)據(jù)區(qū)域的任意一個(gè)單元格,再選擇“插入”|“數(shù)據(jù)透視表”命令,打開(kāi)“創(chuàng)建數(shù)據(jù)透視表”對(duì)話框。(2)要分析的數(shù)據(jù)區(qū)域?yàn)椤?2015年銷售記錄'!$A$1:$F$363”,透視表的位置為“新工作表”,如圖4-13所示。圖4-13要分析的數(shù)據(jù)及透視表放置位置數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第17頁(yè)。(3)將“日期”拖到“行標(biāo)簽”處,將“成交商品數(shù)”拖到“數(shù)值”處,如圖4-14所示。圖4-14按日期分組統(tǒng)計(jì)成交商品數(shù)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第18頁(yè)。(4)在透視表的“行標(biāo)簽”下任意單元格上單擊鼠標(biāo)右鍵,在彈出的快捷菜單中選擇“創(chuàng)建組”命令,如圖4-15所示。(5)在隨后打開(kāi)的“分組”對(duì)話框中選擇“步長(zhǎng)“為“季度”,如圖4-16所示。圖4-15創(chuàng)建組圖4-16按季度分組數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第19頁(yè)。(6)單擊“確定”按鈕,統(tǒng)計(jì)結(jié)果如圖4-17所示。圖4-17各季度的成交商品數(shù)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第20頁(yè)。例3:將工作簿“數(shù)據(jù)分組.xlsx”中的“商品詳情”工作表數(shù)據(jù)按“單價(jià)”進(jìn)行等距分組(組距為50),統(tǒng)計(jì)各組的“點(diǎn)擊次數(shù)”。(1)單擊“商品詳情”工作表數(shù)據(jù)區(qū)域的任意一個(gè)單元格,再選擇“插入”|“數(shù)據(jù)透視表”命令,將“單價(jià)”拖至“行標(biāo)簽”處,將“點(diǎn)擊次數(shù)”拖至“數(shù)值”處,如圖4-18所示。圖4-18按單價(jià)分組統(tǒng)計(jì)點(diǎn)擊次數(shù)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第21頁(yè)。(2)在透視表的“行標(biāo)簽”下任意單元格上單擊鼠標(biāo)右鍵,在彈出的快捷菜單中選擇“創(chuàng)建組”命令,如圖4-19所示。(3)修改起始值為100,終止值為400,步長(zhǎng)為50,如圖4-20所示。圖4-19創(chuàng)建組圖4-20修改起始值、終止值、步長(zhǎng)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第22頁(yè)。注意:當(dāng)各組的上下限互不相等時(shí),各組是既含下限又含上限的;但當(dāng)前一組的上限與后一組的下限相同時(shí),數(shù)據(jù)透視表統(tǒng)計(jì)結(jié)果遵循“含下限、不含上限”的原則。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第23頁(yè)。4.1.3利用“數(shù)據(jù)分析”之“直方圖”功能統(tǒng)計(jì)各組的頻數(shù)利用透視表可以完成對(duì)數(shù)據(jù)的單項(xiàng)分組和等距分組。如果要對(duì)數(shù)據(jù)進(jìn)行不等距分組,透視表就無(wú)能為力了,此時(shí)可以利用“數(shù)據(jù)分析”之“直方圖”功能進(jìn)行分組。透視表就無(wú)能為力了,此時(shí)可以利用“數(shù)據(jù)分析”之“直方圖”功能進(jìn)行分組。例:將工作簿“數(shù)據(jù)分組.xlsx”中的“數(shù)學(xué)成績(jī)”工作表的數(shù)據(jù)按“40分以下”“40~60分”“60~70分”“70~80分”“80分以上”分成5組,并統(tǒng)計(jì)各組的人數(shù)。(1)在F列輸入各組的上限值:40、60、70、80、100,如圖4-21所示。(2)選擇“數(shù)據(jù)”|“數(shù)據(jù)分析”命令。(3)在“數(shù)據(jù)分析”對(duì)話框中選擇“直方圖”,如圖4-22所示。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第24頁(yè)。圖4-21組上限

圖4-22選擇直方圖數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第25頁(yè)。(4)“直方圖”對(duì)話框中的“輸入?yún)^(qū)域”是指要分析的數(shù)據(jù)區(qū)域,操作時(shí)先單擊該輸入框,再在“數(shù)學(xué)成績(jī)”工作表中選擇整個(gè)D列(在字母D上單擊即可選擇整個(gè)D列),這時(shí)輸入?yún)^(qū)域會(huì)自動(dòng)顯示絕對(duì)引用的方式$D:$D;“接收區(qū)域”是指組上限區(qū)域,操作時(shí)先單擊該輸入框,再在“數(shù)學(xué)成績(jī)”工作表中選擇單元格區(qū)域F1:F6,這時(shí)接收區(qū)域也會(huì)自動(dòng)顯示絕對(duì)引用的方式$F$1:$F$6。因?yàn)閱卧馜1和F1里的數(shù)據(jù)是標(biāo)志,所以下面選中“標(biāo)志”復(fù)選項(xiàng),如圖4-23所示。圖4-23設(shè)置輸入?yún)^(qū)域和接收區(qū)域數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第26頁(yè)。(5)如果選中了“圖表輸出”復(fù)選框,還將自動(dòng)輸出直方圖,如圖4-24所示。圖4-24直方圖數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第27頁(yè)。4.1.4用frequency、countif函數(shù)統(tǒng)計(jì)頻數(shù)1.frequency函數(shù)frequency函數(shù)的功能就是統(tǒng)計(jì)各組的頻數(shù),因此它是一個(gè)數(shù)組函數(shù),即它返回的結(jié)果不是一個(gè)數(shù),而是一組數(shù)。例1:用frequency函數(shù)對(duì)“數(shù)學(xué)成績(jī)(1)”工作表的數(shù)據(jù)按“40分以下”“40~60分”

“60~70分”“70~80分”“80分以上”進(jìn)行分組統(tǒng)計(jì)。(1)打開(kāi)“數(shù)學(xué)成績(jī)(1)”工作表,在F2:F6中輸入各組的上限:40、60、70、80、100。選擇區(qū)域G2:G6,用于放統(tǒng)計(jì)結(jié)果,如圖4-25所示。圖4-25選擇放置結(jié)果的單元格區(qū)域數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第28頁(yè)。(2)插入frequency函數(shù)。(3)在frequency函數(shù)參數(shù)對(duì)話框中,在第一個(gè)輸入框中選擇D列(結(jié)果顯示D:D);在第2個(gè)輸入框中選擇組上限區(qū)域(F1:F6),如圖4-26所示。(4)按Ctrl+Shift+Enter組合鍵確認(rèn),結(jié)果如圖4-27所示。圖4-26frequency函數(shù)參數(shù)圖4-27統(tǒng)計(jì)結(jié)果數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第29頁(yè)。2.countif函數(shù)countif函數(shù)的功能是統(tǒng)計(jì)滿足一定條件的單元格個(gè)數(shù),使用格式為:countif(單元格區(qū)域,條件)。例2:用countif函數(shù)對(duì)“數(shù)學(xué)成績(jī)(2)”工作表的數(shù)據(jù)按“40分以下”“40~60分”“60~70分”“70~80分”“80分以上”進(jìn)行分組統(tǒng)計(jì)。使用的公式和結(jié)果如圖4-28所示。圖4-28用countif統(tǒng)計(jì)區(qū)間的頻數(shù)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第30頁(yè)。4.2描述性統(tǒng)計(jì)描述性統(tǒng)計(jì)主要用于計(jì)算總體的總量指標(biāo)、平均指標(biāo)、中位數(shù)、眾數(shù)、極差、方差、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)差系數(shù)等。4.2.1總量指標(biāo)和平均指標(biāo)根據(jù)總體反應(yīng)的具體內(nèi)容,總量指標(biāo)劃分為標(biāo)志總量和單位總量。(1)標(biāo)志總量:總體某一標(biāo)志的總和∑xi。(2)單位總量:總體所包含個(gè)體數(shù)的多少。如果收集的數(shù)據(jù)是一條一條的原始記錄,而且是精確的數(shù)據(jù),則用sum函數(shù)計(jì)算標(biāo)志總量,用count函數(shù)計(jì)算單位總量,用average函數(shù)計(jì)算平均指標(biāo)。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第31頁(yè)。例1:打開(kāi)文件“描述性統(tǒng)計(jì).xlsx”中的“捐款資料”工作表,計(jì)算總捐款金額、總捐款人數(shù)、人均捐款金額。圖4-29計(jì)算標(biāo)志總量

圖4-30計(jì)數(shù)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第32頁(yè)。圖4-31計(jì)算單位總量圖4-32用函數(shù)average計(jì)算算數(shù)平均數(shù)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第33頁(yè)。例2:××學(xué)院新生入學(xué)年齡統(tǒng)計(jì)表如圖4-33所示,請(qǐng)統(tǒng)計(jì)新生的平均年齡。數(shù)據(jù)文件見(jiàn)“描述性統(tǒng)計(jì).xlsx”中的“平均年齡”工作表。圖4-33年齡統(tǒng)計(jì)表圖4-34增加“xf

”列和“合計(jì)∑”行數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第34頁(yè)。圖4-35計(jì)算xf的值圖4-36計(jì)算∑f

圖4-37計(jì)算∑xf數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第35頁(yè)。在Excel中,函數(shù)sumproduct的功能是計(jì)算兩組或多組數(shù)據(jù)的乘積之和。圖4-38計(jì)算平均年齡數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第36頁(yè)。本例可用函數(shù)sumproduct直接計(jì)算∑xf,操作如下。(1)插入sumproduct函數(shù),在“函數(shù)參數(shù)”對(duì)話框的第一個(gè)參數(shù)中選擇單元格區(qū)域A3:A7,在第二個(gè)參數(shù)中選擇單元格區(qū)域B3:B7,如圖4-39所示。圖4-39sumproduct函數(shù)參數(shù)設(shè)置數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第37頁(yè)。(2)所以,平均年齡的計(jì)算可以直接用公式“=sumproduct(A3:A7,B3:B7)/sum(B3:B7)”完成,不需要計(jì)算xf、∑f、∑xf,如圖4-40所示。圖4-40用sumproduct和sum計(jì)算平均年齡數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第38頁(yè)。例3:IT企業(yè)對(duì)IT人才中高級(jí)程序員的素質(zhì)要求也越來(lái)越高,其中包括團(tuán)隊(duì)意識(shí)與協(xié)作能力、文檔處理與測(cè)試能力、規(guī)范化代碼編寫能力、需求理解與分析能力、模塊化思維能力、學(xué)習(xí)與總結(jié)能力、項(xiàng)目設(shè)計(jì)與流程處理能力、整體項(xiàng)目評(píng)估能力、團(tuán)隊(duì)組織與管理能力等。有一名某高級(jí)程序員叫張三,300名同事對(duì)他的評(píng)價(jià)投票資料如圖4-41所示,請(qǐng)計(jì)算他各個(gè)項(xiàng)目的平均得分。數(shù)據(jù)文件為工作簿“描述性統(tǒng)計(jì).xlsx”中的“程序員測(cè)評(píng)”工作表。圖4-41評(píng)價(jià)投票資料數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第39頁(yè)。在Excel中的操作如下。(1)在單元格G3中使用公式“=(B3*100+C3*85+D3*65+E3*45+F3*30)/300”計(jì)算“團(tuán)隊(duì)意識(shí)與協(xié)作”的平均得分,如圖4-42所示。(2)雙擊G3的填充柄,即可得到其他項(xiàng)目的平均得分。圖4-42“團(tuán)隊(duì)意識(shí)與協(xié)作”的平均得分?jǐn)?shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第40頁(yè)。例4:某次考試成績(jī)分組統(tǒng)計(jì)情況如圖4-43所示,請(qǐng)計(jì)算此次考試的平均分。數(shù)據(jù)文件為工作簿“描述性統(tǒng)計(jì).xlsx”中的“平均成績(jī)”工作表。圖4-43考試成績(jī)分組統(tǒng)計(jì)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第41頁(yè)。(1)計(jì)算各組的組中值x,并將每組的組中值直接錄入到C列,如圖4-44所示。(2)計(jì)算xf、∑f、∑xf,并用公式“=D7/B7”計(jì)算平均得分66.9,結(jié)果如圖4-45所示。圖4-44計(jì)算組中值x圖4-45計(jì)算平均分?jǐn)?shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第42頁(yè)。例5:打開(kāi)文件“描述性統(tǒng)計(jì).xlsx”中的“月薪調(diào)查”工作表,如圖4-46所示,請(qǐng)計(jì)算平均月薪。圖4-46月薪調(diào)查數(shù)據(jù)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第43頁(yè)。圖4-47對(duì)數(shù)據(jù)分組圖4-48調(diào)整組別順序數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第44頁(yè)。圖4-49復(fù)制粘貼“值”圖4-50計(jì)算結(jié)果數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第45頁(yè)。4.2.2中位數(shù)和眾數(shù)中位數(shù)是指將總體各單位的標(biāo)志值按大小順序排列時(shí)位于數(shù)列中間位置的數(shù)據(jù)。如果有偶數(shù)個(gè)數(shù)據(jù),則取中間兩個(gè)數(shù)的平均數(shù)。中位數(shù)用字母Me(median)表示。眾數(shù)是指總體中出現(xiàn)次數(shù)最多的數(shù)據(jù),用字母Mo(mode)表示。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第46頁(yè)。1.用函數(shù)median計(jì)算中位數(shù)Me例1:打開(kāi)文件“描述性統(tǒng)計(jì).xlsx”的“捐款資料”工作表,計(jì)算“捐款金額”的中位數(shù)。用函數(shù)median計(jì)算中位數(shù)Me,如圖4-52所示。圖4-51有異常數(shù)據(jù)的散點(diǎn)圖圖4-52用函數(shù)median計(jì)算中位數(shù)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第47頁(yè)。2.用函數(shù)mode計(jì)算眾數(shù)Mo例2:打開(kāi)文件“描述性統(tǒng)計(jì).xlsx”的“捐款資料”工作表,計(jì)算“捐款金額”的眾數(shù),如圖4-53所示。圖4-53用函數(shù)mode計(jì)算眾數(shù)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第48頁(yè)。4.2.3極差、方差、標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù)有一組數(shù)據(jù):x1、x2、x3、x4、…①極差=最大值-最小值;②方差= ;③標(biāo)準(zhǔn)差= ;④標(biāo)準(zhǔn)差系數(shù)= 。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第49頁(yè)。這幾個(gè)指標(biāo)用于描述數(shù)據(jù)的差異程度和離散程度。指標(biāo)值越大,說(shuō)明數(shù)據(jù)的離散程度越大,即數(shù)據(jù)波動(dòng)幅度大,平均值的代表性越差;指標(biāo)值越小,說(shuō)明數(shù)據(jù)越平穩(wěn),波動(dòng)幅度小,平均值的代表性越好。如果直接從數(shù)學(xué)角度用數(shù)學(xué)公式的方法來(lái)計(jì)算方差和標(biāo)準(zhǔn)差是比較煩瑣的。在Excel中,用函數(shù)計(jì)算要方便得多,如圖4-54~圖4-57所示。圖4-54用函數(shù)max和min的差計(jì)算極值數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第50頁(yè)。圖4-55用函數(shù)var.p計(jì)算方差圖4-56用函數(shù)stdev.p計(jì)算標(biāo)準(zhǔn)差數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第51頁(yè)。①極差R=max()-min();②方差σ2=var.p();③標(biāo)準(zhǔn)差σ=stdev.p();④標(biāo)準(zhǔn)差系數(shù)

。圖4-57計(jì)算標(biāo)準(zhǔn)差系數(shù)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第52頁(yè)。4.2.4利用“數(shù)據(jù)分析”之“描述統(tǒng)計(jì)”功能計(jì)算描述性指標(biāo)例:打開(kāi)文件“描述性統(tǒng)計(jì).xlsx”的“捐款資料”工作表,用“描述統(tǒng)計(jì)”的方法統(tǒng)計(jì)“捐款金額”的各項(xiàng)描述性統(tǒng)計(jì)指標(biāo)。(1)單擊“數(shù)據(jù)”|“數(shù)據(jù)分析”按鈕,打開(kāi)“數(shù)據(jù)分析”對(duì)話框,選擇“描述統(tǒng)計(jì)”功能,單擊“確定”按鈕,如圖4-58所示。圖4-58“數(shù)據(jù)分析”之“描述統(tǒng)計(jì)”數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第53頁(yè)。(2)在“描述統(tǒng)計(jì)”對(duì)話框中設(shè)置輸入?yún)^(qū)域(可選擇整列)、輸出區(qū)域(僅選擇起點(diǎn)),如圖4-59所示。(3)單擊“確定”按鈕,結(jié)果如圖4-60所示。圖4-59描述統(tǒng)計(jì)設(shè)置圖4-60描述統(tǒng)計(jì)結(jié)果數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第54頁(yè)。描述統(tǒng)計(jì)”結(jié)果中其他指標(biāo)的含義或公式如下。①標(biāo)準(zhǔn)誤差:

。②峰度:衡量數(shù)據(jù)離群度的指標(biāo)。③偏度:衡量數(shù)據(jù)偏斜平均數(shù)

的方向和程度。④區(qū)域:極值。⑤求和:標(biāo)志總量。⑥觀測(cè)數(shù):?jiǎn)挝豢偭俊?shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第55頁(yè)。4.3動(dòng)態(tài)數(shù)列的分析與預(yù)測(cè)動(dòng)態(tài)數(shù)列是指將總體在不同時(shí)間上的指標(biāo)數(shù)值按時(shí)間先后排列而成的序列,又叫時(shí)間數(shù)列。為了方便起見(jiàn),動(dòng)態(tài)數(shù)列經(jīng)常以表格的形式展現(xiàn),如表4-4所示。動(dòng)態(tài)數(shù)列有兩個(gè)基本要素:時(shí)間t和水平值a。時(shí)間t0t1t2t3……指標(biāo)數(shù)值(水平值)a0a1a2a3……表4-4動(dòng)態(tài)數(shù)列的形式數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第56頁(yè)。4.3.1動(dòng)態(tài)數(shù)列的速度指標(biāo)動(dòng)態(tài)數(shù)列常用的速度指標(biāo)有發(fā)展速度、總發(fā)展速度、增長(zhǎng)速度、平均發(fā)展速度和平均增長(zhǎng)速度。1.發(fā)展速度研究動(dòng)態(tài)數(shù)列時(shí),如果要將兩個(gè)不同時(shí)期的水平值進(jìn)行對(duì)比,那么分析研究時(shí)期的水平值叫報(bào)告期水平;對(duì)比基礎(chǔ)時(shí)期的水平值叫基期水平。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第57頁(yè)。例1:文件“動(dòng)態(tài)數(shù)列分析.xlsx”的“發(fā)展速度1”工作表中列出某企業(yè)2010—2015年固定資產(chǎn)投資情況如圖4-61所示,請(qǐng)計(jì)算歷年的定基發(fā)展速度、環(huán)比發(fā)展速度。(1)計(jì)算定基發(fā)展速度(2)計(jì)算環(huán)比發(fā)展速度圖4-61某企業(yè)2010—2015年固定資產(chǎn)投資情況數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第58頁(yè)。2.總發(fā)展速度總發(fā)展速度簡(jiǎn)稱總速度。顧名思義,總發(fā)展速度就是一段時(shí)間以來(lái)總的發(fā)展速度,在數(shù)值上應(yīng)等于最終的水平值除以最初的水平值,即

。例2:已知2009—2015年淘寶“雙11”銷量統(tǒng)計(jì)資料如圖4-63所示,請(qǐng)計(jì)算2009—2015年的總發(fā)展速度。數(shù)據(jù)文件為“動(dòng)態(tài)數(shù)列分析.xlsx”的“發(fā)展速度2”工作表。圖4-63淘寶“雙11”銷量統(tǒng)計(jì)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第59頁(yè)。例3:已知某公司2006—2015年的發(fā)展速度如圖4-64所示,請(qǐng)計(jì)算10年內(nèi)的總發(fā)展速度。數(shù)據(jù)文件為“動(dòng)態(tài)數(shù)列分析.xlsx”的“發(fā)展速度3”工作表。圖4-64某公司2006—2015年的發(fā)展速度數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第60頁(yè)。該例可用公式“=product(B3:K3)”計(jì)算10年的總發(fā)展速度,如圖4-65所示。所以在例1中,2015年的定基發(fā)展速度H4就是總發(fā)展速度,當(dāng)然也可以用公式“=product(D5:H5)”計(jì)算總發(fā)展速度,如圖4-66所示。圖4-65用product函數(shù)計(jì)算總發(fā)展速度圖4-66計(jì)算總發(fā)展速度數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第61頁(yè)。3.平均發(fā)展速度平均發(fā)展速度

。數(shù)學(xué)上,我們把n個(gè)數(shù)的乘積開(kāi)n次方根,叫作這n個(gè)數(shù)的幾何平均數(shù)。所以,平均發(fā)展速度=環(huán)比發(fā)展速度的幾何平均數(shù)。在Excel中,有一個(gè)函數(shù)可以計(jì)算n個(gè)數(shù)的幾何平均數(shù),就是geomean函數(shù),即平均發(fā)展速度=geomean(環(huán)比發(fā)展速度)。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第62頁(yè)。在Excel中,用公式“=(B5)^(1/6)”或=power(B5,1/6)計(jì)算平均發(fā)展速度,如圖4-67和圖4-68所示。圖4-67計(jì)算平均發(fā)展速度(一)圖4-68計(jì)算平均發(fā)展速度(二)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第63頁(yè)。例3中的平均發(fā)展速度計(jì)算公式則應(yīng)該用“=geomean(B3:K3)”,如圖4-69所示。圖4-69計(jì)算平均發(fā)展速度(三)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第64頁(yè)。4.增長(zhǎng)速度增長(zhǎng)速度==發(fā)展速度-1。根據(jù)基期的不同,增長(zhǎng)速度也分定基、環(huán)比、同比3種。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第65頁(yè)。例4:2014年1月至2015年12月京東商城空氣凈化器的銷量統(tǒng)計(jì)資料(銷量前十大品牌TPO10)如圖4-70所示,請(qǐng)計(jì)算每個(gè)月的“發(fā)展速度”和“增長(zhǎng)速度”。數(shù)據(jù)文件為“動(dòng)態(tài)數(shù)列分析.xlsx”的“發(fā)展速度4”工作表。圖4-70京東商城空氣凈化器的銷量統(tǒng)計(jì)資料圖4-71京東商城空氣凈化器銷售量的速度指標(biāo)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第66頁(yè)。例5:已知某企業(yè)的經(jīng)濟(jì)效益連年增長(zhǎng),2013年是2012年的110%,2014年是2013年的120%,2015年是2014年的115%。計(jì)算3年來(lái)年平均增長(zhǎng)速度是多少。數(shù)據(jù)文件為“動(dòng)態(tài)數(shù)列分析.xlsx”的“平均增長(zhǎng)速度1”工作表。例6:已知某公司2011—2015年固定資產(chǎn)投資額環(huán)比增長(zhǎng)速度資料表如圖4-72所示,請(qǐng)計(jì)算5年的平均增長(zhǎng)速度。數(shù)據(jù)文件為“動(dòng)態(tài)數(shù)列分析.xlsx”的“平均增長(zhǎng)速度2”工作表。圖4-72某公司2011—2015年固定資產(chǎn)投資額環(huán)比增長(zhǎng)速度資料表數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第67頁(yè)。正確解法是:先利用環(huán)比增長(zhǎng)速度計(jì)算環(huán)比發(fā)展速度,再利用環(huán)比發(fā)展速度計(jì)算平均發(fā)展速度,再用平均發(fā)展速度減1即可,如圖4-73所示。圖4-73計(jì)算環(huán)比增長(zhǎng)速度數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第68頁(yè)。4.3.2同期平均法預(yù)測(cè)總體隨著季節(jié)的變動(dòng)而引起的比較有規(guī)則的波動(dòng)叫作季節(jié)變動(dòng)。除了由季節(jié)變動(dòng)引起的數(shù)據(jù)波動(dòng)外,還有可能由月份引起的數(shù)據(jù)波動(dòng),對(duì)于這類數(shù)據(jù)的分析,我們常用同期平均法。同期平均法就是先根據(jù)動(dòng)態(tài)數(shù)列求出同期(季或月)平均數(shù),再計(jì)算各期的季節(jié)指數(shù),最后根據(jù)季節(jié)指數(shù)預(yù)測(cè)下一期的數(shù)據(jù)。具體的計(jì)算過(guò)程為:(1)先根據(jù)歷年(3年以上)資料求出同期(季或月)平均數(shù);(2)求季節(jié)指數(shù)=×100%;(3)計(jì)算各期的預(yù)測(cè)值=上年的平均水平×各期的季節(jié)指數(shù)。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第69頁(yè)。例:某商場(chǎng)2012—2015年4年每月的空調(diào)銷售量資料如圖4-74所示,用同期平均法計(jì)算各月的季節(jié)指數(shù),并預(yù)測(cè)2016年每月的銷售量。數(shù)據(jù)文件為“動(dòng)態(tài)數(shù)列分析.xlsx”中的“同期平均法”工作表。圖4-74某商場(chǎng)空調(diào)銷售量資料數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第70頁(yè)。4.3.3移動(dòng)平均趨勢(shì)剔除法預(yù)測(cè)如果動(dòng)態(tài)數(shù)列的發(fā)展水平既有規(guī)律性的季節(jié)變化,又有明顯的長(zhǎng)期趨勢(shì),最好采用移動(dòng)平均趨勢(shì)剔除法,排除不規(guī)則變動(dòng)等因素的影響,使數(shù)據(jù)分析更合理、更準(zhǔn)確。例:某企業(yè)5年來(lái)各季節(jié)銷售資料如圖4-79所示,用移動(dòng)平均剔除法計(jì)算季節(jié)指數(shù),并根據(jù)季節(jié)指數(shù)預(yù)測(cè)2016年各季度的銷量。數(shù)據(jù)文件為“動(dòng)態(tài)數(shù)列分析.xlsx”的“趨勢(shì)剔除法”工作表。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第71頁(yè)。圖4-79各季節(jié)的銷售資料圖4-80銷量散點(diǎn)圖數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第72頁(yè)。圖4-81計(jì)算四項(xiàng)移動(dòng)平均數(shù)及其正位平均數(shù)圖4-82計(jì)算趨勢(shì)值數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第73頁(yè)。圖4-83計(jì)算季平均數(shù)圖4-84計(jì)算總平均數(shù)和季節(jié)指數(shù)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第74頁(yè)。圖4-85預(yù)測(cè)結(jié)果數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第75頁(yè)。4.4相關(guān)分析與回歸分析4.4.1相關(guān)分析相關(guān)分析是研究?jī)蓚€(gè)或兩個(gè)以上變量之間相關(guān)程度及大小的一種統(tǒng)計(jì)方法,其目的是揭示現(xiàn)象之間是否存在相關(guān)關(guān)系,并確定相關(guān)關(guān)系的性質(zhì)、方向和密切程度。1.相關(guān)圖對(duì)兩個(gè)變量進(jìn)行相關(guān)分析,最常見(jiàn)的方法就是以這兩個(gè)變量的值為坐標(biāo)(x,y),在直角坐標(biāo)系中繪制成散點(diǎn)圖,此時(shí)的散點(diǎn)圖亦稱“相關(guān)圖”,如圖4-86所示。圖4-86相關(guān)圖(散點(diǎn)圖)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第76頁(yè)。利用相關(guān)圖,可以直觀、形象地表現(xiàn)變量之間的相互關(guān)系。(1)散點(diǎn)分布大致呈一條直線,稱二者線性相關(guān),如圖4-87所示。(2)散點(diǎn)分布大致呈一條曲線,稱二者曲線相關(guān),如圖4-88所示。(3)散點(diǎn)分布雜亂無(wú)章,稱二者不相關(guān),如圖4-89所示。(4)當(dāng)一個(gè)變量增加,另一個(gè)變量也呈增加的態(tài)勢(shì),稱二者正相關(guān),如圖4-87(a)所示。(5)當(dāng)一個(gè)變量增加,另一個(gè)變量反而呈減少的態(tài)勢(shì),則稱二者負(fù)相關(guān),如圖4-87(b)所示。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第77頁(yè)。圖4-87線性相關(guān)圖4-88曲線相關(guān)圖4-89不相關(guān)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第78頁(yè)。2.線性相關(guān)與相關(guān)系數(shù)當(dāng)兩個(gè)變量線性相關(guān)時(shí),用相關(guān)系數(shù)r表示兩個(gè)變量x和y之間的相關(guān)方向和密切程度。在數(shù)學(xué)上,相關(guān)系數(shù)相關(guān)系數(shù)的取值范圍為|r|≤1。|r|越接近于1,說(shuō)明散點(diǎn)圖上的點(diǎn)越集中在某一直線附近,兩個(gè)變量之間的直線相關(guān)密切程度就越高;|r|越接近于0,則直線相關(guān)密切程度就越低。

數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第79頁(yè)。在實(shí)際應(yīng)用中,利用相關(guān)系數(shù)來(lái)判斷直線相關(guān)密切程度的一般標(biāo)準(zhǔn)為:

當(dāng)|r|=0時(shí),說(shuō)明兩個(gè)變量之間不存在直線相關(guān)關(guān)系;

當(dāng)0<|r|≤0.3時(shí),認(rèn)為兩個(gè)變量之間存在微弱直線相關(guān);

當(dāng)0.3<|r|≤0.5時(shí),認(rèn)為兩個(gè)變量之間存在低度直線相關(guān);

當(dāng)0.5<|r|≤0.8時(shí),認(rèn)為兩個(gè)變量之間存在顯著直線相關(guān);

當(dāng)0.8<|r|<1時(shí),認(rèn)為兩個(gè)變量之間存在高度直線相關(guān);

當(dāng)|r|=1時(shí),說(shuō)明兩個(gè)變量之間存在完全直線相關(guān)關(guān)系,即成直線函數(shù)關(guān)系;

當(dāng)相關(guān)系數(shù)r很小甚至為零時(shí),只能說(shuō)明變量之間不存在直線相關(guān),而不能說(shuō)明它們不存在相關(guān)關(guān)系。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第80頁(yè)。3.相關(guān)系數(shù)的計(jì)算在Excel中,有兩種常用方法可以計(jì)算相關(guān)系數(shù),那就是correl函數(shù)和“數(shù)據(jù)分析”之“相關(guān)系數(shù)”。(1)correl函數(shù)例1:調(diào)查××小區(qū)超市的年銷售額(百萬(wàn)元)與小區(qū)常住人口數(shù)(萬(wàn)人)的數(shù)據(jù)資料如圖4-90所示,請(qǐng)分析超市的年銷售額與小區(qū)常住人口數(shù)的相關(guān)關(guān)系。數(shù)據(jù)文件見(jiàn)工作簿“相關(guān)與回歸分析.xlsx”的“相關(guān)系數(shù)1”工作表。(2)“數(shù)據(jù)分析”之“相關(guān)系數(shù)”例2:利用“數(shù)據(jù)分析”之“相關(guān)系數(shù)”來(lái)計(jì)算例1中“年銷售額”與“小區(qū)常住人口數(shù)”的相關(guān)系數(shù)。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第81頁(yè)。圖4-90超市年銷售額與小區(qū)人數(shù)圖4-91correl函數(shù)參數(shù)設(shè)置數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第82頁(yè)。例3:調(diào)查××市多家大型超市的月售量(百萬(wàn)元)與超市面積大?。ò倨椒矫祝⒈驹碌拇黉N費(fèi)用(萬(wàn)元)、所在地理位置(1表示市區(qū)一類地段用、2表示市區(qū)二類地段用、3表示市區(qū)三類地段)的數(shù)據(jù)如圖4-95所示,請(qǐng)計(jì)算各變量之間的相關(guān)系數(shù)。數(shù)據(jù)文件為工作簿“相關(guān)與回歸分析.xlsx”中“相關(guān)系數(shù)2”工作表。圖4-95超市月銷售額調(diào)查表數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第83頁(yè)。圖4-96設(shè)置“相關(guān)系數(shù)”對(duì)話框圖4-97銷售額、賣場(chǎng)面積、月促銷費(fèi)、地理位置相關(guān)系數(shù)表數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第84頁(yè)。4.4.2回歸分析回歸分析是確定兩個(gè)或兩個(gè)以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法?;貧w分析按照涉及的變量多少,分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關(guān)系類型,可分為線性回歸分析和非線性回歸分析。1.最小二乘法原理回歸分析法的基本思路是:當(dāng)數(shù)據(jù)分布在一條直線(或曲線)附近時(shí),找出一條最佳的直線(或曲線)來(lái)模擬它。當(dāng)所有點(diǎn)到該直線的豎直距離的平方和∑(y-y′)2最小時(shí),得到的直線(或曲線)最佳,如圖4-98所示。這就是最小二乘法原理(二乘就是平方)。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第85頁(yè)。歸根結(jié)底,回歸分析法就是根據(jù)最小二乘法原理,將變量之間的關(guān)系模擬成一個(gè)數(shù)學(xué)方程(也叫回歸方程,或趨勢(shì)線方程),以此來(lái)推斷變量之間的關(guān)系的一種統(tǒng)計(jì)方法,所以回歸分析法也叫數(shù)學(xué)模型法。圖4-98最小二乘法原理數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第86頁(yè)。2.決定系數(shù)當(dāng)變量之間的關(guān)系可以用一個(gè)數(shù)學(xué)模型來(lái)模擬時(shí),我們用決定系數(shù)(R2)判定數(shù)學(xué)模型擬合效果的好壞。在數(shù)學(xué)上,決定系數(shù)

(y是實(shí)際值,y′是模擬值)。決定系數(shù)R2越接近于1,說(shuō)明數(shù)學(xué)模型的模擬效果越好。對(duì)于一元線性回歸來(lái)說(shuō),r2=R2。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第87頁(yè)。3.利用Excel回歸分析工具進(jìn)行回歸分析(1)一元線性回歸如果在回歸分析中只包括一個(gè)因變量和一個(gè)自變量,且二者的關(guān)系可用函數(shù)y=kx+b來(lái)模擬,這種回歸分析稱為一元線性回歸分析。圖4-99“數(shù)據(jù)分析”之“回歸”數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第88頁(yè)。圖4-100回歸設(shè)置圖4-101回歸結(jié)果數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第89頁(yè)?;貧w結(jié)果中第一組數(shù)據(jù)的前3個(gè)數(shù)據(jù)分別為:MultipleR(相關(guān)系數(shù))、RSquare(決定系數(shù))、AdjustedRSquare(校正決定系數(shù)),都用于反映模型的擬合度;第4個(gè)數(shù)據(jù)是標(biāo)準(zhǔn)誤差,反映擬合平均數(shù)對(duì)實(shí)際平均數(shù)的變異程度;第5個(gè)數(shù)據(jù)為觀測(cè)值(數(shù)據(jù)的個(gè)數(shù))。第三組數(shù)據(jù)的第1個(gè)數(shù)據(jù)(301.665)是回歸直線的截距b,第2個(gè)數(shù)據(jù)(44.797)也叫回歸系數(shù),其實(shí)就是回歸直線的斜率k。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第90頁(yè)。(2)多元線性回歸如果在回歸分析中包括一個(gè)因變量和多個(gè)自變量,且因變量和自變量的關(guān)系可用函數(shù)y=k1x1+k2x2+…+knxn+b來(lái)模擬,這種回歸分析稱為多元線性回歸分析。事實(shí)上,一種現(xiàn)象常常與多個(gè)因素相關(guān),所以,由多個(gè)自變量的最優(yōu)組合來(lái)估計(jì)和預(yù)測(cè)因變量,比只用一個(gè)自變量進(jìn)行估計(jì)和預(yù)測(cè)更有效、更有實(shí)際意義。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第91頁(yè)。例2:用回歸分析法分析上一小節(jié)例3中超市的銷量與超市的面積大小、促銷費(fèi)用、所在地理位置的關(guān)系,并根據(jù)回歸方程預(yù)測(cè)一家在二類地段、面積為1000平方米、月促銷費(fèi)5萬(wàn)元的超市月銷售額將會(huì)是多少。數(shù)據(jù)文件為工作簿“相關(guān)與回歸分析.xlsx”中“多元線性回歸”工作表。圖4-102回歸設(shè)置圖4-103回歸結(jié)果數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第92頁(yè)。4.利用Excel散點(diǎn)圖和趨勢(shì)線進(jìn)行回歸分析對(duì)于初學(xué)者,我們還是建議大家用“先插入散點(diǎn)圖,再添加趨勢(shì)線”的方法求趨勢(shì)線方程、相關(guān)系數(shù)和決定系數(shù),最后根據(jù)決定系數(shù)的大小判定模擬效果的好壞,并根據(jù)趨勢(shì)線方程做數(shù)據(jù)預(yù)測(cè)。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第93頁(yè)。例3:利用散點(diǎn)圖求上一小節(jié)例1中“超市年銷售額”和“小區(qū)人數(shù)”的回歸方程,“超市年銷售額”為因變量y,“小區(qū)人數(shù)”為自變量x。數(shù)據(jù)文件為工作簿“相關(guān)與回歸分析.xlsx”中的“直線模型”工作表。(1)插入散點(diǎn)圖。(2)添加趨勢(shì)線。圖4-104散點(diǎn)圖圖4-105編輯數(shù)據(jù)源數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第94頁(yè)。圖4-106修改數(shù)據(jù)系列圖4-107修改后的散點(diǎn)圖數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第95頁(yè)。圖4-108添加趨勢(shì)線圖4-109設(shè)置趨勢(shì)線格式圖4-110趨勢(shì)線方程(直線)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第96頁(yè)。例4:將例3中的直線模型改成指數(shù)模型,操作如下。圖4-111修改趨勢(shì)線類型圖4-112趨勢(shì)線方程(指數(shù)函數(shù))數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第97頁(yè)。例5:已知2009—2015年淘寶“雙11”當(dāng)天銷量統(tǒng)計(jì)如圖4-113所示,請(qǐng)利用散點(diǎn)圖模擬淘寶“雙11”的銷量變化規(guī)律,并預(yù)測(cè)2016年的銷量。數(shù)據(jù)文件為“相關(guān)與回歸分析.xlsx”的“拋物線模型”工作表。圖4-113淘寶“雙11”歷年銷量圖4-114淘寶銷量散點(diǎn)圖數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第98頁(yè)。利用回歸分析工具進(jìn)行線性回歸的優(yōu)缺點(diǎn)如下。①優(yōu)點(diǎn):可以進(jìn)行一元線性回歸,也可以進(jìn)行多元線性回歸。②缺點(diǎn):只能進(jìn)行線性回歸,不能直接進(jìn)行非線性回歸。利用散點(diǎn)圖和趨勢(shì)線進(jìn)行回歸分析的優(yōu)缺點(diǎn)如下。①優(yōu)點(diǎn):不僅能進(jìn)行線性回歸,還能進(jìn)行非線性回歸。②缺點(diǎn):只能進(jìn)行一元回歸,不能進(jìn)行多元回歸。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第99頁(yè)。圖4-115設(shè)置趨勢(shì)線格式圖4-116趨勢(shì)線方程(拋物線)數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第100頁(yè)。4.5綜合評(píng)價(jià)分析法綜合評(píng)價(jià)分析法是指運(yùn)用多個(gè)指標(biāo)對(duì)多個(gè)參評(píng)對(duì)象進(jìn)行綜合評(píng)價(jià)的方法。綜合評(píng)價(jià)分析法的基本思想是將多個(gè)指標(biāo)轉(zhuǎn)化為一個(gè)能夠反映綜合情況的指標(biāo)來(lái)進(jìn)行分析評(píng)價(jià)。例1:某學(xué)生某課程的平時(shí)成績(jī)?yōu)?0分,期中考試成績(jī)?yōu)?0分,期末考試成績(jī)?yōu)?0分,那么任課老師最后就會(huì)根據(jù)學(xué)校的一貫要求,綜合考慮該學(xué)生的這3個(gè)成績(jī),給出一個(gè)總評(píng)成績(jī)90×20%+70×30%+80×50%=79(分),這就是綜合評(píng)價(jià)分析法的具體應(yīng)用。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第101頁(yè)。例2:某學(xué)校招聘3名數(shù)學(xué)老師,現(xiàn)有7名應(yīng)聘者經(jīng)過(guò)筆試、試講、面試3個(gè)環(huán)節(jié),考核成績(jī)?nèi)鐖D4-117所示。若筆試成績(jī)、試講成績(jī)、面試成績(jī)的權(quán)重分別為40%、30%、20%。求各位應(yīng)聘者的綜合評(píng)價(jià)得分,并求各應(yīng)聘者的綜合排名,根據(jù)排名錄取前3名。數(shù)據(jù)文件為工作簿“綜合評(píng)價(jià)分析.xlsx”中的“綜合評(píng)價(jià)1”工作表。圖4-117應(yīng)聘者考核成績(jī)圖4-118計(jì)算綜合得分和綜合排名數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第102頁(yè)。例3:在4.2例3中,我們?cè)?jīng)學(xué)習(xí)過(guò)如何計(jì)算高級(jí)程序員張三的各項(xiàng)素養(yǎng)的平均得分。現(xiàn)在已知該IT企業(yè)所有高級(jí)程序員的各項(xiàng)素養(yǎng)平均得分如圖4-119所示,請(qǐng)用綜合評(píng)價(jià)分析法計(jì)算各程序員的綜合得分(各項(xiàng)目的權(quán)重分別為15%、5%、20%、10%、20%、10%、5%、10%、5%),并根據(jù)綜合得分進(jìn)行排序。數(shù)據(jù)文件為工作簿“綜合評(píng)價(jià)分析.xlsx”中的“綜合評(píng)價(jià)2”工作表。圖4-119所有高級(jí)程序員的各項(xiàng)素養(yǎng)平均得分?jǐn)?shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第103頁(yè)。4.5.2權(quán)重的確定在應(yīng)用綜合評(píng)價(jià)分析法中,為了保證評(píng)價(jià)的科學(xué)性,權(quán)重的確定必須合理。一般來(lái)說(shuō),權(quán)重的確定可以由專家直接指定,也就是說(shuō)權(quán)重是給定的,如上述例1、例2、例3。如果權(quán)重沒(méi)有給定,可以取某一相關(guān)指標(biāo)所占的比重作為權(quán)重。例1:某餐飲店本月擬對(duì)店內(nèi)所有的菜品(50個(gè))進(jìn)行價(jià)格調(diào)整,部分?jǐn)?shù)據(jù)的截圖如圖4-120所示,請(qǐng)運(yùn)用綜合評(píng)價(jià)法對(duì)該餐飲店的價(jià)格與上月相比的變化做綜合分析。數(shù)據(jù)文件為工作簿“綜合評(píng)價(jià)分析.xlsx”中的“綜合評(píng)價(jià)3”工作表。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第104頁(yè)。圖4-120部分菜價(jià)調(diào)整情況圖4-121價(jià)格漲幅數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第105頁(yè)。圖4-122銷售額占比(權(quán)重)計(jì)算圖4-123綜合漲幅數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第106頁(yè)。4.5.3數(shù)據(jù)的標(biāo)準(zhǔn)化處理當(dāng)我們處理的數(shù)據(jù)性質(zhì)或單位不一致時(shí),就要將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,去除數(shù)據(jù)的單位限制,將其轉(zhuǎn)化為無(wú)量綱的純數(shù)值,便于不同單位或量級(jí)的指標(biāo)能夠進(jìn)行比較和加權(quán)。標(biāo)準(zhǔn)化處理最典型的就是0-1標(biāo)準(zhǔn)法和Z標(biāo)準(zhǔn)法。在此介紹0-1標(biāo)準(zhǔn)化法。0-1標(biāo)準(zhǔn)化也叫離差標(biāo)準(zhǔn)化,是對(duì)原始數(shù)據(jù)進(jìn)行線性變換,使結(jié)果落到[0,1]區(qū)間。做0-1標(biāo)準(zhǔn)化法時(shí),對(duì)一列數(shù)據(jù)中某一個(gè)數(shù)據(jù)標(biāo)準(zhǔn)化的公式為:標(biāo)準(zhǔn)化值=,標(biāo)準(zhǔn)化處理使用的公式和效果如圖4-136所示。數(shù)據(jù)分析基礎(chǔ)課程-第4章--數(shù)據(jù)的分析全文共121頁(yè),當(dāng)前為第107頁(yè)。圖4-136數(shù)據(jù)0-1標(biāo)準(zhǔn)化處理數(shù)據(jù)分析基礎(chǔ)課程

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論