數(shù)據(jù)可視化 第2版 課件 項目6、7 高級可視化分析、統(tǒng)計分析_第1頁
數(shù)據(jù)可視化 第2版 課件 項目6、7 高級可視化分析、統(tǒng)計分析_第2頁
數(shù)據(jù)可視化 第2版 課件 項目6、7 高級可視化分析、統(tǒng)計分析_第3頁
數(shù)據(jù)可視化 第2版 課件 項目6、7 高級可視化分析、統(tǒng)計分析_第4頁
數(shù)據(jù)可視化 第2版 課件 項目6、7 高級可視化分析、統(tǒng)計分析_第5頁
已閱讀5頁,還剩107頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

項目六高級可視化分析目錄高級可視化分析任務(wù)一帕累托圖任務(wù)二盒須圖任務(wù)三瀑布圖任務(wù)目標(biāo):制作企業(yè)采購金額帕累托圖相關(guān)知識:帕累托(Pareto)圖與帕累托法則密切相關(guān)。帕累托法則是19世紀(jì)末20世紀(jì)初意大利經(jīng)濟學(xué)家帕累托發(fā)現(xiàn)的。他認為:在任何一組對象中,最重要的只占其中一小部分,約20%,其余80%盡管是多數(shù),卻是次要的,因此又稱二八定律。在市場、營銷、管理等領(lǐng)域,帕累托法則所反映的現(xiàn)象廣泛存在。帕累托圖是“揭示”帕累托法則的有力工具,以“數(shù)量占比”為橫軸,“重要性占比”為縱軸,直觀的顯示出“兩個占比”的數(shù)量關(guān)系。任務(wù)分析:原始數(shù)據(jù)為某網(wǎng)店過去一年的客戶消費金額數(shù)據(jù)。為了顯示該網(wǎng)店客戶消費金額的集中度,制作帕累托圖。以反映累計金額的直方圖與累計金額占比的線型圖為基礎(chǔ),通過控件及參考線使得圖形顯示出與累計消費金額占比對應(yīng)的客戶數(shù)量占比。任務(wù)數(shù)據(jù):見《網(wǎng)店銷售數(shù)據(jù)》任務(wù)一帕累托圖步驟2進入工作表,如圖6-2:步驟3修改表名為——帕累托圖,如圖6-3:圖6-2圖6-3任務(wù)一帕累托圖步驟4創(chuàng)建計算字段—消費金額百分比,公式:RUNNING_SUM(sum([累計消費金額]))/TOTAL(sum([累計消費金額])),如圖6-4、6-5:

圖6-4

圖6-5任務(wù)一帕累托圖步驟4將[姓名]拖到列,如圖6-6:步驟5:將[消費金額百分比]拖到行,如圖6-7:圖6-6任務(wù)一帕累托圖步驟6將行區(qū)域[消費金額百分比]的計算依據(jù)設(shè)置為[姓名],如圖6-8:

圖6-8任務(wù)一帕累托圖步驟7設(shè)置視圖尺寸為——適合寬度,如圖6-9:步驟8對列區(qū)域[姓名]設(shè)置排序,如圖6-10:

圖6-9

圖6-10任務(wù)一帕累托圖注:如果已有其他排序,須將原排序清除。點擊[排序]下的[清除排序]即可。步驟9設(shè)置排序條件——降序、累計消費金額、總計。如圖6-11:

圖6-11任務(wù)一帕累托圖步驟10設(shè)置標(biāo)記類型為——線,如圖6-12:步驟11將[累計消費金額]拖到行,如圖6-13:

圖6-12

圖6-13任務(wù)一帕累托圖步驟12調(diào)整[累計消費金額]的標(biāo)記類型為條形圖(注意選擇[累計消費金額]的標(biāo)記類型),如圖6-14:步驟13將[總計(累計消費金額)]設(shè)置——雙軸,如圖6-15:

圖6-14

圖6-15任務(wù)一帕累托圖步驟14調(diào)整圖形顯示順序——將[消費金額百分比]拖到[總計(累計金額)]右側(cè),如圖6-16:步驟15為了更好地表示分布,我們將橫軸轉(zhuǎn)換為客戶總數(shù)量的百分比。創(chuàng)建計算字段—[%客戶],公式—index()/size(),如圖6-17、6-18:

圖6-16

圖6-17,圖6-18任務(wù)一帕累托圖步驟16將創(chuàng)建的字段[%客戶]拖放到列,如圖6-19:

圖6-19任務(wù)一帕累托圖步驟17將列區(qū)域[%客戶]的計算依據(jù)設(shè)置為[姓名],如圖6-20:

圖6-20任務(wù)一帕累托圖步驟18將列區(qū)域的[姓名]拖到標(biāo)記卡上的[全部]頁簽內(nèi)的[詳細信息],如圖6-21:

圖6-21任務(wù)一帕累托圖步驟19右鍵單擊右軸的任意區(qū)域,點選[設(shè)置格式],設(shè)置[軸]中數(shù)字格式為[百分比],小數(shù)位數(shù)為0,如圖6-22、6-23:

圖6-22,圖6-23任務(wù)一帕累托圖注:因為刻度值習(xí)慣上不設(shè)為小數(shù)。步驟20數(shù)字格式設(shè)置完成后,關(guān)閉當(dāng)前的設(shè)置界面,如圖6-24:

圖6-24任務(wù)一帕累托圖注:接下來對橫軸數(shù)字格式及范圍進行調(diào)整。步驟21右鍵單擊橫軸的任意區(qū)域,點選[設(shè)置格式],設(shè)置[軸]中數(shù)字格式為[百分比],小數(shù)位數(shù)為0,如圖6-25、6-26:

圖6-25

圖6-26任務(wù)一帕累托圖注:因為刻度值習(xí)慣上不設(shè)為小數(shù)。步驟22數(shù)字格式設(shè)置完成后,關(guān)閉當(dāng)前的設(shè)置界面,如圖6-27:

圖6-27任務(wù)一帕累托圖步驟23右鍵單擊橫軸任意區(qū)域,對橫軸的范圍進行編輯,見圖6-28:步驟24在編輯框中,點選——固定,并將[固定開始]及[固定結(jié)束]分別設(shè)置為0,1。見圖6-29:

圖6-28

圖6-29任務(wù)一帕累托圖注:因為橫軸指標(biāo)[%客戶]的數(shù)值范圍介于0與1之間。如圖6-30,此時帕累托圖的主體圖形已經(jīng)成型,接下來的工作是參考線及控件的制作。

圖6-30任務(wù)一帕累托圖步驟25創(chuàng)建參數(shù)——總額百分比,并設(shè)置屬性及范圍,如圖6-31、6-32:

圖6-31

圖6-32任務(wù)一帕累托圖注:選擇“范圍”意味著設(shè)置參數(shù)的變化范圍在“最小值”與“最大值”之間?!安介L”為參數(shù)變化的最小單位。步驟26為了讓累計百分比圖的橫軸參考線和縱軸參考線的交點落在累計百分比圖上,需要創(chuàng)建一個新的字段作為橫軸參考線的值的依據(jù)。創(chuàng)建計算字段——[橫軸參考線%],公式:IF[消費金額百分比]<=[總額百分比]THEN[%客戶]ELSENULLEND如圖6-33、6-34圖6-33圖6-34任務(wù)一帕累托圖步驟27為右軸(消費金額百分比)添加參考線,如圖6-35、6-36:

圖6-35

圖6-36任務(wù)一帕累托圖步驟28將[橫軸參考線%]拖到標(biāo)記卡上的[全部]頁簽內(nèi)的詳細信息,如圖6-37:

圖6-37任務(wù)一帕累托圖步驟29為橫軸添加參考線,如圖6-38、6-39:

圖6-38

圖6-39任務(wù)一帕累托圖步驟30右鍵單擊[總額百分比],將[總額百分比]顯示參數(shù)控件,如圖6-40:

圖6-40任務(wù)一帕累托圖效果如圖6-41,在圖像右上區(qū)域出現(xiàn)[總額百分比]控件,可以通過點擊控件的“<”與“>”控制[總額百分比]參數(shù)的大小。箭頭所指的數(shù)字即為當(dāng)前的客戶數(shù)量占比??梢姡杭s70%的客戶貢獻了90%的銷售額。

圖6-41任務(wù)一帕累托圖如圖6-42,如果將[總額百分比]調(diào)整為0.8,則客戶占比約為58%。

圖6-42任務(wù)一帕累托圖任務(wù)目標(biāo):通過圖形展示整體及不同類別訂單的利潤率分布情況。相關(guān)知識:盒須圖又叫箱線圖,因形狀如箱子而得名。盒須圖包含了數(shù)據(jù)的五個統(tǒng)計指標(biāo)——最大值、最小值、中位數(shù)、及上下四分位數(shù)。其中:中位數(shù)是按順序排列的一組數(shù)值中居于中間位置的數(shù)。上四分位數(shù)為該組數(shù)值由小到大排列后第處于75%位置的數(shù),即該分位數(shù)≥數(shù)據(jù)集中%75的個體值。下四分位數(shù)為該組數(shù)值由小到大排列后處于第25%位置的數(shù),即該分位數(shù)≥數(shù)據(jù)集中%25的個體值。通過五個指標(biāo)在數(shù)據(jù)點分布圖中的位置顯示數(shù)據(jù)的分散程度、異常值等。常見于品質(zhì)管理,還可以用于對多組數(shù)據(jù)分布特征的比較。任務(wù)分析:制作訂單利潤率的盒須圖,在此基礎(chǔ)上加入分類字段查看不同產(chǎn)品類別、客戶類別及其交叉類別訂單的利潤率分布情況。任務(wù)數(shù)據(jù):見《家具電商數(shù)據(jù)》任務(wù)二盒須圖步驟1導(dǎo)入數(shù)據(jù),如圖6-43:

圖6-43任務(wù)二盒須圖步驟2進入工作表,如圖6-44:步驟3修改表名為——盒須圖,如圖6-45:

圖6-44

圖6-45任務(wù)二盒須圖步驟4將[利潤率]拖到行(或雙擊[利潤率]),如圖6-46:

圖6-46任務(wù)二盒須圖步驟5依次點選菜單欄的分析—聚和度量,解除聚合狀態(tài),如圖6-47:注:聚合狀態(tài)意味著當(dāng)前視圖顯示所有數(shù)據(jù)的“聚合”值(如總和、均值等匯總性的指標(biāo)值),解除聚合狀態(tài)意味著視圖顯示所有數(shù)據(jù)點的“個體”分布情況。

圖6-47任務(wù)二盒須圖步驟6在右側(cè)的[智能顯示]中點選——盒須圖,如圖6-48:

圖6-48任務(wù)二盒須圖注:此時盒須圖的“初稿”完成,接下來對視圖作必要的調(diào)整與修飾。步驟7交換行列,使得圖形橫向分布,如圖6-49:注:由于視圖的“寬度”大于“高度”,將視圖橫向排布更有利于觀察數(shù)據(jù)點分布。在實務(wù)中可根據(jù)分析者的習(xí)慣自行調(diào)整。步驟8將視圖尺寸設(shè)置為——整個視圖,如圖6-50:

圖6-49

圖6-50任務(wù)二盒須圖步驟9由于初始圖形中的數(shù)據(jù)點較小,可在標(biāo)記卡的[大小]中向右側(cè)移動滑塊將其尺寸適當(dāng)放大,如圖6-51:注:標(biāo)記大小可根據(jù)分析者的習(xí)慣自行調(diào)整。

圖6-51任務(wù)二盒須圖如圖6-52所示,當(dāng)前視圖顯示出所有訂單的利潤率分布情況,但在數(shù)據(jù)點分布較為密集的區(qū)域,存在著大量數(shù)據(jù)點“重合”的情況。從而低估了數(shù)據(jù)點在該區(qū)間段的占比,造成“誤導(dǎo)”。如果能夠?qū)?shù)據(jù)點“上下錯開”則能夠在很大程度上解決這個問題。接下來通過計算字段加以實現(xiàn)。

圖6-52任務(wù)二盒須圖步驟10創(chuàng)建計算字段——分散變量,公式——[銷售額]%40,如圖6-53、6-54:

圖6-53

圖6-54任務(wù)二盒須圖注1:“%”為取余運算。A%B運算結(jié)果為A整除B所得到的余數(shù)。例如:9除以4,商數(shù)為2,余數(shù)為1。注2:公式里的“40”可根據(jù)實際分布情況調(diào)整。該數(shù)值越大,則不同的點分散的范圍越大。注3:分散變量是銷售額取余運算的結(jié)果,這里借助分散變量使得所有點“上下錯開”。步驟11將[分散變量]拖到行,如圖6-55:

圖6-55任務(wù)二盒須圖操作效果如圖6-56所示,可見大部分訂單的利潤率分布在-0.7——0.5之間。-0.7以下的訂單分布較為稀疏。區(qū)間[0,0.5]的數(shù)據(jù)點密度高于[-0.7,0]區(qū)間。從圖中可見中位數(shù)為0.17(需要將鼠標(biāo)懸停在視圖中的“盒須”部分)。基本可以確定該電商平臺整體上是盈利的。

圖6-56任務(wù)二盒須圖注:接下來查看不同類別(含產(chǎn)品類別、客戶類別)的訂單利潤率分布情況。步驟12將[類別]拖到行,如圖6-57:

圖6-57任務(wù)二盒須圖步驟13為了更好的區(qū)分各個類別,將[類別]拖到標(biāo)記卡中的[顏色],如圖5-58:

圖6-58任務(wù)二盒須圖注:[類別]為產(chǎn)品類別。步驟14為了視圖的簡潔,可將視圖中的標(biāo)題[分散變量]刪除,右鍵單擊[分散變量]區(qū)域,點選——編輯軸,在[編輯軸]界面中刪除標(biāo)題“分散變量”,如圖6-59、6-60:

圖6-59

圖6-60任務(wù)二盒須圖操作效果如圖6-61所示,可見視圖被分為三個子圖,從上到下依次為:辦公用品、技術(shù)、家具。分別為三類產(chǎn)品訂單的利潤率盒須圖??梢娹k公用品的虧損訂單占比最高,其次是家具。注意到雖然辦公用品類虧損訂單數(shù)量比較高,但盈利訂單數(shù)量也非常高,辦公用品訂單在盒須圖中的右側(cè)區(qū)域(高利潤率區(qū)域)密度顯著高于其他兩類產(chǎn)品。

圖6-61任務(wù)二盒須圖注:接下來查看不同客戶類別的訂單利潤率分布情況。步驟15分別將標(biāo)記卡及行的[類別]移除,如圖6-62、6-63:

圖6-62

圖6-63任務(wù)二盒須圖步驟16將[細分]拖到行,如圖6-64:

圖6-64任務(wù)二盒須圖注:“細分”為客戶類別。步驟17將[細分]拖到標(biāo)記卡中的[顏色],如圖6-65:

圖6-65任務(wù)二盒須圖操作效果如圖6-66所示,可見視圖被分為三個子圖,從上到下依次為:公司、消費者、小型企業(yè)。分別為三類客戶訂單的利潤率盒須圖??梢娙惪蛻簟昂许殹辈糠值姆植夹螒B(tài)大致相同。利潤率的中位數(shù)也相差不大。小型企業(yè)的高虧損訂單(分布在“稀疏區(qū)域”的訂單)數(shù)量占比最低。

圖6-66任務(wù)二盒須圖注:接下來將[類別](產(chǎn)品類別)也拖入行,查看不同產(chǎn)品/客戶組合類的訂單利潤分布情況。步驟18將[類別]拖到行,如圖6-67:

圖6-67任務(wù)二盒須圖效果如圖6-68所示,可見視圖被分為九個子圖,從上到下依次對應(yīng)辦公用品的三類客戶訂單利潤率箱線圖、技術(shù)的三類客戶訂單利潤率箱線圖、家具的三類客戶訂單利潤率箱線圖。此時可以更為清晰的觀察各個交叉類別的訂單利潤率分布情況??梢?,相同產(chǎn)品類別的箱線圖大體上相差不大。家具類別中,小型企業(yè)相較于公司、消費者,低利潤率訂單占比顯著更低。

圖6-68任務(wù)二盒須圖任務(wù)目標(biāo):制作視圖反映各保險產(chǎn)品盈利情況。相關(guān)知識:瀑布圖是由麥肯錫顧問公司所獨創(chuàng)的圖表類型,采用絕對值與相對值結(jié)合的方式,適用于表達數(shù)個特定數(shù)值之間的數(shù)量變化關(guān)系。瀑布圖外觀與條形圖較為類似。但與條形圖相比,瀑布圖能夠?qū)χ笜?biāo)值較大或者為負的個體予以突出顯示,從而凸顯這類個體對總體的影響,提示問題或機會。任務(wù)分析:原始數(shù)據(jù)為某保險公司意外險部的所有產(chǎn)品的年度利潤。由于不同保險產(chǎn)品的賠付情況不一樣,賠付數(shù)量較多的產(chǎn)品往往出現(xiàn)較大的虧損,反之則虧損較小甚至盈利。本圖的目的是為了展示不同保險產(chǎn)品的盈利情況,并展示部門的整體盈虧狀態(tài)。在瀑布圖中,以條形的長度展示不同產(chǎn)品的盈利(虧損)大小,以不同的顏色展示不同產(chǎn)品的盈虧狀態(tài)。任務(wù)數(shù)據(jù):見《意外險經(jīng)營數(shù)據(jù)》任務(wù)三瀑布圖步驟1導(dǎo)入數(shù)據(jù),如圖6-69:步驟2進入工作表,如圖6-70:

圖6-69

圖6-70任務(wù)三瀑布圖步驟3修改表名為——瀑布圖,如圖6-71:步驟4將[險種]拖到列,如圖6-72:

圖6-71

圖6-72任務(wù)三瀑布圖步驟5將[利潤]拖到行,如圖6-73:

圖6-73任務(wù)三瀑布圖步驟6設(shè)置標(biāo)記類型為——甘特條形圖,如圖6-74:步驟7將[利潤]拖到標(biāo)記卡的[大小],如圖6-75:

圖6-74

圖6-75任務(wù)三瀑布圖步驟8設(shè)置[險種]的排序,如圖6-76、6-77:

圖6-76

圖6-77任務(wù)三瀑布圖步驟9為了顯示合計的利潤金額,點選菜單欄分析—合計—顯示行合計,如圖6-78:

圖6-78任務(wù)三瀑布圖步驟10為了突出顯示盈虧狀態(tài),用不同的顏色區(qū)分贏利與虧損,將[利潤]拖到標(biāo)記卡的[顏色],如圖6-79:

圖6-79任務(wù)三瀑布圖步驟11為便于查看數(shù)值大小,設(shè)置顯示標(biāo)簽,順次點選標(biāo)記卡的[標(biāo)簽]—[顯示標(biāo)記標(biāo)簽],如圖6-80:

圖6-80任務(wù)三瀑布圖效果如圖6-81,此時圖中出現(xiàn)多種顏色。為了簡潔起見,可以對顏色設(shè)置進行調(diào)整。

圖6-81任務(wù)三瀑布圖步驟11依次點選標(biāo)記卡顏色—編輯顏色,如圖6-82:

圖6-82任務(wù)三瀑布圖步驟12在[編輯顏色]框中,點選[色板]中最下面的[自定義發(fā)散],如圖6-83:

圖6-83任務(wù)三瀑布圖注:若選擇“自定義發(fā)散”,則顏色隨著度量值的變化“漸變”。若選擇“自定義連續(xù)”,則顏色隨著度量值的變化而“連續(xù)”變化。步驟13在[編輯顏色]框中,點選——[漸變顏色]、2階,如圖6-84:

圖6-84任務(wù)三瀑布圖注:2階意味著2種顏色,如果需要可以設(shè)置為更多的顏色。步驟14點選[高級]、[中心]、設(shè)置為0。如圖6-85:

圖6-85任務(wù)三瀑布圖注:在[高級]中,可設(shè)置顏色變化的度量范圍及顏色變化的分界值(中心)。在本例中,為了區(qū)分“盈利”與“虧損”,將[中心]設(shè)置為0。意味著利潤大于0與小于0的點分別設(shè)置為不同的顏色。如有需要可以設(shè)置為其他值。步驟15如果需要將盈利與虧損的顏色互換,可以在[編輯顏色]界面中點選——倒序,如圖6-86:

圖6-86任務(wù)三瀑布圖效果如圖6-87,可見,利潤較高的產(chǎn)品為A、C、E,特別是A。在3款虧損產(chǎn)品中,產(chǎn)品B的虧損金額占據(jù)了較大的比重,應(yīng)當(dāng)予以重點關(guān)注。

圖6-87任務(wù)三瀑布圖感謝聆聽項目七統(tǒng)計分析目錄統(tǒng)計分析任務(wù)一相關(guān)分析應(yīng)用實例任務(wù)二回歸分析應(yīng)用實例任務(wù)三時間序列分析應(yīng)用分析任務(wù)目標(biāo):利用圖形分析利潤與研發(fā)投入、管理費用、市場投入之間的關(guān)系。相關(guān)知識:相關(guān)分析是研究兩個或兩個以上變量間的相關(guān)關(guān)系的統(tǒng)計分析方法。例如,商品的價格和銷量之間;廣告投入與銷量之間的關(guān)系等問題。相關(guān)系數(shù)是描述變量間相關(guān)關(guān)系的指標(biāo),通常用字母r來表示。r介于-1到1之間。r=1代表變量間完全正相關(guān),r=-1代表變量間完全負相關(guān),r=0則代表變量間無線性相關(guān)關(guān)系。r越接近1則正相關(guān)性越強,r越接近-1則負相關(guān)性越強。除了直接計算相關(guān)系數(shù)以外,借由散點圖,我們可以大致看出變量之間的相關(guān)關(guān)系類型和相關(guān)強度,理解變量之間的關(guān)系。任務(wù)分析:制作散點圖顯示利潤分別與研發(fā)投入、管理費用及市場投入之間的線性相關(guān)關(guān)系。并分地區(qū)分別查看變量間的相關(guān)關(guān)系。任務(wù)數(shù)據(jù):見《企業(yè)經(jīng)營數(shù)據(jù)》任務(wù)一相關(guān)分析步驟1導(dǎo)入數(shù)據(jù),如圖7-1:圖7-1任務(wù)一相關(guān)分析步驟2進入工作表,如圖7-2:步驟3修改表名為——散點圖,如圖7-3:

圖7-2

圖7-3任務(wù)一相關(guān)分析步驟4分別將[利潤]、[研發(fā)投入]、[管理費用]、[市場投入]拖到列及行,如圖7-4:圖7-4任務(wù)一相關(guān)分析步驟5解除聚合狀態(tài),如圖7-5:

圖7-5任務(wù)一相關(guān)分析效果如圖7-6所示,此時,基于全體數(shù)據(jù)的散點圖已經(jīng)完成,可見共計有16(4ⅹ4)個散點圖。形成一個“矩陣”結(jié)構(gòu)。沿著矩陣對角線(矩陣左上角到右下角)的4個散點圖分別為這4個指標(biāo)“自身與自身”的散點圖,因此呈現(xiàn)出45度直線的形態(tài)。因此,需要重點關(guān)注“對角線”以外的散點圖。注意到關(guān)于“對角線”對稱的兩個散點圖是完全相同,散點圖矩陣關(guān)于“對角線”對稱。

圖7-6任務(wù)一相關(guān)分析為了研究利潤與其余三個指標(biāo)的關(guān)系,觀察第一行除對角線外的三個散點圖(由于對稱性,也可以觀察第一列除對角線外的三個散點圖)。可以發(fā)現(xiàn):利潤與市場投入、研發(fā)投入之間存在線性相關(guān)關(guān)系,且為正相關(guān),即這兩項投入越高,利潤越高。但利潤與管理費用之間則基本不存在線性關(guān)系,也即利潤大小與管理費用之間線性無關(guān)。步驟6為了觀察不同地區(qū)指標(biāo)之間的關(guān)系,將[地區(qū)]拖到[篩選器],如圖7-7:

圖7-7任務(wù)一相關(guān)分析步驟7在篩選器中,可分別選擇不同的地區(qū),觀察不同地區(qū)的散點圖,如圖7-8所示。

圖7-8任務(wù)一相關(guān)分析步驟8在篩選器中,選擇California,將得到下圖7-9:

圖7-9任務(wù)一相關(guān)分析步驟9為了便于使用篩選器,顯示篩選器,如圖7-10:

圖7-10任務(wù)一相關(guān)分析效果如圖7-11,在視圖右上區(qū)域?qū)a(chǎn)生一個篩選器控件,可通過點擊進行選擇或取消選擇。

圖7-11任務(wù)一相關(guān)分析步驟10分別選擇Florida、NewYork,得到圖7-12、7-13:由以上三圖可見,三個地區(qū)的分布情況基本相同。但在NewYork,利潤與管理費用之間存在著較弱的正相關(guān)關(guān)系。

圖7-12

圖7-13任務(wù)一相關(guān)分析任務(wù)目標(biāo):利用回歸分析分析收入與工齡的關(guān)系相關(guān)知識:回歸分析指的是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法?;貧w分析按照涉及的變量的多少,分為一元回歸和多元回歸分析;按照自變量和因變量之間的關(guān)系類型,可分為線性回歸分析和非線性回歸分析。其中,線性回歸分析是應(yīng)用最為廣泛的回歸分析方法。以一元線性回歸為例,假設(shè)應(yīng)變量y與自變量x之間的關(guān)系可用:y=a*x+b+e表示,其中e為誤差項。基于x與y的值,通過最小二乘法即可計算出回歸方程的系數(shù)a與b。從而得到回歸方程。任務(wù)分析:制作散點圖顯示變量間的相關(guān)關(guān)系,顯示趨勢線及描述趨勢模型(回歸方程)。任務(wù)數(shù)據(jù):見《收入數(shù)據(jù)》任務(wù)二回歸分析步驟1導(dǎo)入數(shù)據(jù),如圖7-14:

圖7-14任務(wù)二回歸分析步驟2進入工作表,如圖7-15:步驟3修改表名為——回歸分析,如圖7-16:

圖7-15

圖7-16任務(wù)二回歸分析步驟4分別將[工齡]、[收入]拖到列及行,如圖7-17:

圖7-17任務(wù)二回歸分析步驟5解除聚合狀態(tài),如圖7-18:步驟6在圖中任意位置點擊右鍵—趨勢線—顯示趨勢線,將回歸直線顯示出來,如圖7-19:

圖7-18

圖7-19任務(wù)二回歸分析如圖7-20所示。此時將鼠標(biāo)置于趨勢線上方,即可顯示回歸直線的方程,R平方值及P值。

圖7-20任務(wù)二回歸分析步驟7右鍵單擊趨勢線,點擊[描述趨勢模型],即可得到回歸方程的具體信息。如圖7-21:

圖7-21任務(wù)二回歸分析效果如圖7-22所示。注:特別關(guān)注R平方值及p值,前者代表該回歸方程所解釋的變量的變化在總體變化中的“比例”,介于0到1之間。R平方值越高則方程的解釋能力越高,兩個變量的相關(guān)程度越高。后者為回歸方程整體顯著情況的假設(shè)檢驗結(jié)果,該值越小,則線性關(guān)系越顯著。一般該值在0.05以下即可認定方程整體顯著。

圖7-22任務(wù)二回歸分析任務(wù)目標(biāo):基于歷史數(shù)據(jù)預(yù)測某國際電商平臺未來一段時間的訂單數(shù)量及銷售額。相關(guān)知識:時間序列,也叫時間數(shù)列或動態(tài)數(shù)列。它是將某種統(tǒng)計指標(biāo)的數(shù)值,按時間先后順序排列所形成的數(shù)列。時間序列預(yù)測法就是通過編制和分析時間序列,根據(jù)時間序列所反映出來的發(fā)展過程、方向和趨勢,進行類推或延伸,借以預(yù)測下一期間或以后若干期間內(nèi)可能達到的水平。其內(nèi)容包括:收集與整理某種指標(biāo)的歷史資料;排成數(shù)列;分析時間數(shù)列,從中尋找其變化規(guī)律,得出一定的模式;以此模式去預(yù)測該指標(biāo)未來的變化趨勢。任務(wù)分析:使用時間序列分析對某國際電商平臺的訂單數(shù)量及銷售額進行外推預(yù)測,外推的期限為4周。任務(wù)數(shù)據(jù):見《國際電商數(shù)據(jù)》任務(wù)三時間序列分析步驟1導(dǎo)入數(shù)據(jù),如圖7-23:

圖7-23任務(wù)三時間序列分析步驟2進入工作表,如圖7-24:步驟3修改表名為——訂單數(shù)量預(yù)測,如圖7-25:

圖7-24

圖7-25任務(wù)三時間序列分析步驟4將[訂單日期]拖到列,如圖7-26:步驟5將日期格式設(shè)置為[周數(shù)],如圖7-27:

圖7-26

圖7-27任務(wù)三時間序列分析步驟7將[訂單號碼]的度量方式設(shè)置為——計數(shù)(不同),如圖7-29:

圖7-29任務(wù)三時間序列分析注:在原始數(shù)據(jù)中,每一行對應(yīng)某一訂單下的同種商品,存在多行對應(yīng)同一訂單號的情況。在計算訂單數(shù)量時需要采用“計數(shù)(不同)”的方式以確保不重復(fù)計數(shù)。步驟8順次點選菜單欄分析—預(yù)測—顯示預(yù)測,顯示初始的預(yù)測結(jié)果,如圖7-30:

圖7-30任務(wù)三時間序列分析效果如圖7-31所示,表現(xiàn)為一條水平的直線(即圖中藍色粗體線段)。同時給出預(yù)測區(qū)間的上限及下限。隨著預(yù)測期間的推移,區(qū)間上限與下限的距離也會逐漸增大。預(yù)測結(jié)果的不確定性也變得更高。

圖7-31任務(wù)三時間序列分析注:此時得到的初始預(yù)測結(jié)果僅僅是預(yù)測期間前若干期的(指標(biāo))簡單平均值,是一個常值。往往并不符合實際。為了得到更加可靠的結(jié)果,需要對預(yù)測選項進行調(diào)整。步驟9在視圖區(qū)右鍵單擊任意區(qū)域,順次點選預(yù)測—預(yù)測選項,如圖7-32:

圖7-32任務(wù)三時間序列分析步驟10如圖所示設(shè)置預(yù)測選項。將[預(yù)測長度]設(shè)置為—精確、4周,將[忽略最后]設(shè)置為0,在[預(yù)測模型]處選擇—自定義,在[趨勢]處選擇—累加,在[季節(jié)]處選擇—累加,如圖7-33:

圖7-33

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論