Python數(shù)據(jù)可視化(微課版)PPT完整全套教學(xué)課件_第1頁
Python數(shù)據(jù)可視化(微課版)PPT完整全套教學(xué)課件_第2頁
Python數(shù)據(jù)可視化(微課版)PPT完整全套教學(xué)課件_第3頁
Python數(shù)據(jù)可視化(微課版)PPT完整全套教學(xué)課件_第4頁
Python數(shù)據(jù)可視化(微課版)PPT完整全套教學(xué)課件_第5頁
已閱讀5頁,還剩231頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

Python數(shù)據(jù)可視化分析

與案例實(shí)戰(zhàn)本書目錄第1章數(shù)據(jù)可視化概述第2章Python數(shù)據(jù)可視化庫第3章時序數(shù)據(jù)的可視化第4章金融數(shù)據(jù)的可視化第5章空間數(shù)據(jù)的可視化第6章地理數(shù)據(jù)的可視化第7章層次數(shù)據(jù)的可視化第8章網(wǎng)絡(luò)數(shù)據(jù)的可視化第9章多元數(shù)據(jù)的可視化第10章文本數(shù)據(jù)的可視化第11章我國人口現(xiàn)狀及趨勢分析第12章社交電商營銷分析第1章數(shù)據(jù)可視化概述1數(shù)據(jù)可視化實(shí)施目錄數(shù)據(jù)可視化基礎(chǔ)2數(shù)據(jù)可視化圖表3數(shù)據(jù)是指對客觀事件進(jìn)行記錄并可以鑒別的符號,是對客觀事物的性質(zhì)、狀態(tài)以及相互關(guān)系等進(jìn)行記載的物理符號或這些物理符號的組合。在數(shù)據(jù)分析中,我們會接觸到很多的數(shù)據(jù),而這些數(shù)據(jù)都是有類別之分的,根據(jù)結(jié)構(gòu)的不同,數(shù)據(jù)可以分為三種:結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)。通常,數(shù)據(jù)分析工作正常開展的前提,是要有數(shù)據(jù),一般情況下,數(shù)據(jù)的來源主要有三種。1.企業(yè)系統(tǒng)數(shù)據(jù)2.本地離線數(shù)據(jù)3.外部公開數(shù)據(jù)1.1.1數(shù)據(jù)及其獲取途徑數(shù)據(jù)預(yù)處理一般包含數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)消減4個階段:1.1.2數(shù)據(jù)預(yù)處理與管理數(shù)據(jù)清洗數(shù)據(jù)集成數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)消減可視化被定義為利用計算機(jī)圖形學(xué)和圖像處理技術(shù),將數(shù)據(jù)轉(zhuǎn)換成圖形或圖像,并在屏幕上顯示出來。在大數(shù)據(jù)時代,數(shù)據(jù)可視化工具必須具備以下4個特性:數(shù)據(jù)實(shí)時更新、軟件易于操作、展現(xiàn)形式豐富、多種數(shù)據(jù)集成。圍繞大數(shù)據(jù)的4種特性,未來數(shù)據(jù)可視化的挑戰(zhàn)主要有以下兩個方面:1.大數(shù)據(jù)可視化分析2.探索式可視化分析1.1.3數(shù)據(jù)可視化及其挑戰(zhàn)1數(shù)據(jù)可視化實(shí)施目錄數(shù)據(jù)可視化基礎(chǔ)2數(shù)據(jù)可視化圖表3數(shù)據(jù)可視化應(yīng)該以業(yè)務(wù)場景為起始點(diǎn),以業(yè)務(wù)決策為終點(diǎn)。基于數(shù)據(jù)分析師的工作職責(zé),我們總結(jié)了數(shù)據(jù)可視化的5個步驟:1.2.1數(shù)據(jù)可視化的基本流程挖掘業(yè)務(wù)含義制訂分析計劃拆分查詢數(shù)據(jù)提煉業(yè)務(wù)信息產(chǎn)出商業(yè)決策設(shè)計數(shù)據(jù)可視化時,需要遵循以下8個方面的原則:1.2.2數(shù)據(jù)可視化的設(shè)計原則原則美學(xué)標(biāo)準(zhǔn)效果精致視圖恰當(dāng)信息合理直觀映射視圖交互信息隱喻巧用過渡為可視化設(shè)計或選擇交互的時候,除了需要符合數(shù)據(jù)類別和所要完成的任務(wù)外,還要遵守一些普遍的準(zhǔn)則,交互技術(shù)的類型形形色色,下面介紹7種常用的交互方法。1.2.3數(shù)據(jù)可視化的交互技術(shù)選擇導(dǎo)航重配編碼抽象過濾關(guān)聯(lián)1數(shù)據(jù)可視化實(shí)施目錄數(shù)據(jù)可視化基礎(chǔ)2數(shù)據(jù)可視化圖表3對比型圖表一般是比較幾組數(shù)據(jù)的差異,這些差異通過視覺和標(biāo)記來區(qū)分,體現(xiàn)在視圖中通常表現(xiàn)為高度差異、寬度差異、面積差異等,包括柱形圖、條形圖、氣泡圖、雷達(dá)圖等。1.柱狀圖:描述的是分類數(shù)據(jù)的數(shù)值大小,回答的是每一個分類中“有多少”的問題。需要注意的是,當(dāng)柱狀圖顯示的分類很多時,會導(dǎo)致分類重疊等顯示問題。2.條形圖:顯示各項(xiàng)目之間的比較情況,分為垂直條形圖和水平條形圖,其中水平條形圖縱軸表示分類,橫軸表示數(shù)值。他強(qiáng)調(diào)各個值之間的比較,不太關(guān)注時間的變化。3.氣泡圖:是散點(diǎn)圖的變體,氣泡的大小表示數(shù)據(jù)維,通常用于比較和展示不同類別之間的關(guān)系。4.雷達(dá)圖:當(dāng)我們擁有一組類別型數(shù)據(jù)、一組連續(xù)數(shù)值型數(shù)據(jù)時,為了對比數(shù)據(jù)大小情況,我們就可以使用雷達(dá)圖。1.3.1對比型圖表及案例趨勢型圖表用來反映數(shù)據(jù)隨時間變化而變化的趨勢,尤其是在整體趨勢比單個數(shù)據(jù)點(diǎn)更重要的場景下,包括折線圖、面積圖、曲面圖等。1.折線圖:用于顯示數(shù)據(jù)在一個連續(xù)的時間間隔或者跨度上的變化,它的特點(diǎn)是反映事物隨時間或有序類別而變化的趨勢。2.面積圖:是折線圖的另一種表現(xiàn)形式,其一般用于顯示不同數(shù)據(jù)系列之間的對比關(guān)系,同時也顯示單個數(shù)據(jù)系列與整體的比例關(guān)系,強(qiáng)調(diào)隨時間變化的幅度。3.曲面圖:可以在曲面上顯示兩個或多個數(shù)據(jù)系列,實(shí)際上它是折線圖和面積圖的另一種形式,我們可以通過創(chuàng)建曲面圖來實(shí)現(xiàn)兩組數(shù)據(jù)之間的最佳配合。1.3.2趨勢型圖表及案例比例型圖表用于展示每一部分占整體的百分比情況,至少有一個分類變量和數(shù)值變量,包括餅圖、環(huán)形圖、旭日圖等。1.餅圖:通過將一個圓餅按照分類的占比劃分成若干個區(qū)塊,整個圓餅代表數(shù)據(jù)的總量,每個圓弧表示各個分類的比例大小,所有區(qū)塊的和等于100%。2.環(huán)形圖:是一類特殊的餅圖,它是由兩個及兩個以上大小不一的餅圖疊加在一起,然后挖去中間的部分所構(gòu)成的圖形。3.旭日圖:由多層的環(huán)形圖組成,在數(shù)據(jù)結(jié)構(gòu)上,內(nèi)圈是外圈的父節(jié)點(diǎn)。因此,它既可以像餅圖一樣表現(xiàn)局部和整體的占比,又能像樹圖一樣表現(xiàn)層級關(guān)系。1.3.3比例型圖表及案例分布型圖表用于研究數(shù)據(jù)的集中趨勢、離散程度等描述性度量,用以反映數(shù)據(jù)的分布特征,包括散點(diǎn)圖、直方圖、箱型圖等。1.散點(diǎn)圖:將所有的數(shù)據(jù)以點(diǎn)的形式展現(xiàn)在直角坐標(biāo)系上,以顯示變量之間的相互影響程度,點(diǎn)的位置由變量的數(shù)值決定。2.直方圖:是由一系列高度不等的柱狀條塊表示數(shù)據(jù)分布的情況,柱與柱之間基本沒有間隔,有間隔就是柱狀圖,一般用橫軸表示數(shù)據(jù)類型,縱軸表示分布情況。3.箱型圖:又稱盒須圖,它是一種顯示一組數(shù)據(jù)分散情況的統(tǒng)計圖,能顯示數(shù)據(jù)的最大值、最小值、中位數(shù)、及上下四分位數(shù),因形狀如箱子而得名。1.3.4分布型圖表及案例除了以上四種類型的基本圖表外,還有一些其它類型的圖表,它們在日??梢暬治鲞^程中也會經(jīng)常遇到,主要包括樹狀圖、瀑布圖、股價圖等。1.樹狀圖:在嵌套的矩形中顯示數(shù)據(jù),使用分類變量定義樹狀圖的結(jié)構(gòu),使用數(shù)值變量定義各個矩形的大小或顏色。2.瀑布圖:形似瀑布流水,采用絕對值與相對值結(jié)合的方式,適用于表達(dá)多個特定數(shù)值之間的數(shù)量變化關(guān)系,當(dāng)需要表達(dá)兩個數(shù)據(jù)點(diǎn)之間數(shù)量的演變過程時,就可以使用瀑布圖。3.股價圖:用來顯示股票價格的波動情況,在研究金融數(shù)據(jù)時經(jīng)常被用到,一般包括股票的開盤價、盤高價、盤低價、收盤價等信息。1.3.5其它類圖表及案例第2章Python數(shù)據(jù)可視化庫目錄1PyechartsMatplotlib2Seaborn3Bokeh45Plotly目錄HoloViews6NetworkX7Matplotlib是比較基礎(chǔ)的Python繪圖庫,它是基于NumPy的數(shù)組運(yùn)算,可視化功能非常強(qiáng)大,已經(jīng)成為Python中最基礎(chǔ)的可視化工具。2.1.1Matplotlib簡介1.線條的設(shè)置2.坐標(biāo)軸的設(shè)置3.圖例的設(shè)置4.其他繪圖參數(shù)2.1.2Matplotlib參數(shù)配置目錄1PyechartsMatplotlib2Seaborn3Bokeh4Pyecharts是一個用于生成Echarts圖表的類庫,可以與Python進(jìn)行對接,方便在Python中直接生成圖形。2.2.1Pyecharts簡介Pyecharts的基本元素配置項(xiàng)主要包括:InitOpts、ToolBoxFeatureOpts、ToolboxOpts、TitleOpts、DataZoomOpts、LegendOpts、VisualMapOpts、TooltipOpts等8個配置。2.2.2Pyecharts基本配置目錄1PyechartsMatplotlib2Seaborn3Bokeh4Seaborn同Matplotlib一樣,也是Python進(jìn)行數(shù)據(jù)可視化分析的重要第三方包。但Seaborn是在Matplotlib的基礎(chǔ)上進(jìn)行了更高級的API封裝,使得作圖更加容易,圖形更加漂亮。2.3.1Seaborn簡介Seaborn有五種風(fēng)格,分別是darkgrid、dark、whitegrid、white和ticks,默認(rèn)的是darkgrid。2.3.2Seaborn風(fēng)格設(shè)置目錄1PyechartsMatplotlib2Seaborn3Bokeh4Bokeh是基于JavaScript實(shí)現(xiàn)數(shù)據(jù)的交互式可視化,它可以在WEB瀏覽器中實(shí)現(xiàn)美觀的視覺效果。2.4.1Bokeh簡介Bokeh可以很方便地實(shí)現(xiàn)自定義各類交互式視圖,下面通過案例逐一介紹Bokeh中圖形的基本設(shè)置,包括工具欄設(shè)置、顏色設(shè)置、邊框設(shè)置、背景設(shè)置、外邊界背景設(shè)置、軸線設(shè)置、網(wǎng)格設(shè)置、圖例設(shè)置等。2.4.2Bokeh基本配置5Plotly目錄HoloViews6NetworkX7HoloViews是一個面向數(shù)據(jù)分析和可視化的Python開源插件庫,旨在使數(shù)據(jù)分析和可視化更加簡便。HoloViews在很大程度上依賴于語義注釋,即聲明的元數(shù)據(jù),它使HoloViews可以解釋數(shù)據(jù)所表示的內(nèi)容,以及自動執(zhí)行復(fù)雜的任務(wù)。三種主要的語義注釋如下:1.元素類型2.元素尺寸3.組和標(biāo)簽2.5.1HoloViews簡介與Matplotlib和Bokeh等類似,HoloViews允許自定義圖形屬性,下面詳細(xì)介紹如何自定義參數(shù)配置,包括圖形大小、圖形背景、字體縮放、軸的位置、反轉(zhuǎn)軸、軸標(biāo)簽和刻度等。2.5.2HoloViews參數(shù)配置5Plotly目錄HoloViews6NetworkX7Plotly是Python的一個在線可視化交互庫,優(yōu)點(diǎn)是能提供WEB在線交互,功能非常強(qiáng)大,可以在線繪制條形圖、散點(diǎn)圖、餅圖、直方圖等多種圖形,可以媲美Tableau的高質(zhì)量視圖。2.6.1Plotly簡介Plotly可以繪制多種視圖,下面逐一介紹其主要圖形:2.6.2Plotly主要圖形5Plotly目錄HoloViews6NetworkX7NetworkX是Python中一個用于創(chuàng)建和操作復(fù)雜網(wǎng)絡(luò)的庫,可以產(chǎn)生多種類型的隨機(jī)網(wǎng)絡(luò)和經(jīng)典網(wǎng)絡(luò),也可以分析網(wǎng)絡(luò)結(jié)構(gòu),建立網(wǎng)絡(luò)模型,設(shè)計新的網(wǎng)絡(luò)算法,繪制網(wǎng)絡(luò)圖等。2.7.1NetworkX簡介在NetworkX中,頂點(diǎn)可以是任何可以哈希的對象,比如文本、圖片、XML對象、其他的圖對象、任意定制的節(jié)點(diǎn)對象等。2.7.2NetworkX參數(shù)配置第3章時序數(shù)據(jù)的可視化目錄1折線圖法時序數(shù)據(jù)概述2散點(diǎn)圖法3日歷圖法4動態(tài)圖法5目錄6平行坐標(biāo)系法主題河流圖法7甘特圖法8自相關(guān)圖法9脊線圖法10通常,具有時間屬性且隨時間變化的數(shù)據(jù)稱之為時序數(shù)據(jù),也就是時間序列數(shù)據(jù),它是一種較常見的數(shù)據(jù)類型。注意在時序數(shù)據(jù)中,同一數(shù)據(jù)列中各數(shù)據(jù)是同口徑的,要求具有可比性。時序數(shù)據(jù)可以是時點(diǎn)數(shù),也可以是時期數(shù),例如,通過Excel繪制的2010年至2019年我國普通高等學(xué)校數(shù)量的條形圖,該時序數(shù)據(jù)是由10個時期數(shù)組成的數(shù)列。3.1.1時序數(shù)據(jù)簡介通常情況下,時序數(shù)據(jù)可以分成兩類:時間序列數(shù)據(jù)和固有序列數(shù)據(jù)。對于時序數(shù)據(jù)的可視化,一般將時間屬性作為X軸,那么Y軸的數(shù)據(jù)就是每個時間點(diǎn)發(fā)生的事件。根據(jù)時序數(shù)據(jù)的變化特征,可以將時序數(shù)據(jù)的可視化分為以下幾種:1.按照是否具有周期性3.1.2時序數(shù)據(jù)的可視化2.按照是否靜態(tài)和動態(tài)目錄1折線圖法時序數(shù)據(jù)概述2散點(diǎn)圖法3日歷圖法4動態(tài)圖法5折線圖是由折線或曲線構(gòu)成的圖形,如股票的K線圖、價格走勢圖、時間序列的趨勢圖等。需要直觀的反映數(shù)據(jù)的變化趨勢、關(guān)聯(lián)性的場景,但是數(shù)據(jù)量較小時顯示效果不夠直觀。例如,為了分析2014年至2020年企業(yè)商品銷售額的變化情況,我們使用Tableau繪制了銷售額的折線圖。3.2.1折線圖及應(yīng)用場景電商企業(yè)的商品銷售一般都具有周期性波動,為了深入研究某電商企業(yè)的銷售額和利潤額的變化情況,繪制兩者的折線圖。該企業(yè)的訂單數(shù)據(jù)存儲在MySQL數(shù)據(jù)庫的訂單表(orders)中,包含客戶訂單的基本信息,例如訂單ID、訂單日期、門店名稱、支付方式、發(fā)貨日期等25個字段。3.2.2Python案例實(shí)戰(zhàn)目錄1折線圖法時序數(shù)據(jù)概述2散點(diǎn)圖法3日歷圖法4動態(tài)圖法5散點(diǎn)圖又稱XY散點(diǎn)圖,將數(shù)據(jù)以點(diǎn)的形式展現(xiàn),以顯示變量間的相互關(guān)系或者影響程度,點(diǎn)的位置由變量的數(shù)值決定。需要顯示若干數(shù)據(jù)系列中各數(shù)值之間的關(guān)系,類似XY軸,判斷兩變量之間是否存在某種關(guān)聯(lián),或者發(fā)現(xiàn)數(shù)據(jù)的分步或者聚合情況。例如,為了分析商品的配送延遲情況,我們使用Tableau繪制了計劃配送天數(shù)與實(shí)際配送天數(shù)的散點(diǎn)圖。3.3.1散點(diǎn)圖及應(yīng)用場景為了深入研究該企業(yè)股票的投資價值,需要分析其股票的開盤價和收盤價走勢。該企業(yè)的股票走勢數(shù)據(jù)存儲在MySQL數(shù)據(jù)庫的股價表(stocks)中,包含A企業(yè)近3年來股價的走勢信息,例如交易日期、開盤價、最高價、最低價、收盤價等7個字段。3.3.2Python案例實(shí)戰(zhàn)目錄1折線圖法時序數(shù)據(jù)概述2散點(diǎn)圖法3日歷圖法4動態(tài)圖法5日歷圖是一個日歷數(shù)據(jù)視圖,提供一段時間的日歷布局,使我們可以更好地查看所選日期每一天的數(shù)據(jù)。需要將時間序列數(shù)據(jù)展現(xiàn)在日歷上。例如為了分析企業(yè)每日的銷售額情況,我們可以使用MicrosoftPowerBI繪制銷售額的日歷圖。3.4.1日歷圖及應(yīng)用場景為了研究企業(yè)股票的價格走勢,我們首先提取存儲在MySQL數(shù)據(jù)庫股價表(stocks)中的數(shù)據(jù),然后使用Pyecharts庫繪制企業(yè)股票的每日收盤價日歷圖,其中圖形顏色的深淺代表了每日股票收盤價的高低。3.4.2Python案例實(shí)戰(zhàn)目錄1折線圖法時序數(shù)據(jù)概述2散點(diǎn)圖法3日歷圖法4動態(tài)圖法5動態(tài)圖是狀態(tài)圖的一種特殊形式,其中所有狀態(tài)都是活動狀態(tài),而且所有后續(xù)狀態(tài)都是在初始狀態(tài)中的活動完成時立即觸發(fā)。除了能展現(xiàn)一般的靜態(tài)圖表內(nèi)容之外,還需要隨著時間等維度進(jìn)行圖表的交互。例如,為了分析2019年企業(yè)每天的銷售額,使用MicrosoftPowerBI繪制了動態(tài)的每日銷售額點(diǎn)線圖,可以單擊視圖左上方的播放按鈕進(jìn)行動態(tài)展示或暫停。3.5.1動態(tài)圖及應(yīng)用場景為了比較分析企業(yè)不同類型的商品在最近7年每一年的銷售情況,使用Pyecharts自帶的商品銷售數(shù)據(jù)集,如表所示。3.5.2Python案例實(shí)戰(zhàn)年份小米三星華為蘋果魅族VIVOOPPO2014年1351041174111038992015年476490261271301142016年66434346101133452017年10625745964136532018年42100136957320992019年47128448689221162020年46305099122113148目錄6平行坐標(biāo)系法主題河流圖法7甘特圖法8自相關(guān)圖法9脊線圖法10主題河流圖是用面積表示事件或主題等在一段時間內(nèi)的變化,它是一種圍繞中心軸線移位的堆積面積圖。當(dāng)我們需要探索幾個不同主題的熱度(或其他統(tǒng)計量)隨時間的演變趨勢,并在同時期進(jìn)行比較時就可以使用該圖形。例如,為了比較分析2020年12月份企業(yè)在各個地區(qū)的銷售額,我們使用Echarts繪制了不同地區(qū)銷售額的主題和流圖。3.6.1主題河流圖及應(yīng)用場景為了深入分析企業(yè)在2020年6月份不同類型商品的銷售額情況,數(shù)據(jù)存儲在MySQL數(shù)據(jù)庫的訂單表(orders)中,使用Pyecharts庫繪制不同商品銷售額的主題河流圖,其中橫軸是訂單日期,縱軸是每種商品的銷售額,并且用不同的顏色進(jìn)行表示。3.6.2Python案例實(shí)戰(zhàn)目錄6平行坐標(biāo)系法主題河流圖法7甘特圖法8自相關(guān)圖法9脊線圖法10平行坐標(biāo)系是信息可視化的一種重要技術(shù),它是可視化高維幾何和分析多元數(shù)據(jù)的常用方法。需要對三維及其以上數(shù)據(jù)進(jìn)行可視化分析,一般與時間序列密切相關(guān),軸與時間點(diǎn)不對應(yīng),沒有固定的軸順序。例如,為了分析北京、上海、廣州三個城市的天氣情況,我們收集了過去一周三個城市的空氣質(zhì)量指數(shù)(AQI)、PM2.5、PM10等數(shù)據(jù),使用Echarts繪制了三個城市空氣質(zhì)量狀況的平行坐標(biāo)系。3.7.1平行坐標(biāo)系及應(yīng)用場景為了研究西北、華中、西南、華南、東北和華東等6個地區(qū),在2014年至2020年共計7年每一年的利潤情況,我們使用Pyecharts庫繪制最近7年各個地區(qū)利潤增長率的平行坐標(biāo)系,其中業(yè)績評估分為Bad、OK、Good和Excellent共4種。3.7.2Python案例實(shí)戰(zhàn)銷售大區(qū)2014年2015年2016年2017年2018年2019年2020年業(yè)績評估西北1.181.260.32.822.032.622.02Bad華中7.189.2612.36.829.034.622.82OK西南6.187.2610.34.828.033.326.12OK華南9.189.2613.313.8214.6311.6215.12Good東北8.188.2610.311.8213.0314.5210.12Good華東10.9818.6620.8315.6217.9316.8219.62Excellent目錄6平行坐標(biāo)系法主題河流圖法7甘特圖法8自相關(guān)圖法9脊線圖法10甘特圖以圖示的方式通過活動列表和時間刻度形象地表示出特定項(xiàng)目的活動順序與持續(xù)時間,即甘特圖是將活動與時間聯(lián)系起來的一種圖表形式,顯示每個活動的歷時長短。生產(chǎn)管理領(lǐng)域制定生產(chǎn)計劃,需要從時間上整體把握進(jìn)度,很清晰地標(biāo)識出直到每一項(xiàng)任務(wù)的起始與結(jié)束時間,直觀的看到任務(wù)的進(jìn)展情況,資源的利用率等。例如,企業(yè)為了實(shí)現(xiàn)業(yè)務(wù)創(chuàng)新,解決信息孤單問題,在2020年加快了數(shù)據(jù)中臺的建設(shè),這里我們使用Excel繪制了項(xiàng)目計劃的甘特圖。3.8.1甘特圖及應(yīng)用場景企業(yè)為了了解客戶的觀念和行為,為商業(yè)模式的創(chuàng)新提供數(shù)據(jù)基礎(chǔ),充分利用內(nèi)外部數(shù)據(jù),打破數(shù)據(jù)孤島的現(xiàn)狀,在2020年啟動了數(shù)據(jù)中臺項(xiàng)目(第一期),項(xiàng)目進(jìn)度如表所示。3.8.2Python案例實(shí)戰(zhàn)項(xiàng)目階段開始日期結(jié)束日期需求調(diào)研2020-01-012020-03-10制定方案2020-03-112020-05-16項(xiàng)目實(shí)施2020-05-172020-09-26項(xiàng)目驗(yàn)收2020-09-272020-11-10項(xiàng)目竣工2020-11-112020-12-31目錄6平行坐標(biāo)系法主題河流圖法7甘特圖法8自相關(guān)圖法9脊線圖法10自相關(guān)也叫序列相關(guān),是時間序列數(shù)據(jù)自身在不同時間點(diǎn)的相關(guān)。由于時間序列的相關(guān)系數(shù)是指與之前的相同系列數(shù)據(jù)的相關(guān)性程度,因此被稱為序列相關(guān)或自相關(guān)。直觀的顯示時間序列的當(dāng)前序列值和過去序列值之間的相關(guān)性,并指示預(yù)測將來值時最有用的過去序列值。例如,根據(jù)2015年至2020年共計6年的銷售額數(shù)據(jù),預(yù)測2021年每個月份的銷售額,我們使用SPSS繪制的自相關(guān)圖(ACF),使用SPSS繪制的偏相關(guān)圖(PACF)。3.9.1自相關(guān)圖及應(yīng)用場景為了深入分析該企業(yè)股票成交金額的未來趨勢,使用存儲在MySQL數(shù)據(jù)庫股價表(stocks)中的數(shù)據(jù),利用Matplotlib庫繪制股票成交金額的自相關(guān)圖和偏相關(guān)圖,其中橫軸是時間序列模型中的滯后期,縱軸是相關(guān)系數(shù),帶顏色的區(qū)域表示95%的置信區(qū)間區(qū)域。3.9.2Python案例實(shí)戰(zhàn)目錄6平行坐標(biāo)系法主題河流圖法7甘特圖法8自相關(guān)圖法9脊線圖法10脊線圖是部分重疊的線形圖,用以在二維空間產(chǎn)生山脈的印象,其中每一行對應(yīng)的是一個類別,而x軸對應(yīng)的是數(shù)值的范圍,波峰的高度代表出現(xiàn)的次數(shù)。適用于可視化指標(biāo)數(shù)據(jù)隨時間或空間分布的變化。例如,為了分析不同食品類型與二氧化碳排放量的關(guān)系,我們可以使用R語言繪制兩者之間的脊線圖。3.10.1脊線圖及應(yīng)用場景為了深入研究該企業(yè)在2019年每個月份的商品退單量情況,我們使用每日退單量數(shù)據(jù)表(return_days.csv),該表包含退單日期(date)和退單量(return)兩個字段,然后利用Altair庫繪制每月商品退單量的脊線圖,其中橫軸是退單量,縱軸是退單所在的月份,山峰的高低表示退單的次數(shù)。3.10.2Python案例實(shí)戰(zhàn)第4章金融數(shù)據(jù)的可視化目錄1K線圖法金融數(shù)據(jù)概述2OHLC圖法3RENKO圖法45BOLL圖法目錄MACD圖法6RSI圖法7金融數(shù)據(jù)是指金融行業(yè)所涉及的市場數(shù)據(jù)、公司數(shù)據(jù)、行業(yè)指數(shù)和定價數(shù)據(jù)等的統(tǒng)稱,凡是金融行業(yè)相關(guān)的數(shù)據(jù)都可以歸入金融市場的數(shù)據(jù)體系之中。在金融市場中,根據(jù)數(shù)據(jù)的頻率,金融數(shù)據(jù)分為低頻數(shù)據(jù)、高頻數(shù)據(jù)和超高頻數(shù)據(jù)三類。4.1.1金融數(shù)據(jù)簡介年月周日低頻數(shù)據(jù)時分秒高頻數(shù)據(jù)實(shí)時超高頻數(shù)據(jù)金融數(shù)據(jù)的可視化可以幫助我們理解股票、商品、貨幣等的價格是如何隨時間而變化,此外,一般在可視化視圖中還新增了一些指標(biāo)顯示價格信號,例如趨勢、交易量、交易額等。由于金融數(shù)據(jù)特有的特征,其可視化視圖元素的表達(dá)方式與其它數(shù)據(jù)類型的視圖不同,一般都需要有金融計算功能,并將金融函數(shù)與統(tǒng)計和可視化框架集成。金融數(shù)據(jù)可視化的方法主要有K線圖(蠟燭圖)、OHLC圖、RENKO圖、MACD圖、BOLL圖、RSI圖等4.1.2金融數(shù)據(jù)的可視化目錄1K線圖法金融數(shù)據(jù)概述2OHLC圖法3RENKO圖法4K線圖又稱蠟燭圖,包含四個指標(biāo)數(shù)據(jù),即開盤價、最高價、最低價、收盤價,所有的k線都是圍繞這四個指標(biāo)展開,反映股票的價格信息。通常用來顯示和分析證券、衍生工具、外匯貨幣、股票、債券等金融相關(guān)商品隨著時間的價格變動。例如,2020年8月7日航某股票的價格分時K線圖,包括開盤價、最高價、最低價、收盤價等。4.2.1K線圖及應(yīng)用場景為了分析該企業(yè)的股票價格走勢,可以繪制股票價格的K線圖,使用存儲在MySQL數(shù)據(jù)庫股價表(stocks)中的數(shù)據(jù),繪制企業(yè)2020年6月份股票價格的K線圖,其中橫軸是日期,縱軸是股票價格。4.2.2Python案例實(shí)戰(zhàn)目錄1K線圖法金融數(shù)據(jù)概述2OHLC圖法3RENKO圖法4OHLC圖(即美國線),其中O表示開盤價,H表示最高價,L表示最低價,C表示收盤價。OHLC圖主要應(yīng)用于外匯等市場,顯示貨幣的價格變化。例如,2020年10月30日恒生指數(shù)(由香港股市中最優(yōu)質(zhì)的50只成分股構(gòu)成的股票指數(shù))的30分鐘行情圖,包括開盤價、最高價、最低價、收盤價等。4.3.1OHLC圖及應(yīng)用場景為了分析該企業(yè)的股票價格走勢,使用企業(yè)股票信息表(stocks.xls),該表包含交易日期、開盤價、最高價、最低價、收盤價等7個字段。利用Seaborn庫繪制2020年上半年企業(yè)股票價格走勢的OHLC圖,其中橫軸是日期,縱軸是股票價格。4.3.2Python案例實(shí)戰(zhàn)目錄1K線圖法金融數(shù)據(jù)概述2OHLC圖法3RENKO圖法4RENKO圖是一種用價格變化來繪制價格走勢的圖形,名稱來自日語“renga”,即磚頭,故稱磚形圖。磚形圖是技術(shù)指標(biāo)的一種,他不考慮時間因素,只考慮價格變化,每當(dāng)價格變化了一個設(shè)定的點(diǎn)數(shù)后,在圖形上就出現(xiàn)一個“磚塊”。例如,2020年10月30日恒生指數(shù)每日行情的磚形圖,出現(xiàn)藍(lán)色的磚塊代表上漲,出現(xiàn)紅色的磚塊代表下跌。如果價格波動幅度不足設(shè)定的基點(diǎn),則不會顯示。4.4.1RENKO圖及應(yīng)用場景為了進(jìn)一步分析該企業(yè)的股票價格走勢,使用企業(yè)股票信息表(stocks.xls),利用Mplfinance庫繪制2020年上半年企業(yè)股票價格的RENKO圖,其中橫軸是日期,縱軸是股票價格。4.4.2Python案例實(shí)戰(zhàn)5BOLL圖法目錄MACD圖法6RSI圖法7MACD平滑異同移動平均線,由美國人杰拉德·阿佩爾(GeraldAppel)及福雷德·海期爾(FredHitschler)在1979年發(fā)明,在股票、期貨等市場分析方面都有著廣泛的應(yīng)用。MACD圖是利用快速、慢速移動平均線之間的聚合與分離的狀況,對買進(jìn)、賣出的時機(jī)作出判斷的圖形,例如,2020年8月7日某股票價格的月度MACD圖。4.5.1MACD圖及應(yīng)用場景為了深入分析該企業(yè)的股票價格走勢,使用企業(yè)股票信息表(stocks.csv),該表包含交易日期、開盤價、最高價、最低價、收盤價等7個字段,利用Matplotlib庫繪制2020年上半年企業(yè)股票價格的MACD圖,其中橫軸是日期,縱軸是股票的MACD線。4.5.2Python案例實(shí)戰(zhàn)5BOLL圖法目錄MACD圖法6RSI圖法7BOLL圖又稱布林帶,是約翰·布林(JohnBollinger)提出的一種行情價格頻帶分軌,他是根據(jù)統(tǒng)計學(xué)中的標(biāo)準(zhǔn)差原理,設(shè)計出來的一種非常實(shí)用的技術(shù)指標(biāo)。BOLL圖建立在移動平均線之上,但包含最近的價格波動,使指標(biāo)更能適應(yīng)不同的市場條件。例如,2020年8月7日某股票價格的周BOLL圖。4.6.1BOLL圖及應(yīng)用場景為了分析該企業(yè)的股票價格走勢,使用企業(yè)股票信息表(stocks.csv),利用Matplotlib庫繪制2020年上半年企業(yè)股票價格走勢的BOLL圖,其中橫軸是日期,縱軸是股票的收盤價、中界線、阻力線、支撐線。4.6.2Python案例實(shí)戰(zhàn)5BOLL圖法目錄MACD圖法6RSI圖法7RSI圖(相對強(qiáng)度指標(biāo))是由美國證券分析技術(shù)大師威爾斯·威爾德(J.Welles-Wilder)提出,并設(shè)計的技術(shù)分析工具,最早應(yīng)用于歐美期貨市場。RSI圖的優(yōu)點(diǎn)是能夠提前提示買賣雙方力量的對比,通過比較一段時間內(nèi)收盤指數(shù)或收盤價的漲跌變化,來分析測量多空雙方買賣力量的強(qiáng)弱程度,從而判斷未來股票的走勢。例如,2020年8月7日某股票價格的日RSI圖。4.7.1RSI圖及應(yīng)用場景為了分析該企業(yè)的股票價格走勢,使用企業(yè)股票信息表(stocks.csv),利用Matplotlib庫繪制2020年上半年企業(yè)股票價格走勢的RSI圖,其中橫軸是日期,縱軸是股票的RSI線、RS線和收盤價。4.7.2Python案例實(shí)戰(zhàn)第5章空間數(shù)據(jù)的可視化目錄1三維條形圖法空間數(shù)據(jù)概述2三維曲面圖法3三維散點(diǎn)圖法4三維等高線法5空間數(shù)據(jù)又稱幾何數(shù)據(jù),它用來表示物體的位置、形態(tài)、大小分布等各方面的信息,是對現(xiàn)實(shí)中存在的具有定位意義的事物和現(xiàn)象的定量描述。空間數(shù)據(jù)的來源和類型繁多,主要可以分為地圖數(shù)據(jù)、影像數(shù)據(jù)、地形數(shù)據(jù)、屬性數(shù)據(jù)和元數(shù)據(jù)等4種類型。5.1.1空間數(shù)據(jù)簡介空間數(shù)據(jù)的可視化是指運(yùn)用計算機(jī)圖形圖像處理技術(shù),將復(fù)雜的科學(xué)現(xiàn)象和自然景觀及一些抽象概念圖形化的過程。具體地說,是利用地圖學(xué)、計算機(jī)圖形圖像技術(shù),將地學(xué)信息輸入、查詢、分析、處理,采用圖形、圖像,結(jié)合圖表、文字、報表,以可視化形式,實(shí)現(xiàn)交互處理和顯示的理論、技術(shù)和方法。5.1.2空間數(shù)據(jù)的可視化空間數(shù)據(jù)三維條形圖三維曲面圖三維散點(diǎn)圖三維等高線目錄1三維條形圖法空間數(shù)據(jù)概述2三維曲面圖法3三維散點(diǎn)圖法4三維等高線法5三維條形圖一般以三維格式顯示水平矩形,而不以三維格式顯示數(shù)據(jù),包括三維簇狀條形圖、三維堆積條形圖、三維百分比堆積條形圖等類型。三維條形圖是使用不同高度的三維條塊顯示數(shù)值的大小。例如,2014年至2019年不同類型商品的銷售額分析,如圖所示。5.2.1三維條形圖及應(yīng)用場景眾所周知,只要是商場等公共場所,每天都會有很多人進(jìn)出,也就是客流量,他是反映門店人氣和價值的重要指標(biāo)。例如,某超市的負(fù)責(zé)人為了分析客流量與時間的關(guān)系,使用客流計數(shù)器統(tǒng)計一周24個小時的進(jìn)店人數(shù)。為了研究該超市門店一周的客流量,我們使用Pyecharts對客流數(shù)據(jù)進(jìn)行可視化,其中X軸是時間,Y軸是周幾,Z軸是客流量,并用顏色表示客流量的大小。5.2.2Python案例實(shí)戰(zhàn)目錄1三維條形圖法空間數(shù)據(jù)概述2三維曲面圖法3三維散點(diǎn)圖法4三維等高線法5三維曲面是使用XYZ三個維度繪制曲面,在連續(xù)曲面上跨兩個維度來顯示數(shù)值的趨勢,圖中的顏色并不代表數(shù)據(jù)系列,而是代表數(shù)值間的差別。三維曲面圖是使用連續(xù)曲面來顯示數(shù)值的大小。例如,2020年全國區(qū)域商品退單量分析,如圖所示。5.3.1三維曲面圖及應(yīng)用場景為了演示如何使用Python繪制三維曲面圖,下面使用surface3d_data()生成數(shù)據(jù),繪制比較絢麗的圖形,其中顏色表示數(shù)值的大小。5.3.2Python案例實(shí)戰(zhàn)目錄1三維條形圖法空間數(shù)據(jù)概述2三維曲面圖法3三維散點(diǎn)圖法4三維等高線法5三維散點(diǎn)圖是使用XYZ三個維度繪制散點(diǎn)圖,在連續(xù)曲面上跨兩個維度來顯示數(shù)值的趨勢,圖中的顏色并不代表數(shù)據(jù)系列,而是代表數(shù)值間的差別。當(dāng)需要在三維空間繪制多個變量的關(guān)系圖時,例如,使用SASJMP繪制銷售額(sales)、利潤額(profit)、購買量(amount)和折扣(discount)等4個變量的散點(diǎn)圖,如圖所示。5.4.1三維散點(diǎn)圖及應(yīng)用場景當(dāng)需要對商品的銷售額、利潤額和訂單量三者之間進(jìn)行深入研究時,可以使用繪制三維散點(diǎn)圖的方法,例如需要對商品一周的銷售情況進(jìn)行分析,數(shù)據(jù)如表所示。為了研究銷售額、利潤額和訂單量三者之間的關(guān)系,我們使用Matplotlib繪制其三維散點(diǎn)圖,其中X軸是訂單量、Y軸是利潤額、Z軸是銷售額,并指定每個點(diǎn)的大小和顏色。5.4.2Python案例實(shí)戰(zhàn)日期salesprofitamount周一504.9128.4314周二495.8924.2813周三534.6125.6115周四455.4524.8217周五425.7328.8616周六435.6131.2611周日485.1827.2812目錄1三維條形圖法空間數(shù)據(jù)概述2三維曲面圖法3三維散點(diǎn)圖法4三維等高線法5等高線指的是地形圖上高程相等的相鄰各點(diǎn)所連成的閉合曲線。把地面上海拔高度相同的點(diǎn)連成的閉合曲線,并垂直投影到一個水平面上,并按比例縮繪在圖紙上,就得到等高線。三維等高線在三維空間繪制等高線,比二維等高線更直觀,例如使用R語言繪制的三維等高線,如圖所示。5.5.1三維等高線及應(yīng)用場景用R語言繪制的三位等高線不是很美觀,我們還可以使用Python繪制更加絢麗的視圖,這里使用的數(shù)據(jù)是NumPy生成的。5.5.2Python案例實(shí)戰(zhàn)第6章地理數(shù)據(jù)的可視化目錄1熱力地圖法地理數(shù)據(jù)概述2著色地圖法3三維地圖法4動態(tài)地圖法5軌跡地圖法6地理數(shù)據(jù)是以地球表面空間位置為參照,描述自然、社會和人文景觀的數(shù)據(jù),它直接或間接關(guān)聯(lián)著相對于地球的某個地點(diǎn)的數(shù)據(jù),是表示地理位置、分布特點(diǎn)的自然現(xiàn)象和社會現(xiàn)象的諸要素文件,包括自然地理數(shù)據(jù)和社會經(jīng)濟(jì)數(shù)據(jù)。6.1.1地理數(shù)據(jù)簡介地理數(shù)據(jù)的可視化反映了地理實(shí)體的空間特征和屬性特征,主要有兩種形式。1.位置圖的可視化2.經(jīng)緯圖的可視化6.1.2地理數(shù)據(jù)的可視化地理數(shù)據(jù)熱力地圖著色地圖三維地圖動態(tài)地圖軌跡地圖目錄1熱力地圖法地理數(shù)據(jù)概述2著色地圖法3三維地圖法4動態(tài)地圖法5軌跡地圖法6熱力地圖(Heatmap),也稱為熱力圖,主要用于展示數(shù)據(jù)的分布情況。標(biāo)準(zhǔn)的熱力圖將兩個連續(xù)數(shù)據(jù)分別映射到x、y軸,第三個連續(xù)數(shù)據(jù)映射到顏色。需要直觀地顯示測量值在整個地理區(qū)域內(nèi)的變化情況,以及變化程度等。例如,使用Excel中的三維地圖功能,繪制如圖所示的2020年企業(yè)商品在湖北省主要城市的銷售額情況。6.2.1熱力地圖及應(yīng)用場景為了分析該企業(yè)的商品在湖北省主要城市的銷售額是否存在較大差異,我們統(tǒng)計匯總了2020年12月份的相關(guān)數(shù)據(jù),如表所示。了研究湖北省主要城市的銷售額情況,我們使用Pyecharts庫繪制2020年12月份商品銷售額的熱力地圖,其中背景是湖北省地圖,主要城市上圓圈的顏色深淺表示銷售額的大小。6.2.2Python案例實(shí)戰(zhàn)主要城市銷售額主要城市銷售額武漢市184荊門市192黃石市131孝感市79十堰市71荊州市83宜昌市56黃岡市99襄陽市65咸寧市49鄂州市52隨州市79目錄1熱力地圖法地理數(shù)據(jù)概述2著色地圖法3三維地圖法4動態(tài)地圖法5軌跡地圖法6著色地圖是指按照數(shù)值的大小為地圖的每一個區(qū)域分配一種顏色,使得地圖相鄰區(qū)域具有不同的顏色,從而比較和展示不同地區(qū)的數(shù)值大小。需要直觀地顯示測量值在各個區(qū)域的變化情況。例如,使用Excel中的三維地圖功能,繪制如圖所示的2020年9月份企業(yè)在湖北省、湖南省、江西省和安徽省4個省份的利潤額情況。6.3.1著色地圖及應(yīng)用場景為了分析該企業(yè)的商品在湖北省主要城市的利潤額是否存在較大差異,我們統(tǒng)計匯總了2020年12月份的相關(guān)數(shù)據(jù),如表所示。為了研究湖北省主要城市的利潤額情況,我們使用Pyecharts庫繪制2020年12月份商品利潤額的著色地圖,其中背景是湖北省地圖,主要城市區(qū)域的顏色深淺表示利潤額的大小。6.3.2Python案例實(shí)戰(zhàn)主要城市利潤額主要城市利潤額武漢市18.4荊門市19.2黃石市13.1孝感市14.9十堰市7.1荊州市8.3宜昌市15.6黃岡市9.9襄陽市6.5咸寧市4.9鄂州市5.2隨州市11.9目錄1熱力地圖法地理數(shù)據(jù)概述2著色地圖法3三維地圖法4動態(tài)地圖法5軌跡地圖法6三維地圖是指基于地理數(shù)據(jù),按照一定的比例對現(xiàn)實(shí)世界的三維抽象化描述。當(dāng)需要將數(shù)據(jù)立體展示在地圖上時,就可以使用三維地圖。例如,使用Excel中的三維地圖功能,繪制如圖所示的2020年第四季度企業(yè)商品在湖北省主要城市的銷售額情況。6.4.1三維地圖及應(yīng)用場景為了分析該企業(yè)商品的在湖北省主要城市的客戶滿意度情況,我們統(tǒng)計匯總了2020年12月份的相關(guān)數(shù)據(jù),如表所示。為了研究湖北省主要城市的客戶滿意度情況,我們使用Pyecharts庫繪制2020年12月份客戶滿意度的三維地圖,其中背景是湖北省地圖,主要城市區(qū)域的顏色深淺表示客戶滿意度的高低。6.4.2Python案例實(shí)戰(zhàn)主要城市客戶滿意度主要城市客戶滿意度武漢市95荊門市94黃石市92孝感市88十堰市91荊州市90宜昌市99黃岡市99襄陽市92咸寧市72鄂州市76隨州市95目錄1熱力地圖法地理數(shù)據(jù)概述2著色地圖法3三維地圖法4動態(tài)地圖法5軌跡地圖法6動態(tài)地圖是反映自然和人文現(xiàn)象變遷和運(yùn)動的地圖,雖表現(xiàn)客觀事物動態(tài)形跡,但在視覺上仍是靜止的。需要顯示事物的變化或形跡時就需要使用動態(tài)地圖,例如,我們使用Echarts繪制了上海市主要車站(包括火車站和汽車站)人員流動的動態(tài)地圖,圖形隨時間而動態(tài)變化,如圖所示。6.5.1動態(tài)地圖及應(yīng)用場景為了研究某企業(yè)在湖北省主要城市之間的物流路線,數(shù)據(jù)如表所示,以及2020年12月份貨運(yùn)量的大小,數(shù)據(jù)如表所示。為了研究湖北省主要城市的貨運(yùn)量情況,利用Pyecharts庫繪制2020年12月份湖北省主要城市的貨運(yùn)量動態(tài)地圖,其中背景是湖北省地圖,主要城市上的箭頭表示物流線路的方向,而且物流線路是動態(tài)變化的。6.5.2Python案例實(shí)戰(zhàn)孝感市,武漢市咸寧市,武漢市孝感市,咸寧市武漢市,黃岡市武漢市,宜昌市武漢市,鄂州市武漢市,黃石市武漢市,咸寧市荊門市,黃石市武漢市,荊州市武漢市,十堰市武漢市,襄陽市武漢市,隨州市襄陽市,宜昌市十堰市,宜昌市主要城市貨運(yùn)量主要城市貨運(yùn)量隨州市66孝感市77武漢市88咸寧市100黃岡市30宜昌市120鄂州市77黃石市88襄陽市100荊門市30十堰市120荊州市66目錄1熱力地圖法地理數(shù)據(jù)概述2著色地圖法3三維地圖法4動態(tài)地圖法5軌跡地圖法6軌跡地圖可以動態(tài)的展示物體(如汽車、公交、地鐵、飛機(jī)等)從初始時刻點(diǎn)到結(jié)束時刻點(diǎn)的運(yùn)動軌跡。需要在地圖上顯示汽車、公交、飛機(jī)等事物的運(yùn)動軌跡時就可以使用軌跡地圖,例如,我們使用Echarts模擬繪制了上海市某條公交線路的基本運(yùn)行軌跡,如圖所示。6.6.1軌跡地圖及應(yīng)用場景地鐵是涵蓋了城市地區(qū)各種地下與地上的路權(quán)專有、高密度、高運(yùn)量的城市軌道交通系統(tǒng)。世界上最早的地鐵是英國倫敦的大都會地鐵,始建于1863年。上海地鐵是世界范圍內(nèi)線路總長度最長的城市軌道交通系統(tǒng),截至2020年8月份,上海地鐵運(yùn)營線路共16條,運(yùn)營里程共705千米。下面我們通過Python繪制上海地鐵的線路圖。6.6.2Python案例實(shí)戰(zhàn)第7章層次數(shù)據(jù)的可視化目錄1樹狀圖法層次數(shù)據(jù)概述2旭日圖法3和弦圖法4層次數(shù)據(jù)是一種常見的數(shù)據(jù)類型,主要用于顯示個體之間的層次關(guān)系,這種關(guān)系表現(xiàn)為包含和從屬兩種,在生活中也會經(jīng)??吹?,例如,學(xué)校包含多個年級,每個年級又包含很多學(xué)生,在企業(yè)等組織機(jī)構(gòu)中,同樣存在著分層的從屬關(guān)系。7.1.1層次數(shù)據(jù)簡介總經(jīng)理市場部賀偉...技術(shù)部潘磊...行政部王輝...高級管理者中級管理者普通員工在層次關(guān)系的數(shù)據(jù)中,由于層次數(shù)目越來越多,導(dǎo)致底層的數(shù)據(jù)節(jié)點(diǎn)成指數(shù)型增長,因此,在有限的區(qū)域內(nèi)可視化展示大量數(shù)據(jù)會造成圖形的重疊,從而降低用戶的體驗(yàn)以及圖形的觀感。層次數(shù)據(jù)的可視化重點(diǎn)是對數(shù)據(jù)中層次關(guān)系進(jìn)行繪圖,目前常用的方法有樹狀圖、旭日圖、和弦圖,此外,還有徑向樹、雙曲樹、相鄰層次圖、彈性層次法等方法。7.1.2層次數(shù)據(jù)的可視化目錄1樹狀圖法層次數(shù)據(jù)概述2旭日圖法3和弦圖法4樹狀圖采用矩形表示層次結(jié)構(gòu)的節(jié)點(diǎn),父子層次關(guān)系用矩陣間的相互嵌套來表達(dá)。樹狀圖在嵌套的矩形中顯示數(shù)據(jù),適合展現(xiàn)具有層級關(guān)系的數(shù)據(jù),能夠直觀體現(xiàn)同級之間的數(shù)據(jù)比較。例如,使用Tableau繪制不同類型商品利潤額的樹狀圖,如圖所示。7.2.1樹狀圖及應(yīng)用場景為了研究2020年上半年企業(yè)在全國六個大區(qū)的商品銷售情況,數(shù)據(jù)存儲在MySQL數(shù)據(jù)庫的訂單表(orders)中,使用Matplotlib庫繪制區(qū)域銷售額的樹狀圖,其中每個區(qū)域的大小和顏色深淺都表示銷售額的大小。7.2.2Python案例實(shí)戰(zhàn)目錄1樹狀圖法層次數(shù)據(jù)概述2旭日圖法3和弦圖法4旭日圖可以展示多級數(shù)據(jù),具有獨(dú)特的外觀,他是一種現(xiàn)代餅圖,超越傳統(tǒng)的餅圖和環(huán)圖,能表達(dá)清晰的層級和歸屬關(guān)系,以父子層次結(jié)構(gòu)來顯示數(shù)據(jù)構(gòu)成情況。旭日圖離遠(yuǎn)點(diǎn)越近表示級別越高,相鄰兩層中,是內(nèi)層包含外層的關(guān)系,可以細(xì)分溯源分析數(shù)據(jù),真正了解數(shù)據(jù)的具體構(gòu)成。例如,使用百度Echarts可視化工具繪制圖書分類的旭日圖。7.3.1旭日圖及應(yīng)用場景為了可視化我的家庭成員之間的層級關(guān)系,我們使用Pyecharts繪制了我的家庭成員旭日圖,其中處于同一個環(huán)上的成員,家庭輩分一樣。7.3.2Python案例實(shí)戰(zhàn)目錄1樹狀圖法層次數(shù)據(jù)概述2旭日圖法3和弦圖法4和弦圖是顯示數(shù)據(jù)之間相互關(guān)系的視圖,實(shí)體之間的連接用來顯示它們共享的元素。和弦圖適合比較數(shù)據(jù)集之間或不同數(shù)據(jù)組之間的相似性,例如,使用MicrosoftPowerBI繪制了2020年上半年不同地區(qū)銷售額的和弦圖,如圖所示。7.4.1和弦圖及應(yīng)用場景為了研究客戶在購買商品后的分享情況,我們整理了2020年9月份重要客戶的分享歷史數(shù)據(jù)。為了可視化客戶商品分享量的大小,我們使用Pyecharts庫繪制2020年9月份客戶分享購買體驗(yàn)的和弦圖,其中客戶名稱間有連線的表示存在分享關(guān)系,連線越多的客戶表示分享越多。7.4.2Python案例實(shí)戰(zhàn)第8章網(wǎng)絡(luò)數(shù)據(jù)的可視化目錄1無向圖法網(wǎng)絡(luò)數(shù)據(jù)概述2有向圖法3社交網(wǎng)絡(luò)法4網(wǎng)絡(luò)數(shù)據(jù)是現(xiàn)實(shí)世界中最常用的數(shù)據(jù)類型之一,例如人與人之間的關(guān)系、城市之間的道路連接、科研論文之間的引用都組成了網(wǎng)絡(luò),中國知網(wǎng)中論文之間的引文網(wǎng)絡(luò)包括引文網(wǎng)絡(luò)和參考引證圖譜,下圖顯示了中國知網(wǎng)中某篇論文的參考引證圖譜。8.1.1網(wǎng)絡(luò)數(shù)據(jù)簡介網(wǎng)絡(luò)數(shù)據(jù)通常用圖來表示,圖是由節(jié)點(diǎn)的非空集合和頂點(diǎn)之間邊的集合組成,表示為:G(V,E),其中,G表示一個圖,V是圖G中頂點(diǎn)的集合,E是圖G中邊的集合。通常,在數(shù)據(jù)分析過程中,網(wǎng)絡(luò)數(shù)據(jù)使用無向圖和有向圖進(jìn)行可視化。8.1.2網(wǎng)絡(luò)數(shù)據(jù)的可視化目錄1無向圖法網(wǎng)絡(luò)數(shù)據(jù)概述2有向圖法3社交網(wǎng)絡(luò)法4通常,一個圖是由數(shù)個頂點(diǎn)和數(shù)個邊組成,其中無向圖的邊是沒有方向的,即兩個相連的頂點(diǎn)可以互相抵達(dá)。當(dāng)實(shí)體之間的聯(lián)系沒有方向時,就可以使用無向圖,例如朋友圈。8.2.1無向圖及應(yīng)用場景為了研究公司數(shù)據(jù)分析小組的溝通情況,我們收集了2020年10月份,數(shù)據(jù)分析組內(nèi)部成員的溝通記錄。為了研究內(nèi)部員工的溝通情況,我們使用NetworkX庫繪制內(nèi)部員工溝通的無向圖,其中員工之間有連線的,表示員工間存在溝通關(guān)系,連線越多的員工表示溝通越多。8.2.2Python案例實(shí)戰(zhàn)林丹,蘇冬露俞毅,常明媚邢偉,常明媚常明媚,林丹常明媚,呂嬋娟蘇冬露,常明媚林丹,周康蘇冬露,俞毅呂嬋娟,邢偉林丹,俞毅呂嬋娟,俞毅

目錄1無向圖法網(wǎng)絡(luò)數(shù)據(jù)概述2有向圖法3社交網(wǎng)絡(luò)法4由有方向的邊組成的圖稱為有向圖,其中以某節(jié)點(diǎn)為起點(diǎn)的邊的條數(shù)稱為該節(jié)點(diǎn)的出度,以該節(jié)點(diǎn)為終點(diǎn)的邊的條數(shù)稱為該節(jié)點(diǎn)的入度,該節(jié)點(diǎn)的度是入度和出度之和。與無向圖不同,當(dāng)實(shí)體之間的聯(lián)系有方向性時,就需要使用有向圖,例如粉絲關(guān)注圖。8.3.1有向圖及應(yīng)用場景為了更加深入的研究員工溝通頻次,以及方向性,即是主動溝通,還是被動的溝通,我們收集了2020年10月份,數(shù)據(jù)分析組內(nèi)部成員的溝通記錄的詳細(xì)數(shù)據(jù)。為了研究數(shù)據(jù)分析組內(nèi)部員工的溝通情況和方向,我們繪制帶權(quán)重的內(nèi)部員工溝通情況的有向圖,其中箭頭箭尾的員工是主動溝通,箭頭指向的員工是被動溝通,箭頭上的數(shù)值表示權(quán)重(度)。8.3.2Python案例實(shí)戰(zhàn)主動溝通--被動溝通度林丹,蘇冬露俞毅,常明媚邢偉,常明媚

21常明媚,林丹常明媚,呂嬋娟蘇冬露,常明媚林丹,周康36蘇冬露,俞毅呂嬋娟,邢偉

39林丹,俞毅呂嬋娟,俞毅

96目錄1無向圖法網(wǎng)絡(luò)數(shù)據(jù)概述2有向圖法3社交網(wǎng)絡(luò)法4社交網(wǎng)絡(luò)是十分常見的一類圖,代表個人或組織之間的關(guān)系。網(wǎng)絡(luò)中的節(jié)點(diǎn)表示人、組織、計算機(jī)或其他實(shí)體,連線表示節(jié)點(diǎn)之間的關(guān)系或信息流動,信息流動的方式有很多。社交網(wǎng)絡(luò)主要應(yīng)用于深入研究個人或組織,在日常工作、生活、娛樂、購物等過程中,形成的紛繁復(fù)雜的網(wǎng)絡(luò)關(guān)系。例如,使用MicrosoftPowerBI繪制了企業(yè)內(nèi)部員工的社交網(wǎng)絡(luò)。8.4.1社交網(wǎng)絡(luò)及應(yīng)用場景客戶在購買商品后,通過社交平臺等分享購買體驗(yàn),所有客戶之間就會形成一個龐大的網(wǎng)絡(luò)。我們收集了2020年10月份客戶分享的記錄,包括分享表(share.csv)和邊界表(edges.csv),其中分享表包含分享者和被分享者的ID,邊界表包含開始節(jié)點(diǎn)和結(jié)束節(jié)點(diǎn)。8.4.2Python案例實(shí)戰(zhàn)第9章多元數(shù)據(jù)的可視化目錄1散點(diǎn)圖矩陣法多元數(shù)據(jù)概述2雷達(dá)圖法3平行坐標(biāo)系法4變量降維法5高維多元數(shù)據(jù),指每個數(shù)據(jù)對象具有兩個或兩個以上獨(dú)立或相關(guān)屬性的數(shù)據(jù)。高維多元數(shù)據(jù)在人類社會生活中普遍存在,且數(shù)量和規(guī)模隨著信息化進(jìn)程加深而不斷增長。如果根據(jù)數(shù)據(jù)類型或分析處理需求的不同,高維多元數(shù)據(jù)涉及文本數(shù)據(jù)、層次結(jié)構(gòu)數(shù)據(jù)、網(wǎng)絡(luò)結(jié)構(gòu)數(shù)據(jù)、空間數(shù)據(jù)、時序數(shù)據(jù)等諸多子領(lǐng)域,而每個領(lǐng)域又有其獨(dú)特的分析方法。9.1.1多元數(shù)據(jù)簡介多元數(shù)據(jù)分析能力不足數(shù)據(jù)復(fù)雜度高處理能力有限對于二維和三維數(shù)據(jù)可以采用常規(guī)的可視化方法,即將各屬性的值映射到不同的坐標(biāo)軸。當(dāng)維度超過三維后,可以增加視覺編碼來表示,例如顏色、大小、形狀等,但是對于更高維多元數(shù)據(jù)的可視化,這種方法還是有局限的。9.1.2多元數(shù)據(jù)的可視化多元數(shù)據(jù)的可視化散點(diǎn)圖矩陣法雷達(dá)圖法平行坐標(biāo)系法變量降維法目錄1散點(diǎn)圖矩陣法多元數(shù)據(jù)概述2雷達(dá)圖法3平行坐標(biāo)系法4變量降維法5散點(diǎn)圖矩陣是散點(diǎn)圖的高維擴(kuò)展,它從一定程度上克服了在平面上展示高維多元數(shù)據(jù)的困難,在展示多維數(shù)據(jù)的兩兩關(guān)系時有著不可替代的作用。當(dāng)需要了解多個變量的相關(guān)關(guān)系時,就可以使用散點(diǎn)圖矩陣。例如,研究企業(yè)銷售額(sales)、利潤額(profit)、購買量(amount)和折扣(discount)之間的相關(guān)性大小。9.2.1散點(diǎn)圖矩陣及應(yīng)用場景在Python中,我們也可以很方便的繪制上述案例中商品的銷售額、利潤額、購買量和折扣4個變量的散點(diǎn)圖矩陣,下面使用Seaborn庫繪制4個變量的散點(diǎn)圖矩陣,其中顏色表示每個訂單客戶的價值類型。9.2.2Python案例實(shí)戰(zhàn)目錄1散點(diǎn)圖矩陣法多元數(shù)據(jù)概述2雷達(dá)圖法3平行坐標(biāo)系法4變量降維法5雷達(dá)圖又被叫做蜘蛛網(wǎng)圖,適用于顯示三個或更多的維度的變量。雷達(dá)圖每一個維度的數(shù)據(jù)都分別對應(yīng)一個坐標(biāo)軸,這些坐標(biāo)軸具有相同的圓心,以相同的間距沿著徑向排列,并且各個坐標(biāo)軸的刻度相同。例如,使用百度Echarts可視化工具繪制學(xué)生某次考試成績的雷達(dá)圖,如圖所示。9.3.1雷達(dá)圖及應(yīng)用場景為了比較分析各地區(qū)的客戶流失量,我們收集了2020年前三季度各個地區(qū)的客戶流失數(shù)據(jù)。為了比較分析企業(yè)每個季度在各個地區(qū)的客戶流失情況,我們使用Pygal繪制不同地區(qū)客戶流失量的雷達(dá)圖,其中7個地區(qū)表示7個維度,每個季度的客戶流失量均用一個7邊形表示。9.3.2Python案例實(shí)戰(zhàn)日期華東華北華中華南西南西北東北第一季度32213528394239第二季度30313525413634第三季度36263035354636目錄1散點(diǎn)圖矩陣法多元數(shù)據(jù)概述2雷達(dá)圖法3平行坐標(biāo)系法4變量降維法5平行坐標(biāo)系可以克服傳統(tǒng)的直角坐標(biāo)系難以表達(dá)三維及其以上數(shù)據(jù)的問題。例如,使用百度Echarts可視化工具繪制4個班級某次考試平均成績的平行坐標(biāo)系,如圖所示。9.4.1平行坐標(biāo)系及應(yīng)用場景可以通過可視化的方法比較2020年9月份企業(yè)不同類型商品在全國六個銷售區(qū)域的銷售額情況。為了研究用具、紙張、書架、器具等商品在東北、華北、華東等6個地區(qū)的銷售額情況,我們使用Pyecharts繪制不同類型商品銷售額的平行坐標(biāo)系,其中業(yè)績評估分為較差、一般、較好和優(yōu)秀共4種。9.4.2Python案例實(shí)戰(zhàn)商品類型東北華北華東西南中南西北業(yè)績評估用具1.681.660.32.622.632.22較差紙張4.685.268.36.829.034.62一般書架6.187.266.34.828.033.32一般器具9.189.2613.313.8214.6311.62較好配件8.188.2610.311.8213.0314.52較好設(shè)備12.9818.6615.8319.6215.9318.82優(yōu)秀目錄1散點(diǎn)圖矩陣法多元數(shù)據(jù)概述2雷達(dá)圖法3平行坐標(biāo)系法4變量降維法5當(dāng)研究多變量,并且希望變量個數(shù)較少而得到的信息較多時,就需要變量降維,例如,使用SASJMP對銷售額(sales)、利潤額(profit)、購買量(amount)和折扣(discount)等4個變量進(jìn)行降維。9.5.1變量降維及應(yīng)用場景為了深入研究企業(yè)銷售指標(biāo)評價體系中各指標(biāo)的關(guān)系,我們對2020年第三季度的銷售數(shù)據(jù)進(jìn)行了變量降維,使用的數(shù)據(jù)還是企業(yè)經(jīng)營數(shù)據(jù)(經(jīng)營數(shù)據(jù).txt),包含銷售額、利潤額、購買量和折扣等4個字段。9.5.2Python案例實(shí)戰(zhàn)第10章文本數(shù)據(jù)的可視化目錄1標(biāo)簽云法文本數(shù)據(jù)概述2詞云法3主題河流圖法4文檔散法5文本數(shù)據(jù)是指不能參與算術(shù)運(yùn)算的任何字符,也稱為字符型數(shù)據(jù)。如英文字母、漢字、不作為數(shù)值使用的數(shù)字(單引號開頭)和其他可輸入的字符。文本數(shù)據(jù)不同于傳統(tǒng)數(shù)據(jù)庫中的數(shù)據(jù),它具有半結(jié)構(gòu)化、高維度、數(shù)據(jù)量大、語義性等4個方面的特點(diǎn)。10.1.1文本數(shù)據(jù)簡介文本數(shù)據(jù)單個文本時序文本文檔集合文本可視化可以幫助我們理解、組織、比較和關(guān)聯(lián)文本,能夠更快的告訴我們文本在講什么。例如,對于社交網(wǎng)絡(luò)上的發(fā)言,文本可視化可以幫我們信息歸類;對于新聞事件,文本可視化可以幫我們整理清楚事情的發(fā)展脈絡(luò)、每個人物的關(guān)系等;對于一系列的文檔,我們可以通過文本可視化來找到它們之間的聯(lián)系等。10.1.2文本數(shù)據(jù)的可視化單個文本標(biāo)簽云文檔散詞云文檔集合星系視圖主題地貌時序文本主題河流圖主題流圖歷史流圖目錄1標(biāo)簽云法文本數(shù)據(jù)概述2詞云法3主題河流圖法4文檔散法5標(biāo)簽云是一種關(guān)鍵詞的可視化方法,用于匯總生成的標(biāo)簽或文字內(nèi)容。標(biāo)簽一般是獨(dú)立的詞匯,常常按順序排列,其重要程度又能通過改變字體大小或顏色來表現(xiàn),所以標(biāo)簽云可以靈活地依照字序或熱門程度來檢索標(biāo)簽。當(dāng)需要對文本中的某些詞進(jìn)行重點(diǎn)突出說明時,例如,馬丁·路德·金于1963年8月28日在華盛頓林肯紀(jì)念堂發(fā)表的著名的《我有一個夢想》演講的英文文本的標(biāo)簽云,如圖所示。10.2.1標(biāo)簽云及應(yīng)用場景文本文件(guzhai_tag.txt)中是一段關(guān)于貴州美麗山水的描述,數(shù)據(jù)如圖所示。下面使用Pytagcloud庫對其進(jìn)行可視化分析,首先需要去除內(nèi)容中的非法字符,然后使用Counter()方法生成詞語的詞頻,最后生成標(biāo)簽云。10.2.2Python案例實(shí)戰(zhàn)目錄1標(biāo)簽云法文本數(shù)據(jù)概述2詞云法3主題河流圖法4文檔散法5詞云最早是由美國西北大學(xué)新聞學(xué)副教授、新媒體專業(yè)主任里奇·戈登(RichGordon)提出。詞云是通過形成“關(guān)鍵詞云層”或“關(guān)鍵詞渲染”,對文本中出現(xiàn)頻率較高的“關(guān)鍵詞”在視覺上的突出顯示。文本分析一般通過生成詞云(WordCloud)的方式進(jìn)行展現(xiàn),例如,使用MicrosoftPowerBI繪制了2020年企業(yè)主要暢銷商品的詞云,如圖所示。10.3.1詞云及應(yīng)用場景文本文件(guzhai_word.txt)中是一段關(guān)于貴州美麗山水的描述,數(shù)據(jù)如圖所示。下面使用Python對其進(jìn)行可視化分析,首先使用jieba分詞庫對文本進(jìn)行分詞,然后過濾掉不需要和無意義的詞匯,并統(tǒng)計詞頻,最后根據(jù)詞語的詞頻生成詞云,其中詞語的顏色和大小表示詞頻的大小。10.3.2Python案例實(shí)戰(zhàn)目錄1標(biāo)簽云法文本數(shù)據(jù)概述2詞云法3主題河流圖法4文檔散法5時序文本是指具有時間或順序特性的文本,例如一篇小說故事情節(jié)的變化,或一個新聞事件隨時間的演化。主題河流圖是一種經(jīng)典的時序文本可視化方法。光陰似水,用河流來隱喻時間的變化幾乎所有人都能非常好地理解。當(dāng)需要表示事件或主題在一段時間內(nèi)的變化,用不同顏色的條帶狀河流表示不同的事件或主題,寬度表示數(shù)據(jù)值時,通常使用主題河流圖。10.4.1主題河流圖及應(yīng)用場景客戶就是上帝,客戶投訴是消費(fèi)者對商家的產(chǎn)品質(zhì)量問題,服務(wù)態(tài)度等各方面的原因投訴。2020年8月份客戶的投訴數(shù)據(jù)如表所示。為了研究客戶投訴的類型和數(shù)量變化,下面使用Pyecharts庫,繪制投訴問題的主題河流圖,其中橫軸是客戶投訴的日期,縱軸是投訴問題的數(shù)量,顏色表示投訴問題的類型。10.4.2Python案例實(shí)戰(zhàn)datecountcategory2020/8/128產(chǎn)品質(zhì)量2020/8/1144服務(wù)態(tài)度2020/8/1313售后服務(wù)2020/8/279產(chǎn)品質(zhì)量2020/8/2372服務(wù)態(tài)度2020/8/2313售后服務(wù)………目錄1標(biāo)簽云法文本數(shù)據(jù)概述2詞云法3主題河流圖法4文檔散法5文檔散以放射狀層次圓環(huán)的形式展示文本結(jié)構(gòu),上下文的層次關(guān)系基于Wordnet方法獲得。在文本數(shù)據(jù)的可視化中,文本關(guān)系的可視化可以分為基于文本內(nèi)在關(guān)系的可視化和基于文本外在關(guān)系的可視化,前者主要關(guān)注文本內(nèi)部的結(jié)構(gòu)和語義關(guān)系,后者則更關(guān)注于文本間的引用關(guān)系、主題相似性等。10.5.1文檔散及應(yīng)用場景貴州山水文本中的關(guān)鍵詞等級數(shù)據(jù)如表所示。為了研究貴州山水文本中的關(guān)鍵詞等級,下面使用Pyecharts中的旭日圖呈現(xiàn)文檔散的效果,通過旭日圖的徑向布局體現(xiàn)詞語的語義等級,其中處于同一環(huán)上的詞語等級是一樣的。10.5.2Python案例實(shí)戰(zhàn)古寨山水山巒疊翠

水如明鏡

日落夕陽萬家燈火建筑吊腳樓

博物館宗教文化節(jié)日文化苗族苗族人熱情好客

民風(fēng)民俗

第11章我國人口現(xiàn)狀及趨勢分析目錄1人口總數(shù)及結(jié)構(gòu)分析數(shù)據(jù)采集及整理2人口增長率數(shù)據(jù)建模3人口撫養(yǎng)比數(shù)據(jù)建模4在國家統(tǒng)計局官方網(wǎng)站,有從新中國成立到2019年的人口相關(guān)數(shù)據(jù)。11.1.1人口數(shù)據(jù)來源與采集獲取原數(shù)據(jù)之后,由于數(shù)據(jù)量較少,可以直接在Excel中進(jìn)行數(shù)據(jù)清洗,提取出我們需要的數(shù)據(jù),然后整理保存到MySQL數(shù)據(jù)庫中。11.1.2人口數(shù)據(jù)清洗與整理目錄1人口總數(shù)及結(jié)構(gòu)分析數(shù)據(jù)采集及整理2人口增長率數(shù)據(jù)建模3人口撫養(yǎng)比數(shù)據(jù)建模42019年年底,我國人口總數(shù)已經(jīng)超過14億,為了深入分析我國人口未來幾年的趨勢,我們繪制了最近20年年末總?cè)丝诘恼劬€圖,其中橫軸是年份,縱軸是人口數(shù)。11.2.1人口總數(shù)趨勢分析為了分析人口的男女性別比,我們繪制了最近20年,男女性別比的折線圖,其中橫軸是年份,縱軸是男女性別比。11.2.2人口男女性別分析為了分析人口的年齡結(jié)構(gòu),我們繪制了0-14歲、15-64歲、65歲及以上三個年齡段的散點(diǎn)圖,其中橫軸是年份,縱軸是不同年齡段的人口數(shù)。11.2.3人口年齡結(jié)構(gòu)分析目錄1人口總數(shù)及結(jié)構(gòu)分析數(shù)據(jù)采集及整理2人口增長率數(shù)據(jù)建模3人口撫養(yǎng)比數(shù)據(jù)建模4為了研究我國人口出生率、死亡率和自然增長率三者之間的關(guān)系,我們繪制了三個變量的散點(diǎn)圖,其中橫軸是年份,縱軸是人口出生率、死亡率和自然增長率(單位:‰)。11.3.1人口增長率趨勢分析為了深入研究我國人口出生率、死亡率和自然增長率三者之間的相關(guān)關(guān)系,我們繪制了三者的相關(guān)系數(shù)熱力圖,其中橫軸和縱軸均是人口出生率、死亡率和自然增長率,顏色的深淺表示相關(guān)系數(shù)的大小。11.3.2人口增長率相關(guān)分析為了深入分析最近20年我國人口出生率與自然增長率之間的函數(shù)關(guān)系,我們對其進(jìn)行了線性回歸分析,其中橫軸是人口出生率,縱軸是自然增長率。11.3.3人口增長率回歸分析為了檢驗(yàn)上述回歸模型的優(yōu)劣,我們繪制了線性回歸模型的殘差散點(diǎn)圖,其中橫軸是人口出生率,縱軸是殘差。目錄1人口總數(shù)及結(jié)構(gòu)分析數(shù)據(jù)采集及整理2人口增長率數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論