大數(shù)據(jù)可視化課件_第1頁
大數(shù)據(jù)可視化課件_第2頁
大數(shù)據(jù)可視化課件_第3頁
大數(shù)據(jù)可視化課件_第4頁
大數(shù)據(jù)可視化課件_第5頁
已閱讀5頁,還剩271頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、BIG DATA大數(shù)據(jù)可視化第1頁,共276頁。第1章 大數(shù)據(jù)可視化概述1.1大數(shù)據(jù)可視化的概念1.2數(shù)據(jù)可視化的作用與意義1.3數(shù)據(jù)可視化的應(yīng)用領(lǐng)域1.4與相關(guān)學科關(guān)系高級大數(shù)據(jù)技術(shù)系列of252習題第2頁,共276頁。1.1大數(shù)據(jù)可視化的概念第1章 大數(shù)據(jù)可視化概述數(shù)據(jù)可視化主要旨在借助于圖形化手段,清晰有效地傳達與溝通信息。of253定義數(shù)據(jù) 圖形可視化數(shù)據(jù)空間視覺空間數(shù)據(jù):聚焦于解決數(shù)據(jù)的采集,清理,預處理,分析,挖掘。圖形:聚焦于解決對光學圖像進行接收、提取信息、加工變換、模式識別及存儲顯示??梢暬壕劢褂诮鉀Q將數(shù)據(jù)轉(zhuǎn)換成圖形,并進行交互處理。第3頁,共276頁。1.1大數(shù)據(jù)可視化的

2、概念第1章 大數(shù)據(jù)可視化概述of254數(shù)據(jù)可視化分層1數(shù)據(jù)統(tǒng)計圖表化階段-表達歷史數(shù)據(jù),省略過程數(shù)據(jù)2數(shù)據(jù)結(jié)果展示化功能強大、交互性強、適用范圍廣;集成了大量的圖形算法、可視化算法,降低復雜的圖表的成本。3數(shù)據(jù)分析過程可視化需要對數(shù)據(jù)的分析過程進行可視化,更好的探索規(guī)律、查找問題4VR/AR 階段的虛擬現(xiàn)實的可視化虛擬現(xiàn)實提升概率思維、多維數(shù)據(jù)的可視化、高密度信息的展示、以及提供情境使人們更全面地理解問題。5人工智能串聯(lián)決策層(人)和數(shù)據(jù)層的最佳橋梁。發(fā)現(xiàn)大數(shù)據(jù)背后隱含的規(guī)律,產(chǎn)生洞見。第4頁,共276頁。1.1大數(shù)據(jù)可視化的概念第1章 大數(shù)據(jù)可視化概述of255數(shù)據(jù)可視化技術(shù)包含以下幾個基本

3、概念:數(shù)據(jù)空間:是由n維屬性和m個元素組成的數(shù)據(jù)集所構(gòu)成的多維信息空間;數(shù)據(jù)開發(fā):是指利用一定的算法和工具對數(shù)據(jù)進行定量的推演和計算;數(shù)據(jù)分析:指對多維數(shù)據(jù)進行切片、塊、旋轉(zhuǎn)等動作剖析數(shù)據(jù),從而能多角度多側(cè)面觀察數(shù)據(jù);數(shù)據(jù)可視化:是指將大型數(shù)據(jù)集中的數(shù)據(jù)以圖形圖像形式表示,并利用數(shù)據(jù)分析和開發(fā)工具發(fā)現(xiàn)其中未知信息的處理過程。數(shù)據(jù)可視化已經(jīng)提出了許多方法,這些方法根據(jù)其可視化的原理不同可以劃分為基于幾何的技術(shù)、面向像素技術(shù)、基于圖標的技術(shù)、基于層次的技術(shù)、基于圖像的技術(shù)和分布式技術(shù)等等。第5頁,共276頁。第1章 大數(shù)據(jù)可視化概述大數(shù)據(jù)數(shù)據(jù)可視化指的是技術(shù)上較為高級的技術(shù)方法,而這些技術(shù)方法允許

4、利用圖形、圖像處理、計算機視覺以及用戶界面,通過表達、建模以及對立體、表面、屬性以及動畫的顯示,對數(shù)據(jù)加以可視化解釋科學與工程實踐當中對于計算機建模和模擬的運用異質(zhì)性數(shù)據(jù)集的分析工作提供支持科學可視化。信息可視化數(shù)據(jù)可視化of2561.1大數(shù)據(jù)可視化的概念數(shù)據(jù)可視化領(lǐng)域的起源第6頁,共276頁。1.1大數(shù)據(jù)可視化的概念1.2數(shù)據(jù)可視化的作用與意義第1章 大數(shù)據(jù)可視化概述1.3數(shù)據(jù)可視化的應(yīng)用領(lǐng)域1.4與相關(guān)學科關(guān)系高級大數(shù)據(jù)技術(shù)系列of257習題第7頁,共276頁。1.2.1數(shù)據(jù)可視化的作用第1章 大數(shù)據(jù)可視化概述of2581數(shù)據(jù)記錄和表達2數(shù)據(jù)操作3數(shù)據(jù)分析第8頁,共276頁。1.2.2數(shù)據(jù)

5、可視化的意義第1章 大數(shù)據(jù)可視化概述of2591視覺是人類獲得信息的最主要途徑2數(shù)據(jù)可視化的主要優(yōu)勢3可視化能夠幫助人們提高理解與處理數(shù)據(jù)的效率4. 數(shù)據(jù)可視化能夠在小空間中展示大規(guī)模數(shù)據(jù)表1-1 Anscombe的4組數(shù)據(jù)(Anscombes quartet)xyxyxyxy10.08.0410.09.1410.07.468.06.588.06.958.08.148.06.778.05.7613.07.5813.08.7413.012.748.07.719.08.819.08.779.07.118.08.8411.08.3311.09.2611.07.818.08.4714.09.9614.

6、08.1014.08.848.07.046.07.246.06.136.06.088.05.254.04.264.03.104.05.3919.012.5012.010.8412.09.1312.08.158.05.567.04.827.07.267.06.428.07.915.05.685.04.745.05.738.06.89第9頁,共276頁。1.2.2數(shù)據(jù)可視化的意義第1章 大數(shù)據(jù)可視化概述of2510平均值 (Means): X =9 Y = 7.5方差(Variance): X =11 Y =4.112相關(guān)度 (Correlation):X-Y:0.816線性回歸(Linear r

7、egression):Y=3.0+0.5X圖 1-3 Anscombes quartet的可視化顯示第10頁,共276頁。1.2.2數(shù)據(jù)可視化的意義第1章 大數(shù)據(jù)可視化概述of2511斯諾的霍亂地圖第11頁,共276頁。第1章 大數(shù)據(jù)可視化概述1.1大數(shù)據(jù)可視化的概念1.2數(shù)據(jù)可視化的作用與意義1.4與相關(guān)學科關(guān)系高級大數(shù)據(jù)技術(shù)系列of2512習題1.3數(shù)據(jù)可視化的應(yīng)用領(lǐng)域第12頁,共276頁。1.3 數(shù)據(jù)可視化的應(yīng)用領(lǐng)域第1章 大數(shù)據(jù)可視化概述of2513在工業(yè)4.0中的應(yīng)用在智能交通中的應(yīng)用在新一代人工智能領(lǐng)域的應(yīng)用在其它領(lǐng)域的應(yīng)用第13頁,共276頁。應(yīng)用第1章 大數(shù)據(jù)可視化概述of25

8、14第14頁,共276頁。第1章 大數(shù)據(jù)可視化概述1.1大數(shù)據(jù)可視化的概念1.2數(shù)據(jù)可視化的作用與意義1.4與相關(guān)學科關(guān)系高級大數(shù)據(jù)技術(shù)系列of2515習題1.3數(shù)據(jù)可視化的應(yīng)用領(lǐng)域第15頁,共276頁。1.4與相關(guān)學科關(guān)系第1章 大數(shù)據(jù)可視化概述of2516與計算機圖形學的關(guān)系與計算機視覺的關(guān)系與計算仿真的關(guān)系與人機交互的關(guān)系與數(shù)據(jù)庫的關(guān)系與數(shù)據(jù)分析和數(shù)據(jù)挖掘的關(guān)系第16頁,共276頁。感謝聆聽第17頁,共276頁。第2章 可視化的類型與模型 2.12.2可視化的模型 習題高級大數(shù)據(jù)人才培養(yǎng)系列教材可視化的類型of3518第18頁,共276頁。2.1可視化的類型第2章 可視化的類型與模型 科

9、學可視化最初稱為“科學計算之中的可視化”(Visualization In Scientific Computing,VISC) 運用計算機圖形學和圖像處理的研究成果創(chuàng)建視覺圖像,替代那些規(guī)模龐大而又錯綜復 雜的數(shù)字化呈現(xiàn)形式,幫助人們更好地理解科學技術(shù)概念和科學數(shù)據(jù)結(jié)果。 of3519科學可視化 第19頁,共276頁。2.1可視化的類型第2章 可視化的類型與模型 of3520科學可視化 的研究重點有兩個科學可視化 的研究重點有兩個一是判斷可視化對象的類別,判斷類別之后才能確定如何用計算機 來進行可視化表現(xiàn);二是將研究對象以最接近真實事物的效果快速地繪制出來,不僅以 單純展示的方式顯現(xiàn)出來,而

10、且能通過虛擬空間的方式讓人們身臨其境,用視覺、觸覺 等交互方式進行觀察、理解和研究。 第20頁,共276頁。科學可視化的發(fā)展方向 第2章 可視化的類型與模型 1)計算機動畫 科學可視化的發(fā)展方向 2)計算機模擬 4)界面技術(shù)與感知 5)遠程可視化 5)遠程可視化 3)視覺通信 of3521。第21頁,共276頁??茖W可視化的分類 第2章 可視化的類型與模型 of3522體可視化研究對象主要是體數(shù)據(jù),即三維采樣數(shù) 據(jù),是各類科學工程領(lǐng)域以及醫(yī)學領(lǐng)域中常見的數(shù)據(jù)類型(圖 2-1)。體可視化技術(shù)包括 等值面的抽取技術(shù)(Iso-surfaces Extraction Technique)、直接體繪制(

11、Direct Volume Rendering)等。 流場可視化運用計算機圖形學和圖像處理技術(shù),將流場數(shù)據(jù)轉(zhuǎn)換為二維或三維圖 形、圖像或動畫進行呈現(xiàn),并詳細分析其模式和相互關(guān)系,是計算流體力學研究與工程 實踐中不可缺少的手段。 大規(guī)模數(shù)據(jù)可視化 研究重點在于如何高效 快捷地對海量的數(shù)據(jù)進行處理 第22頁,共276頁。科學可視化常用方法 第2章 可視化的類型與模型 of3523顏色映射方法用顏色表示數(shù)據(jù)場中數(shù)據(jù) 值的大小,即在數(shù)據(jù)與顏色之間建立一個映射關(guān)系,把不同的數(shù)據(jù)映射為不同的顏色 等值線方法制圖對象某一數(shù)量指標值相等的各點連成的平滑曲線,由地圖上標出的表示制圖對象數(shù)量的各點采用內(nèi)插法找出各

12、整數(shù)點繪制而成的。每兩條等值線之間的數(shù)量差額多為常數(shù),可通過等值線的疏密程度來判斷現(xiàn)象的數(shù)量變化趨勢。 立體圖法和層次分割法矢量數(shù)據(jù)場 的直接法和流線法通過記錄坐標的方式來盡可能將地理實體的空間位置表現(xiàn)的準確無誤 第23頁,共276頁??茖W可視化系統(tǒng)的組成 第2章 可視化的類型與模型 of3524根據(jù)科學可視化系統(tǒng)主要功能的要求,科學可視化系統(tǒng)大致可由以下幾部分組成: 數(shù)據(jù)的管理與過濾,提取幾何圖元和建立模型,繪制,顯示和播放。 眾多的科學可視化系統(tǒng)采用“可視化流水線”作為理論模型 Topics與日志分析第24頁,共276頁。信息可視化 第2章 可視化的類型與模型 of4225信息可視化是 1

13、989 年由斯圖爾特卡德(Stuart K. Card )、約克麥金利(Jock D. Mackinlay)和喬治羅伯遜(GeorgeG. Robertson)提出的信息可視化就是利用計算機支撐的、交互的、對抽象數(shù)據(jù)的可視表示,增強人們對 這些抽象信息的認知。-即是將非空間數(shù)據(jù)的信息對象的特征值抽取、轉(zhuǎn)換、映射、高度 抽象與整合,用圖形、圖像、動畫等方式表示信息對象內(nèi)容特征和語義的過程。 信息對 象包括文本、圖像、視頻和語音等類型,它們的可視化分別采用不同模型方法實現(xiàn)。 第25頁,共276頁?,F(xiàn)代信息可視化發(fā)展 第2章 可視化的類型與模型 of3526(1)文本信息可視化(2)層次信息可視化(

14、3)Web 信息可視化 (4)可視化數(shù)據(jù)挖掘(5)多維信息可視化 第26頁,共276頁。信息可視化數(shù)據(jù)分類 第2章 可視化的類型與模型 of3527(1)一維線性數(shù)據(jù) (2)二維數(shù)據(jù) (3)三維數(shù)據(jù) (4)多維數(shù)據(jù)(5)時態(tài)數(shù)據(jù)(6)層次數(shù)據(jù)(7)網(wǎng)絡(luò)結(jié)構(gòu) 第27頁,共276頁。信息可視化技術(shù)第2章 可視化的類型與模型 of35281)多維數(shù)據(jù)可視化技術(shù) (1)平行坐標系(2)散點圖 (3)Andrews 曲線法 2)層次數(shù)據(jù)的可視化 (1)節(jié)點連接圖(2)樹圖3)網(wǎng)絡(luò)數(shù)據(jù)可視化 (1)力導向布局(2)分層布局(3)網(wǎng)格布局 第28頁,共276頁。信息可視化技術(shù)第2章 可視化的類型與模型 of

15、3529(1)平行坐標系(1)平行坐標和星形圖的結(jié)合第29頁,共276頁。信息可視化技術(shù)第2章 可視化的類型與模型 of3530鳶尾花數(shù)據(jù)散點圖矩陣第30頁,共276頁。信息可視化技術(shù)第2章 可視化的類型與模型 of3531Andrews曲線第31頁,共276頁。信息可視化技術(shù)第2章 可視化的類型與模型 of3532節(jié)點鏈接圖第32頁,共276頁。信息可視化技術(shù)第2章 可視化的類型與模型 of3533樹圖第33頁,共276頁。信息可視化的基本過程及特征 第2章 可視化的類型與模型 of3534在 CARD 等提出的信息可視化模型中,信息可視化過程可以劃分為 3 個數(shù)據(jù)轉(zhuǎn)換的過程:原始數(shù)據(jù)到數(shù)據(jù)

16、表的轉(zhuǎn)換、數(shù)據(jù)表到可視化結(jié)構(gòu)的轉(zhuǎn)換、可視化結(jié)構(gòu) 到視圖的轉(zhuǎn)換第34頁,共276頁。信息可視化具有以下主要特點第2章 可視化的類型與模型 of3535(1)位置特征(2)直觀形象性(3)多源數(shù)據(jù)的采集和集成性(4)交互探討性(5)信息的動態(tài)性(6)信息載體的多樣性 第35頁,共276頁。信息可視化應(yīng)用領(lǐng)域 第2章 可視化的類型與模型 of35361)可視化數(shù)據(jù)挖掘 2)可視化技術(shù)在空間信息挖掘中的應(yīng)用 3)KM 可視化 4)信息可視化商品 第36頁,共276頁。2.2可視化的模型 第2章 可視化的類型與模型 of3537數(shù)據(jù)可視化的流程分為了七步:獲取、分析、過濾、挖掘、表示、修飾、交互。為了使

17、這個流程更便于理解,把這七步歸納為三大部分,即原始數(shù)據(jù)的轉(zhuǎn)換、數(shù)據(jù)的視覺轉(zhuǎn)換以及界面交互。順序模型01分析模型02(1)數(shù)據(jù)表示與轉(zhuǎn)換(2)數(shù)據(jù)的可視化呈現(xiàn)(3)用戶交互 (4)分析推理循環(huán)模型 03(1)探索循環(huán):(2)驗證循環(huán)(3)知識產(chǎn)生循環(huán)第37頁,共276頁。第2章 可視化的類型與模型 2.12.2可視化的模型 習題高級大數(shù)據(jù)人才培養(yǎng)系列教材可視化的類型of3538第38頁,共276頁。順序模型第2章 可視化的類型與模型 of3539 順序模型1.原始數(shù)據(jù)的轉(zhuǎn)換 原始數(shù)據(jù)的轉(zhuǎn)換包括 7 個階段里的獲取、分析、過濾和挖掘。 2.數(shù)據(jù)的視覺轉(zhuǎn)換 數(shù)據(jù)的視覺轉(zhuǎn)換包括 7 個階段里的表示和修

18、飾。 3.界面交互 界面交互包括 7 個階段里的交互。 第39頁,共276頁。分析模型第2章 可視化的類型與模型 of3540分析模型1.數(shù)據(jù)表示與轉(zhuǎn)換 2.數(shù)據(jù)的可視化呈現(xiàn) 3.用戶交互 4.分析推理 第40頁,共276頁。分析模型第2章 可視化的類型與模型 of3541可視分析中的知識產(chǎn)生模型第41頁,共276頁。循環(huán)模型 第2章 可視化的類型與模型 of3542循環(huán)模型 該模型包含左邊計算機的部分和右邊人的部分。在計算機部分中, 數(shù)據(jù)被繪制為可視化圖表,同時也通過模型進行整理和挖掘。在人的部分中,提出了 3 層循環(huán):探索循環(huán)、驗證循環(huán)和知識產(chǎn)生循環(huán)。 第42頁,共276頁。1對數(shù)據(jù)可視化

19、的三種類型進行對比分析。2對數(shù)據(jù)可視化的三種基本模型進行對比分析。3列出在研究中經(jīng)常使用的數(shù)據(jù)可視化工具,并進行對比分析。4研究Microsoft Office 中的數(shù)據(jù)可視化技術(shù)。5研究MySQL 數(shù)據(jù)庫中的數(shù)據(jù)可視化技術(shù)。6研究數(shù)據(jù)倉庫中常用的數(shù)據(jù)可視化技術(shù)。7自學顏色刺激理論,并探討其對數(shù)據(jù)可視化的意義。8結(jié)合自己的專業(yè)領(lǐng)域,采用數(shù)據(jù)可視化方法展示該領(lǐng)域的典型文獻數(shù)據(jù)。習題:第43頁,共276頁。感謝聆聽第44頁,共276頁。第三章數(shù)據(jù)可視化基礎(chǔ)3.1光與視覺特性3.2可視化的基本特征3.3可視化流程of37453.5可視化中的美學因素3.6可視化框架設(shè)計整體思路習題3.4可視化設(shè)計組件

20、第45頁,共276頁。3.1 光與視覺特性第三章 數(shù)據(jù)可視化基礎(chǔ)of37463.1.1 光的特性可見光譜的波長由780 nm向380 nm變化時,人眼產(chǎn)生的顏色感覺依次是紅、橙、黃、綠、青、藍、紫7色。一定波長的光譜呈現(xiàn)的顏色稱為光譜色。太陽光包含全部可見光譜,給人以白色感覺。第46頁,共276頁。3.1 光與視覺特性第三章 數(shù)據(jù)可視化基礎(chǔ)of37473.1.2 三基色原理三基色原理是根據(jù)色度學中著名的格拉茲曼法則和配色實驗總結(jié)出來的,它把彩色電視系統(tǒng)需要傳送成千上萬種顏色的任務(wù)簡化成只需傳送3種基本顏色,包含以下規(guī)則: 人的視覺只能分辨顏色的3種變化,即亮度、色調(diào)和色飽和度。 任何彩色均可以

21、由3種線性無關(guān)的彩色混合得到時,稱這3種彩色為三基色。合成彩色光的亮度等于三基色分量亮度之和,即符合亮度相加定律。光譜組成成分不同的光在視覺上可能具有相同的顏色外貌,及相同的彩色感覺。在由兩個成分組成的混合色中,如果一個成分連續(xù)變化,混合色也連續(xù)變化。 1)補色律:每種顏色都有一個相應(yīng)的補色。 2)中間色律:任何兩個非補色的色光相混合,可產(chǎn)生出它們兩個色調(diào)之間的新 的中間色調(diào)。第47頁,共276頁。3.1 光與視覺特性第三章 數(shù)據(jù)可視化基礎(chǔ)of37483.1.2 三基色原理三基色原理:自然界中幾乎所有的彩色都能由3種線性無關(guān)的色光按一定比例混配得到,合成彩色的亮度由3種色光的亮度之和決定,色度

22、由3種色光所占比例決定。線性無關(guān)是指3種色光必須相互獨立,其中任何一種色光都不能由其他兩種色光混配得到。第48頁,共276頁。3.1 光與視覺特性第三章 數(shù)據(jù)可視化基礎(chǔ)of37493.1.3 黑白視覺特性視敏特性:指人眼對不同波長和光具有不同靈敏度的特性,即對于輻射功率相同的各色光具有不同的亮度感覺。在相同的輻射功率條件下,人眼感到最亮的光是黃綠光,而感覺最暗的光是紅光和紫光。視敏特性可用視敏函數(shù)和相對視敏函數(shù)來描述。第49頁,共276頁。3.1 光與視覺特性第三章 數(shù)據(jù)可視化基礎(chǔ)of37503.1.3 黑白視覺特性 亮度感覺 亮度感覺不僅僅取決于景物給出的亮度值,而且還與周圍環(huán)境的平均亮度有

23、關(guān),是一個主觀量。人眼感光適應(yīng)性適應(yīng)性是指隨著外界光的強弱變化,人眼能自動調(diào)節(jié)感光靈敏度的特性。亮度視覺范圍人眼的亮度感覺不僅僅取決于景物本身的亮度值,而且還與環(huán)境亮度有關(guān)。 亮度可見度閾值 人眼對亮度變化的分辨能力是有限的,人眼無法區(qū)分非常微弱的亮度變化。通常用亮度級差來表示人眼剛剛能感覺到的兩者的差異。人眼視覺的掩蓋效應(yīng)如果是在空間和時間上不均勻的背景中,測量可見度閾值,可見度閾值就會增大,即人眼會喪失分辨一些亮度的能力第50頁,共276頁。3.1 光與視覺特性第三章 數(shù)據(jù)可視化基礎(chǔ)of37513.1.3 黑白視覺特性 對比度 把景物或重現(xiàn)圖像最大亮度Lmax和最小亮度Lmin的比值稱為對

24、比度。亮度層次畫面最大亮度與最小亮度之間可分辨的亮度級差數(shù)稱為亮度層次或灰度層次。視覺惰性人眼的視覺有惰性,這種惰性現(xiàn)象也稱為視覺的暫留。 閃爍 觀察者觀察按時間重復的亮度脈沖,當脈沖重復頻率不夠高時,人眼就有一亮一暗的感覺,稱為閃爍。視角觀看景物時,景物大小對眼睛形成的張角叫做視角。 分辨力 當與人眼相隔一定距離的兩個黑點靠近到一定程度時,人眼就分辨不出有兩個黑點存在,而只感覺到是連在一起的一個點。這種現(xiàn)象表明人眼分辨景物細節(jié)的能力是有一定極限的。第51頁,共276頁。3.1 光與視覺特性第三章 數(shù)據(jù)可視化基礎(chǔ)of37523.1.4 彩色視覺特性 辨色能力 亮度、色調(diào)和飽和度稱為彩色的三要素

25、。人眼對不同波長的譜色光有不同的色調(diào)感覺。人眼的彩色視覺的辨色能力總共有30004000種。人眼對彩色感覺具有非單一性。顏色感覺相同,光譜組成可以不同。彩色細節(jié)分辨力畫面最大亮度與最小亮度之間可分辨的亮度級差數(shù)稱為亮度層次或灰度層次。人眼對彩色細節(jié)的分辨力比對黑白細節(jié)的分辨力要低,只有對黑白細節(jié)分辨力的1/31/5?;焐匦曰焐匦园〞r間混色、空間混色和雙眼混色等。第52頁,共276頁。第三章數(shù)據(jù)可視化基礎(chǔ)3.1光與視覺特性3.2可視化的基本特征3.3可視化流程of37533.5可視化中的美學因素3.6可視化框架設(shè)計整體思路習題3.4可視化設(shè)計組件第53頁,共276頁。3.2 數(shù)據(jù)可視化的基

26、本特征第三章 數(shù)據(jù)可視化基礎(chǔ)of3754 易懂性 可視化使人們更加容易地理解數(shù)據(jù)和使用數(shù)據(jù),進而便于人們將數(shù)據(jù)與他們的經(jīng)驗知識相關(guān)聯(lián)。可視化使得原本碎片化的數(shù)據(jù)轉(zhuǎn)換為具有特定結(jié)構(gòu)的知識,從而為科學決策支持提供強有力的支持。必然性數(shù)據(jù)量已遠遠超出了人們直接讀取、瀏覽和操作數(shù)據(jù)的能力,必然要求人們對數(shù)據(jù)進行形象化的歸納和總結(jié),對數(shù)據(jù)的結(jié)構(gòu)和表現(xiàn)形式進行有效的轉(zhuǎn)換處理。多維性通過數(shù)據(jù)可視化的多維呈現(xiàn),能夠清楚地對數(shù)據(jù)相關(guān)的多個變量或者多個屬性進行標識,并且所處理的數(shù)據(jù)可以根據(jù)每一維的量值來進行顯示、組合、排序與分類。 片面性 數(shù)據(jù)可視化往往只是從特定的視角或需求來認識數(shù)據(jù),并得到符合特定目的的可視化

27、模式。數(shù)據(jù)可視化的片面性特征意味著可視化模式不能替代數(shù)據(jù)本身,只能作為數(shù)據(jù)表達的一種特定形式。專業(yè)性數(shù)據(jù)可視化與領(lǐng)域?qū)I(yè)知識緊密相關(guān),其形式需求多種多樣并隨行業(yè)、用戶和環(huán)境等條件而動態(tài)變化。專業(yè)化特征是人們從可視化模型中提取專業(yè)知識的必要環(huán)節(jié),是數(shù)據(jù)可視化應(yīng)用的最后流程。第54頁,共276頁。第三章數(shù)據(jù)可視化基礎(chǔ)3.1光與視覺特性3.2可視化的基本特征3.3可視化流程of37553.5可視化中的美學因素3.6可視化框架設(shè)計整體思路習題3.4可視化設(shè)計組件第55頁,共276頁。3.3 可視化流程第三章 數(shù)據(jù)可視化基礎(chǔ)of37563.3.1 數(shù)據(jù)可視化的基本步驟12345明確問題開始創(chuàng)建一個可視化

28、項目時,第一步是要明確可視化項目要解決的問題從基本的可視化著手確定可視化的目標后,下一步是基于要展現(xiàn)的數(shù)據(jù),選擇建立一個基本的圖形,不同類型的數(shù)據(jù)各自有其最適合的圖表類型確定最富有信息的指標確定可視化目標和可視化形式后,下一步需要確定最能提供信息的指標,以便于信息準確表達選擇正確的圖表類型在確定最能提供信息的指標后,選取正確的圖表類型有助于用戶理解數(shù)據(jù)中隱含的信息和規(guī)律。將注意力引向關(guān)鍵信息最后,采用確定的圖表展現(xiàn)數(shù)據(jù)可視化結(jié)果時,需要將用戶的注意力引向關(guān)鍵的信息??梢暬椖繎?yīng)該總結(jié)關(guān)鍵信息并使之更清晰直白,而不應(yīng)該令人困惑。第56頁,共276頁。3.3 可視化流程第三章 數(shù)據(jù)可視化基礎(chǔ)of3

29、7573.3.2 數(shù)據(jù)可視化模型1科學可視化的可視化流水線2數(shù)據(jù)可視化循環(huán)模型第57頁,共276頁。3.3 可視化流程第三章 數(shù)據(jù)可視化基礎(chǔ)of37581數(shù)據(jù)獲取主動式是以明確的數(shù)據(jù)需求為目的,如衛(wèi)星影像、測繪工程等;被動式是以數(shù)據(jù)平臺為基礎(chǔ),由數(shù)據(jù)平臺的活動者提供數(shù)據(jù)來源,如電子商務(wù)、網(wǎng)絡(luò)論壇等。2數(shù)據(jù)處理數(shù)據(jù)處理是指對原始的數(shù)據(jù)進行質(zhì)量分析、預處理和計算等步驟。數(shù)據(jù)處理的目標是保證數(shù)據(jù)的準確性、可用性。3可視化模式可視化模式是數(shù)據(jù)的一種特殊展現(xiàn)形式,常見的可視化模式有標簽云、序列分析、網(wǎng)絡(luò)結(jié)構(gòu)、電子地圖等。可視化模式的選取決定了可視化方案的雛形。4可視化應(yīng)用可視化應(yīng)用主要根據(jù)用戶的主觀需求

30、展開,最主要的應(yīng)用方式是用來觀察和展示,通過觀察和人腦分析進行推理和認知,輔助人們發(fā)現(xiàn)新知識或者得到新結(jié)論。第58頁,共276頁。第三章數(shù)據(jù)可視化基礎(chǔ)3.1光與視覺特性3.2可視化的基本特征3.3可視化流程of37593.5可視化中的美學因素3.6可視化框架設(shè)計整體思路習題3.4可視化設(shè)計組件第59頁,共276頁。3.4數(shù)據(jù)可視化設(shè)計組件第三章 數(shù)據(jù)可視化基礎(chǔ)of37603.4.1 可視化設(shè)計模型數(shù)據(jù)可視化的設(shè)計可簡化為四個層次,各層之間是嵌套的關(guān)系,外層的輸出是內(nèi)層的輸入,同時外層的錯誤最終會級聯(lián)傳導到各內(nèi)層。第一層(最外層)概括描述用戶遇到的實際問題,稱為問題描述層;第二層是抽象層,負責將

31、特定領(lǐng)域的任務(wù)和數(shù)據(jù)映射到抽象且通用的任務(wù)及數(shù)據(jù)類型;第三層是編碼層,設(shè)計與數(shù)據(jù)類型相關(guān)的視覺編碼及交互方法;第四層(最內(nèi)層)則需要實現(xiàn)正確完成數(shù)據(jù)可視化展示和交互的算法。第60頁,共276頁。3.4數(shù)據(jù)可視化設(shè)計組件第三章 數(shù)據(jù)可視化基礎(chǔ)of37613.4.2 可視化設(shè)計原則 三個原則 1、過于復雜繁瑣的可視化可能會給用戶帶來理解上的麻煩,甚至會引起用戶對原始數(shù)據(jù)信息的誤解;2、缺少友好交互控制的可視化也會阻礙用戶以更直觀的方式獲得可視化所包含的信息;3、美學因素也在一定程度上影響用戶對可視化設(shè)計的喜好或厭惡情緒,進而影響可視化傳播和表達信息的能力。 三個步驟 1、確定數(shù)據(jù)到圖形元素(即標記

32、)和視覺通道的映射,明確需要呈現(xiàn)的是什么樣的數(shù)據(jù);2、視圖的選擇與用戶交互控制的設(shè)計,建立恰當?shù)臄?shù)據(jù)指標,從總體到局部逐步展示數(shù)據(jù)結(jié)果;3、數(shù)據(jù)的有效篩選并注重數(shù)據(jù)的比較,即確定在有限的可視化視圖空間中選擇適當容量的信息進行編碼,以避免在數(shù)據(jù)量過大情況下產(chǎn)生視覺上的混亂。第61頁,共276頁。3.4數(shù)據(jù)可視化設(shè)計組件第三章 數(shù)據(jù)可視化基礎(chǔ)of37623.4.3 可視化的數(shù)據(jù) 認知數(shù)據(jù) 人們對數(shù)據(jù)的認知,一般都經(jīng)過從數(shù)據(jù)模型到概念模型的過程,最后得到數(shù)據(jù)在實際中的具體語義。在處理數(shù)據(jù)時,最初接觸的是數(shù)據(jù)模型,數(shù)據(jù)模型是對數(shù)據(jù)的底層描述及相關(guān)操作。概念模型是對數(shù)據(jù)的高層次描述,對應(yīng)于人們對數(shù)據(jù)的具

33、體認知。對數(shù)據(jù)進行進一步處理之前,需要定義數(shù)據(jù)的概念和它們之間的聯(lián)系,同時定義數(shù)據(jù)的語義和它們所代表的含義。 數(shù)據(jù)分類 根據(jù)數(shù)據(jù)分析要求,不同的應(yīng)用可以采用不同的數(shù)據(jù)分類方法。例如,根據(jù)數(shù)據(jù)模型,可以將數(shù)據(jù)分為浮點數(shù)、整數(shù)、字符等;根據(jù)概念模型,可以定義數(shù)據(jù)所對應(yīng)的實際意義或者對象,例如汽車、摩托車、自行車等。在科學計算中,通常根據(jù)測量標度,將數(shù)據(jù)分為四類:類別型數(shù)據(jù)、有序型數(shù)據(jù)、區(qū)間型數(shù)據(jù)和比值型數(shù)據(jù)。類別型數(shù)據(jù)用于區(qū)分物體,有序型數(shù)據(jù)用來表示對象間的順序關(guān)系,區(qū)間型數(shù)據(jù)用于得到對象間的定量比較,比值型數(shù)據(jù)用于比較數(shù)值間的比例關(guān)系,可以精確地定義比例。第62頁,共276頁。3.4數(shù)據(jù)可視化設(shè)

34、計組件第三章 數(shù)據(jù)可視化基礎(chǔ)of37633.4.4 可視化的原材料1視覺暗示可視化最基本的形式就是簡單地把數(shù)據(jù)映射成彩色圖形??梢暬故颈仨毐WC可以在圖形和它所代表的數(shù)字間來回切換。2坐標系編碼數(shù)據(jù)的時候,總得把物體放到一定的位置。有一個結(jié)構(gòu)化的空間,還要指定圖形和顏色畫在哪里的規(guī)則,這就是坐標系,它賦予 X、Y 坐標或經(jīng)緯度以意義。34標尺坐標系指定了可視化的維度,而標尺則指定了在每一個維度里數(shù)據(jù)映射到哪里。標尺有多種,但基本上不會偏離以下三種標尺,分別為數(shù)字標尺、分類標尺和時間標尺。背景信息背景信息(幫助更好地理解數(shù)據(jù)相關(guān)的 5W 信息,即何人、何事、何時、何地、為何)可以使數(shù)據(jù)更清晰,并

35、且能正確引導數(shù)據(jù)使用者。第63頁,共276頁。3.4數(shù)據(jù)可視化設(shè)計組件第三章 數(shù)據(jù)可視化基礎(chǔ)of37643.4.5 可視化的基本圖表 原始數(shù)據(jù)繪圖 原始數(shù)據(jù)繪圖用于可視化原始數(shù)據(jù)的屬性值,直觀呈現(xiàn)數(shù)據(jù)特征,其代表性方法包括:數(shù)據(jù)軌跡、柱狀圖、折線圖、直方圖、餅圖、等值線圖、散點圖、氣泡圖、維恩圖、熱力圖和雷達圖等。 簡單統(tǒng)計值標繪 盒須圖是John Tukey發(fā)明的通過標繪簡單的統(tǒng)計值來呈現(xiàn)一維和二維數(shù)據(jù)分布的一種方法。它的基本形式是用一個長方形盒子表示數(shù)據(jù)的大致范圍,并在盒子中用橫線標明均值的位置。同時,在盒子上部和下部分別用兩根橫線標注最大值和最小值。盒須圖在實驗數(shù)據(jù)的統(tǒng)計分析中很有用。針

36、對二維數(shù)據(jù),標準的一維盒須圖可以根據(jù)需要擴充為二維盒須圖。 多視圖協(xié)調(diào)關(guān)聯(lián) 多視圖協(xié)調(diào)關(guān)聯(lián)將不同類型的繪圖組合起來,每個繪圖單元可以展現(xiàn)數(shù)據(jù)某方面的屬性,并且通常允許用戶進行交互分析,提升用戶對數(shù)據(jù)的模式識別能力。在多視圖協(xié)調(diào)關(guān)聯(lián)應(yīng)用中,“選擇”操作作為一種探索方法,可以是對某個對象和屬性進“取消選擇”的過程,也可以是選擇屬性的子集或?qū)ο蟮淖蛹圆榭疵總€部分之間的關(guān)系的過程。第64頁,共276頁。第三章數(shù)據(jù)可視化基礎(chǔ)3.1光與視覺特性3.2可視化的基本特征3.3可視化流程of37653.5可視化中的美學因素3.6可視化框架設(shè)計整體思路習題3.4可視化設(shè)計組件第65頁,共276頁。3.5 可視

37、化中的美學因素第三章 數(shù)據(jù)可視化基礎(chǔ)of3766 必要性 數(shù)據(jù)可視化主要是借助于圖形化手段,清晰有效地傳達與溝通信息。為了有效地傳達思想概念,美學形式應(yīng)與功能需要齊頭并進,通過直觀地傳達關(guān)鍵的方面與特征。好的可視化項目應(yīng)盡可能以簡潔易懂的表現(xiàn)形式展示適當?shù)男畔?,最好能讓讀者有賞心悅目的感覺。因此,美學因素在一定程度上影響用戶對可視化設(shè)計的喜好或厭惡情緒,進而影響可視化傳播和表達信息的能力。 內(nèi)涵可視化效果之美有其特定的涵義,稱得上“完美“的可視化效果,不僅必須美觀悅目,而且必須新穎、充實和高效。也可以說,可視化的藝術(shù)完美性指其形式與內(nèi)容是否和諧統(tǒng)一,以及是否有創(chuàng)新和發(fā)展。 作用和要素 在可視化

38、設(shè)計中,美觀有效的可視化項目能使用戶方便地從可視化結(jié)果中獲取足夠的信息,以判斷和理解可視化所包含的內(nèi)容。可視化設(shè)計中的網(wǎng)格及其標注是美化設(shè)計效果必須考慮的因素。圖形化的構(gòu)建要素,包括坐標軸、布局、形狀、色彩、線條和排版是實現(xiàn)可視化之美的“必要”因素,而不是“充分因素。合理地利用這些因素來引導用戶、傳播信息、揭示關(guān)系、突出結(jié)論以及提高視覺魅力是必要的。第66頁,共276頁。3.5 可視化中的美學因素第三章 數(shù)據(jù)可視化基礎(chǔ)of3767 配色 在可視化項目中,顏色是使用最廣泛的視覺通道,也是經(jīng)常被過度甚至錯誤使用的一個重要視覺參數(shù)。使用了錯誤的顏色或者試圖使用過多顏色表示大量數(shù)據(jù)屬性,都可能導致可視

39、化結(jié)果的視覺混亂,因而都是不可取的。另外,鑒于人的感知判斷大都是基于相對判斷的,對顏色的感知尤其如此。因此,可視化設(shè)計應(yīng)特別謹慎地選取顏色。另外,在某些可視化領(lǐng)域,可視化的設(shè)計者還需要考慮色覺障礙的用戶感受,使得可視化結(jié)果對這些用戶依然能夠有效地表達和傳遞信息。 提高可視化美學效果的三大原則1聚焦:設(shè)計者必須通過適當?shù)募夹g(shù)手段將用戶的注意力集中到可視化結(jié)果中的最重要的區(qū)域。2、平衡:平衡原則要求可視化的設(shè)計空間必須被有效利用,盡量使重要元素置于可視化設(shè)計空間的中心或中心附近,同時確保元素在可視化設(shè)計空間中的平衡分布。3、簡單:簡單原則要求設(shè)計者既要盡量避免在可視化項目中包含過多的造成混亂的圖形

40、元素,也要盡可能不使用過于復雜的視覺效果(如帶光照的二維柱狀圖等)。第67頁,共276頁。第三章數(shù)據(jù)可視化基礎(chǔ)3.1光與視覺特性3.2可視化的基本特征3.3可視化流程of37683.5可視化中的美學因素3.6可視化框架設(shè)計整體思路習題3.4可視化設(shè)計組件第68頁,共276頁。3.6可視化框架設(shè)計思路第三章 數(shù)據(jù)可視化基礎(chǔ)of37693.6.1 可視化框架的構(gòu)成 數(shù)據(jù)可視化的本質(zhì)是:將數(shù)據(jù)映射到圖形,同時將一些附加信息傳達給用戶 對數(shù)據(jù)進行加工的模塊,包括一些數(shù)據(jù)處理方法。例如:合并、分組、排序、過濾、計算統(tǒng)計信息等決定使用何種圖形來展示數(shù)據(jù),包括點、線、面等圖形標記將數(shù)據(jù)映射到圖形視覺通道的過

41、程。例如:將數(shù)據(jù)映射成顏色、位置、大小等用于說明視覺通道跟數(shù)據(jù)的映射關(guān)系,例如:坐標軸、圖例、輔助文本等可視化框架的構(gòu)成數(shù)據(jù)處理模塊圖形映射模塊圖形展示模塊輔助信息模塊第69頁,共276頁。3.6可視化框架設(shè)計思路第三章 數(shù)據(jù)可視化基礎(chǔ)of37703.6.2 數(shù)據(jù)圖形映射的流程數(shù)可視化從原始數(shù)據(jù)映射到所需要的圖形需要經(jīng)過多個步驟,包括統(tǒng)計分析、預處理數(shù)據(jù)、過濾、映射和繪制等。 關(guān)注數(shù)據(jù)幾何數(shù)據(jù) 繪制 映射 過濾 統(tǒng)計分析原始數(shù)據(jù)預處理數(shù)據(jù)圖形數(shù)據(jù)第70頁,共276頁。1彩色電視系統(tǒng)中的三基色是什么顏色,是如何選定的?2. 何謂明視覺和暗視覺,比較在明視覺條件下對輻射功率相同的510nm 綠光和

42、610nm 橙光的亮度感覺誰高誰低?3. 何謂視敏函數(shù)和相對視敏函數(shù)?4. 何謂對比度和亮度層次,它們之間存在什么關(guān)系?5. 何謂視覺惰性,人眼視覺暫留時間是多少,電視顯示25 幀與視覺惰性的關(guān)系是怎樣的?6. 被傳送的景物中,有兩點的亮度分別為B1=1nit,B2=10nit,試說明B1、 B2 間能分辨的亮度等級(取=0.05)。7. 人眼彩色視覺對色調(diào)和色飽和度的分辨力怎樣?8. 人眼彩色視覺對彩色細節(jié)的分辨力怎樣,它在彩色電視中得到怎樣的利用?9. 談?wù)勀菍?shù)據(jù)可視化這門學科的認識和想法。10. 地理信息可視化是可視化應(yīng)用眾多領(lǐng)域中的一種,請列舉幾個屬于地理信息可視化的實例。習題:第

43、71頁,共276頁。11. 數(shù)據(jù)可視化的最終目標是什么,有哪些基本特征?12. 舉例說明數(shù)據(jù)可視化帶來的好處,并討論存在的技術(shù)難題。13. 數(shù)據(jù)可視化的三類通用目標是什么,分別舉例加以說明。14. 以零售商銷售報表可視化為例,說明數(shù)據(jù)可視化過程中的5 個基本步驟。15. 使用常用的可視化工具(如Excel)對您所在班級的學生信息表進行可視化展示,并考慮如何突出展示效果。16. 在進行數(shù)據(jù)分析時,統(tǒng)計分析方法、探索性數(shù)據(jù)分析和數(shù)據(jù)挖掘三類方法各有什么側(cè)重點和優(yōu)勢?17. 簡要畫出可視化流程概念圖,并對其進行簡要說明。18. 談?wù)勀鷮?shù)據(jù)可視化中美學因素的認識。習題:第72頁,共276頁。感謝聆聽

44、第73頁,共276頁。第四章數(shù)據(jù)可視化的常用方法of46744.14.2 統(tǒng)計圖表可視化方法4.3 圖可視化方法4.4 可視化分析方法的常用算法視覺編碼4.5 可視化方法的選擇習題第74頁,共276頁。4.1視覺編碼第四章 數(shù)據(jù)可視化的常用方法選擇可視化方法之前,需要掌握視覺感知(Visual Perception)和視覺認知(Visual Cognition)的概念。視覺感知是指客觀事物通過人的視覺器官在人腦中形成的直接反映,人類只有通過“視覺感知”,才能達到“視覺認知”。通常而言,人類的視覺感知器官最靈敏,感知外在事物的效率和效果都優(yōu)于其他感知器官。of46754.1.1 視覺感知第75頁

45、,共276頁。4.1視覺編碼of46764.1.2 視覺通道視覺通道:用于控制幾何標記的展示特性,包括標記的位置、大小、形狀、方向、色調(diào)、飽和度、亮度等。視覺通道分為兩大類:定性(分類)的視覺通道,如形狀、顏色的色調(diào)、空間位置;定量(連續(xù)、有序)的視覺通道,如直線的長度、區(qū)域的面積、空間的體積、斜度、角度、顏色的飽和度和亮度等。第四章 數(shù)據(jù)可視化的常用方法第76頁,共276頁。of46774.1.3 數(shù)據(jù)分類對于信息可視化中數(shù)據(jù)類型的劃分,從數(shù)據(jù)可視化類型出發(fā)研究可視化過程,可以參考基于任務(wù)分類學的數(shù)據(jù)類型(TTT, data Type by Task Taxonomy)。TTT 定義了 7

46、種基本任務(wù):總覽、縮放、過濾、按需細化、關(guān)聯(lián)、歷史和提取;并將數(shù)據(jù)分為 7 類:一維線性數(shù)據(jù)、二維數(shù)據(jù)、三維數(shù)據(jù)、多維數(shù)據(jù)、時態(tài)數(shù)據(jù)、樹型數(shù)據(jù)和網(wǎng)狀數(shù)據(jù)。4.1視覺編碼第四章 數(shù)據(jù)可視化的常用方法第77頁,共276頁。of46784.1.4 常用的復雜數(shù)據(jù)處理方法通過實驗測量、計算機仿真、網(wǎng)絡(luò)數(shù)據(jù)傳輸和文件輸入/輸出等方法獲取數(shù)據(jù)之后,通常要對復雜數(shù)據(jù)進行預處理,常見數(shù)據(jù)操作包括:合并、采樣、降維、特征子集選擇、特征生成、離散化與二值化、屬性變換。4.1視覺編碼第四章 數(shù)據(jù)可視化的常用方法第78頁,共276頁。第四章數(shù)據(jù)可視化的常用方法of46794.14.2 統(tǒng)計圖表可視化方法4.3 圖可視

47、化方法4.4 可視化分析方法的常用算法視覺編碼4.5 可視化方法的選擇習題第79頁,共276頁。4.2 統(tǒng)計圖表可視化方法of4680第四章 數(shù)據(jù)可視化的常用方法4.2.1 柱狀圖柱狀圖(bar chart),是一種以長方形的長度為變量的表達圖形的統(tǒng)計報告圖。優(yōu)勢:柱狀圖利用柱子的高度,反映數(shù)據(jù)的差異,肉眼對高度差異很敏感。劣勢:柱狀圖的局限在于只適用中小規(guī)模的數(shù)據(jù)集。 1、傳統(tǒng)二維柱狀圖傳統(tǒng)柱狀圖一般用于表示客觀事物的絕對數(shù)量的比較或者變化規(guī)律,用于顯示一段時間內(nèi)數(shù)據(jù)的變化,或者顯示不同項目之間的對比,分為:二維簇狀柱形圖、二維堆積柱形圖、二維百分比堆積柱形圖。第80頁,共276頁。4.2

48、統(tǒng)計圖表可視化方法of4681第四章 數(shù)據(jù)可視化的常用方法4.2.1 柱狀圖2、三維柱狀圖三維柱狀圖的可視化效果更佳直觀,而且能夠在第三個坐標軸顯示三維數(shù)據(jù)。三維柱狀圖采用柱體來量化數(shù)據(jù),同時對柱體可以采用不用的顏色編碼,來表述不同的變量。第81頁,共276頁。4.2 統(tǒng)計圖表可視化方法of4682第四章 數(shù)據(jù)可視化的常用方法4.2.2 條形圖排列在工作表的列或行中的數(shù)據(jù)可以繪制到條形圖中。條形圖顯示各個項目之間的比較情況。4.2.3 折線圖折線圖適用于二維大數(shù)據(jù)集,尤其是那些趨勢比單個數(shù)據(jù)點更重要的場合。4.2.4 餅圖餅圖適用于一維數(shù)據(jù)可視,尤其是能反映數(shù)據(jù)序列中各項大小、總和和相互之間比

49、例大小。4.2.5 散點圖散點圖適用于三維數(shù)據(jù)集,但其中只有兩維需要比較。4.2.6 氣泡圖氣泡圖是散點圖的一種變形,通過每個點的面積大小,反應(yīng)第三維。4.2.7 雷達圖雷達圖適用于多維數(shù)據(jù)(四維以上),且每個維度必須可以排序。第82頁,共276頁。4.2 統(tǒng)計圖表可視化方法of4683第四章 數(shù)據(jù)可視化的常用方法第83頁,共276頁。第四章數(shù)據(jù)可視化的常用方法of46844.14.2 統(tǒng)計圖表可視化方法4.3 圖可視化方法4.4 可視化分析方法的常用算法視覺編碼4.5 可視化方法的選擇習題第84頁,共276頁。4.3 圖可視化方法of4685第四章 數(shù)據(jù)可視化的常用方法4.3.1 圖的類型1

50、、關(guān)系圖可視化最重要的作用之一,便是能夠表達關(guān)系。這些關(guān)系組成了已經(jīng)定義的世界或系統(tǒng)。圖能夠使得我們以一種非常容易理解的方式來描述和表達世界。2、分層對于分層數(shù)據(jù)中獲取信息,圖也是一個很好的選擇。分層圖常被稱樹。樹有一個根父節(jié)點,其鏈接分支到第二個節(jié)點,第二級節(jié)點還可能再次分支,以此類推,直到到達沒有子節(jié)點的葉子節(jié)點,根節(jié)點的每個后代節(jié)點都只有一個父節(jié)點。第85頁,共276頁。4.3 圖可視化方法of4686第四章 數(shù)據(jù)可視化的常用方法4.3.2 圖論可視化圖論(Graph Theory)是數(shù)學的一個分支。它以圖為研究對象。圖論中的圖是由若干給定的點及連接兩點的線所構(gòu)成的圖形,這種圖形通常用來

51、描述某些事物之間的某種特定關(guān)系,用點代表事物,用連接兩點的線表示相應(yīng)兩個事物間具有這種關(guān)系。第86頁,共276頁。4.3 圖可視化方法of4687第四章 數(shù)據(jù)可視化的常用方法4.3.3 思維導圖思維導圖(Mind Map),即借助圖表來分析問題、理清思路。 常見的思維圖有八種:Circle Map圓圈圖、Tree Map樹狀圖、Bubble Map氣泡圖、Double Bubble Map 雙重氣泡圖、Flow Map流程圖、Multi-flow Map 多重流程圖、Brace Map 括號圖,和Bridge Map橋型圖。第87頁,共276頁。第四章數(shù)據(jù)可視化的常用方法of46884.14.

52、2 統(tǒng)計圖表可視化方法4.3 圖可視化方法4.4 可視化分析方法的常用算法視覺編碼4.5 可視化方法的選擇習題第88頁,共276頁。4.4 可視化分析方法的常用算法of4689第四章 數(shù)據(jù)可視化的常用方法4.4.1 可視化分析方法1、沙盒分析法沙盒分析的關(guān)鍵能力主要有:認知、自動處理模型范本、想法的解讀。運用網(wǎng)絡(luò)服務(wù)界面和協(xié)議,整合了高級計算機語言功能。第89頁,共276頁。4.4 可視化分析方法的常用算法of4690第四章 數(shù)據(jù)可視化的常用方法4.4.1 可視化分析方法2、認知作業(yè)分析法認知作業(yè)分析是人們對完成特定任務(wù)的思維過程信息,這些信息包括如何去處理所獲取的信息和下一步該做什么。3、順

53、序模式法順序模式被用來發(fā)現(xiàn)離散事件同時發(fā)生的概率。隨著計算機的發(fā)展,我們能處理更龐大的數(shù)據(jù)并且獲得大量的順序模式。每個順序模式包含一個最小概率,其意義為這個模式發(fā)生的百分比。其優(yōu)點是快速地顯示數(shù)據(jù)的結(jié)構(gòu)與分布、顯示單個事件的發(fā)生頻率、準確性高;應(yīng)用于文本挖掘。第90頁,共276頁。4.4 可視化分析方法的常用算法of4691第四章 數(shù)據(jù)可視化的常用方法4.4.1 可視化分析方法4、協(xié)同多視圖法多視圖可用多種形式的視圖,如促進信息加工中的抽象視圖、分層和時間序列的視圖。在可視分析中實現(xiàn)協(xié)同并不容易,因為沒有正式的協(xié)同規(guī)則,有的規(guī)則也不是萬能的,需要具有一定的針對性才能體現(xiàn)協(xié)同多視圖法的效果。第9

54、1頁,共276頁。4.4 可視化分析方法的常用算法of4692第四章 數(shù)據(jù)可視化的常用方法4.4.2 可視分析研究的特點可視分析學從6個基本方面放大了人類感知能力:(1)增加感知源,如通過可視化源來擴展人類工作記憶。(2)減少搜索,例如在小空間中表示大量數(shù)據(jù)。(3)增強模式認知,如在空間中展示具備時間序列特征的信息。(4)支持關(guān)系可感知的簡易推理。(5)對大量潛在事件的感知監(jiān)測。(6)提供可操作的介質(zhì),與靜態(tài)圖不同,能允許探索參數(shù)值的表示空間。第92頁,共276頁。4.4 可視化分析方法的常用算法of4693第四章 數(shù)據(jù)可視化的常用方法4.4.3 可視分析的應(yīng)用實例1、模型和決策支持回歸模型在

55、許多應(yīng)用領(lǐng)域中扮演著重要角色,典型的回歸模型構(gòu)建過程中輸入變量的特征子集選取受到限制,其他局限還存在于局部結(jié)構(gòu)、轉(zhuǎn)換以及變量間交互的識別。第93頁,共276頁。4.4 可視化分析方法的常用算法of4694第四章 數(shù)據(jù)可視化的常用方法4.4.3 可視分析的應(yīng)用實例2、圖像和視頻數(shù)據(jù)處理圖像和視頻數(shù)據(jù)是繼文本數(shù)據(jù)之后的又一大數(shù)據(jù)類型,可視分析學在這兩種數(shù)據(jù)分析上同樣能發(fā)揮優(yōu)勢。第94頁,共276頁。4.4 可視化分析方法的常用算法of4695第四章 數(shù)據(jù)可視化的常用方法4.4.3 可視分析的應(yīng)用實例3、社會媒體數(shù)據(jù)分析可視分析學還被用至社會媒體數(shù)據(jù)分析、社會網(wǎng)絡(luò)分析、文檔重建系統(tǒng)和人類地形分析等領(lǐng)

56、域。第95頁,共276頁。4.4 可視化分析方法的常用算法of4696第四章 數(shù)據(jù)可視化的常用方法4.4.4 主成分分析主成分分析(Principal Component Analysis,PCA)法是一種利用線性映射來進行數(shù)據(jù)降維的方法,同時去除數(shù)據(jù)的相關(guān)性,以最大限度保持原始數(shù)據(jù)的方差信息,從而進行有效的特征提取。4.4.5 聚類分析(1)系統(tǒng)聚類法將變量由多變少的一種方法,先將距離最小的變量歸為一類,再將它們合并,合并后將新類計算相互間的距離,再將距離最小的新類合并,直到所有變量歸為一類為止。距離的定義有:最短距離法、最長距離法、中心法、類平均法、中間距離法、離差平法和法等。(2)動態(tài)聚

57、類法能較好地解決系統(tǒng)聚類當樣本數(shù)量大時計算量大的問題。動態(tài)聚類先設(shè)定好數(shù)值K,然后將所有樣本分成K類作為聚核,再計算每個樣本到聚核的距離,與聚核距離最小的樣本歸為一類,這樣樣本被分為K類;然后依次繼續(xù)進行分類,并按一定的標準停止分類。第96頁,共276頁。4.4 可視化分析方法的常用算法of4697第四章 數(shù)據(jù)可視化的常用方法4.4.6 因子分析因子分析是從假定的因子模型出發(fā),把復雜數(shù)據(jù)視為由公共因子、誤差和特殊因子構(gòu)成。使用了主成分分析的方法但其關(guān)于特征值的計算是以相關(guān)矩陣作為出發(fā),把每個變量置于同一度量,使特征值相對均勻,并將主成分轉(zhuǎn)換成因子,還把特征向量正規(guī)化使之長度為1。4.4.7 層

58、次分析法層次分析法能對大量的非定量的模糊數(shù)據(jù)進行處理,如良好、優(yōu)秀、一般等,層次分析法用定量的方法去描述這些數(shù)據(jù),將定性和定量相結(jié)合,分層次分析,用數(shù)學的方法確定每一層中所有元素的重要性的權(quán)值,最后分析排序結(jié)果,解決問題。層次分析的步驟為:(1)構(gòu)造判斷矩陣(2)計算層次單排序(3)計算各層元素的組合權(quán)重(4)一致性檢驗第97頁,共276頁。第四章數(shù)據(jù)可視化的常用方法of46984.14.2 統(tǒng)計圖表可視化方法4.3 圖可視化方法4.4 可視化分析方法的常用算法視覺編碼4.5 可視化方法的選擇習題第98頁,共276頁。4.5 可視化方法的選擇of4699第四章 數(shù)據(jù)可視化的常用方法為數(shù)據(jù)選擇正

59、確的圖表和圖的時候,除了要依據(jù)格式塔原則之外,還要參照可視化模型,遵循各種方法的優(yōu)勢,優(yōu)秀的可視化作品總是精挑細選方法之后,選擇多種方法聯(lián)合呈現(xiàn)數(shù)據(jù)。因此,在研究的初期階段,更重要的是要從不同的角度觀察數(shù)據(jù)。第99頁,共276頁。4.5 可視化方法的選擇of46100第四章 數(shù)據(jù)可視化的常用方法在可視化圖表工具的表現(xiàn)形式方面,圖表類型表現(xiàn)的更加多樣化,豐富化。除了傳統(tǒng)的餅圖、柱狀圖、折線圖等常見圖形,還有氣泡圖、面積圖、省份地圖、詞云、瀑布圖、漏斗圖等酷炫圖表,甚至還有GIS地圖。這些種類繁多的圖形能滿足不同的展示和分析需求。下圖總結(jié)了根據(jù)需求分析可采用的統(tǒng)計可視化方法。第100頁,共276頁

60、。4.4 可視化方法的選擇of46101第四章 數(shù)據(jù)可視化的常用方法第101頁,共276頁。4.5 可視化方法的選擇of46102第四章 數(shù)據(jù)可視化的常用方法4.5.1 實時人流檢測如圖展示上海市區(qū)域內(nèi),通過熱力圖的方式來反映各商圈的人流信息,人數(shù)越多的地方越好。為了獲得更具體的人流數(shù)據(jù),我們還加入信息點,通過地圖覆蓋物實現(xiàn)。當鼠標懸浮到信息點的時候,會顯示該商圈具體人流情況,我們使用了哪些數(shù)據(jù),就顯示出來。第102頁,共276頁。4.5 可視化方法的選擇of46103第四章 數(shù)據(jù)可視化的常用方法4.5.2 百度地圖開發(fā)百度地圖是百度提供的一項網(wǎng)絡(luò)地圖搜索服務(wù),覆蓋了國內(nèi)近400個城市、數(shù)千個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論