版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第四章數(shù)據(jù)可視化基礎(chǔ)第 2 頁竢實揚(yáng)華,自強(qiáng)不息目 錄CONTENT1數(shù)據(jù)可視化基本框架可視化的基本圖表可視化理論發(fā)展可視化中的數(shù)據(jù)可視化設(shè)計原則3524第 3 頁竢實揚(yáng)華,自強(qiáng)不息數(shù)據(jù)可視化不僅是一門包含各種算法的技術(shù),還是一個具有方法論的學(xué)科。實際應(yīng)用中需要采用系統(tǒng)化的思維設(shè)計數(shù)據(jù)可視化方法與工具。本節(jié)通過對數(shù)據(jù)可視化的基本流程和可視化設(shè)計所遵循的多層次模型的討論,介紹數(shù)據(jù)可視化的基本框架。4.1數(shù)據(jù)可視化基本框架“”第 4 頁竢實揚(yáng)華,自強(qiáng)不息4.1.1數(shù)據(jù)可視化流程圖4.1 科學(xué)可視化的早期可視化流水線科學(xué)可視化和信息可視化分別設(shè)計了可視化流程的參考結(jié)構(gòu)模型,并被廣泛應(yīng)用于數(shù)據(jù)可視化系
2、統(tǒng)中。如圖4.1所示,是科學(xué)可視化的早期可視化流水線,它描述了從數(shù)據(jù)空間到可視化空間的映射,包含串行處理數(shù)據(jù)的各個階段:數(shù)據(jù)分析、數(shù)據(jù)濾波、數(shù)據(jù)的可視映射和繪制。這個流水線實際上是數(shù)據(jù)處理和圖形繪制的嵌套組合。第 5 頁竢實揚(yáng)華,自強(qiáng)不息4.1.1數(shù)據(jù)可視化流程圖4.2 信息可視化參考流程如圖4.2展示了Card, Mackinlay和Shneiderman描述的信息可視化流程模型:將流水線改進(jìn)成回路且用戶的交互可以出現(xiàn)在流程的任何階段。后繼幾乎所有著名的信息可視化系統(tǒng)和工具包都支持這個模型,而且絕大多數(shù)系統(tǒng)在基礎(chǔ)層都兼容,只存在細(xì)微的實現(xiàn)差異。第 6 頁竢實揚(yáng)華,自強(qiáng)不息由Jark Van
3、Wijk等人提出的可視化循環(huán)模型模式探索第 7 頁竢實揚(yáng)華,自強(qiáng)不息圖4.4 由C.Stolte等人提出的可視化循環(huán)模型第 8 頁竢實揚(yáng)華,自強(qiáng)不息4.1.1數(shù)據(jù)可視化流程圖4.5 Daniel Keim等人提出的 可視化分析學(xué)標(biāo)準(zhǔn)流程可視分析學(xué)的基本流程則通過人機(jī)交互將自動和可視分析方法緊密結(jié)合。如圖4.5所示,展示了一個典型的可視化流程圖和每個步驟中的過渡形式。這個流水線的起點是輸入的數(shù)據(jù),終點是提煉的知識。從數(shù)據(jù)到知識有兩個途徑:交互的可視化方法和自動的數(shù)據(jù)挖掘方法。兩個途徑的中間結(jié)果分別是對數(shù)據(jù)的交互可視化結(jié)果和從數(shù)據(jù)中提煉的數(shù)據(jù)模型。用戶既可以對可視化結(jié)果進(jìn)行交互的修正,也可以調(diào)節(jié)參
4、數(shù)以修正模型。第 9 頁竢實揚(yáng)華,自強(qiáng)不息數(shù)據(jù)可視化流程中的核心要素包括三個方面。4.1.1數(shù)據(jù)可視化流程數(shù)據(jù)可視化的基礎(chǔ)是數(shù)據(jù)表示與變換。為了允許有效的可視化、分析和記錄,輸入數(shù)據(jù)必須從原始狀態(tài)變換到一種便于計算機(jī)處理的結(jié)構(gòu)化數(shù)據(jù)表示形式。有效表示海量數(shù)據(jù)的主要挑戰(zhàn)是:采用具有可伸縮性和擴(kuò)展性的方法,以便忠實地保持?jǐn)?shù)據(jù)的特性和內(nèi)容;將不同類型、不同來源的信息合成一個統(tǒng)一的表示,使得數(shù)據(jù)分析人員能及時聚焦于數(shù)據(jù)的本質(zhì)。數(shù)據(jù)表示與變換第 10 頁竢實揚(yáng)華,自強(qiáng)不息將數(shù)據(jù)以一種直觀、容易理解的方式呈現(xiàn)給用戶。數(shù)據(jù)可視化的核心內(nèi)容是從巨大的呈現(xiàn)多樣性空間中選擇最合適的編碼形式。判斷某個視覺編碼是否合
5、適的因素:感知與認(rèn)知系統(tǒng)的特性、數(shù)據(jù)本身的屬性和目標(biāo)任務(wù)。大量的數(shù)據(jù)采集通常是以流的形式實時獲取,針對靜態(tài)數(shù)據(jù)發(fā)展起來的可視化顯示方法不能直接拓展到動態(tài)數(shù)據(jù)。不僅要求可視化結(jié)果有一定的時間連貫性,還要求可視化方法達(dá)到高效以便給出實時反饋。需要強(qiáng)大的計算平臺(分布式計算)、顯示平臺(一億像素顯示器)和交互模式(體感交互、可穿戴交互)數(shù)據(jù)的可視化呈現(xiàn)第 11 頁竢實揚(yáng)華,自強(qiáng)不息汽車品牌和所屬國家。上:錯誤的柱狀圖;下:正確的散點圖柱狀圖主要用于表達(dá)數(shù)值信息而不是分類信息,圖中雪弗蘭對應(yīng)縱軸上中國、德國、美國等多個國家,并不合理。第 12 頁竢實揚(yáng)華,自強(qiáng)不息對數(shù)據(jù)進(jìn)行可視化和分析的目的是解決目標(biāo)
6、任務(wù)。目標(biāo)任務(wù)可分為:生成假設(shè)、驗證假設(shè)和視覺呈現(xiàn)。通過可視化能達(dá)到目標(biāo)任務(wù)。交互是通過可視的手段輔助分析決策的直接推動力。適用于海量數(shù)據(jù)可視化的交互技術(shù)還是一個難題,其核心挑戰(zhàn)是新型的可支持用戶分析決策的交互方法。涵蓋底層的交互方式與硬件、復(fù)雜的交互理念與流程,克服不同類型的顯示環(huán)境和不同任務(wù)帶來的可擴(kuò)充性用戶交互第 13 頁竢實揚(yáng)華,自強(qiáng)不息4.1.2數(shù)據(jù)可視化設(shè)計圖4.4 可視化設(shè)計的層次嵌套模型迭代式逐步求精過程數(shù)據(jù)可視化的設(shè)計簡化為四個級聯(lián)的層次。第一層(最外層):問題刻畫層。刻畫真實用戶的問題。第二層:抽象層。將特定領(lǐng)域的任務(wù)和數(shù)據(jù)映射到抽象且通用的任務(wù)及數(shù)據(jù)類型。第三層:編碼層。
7、設(shè)計與數(shù)據(jù)類型相關(guān)的視覺編碼及交互方法。(核心)第四層(最內(nèi)層):算法實現(xiàn)層。創(chuàng)建正確完成系統(tǒng)設(shè)計的算法。第 14 頁竢實揚(yáng)華,自強(qiáng)不息數(shù)據(jù)可視化將數(shù)據(jù)變換為易于感知的可視編碼。為了精準(zhǔn)地通過數(shù)據(jù)的可視表達(dá)傳播信息,需要研究數(shù)據(jù)的分類機(jī)器對應(yīng)的可視編碼方法4.2可視化中的數(shù)據(jù)“”第 15 頁竢實揚(yáng)華,自強(qiáng)不息4.2.1 數(shù)據(jù)認(rèn)知人們對數(shù)據(jù)的認(rèn)知,一般都經(jīng)過從數(shù)據(jù)模型到概念模型的過程,最后得到數(shù)據(jù)在實際中的具體語義。數(shù)據(jù)模型是對數(shù)據(jù)的底層描述及相關(guān)的操作。在處理數(shù)據(jù)時,最初接觸的是數(shù)據(jù)模型。概念模型是對數(shù)據(jù)的高層次描述,對應(yīng)于人們對數(shù)據(jù)的具體認(rèn)知。概念模型的建立跟實際應(yīng)用緊密相關(guān)。對數(shù)據(jù)進(jìn)行進(jìn)一
8、步處理之前,需要定義數(shù)據(jù)的概念和它們之間的聯(lián)系。同時定義數(shù)據(jù)的語義和它們所代表的含義。例如,一組數(shù)據(jù):7.8、12.5、14.3首先被看成一組浮點數(shù)據(jù),可以應(yīng)用;“白、黃、黑”視為一組根據(jù)顏色分類的數(shù)據(jù)。第一組數(shù)據(jù)給從概念模型出發(fā)定義為某天的氣溫值,從而賦予具體語義,并進(jìn)行下一步分析;第二組數(shù)據(jù)表示為一組人群中的不同膚色。第 16 頁竢實揚(yáng)華,自強(qiáng)不息4.2.2數(shù)據(jù)類型表4.1 賽跑比賽排名數(shù)據(jù)根據(jù)數(shù)據(jù)分析要求,不同的應(yīng)用可以采用不同的數(shù)據(jù)分析方法。例如,根據(jù)數(shù)據(jù)模型,可以分為浮點數(shù)、整數(shù)、字符等;根據(jù)概念模型,可以定義數(shù)據(jù)所對應(yīng)的實際意義或者對象,例如汽車、摩托車、自行車等分類數(shù)據(jù)。在科學(xué)計
9、算中,通常根據(jù)測量標(biāo)度,將數(shù)據(jù)分為四類(見表4.1):類別型數(shù)據(jù)(性別)、有序型數(shù)據(jù)(排名)、區(qū)間型數(shù)據(jù)和比值型數(shù)據(jù)。在數(shù)據(jù)可視化中,我們通常并不區(qū)分區(qū)間型數(shù)據(jù)和比值型數(shù)據(jù),將數(shù)據(jù)類型進(jìn)一步精簡為三種:類別型數(shù)據(jù)、有序型數(shù)據(jù)和數(shù)值型數(shù)據(jù)。排名姓名時間性別1小趙3分10秒男2小錢3分12秒男3小孫3分18秒男4小李3分40秒女5小周3分52秒男6小吳4分10秒女第 17 頁竢實揚(yáng)華,自強(qiáng)不息類別型數(shù)據(jù):用于區(qū)分物體。例如,男性女性,蘋果香蕉橘子等。這些類別可以用于區(qū)分一組對象,但是無法提供對象的定量數(shù)據(jù)。有序型數(shù)據(jù):用來表示對象的順序關(guān)系。例如,排名為1的運動員比排名為2的運動員跑得更快。根據(jù)對
10、象順序,并不一定能得到準(zhǔn)確的定量比較。例如,小趙和小錢的跑步成績差別并不一定等于小周和小吳間的差別,雖然都是相差1.無法進(jìn)行定量差別比較。區(qū)間型數(shù)據(jù):用戶得到對象間的定量比較。相比有序型數(shù)據(jù),能提供詳細(xì)的定量信息。例如,10度和20度的差別50度和60度的差別。但是,區(qū)間型數(shù)據(jù)基于任意的起始點,所以只能得到對象的相對差別,并不能定義對象的絕對值。例如,0度并不表示沒有任何溫度。比值型數(shù)據(jù):用于比較數(shù)值間的比例關(guān)系。比值型數(shù)據(jù)基于真正意義上的0點,可以用來精確的定義比例4厘米的物體比2厘米的物體長2倍。跑步成績屬于比值型數(shù)據(jù)。第 18 頁竢實揚(yáng)華,自強(qiáng)不息不同數(shù)據(jù)類型使用不同的操作算子區(qū)分度算子
11、:= 類別型數(shù)據(jù)、有序型數(shù)據(jù)、區(qū)間型數(shù)據(jù)、比值型數(shù)據(jù)序別算子: 有序型數(shù)據(jù)、區(qū)間型數(shù)據(jù)、比值型數(shù)據(jù)加減算子:+ 區(qū)間型數(shù)據(jù)、比值型數(shù)據(jù)乘除算子: 比值型數(shù)據(jù)不同數(shù)據(jù)類型對應(yīng)不同的操作集合和統(tǒng)計計算數(shù)據(jù)類型進(jìn)一步精簡為三種:類別型數(shù)據(jù)、有序型數(shù)據(jù)和數(shù)值型數(shù)據(jù)。基礎(chǔ)的可視化設(shè)計和編碼一般針對這三種,復(fù)雜型數(shù)據(jù)通常是這三類數(shù)據(jù)的組合或變化。第 19 頁竢實揚(yáng)華,自強(qiáng)不息不同類型的數(shù)據(jù)及其所對應(yīng)的操作計算第 20 頁竢實揚(yáng)華,自強(qiáng)不息統(tǒng)計圖表是最早的數(shù)據(jù)可視化形式之一,作為基本的可視化元素仍然被非常廣泛地使用。對于很多復(fù)雜的大型可視化系統(tǒng)來說,這類圖表更是作為基本的組成元素而不可缺少。本節(jié)介紹一些基本
12、圖表及其屬性和適用的場景。通過實例介紹,讀者能了解和認(rèn)識可視化設(shè)計所遵循的準(zhǔn)則。4.3可視化的基本圖表“”第 21 頁竢實揚(yáng)華,自強(qiáng)不息01數(shù)據(jù)軌跡02柱狀圖03直方圖04餅圖4 餅圖餅圖采用了餅干的隱喻,用環(huán)狀方式呈現(xiàn)各分量在整體中的比例。這種分塊方式是環(huán)狀樹圖等可視表達(dá)的基礎(chǔ)。2 柱狀圖柱狀圖采用長方形的形狀和顏色編碼數(shù)據(jù)的屬性。堆疊圖(stacked graph):柱狀圖的每根直柱內(nèi)部用像素編碼。3 直方圖直方圖是對數(shù)據(jù)集的某個數(shù)據(jù)屬性的頻率統(tǒng)計。雙直方圖將兩個數(shù)據(jù)集的頻率統(tǒng)計信息(即直方圖)分別沿橫軸對稱呈現(xiàn)。直方圖可以擴(kuò)展到多維。1 數(shù)據(jù)軌跡數(shù)據(jù)軌跡是一種標(biāo)準(zhǔn)的單變量數(shù)據(jù)呈現(xiàn)方法:x
13、軸顯示自變量;y軸顯示因變量。可直觀呈現(xiàn)數(shù)據(jù)分布、離群值、均值的偏移等。4.3.1 原始數(shù)據(jù)繪圖用于可視化原始數(shù)據(jù)的屬性值,直觀呈現(xiàn)數(shù)據(jù)特征,代表性(九種)第 22 頁竢實揚(yáng)華,自強(qiáng)不息數(shù)據(jù)軌跡Twitter輿情系統(tǒng)根據(jù)用詞的貶褒程度對公司的打分。比較了美國網(wǎng)絡(luò)影視服務(wù)和租賃商的分?jǐn)?shù),為多個數(shù)據(jù)集的單變量數(shù)據(jù)軌跡,日期是自變量,分?jǐn)?shù)是因變量。股票K線圖,時間是自變量,股指是因變量第 23 頁竢實揚(yáng)華,自強(qiáng)不息柱狀圖標(biāo)準(zhǔn)柱狀圖堆疊圖,不同國家的不同能源消耗量第 24 頁竢實揚(yáng)華,自強(qiáng)不息直方圖直方圖(histogram)VS 柱狀圖(bar chart):直方圖的各個部分之和等于單位整體,而柱狀
14、圖的各個部分之和沒有限制。第 25 頁竢實揚(yáng)華,自強(qiáng)不息直方圖雙直方圖第 26 頁竢實揚(yáng)華,自強(qiáng)不息5 等值線圖等值線圖使用相等數(shù)值的數(shù)據(jù)點連線來表示數(shù)據(jù)的連續(xù)分布和變化規(guī)律。等值線圖中的曲線是空間中具有相同數(shù)值的數(shù)據(jù)點在平面上的投影。平面地圖山的地形等高線、等溫線、等濕閑等都是等值線圖在不同領(lǐng)域的應(yīng)用。6 走勢圖走勢圖是一種緊湊簡潔的數(shù)據(jù)趨勢表達(dá)方式,它通常以折線圖為基礎(chǔ),用來表示數(shù)據(jù)隨某一變量(時間、空間)變化趨勢。大小與文本相仿,往往直接嵌入在文本或表格中。7 散點圖散點圖是表示二維數(shù)據(jù)的標(biāo)準(zhǔn)方法。在散點圖中,所有數(shù)據(jù)以點的形式出現(xiàn)在笛卡爾坐標(biāo)系中,每個點所對應(yīng)的橫縱坐標(biāo)即代表該數(shù)據(jù)在坐
15、標(biāo)軸所表示維度上的屬性值大小。散點圖矩陣是展現(xiàn)高維數(shù)據(jù)屬性分布,可以通過尺寸、形狀和顏色等編碼信息。8 維恩圖維恩圖使用平面上的封閉圖形來表示數(shù)據(jù)集合間的關(guān)系。維恩圖在一張平面上表示集合間的所有邏輯關(guān)系,被廣泛用于集合關(guān)系展示。4.3.1 原始數(shù)據(jù)繪圖05060708第 27 頁竢實揚(yáng)華,自強(qiáng)不息二維高斯分布的立體圖和平面等值線圖第 28 頁竢實揚(yáng)華,自強(qiáng)不息走勢圖走勢圖常用于商業(yè)數(shù)據(jù)表達(dá),如股票走勢、市場行情等。和數(shù)據(jù)軌跡圖類似,但是尺寸更小。第 29 頁竢實揚(yáng)華,自強(qiáng)不息散點圖矩陣第 30 頁竢實揚(yáng)華,自強(qiáng)不息維恩圖四集合維恩圖的不同畫法319 熱力圖(Heat map)熱力圖使用顏色來表
16、達(dá)位置相關(guān)的二維數(shù)值數(shù)據(jù)大小。這些數(shù)據(jù)常以矩陣或方格形式整齊排列,或在地圖上按一定的位置關(guān)系排列,每個數(shù)據(jù)點的顏色編碼數(shù)據(jù)大小,如圖4.17所示:第 31 頁竢實揚(yáng)華,自強(qiáng)不息4.3.1 原始數(shù)據(jù)繪圖圖4.17 使用熱力圖表示杭州市公共自行車租車點的繁忙程度(由紅色至綠色遞減)第 32 頁竢實揚(yáng)華,自強(qiáng)不息4.3.2簡單統(tǒng)計值標(biāo)繪圖4.6 盒須圖的標(biāo)準(zhǔn)表示(左圖)及其若干變種盒須圖是John Tukey發(fā)明的通過標(biāo)繪簡單的統(tǒng)計值來呈現(xiàn)一維和二維數(shù)據(jù)分布的一種方法。它的基本形式是用一個長方形盒子表示數(shù)據(jù)的大致范圍(數(shù)據(jù)值范圍的25%75),并在盒子中用橫線標(biāo)明均值的位置。同時,在盒子上部和下部分
17、別用兩根橫線標(biāo)注最大值和最小值。盒須圖在實驗數(shù)據(jù)的分析中非常有用。針對二維數(shù)據(jù),標(biāo)準(zhǔn)的一維盒須圖可擴(kuò)充為二維盒須圖。(見圖4.6)第 33 頁竢實揚(yáng)華,自強(qiáng)不息第 34 頁竢實揚(yáng)華,自強(qiáng)不息4.3.3 多視圖協(xié)調(diào)關(guān)聯(lián)多視圖協(xié)調(diào)關(guān)聯(lián)(multiple coordinated views)將不同種類的繪圖組合起來,每個繪圖單元可以展現(xiàn)數(shù)據(jù)某個方面的屬性,并且通常允許用戶進(jìn)行交互分析,提升用戶對數(shù)據(jù)的模式識別能力。在多視圖協(xié)調(diào)關(guān)聯(lián)應(yīng)用中,“選擇”操作作為一種探索辦法,可以是對某個對象和屬性進(jìn)行“取消選擇”的過程,也可以是選擇屬性的子集或?qū)ο蟮淖蛹圆榭疵總€部分之間的關(guān)系的過程。第 35 頁竢實揚(yáng)華
18、,自強(qiáng)不息探索式基因可視分析過程MizBee的設(shè)計基于知覺原則,包括幾種技術(shù),如邊緣捆綁和分層,以增強(qiáng)與接近度,大小,相似性和方向相關(guān)的保護(hù)關(guān)系的視覺提示。第 36 頁竢實揚(yáng)華,自強(qiáng)不息如圖所示,總結(jié)了根據(jù)分析需求可采用的統(tǒng)計可視化方法。圖 基本的統(tǒng)計圖表可視化方法和適用規(guī)則第 37 頁竢實揚(yáng)華,自強(qiáng)不息可視化的首要任務(wù)是準(zhǔn)確地展示和傳達(dá)數(shù)據(jù)所包含的信息。在此前提下,針對特定的用戶對象,設(shè)計者可以根據(jù)用戶的預(yù)期和需求,提供有效輔助手段以方便用戶理解數(shù)據(jù),從而完成有效的可視化。4.4可視化設(shè)計原則“”第 38 頁竢實揚(yáng)華,自強(qiáng)不息設(shè)計一個可視化視圖包括三個主要步驟:確定數(shù)據(jù)到圖形元素(即標(biāo)記)和
19、視覺通道的映射;視圖的選擇與用戶交互控制的設(shè)計;數(shù)據(jù)的篩選,即確定在有限的可視化視圖空間中選擇適當(dāng)容量的信息進(jìn)行編碼,以避免在數(shù)據(jù)量過大情況下產(chǎn)生的視覺混亂。即可視化結(jié)果中要保持合理的信息密度。為提高可視化結(jié)果的有效性,可視化設(shè)計還包括顏色、標(biāo)記、動畫的設(shè)計等。第 39 頁竢實揚(yáng)華,自強(qiáng)不息4.4.1數(shù)據(jù)到可視化的直觀映射圖 基本數(shù)據(jù)類型適用的可視化編碼方式(優(yōu)先級自上而下)在選擇合適的數(shù)據(jù)到可視化元素(標(biāo)記和視覺通道)的映射時,設(shè)計者首先需要考慮的是數(shù)據(jù)的語義和可視化用戶的個性特征。一般而言,可視化的一個核心作用是使用戶在最短的時間內(nèi)獲取數(shù)據(jù)的整體信息和大部分細(xì)節(jié)信息,這通過直接觀察數(shù)據(jù)顯然
20、無法完成。數(shù)據(jù)到可視化元素的映射需充分利用已有的先驗知識,從而降低人們對信息的感知和認(rèn)知所需要的時間。對于基本數(shù)據(jù)類型,可以通過使用不同的視覺編碼通道來表達(dá)數(shù)據(jù)及其之間的關(guān)系。(見圖)第 40 頁竢實揚(yáng)華,自強(qiáng)不息4.4.1數(shù)據(jù)到可視化的直觀映射圖4.9 使用散點圖的形式可視化行星到太陽的距離和行星公轉(zhuǎn)時間實際應(yīng)用中的數(shù)據(jù)通常是基礎(chǔ)數(shù)據(jù)類型的實例和組合,其可視化方法一般為采用基于不同視覺編碼通道的組合。如圖4.9所示的可視化設(shè)計使用的是散點圖,在點標(biāo)記的選擇上設(shè)計者使用了眾所周知的一些紋理貼圖以表示不同的行星,用橫軸表示距離,縱軸表示公轉(zhuǎn)時間,同時使用了標(biāo)簽對各行星的數(shù)據(jù)進(jìn)行標(biāo)注。第 41 頁
21、竢實揚(yáng)華,自強(qiáng)不息可視化系統(tǒng)也可以向用戶提供一些靈活特性。例如,左圖將時間和空間分別映射為橫軸和縱軸,可以呈現(xiàn)時空演化的事件。圖:復(fù)活節(jié)前一周耶穌活動記錄可視化。全周時間沿橫軸從左到右布局,灰色長塊區(qū)域表現(xiàn)了空間,不同顏色的管道線的位置遠(yuǎn)近編碼了人物之間的互動。第 42 頁竢實揚(yáng)華,自強(qiáng)不息4.4.2 視圖選擇與交互設(shè)計對于簡單的數(shù)據(jù),使用一個基本的可視化視圖就可以展現(xiàn)數(shù)據(jù)的所有信息;對于復(fù)雜的數(shù)據(jù),就需要使用較為復(fù)雜的可視化視圖,甚至為此發(fā)明新的視圖,以有效的展示數(shù)據(jù)中所包含的信息。一般而言,一個成功的可視化首先需要考慮的是被用戶所廣泛認(rèn)可并熟悉的視圖設(shè)計。此外,可視化系統(tǒng)還必須提供一系列的
22、交互手段,使得用戶可以按照自己滿意的方式修改視圖的呈現(xiàn)形式。第 43 頁竢實揚(yáng)華,自強(qiáng)不息數(shù)據(jù)縮放和裁剪工具在對數(shù)據(jù)進(jìn)行可視映射之前,用戶通常會對數(shù)據(jù)進(jìn)行縮放并對可視化數(shù)據(jù)的范圍進(jìn)行必要的裁剪,從而控制最終可視化的數(shù)據(jù)內(nèi)容。LOD控制細(xì)節(jié)層次(level-of-detail)控制有助于在不同的條件下隱藏或者突出數(shù)據(jù)的細(xì)節(jié)部分。0504滾動與縮放當(dāng)數(shù)據(jù)無法在當(dāng)前有限的分辨率下完整展示時,滾動與縮放是非常有效的交互方式。顏色映射的控制調(diào)色盤是可視化系統(tǒng)的基本配置。同樣,允許用戶修改或者制作新的調(diào)色盤也能增加可視化系統(tǒng)的易用性和靈活性。數(shù)據(jù)映射方式的控制在可視化設(shè)計時,設(shè)計者首先需要確定一個直觀且易
23、于理解的數(shù)據(jù)到可視化的映射。(見后圖)02034.4.2 視圖選擇與交互設(shè)計視圖的交互主要包括以下一些方面:01第 44 頁竢實揚(yáng)華,自強(qiáng)不息4.4.2 視圖選擇與交互設(shè)計實際使用過程中,用戶仍有可能需要轉(zhuǎn)換到另一種映射方式來觀察他們感興趣的其他特征。因此,完善的可視化系統(tǒng)在提供默認(rèn)的數(shù)據(jù)映射方式前提下,仍需保留用戶對數(shù)據(jù)映射方式的控制交互。如圖所示,可視化使用了兩種不同的數(shù)據(jù)映射方式展示了同一個數(shù)據(jù)。圖 用散點圖和平行坐標(biāo)圖對一個4維數(shù)據(jù)進(jìn)行可視化第 45 頁竢實揚(yáng)華,自強(qiáng)不息4.4.3 信息密度數(shù)據(jù)的篩選在確定了數(shù)據(jù)到可視化元素的映射和視圖與交互的設(shè)計后,信息可視化設(shè)計的另一個關(guān)鍵挑戰(zhàn)是:
24、設(shè)計者必須決定可視化視圖所需要包含的信息量。(數(shù)據(jù)墨水比是衡量信息可視化的表達(dá)效果)失敗的可視化案例主要存在兩種極端情況:第一種極端情況是可視化展示了過少的數(shù)據(jù)信息;可視化只是輔助用戶認(rèn)識和理解數(shù)據(jù)的工具,可視化過少的數(shù)據(jù)信息并不能給用戶理解數(shù)據(jù)帶來好處。第二種極端情況是設(shè)計者試圖表達(dá)和傳遞過多的信息。包含過多信息增加視覺復(fù)雜度,造成用戶難以理解。第 46 頁竢實揚(yáng)華,自強(qiáng)不息4.4.4美學(xué)因素圖 一個不完整的可視化結(jié)果與一個完整的可視化結(jié)果在可視化設(shè)計中,僅僅完成上述三個步驟仍然無法形成有效的可視化,用戶可能仍然無法從可視化結(jié)果中獲取足夠的信息,以判斷和理解可視化所包含的內(nèi)容。例如,左圖只是
25、簡單地完成了數(shù)據(jù)到可視化(位置和顏色)的映射,然而在用戶看來,它僅僅是幾條不同顏色的曲線;右圖則是一個較完整的可視化,通過增加坐標(biāo)軸、顏色和尺寸等的標(biāo)注和說明,用戶就能知道這10條曲線的信息含義。第 47 頁竢實揚(yáng)華,自強(qiáng)不息4.4.4美學(xué)因素圖 一個不完整的可視化結(jié)果與一個完整的可視化結(jié)果圖展示了網(wǎng)格及其標(biāo)注是否被合理使用的例子。在(a)和(c)中,分別由于網(wǎng)格的過多使用和過少使用,使得可視化結(jié)果在缺少數(shù)據(jù)表達(dá)的精確性的同時也缺失了美觀性,而(b)中通過網(wǎng)格的合理使用,數(shù)據(jù)所映射的點能夠被用戶很好地理解。第 48 頁竢實揚(yáng)華,自強(qiáng)不息4.4.4美學(xué)因素圖4.13 網(wǎng)格間距的正確使用例子網(wǎng)格所
26、表示的區(qū)間的均勻性對于用戶對可視化的理解也非常重要。圖4.13左圖所示的可視化結(jié)果中由于設(shè)計者使用了不均勻的網(wǎng)格間距(橫軸)和非零的起始位置(縱軸),使得用戶對可視化結(jié)果的理解很難忠于原始數(shù)據(jù)所包含的信息。第 49 頁竢實揚(yáng)華,自強(qiáng)不息可視化中,顏色是使用最廣泛的視覺通道,也是經(jīng)常被過度甚至錯誤使用的一個重要的視覺參數(shù)。使用錯誤的顏色映射表或者視圖使用很多不同的顏色表示大量數(shù)據(jù)屬性,都可能導(dǎo)致可視化結(jié)果的視覺混亂。另外,由于人的感知判斷是基于相對判斷的,特別對顏色的感知,因此進(jìn)行顏色選取的時候也需要特別謹(jǐn)慎。在某些可視化領(lǐng)域,可視化的設(shè)計者還要考慮色覺障礙用戶的因素,使得可視化結(jié)果對這些用戶依
27、然能夠起到信息的表達(dá)與傳遞的功能。第 50 頁竢實揚(yáng)華,自強(qiáng)不息4.4.4美學(xué)因素圖4.14 可視化元素的平衡分布在可視化設(shè)計的方法學(xué)中,提高可視化的美學(xué)性方法主要有:聚焦:設(shè)計者必須通過適當(dāng)?shù)募夹g(shù)手段將用戶的注意力集中到可視化結(jié)果中的最重要區(qū)域。(前向注意力)平衡:平衡原則要求可視化的設(shè)計空間必須被有效地利用,盡量使重要元素置于可視化設(shè)計空間的中心或中心附近,同時確保元素在可視化設(shè)計空間中的平衡分布。簡單:簡單原則要求設(shè)計者盡量避免在可視化中包含過多的造成混亂的圖形元素,也要盡量避免使用過于復(fù)雜的世界效果。最終找到可視化結(jié)果美學(xué)特征與傳達(dá)的信息含量的平衡。在圖4.14中,左圖將主要的可視化元
28、素置于視圖空間的右上角,違背了平衡原則。4.4.5動畫與過渡 信息可視化的結(jié)果主要以兩種形式存在:可視化視圖與可視化系統(tǒng)。前者通常是圖像,是相關(guān)人員進(jìn)行交流的載體形式;后者則創(chuàng)建了一個終端用戶(包括設(shè)計者和一般用戶)與數(shù)據(jù)進(jìn)行交互的系統(tǒng)環(huán)境,使得用戶可以根據(jù)自己的意圖選擇合適的可視化映射和可視化信息密度,并通過系統(tǒng)提供的交互生成最終的可視化視圖或可視化視圖序列。 動畫與過濾效果是可視化系統(tǒng)中常用的技術(shù),它通常被用于增加可視化結(jié)果視圖的豐富性與可理解性,或增加用戶交互的反饋效果。例如,對于時變的科學(xué)數(shù)據(jù),采用科學(xué)可視化方法逐楨繪制每個時刻的數(shù)據(jù),可重現(xiàn)動態(tài)的物理或化學(xué)演化規(guī)律。在可視化系統(tǒng)中,動
29、畫與過渡效果的功能可概括如下:第 52 頁竢實揚(yáng)華,自強(qiáng)不息4.4.5 動畫與過渡 1. 用時間換取空間,在有限的屏幕空間中展示更多的數(shù)據(jù)當(dāng)數(shù)據(jù)包含多個維度時,需要通過多個視覺通道編碼不同的維度信息,此時如果采用動畫的方式編碼隨著時間演進(jìn)而產(chǎn)生的數(shù)據(jù)值變化,則可以在有限的視圖空間上展示更多的信息,同時也確保任何單一時刻時可視化結(jié)果對有限視圖空間的充分利用。案例:兒童死亡率與收入的關(guān)系與變化(GapminderFlash_MDG4_07jan09)第 53 頁竢實揚(yáng)華,自強(qiáng)不息2. 輔助不同可視化視圖之間的轉(zhuǎn)換與跟蹤,或者輔助不同可視化視覺通道的變換用戶在瀏覽可視化數(shù)據(jù)的過程中需要在不同的視圖之
30、間進(jìn)行切換,使用動畫效果輔助視圖切換過程有助于用戶跟蹤在不同可視化視圖中出現(xiàn)的相同元素。采用動畫切換技術(shù),可以減輕視圖變換給用戶帶來的“沖擊”,避免用戶在轉(zhuǎn)換過程縱迷失,方便用戶跟蹤數(shù)據(jù)的信息。從柱狀圖過渡成餅圖的動畫序列的幾幀截圖,避免兩種可視化編碼切換所帶來的視覺“沖擊”第 54 頁竢實揚(yáng)華,自強(qiáng)不息3. 增加用戶在可視化系統(tǒng)中交互的反饋效果 實時的反饋效果有助于用戶獲得對其所做操作的確認(rèn),以避免用戶盲目地重復(fù)操作。例如,一個簡單的進(jìn)度條可讓用戶知道處理進(jìn)展;當(dāng)用戶鼠標(biāo)經(jīng)過散點圖的某個點時,物體在很短的時間內(nèi)(200ms)產(chǎn)生一個光暈動畫,表示該物體能被點選或進(jìn)行其他操作。4. 引起觀察者
31、注意力 動畫作為視覺通道包括了運動的方向、運動的速度和閃爍的頻率等。由于閃爍等動畫效果很難被人眼忽視,因此,當(dāng)有特別重要的信息需要被觀察者捕捉時,對標(biāo)記進(jìn)行閃爍是一個不錯的選擇。也正因為如此,在可視化中動畫作為視覺通道必須小心謹(jǐn)慎地使用。第 55 頁竢實揚(yáng)華,自強(qiáng)不息4.4.6可視化隱喻在解釋或者介紹人們不熟悉的事物和概念的時候,常常將其與一個人們所熟悉的事物進(jìn)行比較來幫助理解,這樣的手法稱為隱喻(metaphor)。隱喻的設(shè)計包含三個層面:隱喻本體、隱喻喻體和可視化變量。本體和喻體之間存在某種關(guān)聯(lián)或相似性。在可視化中也常常使用這樣的方法,將需要介紹的事物和概念用人們所熟知的事物的視覺形態(tài)來呈
32、現(xiàn)。時間隱喻和空間隱喻是可視化隱喻中最常見的兩類方式。選取合適的源域和喻體表示時間和空間概念,能創(chuàng)造最佳的可視和交互效果。第 56 頁竢實揚(yáng)華,自強(qiáng)不息第 57 頁竢實揚(yáng)華,自強(qiáng)不息4.4.7 顏色與透明度顏色在數(shù)據(jù)可視化領(lǐng)域通常被用于編碼數(shù)據(jù)的分類或定序?qū)傩?。?dāng)顏色的兩種數(shù)據(jù)編碼規(guī)則在用戶所見的視圖空間中存在相互遮掩時,可視化的設(shè)計者必須從中選擇一種予以顯示。為了便于用戶在觀察和探索數(shù)據(jù)可視化時從整體進(jìn)行把握,可以給顏色增加一個表示不透明度的分量通道,通常也稱為通道,用于表示離觀察者更近的顏色對背景顏色的透過程度。當(dāng)顏色的值為1時,表示不透過任何背景顏色,即顏色是不透明的;當(dāng)顏色的值為0時,
33、表示該顏色是透明的;當(dāng)顏色的值介于0和1之間時,表示該顏色可以透過一部分背景的顏色,從而實現(xiàn)當(dāng)前顏色和背景顏色的混合,創(chuàng)造出可視化的上下文效果。顏色混合可以在一定程度上避免兩種數(shù)據(jù)編碼規(guī)則的遮擋問題,便于抓住數(shù)據(jù)的特征,提高用戶的交互體驗。但也容易導(dǎo)致顏色視覺通道的失效,要慎用顏色混合。第 58 頁竢實揚(yáng)華,自強(qiáng)不息 對于一門學(xué)科而言,目前可視化還處于發(fā)展階段,研究者在不斷探索和發(fā)展可視化理論,試圖建立不同的模型,對可視化進(jìn)行規(guī)則的描述。4.5可視化理論發(fā)展“”第 59 頁竢實揚(yáng)華,自強(qiáng)不息4.5.1 圖形符號學(xué)表 Bertin的圖形詞匯Bertin使用符號學(xué)來描述圖形,提出了信息的可視化編碼
34、原則,并嚴(yán)格地定義了二維圖形及其對信息的表達(dá)過程。他將圖形系統(tǒng)嚴(yán)格區(qū)分為內(nèi)容(所要表達(dá)的信息和數(shù)據(jù))和載體(圖形符號)。在此框架下,圖形(可視化)由傳輸不同信息的圖形符號組成。圖形符號用視覺變量描述,包括位置變量和視網(wǎng)膜變量。如表4.2所示:基于基本元素(點線面)的組合可以產(chǎn)生各類圖形的視網(wǎng)膜變量。在此基礎(chǔ)上,視網(wǎng)膜變量可以表達(dá)不同層次的組織,且變量之間存在關(guān)聯(lián)性、選擇性、有序性和定量性。圖形符號點、線和面位置變量二維平面上的位置視網(wǎng)膜變量尺寸、數(shù)值、紋理、顏色、方向和形狀第 60 頁竢實揚(yáng)華,自強(qiáng)不息層次變量關(guān)聯(lián)性選擇性有序性定量性平面YYYY大小YYY數(shù)值YY紋理YYY顏色YY方向YY形狀
35、Y表 不同視網(wǎng)膜變量對應(yīng)的層次組織關(guān)聯(lián)性:根據(jù)屬性可找出圖形符號對應(yīng)關(guān)系,并進(jìn)行分類;選擇性:根據(jù)屬性可找出圖形符號所屬類別;有序性:根據(jù)屬性可對圖形符號進(jìn)行排序;定量性:根據(jù)屬性可從圖形符號推導(dǎo)出比例關(guān)系或者距離第 61 頁竢實揚(yáng)華,自強(qiáng)不息4.5.1 圖形符號學(xué)Bertin提出的視覺變量標(biāo)記形式點線面通道位置尺寸灰階值紋理色彩方向形狀第 62 頁竢實揚(yáng)華,自強(qiáng)不息4.5.2 關(guān)系數(shù)據(jù)的圖形表示1986年,Mackinlay提出了一種可從數(shù)據(jù)庫中自動提取信息并用圖形方式顯示的技術(shù)。和Bertin的理論相似,這種可視化技術(shù)采用二維靜態(tài)表達(dá)方式,如散點圖和網(wǎng)絡(luò)圖。區(qū)別在于Mackinlay試圖用
36、圖形語言描述和定義可視化的表達(dá)。Mackinlay提出:圖形語言需要滿足表達(dá)性和有效性,表達(dá)性指圖形語言必須能夠表達(dá)所需的信息;有效性指對于給定情況,圖形語言必須有效的使用顯示介質(zhì)和人的視覺系統(tǒng)。圖形符號點、線和面位置變量一維、二維和三維時間變量動畫視網(wǎng)膜變量顏色、形狀、尺寸、飽和度、紋理和方向表4.3 Mackinlay的圖形詞匯Mackinlay提出了一套基本的圖形語言和組合算子,在這些元素的基礎(chǔ)上可通過運算構(gòu)造出更高級的圖形表達(dá)。基于Bertin的理論, Mackinlay提出了新的圖形詞匯(見表4.3)第 63 頁竢實揚(yáng)華,自強(qiáng)不息以及初級圖形語言的基組(見表4.4)并定義了三個用于合
37、并兩個表達(dá)相同信息的圖形句子的原則:雙軸合并:合并的圖形句子具有相同的橫軸和縱軸。單軸合并:對齊圖形句子中相同的橫軸或者縱軸。圖形合并:對齊圖形句子中的圖形。編碼技術(shù)基本圖形語言視網(wǎng)膜變量顏色、形狀、尺寸、飽和度、紋理和方向單個位置橫軸、豎軸拼接位置曲線圖、柱狀圖、散點圖地圖道路圖、地形圖鏈接樹、圖、網(wǎng)絡(luò)雜項餅圖、維恩圖表4.4 Mackinlay的初級圖形語言的基組Mackinlay的創(chuàng)新之處是進(jìn)一步提出了表達(dá)性和有效性原則,并且提供了更為嚴(yán)格的圖形語言描述第 64 頁竢實揚(yáng)華,自強(qiáng)不息Mackinlay提出的視覺變量4.5.2 關(guān)系數(shù)據(jù)的圖形表示第 65 頁竢實揚(yáng)華,自強(qiáng)不息4.5.3 圖
38、形語法表4.5 Wilinson的語法規(guī)范Wilkinson提出了一種底層設(shè)計圖形生成語言,可用于構(gòu)造不同類型的統(tǒng)計圖形。圖形的構(gòu)造過程分為三個階段:規(guī)范定義、組裝和顯示。其中,規(guī)范定義是整個語法的基礎(chǔ),描述了不同圖形對象間的轉(zhuǎn)變和最終圖形顯示映射。整個語法規(guī)范由7個部分組成(見表4.5)。其中,數(shù)據(jù)和轉(zhuǎn)換定義在數(shù)據(jù)空間;框架、標(biāo)度和坐標(biāo)定義了底層的圖形幾何和數(shù)據(jù)的空間位置;圖形定義了不同的圖形對象。數(shù)據(jù)從數(shù)據(jù)集中生成變量的數(shù)據(jù)操作轉(zhuǎn)換數(shù)據(jù)變量間的轉(zhuǎn)換框架變量空間,包括變量間的操作標(biāo)度標(biāo)度轉(zhuǎn)換坐標(biāo)坐標(biāo)系統(tǒng)圖形圖形及其美學(xué)屬性參考用于圖形對象間的對齊、分類和比較等第 66 頁竢實揚(yáng)華,自強(qiáng)不息形
39、式表面運動聲音文字位置堆疊躲避擾動尺寸形狀多邊形符號圖片旋轉(zhuǎn)顏色色相亮度飽和度紋理圖案粒度方向模糊透明度方向速度加速音調(diào)聲響節(jié)奏語音標(biāo)簽Wilkinson也定義了標(biāo)準(zhǔn)圖形和美學(xué)屬性。其中,標(biāo)準(zhǔn)圖形對應(yīng)于Bertin 的圖形符號,美學(xué)屬性對應(yīng)Bertin的視網(wǎng)膜變量。Wilkinson的美學(xué)屬性Wilkinson提出兩個重要的可視化概念數(shù)據(jù)和它們的視覺表達(dá)應(yīng)該被區(qū)分(類似于Bertin的內(nèi)容和載體的分離)可應(yīng)用不同的算子構(gòu)造數(shù)據(jù)變量的可視化。即可采用融合+等算子從各類數(shù)據(jù)變量出發(fā)定義復(fù)雜的圖形空間,并通過縮放映射島顯示視圖。第 67 頁竢實揚(yáng)華,自強(qiáng)不息4.5.4 基于數(shù)據(jù)類型的研究一維:一維數(shù)據(jù)指由字母或文字組成的線性數(shù)據(jù),如文本文件、程序源代碼等??梢暬O(shè)計主要針對文字、選擇字體、顏色、大小和顯示方式。用戶需求一半是搜索文本或者數(shù)據(jù)項,以及相關(guān)屬性。二維:二維數(shù)據(jù)主要是平面或地圖數(shù)據(jù),例如地理地圖、平面圖或報紙版面等。數(shù)據(jù)集中每一項對應(yīng)二維平面上的某些區(qū)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 分裂情感性精神病
- 防震疏散演練主題班會
- 2024年非公路礦用車項目投資申請報告代可行性研究報告
- 3.3.2鹽類的水解影響因素及應(yīng)用 課件 高二上學(xué)期化學(xué)人教版(2019)選擇性必修1
- 智慧航安培訓(xùn)方案
- 吉林省2024七年級數(shù)學(xué)上冊第1章有理數(shù)階段綜合訓(xùn)練范圍1.9~1.14課件新版華東師大版
- 生命安全教育我的煩惱
- 草原上教案及教學(xué)反思
- 食堂食品安全培訓(xùn)
- 水利資源利用審批管理辦法
- 食品生產(chǎn)企業(yè)食品安全管理人員考試題庫含答案完整版
- 一份完整的投標(biāo)書
- 宜章莽山景區(qū)旅游開發(fā)有限公司股東全部權(quán)益價值評估項目資產(chǎn)評估報告
- 化學(xué)丨四川省南充市高2025屆高考適應(yīng)性考試(南充一診)高三10月聯(lián)考化學(xué)試卷及答案
- 期中測試卷(試題)-2024-2025學(xué)年人教版數(shù)學(xué)五年級上冊
- 建筑保險行業(yè)市場深度分析報告
- 蒲城清潔能源化工有限責(zé)任公司70萬噸年煤制烯烴項目脫鹽水
- 個人理財-形考作業(yè)3(第6-7章)-國開(ZJ)-參考資料
- GB/T 44340-2024糧食儲藏玉米安全儲藏技術(shù)規(guī)范
- 點亮文明 課件 2024-2025學(xué)年蘇少版(2024)初中美術(shù)七年級上冊
- 建設(shè)用地土壤污染風(fēng)險篩選值和管制值(基本項目)
評論
0/150
提交評論