《新媒體數(shù)據(jù)分析》課件-第5章 新媒體數(shù)據(jù)的可視化呈現(xiàn)_第1頁
《新媒體數(shù)據(jù)分析》課件-第5章 新媒體數(shù)據(jù)的可視化呈現(xiàn)_第2頁
《新媒體數(shù)據(jù)分析》課件-第5章 新媒體數(shù)據(jù)的可視化呈現(xiàn)_第3頁
《新媒體數(shù)據(jù)分析》課件-第5章 新媒體數(shù)據(jù)的可視化呈現(xiàn)_第4頁
《新媒體數(shù)據(jù)分析》課件-第5章 新媒體數(shù)據(jù)的可視化呈現(xiàn)_第5頁
已閱讀5頁,還剩24頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第五章

新媒體數(shù)據(jù)的可視化呈現(xiàn)學習目標隨著大數(shù)據(jù)時代的到來,互聯(lián)網(wǎng)進入了一個數(shù)據(jù)量飛速增長的階段。人們逐漸在新媒體數(shù)據(jù)的海洋中迷失,這給新媒體數(shù)據(jù)的可視化呈現(xiàn)帶來了機遇也帶來了新的挑戰(zhàn)。如何讓數(shù)據(jù)從“人們看不見變成看得見,從不愿意看變成愿意看”成為數(shù)據(jù)可視化呈現(xiàn)要解決的突出問題。本章介紹從非視覺的數(shù)據(jù)向視覺化轉化的基本原理和技巧,提供柱形圖、折線圖、樹圖等13種圖表的選擇和設計方法,介紹時序數(shù)據(jù)、空間數(shù)據(jù)、層次網(wǎng)絡數(shù)據(jù)、文本數(shù)據(jù)的可視化呈現(xiàn)方案。導語微信、微博、頭條號、抖音等新媒體平臺每天都在產(chǎn)生大量的新媒體數(shù)據(jù)。僅僅采集、分析這些新媒體數(shù)據(jù)還遠遠不夠,只有將這些新媒體數(shù)據(jù)進行高效、直觀、生動、準確的視覺呈現(xiàn),才能使大家共享數(shù)據(jù)帶來的紅利和益處。人的大腦有一半以上的神經(jīng)與視覺有關,而人從外界所獲得的信息中,70%以上是通過視覺得到的,并且人類具有高效的、大容量的圖形和圖像信息通道。數(shù)據(jù)可視化將數(shù)據(jù)以圖表的形式呈現(xiàn)出來,提供直觀的可視界面,用戶通過視覺器官獲得經(jīng)過可視編碼后的信息,經(jīng)大腦解碼并形成認知,在交互和分析過程中洞悉信息內涵,獲得解決問題的方法。因此科學、合理地利用圖表呈現(xiàn)數(shù)據(jù)愈發(fā)成為各行業(yè)人才的必備技能。目錄新媒體數(shù)據(jù)呈現(xiàn)的基本原理常用的新媒體數(shù)據(jù)呈現(xiàn)形式不同類型數(shù)據(jù)的可視化處理方法和路徑第一節(jié)新媒體數(shù)據(jù)呈現(xiàn)的基本原理一、可視化基本理論二、數(shù)據(jù)屬性與視覺通道三、可視化組件四、可視化目標和任務一、可視化基本理論數(shù)據(jù)可視化(Visualization)是利用計算機圖形學和圖像處理技術,將數(shù)據(jù)轉換成圖形或圖像在屏幕上顯示出來,并進行交互處理的理論、方法和技術??梢暬譃樗膫€類型,分別為:科學計算可視化、數(shù)據(jù)可視化、信息可視化和知識可視化。弗萊在著作《可視化數(shù)據(jù)》中,將數(shù)據(jù)可視化分為七個階段:獲取、分析、過濾、挖掘、表述、修飾和交互。陳為等人在《數(shù)據(jù)可視化》中,將可視化設計的基本圖表分為柱狀圖、直方圖、餅圖、等值線圖、走勢圖、散點圖和散點矩陣、維恩圖、熱力圖等。當選擇了合適的可視化圖表后,還要對這些圖表進行色彩設計、場景設計、視覺層次設計、動態(tài)交互設計等,以此提升視覺沖擊力和用戶體驗。二、數(shù)據(jù)屬性與視覺通道

數(shù)據(jù)屬性可分為3類,分別為類別型、有序型和數(shù)值型。類別型數(shù)據(jù)是只能歸于某一類別的非數(shù)字型數(shù)據(jù),屬于定性數(shù)據(jù)或品質數(shù)據(jù);有序型數(shù)據(jù)用于表示對象的順序關系,只能歸于某一有序類別的非數(shù)字型數(shù)據(jù);數(shù)值型數(shù)據(jù)則表示某一種量級的測量值,屬于定量數(shù)據(jù)或數(shù)量數(shù)據(jù)。將數(shù)據(jù)信息映射成可視化元素的技術被稱為可視化編碼??梢暬幋a由標記和視覺通道兩部分組成。標記包括點、線、面等各類圖形元素。而通道則是標記的視覺特征,包括形狀、大小、位置、方向、飽和度、亮度等。數(shù)據(jù)可視化過程中,要將表現(xiàn)力最強的通道預留給最重要的屬性。類別型數(shù)據(jù)適宜用空間位置、形狀、色調等進行編碼;有序型數(shù)據(jù)和數(shù)值型數(shù)據(jù)適宜用飽和度、亮度、長度和面積等通道進行編碼。三、可視化組件

基于數(shù)據(jù)的可視化組件可以分為四種:視覺通道、坐標系、標尺以及背景信息。可視化是基于數(shù)據(jù)和這四種組件創(chuàng)建的。有時它們是顯式的,而有時它們則會組成一個無形的框架。這些組件協(xié)同工作,對一個組件的選擇會影響到其他組件。編碼數(shù)據(jù)的時候,總得把物體放在一定的位置。有一個結構化的空間,還有指定圖形和顏色畫在哪里的規(guī)則,這就是坐標系,它賦予XY坐標或經(jīng)緯度以意義。有三種坐標系幾乎可以覆蓋所有的需求,它們分別是直角坐標系、極坐標系和地理坐標系;坐標系指定了可視化的維度,而標尺則指定了在每一個維度里數(shù)據(jù)映射到哪里。標尺主要有數(shù)字標尺、分類標尺和時間標尺;背景信息可以幫助更好地理解數(shù)據(jù)相關的5w信息,即何人、何事、何時、何地、為何,可以使數(shù)據(jù)更清晰,并且能正確引導讀者。它可以提醒讀者這張圖在說什么。四、可視化目標和任務

除了明確數(shù)據(jù)屬性和視覺通道,可視化及數(shù)據(jù)呈現(xiàn)的邏輯還必須明確可視化的任務和目標,即用戶需解決什么問題?不同的讀者意味著可視化的目標不同,目標取決于設計者想讓讀者接收和理解什么樣的內容,因此這帶來了許多不同的視覺形式。第二節(jié)常用的新媒體數(shù)據(jù)呈現(xiàn)形式一、圖表的目的和價值二、圖表的三大要素(WhereWhatWhy)三、圖表選擇:統(tǒng)計圖及其他圖表樣式四、圖表設計一、圖表的目的和價值

㈠圖表是解讀數(shù)字的一種強有力的手段㈡圖表的解碼快速、簡單隨著數(shù)據(jù)點或數(shù)據(jù)系列數(shù)量的增多,圖表相對于表格的優(yōu)勢愈加突出,表現(xiàn)為溝通效率更高、對關鍵信息的表達更加充分等。二、圖表的三大要素(WhereWhatWhy)㈠where問題:坐標軸平面㈡what問題:圖表的視覺機制㈢why問題:數(shù)據(jù)和圖表的意義三、圖表選擇:統(tǒng)計圖及其他圖表樣式

最基礎的數(shù)據(jù)可視化方法就是統(tǒng)計圖。一個好的統(tǒng)計圖應該滿足四個標準:準確、有效、簡潔、美觀。由此對應的就是統(tǒng)計圖的“實力派”(準確+有效)和偶像派(簡潔+美觀)。不同圖表有不同的適用場合。本章介紹餅狀圖、柱形圖、折線圖、面積圖、散點圖、氣泡圖、雷達圖、南丁格爾玫瑰圖、樹圖、弦圖、詞云圖、示意圖、組合圖十三種圖表的適用場合和范圍,幫助大家理解不同類型的數(shù)據(jù)應匹配何種圖表,以達到最適宜的展示效果。三、圖表選擇:統(tǒng)計圖及其他圖表樣式

餅狀圖是以圓心角的度數(shù)來表達數(shù)值大小的統(tǒng)計圖表,常用于表現(xiàn)數(shù)據(jù)的占比關系,只有一個要繪制的數(shù)據(jù)系列,適合表現(xiàn)二維數(shù)據(jù)。餅圖中各項的總和為100%。

柱形圖是一種以長方形的長度為變量的統(tǒng)計圖表,它是最常見的圖表類型,通過使用水平或垂直方向柱子的高度來顯示不同類別的數(shù)值,其中柱狀圖的一個軸顯示正在比較的類別,而另一個軸代表對應的刻度值。柱狀圖不僅可以用于表現(xiàn)單一的數(shù)據(jù),也可將多種數(shù)據(jù)進行并列比較。它的適用場合是二維的中小規(guī)模數(shù)據(jù)集,但只有一個維度需要比較。

折線圖是通過線條的波動(上升或下降)來顯示連續(xù)數(shù)據(jù)隨時間或有序類別變化的圖表,常用于強調數(shù)據(jù)的變化或者趨勢。三、圖表選擇:統(tǒng)計圖及其他圖表樣式

面積圖與折線圖很相近,都可以用來展示隨著連續(xù)時間的推移數(shù)據(jù)的變化趨勢。區(qū)別在于,面積圖在折線與類別數(shù)據(jù)的水平軸(X軸)之間填充顏色或者紋理,形成一個面表示數(shù)據(jù)體積。相對于折線而言,被填充的區(qū)域可以更好的引起人們對總值趨勢的注意,所以面積圖主要用于傳達趨勢的大小,而不是確切的單個數(shù)據(jù)值。

散點圖是以一個變量為橫坐標,另一變量為縱坐標,利用散點(坐標點)的分布形態(tài)反映變量統(tǒng)計關系或坐標點分布模式的一種圖形。它一般用來呈現(xiàn)二維或三維的數(shù)據(jù),其中有兩個維度需比較。散點圖能通過直觀醒目的圖形方式反映變量間關系的變化形態(tài),當估計兩個變量之間存在相關關系時,可以用散點圖進行確認,并觀察和確定兩者的關系強度。散點圖還可以用來表現(xiàn)大量數(shù)據(jù)的分布和聚合情況。三、圖表選擇:統(tǒng)計圖及其他圖表樣式

氣泡圖可用于展示三個變量之間的關系。它是散點圖的一種變體,繪制時將一個變量放在橫軸,另一個變量放在縱軸,而第三個變量則用氣泡的大小來表示。氣泡圖適用于呈現(xiàn)三維或四維數(shù)據(jù),其中有兩維能精確辨識。

雷達圖又被叫做蜘蛛網(wǎng)圖,它是以在同一點開始的軸上顯示的三個或更多個變量的二維圖表的形式來顯示多元數(shù)據(jù)的方法,其中軸的相對位置和角度通常是無意義的。雷達圖的每個變量都有一個從中心向外發(fā)射的軸線,所有的軸之間的夾角相等,同時每個軸有相同的刻度,將軸到軸的刻度用網(wǎng)格線鏈接作為輔助元素,連接每個變量在其各自的軸線的數(shù)據(jù)點成一條多邊形。雷達圖可以同時對單個或者多個對象的不同性能進行比較,尤其應用于不同對象的不同性能的對比以及單個對象不同性能的對比。雷達圖對于查看哪些變量具有相似的值、變量之間是否有異常值都很有用。三、圖表選擇:統(tǒng)計圖及其他圖表樣式

長得像餅圖又不是餅圖,這種有著極坐標的統(tǒng)計圖有著一個美麗的名字—南丁格爾玫瑰圖。南丁格爾玫瑰圖又名雞冠花圖,這種圖表將柱圖轉化為更美觀的餅圖形式,是極坐標化的柱圖,其夸大了數(shù)據(jù)之間差異的視覺效果,適合展示數(shù)據(jù)原本差異小的數(shù)據(jù)。不同于餅圖用角度表現(xiàn)數(shù)值或占比,南丁格爾玫瑰圖使用扇形的半徑表示數(shù)據(jù)的大小,各扇形的角度則保持一致。

樹圖是一種利用包含關系表達層次化數(shù)據(jù)的可視化方法。樹圖通常是用來將主要的類別逐漸分解成許多越來越詳細的層,它把所屬關系或要實現(xiàn)的目的與需要采取的措施、手段,系統(tǒng)地展開,并繪制成圖,以明確問題的重點,尋找最佳手段或措施。繪制樹圖有助于思維從一般到具體的逐步轉化。三、圖表選擇:統(tǒng)計圖及其他圖表樣式

弦圖是一種可視化數(shù)據(jù)關系的圖表,主要用于展示多個對象之間的關系,連接圓上任意兩點的線段叫做弦。弦圖雖然看起來眼花繚亂,但是它卻非常適合分析復雜數(shù)據(jù)的關聯(lián)關系?!霸~云”圖是將文本中出現(xiàn)頻率較高的關鍵詞予以視覺上的突出,形成“關鍵詞云層”的圖形樣式。它能過濾掉大量的文本信息,使瀏覽者只要一眼掃過文本就可以領略文本的主旨。它適合呈現(xiàn)文本數(shù)據(jù),已成為一種直觀展現(xiàn)關鍵詞術語的高級、美觀、絢麗、個性的有效方法。大體上描述或表示物體的形狀、相對大小、物體與物體之間的聯(lián)系,描述某器材或某機械的大體結構和工作的基本原理,描述某個工藝過程的簡單圖示都叫做示意圖。四、圖表設計

可視化圖表設計是數(shù)據(jù)可視化的一個分支領域,是對數(shù)據(jù)進行的二次加工,既要保證圖表本身清晰易懂,盡可能減輕用戶獲取信息的成本;又要找準用戶關注的核心內容,進行適當?shù)耐伙@,幫助用戶通過數(shù)據(jù)進行決策。圖表設計包含圖表色彩設計、場景設計、視覺層次設計、動態(tài)交互設計多個方面。圖表設計的首要任務是準確展示和傳達數(shù)據(jù)所包含的信息,其次還有兼顧易讀性和傳播性,突出重點信息,用更加有助于理解和引導的方式去表達信息。第三節(jié)不同類型數(shù)據(jù)的可視化處理方法和路徑一、時序數(shù)據(jù)的可視化二、空間數(shù)據(jù)的可視化三、文本數(shù)據(jù)的可視化四、層次和網(wǎng)絡數(shù)據(jù)的可視化一、時序數(shù)據(jù)的可視化

不同的數(shù)據(jù)類型要匹配不同的可視化模式,設計之前應該先觀察和分析數(shù)據(jù)屬于哪種類型。時序數(shù)據(jù)是基于時間的一系列數(shù)據(jù),數(shù)據(jù)隨著時間的變化而變化;空間數(shù)據(jù)是帶有物理空間坐標的、與地理位置信息相關的數(shù)據(jù)??蓪?shù)值映射在地理坐標系中,以展現(xiàn)不同地區(qū)之間的聯(lián)系和差異;層次數(shù)據(jù)是表達個體之間的層次關系(包含或從屬)的數(shù)據(jù);網(wǎng)絡數(shù)據(jù)指不具備層次結構的關系數(shù)據(jù);文本數(shù)據(jù)以文字為記錄形式,可分為單文本、文檔集合和時序文本數(shù)據(jù)。一、時序數(shù)據(jù)的可視化

時間序列數(shù)據(jù)的定義包含兩個方面,一是數(shù)據(jù)與時間密切相關,并隨時間變化;二是數(shù)據(jù)按時間的先后順序排列。呈現(xiàn)時序數(shù)據(jù)的可視化模式較多,最常見的是用折線圖、柱狀圖、條形圖、堆積圖等傳統(tǒng)統(tǒng)計圖表。除了通過統(tǒng)計圖表來呈現(xiàn)時序數(shù)據(jù),還可以把時序數(shù)據(jù)作為一個大作品的整體架構貫穿其中,以此來梳理數(shù)據(jù)內容,搭建作品結構。這其實也是靈活運用各種圖表、圖形的一個表現(xiàn)。二、空間數(shù)據(jù)的可視化

空間數(shù)據(jù)多為地理數(shù)據(jù),往往通過地圖來呈現(xiàn)。可將數(shù)值映射在地理坐標系中,以展現(xiàn)不同地區(qū)之間的聯(lián)系和差異。地圖通常是展示地理數(shù)據(jù)的最好方式,也是最常用方式,比如二維的、三維的、靜態(tài)的、動態(tài)的、交互的地圖等。它還經(jīng)常跟點、線、氣泡等組合使用,形成地圖+詞云圖、示意地圖、地圖+氣泡圖、地圖+散點圖、實時地圖、地圖著色等多種樣式的地理數(shù)據(jù)可視化。三、文本數(shù)據(jù)的可視化

文本可視化技術將文本中復雜的或者難以通過文字表達的內容和規(guī)律以視覺符號的形式表達出來,使人們能夠利用與生俱來的視覺感知的并行化處理能力,快速獲取文本中所蘊含的關鍵信息。文本可視化依賴于自然語言處理,因此關鍵詞抽取、主題分析、情感分析等是較常用的文本分析技術。文本分析的過程主要包括特征提取,通過分詞、抽取、歸一化等操作提取出文本詞匯級的內容,利用特征構建向量空間模型并進行降維,以便將其呈現(xiàn)在低維空間,或者利用主題模型處理特征,最終以靈活有效的形式表示這些處理過的數(shù)據(jù),以便進行可視化呈現(xiàn)。文本可視化可分為三類:文本內容的可視化、文本關系的可視化、文本多層面信息的可視化。四、層次和網(wǎng)絡數(shù)據(jù)的可視化

層次數(shù)據(jù)是表達個體之間的層次關系(包含或從屬)的數(shù)據(jù);網(wǎng)絡數(shù)據(jù)指不具備層次結構的關系數(shù)據(jù)。節(jié)點鏈接圖和樹圖是表現(xiàn)層次化數(shù)據(jù)的代表方法。關系網(wǎng)絡圖是表現(xiàn)網(wǎng)絡數(shù)據(jù)的主要方法,通過關系網(wǎng)絡圖往往可以呈現(xiàn)兩個或多個對象之間錯綜復雜的關系。把對象變成點,點的大小、顏色可以是它的兩個參數(shù),兩個點之間的關系可以用連線來表示。連線又分為有向和無向,有向適合表現(xiàn)負責網(wǎng)絡數(shù)據(jù),將連接和方向相結合,線本身的方向代表了不同的連接關系;而無向適合表現(xiàn)簡單關系。習題1.比較分析餅狀圖、柱形圖、折線圖、面積圖、散點圖、氣泡圖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論