數(shù)據(jù)可視化報(bào)告_第1頁
數(shù)據(jù)可視化報(bào)告_第2頁
數(shù)據(jù)可視化報(bào)告_第3頁
數(shù)據(jù)可視化報(bào)告_第4頁
數(shù)據(jù)可視化報(bào)告_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2018年 6 月 7 日目錄一、題目4二、數(shù)據(jù)4三、可視化工具(哪一種,選擇原因)4四、可視化方案或可視化實(shí)現(xiàn)過程41、導(dǎo)入數(shù)據(jù)并進(jìn)行規(guī)范化42、數(shù)據(jù)連接與整理43、將地理信息與地圖進(jìn)行結(jié)合54、設(shè)置相關(guān)參數(shù)55、可視化方案5五、可視化結(jié)果51、交戰(zhàn)陣營可視化62、人口統(tǒng)計(jì)可視化83、死亡人數(shù)可視化94、時間順序可視化115、人口損失情況可視化13六、體會15一、 題目在的可視化課程結(jié)束的同時中,本人也開始了數(shù)據(jù)可視化的大作業(yè)的工作。大作業(yè)是對前面學(xué)過的數(shù)據(jù)可視化技術(shù)的一個總結(jié)、回顧和實(shí)踐。在開始設(shè)計(jì)前,本人回顧以前所學(xué)的內(nèi)容,明確了本次作業(yè)設(shè)計(jì)所要用到的技術(shù)點(diǎn),成功完成了可視化期末大作業(yè)。大作業(yè)要求從網(wǎng)絡(luò)上下載一組數(shù)據(jù)(自行獲?。?,選擇一種可視化工具(Excel、Tableau、Matlab、Echarts等),設(shè)計(jì)一種可視化方案實(shí)現(xiàn)該數(shù)據(jù)的可視化,并做適當(dāng)?shù)臄?shù)據(jù)分析(或挖掘)。二、 數(shù)據(jù)本次實(shí)驗(yàn)中,我設(shè)計(jì)的是關(guān)于第二次世界大戰(zhàn)的數(shù)據(jù)可視化。原數(shù)據(jù)為兩張表,分別存儲了各個國家的人口犧牲情況與各個國家相互之間的戰(zhàn)爭具體時間、陣營、以及事件。其中國家數(shù)據(jù)來源于維基百科中World War II casualties詞條下的表格,具體網(wǎng)址為:/wiki/World_War_II_casualties#cite_note-187。而關(guān)于時間、陣營與事件的數(shù)據(jù)來源于維基百科的World War II詞條下方的信息,具體網(wǎng)址為:/wiki/World_War_II。兩張表之間都以excel形式存在,在導(dǎo)入Tableau數(shù)據(jù)庫的時候,建立兩表的關(guān)系并對表進(jìn)行說明。本人在建立過程前引入了一些編號變量,可以進(jìn)行無視。下面是部分?jǐn)?shù)據(jù)截圖,具體數(shù)據(jù)見隨文檔上交的excel文件。三、 可視化工具(哪一種,選擇原因)在這次的作業(yè)中本人選擇的可視化工具為Tableau,選擇該工具主要有以下原因:1、快速創(chuàng)建交互式繪圖。使用Tableau的拖拽式界面,可以在幾分鐘內(nèi)創(chuàng)建許多漂亮的可視化。這個界面可以操作無窮盡的變化,可以輕松解決項(xiàng)目。 2、交互式儀表盤。得到結(jié)果后可以簡單的與結(jié)果進(jìn)行交互,得到更加直觀的結(jié)果。3、實(shí)時的連接,在對原數(shù)據(jù)進(jìn)行修改后,簡單的刷新數(shù)據(jù)庫就可以對全部的可視化結(jié)果進(jìn)行修改。4、提供多種的可視化方法,不僅限于Excel的簡單圖,Tableau可以容易的與地圖進(jìn)行連接,構(gòu)建更加直觀的圖像。也可以直接選擇不同的可視化方法,觀察其中的優(yōu)劣。 5、Tableau簡單易學(xué),可以快速掌握,簡單的得出還算漂亮的圖像。四、 可視化方案或可視化實(shí)現(xiàn)過程1、 導(dǎo)入數(shù)據(jù)并進(jìn)行規(guī)范化選擇導(dǎo)入excel文件,然后整理文件的格式,讓系統(tǒng)可以正常識別。2、 數(shù)據(jù)連接與整理把excel表中的表和詳細(xì)描述進(jìn)行連接,然后清除掉多余或者無用的項(xiàng),整理后的數(shù)據(jù)見下圖:圖4-1:交戰(zhàn)情況表圖4-2:國家狀況表3、 將地理信息與地圖進(jìn)行結(jié)合把地理信息同具體的地圖進(jìn)行結(jié)合,在地圖上解釋原來數(shù)據(jù)中的地理信息。4、 設(shè)置相關(guān)參數(shù)設(shè)置相關(guān)的參數(shù),通過參數(shù)來確認(rèn)相關(guān)的閾值,以及形成數(shù)據(jù)桶,更好的進(jìn)行分類操作。5、 可視化方案1)對交戰(zhàn)國戰(zhàn)前、戰(zhàn)時、戰(zhàn)后的情況進(jìn)行可視化,使用顏色區(qū)別陣營。2)對交戰(zhàn)國的人口與人口死亡率進(jìn)行可視化,同時用不同的顏色標(biāo)識死亡率大小。3)對交戰(zhàn)國具體的死亡人數(shù)進(jìn)行可視化,用顏色深淺標(biāo)識人數(shù)多寡。4)對交戰(zhàn)國總?cè)丝谒劳銮闆r進(jìn)行可視化,設(shè)置閾值識別犧牲多寡,同時使用不同顏色標(biāo)示不同陣營與狀態(tài)的犧牲人數(shù)。5)對交戰(zhàn)國具體事件與開戰(zhàn)事件進(jìn)行可視化,要求可以清楚的分辨開戰(zhàn)時間的長短與具體事件的先后。6)對以上可視化內(nèi)容,要求可以突出顯示每一個交戰(zhàn)國的具體情況。也可以根據(jù)陣營或其他分類方法進(jìn)行突出顯示。五、 可視化結(jié)果1、 交戰(zhàn)陣營可視化使用了地圖的模式,把每一個國家與對應(yīng)的版圖進(jìn)行連接,其中比較麻煩的是有部分國家政治環(huán)境發(fā)生了一些變化,導(dǎo)致國家的消失(如蘇聯(lián)、英聯(lián)邦和南斯拉夫)因此要使用其他的方法重現(xiàn)。下面是本人的陣營圖界面:下面是具體的操作演示與分析:戰(zhàn)前,1939年前的世界秩序,可以看到,一戰(zhàn)中利益受損國從一戰(zhàn)中走出,開始積極向周圍小國開戰(zhàn),各大利益集團(tuán)利益開始沖突。在歐洲,爆發(fā)了意識形態(tài)沖突,一戰(zhàn)中失去了領(lǐng)土的戰(zhàn)敗國積極的對外擴(kuò)張,法西斯注意在戰(zhàn)敗國中間傳播。十月革命后成立的蘇聯(lián)也積極對外進(jìn)行意思形態(tài)的輸出,同時希望奪取原來屬于沙皇俄國的遺產(chǎn)。西班牙意識形態(tài)斗爭異常劇烈,從而爆發(fā)了內(nèi)戰(zhàn)。非洲,意大利積極對外擴(kuò)張,希望一雪二十年前慘敗與埃塞俄比亞的恥辱,而亞洲大部分利益都掌握在歐洲國家手中,對此不滿的日本企圖奪取東亞的利益,一場大戰(zhàn)一觸即發(fā)。戰(zhàn)時,1939年到1943年的世界秩序,可以看到,軸心國勢力達(dá)到頂峰,世界籠罩在黑暗之中,同時中立的美洲國家加入了世界大戰(zhàn)。歐洲大陸幾乎被法西斯占據(jù),只有蘇聯(lián)仍然堅(jiān)持,西班牙內(nèi)戰(zhàn)中右翼政府上臺,歐洲形勢到了最危急的時候。然而蘇聯(lián)力挽狂瀾,在1943年完成了攻守互換。日本在東亞如入無人之境,橫掃東南亞的英美荷殖民地,劍鋒直至印度。然而日本低估了美國的工業(yè)能力,最后喪失了制海權(quán)。于此同時中國也加入了同盟國,正式加入了第二次世界大戰(zhàn)。戰(zhàn)后,1945年以后的世界秩序,可以看到軸心國勢力完全磨平,剩余兩大陣營瓜分了軸心的勢力范圍,并且在東亞開始了新一輪的意識形態(tài)競爭。同時因?yàn)閼?zhàn)爭導(dǎo)致歐洲國家力量減弱,各個殖民地獨(dú)立行動也轟轟烈烈的展開了。歐洲戰(zhàn)場,蘇聯(lián)力挽狂瀾,意大利忽然反水,美英諾曼底登陸。軸心國勢力別瓜分。正如丘吉爾所說,一道橫跨歐洲的鐵幕拉開了。但由于犧牲過與巨大,歐洲沒有發(fā)生繼續(xù)的戰(zhàn)爭。亞洲,日本投降,遠(yuǎn)東的利益又一次別掌握,然而由于宗主國實(shí)力的減弱,轟轟烈烈的民族解放運(yùn)動在南亞開始了。而東亞則成了蘇聯(lián)與美國博弈的舞臺,意識形態(tài)的戰(zhàn)爭在這里再次開戰(zhàn)。2、 人口統(tǒng)計(jì)可視化在這個部分設(shè)置兩個數(shù)據(jù)桶,把人口總數(shù)放入人口數(shù)據(jù)桶,死亡率放入死亡率數(shù)據(jù)桶,然后用大小標(biāo)識國家人口多少,用顏色深淺標(biāo)識死亡率高低,具體結(jié)果如下所示:下面是本人的操作與分析可以看到,下圖中戰(zhàn)爭中別占領(lǐng)的國家,人口傷亡率普遍高于沒有被占領(lǐng)的國家。尤其是德國東線戰(zhàn)場上的國家,人口死亡率相當(dāng)驚人。如下圖所示,人口死亡率低于10%的國家明顯標(biāo)注出來,其中主要包括美洲國家、西線戰(zhàn)場的國家、英國殖民地以及人口基數(shù)較大的國家。下圖是人口死亡率高于10%的國家。主要包括蘇聯(lián)成員國,東線戰(zhàn)場國家以及德國本身。結(jié)合上面的分析,可以得到,海上交戰(zhàn)的國家人口死亡率較低,亞洲的人口大國人口因?yàn)槿丝诨鶖?shù)較大死亡率次低,而歐洲戰(zhàn)場上主要陸上交戰(zhàn)國,如德國、俄羅斯、波蘭,人口死亡率極高。3、 死亡人數(shù)可視化在該界面中主要標(biāo)識了不同國家的具體死亡人口數(shù)目,使用顏色深淺來標(biāo)識數(shù)據(jù)的大小情況。具體情況見下面的分析操作:下面是按照士兵戰(zhàn)死數(shù)目,可以看到歐洲西線戰(zhàn)場上雙方死傷慘重,接下來就是遠(yuǎn)東的亞洲戰(zhàn)場上,中國與日本這兩個人口大國之間也是士兵犧牲數(shù)量較多的國家。下面是按照軍事行動導(dǎo)致平民死亡的人數(shù),可以看到大部分都是領(lǐng)土別入侵的國家與人口基數(shù)較大的國家。不過要注意的是軸心國的數(shù)據(jù)普遍偏小。下面是按照疾病與饑荒導(dǎo)致平民死亡的數(shù)據(jù),可以看到排名靠前的都是人口基數(shù)大的國家或者欠發(fā)達(dá)國家。下面是士兵失蹤數(shù)目,其中俄羅斯數(shù)據(jù)包括全部蘇聯(lián)失蹤人數(shù)。失蹤人員可能是臨陣脫逃或者關(guān)如集中營死亡。這個數(shù)據(jù)真的有點(diǎn)玄乎,俄羅斯作為蘇聯(lián)一員軍事行動中死亡的士兵約6百萬,然而全蘇聯(lián)失蹤人數(shù)竟然達(dá)到1千4百萬。各國都是失蹤人數(shù)大于犧牲士兵數(shù),這真的很怪。下面是全體人口的死亡數(shù),其中我把失蹤人數(shù)也算入了死亡人數(shù),按照大眾的說法是不應(yīng)該計(jì)入失蹤人數(shù)的,但我還是加上了失蹤人數(shù),因?yàn)槎歼^去那么多年了,失蹤人員假如生還也應(yīng)該死了,他們的人生因?yàn)閼?zhàn)爭而改變,到最后都生死不明,于是我加上了他們。從上述數(shù)據(jù)可以看出不同國家的具體人口犧牲數(shù)目使用顏色深淺可以讓數(shù)據(jù)更加直觀。同時這個數(shù)據(jù)也是很有問題的,軸心國平民中因?yàn)轲嚮幕蛘哕娛滦袆铀劳龅娜藬?shù)為零或很少,而且士兵失蹤數(shù)目也過于巨大;這都是原本數(shù)據(jù)的不可信點(diǎn)??梢园l(fā)現(xiàn),法國、意大利人口基數(shù)大早早投降,因此死亡人口低。而蘇聯(lián),波蘭、中國德國等國家人口死亡率極高。因此,人口基數(shù)越大、戰(zhàn)爭持續(xù)時間越長、被入侵本土的國家人口死亡率就高。4、 時間順序可視化這里可以通過時間來對二戰(zhàn)中的大事件進(jìn)行梳理,可以突出表達(dá)有關(guān)國家的具體事件。在事件部分采用了地圖散點(diǎn)圖,而持續(xù)時間用了樹狀圖的平鋪圖。下面是具體的頁面:如下圖所示,可以高亮的顯示具體國家的情況。下面就高亮了全部有關(guān)于軸心國方日本的時間情況:此時,只要再高亮同盟國方的具體情況,就可以看見具體的兩國之間的情況了,鼠標(biāo)放到點(diǎn)上會顯示具體情況。還可以拖動右上角的時間條對時間進(jìn)行梳理。下面是關(guān)于這方面的分析:上面是軸心國主要國家:德、日、意三國的各自作戰(zhàn)情況圖,可以看到,二戰(zhàn)中的軸心國交戰(zhàn)主要依據(jù)地緣政治,德國負(fù)責(zé)歐洲,意大利負(fù)責(zé)北非,日本負(fù)責(zé)亞太地區(qū)。詳細(xì)情況可拖動時間表顯示,具體情況可以在工作表中操作。5、 人口損失情況可視化按照可視化方案,設(shè)計(jì)了這一份人口損失情況的可視化。其中包括各國的具體情況與世界情況的對照,可以突出顯示具體的國家,下圖中高亮了中國的信息:具體界面如下圖所示,左邊是柱狀圖顯示的死亡率圖與死亡人口總數(shù)圖,其中超過閾值(12%的人口死亡率與1百萬的人口死亡數(shù))的標(biāo)記為紅色。右邊是全世界不同國家的具體情況,用不同的顏色表明了不同的陣營。下面是具體情況的分析報(bào)告與演示,先展示全部軸心國死亡人數(shù)的情況,可以看到,左邊的人口除德國以外沒有其他國家,再看右邊,人口死亡數(shù)與人口死亡率中考前的兩個深灰色原點(diǎn)是德國和日本,而平民死亡人數(shù)都沒有高亮的圓圈。再展示全部同盟國死亡人數(shù)的情況,可以看到,左邊的人口中標(biāo)紅的為中國、印度與美國。再看右邊,人口死亡數(shù)與人口死亡率中普遍較低,而平民死亡人數(shù)除最高的中國之外沒有其他較高的數(shù)據(jù)點(diǎn)。最后是蘇維埃聯(lián)邦和其他別占領(lǐng)的國家,他們在二戰(zhàn)中付出了巨大的犧牲,其中平民死亡與人口死亡率都是排在前列。1945年8月5日,戰(zhàn)爭結(jié)束。這場戰(zhàn)爭中交戰(zhàn)方都付出了巨大的代價(jià),特別是蘇聯(lián)、同盟國主要國家、德國以及被軸心國占領(lǐng)的國家;也給世界帶來了巨大的災(zāi)難,希望人類引以為戒,戰(zhàn)爭不再發(fā)生。以上就是全部我的全部相關(guān)分析。 六、 體會在本次的期末作業(yè)中,我根據(jù)網(wǎng)上收集的二戰(zhàn)數(shù)據(jù),完成了關(guān)于二戰(zhàn)情況的可視化作業(yè),雖然較為簡單,同時并不完善,但是我也在實(shí)踐中收獲了很多,得到了以下體會:在搞大作業(yè)的時候,我才開始學(xué)習(xí)tableau,由于對于這一款軟件的不了解,沒有使用有關(guān)算法進(jìn)行數(shù)據(jù)挖掘,只是簡單的把數(shù)據(jù)可視化了而已。在實(shí)戰(zhàn)中,主要參考了給的模板例子,同時查閱網(wǎng)上的資料,在試驗(yàn)中掌握技術(shù),最終得到了成果。同時我也了解了數(shù)據(jù)一致化的重要性,從晚上得到的數(shù)據(jù)千奇百怪,總是有種種問題。在本次作業(yè)中主要遇到的數(shù)據(jù)不一致問題有國家名稱的不統(tǒng)一,事件城市名稱多值,以及人數(shù)欄中出現(xiàn)字符串等,都要進(jìn)行修改,因此數(shù)據(jù)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論