![數(shù)據(jù)新聞理論與實(shí)踐(微課版)PPT完整全套教學(xué)課件_第1頁(yè)](http://file4.renrendoc.com/view/c66587b4ce552551cc517e7a32df8bfb/c66587b4ce552551cc517e7a32df8bfb1.gif)
![數(shù)據(jù)新聞理論與實(shí)踐(微課版)PPT完整全套教學(xué)課件_第2頁(yè)](http://file4.renrendoc.com/view/c66587b4ce552551cc517e7a32df8bfb/c66587b4ce552551cc517e7a32df8bfb2.gif)
![數(shù)據(jù)新聞理論與實(shí)踐(微課版)PPT完整全套教學(xué)課件_第3頁(yè)](http://file4.renrendoc.com/view/c66587b4ce552551cc517e7a32df8bfb/c66587b4ce552551cc517e7a32df8bfb3.gif)
![數(shù)據(jù)新聞理論與實(shí)踐(微課版)PPT完整全套教學(xué)課件_第4頁(yè)](http://file4.renrendoc.com/view/c66587b4ce552551cc517e7a32df8bfb/c66587b4ce552551cc517e7a32df8bfb4.gif)
![數(shù)據(jù)新聞理論與實(shí)踐(微課版)PPT完整全套教學(xué)課件_第5頁(yè)](http://file4.renrendoc.com/view/c66587b4ce552551cc517e7a32df8bfb/c66587b4ce552551cc517e7a32df8bfb5.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)新聞理論與實(shí)踐(微課版)1.認(rèn)識(shí)數(shù)據(jù)新聞4-數(shù)據(jù)分析5-數(shù)據(jù)清洗8-圖表使用9-信息圖設(shè)計(jì)10-社會(huì)網(wǎng)絡(luò)數(shù)據(jù)可視化實(shí)踐-Gephi入門【數(shù)據(jù)新聞理論與實(shí)務(wù)】à
華南理工大學(xué)吳小坤1課程理念與目標(biāo)數(shù)據(jù)新聞學(xué)習(xí)的核心是思維訓(xùn)練。人文思維
計(jì)算思維DataacquisitionDatacategorizingDataorganizingStructurethedatastoryTitlexxxxxxxxxxxxxxxxxxxxxxxxxxxx第一步
收集數(shù)據(jù)第二步
數(shù)據(jù)分類第三步StructurethedatastoryxxxxxxxxxxxxxxxxxxxxxxExample.mapcanlieAvoiddatamisleadingl
教學(xué)目標(biāo)幫助文科背景的學(xué)生掌握數(shù)據(jù)獲取的基本途徑、工具與方法,能夠運(yùn)用數(shù)據(jù)方法和本專業(yè)知識(shí)推動(dòng)新聞生產(chǎn)前沿發(fā)展。數(shù)據(jù)獲取能力能夠?qū)Λ@取的數(shù)據(jù)進(jìn)行清洗和分析,使用數(shù)據(jù)和本專業(yè)基本原理、方法和手段挖掘新聞故事。數(shù)據(jù)分析與問(wèn)題發(fā)現(xiàn)能力交互式數(shù)據(jù)新聞生產(chǎn)能力能夠選擇與使用恰當(dāng)?shù)募夹g(shù)、數(shù)據(jù)資源和信息技術(shù)工具,進(jìn)行數(shù)據(jù)可視化設(shè)計(jì),并完成交互式數(shù)據(jù)新聞作品。知識(shí)目標(biāo)能力目標(biāo)素質(zhì)目標(biāo)創(chuàng)
新創(chuàng)新能力應(yīng)
用工具技能+實(shí)踐經(jīng)驗(yàn)數(shù)據(jù)素養(yǎng)+眼界評(píng)
價(jià)分
析數(shù)據(jù)素養(yǎng)+分析能力+方法掌握知識(shí)、理念理
解2課程內(nèi)容安排課程類型:專業(yè)課學(xué)時(shí)/學(xué)分:3學(xué)分/48學(xué)時(shí)教師團(tuán)隊(duì):吳小坤
劉銀娣
韓鎂
劉倩
黃雅蘭課程對(duì)象:新聞傳播學(xué)專業(yè)教學(xué)環(huán)境:線上線下混合式教學(xué)內(nèi)容共16章,涵蓋選題、數(shù)據(jù)、可視化三大板塊,對(duì)接媒體數(shù)據(jù)記者要求。EXCEL三、
Excel功能組件PowerQuery第7課不規(guī)范數(shù)據(jù)與數(shù)據(jù)清洗【3學(xué)時(shí):線上課程】(對(duì)應(yīng)在線課程“3.1面對(duì)雜亂的數(shù)據(jù)”“3.2巧妙使用數(shù)據(jù)透視表”“3.3使用OpenRefine做數(shù)據(jù)統(tǒng)一與清洗”“3.4使用OpenRefine做數(shù)據(jù)轉(zhuǎn)換”)一、
數(shù)據(jù)不規(guī)范的常見情況二、
使用OpenRefine做數(shù)據(jù)清洗**作業(yè)布置:各小組學(xué)習(xí)DJA案例資源,觀看在線課程,并準(zhǔn)備案例分析。**第8課數(shù)據(jù)新聞優(yōu)秀案例學(xué)習(xí)與討論【6學(xué)時(shí):3學(xué)時(shí)線上課程+3學(xué)時(shí)線下課程】(對(duì)應(yīng)在線課程“6.1數(shù)據(jù)新聞的重要獎(jiǎng)項(xiàng)”“6.2數(shù)據(jù)新聞的生產(chǎn)機(jī)構(gòu)”“6.3話題類數(shù)據(jù)新聞”“6.4事件類數(shù)據(jù)新聞”“6.5移動(dòng)場(chǎng)景下的數(shù)據(jù)可視化”“6.6短視頻在數(shù)據(jù)新聞中的運(yùn)用”“6.7人工智能技術(shù)在數(shù)據(jù)新聞中的運(yùn)用”)一、優(yōu)秀案例小組展示與點(diǎn)評(píng)二、優(yōu)秀案例討論(課程思政)第9課不使用代碼抓取網(wǎng)絡(luò)數(shù)據(jù)【2學(xué)時(shí):線上課程】(對(duì)應(yīng)線上課程“3.5使用數(shù)據(jù)庫(kù)軟件”“3.6簡(jiǎn)單的數(shù)據(jù)抓取”“3.7數(shù)據(jù)使用標(biāo)準(zhǔn)”)一、
使用瀏覽器插件TableTools2下載網(wǎng)頁(yè)數(shù)據(jù)二、
使用后羿采集器下載網(wǎng)頁(yè)數(shù)據(jù)第10課數(shù)據(jù)新聞的圖形表達(dá)【3學(xué)時(shí):線上課程】(對(duì)應(yīng)線上課程“4.1可視化歷史、可視化定義”“4.2主要幾種圖表類型例子介紹”“4.3選擇適當(dāng)圖形可視化的案例”“4.4需要避免的誤區(qū)和可能問(wèn)題”)l
課程體系社交網(wǎng)絡(luò)基礎(chǔ)知識(shí)社交網(wǎng)絡(luò)分析與可視化基于Gephi的社交網(wǎng)絡(luò)可視化從社交媒體數(shù)據(jù)集中構(gòu)建網(wǎng)絡(luò)Python環(huán)境配置和基礎(chǔ)語(yǔ)法基于Python的新聞數(shù)據(jù)處理及可視化高級(jí)數(shù)據(jù)新聞基于Python的新聞數(shù)據(jù)處理及可視化案例基于jiagu的自然語(yǔ)言處理實(shí)踐基于sklearn的機(jī)器學(xué)習(xí)實(shí)踐人工智能方法在數(shù)據(jù)新聞中的應(yīng)用l
課程目標(biāo)通過(guò)課程學(xué)習(xí),訓(xùn)練邏輯與數(shù)據(jù)的思維,較為全面地掌握數(shù)據(jù)分析和可視化的技能,在課程結(jié)束時(shí),能夠以小組合作的形式完成屬于自己的數(shù)據(jù)新聞作品。l
考核形式與內(nèi)容AB?
每小組最多3人;?
提交內(nèi)容需包括:、?
課堂作業(yè)與討論;?
中期展示;?
個(gè)人學(xué)習(xí)報(bào)告;小組作品平時(shí)成績(jī)、數(shù)據(jù)新聞稿、最終的可視化呈現(xiàn)網(wǎng)頁(yè)。(70%)(30%)l
評(píng)分標(biāo)準(zhǔn)兼顧選題和難度l
課程要求?
全程參加學(xué)習(xí),沒(méi)有特殊情況請(qǐng)不要缺課,以免跟不上進(jìn)度;?
認(rèn)真完成作業(yè)任務(wù),小組作業(yè)每個(gè)人都要參與,輪流匯報(bào);?
每位同學(xué)自帶電腦,在課程學(xué)習(xí)的過(guò)程中會(huì)幫助大家安裝一些軟件;這些軟件將幫助你課后自我練習(xí)和學(xué)習(xí);?
有不懂或跟不上的地方,課堂上可隨時(shí)提問(wèn)或討論。3課程配套資源l
課程配套教學(xué)資源建設(shè)(1)l
課程配套教學(xué)資源建設(shè)(2)吳小坤:《數(shù)據(jù)新聞制作簡(jiǎn)明教程》,吳小坤
趙甜芳:《數(shù)據(jù)新聞理論與實(shí)踐》,復(fù)旦大學(xué)出版社,2018.人民郵電出版社,20.l
課程配套教學(xué)資源建設(shè)(4)合作欄目l
SCUT數(shù)據(jù)之美
(華南理工-澎湃新聞)l
有理有數(shù)(華南理工-騰訊天天快報(bào))4什么是數(shù)據(jù)新聞1854年倫敦爆發(fā)霍亂,10天內(nèi)有500人死去,但比死亡更加讓人恐慌的是“未知”,人們不知道霍亂的源頭和感染分布。只有流行病專家John
Snow意識(shí)到,源頭來(lái)自市政供水。John在地圖上用黑杠標(biāo)注死亡案例,最終地圖“開口說(shuō)話”,顯示大街水龍頭是傳染源。這張信息圖還使公眾意識(shí)到城市下水系統(tǒng)的重要性并采取切實(shí)行動(dòng)。FlorenceNightingale,WilliamFarr(1859,LondonPriestley's
Chart
-
Comparison
of
Digital
vs.
Original/infographics/timeline/pages/compare.htmlCotton
Imports
in
1858
and
1861DiscusChronologicusDiscusChronologicus
inquo
OmnesImperatores
etReges
OrbisEuropaeiChristophWeigel1730,Nuremberg數(shù)據(jù)新聞的興起19301940Opinion
pollsInvestigation
organizationsNew
York
Tribune;Columbus
Telegraph;Chicago
TribuneCBS
usecomputers
topredict
presidentialelection
in
1952.數(shù)據(jù)新聞的興起193019401960InvestigationorganizationsOpinion
pollsAccurate
newsNew
York
Tribune;Columbus
Telegraph;Chicago
TribunePopular
in
mediaCBS
usecomputers
topredict
presidentialelection
in
1952.數(shù)據(jù)新聞的興起1930194019601967P
h
i
l
i
pM
e
ye
rInvestigationorganizationsAccuratenewsOpinion
pollsNew
York
Tribune;Columbus
Telegraph;Chicago
TribuneCBS
usecomputers
topredict
presidentialelection
in
1952.Use
computer
toanalyze
a
survey
oflocal
residents
indetail,to
coveragetheblackriots
that
summerPopular
in
media數(shù)據(jù)新聞的興起19891993199620011986MissouriInstituteforComputer-assistedComputer-assistedreportingNationalInstituteforComputer-assistedCAR-APracticalNICARconference:D
a
t
aJ
o
u
r
n
a
l
i
s
mGuideBookReportingreporting33數(shù)據(jù)新聞在中國(guó)l
Datanewsproduction(>10/month)更新情況(2018.6-2019.5)1348(18.8-19.5含每月更新(篇)**媒體/機(jī)構(gòu)欄目名稱湃客有數(shù)上線時(shí)間*2018年8月澎湃新聞135轉(zhuǎn)載)數(shù)可視廣東衛(wèi)視界面新聞上游新聞鏑數(shù)知數(shù)生活大數(shù)據(jù)數(shù)據(jù)2018年11月2017年11月2014年11月2017年2015年4月2013年3月2013年7月2014年12月2016年8月2016年3月2014年7月2012年1月2012年1月2012年759407376(含轉(zhuǎn)載)322126343127數(shù)據(jù)鏑次元數(shù)據(jù)新聞(信息圖)圖個(gè)明白/數(shù)據(jù)新聞圖解新聞272(含聯(lián)合報(bào)道)232218151414141312121210新華網(wǎng)265215179172170169156《新京報(bào)》中國(guó)新聞網(wǎng)好奇心日?qǐng)?bào)上觀新聞澎湃新聞財(cái)新傳媒網(wǎng)易新聞***《南方都市報(bào)》大眾網(wǎng)好奇心小數(shù)據(jù)圖數(shù)圖說(shuō)美數(shù)課數(shù)字說(shuō)數(shù)讀南都有數(shù)(南都指數(shù))圖個(gè)明白圖解48(19.1-19.5)1471381242015年8月2015年10月中國(guó)甘肅網(wǎng)l
停更/缺失欄目(15項(xiàng))更新情況(2018.6-2019.5)媒體欄目名稱上線時(shí)間*壹讀壹讀視頻新聞大數(shù)據(jù)新聞百科2012年7月2016年5月2012年9月已停更(總326期)已停更廣東衛(wèi)視騰訊新聞已停更(總631期)無(wú)界大公網(wǎng)《錢江晚報(bào)》國(guó)際在線無(wú)界新聞圖說(shuō)新聞圖視繪2015年7月2013年8月2012年6月2013年9月欄目缺失已停更已停更已停更圖解新聞28(18.6-18.11)18.12后已停更新浪新聞圖解天下2012年6月搜狐圖解財(cái)經(jīng)圖個(gè)明了數(shù)據(jù)控2012年8月2013年1月2012年12月已停更(總312期)已停更四川在線騰訊新聞已停更(總49期)中央電視臺(tái)《九派新聞》政見據(jù)說(shuō)春運(yùn)九派新聞讀圖識(shí)政治讀數(shù)2014年1月2015年9月2012年2月2014年已停更欄目缺失缺失《中國(guó)海洋石油報(bào)》缺失媒體人數(shù)月均產(chǎn)量(數(shù)據(jù)新聞)數(shù)據(jù)新聞的生產(chǎn)和閱讀門檻都相對(duì)較高澎湃20(其中設(shè)計(jì)人員需
12-28要承擔(dān)全公司的可視化設(shè)計(jì)工作)數(shù)據(jù)新聞的技術(shù)性難點(diǎn)直接導(dǎo)致其生產(chǎn)難度比普通新聞大,而普遍的小團(tuán)隊(duì)規(guī)模也決定了其無(wú)法追求大的生產(chǎn)規(guī)模。國(guó)內(nèi)的大多數(shù)媒體尚未配備數(shù)據(jù)記者,除了重視數(shù)據(jù)業(yè)務(wù)的媒體外,一些媒體即便配備了數(shù)據(jù)記者,在媒體里也是非常小的一個(gè)團(tuán)隊(duì)。(2019)DT財(cái)經(jīng)12(其中3人屬于整個(gè)公司的UED部門)8-12川業(yè)MORE數(shù)據(jù)
105-8南都7(更多的人從事數(shù)據(jù)
12服務(wù))解放-上觀498Sixth
Tone1輔助視覺(jué)數(shù)可視3030-40IRE與美國(guó)的數(shù)據(jù)新聞?wù){(diào)查記者……需要一種對(duì)世界為什么如此或?yàn)槭裁床蝗绱说膹?qiáng)烈好奇心,這種好奇心一定要伴之以嚴(yán)肅認(rèn)真的實(shí)證精神,而不是玩世不恭和虛無(wú)主義的懷疑精神、憤世嫉俗和‘殺富濟(jì)貧’的義憤,在這些素質(zhì)的基礎(chǔ)上鑄成一種暴露的品格;成功并非靠運(yùn)氣而因胸有成竹、把握機(jī)會(huì)……《調(diào)查記者手冊(cè)》(第四版),2005:
3.數(shù)據(jù)新聞在介入公共服務(wù)領(lǐng)域,是非常有力量的。你有一個(gè)疑問(wèn),你可以通過(guò)數(shù)據(jù)證實(shí),或者證偽你所發(fā)現(xiàn)的事情。從一個(gè)單一的事件上升到社會(huì)規(guī)律,社會(huì)現(xiàn)象,這件事情和很多社會(huì)科學(xué)做的事情很像,都是用定量的方法來(lái)回答問(wèn)題。數(shù)據(jù)公開的推動(dòng)力?
2010年:維基解密事件。?
大量的公開數(shù)據(jù)推動(dòng)了更多的媒體參與到從數(shù)據(jù)中挖掘新聞故事的過(guò)程中來(lái)。?
如《衛(wèi)報(bào)》便于2
0
1
0
年1
0
月發(fā)布了一則“伊拉克戰(zhàn)爭(zhēng)日志”(Wikileaks
Iraqwar
logs:
every
death
mapped)。該報(bào)道基于維基解密的數(shù)據(jù),利用谷歌提供的免費(fèi)軟件Google
Fushion,制作了一幅點(diǎn)狀數(shù)據(jù)地圖,地圖上的每一個(gè)紅點(diǎn)都代表了伊拉克戰(zhàn)爭(zhēng)中的一次死傷事件,并可以交互的方式展現(xiàn)事件的傷亡人數(shù)、時(shí)間,造成傷亡的具體原因,數(shù)據(jù)多達(dá)39.1萬(wàn)條之多,聚合起來(lái)形成了巨大的沖擊力。/world/datablog/interactive/2010/oct/23/wikileaks-iraq-deaths-map/news/datablog/2010/oct/23/wikileaks-iraq-data-journalism華南理工大學(xué)數(shù)據(jù)分析與信息可視化研究中心DJA/policy-and-politics/2018/9/28/17914308/kavanaugh-ford-question-dodge-hearing-chartEvery
time
Ford
and
Kavanaugh
dodged
a
question,in
one
chartTherewereseveralnoticeabledifferencesbetweentheSenatetestimony
ofSupremeCourtnomineeBrettKavanaughandthewomanaccusinghimofsexualassault,Christine
Blasey
Ford.Themostobviouswasthetoneeachtook.Fordwaspoliteandquietinrecounting
heraccusation
againstKavanaugh;hewasangry
andloud
inhisdenialsoftheallegationsagainsthim.Beyondthestyleoftheirtestimonies,therewasastrikingdifferenceinthecontentoftheirwords.ButonlyFordmadeanefforttoanswereverysinglequestion.2021-12-3華南理工大學(xué)數(shù)據(jù)分析與信息可視化研究中心2017年9月份,颶風(fēng)瑪利亞席卷了美屬波多黎各島,官方通報(bào)島上一共死了64個(gè)人。但其實(shí)你去當(dāng)?shù)刈鰣?bào)道,和當(dāng)?shù)氐娜肆模瑫?huì)發(fā)現(xiàn)有幾千人死了,遠(yuǎn)不止這64個(gè)人。那為什么政府會(huì)說(shuō)是64呢?我們想知道到底有多少人死了。我們做了一個(gè)網(wǎng)絡(luò)調(diào)查問(wèn)卷,放在Quartz的網(wǎng)站上,同時(shí)和波多黎各的一個(gè)非營(yíng)利調(diào)查新聞機(jī)構(gòu)合作,讓盡可能多的人來(lái)填這個(gè)問(wèn)卷。問(wèn)卷上收集的是填問(wèn)卷人的基本信息,和他們所知道的死者情況的詳細(xì)信息。最后有很多人填了這個(gè)表,這份問(wèn)卷我們從2017年12月份開始收集,一直到2018年7月份,還有人在填這個(gè)表,告訴我們,他們認(rèn)識(shí)的人過(guò)世了。華南理工大學(xué)數(shù)據(jù)分析與信息可視化研究中心但網(wǎng)絡(luò)問(wèn)卷有一個(gè)問(wèn)題,信息真實(shí)度很難核實(shí)。我們還做了一件事,向波多黎各的衛(wèi)生局申請(qǐng)公開信息,要求他們把這一年內(nèi)的所有死亡登記信息給到我們,最后一共拿到了兩萬(wàn)多條數(shù)據(jù)。我們把這兩個(gè)數(shù)據(jù)庫(kù)配對(duì)分析,看問(wèn)卷中收集到的死亡信息,是不是能夠在政府的死亡信息登記上找到。最后篩選出了一份二次問(wèn)卷。我們?cè)诘诙輪?wèn)卷中加了更多詳細(xì)的問(wèn)題,然后對(duì)填表人進(jìn)行電話回訪。一方面是核實(shí)填問(wèn)卷人的信息,另一方面又做了一次采訪,了解這些人為什么會(huì)在颶風(fēng)中死亡。電話核實(shí)后,我們最后一共收集了487個(gè)案例,可以看到第二年的2、3月份,還有人因?yàn)轱Z風(fēng)而過(guò)世。華南理工大學(xué)數(shù)據(jù)分析與信息可視化研究中心為什么會(huì)發(fā)生這樣的事情呢?通過(guò)這個(gè)數(shù)據(jù)庫(kù),我們發(fā)現(xiàn)很多人死于斷電。沒(méi)有電,醫(yī)院里面輸液的病人不行了。老人下樓,因?yàn)闆](méi)有電摔倒了?;蛘哂袝r(shí)候我想打個(gè)急救電話,沒(méi)有電,我打不出去。還有一些人他可能到了醫(yī)藥站,但因?yàn)檫@個(gè)醫(yī)藥站沒(méi)有電,拿不到藥,他需要去下一個(gè)醫(yī)藥站,那他去不了。所以有很多問(wèn)題是沒(méi)有電造成的。還有一些人是因?yàn)樗攘耸芪廴镜乃?,感染了一些疾病。他沒(méi)有在颶風(fēng)發(fā)生的第一個(gè)禮拜,死于溺水或者房屋倒塌,而是過(guò)了兩三個(gè)月之后死于疾病。還有一些人,他是抑郁自殺死的,大水把它的房子沖走了,他一輩子的財(cái)產(chǎn)沒(méi)有了,最后抑郁自殺。新聞中的數(shù)據(jù)價(jià)值數(shù)據(jù)對(duì)新聞為什么是重要的?如何理解兩者之間的關(guān)系?故事數(shù)據(jù)使用一定量的數(shù)據(jù)為新聞提供支撐,并以可視化的形式呈現(xiàn)原本僅靠文字所無(wú)法呈現(xiàn)的內(nèi)容。從數(shù)據(jù)中發(fā)現(xiàn)問(wèn)兩條路徑題,并進(jìn)而挖掘出新聞故事。數(shù)據(jù)在新聞中的應(yīng)用形式描述性分析
診斷性分析
預(yù)測(cè)性分析
規(guī)范性分析發(fā)生了什么?為什么會(huì)發(fā)生?將要發(fā)生什么?
需要做什么?列舉和事件相關(guān)的數(shù)據(jù);流程和進(jìn)展;數(shù)據(jù)檔案;發(fā)生的條件有哪些?重要性排序是怎樣的?發(fā)生的事情將產(chǎn)生怎樣的影響?比如通過(guò)對(duì)人口流動(dòng)數(shù)據(jù)或交通數(shù)據(jù)的分析,幫助人們選擇更好的旅行路線。/2014/zhoushicailu/案例
◆霍曼廣場(chǎng)(Homan
Square)/us-news/homan-square從2015年2月開始,《衛(wèi)報(bào)》揭露并調(diào)查了一個(gè)位于芝加哥霍曼廣場(chǎng)的秘密倉(cāng)庫(kù)。在那里,芝加哥警方拘留和詢問(wèn)數(shù)千人,但沒(méi)有向外界告知他們的下落或也不允許他們和律師聯(lián)系。衛(wèi)報(bào)通過(guò)將之前被拘留在霍曼廣場(chǎng)的這個(gè)倉(cāng)庫(kù)里的二十多名被拘留者的報(bào)告擴(kuò)展到擴(kuò)大的信息自由訴訟,迫使芝加哥警方披露內(nèi)部數(shù)據(jù),收集和調(diào)查到了數(shù)百頁(yè)之前從未公開的警方文件。這些文件與芝加哥警方之前的公開聲明相矛盾。調(diào)查表明在2004年8月至2015年6月期間被芝加哥警察單獨(dú)監(jiān)禁在霍曼廣場(chǎng)至少7351人,其中6000多人是黑人,。“The
injured
men
areamongat
least
7,351
people
–
morethan
6,000
of
themblack–who,policedocuments
show,
have
been
detained
and
interrogated
at
HomanSquarewithoutapublicnoticeoftheirwhereaboutsoraccesstoanattorney.
”出于隱私和安全的考慮,衛(wèi)報(bào)沒(méi)有公布被拘留著的名字和照片,而是用一個(gè)個(gè)小的圖標(biāo)代表一個(gè)人,用圖表、地圖直觀呈現(xiàn)了這七千多人的相關(guān)信息,包括種族、職位等。該報(bào)道中的數(shù)據(jù)來(lái)源包括:日常報(bào)告、對(duì)曾經(jīng)被拘留過(guò)的人以及進(jìn)入過(guò)這座被警方封鎖的倉(cāng)庫(kù)的律師的采訪、公開可用的芝加哥警方的逮捕記錄等等。其中最為重要的數(shù)據(jù)是,衛(wèi)報(bào)結(jié)合事先的調(diào)查,提起了對(duì)芝加哥警方的信息自由訴訟,迫使警方發(fā)布的內(nèi)部文件。數(shù)據(jù)ShareddataOpendataresourcesinChina////////Intl.?
datahub.io
(https://datahub.io/
)?
Worldbank(/
)?
Amazoncloud(NASA
satellite)?
世界衛(wèi)生組織
/zh/?
經(jīng)濟(jì)合作與發(fā)展組織/?
國(guó)際貨幣基金組織網(wǎng)站?
聯(lián)合國(guó)數(shù)據(jù)庫(kù)
/?
歐盟統(tǒng)計(jì)局http://ec.europa.eu/eurostat/data/database5同學(xué)作品示例D
ATA
STORIES
BY
STUDENTShttps://puyunsha.gitee.io/index.html/newsDetail_forward_6640709?from=singlemessage&isappinstalled=0/mysitehttps://xi-dong.github.io/index.htmlhttp://jackfruitxx.gitee.io/data-news/下節(jié)課任務(wù):每小組擬定選題,課前填入石墨文檔,并在線PPT展示匯報(bào)。匯報(bào)需包含如下內(nèi)容:?
選題名稱?
選題依據(jù)?
可以找到的數(shù)據(jù)與可行性分析?
是否已有類似的數(shù)據(jù)新聞作品。數(shù)
據(jù)
應(yīng)
用目
錄C
O
N
T
E
N
T
S01/
數(shù)據(jù)存在的問(wèn)題03/
常
用
工
具02/
數(shù)
據(jù)
整
理
和
清
洗04/
實(shí)
踐
練
習(xí)PA
RT
01數(shù)據(jù)存在的問(wèn)題不規(guī)范的數(shù)據(jù)格式不統(tǒng)一或錯(cuò)誤;打字錯(cuò)誤或亂碼;010203同一名稱,不同拼寫;04
數(shù)據(jù)缺失;05
樣本偏差;06
假數(shù)據(jù)。The
Quartz
壞數(shù)據(jù)手冊(cè)/2016/07/12/bad_data_guide/#missing你的信息源應(yīng)該解決的問(wèn)題?數(shù)據(jù)值缺失?缺失數(shù)據(jù)值被0補(bǔ)位?明顯的數(shù)據(jù)不完整?數(shù)據(jù)行或數(shù)據(jù)值重復(fù)?拼寫不一致?姓名順序不一致?日期格式不一致?未標(biāo)明數(shù)據(jù)值單位?分類不合理你應(yīng)該解決的問(wèn)題?文字出現(xiàn)亂碼?行末出現(xiàn)亂碼?數(shù)據(jù)在PDF文檔中?數(shù)據(jù)過(guò)于細(xì)碎?數(shù)據(jù)由人工錄入?數(shù)據(jù)中混雜格式和注釋?計(jì)算沒(méi)有處理缺失值?非隨機(jī)樣本?誤差范圍太大?字段名命名模糊不清?來(lái)源出處未標(biāo)明?出現(xiàn)不合理數(shù)據(jù)值?數(shù)據(jù)過(guò)于籠統(tǒng)?誤差范圍未知?樣本有傾向性?數(shù)據(jù)被人工編輯過(guò)?通貨膨脹影響數(shù)據(jù)?自然因素影響數(shù)據(jù)?時(shí)間維度被修改?參考維度被修改?數(shù)據(jù)量和公開的數(shù)據(jù)量不符?數(shù)據(jù)表有65536行?數(shù)據(jù)表中的年份出現(xiàn)1900、1904、1969或1970?文本被轉(zhuǎn)為數(shù)字?數(shù)字被儲(chǔ)存為文字l
數(shù)據(jù)值缺失l
常見問(wèn)題拼寫不一致,如:China,P.R.China,
People’s
RepublicofChina日期格式不一致,如:2017-09-16,
09/16/2017,
09/16/17,
16/09/17PA
RT
02數(shù)據(jù)整理和清洗只適合數(shù)據(jù)量很小的情況。如用OpenRefine來(lái)修正格式。如使用Excel表格或其他工具(如MySQL)做排列、合并或拆分。如使用Python、R等進(jìn)行數(shù)據(jù)清理。數(shù)據(jù)檢查用R畫直方圖隨機(jī)生成數(shù)字畫直方圖rnorm(100)rnorm(100,50,6)h=rnorm(100,50,6)hist(h)
檢查數(shù)據(jù)本身:1)
數(shù)據(jù)集有多少行?是否符合預(yù)期2)
數(shù)字加起來(lái)是否與總數(shù)一致?3)
使用直方圖如果不特別指定均值和方差,hist(rnorm(100,0,1)),這樣生成的直方圖每次都不同,是隨機(jī)的。
數(shù)據(jù)校驗(yàn)1)
與其他數(shù)據(jù)來(lái)源比照2)
查看之前的版本3)
咨詢專家4)
是否符合常識(shí)對(duì)新聞中的數(shù)據(jù)進(jìn)行檢驗(yàn)JonathanStray(哥倫比亞大學(xué)計(jì)算新聞學(xué)課程教授)
這些數(shù)字是哪里來(lái)的?
誰(shuí)記錄了這些數(shù)字?
怎么記錄的?
出于什么目的收集這些數(shù)據(jù)?
我們?cè)趺床拍軌蛑罃?shù)據(jù)是完整的?
這些數(shù)據(jù)的人口統(tǒng)計(jì)信息是什么?
用定量的方法解決這個(gè)問(wèn)題是正確的嗎?
這些數(shù)據(jù)中不包括什么?
這些數(shù)據(jù)的結(jié)果會(huì)對(duì)誰(shuí)不利?
數(shù)據(jù)是始終如一的,還是由不同人統(tǒng)計(jì)的?
為了生成這些數(shù)據(jù),需要做出哪些隨意的決定?
這些數(shù)據(jù)與其他來(lái)源的數(shù)據(jù)相符嗎?有誰(shuí)已經(jīng)分析過(guò)這些數(shù)據(jù)了?
數(shù)據(jù)有已知的缺陷嗎?有多個(gè)版本嗎?數(shù)據(jù)的測(cè)量層次在很大程度上決定了我們使用什么樣的統(tǒng)計(jì)方法和工具。使用調(diào)查數(shù)據(jù)的時(shí)候,會(huì)針對(duì)一些變量做分析,變量有三種形式:
定類變量:比如職業(yè)、性別、民族、健康狀況;
定序變量:比如文化程度、排名
定距變量/連續(xù)變量:比如工資、年齡、收入卡方分析比較率分類型數(shù)值型方差分析比較均值回歸分析依存關(guān)系卡方分析卡方(χ2)常用以檢驗(yàn)兩個(gè)或兩個(gè)以上樣本率或構(gòu)成比之間差別的顯著性分析,用以說(shuō)明兩類屬性現(xiàn)象之間是否存在一定的關(guān)系。CHITEST(range1,
range2)統(tǒng)計(jì)中的方差(樣本方差)是每個(gè)樣本值與全體樣本值的平均數(shù)之差的平方值的平均數(shù)。單因素方差分析練習(xí)案例:BasicSkills單因素方差分析,是檢驗(yàn)由單一因素影響的多組樣本某因變量的均值是否有顯著差異的問(wèn)題,如各組之間有顯著差異,說(shuō)明這個(gè)因素(分類變量)對(duì)因變量是有顯著影響的,因素的不同水平會(huì)影響到因變量的取值。
比較均值
回歸模型以及廣義線性模型
階層線性模型
聚類分析
時(shí)間序列分析PA
RT
03常用工具Excel案例:deerQ1.看天氣狀況與受傷程度有關(guān)系嗎?Q2.性別與受傷類型的關(guān)系?Q3.哪個(gè)部位受傷最多?Excel查詢功能說(shuō)英語(yǔ)的人占50%以上的國(guó)家中,該比例最小的是那個(gè)國(guó)家?Excel(唯一值)匹配功能=vlookup(目標(biāo)項(xiàng),查找范圍,第幾列,精確匹配)第幾列:可使用match函數(shù),
match(目標(biāo)項(xiàng),查找范圍,精確匹配)=VLOOKUP(B2,Gender_StatsCountry.csv!$A:$B,MATCH($C$1,Gender_StatsCountry.csv!$A$1:$E$1,0),FALSE)=VLOOKUP(B3,‘C:\Users\ich\Desktop\[country.xlsx]country'!$B:$D,2,FALSE)給Muslim表格匹配地區(qū)MySQLNavicatselect*FROMcountrylanguageWHERELANGUAGE="English"andPercentage
>50ORDERBY
PercentageSELECT*FROM`deathsonly`whereType='FriendlyAction'andCategory='Raid'and`Total
deaths`>3ORDERBY
`Total
deaths`DESCTabulahttp://tabula.technology/從下載環(huán)境保護(hù)部數(shù)據(jù)中心的數(shù)據(jù),打印成pdf文件。/index!MenuAction.action?name=12345678910123456789將pdf導(dǎo)入tabula;選擇表格或者自動(dòng)檢測(cè)表格;預(yù)覽并提??;導(dǎo)出數(shù)據(jù)。OpenRefine/download.html運(yùn)行
網(wǎng)頁(yè)顯示導(dǎo)入文件,執(zhí)行,在頁(yè)面上打開表格/wiki/Filmfare_Award_for_Best_Actress簡(jiǎn)單的數(shù)據(jù)采集方法h
t
t
p
s
:
/
/
a
d
d
o
n
s
.
m
o
z
i
l
l
a
.
o
r
g
/
e
n
-US/firefox/addon/tabletools2/?src=collection&collection_id=56e286c9-3863-4014-adc7-ac64ea0b1767
(火狐瀏覽器插件)實(shí)際例子安裝tabletools2后,打開網(wǎng)頁(yè)/chart/esf_cz.asp?Pages=3右鍵表格—tabletools2—復(fù)制—表格為制表符分隔文本/wholemarket/html/cbcx.aspx新聞實(shí)例:WikileaksIraq:datajournalismmapseverydeath/news/datablog/2010/oct/23/wikileaks-iraq-data-journalism#data請(qǐng)嘗試:/world-population/china-population//china/population數(shù)據(jù)來(lái)源2數(shù)據(jù)與新聞數(shù)據(jù)分析與應(yīng)用數(shù)據(jù)獲取與處理/extreme-poverty《全球極度貧困》報(bào)告1.使用了哪些衡量指標(biāo)?2.這篇報(bào)告從哪些角度對(duì)貧困現(xiàn)象展開的討論?3.撰寫者是怎樣建立其數(shù)據(jù)分析和推演的?數(shù)據(jù)清洗Open
Refine的使用雜亂的數(shù)據(jù)我們從各種路徑獲取的數(shù)據(jù)都并不整齊干凈,其中會(huì)存在數(shù)據(jù)不規(guī)范或者錯(cuò)誤。比如:?
數(shù)據(jù)格式不統(tǒng)一、?
打字錯(cuò)誤或亂碼、?
同一名稱不同拼寫、?
數(shù)據(jù)缺失、?
樣本偏差、?
假數(shù)據(jù)等等。Open
Refine?
工具的價(jià)值在于幫助我們節(jié)約了時(shí)間和勞動(dòng)力成本,將不可能的任務(wù)變得可能。?
Open
Refine的官方下載網(wǎng)址是:/。?
最常用的數(shù)據(jù)清洗功能有二:①
其一是針對(duì)數(shù)據(jù)內(nèi)部不統(tǒng)一的情況,對(duì)不同類型的數(shù)據(jù)加以發(fā)現(xiàn),進(jìn)而將數(shù)據(jù)統(tǒng)一起來(lái)。②
其二是通過(guò)過(guò)濾數(shù)據(jù)行、區(qū)分多值單元、轉(zhuǎn)換數(shù)據(jù)值等方式,修復(fù)錯(cuò)誤數(shù)據(jù)。(一)對(duì)內(nèi)部數(shù)據(jù)進(jìn)行統(tǒng)一?
假設(shè)我們?cè)谝粍t關(guān)于環(huán)境問(wèn)題的新聞項(xiàng)目中需要使用關(guān)于廣州垃圾中轉(zhuǎn)站的信息。可以從廣州市政府?dāng)?shù)據(jù)統(tǒng)一開放平臺(tái)(/)下載數(shù)據(jù)集“廣州市垃圾中轉(zhuǎn)站一覽表”,并導(dǎo)入到Open
Refine中。(二)將文本數(shù)據(jù)轉(zhuǎn)換為表格?
Open
Refine工具在數(shù)據(jù)格式處理上也是個(gè)好用的工具,比如可以將以list形式呈現(xiàn)的純文本內(nèi)容,轉(zhuǎn)化為表格,并儲(chǔ)存下來(lái)。尤其是當(dāng)文本內(nèi)容來(lái)自網(wǎng)絡(luò)數(shù)據(jù),出現(xiàn)一些冗余的符號(hào)格式的時(shí)候。使用Open
Refine導(dǎo)入和處理“最佳女演員”film_actres.txt文檔如
何
使
用
圖
表/_v3/whos_your_city//singles/Eg.2
Ticket
Trends這幅圖上能看到什么趨勢(shì)呢?修改后:Eg.3這幅圖上能看到什么趨勢(shì)呢?修改后:練習(xí):使用數(shù)據(jù)集“作圖”1.
在案件統(tǒng)計(jì)中,每個(gè)地區(qū)所擁有的州的個(gè)數(shù),占總體的比例是多少?2.
在Guelleh地區(qū),各州兇殺案占該地區(qū)總體兇殺案的比例是多少?其他類型的犯罪呢?3.
在Abela地區(qū)的情況是怎樣的呢?4.
比較Guelleh地區(qū)各類型犯罪情況。5.
比較Guelleh和Abela地區(qū)兇殺案的犯罪情況。圖表類型柱狀圖VERTICAL
(COLUMNCHART)Bestusedforchronologicaldata(time-seriesshouldalwaysrunlefttoright),orwhenvisualizingnegativevaluesbelowthex-axis.HORIZONTALBest
used
for
datawith
longcategory
labels.STACKEDBestusedwhenthereisa
needtocomparemultiplepart-to-wholerelationships.
Thesecanusediscreteorcontinuousdata,orientedeitherverticallyorhorizontally.100%STACKEDBestusedwhenthetotalvalueofeachcategoryisunimportantandpercentagedistributionofsubcategoriesistheprimarymessage.100%STACKEDBestusedwhenthetotalvalueofeachcategoryisunimportantandpercentagedistributionofsubcategoriesistheprimarymessage.1.USEHORIZONTAL
LABELSAvoidsteepdiagonalorverticaltype,asitcanbedifficulttoread.2.SPACE
BARS
APPROPRIATELYSpacebetweenbarsshouldbe1?2barwidth.3.START
THE
Y-AXIS
VALUE
AT
0Startingatavalueabovezerotruncatesthebarsanddoesn’taccuratelyreflectthefullvalue.4.USECONSISTENT
COLORSUseonecolorforbarcharts.
Yo
umayuseanaccentcolortohighlightasignificantdatapoint.5.ORDERDATA
APPROPRIATELYOrdercategoriesalphabetically,
sequentially,
orbyvalue.餅圖Pie
charts
are
best
used
for
making
part-to-wholecomparisons
with
discrete
or
continuous
data.
They
aremostimpactfulwithasmalldataset.1.VISUALIZENOMORE
THAN5CATEGORIES
PERCHARTIt
is
difficult
to
differentiate
betweensmall
values;
depicting
toomanyslicesdecreasestheimpactofthevisualization.Ifneeded,youcangroupsmallervalues
intoan“other”
or
“miscellaneous”category,
but
make
sureitdoesnothideinterestingorsignificantinformation.2
.
D
O
N
’
T
U
S
E
M
U
LT
I
P
L
E
P
I
E
C
H
A
R
T
S
F
O
RCOMPARISONSlice
sizes
are
very
difficult
to
compare
side-by-side.
Use
astackedbarchartinstead.3.MAKESURE
ALL
DATA
ADDSUP
TO
100%Verify
thatvaluestotal100%andthatpieslicesaresizedproportionatetotheircorrespondingvalue.線狀圖1.INCLUDE
A
ZEROBASELINEIFPOSSIBLE2.DON’T
PLOT
MORE
THAN4LINESIfyouneedtodisplaymore,breakthemoutintoseparatechartsforbettercomparison.3.USESOLIDLINESONLYDashedanddottedlinescanbedistracting.4.LABEL
THELINESDIRECTLYThis
lets
readers
quickly
identify
lines
andcorresponding
labels
instead
of
referencing
alegend.5.USE
THERIGHT
HEIGHTPlotalldatapointssothatthelinecharttakes
up
approximately
two-thirds
of
they-axis’totalscale.面積圖1.MAKEIT
EASY
TO
READInstackedareacharts,arrangedatatopositioncategorieswithhighlyvariabledataonthetopofthechartandlowvariabilityonthebottom.2.START
Y-AXIS
VALUE
AT
0Startingtheaxisabovezerotruncatesthevisualizationofvalues.3.DON’T
DISPLAY
MORE
THAN4D
ATACATEGORIESTo
omanywillresultinaclutteredvisualthatisdifficulttodecipher.4.USE
TRANSPARENT
COLORSInstandardareacharts,ensuredataisn’tobscuredinthebackgroundbyorderingthoughtfullyandusingtransparency.5.DON’T
USE
AREA
CHARTS
TO
DISPLAYDISCRETED
ATATheconnectedlinesimplyintermediatevalues,whichonlyexistwithcontinuousdata.散點(diǎn)圖Scatterplotsshowtherelationshipbetweenitemsbasedontwosetsofvariables.
Theyarebestusedtoshowcorrelationinalargeamountofdata.1.START
Y-AXIS
VALUE
AT
0Startingtheaxisabovezerotruncatesthevisualizationofvalues.2.INCLUDEMOREVARIABLESUsesizeanddotcolortoencodeadditionaldatavariables.3.USE
TRENDLINESThesehelpdrawcorrelationbetweenthevariablestoshowtrends.4.DON’T
COMPARE
MORE
THAN2
TRENDLINESTo
omanylinesmakedatadifficulttointerpret.氣泡圖1.MAKESURELABELS
AREVISIBLEAlllabelsshouldbeunobstructedandeasilyidentifiedwiththecorrespondingbubble.2.SIZEBUBBLES
APPROPRIATELYBubblesshouldbescaledaccordingtoarea,notdiameter.3.DON’T
USEODDSHAPESAvoidaddingtoomuchdetailorusingshapesthatarenotentirelycircular;thiscanleadtoinaccuracies.熱度圖1.USE
A
SIMPLEMAP
OUTLINETheselinesaremeanttoframethedata,notdistract.2.SELECT
COLORS
APPROPRIATELYSomecolorsstandoutmorethanothers,givingunnecessaryweighttothatdata.Instead,useasinglecolorwithvaryingshadeoraspectrumbetweentwoanalogouscolorstoshowintensity.
Alsoremembertointuitivelycodecolorintensityaccordingtovalues.3.USEPATTERNS
SPARINGLYA
patternoverlaythatindicatesasecondvariableisacceptable,butusingmultipleisoverwhelminganddistracting.4.CHOOSE
APPROPRIATE
D
ATA
RANGESSelect3-5numericalrangesthatenablefairlyevendistributionofdatabetweenthem.Use+/-signstoextendhighandlowranges比較■■■■■■■■■■■趨勢(shì)■組成占比分布排名關(guān)系空間折線圖階梯圖■面積圖(堆疊、百分比)■■■■■柱狀圖(分組、堆疊、百分比、區(qū)間、3D)■■■■■■瀑布圖■條形圖(分組、堆疊、百分比、區(qū)間)■■■餅圖(環(huán)圖、玫瑰圖)散點(diǎn)圖(散點(diǎn)、氣泡)■■漏斗圖(漏斗圖、對(duì)比漏斗圖)■■雷達(dá)圖地圖(符號(hào)、面積、等值線、3D)■■■?;鶊D水波圖子彈圖■熱力圖(熱力、密度熱力、蜂窩熱力)■■直方圖弧形圖■布局關(guān)系圖(力導(dǎo)向、環(huán)形、螺旋、同心圓、輻射)■■流向圖(?;飨颉⒘鞒虉D)信息圖設(shè)計(jì)目錄Contents?
什么是信息圖?
如何制作信息圖?
如何做出有設(shè)計(jì)感的信息圖Infographics什么是信息圖?復(fù)活節(jié)情人節(jié)寒假前兩周愚人節(jié)周一暑假圣誕節(jié)簡(jiǎn)單來(lái)說(shuō),信息圖就是信息的視覺(jué)表達(dá)。知識(shí)+圖形=值得分享的故事。方式數(shù)據(jù)描繪聰明的
引人注目的
及時(shí)的切題的成組的篩選過(guò)的原始數(shù)據(jù)高數(shù)據(jù)可視化信息圖低復(fù)雜程度通用性中中高低獲得難度立場(chǎng)低中高客觀客觀主觀普羅大眾適用人群專業(yè)數(shù)據(jù)分析員
相關(guān)從業(yè)人員如何制作信息圖?構(gòu)思
篩選
研究
同步
初稿
校訂
推廣構(gòu)思好的開始是成功的一半。社交網(wǎng)絡(luò)時(shí)事新聞化繁為簡(jiǎn)制作教程頭腦風(fēng)暴?
追氣球的熊孩子?
QQ音樂(lè)簽約YG?
香港占中?
APEC會(huì)議?
奇怪的日本?
咖啡與茶哪個(gè)更好?
如何做花式咖啡?
5步打造精品書房?
白領(lǐng)的一天?
聽音樂(lè)的習(xí)慣篩選找出真正有價(jià)值的想法。a
b
c這個(gè)想法是否會(huì)在發(fā)布的網(wǎng)站上引起眾人評(píng)論?這個(gè)想法是否容易理解?這個(gè)想法是否找到了一個(gè)新的角度去闡述話題?d
e
f這個(gè)想法是否有可靠的信息來(lái)源支撐?你自己是否對(duì)這個(gè)想法感興趣?你是否可以用一兩句話來(lái)講清楚這個(gè)想法?PlanB別忘了你永遠(yuǎn)需要一個(gè)備選方案,甚至是兩個(gè)、三個(gè)。研究找到有趣且可靠的數(shù)據(jù)。14通過(guò)政府機(jī)關(guān)、教育機(jī)構(gòu)的網(wǎng)站2投放問(wèn)卷可靠的數(shù)據(jù)網(wǎng)站(例如羅盤、友盟)3其他網(wǎng)絡(luò)資源梳理發(fā)現(xiàn),篩選出有助于支撐你觀點(diǎn)的資源找出值得視覺(jué)化的部分,并把相似的點(diǎn)編組給不同的組主題,撰寫連接性的描述用標(biāo)題、副標(biāo)題及其他指標(biāo)來(lái)組織信息,讓結(jié)構(gòu)清晰化Titlexxxxxxxxxxxxxxxxxxxxxxxxxxxx同步確定視覺(jué)風(fēng)格與可視化形式。基調(diào)形式規(guī)范不同的內(nèi)容需要不同的主題配色長(zhǎng)度與面積可視化顏色可視化圖形可視化地域與空間可視化概念可視化進(jìn)攻技術(shù)防守力量速度梅西
C羅柱狀圖和條形圖餅圖和環(huán)形圖雷達(dá)圖4.34.54進(jìn)攻3.93.53.53白領(lǐng)20%2.7技術(shù)防守2.52藍(lán)領(lǐng)9%學(xué)生64%1.51其他7%0.50力量速度足球
籃球
排球
跳繩最基本的圖表,多選題的不二之選選項(xiàng)加總為100%時(shí)可用,更好的闡述占比要描述同一個(gè)對(duì)象的不同屬性時(shí)選用柱狀圖和條形圖4.34.34.544.5454.543.93.93.53.53.533.532.72.72.522.523.531.511.510.500.502.5足球
籃球
排球
跳繩一月
二月
三月
四月足球
籃球
排球
跳繩?
按照數(shù)值順序排列?
從0刻度開始?
如果選項(xiàng)有特殊順序則不按數(shù)值排序?
沒(méi)有從0刻度開始?
沒(méi)有標(biāo)記數(shù)值?
坐標(biāo)軸可隱藏餅圖和環(huán)形圖7%白領(lǐng)20%白領(lǐng)20%9%學(xué)生白領(lǐng)藍(lán)領(lǐng)其他藍(lán)領(lǐng)9%學(xué)生64%學(xué)生64%64%20%藍(lán)領(lǐng)9%其他7%其他7%?
從0度角順時(shí)針?lè)抛畲笾?,逆時(shí)針從次大值降序排列?
把類別名直接標(biāo)注在圖形內(nèi)?
環(huán)形圖可以把需要突出的重點(diǎn)放中間?
沒(méi)有把類別名直接標(biāo)在圖內(nèi)?
最小值集中在0度角附近,會(huì)吸引注意雷達(dá)圖進(jìn)攻進(jìn)攻進(jìn)攻技術(shù)防守技術(shù)防守技術(shù)防守力量速度力量速度力量速度梅西
C羅梅西
C羅梅西
C羅
內(nèi)馬爾
阿扎爾?
雷達(dá)圖的面積大小是有意義的?
要突出單個(gè)項(xiàng)目對(duì)比時(shí)用線稿?
在一張圖里展現(xiàn)超過(guò)3數(shù)據(jù)?
坐標(biāo)軸可隱藏以下圖表分別是什么形式的可視化?初稿檢查以下4點(diǎn)。a
b內(nèi)容完整度所有需要表達(dá)內(nèi)容都已經(jīng)視覺(jué)化理解難度是否容易理解圖上的內(nèi)容c
d說(shuō)服力觀點(diǎn)是否容易被接受排版是否容易消化,故事的連貫性如何校訂多次檢查與潤(rùn)色。社論概念視覺(jué)細(xì)節(jié)如何做出有設(shè)計(jì)感的信息圖?
字體Fonts?
用色ColorScheme?
配圖Visual
Aids?
排版Layouts?
細(xì)節(jié)Details?
統(tǒng)一Consistency字體Fonts字體的使用是最基本、最重要,同時(shí)也是最容易出錯(cuò)的。三個(gè)基本原則:宋?
不使用超過(guò)3種字體(包括大?。?
中英文字體的相關(guān)性?
盡量不要用帶襯線的字體這些就叫做襯線宋這些就叫做襯線字體Fonts推薦的字體中文:方正蘭亭黑簡(jiǎn)體英文:Helvetica字體Fonts字體Fonts132456字體大小過(guò)多的例子,包括粗體在內(nèi),一共用了6個(gè)不同尺寸的字號(hào)用色ColorScheme三原色:紅綠藍(lán)/紅黃藍(lán)色相、明度、純度用色ColorScheme底色:用來(lái)配黑色文字
用來(lái)配白色文字用色ColorScheme配色工具,如果想要自己調(diào)顏色的話,可以使用Adobe的在線工具AdobeColorCC,曾經(jīng)叫AdobeKuler配圖Visual
Aids配圖是指視覺(jué)輔助,包括圖表、圖片以及視頻。配圖Visual
Aids使用圖片要注意版權(quán),尤其是博客文章,以下是一些獲得免費(fèi)圖片的好去處。www.sxc.hu配圖Visual
Aids大圖疊底時(shí),給文字加個(gè)半透明色塊底。配圖Visual
Aids在圖上的文字,有些是完全看不清的,這時(shí)候只需要疊一個(gè)半透明色塊就可以輕松解決排版Layouts排版其實(shí)是讓同學(xué)們最頭疼的事情了,因?yàn)槲覀冃枰故镜膬?nèi)容真的是太多了。關(guān)于排版,只要做到一件事情就不會(huì)太亂,那就是,對(duì)齊。排版Layouts對(duì)齊錯(cuò)誤的例子,只看垂直方向就發(fā)現(xiàn)至少有9條基準(zhǔn)線了-.-細(xì)節(jié)Details?
記得在每一頁(yè)加上頁(yè)碼?
注意大小寫,注意標(biāo)點(diǎn)符號(hào)的全角和半角?
拉伸縮小圖片的時(shí)候注意長(zhǎng)寬比(如果需要改變比例請(qǐng)用裁剪)WRONGRIGHT細(xì)節(jié)Details標(biāo)點(diǎn)符號(hào)錯(cuò)誤,使用了英文半角的逗號(hào)細(xì)節(jié)Details拉升錯(cuò)誤的例子,整個(gè)LOGO都被拉長(zhǎng)了統(tǒng)一Consistency最后一點(diǎn)卻也是最重要的一點(diǎn),無(wú)論何時(shí),都需要保持整個(gè)信息圖的統(tǒng)一性。統(tǒng)一Consistency都是主標(biāo)題加副標(biāo)題的形式,格式卻發(fā)生了變化,在一個(gè)信息圖中不統(tǒng)一統(tǒng)一Consistency這三塊的內(nèi)容其實(shí)是同一層級(jí)的內(nèi)容,卻用了不同的排布方式總結(jié)Conclusion因?yàn)槿祟愐淮沃荒苡涀∪虑椋?
選擇合適的字體和顏色?
注意對(duì)齊?
統(tǒng)一做設(shè)計(jì)非常好用的網(wǎng)站?
?
/?
/?
/?
/黃金比例黃金比例為1:1.618。這是一個(gè)數(shù)學(xué)方程式,它也在設(shè)計(jì)實(shí)踐中找到了自己的方法。黃金比例已被科學(xué)證明是美麗的,理解黃金比例重要性的最好例子可以追溯到最著名的畫作之一:《蒙娜麗莎》,這幅畫就使用了黃金比例。黃金比例的其他名稱還有黃金分割、中庸之道或德語(yǔ)字母“phi”。黃金分割不同于其他設(shè)計(jì)實(shí)踐的地方在于,設(shè)計(jì)通常是由本能和創(chuàng)造力主導(dǎo)的。而黃金比例有不同的方法,它使用數(shù)學(xué)方法來(lái)轉(zhuǎn)換您的圖像,布局,排版和更多的設(shè)計(jì)實(shí)踐?!毒S特魯威人》cb:a=c:b≈0.618ba均衡原理??硕蒖T=a+blog2(n)RT=反應(yīng)時(shí)間,a=跟做決定無(wú)關(guān)的總時(shí)間,b=根據(jù)對(duì)選項(xiàng)認(rèn)知的處理時(shí)間實(shí)證衍生出的常數(shù)(b≈0.155秒--相對(duì)人而言),n=可供選擇的選項(xiàng)數(shù)社會(huì)網(wǎng)絡(luò)數(shù)據(jù)可視化實(shí)踐-Gephi入門I.
社會(huì)網(wǎng)絡(luò)圖在數(shù)據(jù)新聞中的運(yùn)用/2014/zhoushicailu/20212社會(huì)網(wǎng)絡(luò)運(yùn)用案例2021-12-303社會(huì)網(wǎng)絡(luò)運(yùn)用案例DJA2019獲獎(jiǎng)作品《司機(jī)觀察筆記》阿根廷民族報(bào)數(shù)據(jù)團(tuán)隊(duì)2021-12-304社會(huì)網(wǎng)絡(luò)運(yùn)用案例DJA2019獲獎(jiǎng)作品《印度尼西亞墜機(jī)事故》路透社美國(guó)分社(QGIS)2021-12-3052021DJA:贈(zèng)地大學(xué)6一個(gè)真實(shí)的故事《午夜騎士保羅·里維爾》《引爆點(diǎn):為何小事件會(huì)產(chǎn)生巨大德影響》2021-12-307II.
網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)2021-12-308網(wǎng)絡(luò)模型通??煞譃橐韵氯悾阂?guī)則網(wǎng)絡(luò)模型、隨機(jī)網(wǎng)絡(luò)模型、復(fù)雜網(wǎng)絡(luò)模型規(guī)則網(wǎng)絡(luò)模型(a)全連接網(wǎng)絡(luò)(b)星形網(wǎng)絡(luò)(c)k-近鄰網(wǎng)絡(luò)(k=4)隨機(jī)網(wǎng)絡(luò)模型復(fù)雜網(wǎng)絡(luò)模型(d)ER隨機(jī)網(wǎng)絡(luò)(e)
WS小世界網(wǎng)絡(luò)(f)BA無(wú)標(biāo)度網(wǎng)絡(luò)2021-12-3099III.
社會(huì)網(wǎng)絡(luò)的分析指標(biāo)平
均
最
短
路
徑
和
網(wǎng)
絡(luò)直
徑節(jié)
點(diǎn)
度
分
布聚
類
系
數(shù)0102030405網(wǎng)
絡(luò)
密
度節(jié)
點(diǎn)
中
心
性2021-12-3010社會(huì)網(wǎng)絡(luò)的分析指標(biāo)-1?
節(jié)點(diǎn)的度是指與節(jié)點(diǎn)直接相連的邊的數(shù)量。?
網(wǎng)絡(luò)的平均度指所有節(jié)點(diǎn)總度的平均值。?
有向圖中,出度和入度的和為該節(jié)點(diǎn)的總度,出度指該節(jié)點(diǎn)為起始節(jié)點(diǎn)的邊的數(shù)量,入度指以該節(jié)點(diǎn)為終止節(jié)點(diǎn)的邊的數(shù)量。節(jié)
點(diǎn)
度
分
布01?
度分布描述不同度值的節(jié)點(diǎn)占網(wǎng)絡(luò)所有節(jié)點(diǎn)數(shù)的比例。度分布示例圖2021-12-3011#
指數(shù)分布vs.
冪率分布兩者的不同可以用一句話概括,冪律比指數(shù)下降的更快。12社會(huì)網(wǎng)絡(luò)的分析指標(biāo)-2
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023二年級(jí)數(shù)學(xué)上冊(cè) 六 測(cè)量第2課時(shí) 課桌有多長(zhǎng)說(shuō)課稿 北師大版
- 《1 負(fù)數(shù) 》(說(shuō)課稿)-2023-2024學(xué)年六年級(jí)下冊(cè)數(shù)學(xué)人教版
- 2024秋四年級(jí)語(yǔ)文上冊(cè) 第六單元 第19課 一只窩囊的大老虎說(shuō)課稿 新人教版001
- 代銷材料合同范例
- 路塹紫穗槐種植施工方案
- 5《守株待兔》說(shuō)課稿-2024-2025學(xué)年語(yǔ)文三年級(jí)下冊(cè)統(tǒng)編版
- 慶城硅pu跑道施工方案
- 5《一個(gè)豆莢里的五粒豆》說(shuō)課稿-2024-2025學(xué)年四年級(jí)上冊(cè)語(yǔ)文統(tǒng)編版
- 京東店鋪運(yùn)營(yíng)合同范例
- 住宅劃地出售合同范本
- 廣西南寧市2024-2025學(xué)年八年級(jí)上學(xué)期期末義務(wù)教育質(zhì)量檢測(cè)綜合道德與法治試卷(含答案)
- 梅大高速塌方災(zāi)害調(diào)查評(píng)估報(bào)告及安全警示學(xué)習(xí)教育
- 2025年供應(yīng)鏈管理培訓(xùn)課件
- 2025中智集團(tuán)招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- 幼兒園2025年春季學(xué)期保教工作計(jì)劃
- 《保利公司簡(jiǎn)介》課件
- 中藥硬膏熱貼敷治療
- 《攜程旅行營(yíng)銷環(huán)境及營(yíng)銷策略研究》10000字(論文)
- 2024年高頻脈沖電源項(xiàng)目可行性研究報(bào)告
- 餐飲行業(yè)優(yōu)化食品供應(yīng)鏈管理計(jì)劃
- cnc加工崗前培訓(xùn)
評(píng)論
0/150
提交評(píng)論