版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、5.1 走近數(shù)據(jù)分析5.1 走近數(shù)據(jù)分析難點(diǎn)2.體驗(yàn)對(duì)比分析和平均分析的一般分析過(guò)程。1.了解數(shù)據(jù)分析的幾種常用方法。3.了解大數(shù)據(jù)的含義,認(rèn)識(shí)大數(shù)據(jù)分析在信息社會(huì)的重要作用。 會(huì)使用數(shù)據(jù)分析的幾種常用方法分析數(shù)據(jù)。大數(shù)據(jù)的含義及大數(shù)據(jù)分析在信息社會(huì)的重要作用。 重 點(diǎn)學(xué) 習(xí) 目 標(biāo)難點(diǎn)2.體驗(yàn)對(duì)比分析和平均分析的一般分析過(guò)程。1.了解數(shù)據(jù)分5.1 走近數(shù)據(jù)分析(第一課時(shí))5.1 走近數(shù)據(jù)分析(第一課時(shí))繁忙的交通繁忙的交通公共自行車公共自行車案例一某同學(xué)每天早上7:00乘坐27路車去學(xué)校,17:00左右回家,他覺得每天往返途中,公交車上并不擁擠。而媽媽每天8:00乘坐49路車出發(fā),18:00
2、下班,她總是抱怨乘車者太多,請(qǐng)嘗試進(jìn)行數(shù)據(jù)分析。課堂導(dǎo)入案例一某同學(xué)每天早上7:00乘坐27路車去學(xué)校,17:00左 學(xué)生可以提出多種假設(shè),例如:(1)假設(shè)27路公交車7:00平均客流量小于49路公交車8:00平 均客流量、27路公交車17:00平均客流量小于49路公交車18:00平均客流量;(2)27路公交車平均客流量小于49路公交車;(3)27路公交車在上下班高峰期平均客流量小于49路公交車。案例一 學(xué)生可以提出多種假設(shè),例如:案例一1、數(shù)據(jù)分析數(shù)據(jù)分析是指用恰當(dāng)?shù)慕y(tǒng)計(jì)分析方法對(duì)收集來(lái)的大量數(shù)據(jù)進(jìn)行分析,提取有用信息,并形成結(jié)論的過(guò)程 數(shù)據(jù)分析的一般過(guò)程為根據(jù)分析的目標(biāo)提出假設(shè),然后收集有
3、關(guān)數(shù)據(jù),選用恰當(dāng)?shù)姆治龇椒ㄟM(jìn)行分析,驗(yàn)證假設(shè)是否正確,繼而得出相應(yīng)的結(jié)論。數(shù)據(jù)分析的基本方法有對(duì)比分析和平均分析。1、數(shù)據(jù)分析數(shù)據(jù)分析是指用恰當(dāng)?shù)慕y(tǒng)計(jì)分析方法對(duì)收集來(lái)的大量數(shù) 數(shù)據(jù)分析是指用恰當(dāng)?shù)慕y(tǒng)計(jì)分析方法對(duì)收集來(lái)的大量數(shù)據(jù)進(jìn)行分析,提取有用信息,并形成結(jié)論的過(guò)程。數(shù)據(jù)分析提出假設(shè)收集數(shù)據(jù)驗(yàn)證假設(shè)得出結(jié)論選用恰當(dāng)?shù)臄?shù)據(jù)分析方法進(jìn)行分析 數(shù)據(jù)分析是指用恰當(dāng)?shù)慕y(tǒng)計(jì)分析方法對(duì)收集來(lái)的大量數(shù)據(jù)進(jìn)2、對(duì)比分析對(duì)比分析是指將兩個(gè)或兩個(gè)以上的數(shù)據(jù)進(jìn)行比較,分析它們的差異,從而揭示這些數(shù)據(jù)所代表的事物發(fā)展變化情況和規(guī)律。對(duì)比分為橫向?qū)Ρ群涂v向?qū)Ρ取M向?qū)Ρ戎傅氖穷愃频氖挛锘蛘咄惖氖挛镏g進(jìn)行比較;縱向?qū)Ρ?/p>
4、指的是和相同事物的不同時(shí)期進(jìn)行比較。2、對(duì)比分析對(duì)比分析是指將兩個(gè)或兩個(gè)以上的數(shù)據(jù)進(jìn)行比較,分析3、平均分析平均分析就是運(yùn)用計(jì)算平均值的方法,來(lái)反映總體在一定時(shí)間、地點(diǎn)條件下某一數(shù)量特征的一般水平。平均分析和對(duì)比分析常結(jié)合使用。3、平均分析平均分析就是運(yùn)用計(jì)算平均值的方法,來(lái)反映總體在一數(shù)據(jù)分析過(guò)程:步驟一:依據(jù)活動(dòng)1要求,提出假設(shè): 步驟二:27路和49路公交線路的月平均分時(shí)段客流量如下表所示,表中“6”表示6:007:00,其他以此類推。請(qǐng)分析表中數(shù)據(jù)。數(shù)據(jù)分析過(guò)程:步驟一:依據(jù)活動(dòng)1要求,提出假設(shè): 參考答案:學(xué)生的假設(shè):(有多種)(1)假設(shè)27路公交車7:00平均客流量小于49路公交車
5、8:00平均客流量、27路公交車17:00平均客流量小于49路公交車18:00平均客流量;(2)27路公交車平均客流量小于49路公交車;(3)27路公交車在上下班高峰期平均客流量小于49路公交車。由于假設(shè)不同,結(jié)論也可能不同。例如:(1)27路公交車7:00平均客流量130人次小于49路公交車8:00平均客流量211人次、27路公交車17:00平均客流量120人次小于49路公交車18:00平均客流量123人次。假設(shè)成立。(2)27路公交車在6:00-19:00平均客流量小于49路公交車,因此假設(shè)不完全準(zhǔn)確。如何界定上下班高峰期,假設(shè)中必須加以說(shuō)明,然后才能得出相應(yīng)結(jié)論。你的結(jié)論是:參考答案:你
6、的結(jié)論是:4、數(shù)據(jù)可視化表達(dá)數(shù)據(jù)可視化表達(dá)是以圖形、圖像和動(dòng)畫等方式更加直觀生動(dòng)地呈現(xiàn)數(shù)據(jù)及數(shù)據(jù)分析結(jié)果,揭示數(shù)據(jù)之間的關(guān)系、趨勢(shì)和規(guī)律等的表達(dá)方式。圖表是最常用的數(shù)據(jù)可視化表達(dá)方式之一?;镜膱D表類型有:柱形圖、餅圖和折線圖,利用一般的表格加工軟件即可繪制。4、數(shù)據(jù)可視化表達(dá)數(shù)據(jù)可視化表達(dá)是以圖形、圖像和動(dòng)畫等方式更基本的圖表類型有:柱形圖、餅圖和折線圖,利用一般的表格加工軟件即可繪制。三種圖形化表示的特點(diǎn)及表示如下:基本的圖表類型有:柱形圖、餅圖和折線圖,利用一般的表格加工軟制作圖表,分析兩條公交線路的高峰期出現(xiàn)時(shí)間和特點(diǎn)(學(xué)生可分組討論)圖表的制作過(guò)程:選定表格的數(shù)據(jù)區(qū)域插入圖表應(yīng)用“圖
7、表向?qū)А惫ぞ邎D表如下:結(jié)論:兩條線路的高峰期基本相同,分別在8:00-9:00和17:00-19:00。早高峰27路公交車平均客流量小于49路公交車;晚高峰兩路公交車人次大致相當(dāng)。制作圖表,分析兩條公交線路的高峰期出現(xiàn)時(shí)間和特點(diǎn)(學(xué)生可分組 柱形圖。主要用于數(shù)據(jù)間大小關(guān)系的比較。數(shù)據(jù)可視化表達(dá)此圖反映了27路車在不同時(shí)間點(diǎn)客流量 柱形圖。主要用于數(shù)據(jù)間大小關(guān)系的比較。數(shù)據(jù)可視化表達(dá) 折線圖,主要用于反映事物的發(fā)展變化趨勢(shì)。數(shù)據(jù)可視化表達(dá)此圖反映了27、49路車在不同時(shí)間點(diǎn)客流量的對(duì)比情況 折線圖,主要用于反映事物的發(fā)展變化趨勢(shì)。數(shù)據(jù)可視化表達(dá) 餅圖,主要用于反映事物的比例關(guān)系。數(shù)據(jù)可視化表達(dá)此
8、圖反映了27、49路車在6點(diǎn)客流量的對(duì)比情況 餅圖,主要用于反映事物的比例關(guān)系。數(shù)據(jù)可視化表達(dá)此圖反數(shù)據(jù)可視化表達(dá)手機(jī)健康數(shù)據(jù)數(shù)據(jù)可視化表達(dá)數(shù)據(jù)可視化表達(dá)手機(jī)健康數(shù)據(jù)數(shù)據(jù)可視化表達(dá)5、數(shù)據(jù)分析報(bào)告數(shù)據(jù)分析報(bào)告是項(xiàng)目研究結(jié)果的展示,也是數(shù)據(jù)分析結(jié)論的有效承載形式。通過(guò)報(bào)告不僅是把數(shù)據(jù)分析的起因、過(guò)程、結(jié)果及建議完整的展現(xiàn)出來(lái),更為決策者提供科學(xué)、嚴(yán)謹(jǐn)?shù)臎Q策依據(jù)。在數(shù)據(jù)分析報(bào)告中,首先需要明確數(shù)據(jù)分析的目的和背景,闡述目前存在的問題及通過(guò)分析希望解決的問題;其次需要描述數(shù)據(jù)來(lái)源和數(shù)據(jù)分析的思路、方法和模型;最后需要重點(diǎn)呈現(xiàn)數(shù)據(jù)分析的過(guò)程、結(jié)論和建議。學(xué)生以小組為單位上交一份調(diào)查報(bào)告。附:分析報(bào)告范
9、例5、數(shù)據(jù)分析報(bào)告數(shù)據(jù)分析報(bào)告是項(xiàng)目研究結(jié)果的展示,也是數(shù)據(jù)分信息時(shí)代的社會(huì)生活中,每天都會(huì)產(chǎn)生大量的數(shù)據(jù),這些數(shù)據(jù)也在改變著我們的生活。信息時(shí)代的社會(huì)生活中,每天都會(huì)產(chǎn)生大量的數(shù)據(jù),這些數(shù)據(jù)也在改課外作業(yè):氣溫與出行活動(dòng):氣溫和公交客流量的相關(guān)性活動(dòng)描述:某同學(xué)感覺天氣越冷,乘公交車的人越少。該同學(xué)選取了所乘公交線路連續(xù)8周周二的7:00-8:00時(shí)段的公交客流量和平均氣溫?cái)?shù)據(jù),見下表。請(qǐng)幫他進(jìn)行分析,探討氣溫和公交客流量是不是有一定的關(guān)聯(lián)?周次氣溫()客流量(人次)12020322119931819241619151518661817471114288157氣溫和客流量數(shù)據(jù)表課外作業(yè):氣溫
10、與出行活動(dòng):氣溫和公交客流量的相關(guān)性周次氣溫(首先需要根據(jù)研究問題,初步確定自變量和因變量參考答案:然后繪制散點(diǎn)圖,初步判斷自變量和因變量是否存在線性相關(guān)關(guān)系,建立回歸模型,并進(jìn)行檢驗(yàn)最終確定回歸模型進(jìn)行預(yù)測(cè)。首先需要根據(jù)研究問題,初步確定自變量和因變量參考答案:然后繪圖氣溫-客流量散點(diǎn)圖在散點(diǎn)圖中,氣溫是自變量,客流量是因變量,觀察這些點(diǎn)的分布規(guī)律,仿佛圍繞著一條直線上下波動(dòng),這條直線被稱為趨勢(shì)線。趨勢(shì)線可以用回歸方程y=ax+b描述。趨勢(shì)方程的擬合程度常用判定系數(shù)來(lái)判斷。判定系數(shù)R2取值范圍是0,1。R2越接近于1,表明自變量和因變量之間相關(guān)性越強(qiáng);R2越接近于0,表明兩者之間幾乎沒有線性
11、相關(guān)關(guān)系。圖氣溫-客流量散點(diǎn)圖在散點(diǎn)圖中,氣溫是自變量,客流量是因變量5.1 走近數(shù)據(jù)分析(第二課時(shí))5.1 走近數(shù)據(jù)分析(第二課時(shí))大 數(shù) 據(jù) 大數(shù)據(jù):是以容量大、類型多、存取速度快、應(yīng)用價(jià)值高為主要特征的數(shù)據(jù)集合,它正快速發(fā)展為對(duì)數(shù)量巨大、來(lái)源分散、格式多樣的數(shù)據(jù)進(jìn)行采集、存儲(chǔ)和關(guān)聯(lián)分析,從中發(fā)現(xiàn)新知識(shí),創(chuàng)造新價(jià)值、提升新能力的新一代信息技術(shù)和服務(wù)業(yè)態(tài)。大 數(shù) 據(jù) 大數(shù)據(jù):是以容量大、類型多、存取速度快大數(shù)據(jù)的意義 意義:我們有可能從如此龐大的數(shù)據(jù)中挖掘出有價(jià)值的數(shù)據(jù),并運(yùn)用于管理、農(nóng)業(yè)、金融、醫(yī)療和教育等各個(gè)社會(huì)領(lǐng)域,為社會(huì)發(fā)展服務(wù)。大 數(shù) 據(jù)大數(shù)據(jù)的意義 意義:我們有可能從如此龐大的數(shù)
12、據(jù)中挖掘出大數(shù)據(jù)分析的應(yīng)用活動(dòng) 公交車距離我多遠(yuǎn)體驗(yàn)一款實(shí)時(shí)公交軟件,輸入起點(diǎn)和終點(diǎn),獲取所需的公交方案,并了解公交車和你之間的距離并填寫下表。(高德實(shí)時(shí)公交)實(shí) 時(shí) 公 交 信 息 查 詢 軟 件 使 用 體 驗(yàn)序號(hào)體驗(yàn)并思考問題結(jié)果1查看該軟件為用戶提供了哪些實(shí)用功能?2如果有條件,乘公交車出行時(shí)使用該軟件,并回答以下問題:1.它所提供的公交車運(yùn)行信息是否及時(shí)準(zhǔn)確?2.它是否可以提供多種出行方案?3定位公交車位置信息需要哪些技術(shù)?它們各有什么優(yōu)缺點(diǎn)?大數(shù)據(jù)分析的應(yīng)用活動(dòng) 公交車距離我多遠(yuǎn)實(shí) 時(shí) 公 交 信 實(shí)時(shí)公交信息查詢軟件使用體驗(yàn)序號(hào)體驗(yàn)并思考問題結(jié)果1查看該軟件為用戶提供了哪些實(shí)用功
13、能?路線、時(shí)間及距離查詢2如果有條件,乘公交車出行時(shí)使用該軟件,并回答以下問題:1.它所提供的公交車運(yùn)行信息是否及時(shí)準(zhǔn)確?2.它是否可以提供多種出行方案?基本準(zhǔn)確可以提供多種出行方案3定位公交車位置信息需要哪些技術(shù)?它們各有什么優(yōu)缺點(diǎn)?GPS/北斗定位技術(shù)、3G/4G通信技術(shù)、GIS地理信息系統(tǒng)技術(shù)活動(dòng) 公交車距離我多遠(yuǎn)體驗(yàn)一款實(shí)時(shí)公交軟件,輸入起點(diǎn)和終點(diǎn),獲取所需的公交方案,并了解公交車和你之間的距離并填寫下表。(高德實(shí)時(shí)公交)大數(shù)據(jù)分析的應(yīng)用實(shí)時(shí)公交信息查詢軟件使用體驗(yàn)序號(hào)體驗(yàn)并思考問題結(jié)果1查看該軟(軟件界面) (公交查詢) (線路查詢) (時(shí)間及距離查詢)總結(jié):實(shí)時(shí)公交信息查詢軟件可以
14、實(shí)時(shí)反饋公交車輛的運(yùn)行信息,提升乘客的出行效率。(軟件界面) (公交查詢) (線路查詢) (時(shí)間及距離查詢 利用掌上公交、“等車來(lái)”軟件可以查看相關(guān)公交信息。大數(shù)據(jù)分析的應(yīng)用 利用掌上公交、“等車來(lái)”軟件可以查看相關(guān)公交信息。大利用電子健康,對(duì)出行人員行蹤進(jìn)行監(jiān)測(cè)、判斷,若發(fā)生疫情,能快速鎖定相關(guān)到過(guò)疫區(qū)人員,利用疫情大數(shù)據(jù)分析的應(yīng)用利用電子健康,對(duì)出行人員行蹤進(jìn)行監(jiān)測(cè)、判斷,若發(fā)生疫情,能快 大數(shù)據(jù)分析帶來(lái)價(jià)值的同時(shí),也在隱私保護(hù)、安全問題等方面帶來(lái)了危害。因此,合理健康地使用大數(shù)據(jù),遵循“數(shù)據(jù)道德”是我們的必備品質(zhì)。 大數(shù)據(jù)分析帶來(lái)價(jià)值的同時(shí),也在隱私保護(hù)、安全問題等方大數(shù)據(jù)分析的流程 因
15、為大數(shù)據(jù)的量大到不能再使用常規(guī)的方法進(jìn)行存儲(chǔ)和處理,所以大數(shù)據(jù)分析和普通的數(shù)據(jù)分析也有所區(qū)別。大數(shù)據(jù)分析的流程 因?yàn)榇髷?shù)據(jù)的量大到不能再使用常規(guī)的方存儲(chǔ)是分布的呀!“分布式”的存儲(chǔ)為以后“分布式處理”做準(zhǔn)備,“分布”是高效處理的前提,否則大數(shù)據(jù)處理怎么這么快。處理也是分布!在分析之前對(duì)數(shù)據(jù)進(jìn)行規(guī)整化是處理階段的重要工作。一切為了提高效率!大數(shù)據(jù)分析的方法有很多,統(tǒng)計(jì)分析和數(shù)據(jù)挖掘也是大數(shù)據(jù)分析。大數(shù)據(jù)采集分布式文件存儲(chǔ)分布式數(shù)據(jù)庫(kù)存儲(chǔ)分布式處理分析大數(shù)據(jù)分析的一般流程可以表示為:存儲(chǔ)是分布的呀!“分布式”的存儲(chǔ)為以后“分布式處理”做準(zhǔn)備案例分析:根據(jù)大數(shù)據(jù)發(fā)現(xiàn)人們的出行規(guī)律 在美國(guó)舊金山舉行的KDD2016學(xué)術(shù)會(huì)議上,羅格斯大學(xué)的熊輝等學(xué)者向大家報(bào)告了他們的研究論文。論文指出,北京在2014年的前9個(gè)月就有350名扒手在地鐵交通系統(tǒng)上被抓, 490名扒手在公交車上被抓。因此,他們認(rèn)為可以通過(guò)對(duì)北京智能公交一卡通數(shù)據(jù)進(jìn)行分析研究,根據(jù)異常交通記錄分析來(lái)抓小偷。如要實(shí)現(xiàn)這個(gè)功能,要調(diào)用哪些數(shù)據(jù)呢?同學(xué)們也可以上網(wǎng)搜索相關(guān)資料,了解大數(shù)據(jù)專家是如何分析的。 案例分析:根據(jù)大數(shù)據(jù)發(fā)現(xiàn)人們的出行規(guī)律 在美國(guó)舊金山舉 案例來(lái)源于熊輝等學(xué)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2030年中國(guó)空氣凈化器市場(chǎng)營(yíng)銷策略及銷售效益預(yù)測(cè)報(bào)告
- 2024-2030年中國(guó)移動(dòng)互聯(lián)網(wǎng)行業(yè)運(yùn)營(yíng)策略及投資前景展望報(bào)告權(quán)威版
- 2024-2030年中國(guó)碳酸鋰行業(yè)發(fā)展規(guī)模及投資可行性研究報(bào)告
- 2024-2030年中國(guó)硫酸銅晶體行業(yè)發(fā)展現(xiàn)狀與前景動(dòng)態(tài)預(yù)測(cè)報(bào)告
- 2024-2030年中國(guó)眼鏡批發(fā)和零售行業(yè)運(yùn)營(yíng)模式及未來(lái)發(fā)展策略分析報(bào)告
- 2024-2030年中國(guó)相容劑行業(yè)市場(chǎng)深度調(diào)研及競(jìng)爭(zhēng)格局與投資研究報(bào)告
- 2024年度特許經(jīng)營(yíng)合同授權(quán)范圍及限制
- 2024年度建筑設(shè)計(jì)與施工合同
- 施工現(xiàn)場(chǎng)土方回填施工方案管理
- 2024年快捷全包裝修合同
- 第19課《小站》課件(共18張)(五四學(xué)制)語(yǔ)文六年級(jí)上冊(cè)
- 高中期中考試成績(jī)分析主題班會(huì)課件
- 智慧醫(yī)療人工智能的應(yīng)用
- 行業(yè)變革下的專業(yè)知識(shí)更新與迭代
- 內(nèi)蒙古自治區(qū)2021-2022學(xué)年普通高中學(xué)業(yè)水平考試(高二會(huì)考)英語(yǔ)真題
- 《草船借箭》教學(xué)案例(5篇)
- 房屋租賃運(yùn)營(yíng)服務(wù)投標(biāo)方案(技術(shù)方案)
- 第三章地圖數(shù)學(xué)基礎(chǔ)
- 人教部編版語(yǔ)文四年級(jí)上冊(cè)第四單元同步練習(xí)及答案
- 家長(zhǎng)會(huì)課件:陪伴的家長(zhǎng)會(huì)課件
- 植入式靜脈給藥裝置(輸液港)-中華護(hù)理學(xué)會(huì)團(tuán)體標(biāo)準(zhǔn)2023
評(píng)論
0/150
提交評(píng)論