大數(shù)據(jù)時(shí)代下的數(shù)據(jù)挖掘簡(jiǎn)易PPT學(xué)習(xí)教案_第1頁(yè)
大數(shù)據(jù)時(shí)代下的數(shù)據(jù)挖掘簡(jiǎn)易PPT學(xué)習(xí)教案_第2頁(yè)
大數(shù)據(jù)時(shí)代下的數(shù)據(jù)挖掘簡(jiǎn)易PPT學(xué)習(xí)教案_第3頁(yè)
大數(shù)據(jù)時(shí)代下的數(shù)據(jù)挖掘簡(jiǎn)易PPT學(xué)習(xí)教案_第4頁(yè)
大數(shù)據(jù)時(shí)代下的數(shù)據(jù)挖掘簡(jiǎn)易PPT學(xué)習(xí)教案_第5頁(yè)
已閱讀5頁(yè),還剩28頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、會(huì)計(jì)學(xué)1大數(shù)據(jù)時(shí)代下的數(shù)據(jù)挖掘簡(jiǎn)易大數(shù)據(jù)時(shí)代下的數(shù)據(jù)挖掘簡(jiǎn)易一場(chǎng)生活、工作與思維的大變革第1頁(yè)/共33頁(yè)一場(chǎng)生活、工作與思維的大變革第2頁(yè)/共33頁(yè)第3頁(yè)/共33頁(yè)FarecastBing第4頁(yè)/共33頁(yè)大數(shù)據(jù)大數(shù)據(jù)的特性的特性第5頁(yè)/共33頁(yè)大數(shù)據(jù)時(shí)代的思維變革大數(shù)據(jù)時(shí)代的商業(yè)變革大數(shù)據(jù)時(shí)代的管理變革第6頁(yè)/共33頁(yè)第7頁(yè)/共33頁(yè)“更多”不是隨機(jī)樣本,而是全體數(shù)據(jù) 當(dāng)數(shù)據(jù)處理技術(shù)已經(jīng)發(fā)生翻天覆地的變化時(shí),在大數(shù)據(jù)時(shí)代進(jìn)行抽樣分析就像在汽車時(shí)代騎馬一樣。一切都改變了,我們需要的是所有的數(shù)據(jù),“樣本總體”。讓數(shù)據(jù)“發(fā)聲”小數(shù)據(jù)時(shí)代的隨機(jī)采樣,最少的數(shù)據(jù)獲得最多的信息全數(shù)據(jù)模式,樣本總體第8頁(yè)/

2、共33頁(yè)“更雜”不是精確性,而是混雜性 執(zhí)迷于精確性是信息缺乏時(shí)代和模擬時(shí)代的產(chǎn)物。只有5%的數(shù)據(jù)是有框架且能適用于傳統(tǒng)數(shù)據(jù)庫(kù)的。如果不能接受混亂,剩下95%的非框架數(shù)據(jù)都無法被利用,只有接受不精確性,我們才能打開一扇從未涉足的世界的窗戶。允許不精確大數(shù)據(jù)的簡(jiǎn)單算法比小數(shù)據(jù)的復(fù)雜算法更有效紛繁的數(shù)據(jù)越多越好混雜性,不是竭力避免,而是標(biāo)準(zhǔn)途徑新的數(shù)據(jù)庫(kù)設(shè)計(jì)的誕生第9頁(yè)/共33頁(yè)“更好”不是因果關(guān)系,而是相關(guān)關(guān)系 知道“是什么”就夠了,沒必要知道“為什么”。在大數(shù)據(jù)時(shí)代,我們不必非得知道現(xiàn)象背后的原因,而是要讓數(shù)據(jù)自己“發(fā)聲”。關(guān)聯(lián)物,預(yù)測(cè)的關(guān)鍵“是什么”,而不是“為什么”改變,從操作方式開始大數(shù)

3、據(jù),改變?nèi)祟愄剿魇澜绲姆椒ǖ?0頁(yè)/共33頁(yè)第11頁(yè)/共33頁(yè)“數(shù)據(jù)化”一切皆可“量化” 大數(shù)據(jù)發(fā)展的核心動(dòng)力來源于人類測(cè)量、記錄和分析世界的渴望。信息技術(shù)變革隨處可見,但是如今信息技術(shù)變革的重點(diǎn)在“T”(技術(shù))上,而不是在“I”(信息)上。現(xiàn)在,我們是時(shí)候把聚光燈打向“I”,開始關(guān)注信息本身了。數(shù)據(jù),從最不可能的地方提取出來數(shù)據(jù)化,不是數(shù)字化量化一切,數(shù)據(jù)化的核心當(dāng)文字變成數(shù)據(jù)當(dāng)方位變成數(shù)據(jù)當(dāng)溝通成為數(shù)據(jù)一切事物的數(shù)據(jù)化第12頁(yè)/共33頁(yè)“價(jià)值”“取之不盡,用之不竭”的數(shù)據(jù)創(chuàng)新 數(shù)據(jù)就像一個(gè)神奇的鉆石礦,當(dāng)它的首要價(jià)值被發(fā)掘后仍能不斷給予。它的真實(shí)價(jià)值就像漂浮在海洋中的冰山,第一眼只能看到冰

4、山的一角,而絕大部分都隱藏在表面之下。數(shù)據(jù)創(chuàng)新1:數(shù)據(jù)的再利用數(shù)據(jù)創(chuàng)新2:重組數(shù)據(jù)數(shù)據(jù)創(chuàng)新3:可擴(kuò)展數(shù)據(jù)數(shù)據(jù)創(chuàng)新4:數(shù)據(jù)的折舊值數(shù)據(jù)創(chuàng)新5:數(shù)據(jù)廢氣數(shù)據(jù)創(chuàng)新6:開放數(shù)據(jù)給數(shù)據(jù)估值第13頁(yè)/共33頁(yè)“角色定位”數(shù)據(jù)、技術(shù)與思維的三足鼎立 微軟以億美元的價(jià)格購(gòu)買了大數(shù)據(jù)公司Farecast,而兩年后谷歌則以7億美元的價(jià)格購(gòu)買了給Farecast提供數(shù)據(jù)的ITA Software公司。如今,我們正處在大數(shù)據(jù)時(shí)代的早期,思維和技術(shù)是最有價(jià)值的,但是最終大部分價(jià)值還是必須從數(shù)據(jù)本身來挖掘。大數(shù)據(jù)價(jià)值的3大構(gòu)成大數(shù)據(jù)掌控公司大數(shù)據(jù)技術(shù)公司大數(shù)據(jù)思維公司和個(gè)人全新的數(shù)據(jù)中間商專家的消亡與數(shù)據(jù)科學(xué)家的崛起大數(shù)

5、據(jù),決定企業(yè)的競(jìng)爭(zhēng)力第14頁(yè)/共33頁(yè)第15頁(yè)/共33頁(yè)“風(fēng)險(xiǎn)”讓數(shù)據(jù)主宰一切的隱憂 我們時(shí)刻都暴露在“第三只眼”之下:亞馬遜監(jiān)視著我們的購(gòu)物習(xí)慣,谷歌監(jiān)視著我們的網(wǎng)頁(yè)瀏覽習(xí)慣,而微博似乎什么都知道,不僅竊聽到了我們心中的“TA”,還有我們的社交關(guān)系網(wǎng)。無處不在的“第三只眼”我們的隱私被二次利用了預(yù)測(cè)與懲罰,不是因?yàn)椤八觥保且驗(yàn)椤皩⒆觥睌?shù)據(jù)獨(dú)裁掙脫大數(shù)據(jù)的困境第16頁(yè)/共33頁(yè)“掌控”責(zé)任與自由并舉的信息管理 當(dāng)世界開始邁向大數(shù)據(jù)時(shí)代時(shí),社會(huì)也將經(jīng)歷類似的地殼運(yùn)動(dòng)。在改變?nèi)祟惢镜纳钆c思考方式的同時(shí),大數(shù)據(jù)早已在推動(dòng)人類信息管理準(zhǔn)則上重新定位。然而,不同于印刷革命,我們沒有幾個(gè)世紀(jì)的時(shí)

6、間去適應(yīng),我們也許只有幾年時(shí)間。管理變革1:個(gè)人隱私保護(hù),從個(gè)人許可到讓數(shù)據(jù)使用者承擔(dān)責(zé)任管理變革2:個(gè)人動(dòng)因VS預(yù)測(cè)分析管理變革3:擊碎黑盒子,大數(shù)據(jù)程序員的崛起管理變革4:反數(shù)據(jù)壟斷大亨第17頁(yè)/共33頁(yè)正在發(fā)生的未來大數(shù)據(jù)并不是一個(gè)充斥著算法和機(jī)器的冰冷世界,人類的作用依然無法被完全替代。大數(shù)據(jù)為我們提供的不是最終答案,只是參考答案,幫助是暫時(shí)的,而更好的方法和答案還在不久的未來。第18頁(yè)/共33頁(yè)大數(shù)據(jù)時(shí)代下的數(shù)據(jù)挖掘 第19頁(yè)/共33頁(yè)數(shù)據(jù)挖掘簡(jiǎn)介數(shù)據(jù)挖掘簡(jiǎn)介1數(shù)據(jù)挖掘分類數(shù)據(jù)挖掘分類2成功案例成功案例3總結(jié)與展望總結(jié)與展望4第20頁(yè)/共33頁(yè)第21頁(yè)/共33頁(yè)第22頁(yè)/共33頁(yè)第23頁(yè)/共33頁(yè)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)挖掘數(shù)據(jù)庫(kù)原始文件原始文件處理原始文件處理紙張紙張界面、查詢界面、查詢硬盤硬盤聯(lián)機(jī)分析處理聯(lián)機(jī)分析處理各個(gè)數(shù)據(jù)庫(kù)各個(gè)數(shù)據(jù)庫(kù)各種媒體各種媒體20世紀(jì)60年代前20世紀(jì)60年代20世紀(jì)80年代現(xiàn)在現(xiàn)在第24頁(yè)/共33頁(yè)統(tǒng)計(jì)學(xué)數(shù)據(jù)庫(kù)技術(shù)信息科學(xué)其他學(xué)科機(jī)器學(xué)習(xí)第25頁(yè)/共33頁(yè)結(jié)果解釋和評(píng)估數(shù)據(jù)挖掘算法執(zhí)行數(shù)據(jù)收集數(shù)據(jù)收集和與處理和與處理問題定義第26頁(yè)/共33頁(yè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論