




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
consultingItechnologyoutsourcing大數(shù)據(jù)分析方法論目錄)概述Q數(shù)據(jù)分析框架③數(shù)據(jù)分析方法(數(shù)據(jù)理解&數(shù)據(jù)淮備分類與回歸①聚類分析關(guān)聯(lián)分析時序模型構(gòu)優(yōu)化◎數(shù)據(jù)分析支撐工具Copyrighte2019AccentureAllnightsreserved數(shù)據(jù)分析即從數(shù)據(jù)、信息到知識的過程,數(shù)據(jù)分析需要數(shù)學(xué)理論、行業(yè)經(jīng)驗(yàn)以及計算機(jī)工具三者結(jié)合具支撐各種廠薊開發(fā)了教據(jù)分析的工具、模玦,將分析模型數(shù)學(xué)&統(tǒng)計學(xué)知識封裝,使不了解技術(shù)的人也能夠快捷的實(shí)現(xiàn)數(shù)學(xué)藪據(jù)分析的基礎(chǔ),將整理、描述建模,快遠(yuǎn)響應(yīng)分析需求預(yù)測數(shù)據(jù)的手段、過程抽象為教學(xué)模型的理論知機(jī)器學(xué)習(xí)不需要人過多干預(yù),通過計算機(jī)自動學(xué)習(xí),發(fā)現(xiàn)數(shù)據(jù)規(guī)律,但結(jié)論不傳統(tǒng)分析在教據(jù)量較少時,傳統(tǒng)的易控制學(xué)習(xí)數(shù)據(jù)分析已能夠發(fā)現(xiàn)數(shù)據(jù)中包含的知識,包括結(jié)構(gòu)挖掘傳f分析、杜邦分析等模型教據(jù)挖掘法成熟,應(yīng)用廣泛,本嶔據(jù)挖掘是挖掘教據(jù)背后隱區(qū)文不展開介紹藏的知識的重要手段行業(yè)經(jīng)驗(yàn)分析誤區(qū)不了解分析模型的數(shù)學(xué)原理,會導(dǎo)致行業(yè)經(jīng)驗(yàn)錯誤的使用模型,而得出錯誤的分析行業(yè)經(jīng)驗(yàn)可在數(shù)據(jù)分析前確定分析需結(jié)論,影響業(yè)務(wù)決策,因此在選用分求,分析中檢驗(yàn)方法是否合理,以及析模型時,要深入了解該模型的原理分析后指導(dǎo)應(yīng)用,但行業(yè)特征不同和使用限制其應(yīng)用也不同,因此本文不展開介紹Copyrighte2019AccentureAllnightsreserved隨著計算機(jī)技術(shù)發(fā)展和數(shù)據(jù)分析理論的更新,當(dāng)前的數(shù)據(jù)分析逐步成為機(jī)器語言、統(tǒng)計知識兩個學(xué)科的交集(備選)數(shù)據(jù)分析工具各種廠商開發(fā)了數(shù)據(jù)分析的工具、模塊,將分析模型封裝,使不解技術(shù)的人也能夠快捷的實(shí)現(xiàn)數(shù)學(xué)建??焖夙憫?yīng)分析需求數(shù)據(jù)分析傳統(tǒng)分析在數(shù)據(jù)量較少時,傳統(tǒng)的數(shù)據(jù)分析已能夠發(fā)現(xiàn)敖據(jù)數(shù)據(jù)中包含的知識,包括結(jié)構(gòu)分析、杜邦分析等模型信息處理傳統(tǒng)分析方法成熟,應(yīng)用廣泛,本文不展開介紹信息處理信息處理基于查詢,可以發(fā)現(xiàn)有用的信息。但是這種查詢的回答反映業(yè)務(wù)數(shù)據(jù)的是直接存放在數(shù)據(jù)庫中的信息數(shù)據(jù)挖掘就是充分利用了統(tǒng)計學(xué)和人工智能它們不反映復(fù)雜的模式,或隱藏在數(shù)據(jù)庫中的規(guī)律技術(shù)的應(yīng)用程序,并把這些高深復(fù)雜的技術(shù)封裝起來,使人們不用自己掌握這些技術(shù)也能完成同樣的功能,并且更專注于自己所要解決的問題Copyrighte2019AccentureAllnightsreserved隨著計算機(jī)科學(xué)的進(jìn)步,數(shù)據(jù)挖掘、商務(wù)智能、大數(shù)據(jù)等概念的出現(xiàn),數(shù)據(jù)分析的手段和方法更加豐富常規(guī)分析數(shù)據(jù)挖掘商務(wù)智能大數(shù)據(jù)技術(shù)數(shù)據(jù)可視化莉示教據(jù)之間的靜…統(tǒng)計學(xué)和計算機(jī)找·一系列以事實(shí)為支多種類型的據(jù)大數(shù)據(jù)葉代,展示態(tài)關(guān)系術(shù)等多學(xué)科的結(jié)合持,輔助商業(yè)決策的中,快進(jìn)獲取知識術(shù)和方法,會用名理解數(shù)掘、演繹數(shù)括專家系統(tǒng)、有能對數(shù)據(jù)質(zhì)量要求高赦據(jù)挖掘技術(shù)的衍·將據(jù)分析的范擴(kuò)展一般由數(shù)據(jù)倉庫!推向“將來從“過去”求搖、數(shù)提備份和復(fù)等部分組成對數(shù)據(jù)分析的體系化管理,數(shù)據(jù)分析的主體依然是數(shù)掘挖掘本文在描逑數(shù)據(jù)分析的流程后,重點(diǎn)介紹通用的數(shù)據(jù)分析方法和主流的應(yīng)用工具數(shù)據(jù)件分析隨著數(shù)據(jù)量的不斷擴(kuò)大,數(shù)據(jù)分析理論正處于飛速發(fā)展期,因此本文的方法側(cè)重于基礎(chǔ)原理介紹Copyrighte2019AccentureAllnightsreserved目錄概述數(shù)據(jù)分析框架③數(shù)據(jù)分析方法(數(shù)據(jù)理解&數(shù)據(jù)淮備分類與回歸①聚類分析關(guān)聯(lián)分析時序模型構(gòu)優(yōu)化◎數(shù)據(jù)分析支撐工具Copyrighte2019AccentureAllnightsreserved數(shù)據(jù)分析標(biāo)準(zhǔn)流程CRISP-DM為90年代由SG組織(當(dāng)時)提出,已被業(yè)界廣泛認(rèn)可的數(shù)據(jù)分析流程1.業(yè)務(wù)理解(businessunderstanding)確定目標(biāo)、明確分析需求2數(shù)據(jù)理解(dataunderstanding)收集原始數(shù)據(jù)、描述數(shù)據(jù)、探索數(shù)據(jù)、檢驗(yàn)效據(jù)質(zhì)量商業(yè)理解效據(jù)理解3.數(shù)據(jù)準(zhǔn)備(datapreparation)選擇數(shù)據(jù)、清洗數(shù)據(jù)、構(gòu)造數(shù)據(jù)、整合數(shù)據(jù)、格式化敖據(jù)建立模型4建立模型(modeling)選擇建模技術(shù)、參數(shù)調(diào)優(yōu)、生成測試計劃、構(gòu)建模型型評估5評估模型(evaluation)對模型進(jìn)行較為仝面的評價,評價結(jié)果、重審過程6部署(deployment分析結(jié)果應(yīng)用Copyrighte2019AccentureAllnightsreserved數(shù)據(jù)分析框架業(yè)務(wù)理解數(shù)據(jù)理解數(shù)據(jù)準(zhǔn)備》《建立模型》《模型評估應(yīng)用理解業(yè)務(wù)背景數(shù)據(jù)收集數(shù)據(jù)探索選擇方法、工評估分析需求數(shù)據(jù)清洗樓過程評估分析結(jié)果應(yīng)月氵毅撼轉(zhuǎn)換日具,建立模型氵模型結(jié)果許估]:分析模型改堤據(jù)分析的本質(zhì)日物取的敦?fù)?jù)必頻能氵運(yùn)用計方法對數(shù)氵綜合考慮業(yè)務(wù)君求對型的:理解業(yè)務(wù)背景敏據(jù)收集探索教據(jù)建立模型·建模過程評將模型應(yīng)用于是服務(wù)于業(yè)務(wù):夠正確反映業(yè)務(wù)需氵據(jù)進(jìn)行粼索,發(fā)現(xiàn)氵精廢、數(shù)據(jù)清況、準(zhǔn)確性、效率和:業(yè)務(wù)賓,才務(wù)理解,缺乏業(yè)會對業(yè)務(wù)將造成氵數(shù)據(jù)內(nèi)部規(guī)律?;ㄙM(fèi)成本等因素求,如果沒有並:求,否則分析轄論用性迷行評能實(shí)現(xiàn)數(shù)據(jù)分選擇最合適的型。佔(zhàn)析的真正價值務(wù)指導(dǎo),會導(dǎo)致:。數(shù)據(jù)特?fù)Q在實(shí)中對分析無法落地。:·數(shù)據(jù)清洗為了達(dá)到樓型的掬:分析目的,往往模型結(jié)果評估::和解決業(yè)務(wù)問教據(jù)要求,需要:用多個樸型,然后:評估是否有遺:題評估業(yè)務(wù)雪吏::原始數(shù)據(jù)中存在教:對教據(jù)進(jìn)行轉(zhuǎn)換通過后續(xù)的樸型評:的業(yè)務(wù),模型結(jié):據(jù)梨失和壞數(shù)據(jù)判斷分析需求是·如果不處理會號致否可以糝換為毅:模型失效,園此對致化、標(biāo)淮化等。整,以尋求取合初的業(yè)務(wù)問題需要結(jié)合業(yè)務(wù)寺!聚的及時跟蹤分析項(xiàng)目,菜:數(shù)據(jù)逼過過濾“去家進(jìn)行評估些需求是不能有噪”從而提取出有后期的樸型調(diào)轉(zhuǎn)換為數(shù)據(jù)分:效數(shù)據(jù)整和優(yōu)化符合商業(yè)邏輯致?lián)蛔?、?shù)據(jù):質(zhì)量極差等Copyrighte2019AcoentureAllnightsreserved數(shù)據(jù)分析框架業(yè)務(wù)理解數(shù)據(jù)理解數(shù)據(jù)準(zhǔn)備建立模型模型評估數(shù)據(jù)探KN法均方根誤差SVM算法均方誤差收集敖據(jù)正概率計神經(jīng)網(wǎng)絡(luò)特征描述〔45決策樹評估分析需求群間差異度分布特K均值算法群內(nèi)相似度業(yè)務(wù)符合度結(jié)構(gòu)分析FP-growth算法確需求Apriori算法支持度數(shù)據(jù)清躉信度教據(jù)摶換指效平滑}均方根誤差是支持向量機(jī)□均方誤差是否滿灰色理論一!正概率統(tǒng)計足要求灰色理論造傳算法Copyrighte2019AccentureAl
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 山東省威海乳山市2024-2025學(xué)年九年級上學(xué)期期末化學(xué)試題(含答案)
- 2025年消防設(shè)施操作員之消防設(shè)備基礎(chǔ)知識基礎(chǔ)試題庫和答案要點(diǎn)
- 景觀橋分析面試題及答案
- 2023-2024學(xué)年廣東省廣州市越秀區(qū)執(zhí)信中學(xué)七年級(下)期中數(shù)學(xué)試卷(含答案)
- 廣東省廣州市中大附中2023-2024學(xué)年八年級下學(xué)期期中物理試題(含答案)
- 采購合同范本(2篇)
- 電器知識技能培訓(xùn)班課件
- 關(guān)于調(diào)整工作時間與資源配置的通知
- 租賃協(xié)議合同
- 山東省青島萊西市(五四制)2024-2025學(xué)年八年級上學(xué)期期末生物學(xué)試題(含答案)
- 計算機(jī)網(wǎng)絡(luò)知到智慧樹章節(jié)測試課后答案2024年秋貴州財經(jīng)大學(xué)
- 酒店2025年應(yīng)急疏散演練計劃
- 數(shù)學(xué)-廣東省2025年深圳市高三年級第一次調(diào)研考試(深圳一模)試題和答案
- 第一單元第2課《生活之美》課件-七年級美術(shù)下冊(人教版)
- 2025年高考作文備考之題目解析及4篇范文:“生活是否還需要游戲”
- 2025年中國秸稈發(fā)電行業(yè)市場前瞻與投資預(yù)測分析報告
- 2025年七下道德與法治教材習(xí)題答案
- 新教科版一年級科學(xué)下冊第二單元第5課《它們吃什么》課件
- 坡面土壤侵蝕過程模擬-深度研究
- 互聯(lián)網(wǎng)護(hù)理服務(wù)典型案例
- 礦泉水購銷合同范本2025年
評論
0/150
提交評論