版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、2022年-2023年最新關于舉辦“大數(shù)據(jù)建模與分析挖掘應用”實戰(zhàn)培訓班的通知地點北京上海時間12月 23-261月 12-15一、課程簡介大數(shù)據(jù)建模與分析挖掘技術已經(jīng)逐步地應用到新興互聯(lián)網(wǎng)企業(yè)(如電子商務網(wǎng)站、搜索引擎、 社交網(wǎng)站、互聯(lián)網(wǎng)廣告服務提供商等)、銀行金融證券企業(yè)、電信運營等行業(yè),給這些行業(yè)帶來了 一定的數(shù)據(jù)價值增值作用。本次課程面向有一定的數(shù)據(jù)分析挖掘算法基礎的工程師,帶大家實踐大數(shù)據(jù)分析挖掘平臺的項 目訓練,系統(tǒng)地講解數(shù)據(jù)準備、數(shù)據(jù)建模、挖掘模型建立、大數(shù)據(jù)分析與挖掘算法應用在業(yè)務模型中, 結(jié)合主流的Hadoop與Spark大數(shù)據(jù)分析平臺架構(gòu),實現(xiàn)工程訓練。結(jié)合業(yè)界使用最廣泛的
2、主流大數(shù)據(jù)平臺技術,重點剖析基于大數(shù)據(jù)分析算法與BI技術應用, 包括分類算法、聚類算法、預測分析算法、推薦分析模型等在業(yè)務中的實踐應用,并根據(jù)講師給定的 數(shù)據(jù)集,實現(xiàn)兩個基本的日志數(shù)據(jù)分析挖掘系統(tǒng),以及電商(或內(nèi)容)推薦系統(tǒng)引擎。本課程基本的實踐環(huán)境是Linux集群,JDK1.8, Hadoop 2.7.*, Spark 2.1.*。學員需要準備的電腦最好是i5及以上CPU, 4GB及以上內(nèi)存,硬盤空間預留50GB (可用移動 硬盤),基本的大數(shù)據(jù)分析平臺所依賴的軟件包和依賴庫等,講師已經(jīng)提前部署在虛擬機鏡像 (VMware鏡像),學員根據(jù)講師的操作任務進行實踐。本課程采用技術原理與工程實戰(zhàn)相
3、結(jié)合的方式進行教學,在講授原理的過程中,穿插實際的系 統(tǒng)操作,本課程講師也精心準備的實際的應用案例供學員動手訓練。二、培訓目標1本課程讓學員充分掌握大數(shù)據(jù)平臺技術架構(gòu)、大數(shù)據(jù)分析的基本理論、機器學習的常用算法、 國內(nèi)外主流的大數(shù)據(jù)分析與BI商業(yè)智能分析解決方案、以及大數(shù)據(jù)分析在搜索引擎、廣告服務推薦、 電商數(shù)據(jù)分析、金融客戶分析方面的應用案例。2本課程強調(diào)主流的大數(shù)據(jù)分析挖掘算法技術的應用和分析平臺的實施,讓學員掌握主流的基 于大數(shù)據(jù)Hadoop和Spark、R的大數(shù)據(jù)分析平臺架構(gòu)和實際應用,并用結(jié)合實際的生產(chǎn)系統(tǒng)案例進2022年-2023年最新行教學,掌握基于Hadoop大數(shù)據(jù)平臺的數(shù)據(jù)挖掘
4、和數(shù)據(jù)倉庫分布式系統(tǒng)平臺應用,以及商業(yè)和開 源的數(shù)據(jù)分析產(chǎn)品加上Hadoop平臺形成大數(shù)據(jù)分析平臺的應用剖析。3讓學員掌握常見的機器學習算法,深入講解業(yè)界成熟的大數(shù)據(jù)分析挖掘與BI平臺的實踐應 用,并以客戶分析系統(tǒng)、日志分析和電商推薦系統(tǒng)為案例,串聯(lián)常用的數(shù)據(jù)挖掘技術進行應用教學。 三、培訓人群.大數(shù)據(jù)分析應用開發(fā)工程師.大數(shù)據(jù)分析工程的規(guī)劃咨詢管理人員.大數(shù)據(jù)分析工程的IT工程高管人員.大數(shù)據(jù)分析與挖掘處理算法應用工程師.大數(shù)據(jù)分析集群運維工程師.大數(shù)據(jù)分析工程的售前和售后技術支持服務人員四、培訓特色定制授課+實戰(zhàn)案例訓練+互動咨詢討論大數(shù)據(jù)建模與分析挖掘應用實戰(zhàn)大數(shù)據(jù)建模與分析挖掘應用實戰(zhàn)
5、目標:掌握大數(shù)據(jù)建模與分析挖掘平臺工具 業(yè)界主流大數(shù)據(jù)建模與分析挖掘平臺工具的應用Hadoop大數(shù)據(jù)分析挖掘工具MahoutSpark大數(shù)據(jù)分析挖掘工具 MllibR建模工具SPSS建模工具目標:掌握大數(shù)據(jù)建模與分析挖掘平臺工具 業(yè)界主流大數(shù)據(jù)建模與分析挖掘平臺工具的應用Hadoop大數(shù)據(jù)分析挖掘工具MahoutSpark大數(shù)據(jù)分析挖掘工具 MllibR建模工具SPSS建模工具目標:掌握大數(shù)據(jù)分析挖掘算法與模型大數(shù)據(jù)挖掘的機器學習算法模型的原理和應用操作客戶分析、日志分析、推薦營銷分析、預測分析等場景中的算法模型聚類分析挖掘算法與模型(K均值、層次聚類、譜聚類等)分類分析挖掘算法與模型(貝葉斯
6、、決策樹等)關聯(lián)分析挖掘算法與模型(FP-Growth 、Apriori關聯(lián)規(guī)那么挖掘等)推薦分析挖掘算法與模型(Item-based 、User-based 協(xié)同過濾等)回歸分析挖掘算法與模型(線性回歸、邏輯回歸等) 圖關系分析挖掘算法模型(鏈接分析、社交分析等) 神經(jīng)網(wǎng)絡深度學習算法模型(CNN、RNN等)上述算法模型基于Spark MLlib的程序例如目標:利用所學的分析挖掘算法模型知識進行工程訓練基于Spark構(gòu)建大數(shù)據(jù)分析挖掘平臺以工程的形式結(jié)合業(yè)務需求,完成兩個完整工程案例任務講師會帶著學員進行操作訓練講師會提供數(shù)據(jù)集、實驗環(huán)境和實驗指導手冊(說明:講師會提供虛擬機鏡像,并把Had
7、oop, Spark等系統(tǒng)提前部署在虛擬機中,分析挖掘平臺 構(gòu)建在Hadoop與Spark之上,學員自帶筆記本,運行虛擬機,并利用同樣的鏡像啟動多臺虛擬機, 構(gòu)建實驗集群,鏡像會提前給學員)2022年-2023年最新五、詳細大綱與培訓內(nèi)容.日志分析建模與日志挖掘工程實踐a)Hadoop, Spark,并結(jié)合ELK技術構(gòu)建日志分析系統(tǒng)和日志 數(shù)據(jù)倉庫兩個完整的項 目任務和實踐 案例(重點)工程的階段性步驟 貫穿到三天的培訓 過程中,第三天完成 整個工程的原型b)互聯(lián)網(wǎng)微博日志分析系統(tǒng)工程推薦系統(tǒng)工程實踐a)電影數(shù)據(jù)分析與個性化推薦關聯(lián)分析工程b)電商購物籃分析工程Hadoop, Spark,可結(jié)
8、合Oryx分布式集群在個性化推薦和精準 營銷工程。培訓內(nèi)容安排如下:時間內(nèi)容提要授課詳細內(nèi)容實踐訓練第天業(yè)界主流的 數(shù)據(jù)倉庫工 具和大數(shù)據(jù) 分析挖掘工 具業(yè)界主流的基于Hadoop和Spark的大數(shù)據(jù)分析挖掘項 目解決方案業(yè)界數(shù)據(jù)倉庫與數(shù)據(jù)分析挖掘平臺軟件工具Hadoop數(shù)據(jù)倉庫工具HiveSpark實時數(shù)據(jù)倉庫工具SparkSQLHadoop數(shù)據(jù)分析挖掘工具MahoutSpark機器學習與數(shù)據(jù)分析挖掘工具MLlib大數(shù)據(jù)分析挖掘工程的實施步驟配置數(shù)據(jù)倉庫工具 Hadoop Hive 和 SparkSQL部署數(shù)據(jù)分析挖掘 工 具 Hadoop Mahout 和 Spark MLlib大數(shù)據(jù)分析
9、 挖掘工程的 數(shù)據(jù)集成操 作訓練.日志數(shù)據(jù)解析和導入導出到數(shù)據(jù)倉庫的操作訓練.從原始搜索數(shù)據(jù)集中抽取、集成數(shù)據(jù),整理后形成規(guī) 范的數(shù)據(jù)倉庫.數(shù)據(jù)分析挖掘模塊從大型的集中式數(shù)據(jù)倉庫中訪問數(shù) 據(jù),一個數(shù)據(jù)倉庫面向一個主題,構(gòu)建兩個數(shù)據(jù)倉庫.同一個數(shù)據(jù)倉庫中的事實表數(shù)據(jù),可以給多個不同類 型的分析挖掘任務調(diào)用.去除噪聲工程數(shù)據(jù)集加載 ETL 到Hadoop Hive 數(shù)據(jù)倉庫并建立多 維模型2022年-2023年最新基于 Hadoop 的大型數(shù)據(jù) 倉庫管理平 臺一HIVE數(shù) 據(jù)倉庫集群 的多維分析 建模應用實 踐基于Hadoop的人型分布式數(shù)據(jù)倉庫在行業(yè)中的數(shù)據(jù)倉 庫應用案例Hive數(shù)據(jù)倉庫集群的平
10、臺體系結(jié)構(gòu)、核心技術剖析Hive Server的工作原理、機制與應用Hive數(shù)據(jù)倉庫集群的安裝部署與配置優(yōu)化Hive應用開發(fā)技巧Hive SQL剖析與應用實踐Hive數(shù)據(jù)倉庫表與表分區(qū)、表操作、數(shù)據(jù)導入導出、 客戶端操作技巧Hive數(shù)據(jù)倉庫報表設計將原始的日志數(shù)據(jù)集,經(jīng)過整理后,加載至Hadoop + Hive數(shù)據(jù)倉庫集群中,用于共享訪問利用HIVE構(gòu)建大 型數(shù)據(jù)倉庫工程的 操作訓練實踐Spark大數(shù)據(jù) 分析挖掘平 臺實踐操作 訓練Spark大數(shù)據(jù)分析挖掘平臺的部署配置Spark數(shù)據(jù)分析庫MLlib的開發(fā)部署Spark數(shù)據(jù)分析挖掘不例操作,從Hive表中讀取數(shù)據(jù) 并在分布式內(nèi)存中運行第天聚類分
11、析建 模與挖掘算 法的實現(xiàn)原 理和技術應 用.聚類分析建模與算法原理及其在Spark MLlib中的實 現(xiàn)與應用,包括:a) Canopy 聚類 (canopy clustering)8 K 均值算法(K-means clustering)0 模糊 K 均值(Fuzzy K-means clustering)d EM聚類, 即期望最大化聚類(Expectation Maximization) 以上算法在Spark MLib中的實現(xiàn)原理和實際場景 中的應用案例。. Spark聚類分析算法程序例如基于 Spark MLlib 的聚類分析算法, 實現(xiàn)日志數(shù)據(jù)集中 的用戶聚類分類分析建 模與挖掘算 法
12、的實現(xiàn)原 理和技術應 用20.分類分析建模與算法原理及其在Spark MLlib中的實 現(xiàn)與應用,包括:0 Spark決策樹算法實現(xiàn) 邏輯回歸算法(logistics regression)B 貝葉斯算法(Bayesian與Cbeyes)0 支持向量機 (Support vector machine)j)以上算法在Spark MLlib中的實現(xiàn)原理和實際場景 中的應用案例。Spark客戶資料分析與給用戶貼標簽的程序例如Spark實現(xiàn)給商品貼標簽的程序例如Spark實現(xiàn)用戶行為的自動標簽和深度技術基于 Spark MLlib 的分類分析算法模 型與應用操作關聯(lián)分析建 模與挖掘算 法的實現(xiàn)原 理和
13、技術應 用24.預測、推薦分析建模與算法原理及其在Spark MLlib 中的實現(xiàn)與應用,包括:0 Spark頻繁模式挖掘算法(parallel FP Growth Algorithm)應用D Spark關聯(lián)規(guī)那么挖掘(Apriori)算法及其應用而 以上算法在Spark MLib中的實現(xiàn)原理和實際場景 中的應用案傷iL基于 Spark MLlib 的關聯(lián)分析操作2022年-2023年最新25. Spark關聯(lián)分析程序例如變天推薦分析挖 掘模型與算 法技術應用26.推薦算法原理及其在Spark MLlib中的實現(xiàn)與應用, 包括:a) Spark協(xié)同過濾算法程序例如t) Item-based協(xié)同
14、過濾與推存 User-based協(xié)同過濾與推存d交叉銷售推薦模型及其實現(xiàn)推薦分析實現(xiàn)步驟 與操作(重點)回歸分析模 型與預測算 法.利用線性回歸(多?;貧w)實現(xiàn)訪問量預測.利用非線性回歸預測成交量和訪問量的關系.基于R+Spark實現(xiàn)回歸分析模型及其應用操作. Spark回歸程序?qū)崿F(xiàn)異常點檢測的程序例如回歸分析預測操作 例子圖關系建模 與分析挖掘 及其鏈接分 析和社交分 析操作.利用Spark GraphX實現(xiàn)網(wǎng)頁鏈接分析,計算網(wǎng)頁重要 性排名.實現(xiàn)信息傳播的社交關系傳遞分析,互聯(lián)網(wǎng)用戶的行 為關系分析任務的操作訓練圖數(shù)據(jù)的分析挖掘 操作,實現(xiàn)微博數(shù) 據(jù)集的社交網(wǎng)絡建 模與關系分析神經(jīng)網(wǎng)絡與
15、深度學習算 法模型及其 應用實踐.神經(jīng)網(wǎng)絡算法Neural Network的實現(xiàn)方法和挖掘模型 應用.基于人工神經(jīng)網(wǎng)絡的深度學習的訓練過程4傳統(tǒng)神經(jīng)網(wǎng)絡的訓練方法t) Deep Learning的訓練方法.深度學習的常用模型和方法a) CNN (Convolutional Neural Network)卷積神經(jīng) 網(wǎng)絡B RNN (Recurrent Neural Network)循環(huán)神經(jīng)網(wǎng)絡 模型 Restricted Boltzmann Machine (RBM)限制波爾茲 曼機.基于Spark的深度學習算法模型庫的應用程序例如基 于 Spark 或 TensorFlow 神經(jīng)網(wǎng) 絡深度學習
16、庫實現(xiàn) 文本與圖片數(shù)據(jù)挖 掘工程實踐37.日志分析系統(tǒng)與日志挖掘工程實踐4 Hadoop, Spark, ELK技術構(gòu)建日志數(shù)據(jù)倉庫b互聯(lián)網(wǎng)微博日志分析系統(tǒng)工程38.推薦系統(tǒng)工程實踐a)電影數(shù)據(jù)分析與個性化推薦關聯(lián)分析工程工程數(shù)據(jù)集和詳細 的實驗指導手冊由 講師提供培訓總結(jié)39.工程方案的課堂討論,討論實際業(yè)務中的分析需求, 剖析各個環(huán)節(jié)的難點、痛點、瓶頸,啟發(fā)出解決之道; 完成講師布置的工程案例,鞏固學過的大數(shù)據(jù)分析挖 掘處理平臺技術知識以及應用技能討論交流第 四 天學員考試與業(yè)界交流2022年-2023年最新六、師資力量周老師,男,中國科學院通信與信息系統(tǒng)專業(yè)博士。北京郵電大學移動互聯(lián)網(wǎng)與
17、信息化實驗室 特聘研究員、對外經(jīng)貿(mào)大學信息學院特聘兼職教師、中國移動集團高級培訓講師,長期從事大數(shù)據(jù)、 4G、移動互聯(lián)網(wǎng)平安、管理及大數(shù)據(jù)精確營銷等研究方向。國內(nèi)頂級信息系統(tǒng)架構(gòu)師,金牌講師, 技術顧問,移動開發(fā)專家。擁有豐富的通信信息系統(tǒng)設計、開發(fā)經(jīng)驗及培訓行業(yè)經(jīng)驗,先后為 全國超過15家省移動公司,超過30家地市移動公司有過工程開發(fā)合作及授課,擔任多個大型通 信工程的總師。張老師:阿里大數(shù)據(jù)高級專家,國內(nèi)資深的Spark Hadoop技術專家、虛擬化專家,對HDFS、 MapReduce、HBase、Hive、Mahout、Storm、spark 和 openTSDB 等Hadoop 生態(tài)系統(tǒng)中的技術進行 了多年的深入的研究,更主要的是這些技術在大量的實際工程中得到廣泛的應用,因此在Hadoop開 發(fā)和運維方面積累了豐富的工程實施經(jīng)驗。近年主要典型的工程有:某電信集團網(wǎng)絡優(yōu)化、中國 移動某省移動公司請賬單系統(tǒng)和某省移動詳單實時查詢系統(tǒng)、中國銀聯(lián)大數(shù)據(jù)數(shù)據(jù)票據(jù)詳單平臺、 某大型銀行大數(shù)據(jù)記錄系統(tǒng)、某大型通信運營商全國用戶上網(wǎng)記錄、某省交通部門違章系統(tǒng)、某區(qū)域 醫(yī)療大數(shù)據(jù)應用工程、互聯(lián)網(wǎng)公共數(shù)據(jù)大云(DAAS)和構(gòu)建游戲云(Web Game Daas)平臺工程等。七、頒發(fā)證書參加相關培訓并通過考試的學員,可以獲得:1.工業(yè)和信息化部頒發(fā)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 紙袋制作課件教學課件
- 防蜇課件教學課件
- 獲獎 課件教學課件
- 2024年度農(nóng)產(chǎn)品收購合同
- 2024年企業(yè)安全評價與咨詢服務合同
- 2024年度空氣能設備安裝與驗收合同
- 2024國際快遞服務全面合作協(xié)議
- 2024樁基工程施工合同范本樁基工程施工合同
- 2024年企業(yè)合并收購協(xié)議
- 2024個人租房的合同模板范本
- (2024年)傳染病培訓課件
- 各系統(tǒng)調(diào)試報告
- 英語人稱代詞-物主代詞-名詞所有格(共4頁)
- 《質(zhì)量管理體系文件》ISO9001_2015_中英文對照
- 漂流項目規(guī)劃設計書
- 中國花鳥畫各個時期藝術特點探析
- 木霉菌生防綜述
- 勞動合同廈門市人力資源和社會保障局制
- 【教案】《認識計算機硬件設備及作用》教學設計
- 個人房屋租賃合同和押金房租收據(jù)(最新整理)
- 臥式車床電氣控制電路設計畢業(yè)設計
評論
0/150
提交評論