


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、大數(shù)據(jù)核心技術(shù)大數(shù)據(jù)技術(shù),就是從各種類型數(shù)據(jù)中迅速獲得有價(jià)值信息技術(shù)。 大數(shù)據(jù)領(lǐng)域己經(jīng)涌現(xiàn)出了大量新技術(shù),它們成為大數(shù)據(jù)采集、存儲(chǔ)、 解決和呈既有力武器。大數(shù)據(jù)解決核心技術(shù)普通涉及:大數(shù)據(jù)采集、大數(shù)據(jù)預(yù)解決、大 數(shù)據(jù)存儲(chǔ)及管理、大數(shù)據(jù)分析及挖掘、大數(shù)據(jù)呈現(xiàn)和應(yīng)用(大數(shù)據(jù)檢 索、大數(shù)據(jù)可視化、大數(shù)據(jù)應(yīng)用、大數(shù)據(jù)安全等)。a-、大數(shù)據(jù)采集技術(shù)數(shù)據(jù)是指通過RFID射頻數(shù)據(jù)、傳感器數(shù)據(jù)、社交網(wǎng)絡(luò)交互數(shù)據(jù)及 移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)等方式獲得各種類型構(gòu)造化、半構(gòu)造化(或稱之為弱 構(gòu)造化)及非構(gòu)造化海量數(shù)據(jù),是大數(shù)據(jù)知識(shí)服務(wù)模型主線。重點(diǎn)要 突破分布式高速高可靠數(shù)據(jù)爬取或采集、高速數(shù)據(jù)全映像等大 數(shù)據(jù)收集技術(shù);突破
2、高速數(shù)據(jù)解析、轉(zhuǎn)換與裝載等大數(shù)據(jù)整合 技術(shù);設(shè)計(jì)質(zhì)量評(píng)估模型,開發(fā)數(shù)據(jù)質(zhì)量技術(shù)。大數(shù)據(jù)采集普通分為大數(shù)據(jù)智能感知層:重要涉及數(shù)據(jù)傳感體 系、網(wǎng)絡(luò)通信體系、傳感適配體系、智能辨認(rèn)體系及軟硬件資源接入 系統(tǒng),實(shí)現(xiàn)對(duì)構(gòu)造化、半構(gòu)造化、非構(gòu)造化海量數(shù)據(jù)智能化辨認(rèn)、定 位、跟蹤、接入、傳播、信號(hào)轉(zhuǎn)換、監(jiān)控、初步解決和管理等。必要 著重攻克針對(duì)大數(shù)據(jù)源智能辨認(rèn)、感知、適配、傳播、接入等技術(shù)。 基本支撐層:提供大數(shù)據(jù)服務(wù)平臺(tái)所需虛擬服務(wù)器,構(gòu)造化、半構(gòu)造 化及非構(gòu)造化數(shù)據(jù)數(shù)據(jù)庫及物聯(lián)網(wǎng)絡(luò)資源等基本支撐環(huán)境。重點(diǎn)攻克 分布式虛擬存儲(chǔ)技術(shù),大數(shù)據(jù)獲取、存儲(chǔ)、組織、分析和決策操作可 視化接口技術(shù),大數(shù)據(jù)網(wǎng)絡(luò)傳播與
3、壓縮技術(shù),大數(shù)據(jù)隱私保護(hù)技術(shù)等。二、大數(shù)據(jù)預(yù)解決技術(shù)重要完畢對(duì)己接受數(shù)據(jù)辨析、抽取、清洗等操作。1)抽?。阂?獲取數(shù)據(jù)也許具備各種構(gòu)造和類型,數(shù)據(jù)抽取過程可以協(xié)助咱們將這 些復(fù)雜數(shù)據(jù)轉(zhuǎn)化為單一或者便于解決構(gòu)型,以達(dá)到迅速分析解決目。 2)清洗:對(duì)于大數(shù)據(jù),并不全是有價(jià)值,有些數(shù)據(jù)并不是咱們所關(guān) 懷內(nèi)容,而另某些數(shù)據(jù)則是完全錯(cuò)誤干擾項(xiàng),因而要對(duì)數(shù)據(jù)通過過濾 “去噪”從而提取出有效數(shù)據(jù)。三、大數(shù)據(jù)存儲(chǔ)及管理技術(shù)大數(shù)據(jù)存儲(chǔ)與管理要用存儲(chǔ)器把采集到數(shù)據(jù)存儲(chǔ)起來,建立相應(yīng) 數(shù)據(jù)庫,并進(jìn)行管理和調(diào)用。重點(diǎn)解決復(fù)雜構(gòu)造化、半構(gòu)造化和非構(gòu) 造化大數(shù)據(jù)管理與解決技術(shù)。重要解決大數(shù)據(jù)可存儲(chǔ)、可表達(dá)、可解 決、可靠
4、性及有效傳播等幾種核心問題。開發(fā)可靠分布式文獻(xiàn)系統(tǒng)(DFS)、能效優(yōu)化存儲(chǔ)、計(jì)算融入存儲(chǔ)、大數(shù)據(jù)去兀余及高效低 成本大數(shù)據(jù)存儲(chǔ)技術(shù);突破分布式非關(guān)系型大數(shù)據(jù)管理與解決 技術(shù),異構(gòu)數(shù)據(jù)數(shù)據(jù)融合技術(shù),數(shù)據(jù)組織技術(shù),研究大數(shù)據(jù)建模 技術(shù);突破大數(shù)據(jù)索引技術(shù);突破大數(shù)據(jù)移動(dòng)、備份、復(fù)制等 技術(shù);開發(fā)大數(shù)據(jù)可視化技術(shù)。開發(fā)新型數(shù)據(jù)庫技術(shù),數(shù)據(jù)庫分為關(guān)系型數(shù)據(jù)庫、非關(guān)系型數(shù)據(jù) 庫以及數(shù)據(jù)庫緩存系統(tǒng)。其中,非關(guān)系型數(shù)據(jù)庫重要指是?oSQL數(shù)據(jù) 庫,分為:鍵值數(shù)據(jù)庫、列存數(shù)據(jù)庫、圖存數(shù)據(jù)庫以及文檔數(shù)據(jù)庫等 類型。關(guān)系型數(shù)據(jù)庫包括了老式關(guān)系數(shù)據(jù)庫系統(tǒng)以及NewSQL數(shù)據(jù)庫。開發(fā)大數(shù)據(jù)安全技術(shù)。改進(jìn)數(shù)據(jù)銷毀、透明
5、加解密、分布 式訪問控制、數(shù)據(jù)審計(jì)等技術(shù);突破隱私保護(hù)和推理控制、數(shù) 據(jù)真?zhèn)伪嬲J(rèn)和取證、數(shù)據(jù)持有完整性驗(yàn)證等技術(shù)。四、大數(shù)據(jù)分析及挖掘技術(shù)大數(shù)據(jù)分析技術(shù)。改進(jìn)己有數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù);開 發(fā)數(shù)據(jù)網(wǎng)絡(luò)挖掘、特異群組挖掘、圖挖掘等新型數(shù)據(jù)挖掘技術(shù); 突破基于對(duì)象數(shù)據(jù)連接、相似性連接等大數(shù)據(jù)融合技術(shù);突破 顧客興趣分析、網(wǎng)絡(luò)行為分析、情感語義分析等而向領(lǐng)域大數(shù) 據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘就是從大量、不完全、有噪聲、模糊、隨機(jī)實(shí)際應(yīng)用數(shù) 據(jù)中,提取隱含在其中、人們事先不懂得、但又是潛在有用信息和知 識(shí)過程。數(shù)據(jù)挖掘涉及技術(shù)辦法諸多,有各種分類法。依照挖掘任務(wù) 可分為分類或預(yù)測(cè)模型發(fā)現(xiàn)、數(shù)據(jù)總結(jié)、聚類、關(guān)聯(lián)
6、規(guī)則發(fā)現(xiàn)、序列 模式發(fā)現(xiàn)、依賴關(guān)系或依賴模型發(fā)現(xiàn)、異常和趨勢(shì)發(fā)現(xiàn)等等;依照挖 掘?qū)ο罂煞譃殛P(guān)系數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫、空間數(shù)據(jù)庫、時(shí)態(tài)數(shù)據(jù) 庫、文本數(shù)據(jù)源、多媒體數(shù)據(jù)庫、異質(zhì)數(shù)據(jù)庫、遺產(chǎn)數(shù)據(jù)庫以及環(huán)球 網(wǎng)Web;依照挖掘辦法分,可粗分為:機(jī)器學(xué)習(xí)辦法、記錄辦法、神 經(jīng)網(wǎng)絡(luò)辦法和數(shù)據(jù)庫辦法。機(jī)器學(xué)習(xí)中,可細(xì)分為:歸納學(xué)習(xí)辦法(決 策樹、規(guī)則歸納等)、基于范例學(xué)習(xí)、遺傳算法等。記錄辦法中,可 細(xì)分為:回歸分析(多元回歸、自回歸等)、鑒別分析(貝葉斯鑒別、費(fèi) 歇爾鑒別、非參數(shù)鑒別等)、聚類分析(系統(tǒng)聚類、動(dòng)態(tài)聚類等)、摸 索性分析(主元分析法、有關(guān)分析法等)等。神經(jīng)網(wǎng)絡(luò)辦法中,可細(xì)分 為:前向神經(jīng)網(wǎng)
7、絡(luò)(BP算法等)、自組織神經(jīng)網(wǎng)絡(luò)(自組織特性映射、 競(jìng)爭(zhēng)學(xué)習(xí)等)等。數(shù)據(jù)庫辦法重要是多維數(shù)據(jù)分析或OLAP辦法,此外 尚有而向?qū)傩詺w納辦法。從挖掘任務(wù)和挖掘辦法角度,著重突破:1.可視化分析。數(shù)據(jù)可 視化無論對(duì)于普通顧客或是數(shù)據(jù)分析專家,都是最基木功能。數(shù)據(jù)圖 像化可以讓數(shù)據(jù)自己說話,讓顧客直觀感受到成果。2.數(shù)據(jù)挖掘算法。 圖像化是將機(jī)器語言翻譯給人看,而數(shù)據(jù)挖掘就是機(jī)器母語。分割、 集群、孤立點(diǎn)分析尚有各種各樣五花八門算法讓咱們精煉數(shù)據(jù),挖掘 價(jià)值。這些算法一定要可以應(yīng)付大數(shù)據(jù)量,同步還具備很高解決速度。 3.預(yù)測(cè)性分析。預(yù)測(cè)性分析可以讓分析師依照?qǐng)D像化分析和數(shù)據(jù)挖掘 成果做出某些前瞻性判
8、斷。4.語義引擎。語義引擎需要設(shè)計(jì)到有足夠 人工智能以足以從數(shù)據(jù)中積極地提取信息。語言解決技術(shù)涉及機(jī)器翻 譯、情感分析、輿情分析、智能輸入、問答系統(tǒng)等。5.數(shù)據(jù)質(zhì)量和數(shù) 據(jù)管理。數(shù)據(jù)質(zhì)量與管理是管理最佳實(shí)踐,透過原則化流程和機(jī)器對(duì) 數(shù)據(jù)進(jìn)行解決可以保證獲得一種預(yù)設(shè)質(zhì)量分析成果。六、大數(shù)據(jù)呈現(xiàn)與應(yīng)用技術(shù)大數(shù)據(jù)技術(shù)可以將隱藏于海量數(shù)據(jù)中信息和知識(shí)挖掘出來,為人 類社會(huì)經(jīng)濟(jì)活動(dòng)提供根據(jù),從而提高各個(gè)領(lǐng)域運(yùn)營效率,大大提高整 個(gè)社會(huì)經(jīng)濟(jì)集約化限度。在國內(nèi),大數(shù)據(jù)將重點(diǎn)應(yīng)用于如下三大領(lǐng)域: 商業(yè)智能、政府決策、公共服務(wù)。例如:商業(yè)智能技術(shù),政府決策技 術(shù),電信數(shù)據(jù)信息解決與挖掘技術(shù),電網(wǎng)數(shù)據(jù)信息解決與挖掘技術(shù), 氣象信息分析技術(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 延遲交付房貸協(xié)議書
- 損壞墳頭賠償協(xié)議書
- 中考協(xié)議書手寫朋友
- 結(jié)伴出游免責(zé)協(xié)議書
- 設(shè)備設(shè)施外包協(xié)議書
- 農(nóng)村老婆婚前協(xié)議書
- 高校輔導(dǎo)員招聘考試應(yīng)對(duì)策略及試題及答案
- 武漢五調(diào)英語試題及答案
- 2025至2030年鐵花彎花機(jī)項(xiàng)目投資價(jià)值分析報(bào)告
- 農(nóng)藝師考試關(guān)鍵準(zhǔn)備2024年試題及答案
- 土方回填施工記錄表
- 旋挖鉆機(jī)基坑支護(hù)工程施工隱患排查治理清單
- 空調(diào)維保質(zhì)量保障體系及措施方案
- 平面向量在三角函數(shù)中的應(yīng)用(學(xué)案)
- 中藥的道地藥材課件
- 幼兒園《3-6歲兒童學(xué)習(xí)與發(fā)展指南》健康領(lǐng)域知識(shí)試題及答案
- 國家職業(yè)技能標(biāo)準(zhǔn) (2021年版) 嬰幼兒發(fā)展引導(dǎo)員
- 幼兒園小班科學(xué):《小雞和小鴨》 PPT課件
- 伯努利方程-ppt課件
- 年產(chǎn)20噸阿齊沙坦原料藥生產(chǎn)車間的設(shè)計(jì)和實(shí)現(xiàn)材料學(xué)專業(yè)
- 電子公章模板
評(píng)論
0/150
提交評(píng)論