大數(shù)據(jù)常見術(shù)語解釋(1)_第1頁
大數(shù)據(jù)常見術(shù)語解釋(1)_第2頁
大數(shù)據(jù)常見術(shù)語解釋(1)_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、大數(shù)據(jù)常見術(shù)語解釋(1)胡經(jīng)國大數(shù)據(jù)(Big Data)是指無法在可承受的時間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕 捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察 發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。大數(shù)據(jù)的出現(xiàn)產(chǎn)生了許多新術(shù)語,這些術(shù)語往往比擬難以理解。為此,我 們根據(jù)有關(guān)大數(shù)據(jù)文獻(xiàn)編寫了本文,供大家認(rèn)識大數(shù)據(jù)參考。1、聚合(Aggregation )聚合是指搜索、合并、顯示數(shù)據(jù)的過程。2、算法(Algorithms)算法是指可以完成某種數(shù)據(jù)分析的數(shù)學(xué)公式。3、分析法(Analytics)分析法用于發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在涵義。4、異常檢測(Anomaly Detect

2、ion )異常檢測用于在數(shù)據(jù)集中搜索與預(yù)期模式或行為不匹配的數(shù)據(jù)項。除了 “Anomalies”以外,用來表示“異?!钡挠⑽膯卧~還有以下幾個:outliers, exceptions, surprises, contaminants0它們通??商峁╆P(guān)鍵的可執(zhí)行信息。5、匿名化(Anonymization)匿名化使數(shù)據(jù)匿名,即移除所有與個人隱私相關(guān)的數(shù)據(jù)。6、應(yīng)用(Application)在這里,應(yīng)用是指實現(xiàn)某種特定功能的計算機軟件。7、人工智能(ArtiHcial Intelligence)人工智能是指研發(fā)智能機器和智能軟件;這些智能設(shè)備能夠感知周圍的環(huán) 境,并根據(jù)要求作出相應(yīng)的反響,甚至能自

3、我學(xué)習(xí)。8、行為分析法(Behavioural Analytics )行為分析法是指根據(jù)用戶的行為如“怎么做”,“為什么這么做”以及 “做了什么”來得出結(jié)論,而不是僅僅針對人物和時間的一門分析學(xué)科。它著 眼于數(shù)據(jù)中的人性化模式。9、大數(shù)據(jù)科學(xué)家(Big Data Scientist)大數(shù)據(jù)科學(xué)家是指能夠設(shè)計大數(shù)據(jù)算法使得大數(shù)據(jù)變得有用的人。10、大數(shù)據(jù)創(chuàng)業(yè)公司(Big Data Startup)大數(shù)據(jù)創(chuàng)業(yè)公司是指研發(fā)最新大數(shù)據(jù)技術(shù)的新興公司。11、生物測定術(shù)(Biometrics)生物測定術(shù)是指根據(jù)個人的特征進(jìn)行身份識別。12、B 字節(jié)(BB: Brontobytes)B字節(jié)約等于1000 Y

4、B (Yottabytes),相當(dāng)于未來數(shù)字化宇宙的大小。1B 字節(jié)包含了 27個0!13、商業(yè)智能(Business Intelligence)商業(yè)智能是指一系列理論、方法學(xué)和過程,使得數(shù)據(jù)更容易被理解。14 分類分析(Classification Analysis)分類分析是指從數(shù)據(jù)中獲得重要相關(guān)性信息的系統(tǒng)化過程;這類數(shù)據(jù)也被 稱為元數(shù)據(jù)(Meta Data),即是描述數(shù)據(jù)的數(shù)據(jù)。15、云計算(Cloud Computing)簡而言之,云計算是指通過互聯(lián)網(wǎng)提供智能化計算資源的服務(wù)模式或商業(yè) 模式。提供資源(資源池上的計算能力、存儲空間和信息服務(wù))的網(wǎng)絡(luò)被稱為 云(或云端),由云按需提供可

5、動態(tài)伸縮(可以無限擴展、隨時獲取、按需使 用、按使用付費)的廉價計算服務(wù);計算能力是通過互聯(lián)網(wǎng)進(jìn)行傳輸?shù)摹?6、聚類分析(Clustering Analysis )聚類分析是指將相似的對象聚合在一起,每類相似的對象組合成一個聚類 (也叫作簇)的過程。這種分析方法的目的在于分析數(shù)據(jù)之間的差異和相似 性。17 冷數(shù)據(jù)存儲(Cold Data Storage)冷數(shù)據(jù)存儲是指在低功耗服務(wù)器上存儲那些幾乎不被使用的舊數(shù)據(jù);這些 舊數(shù)據(jù)檢索起來將會很耗時。18、比照分析(Comparative Analysis)比照分析是指在非常大的數(shù)據(jù)集中進(jìn)行模式匹配口寸,進(jìn)行一步步的比照和 計算從而得到分析結(jié)果的過程。19、復(fù)雜結(jié)構(gòu)數(shù)據(jù)(Complex Structured Data)復(fù)雜結(jié)構(gòu)數(shù)據(jù)是指由兩個或多個復(fù)雜而相互關(guān)聯(lián)的局部組成的數(shù)據(jù)。這類 數(shù)據(jù)不能簡單地用結(jié)構(gòu)化查詢語言或工具(SQL)來解析。20、計算機產(chǎn)生的數(shù)據(jù)(Computer Generated Data)計算機產(chǎn)生的數(shù)據(jù)是指如日志文件這類由計算機生成的數(shù)據(jù)。21、并發(fā) (Concurrency)并發(fā)是指同時執(zhí)行多個任務(wù)或運行多個進(jìn)程。22、相關(guān)性分析(Correlation Analysis )相關(guān)性分析是指一種數(shù)據(jù)分析方法,用于分析變量之間是否存在正相關(guān)或 者負(fù)相關(guān)。23、客戶關(guān)系管理(Cust

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論