大數(shù)據(jù)常見(jiàn)術(shù)語(yǔ)解釋(1)_第1頁(yè)
大數(shù)據(jù)常見(jiàn)術(shù)語(yǔ)解釋(1)_第2頁(yè)
大數(shù)據(jù)常見(jiàn)術(shù)語(yǔ)解釋(1)_第3頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、大數(shù)據(jù)常見(jiàn)術(shù)語(yǔ)解釋(1)胡經(jīng)國(guó)大數(shù)據(jù)(Big Data)是指無(wú)法在可承受的時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕 捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察 發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。大數(shù)據(jù)的出現(xiàn)產(chǎn)生了許多新術(shù)語(yǔ),這些術(shù)語(yǔ)往往比擬難以理解。為此,我 們根據(jù)有關(guān)大數(shù)據(jù)文獻(xiàn)編寫了本文,供大家認(rèn)識(shí)大數(shù)據(jù)參考。1、聚合(Aggregation )聚合是指搜索、合并、顯示數(shù)據(jù)的過(guò)程。2、算法(Algorithms)算法是指可以完成某種數(shù)據(jù)分析的數(shù)學(xué)公式。3、分析法(Analytics)分析法用于發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在涵義。4、異常檢測(cè)(Anomaly Detect

2、ion )異常檢測(cè)用于在數(shù)據(jù)集中搜索與預(yù)期模式或行為不匹配的數(shù)據(jù)項(xiàng)。除了 “Anomalies”以外,用來(lái)表示“異常”的英文單詞還有以下幾個(gè):outliers, exceptions, surprises, contaminants0它們通??商峁╆P(guān)鍵的可執(zhí)行信息。5、匿名化(Anonymization)匿名化使數(shù)據(jù)匿名,即移除所有與個(gè)人隱私相關(guān)的數(shù)據(jù)。6、應(yīng)用(Application)在這里,應(yīng)用是指實(shí)現(xiàn)某種特定功能的計(jì)算機(jī)軟件。7、人工智能(ArtiHcial Intelligence)人工智能是指研發(fā)智能機(jī)器和智能軟件;這些智能設(shè)備能夠感知周圍的環(huán) 境,并根據(jù)要求作出相應(yīng)的反響,甚至能自

3、我學(xué)習(xí)。8、行為分析法(Behavioural Analytics )行為分析法是指根據(jù)用戶的行為如“怎么做”,“為什么這么做”以及 “做了什么”來(lái)得出結(jié)論,而不是僅僅針對(duì)人物和時(shí)間的一門分析學(xué)科。它著 眼于數(shù)據(jù)中的人性化模式。9、大數(shù)據(jù)科學(xué)家(Big Data Scientist)大數(shù)據(jù)科學(xué)家是指能夠設(shè)計(jì)大數(shù)據(jù)算法使得大數(shù)據(jù)變得有用的人。10、大數(shù)據(jù)創(chuàng)業(yè)公司(Big Data Startup)大數(shù)據(jù)創(chuàng)業(yè)公司是指研發(fā)最新大數(shù)據(jù)技術(shù)的新興公司。11、生物測(cè)定術(shù)(Biometrics)生物測(cè)定術(shù)是指根據(jù)個(gè)人的特征進(jìn)行身份識(shí)別。12、B 字節(jié)(BB: Brontobytes)B字節(jié)約等于1000 Y

4、B (Yottabytes),相當(dāng)于未來(lái)數(shù)字化宇宙的大小。1B 字節(jié)包含了 27個(gè)0!13、商業(yè)智能(Business Intelligence)商業(yè)智能是指一系列理論、方法學(xué)和過(guò)程,使得數(shù)據(jù)更容易被理解。14 分類分析(Classification Analysis)分類分析是指從數(shù)據(jù)中獲得重要相關(guān)性信息的系統(tǒng)化過(guò)程;這類數(shù)據(jù)也被 稱為元數(shù)據(jù)(Meta Data),即是描述數(shù)據(jù)的數(shù)據(jù)。15、云計(jì)算(Cloud Computing)簡(jiǎn)而言之,云計(jì)算是指通過(guò)互聯(lián)網(wǎng)提供智能化計(jì)算資源的服務(wù)模式或商業(yè) 模式。提供資源(資源池上的計(jì)算能力、存儲(chǔ)空間和信息服務(wù))的網(wǎng)絡(luò)被稱為 云(或云端),由云按需提供可

5、動(dòng)態(tài)伸縮(可以無(wú)限擴(kuò)展、隨時(shí)獲取、按需使 用、按使用付費(fèi))的廉價(jià)計(jì)算服務(wù);計(jì)算能力是通過(guò)互聯(lián)網(wǎng)進(jìn)行傳輸?shù)摹?6、聚類分析(Clustering Analysis )聚類分析是指將相似的對(duì)象聚合在一起,每類相似的對(duì)象組合成一個(gè)聚類 (也叫作簇)的過(guò)程。這種分析方法的目的在于分析數(shù)據(jù)之間的差異和相似 性。17 冷數(shù)據(jù)存儲(chǔ)(Cold Data Storage)冷數(shù)據(jù)存儲(chǔ)是指在低功耗服務(wù)器上存儲(chǔ)那些幾乎不被使用的舊數(shù)據(jù);這些 舊數(shù)據(jù)檢索起來(lái)將會(huì)很耗時(shí)。18、比照分析(Comparative Analysis)比照分析是指在非常大的數(shù)據(jù)集中進(jìn)行模式匹配口寸,進(jìn)行一步步的比照和 計(jì)算從而得到分析結(jié)果的過(guò)程。19、復(fù)雜結(jié)構(gòu)數(shù)據(jù)(Complex Structured Data)復(fù)雜結(jié)構(gòu)數(shù)據(jù)是指由兩個(gè)或多個(gè)復(fù)雜而相互關(guān)聯(lián)的局部組成的數(shù)據(jù)。這類 數(shù)據(jù)不能簡(jiǎn)單地用結(jié)構(gòu)化查詢語(yǔ)言或工具(SQL)來(lái)解析。20、計(jì)算機(jī)產(chǎn)生的數(shù)據(jù)(Computer Generated Data)計(jì)算機(jī)產(chǎn)生的數(shù)據(jù)是指如日志文件這類由計(jì)算機(jī)生成的數(shù)據(jù)。21、并發(fā) (Concurrency)并發(fā)是指同時(shí)執(zhí)行多個(gè)任務(wù)或運(yùn)行多個(gè)進(jìn)程。22、相關(guān)性分析(Correlation Analysis )相關(guān)性分析是指一種數(shù)據(jù)分析方法,用于分析變量之間是否存在正相關(guān)或 者負(fù)相關(guān)。23、客戶關(guān)系管理(Cust

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論