下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、大數(shù)據(jù)常見術(shù)語解釋(1)胡經(jīng)國大數(shù)據(jù)(Big Data)是指無法在可承受的時間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕 捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察 發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。大數(shù)據(jù)的出現(xiàn)產(chǎn)生了許多新術(shù)語,這些術(shù)語往往比擬難以理解。為此,我 們根據(jù)有關(guān)大數(shù)據(jù)文獻(xiàn)編寫了本文,供大家認(rèn)識大數(shù)據(jù)參考。1、聚合(Aggregation )聚合是指搜索、合并、顯示數(shù)據(jù)的過程。2、算法(Algorithms)算法是指可以完成某種數(shù)據(jù)分析的數(shù)學(xué)公式。3、分析法(Analytics)分析法用于發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在涵義。4、異常檢測(Anomaly Detect
2、ion )異常檢測用于在數(shù)據(jù)集中搜索與預(yù)期模式或行為不匹配的數(shù)據(jù)項。除了 “Anomalies”以外,用來表示“異?!钡挠⑽膯卧~還有以下幾個:outliers, exceptions, surprises, contaminants0它們通??商峁╆P(guān)鍵的可執(zhí)行信息。5、匿名化(Anonymization)匿名化使數(shù)據(jù)匿名,即移除所有與個人隱私相關(guān)的數(shù)據(jù)。6、應(yīng)用(Application)在這里,應(yīng)用是指實現(xiàn)某種特定功能的計算機軟件。7、人工智能(ArtiHcial Intelligence)人工智能是指研發(fā)智能機器和智能軟件;這些智能設(shè)備能夠感知周圍的環(huán) 境,并根據(jù)要求作出相應(yīng)的反響,甚至能自
3、我學(xué)習(xí)。8、行為分析法(Behavioural Analytics )行為分析法是指根據(jù)用戶的行為如“怎么做”,“為什么這么做”以及 “做了什么”來得出結(jié)論,而不是僅僅針對人物和時間的一門分析學(xué)科。它著 眼于數(shù)據(jù)中的人性化模式。9、大數(shù)據(jù)科學(xué)家(Big Data Scientist)大數(shù)據(jù)科學(xué)家是指能夠設(shè)計大數(shù)據(jù)算法使得大數(shù)據(jù)變得有用的人。10、大數(shù)據(jù)創(chuàng)業(yè)公司(Big Data Startup)大數(shù)據(jù)創(chuàng)業(yè)公司是指研發(fā)最新大數(shù)據(jù)技術(shù)的新興公司。11、生物測定術(shù)(Biometrics)生物測定術(shù)是指根據(jù)個人的特征進(jìn)行身份識別。12、B 字節(jié)(BB: Brontobytes)B字節(jié)約等于1000 Y
4、B (Yottabytes),相當(dāng)于未來數(shù)字化宇宙的大小。1B 字節(jié)包含了 27個0!13、商業(yè)智能(Business Intelligence)商業(yè)智能是指一系列理論、方法學(xué)和過程,使得數(shù)據(jù)更容易被理解。14 分類分析(Classification Analysis)分類分析是指從數(shù)據(jù)中獲得重要相關(guān)性信息的系統(tǒng)化過程;這類數(shù)據(jù)也被 稱為元數(shù)據(jù)(Meta Data),即是描述數(shù)據(jù)的數(shù)據(jù)。15、云計算(Cloud Computing)簡而言之,云計算是指通過互聯(lián)網(wǎng)提供智能化計算資源的服務(wù)模式或商業(yè) 模式。提供資源(資源池上的計算能力、存儲空間和信息服務(wù))的網(wǎng)絡(luò)被稱為 云(或云端),由云按需提供可
5、動態(tài)伸縮(可以無限擴展、隨時獲取、按需使 用、按使用付費)的廉價計算服務(wù);計算能力是通過互聯(lián)網(wǎng)進(jìn)行傳輸?shù)摹?6、聚類分析(Clustering Analysis )聚類分析是指將相似的對象聚合在一起,每類相似的對象組合成一個聚類 (也叫作簇)的過程。這種分析方法的目的在于分析數(shù)據(jù)之間的差異和相似 性。17 冷數(shù)據(jù)存儲(Cold Data Storage)冷數(shù)據(jù)存儲是指在低功耗服務(wù)器上存儲那些幾乎不被使用的舊數(shù)據(jù);這些 舊數(shù)據(jù)檢索起來將會很耗時。18、比照分析(Comparative Analysis)比照分析是指在非常大的數(shù)據(jù)集中進(jìn)行模式匹配口寸,進(jìn)行一步步的比照和 計算從而得到分析結(jié)果的過程。19、復(fù)雜結(jié)構(gòu)數(shù)據(jù)(Complex Structured Data)復(fù)雜結(jié)構(gòu)數(shù)據(jù)是指由兩個或多個復(fù)雜而相互關(guān)聯(lián)的局部組成的數(shù)據(jù)。這類 數(shù)據(jù)不能簡單地用結(jié)構(gòu)化查詢語言或工具(SQL)來解析。20、計算機產(chǎn)生的數(shù)據(jù)(Computer Generated Data)計算機產(chǎn)生的數(shù)據(jù)是指如日志文件這類由計算機生成的數(shù)據(jù)。21、并發(fā) (Concurrency)并發(fā)是指同時執(zhí)行多個任務(wù)或運行多個進(jìn)程。22、相關(guān)性分析(Correlation Analysis )相關(guān)性分析是指一種數(shù)據(jù)分析方法,用于分析變量之間是否存在正相關(guān)或 者負(fù)相關(guān)。23、客戶關(guān)系管理(Cust
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 青島版小學(xué)二年級科學(xué)上冊全冊教案
- 2024年二建機電-核心100題
- 陶瓷打標(biāo)機采購合同模板
- 俱樂部入駐學(xué)校合同模板
- 雪容融繪畫課件
- 水杯訂貨合同模板
- 白酒代理授權(quán)合同模板
- 棚子改造商鋪合同模板
- 合伙承包鋼筋合同模板
- 醫(yī)藥進(jìn)口合同模板
- 醫(yī)院信息保密協(xié)議(2024版)
- DL∕T 875-2016 架空輸電線路施工機具基本技術(shù)要求
- 2024年浙江杭州西湖區(qū)投資促進(jìn)局招聘編外合同制工作人員1人歷年(高頻重點提升專題訓(xùn)練)共500題附帶答案詳解
- HYT 0301-2021 海洋觀測數(shù)據(jù)格式(正式版)
- 2024四川省招聘社區(qū)工作者試題完整
- 黑龍江雞西市(2024年)小學(xué)語文部編版小升初真題(瘋狂進(jìn)步)完整試卷(含答案)
- 風(fēng)溫肺熱病護(hù)理查房
- 2024年中考語文復(fù)習(xí)專題21:敘事性散文閱讀(六)含答案
- 2023-2024學(xué)年山東省泰安市新泰市八年級(上)期中數(shù)學(xué)試卷(五四學(xué)制)
- 兒科重點??茀R報
- 工藝流程專題復(fù)習(xí)市公開課一等獎省賽課微課金獎?wù)n件
評論
0/150
提交評論