大數(shù)據(jù)常見(jiàn)術(shù)語(yǔ)解釋(3)_第1頁(yè)
大數(shù)據(jù)常見(jiàn)術(shù)語(yǔ)解釋(3)_第2頁(yè)
大數(shù)據(jù)常見(jiàn)術(shù)語(yǔ)解釋(3)_第3頁(yè)
大數(shù)據(jù)常見(jiàn)術(shù)語(yǔ)解釋(3)_第4頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、大數(shù)據(jù)常見(jiàn)術(shù)語(yǔ)解釋(3)胡經(jīng)國(guó)49、游戲化(Gamification)游戲化是指在其他非游戲領(lǐng)域中運(yùn)用游戲的思維和機(jī)制。這種方法可以以 一種十分友好的方式進(jìn)行數(shù)據(jù)的創(chuàng)立和偵測(cè),非常有效。50、圖形數(shù)據(jù)庫(kù)(Graph Databases )圖形數(shù)據(jù)庫(kù)是指運(yùn)用圖形結(jié)構(gòu)(例如,一組有限的有序?qū)?,或者某種實(shí) 體)來(lái)存儲(chǔ)數(shù)據(jù)。這種圖形存儲(chǔ)結(jié)構(gòu)包括邊緣、屬性和節(jié)點(diǎn)。它提供了相鄰節(jié) 點(diǎn)間的自由索引功能。也就是說(shuō),數(shù)據(jù)庫(kù)中每個(gè)元素間都與其他相鄰元素直接 關(guān)聯(lián)。51、網(wǎng)格計(jì)算(Grid Computing )網(wǎng)格計(jì)算是指將許多分布在不同地點(diǎn)的計(jì)算機(jī)連接在一起,用以處理某個(gè) 特定問(wèn)題;通常是通過(guò)云將計(jì)算機(jī)相連在一

2、起的。52、HadoopHadoop是一個(gè)開(kāi)源的分布式系統(tǒng)基礎(chǔ)框架,可用于開(kāi)發(fā)分布式程序,進(jìn)行 大數(shù)據(jù)的運(yùn)算與存儲(chǔ)。53、Hadoop 數(shù)據(jù)庫(kù)(HBase)Hadoop數(shù)據(jù)庫(kù)(HBase)是一個(gè)開(kāi)源的、非關(guān)系型、分布式數(shù)據(jù)庫(kù),與 Hadoop框架共同使用。54、HDFSHDFS是Hadoop 分布式文件系統(tǒng)(Hadoop Distributed File System);是一 個(gè)被設(shè)計(jì)成適合運(yùn)行在通用硬件(Commodity Hardware)上的分布式文件系 統(tǒng)。55、高性能計(jì)算(HPC, High-Performance-Computing)高性能計(jì)算是指使用超級(jí)計(jì)算機(jī)來(lái)解決極其復(fù)雜的計(jì)算

3、問(wèn)題。56、內(nèi)存數(shù)據(jù)庫(kù)(IMDB, In-Memory Data Base)內(nèi)存數(shù)據(jù)庫(kù)是指一種數(shù)據(jù)庫(kù)管理系統(tǒng);與普通數(shù)據(jù)庫(kù)管理系統(tǒng)不同之處在 于,它使用主存(內(nèi)存)來(lái)存儲(chǔ)數(shù)據(jù),而不是使用硬盤(pán)來(lái)存儲(chǔ)數(shù)據(jù)。其特點(diǎn)在 于能高速地進(jìn)行數(shù)據(jù)的處理和存取。57、物聯(lián)網(wǎng)(Internet of Things)物聯(lián)網(wǎng)是指在普通的設(shè)備中安裝上傳感器,使這些設(shè)備能夠在任何時(shí)間任 何地點(diǎn)與網(wǎng)絡(luò)相連。物聯(lián)網(wǎng)(Internet of Things, IoT)是新一代信息技術(shù)的重要組成局部,也 是信息化時(shí)代的重要開(kāi)展階段。顧名思義,物聯(lián)網(wǎng)是指物物相連的互聯(lián)網(wǎng)。這 有兩層意思:其一,物聯(lián)網(wǎng)的核心和基礎(chǔ)仍然是互聯(lián)網(wǎng),是在互聯(lián)

4、網(wǎng)基礎(chǔ)上延 伸和擴(kuò)展的網(wǎng)絡(luò);其二,其用戶端延伸和擴(kuò)展到了任何物品與物品之間進(jìn)行信 息交換和通信,也就是物物相息。58、法律上的數(shù)據(jù)一致性(Juridical Data Compliance)法律上的數(shù)據(jù)一致性是指當(dāng)你使用的云計(jì)算解決方案將你的數(shù)據(jù)存儲(chǔ)于不 同的國(guó)家或不同的大陸時(shí),就會(huì)與這個(gè)概念扯上關(guān)系。你需要留意這些存儲(chǔ)在 不同國(guó)家或不同的大陸的數(shù)據(jù)是否符合當(dāng)?shù)氐姆伞?9、鍵值數(shù)據(jù)庫(kù)(KeyValue Databases)鍵值數(shù)據(jù)庫(kù)是指數(shù)據(jù)的存儲(chǔ)方式是使用一個(gè)特定的鍵指向一個(gè)特定的數(shù)據(jù) 記錄。這種方式使得數(shù)據(jù)的查找更加方便快捷。鍵值數(shù)據(jù)庫(kù)中所存放的數(shù)據(jù)通 常為編程語(yǔ)言中基本數(shù)據(jù)類型的數(shù)據(jù)。6

5、0、延遲(Latency)延遲是指系統(tǒng)時(shí)間的延遲。61、遺留系統(tǒng)(Legacy System)遺留系統(tǒng)是指一種舊的應(yīng)用程序,或是舊的技術(shù),或是舊的計(jì)算系統(tǒng),現(xiàn) 在已經(jīng)不再支持了。62 負(fù)載均衡(Load Balancing)負(fù)載均衡是指將工作量均衡地分配到多臺(tái)電腦或服務(wù)器上,以獲得最優(yōu)結(jié) 果和最大的系統(tǒng)利用率。63 位置信息(Location Data)位置信息是指GPS信息,即地理位置信息。64、日志文件(Log File)日志文件是指由計(jì)算機(jī)系統(tǒng)自動(dòng)生成的文件,它記錄系統(tǒng)的運(yùn)行過(guò)程。65、M2M 數(shù)據(jù)(Machine 2 Machine Data)M2M數(shù)據(jù)是指兩臺(tái)或多臺(tái)機(jī)器之間交流與傳輸

6、的內(nèi)容。66、機(jī)器數(shù)據(jù)(Machine Data )機(jī)器數(shù)據(jù)是指由傳感器或算法在機(jī)器上產(chǎn)生的數(shù)據(jù)。67 機(jī)器學(xué)習(xí)(Machine Learning )機(jī)器學(xué)習(xí)是人工智能的一局部,是指機(jī)器能夠從它們所完成的任務(wù)中進(jìn)行 自我學(xué)習(xí),通過(guò)長(zhǎng)期的累積實(shí)現(xiàn)自我改進(jìn)。68 MapReduceMapReduce是一種處理大規(guī)模數(shù)據(jù)的軟件框架(M叩:映射;Reduce:歸 納)。69、大規(guī)模并行處理(MPP, Massively Parallel Processing)大規(guī)模并行處理是指同時(shí)使用多個(gè)處理器(或多臺(tái)計(jì)算機(jī))處理同一個(gè)計(jì) 算任務(wù)。70、元數(shù)據(jù)(Metadata)元數(shù)據(jù)是指描述數(shù)據(jù)的數(shù)據(jù),即描述數(shù)據(jù)的

7、數(shù)據(jù)屬性(數(shù)據(jù)是什么)的信 ,目、O71、MongoDBMongoDB是一種開(kāi)源的非關(guān)系型數(shù)據(jù)庫(kù)(NoSQL DataBase)。72、多維數(shù)據(jù)庫(kù)(Multi-Dimensional Databases )多維數(shù)據(jù)庫(kù)是指用于優(yōu)化數(shù)據(jù)聯(lián)機(jī)分析處理(OLAP)程序,優(yōu)化數(shù)據(jù)倉(cāng) 庫(kù)的一種數(shù)據(jù)庫(kù)。73、多值數(shù)據(jù)庫(kù)(MultiValue Databases)多值數(shù)據(jù)庫(kù)是指一種非關(guān)系型數(shù)據(jù)庫(kù)(NoSQL), 一種能處理3個(gè)維度數(shù) 據(jù)的特殊的多維數(shù)據(jù)庫(kù)。它主要針對(duì)非常長(zhǎng)的字符串,能夠完美地處理HTML 和XML中的字符串。74、自然語(yǔ)言處理(Natural Language Processing )自然語(yǔ)言

8、處理是指計(jì)算機(jī)科學(xué)的一個(gè)分支領(lǐng)域。它研究如何實(shí)現(xiàn)計(jì)算機(jī)與 人類語(yǔ)言之間的交互。75、網(wǎng)絡(luò)分析(Network Analysis)網(wǎng)絡(luò)分析是指分析網(wǎng)絡(luò)或圖論中節(jié)點(diǎn)之間的關(guān)系,即分析網(wǎng)絡(luò)中節(jié)點(diǎn)之間 的連接和強(qiáng)度關(guān)系。76、NewSQLNewSQL是一個(gè)優(yōu)雅的、定義良好的數(shù)據(jù)庫(kù)系統(tǒng),比SQL更容易學(xué)習(xí)和使 用,是一個(gè)比NoSQL更晚提出的新型數(shù)據(jù)庫(kù)。77、NoSQL顧名思義,NoSQL就是“不使用SQL”的數(shù)據(jù)庫(kù),即通常所說(shuō)的非關(guān)系型 數(shù)據(jù)庫(kù)。這類數(shù)據(jù)庫(kù)泛指?jìng)鹘y(tǒng)關(guān)系型數(shù)據(jù)庫(kù)以外的其他類型的數(shù)據(jù)庫(kù)。這類數(shù) 據(jù)庫(kù)有更強(qiáng)的一致性,能處理超大規(guī)模和高并發(fā)的數(shù)據(jù)。78、對(duì)象數(shù)據(jù)庫(kù)(Object Databas

9、es)對(duì)象數(shù)據(jù)庫(kù)又稱為面象對(duì)象數(shù)據(jù)庫(kù),以對(duì)象的形式存儲(chǔ)數(shù)據(jù),用于面向?qū)?象編程。它不同于關(guān)系型數(shù)據(jù)庫(kù)和圖形數(shù)據(jù)庫(kù)。大局部對(duì)象數(shù)據(jù)庫(kù)都提供一種 查詢語(yǔ)言,允許使用聲明式編程(Declarative Programming)訪問(wèn)對(duì)象。79 基于對(duì)象圖像分析(Object-based Image Analysis)數(shù)字圖像分析方法是對(duì)每一個(gè)像素的數(shù)據(jù)進(jìn)行分析;而基于對(duì)象的圖像分 析方法那么只分析相關(guān)像素的數(shù)據(jù)。這些相關(guān)像素被稱為對(duì)象或圖像對(duì)象。80、操作型數(shù)據(jù)庫(kù)(Operational Databases )操作型數(shù)據(jù)庫(kù)可以完成一個(gè)組織機(jī)構(gòu)的常規(guī)操作;對(duì)商業(yè)運(yùn)營(yíng)非常重要。 一般使用在線事務(wù)處理,允許

10、用戶訪問(wèn)、收集、檢索公司內(nèi)部的具體信息。81 優(yōu)化分析(Optimization Analysis )優(yōu)化分析是指在產(chǎn)品設(shè)計(jì)周期,依靠算法來(lái)實(shí)現(xiàn)的優(yōu)化過(guò)程。在這一過(guò)程 中,公司可以設(shè)計(jì)各種各樣的產(chǎn)品,并測(cè)試這些產(chǎn)品是否滿足預(yù)設(shè)值。82、本體論(Ontology)本體論表示知識(shí)本體,是一種用于定義一個(gè)領(lǐng)域中的概念集及概念之間的 關(guān)系的哲學(xué)思想。(在這里,數(shù)據(jù)被提高到哲學(xué)的高度,被賦予了世界本體的 意義,成為一個(gè)獨(dú)立的客觀數(shù)據(jù)世界。)83、異常值檢測(cè)(Outlier Detection )異常值是指嚴(yán)重偏離一個(gè)數(shù)據(jù)集或一個(gè)數(shù)據(jù)組合總平均值的對(duì)象。該對(duì)象 與數(shù)據(jù)集中的其它對(duì)象相去甚遠(yuǎn)(相差很大)。因

11、此,異常值的出現(xiàn)意味著系 統(tǒng)發(fā)生問(wèn)題,需要對(duì)此另加分析。84、模式識(shí)別(Pattern Recognition )模式識(shí)別是指通過(guò)算法來(lái)識(shí)別數(shù)據(jù)中的模式,并對(duì)同一數(shù)據(jù)源中的新數(shù)據(jù) 作出預(yù)測(cè)。85、P 字節(jié)(PB, PetaBytes)P字節(jié)(PB)大約等于1000 TB (TeraBytes),大約等于100萬(wàn)GB (GigaBytes) o例如,歐洲核子研究中心(CERN)的大型強(qiáng)子對(duì)撞機(jī)每秒鐘 所產(chǎn)生的粒子個(gè)數(shù)就約為IPBo86 平臺(tái)即服務(wù)(PaaS, Platform-as-a-Service)平臺(tái)即服務(wù)是指云計(jì)算解決方案提供所有必需的基礎(chǔ)平臺(tái)的一-種服務(wù)。87 預(yù)測(cè)分析(Predictive Analysis)預(yù)測(cè)分析是指大數(shù)據(jù)分析方法中最有價(jià)值的一種分析方法。這種方法有助 于預(yù)測(cè)個(gè)人未來(lái)(近期)的行為。例如,某人很可能會(huì)買(mǎi)某些商品,可能會(huì)訪 問(wèn)某些網(wǎng)站,做某些事情或者產(chǎn)生某種行為。它通過(guò)使用各種不同的數(shù)據(jù)集, 例如歷史數(shù)據(jù),事務(wù)數(shù)據(jù),社交數(shù)據(jù),或者客戶的個(gè)人信息數(shù)據(jù),來(lái)識(shí)別

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論