傳統(tǒng)分析與大數據分析的對比_第1頁
傳統(tǒng)分析與大數據分析的對比_第2頁
傳統(tǒng)分析與大數據分析的對比_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、傳統(tǒng)數據倉庫分析大數據分析傳統(tǒng)分析對已知的數據范圍中好理解的數據 進行分析。大多數數據倉庫都有一個精致的 提取、轉換和加載(ETL)的流程和數據庫限 制,這意味著加載進數據倉庫的數據是容易 理解的,洗清過的,并符合業(yè)務的元數據。大數據最大的優(yōu)點是針對傳統(tǒng)手段捕捉到 的數據之外的非結構化數據。這意味著不 能保證輸入的數據是完整的,清洗過的和 沒有任何的錯誤。這使它更有挑戰(zhàn)性,但 同時它提供了在數據中獲得更多的洞察力 的范圍。傳統(tǒng)分析是建立在關系數據模型之上的,主 題之間的關系在系統(tǒng)內就已經被創(chuàng)立,而分 析也在此基礎上進行。在典型的世界里,很難在所有的信息間以 一種正式的方式建立關系,因此非結構化

2、 以圖片、視頻、移動產生的信息、無線射 頻識別(RFID)等的形式存在,被考慮進 大數據分析。絕大多數的大數據分析數據 庫基于縱列數據庫之外。傳統(tǒng)分析是定向的批處理,而且我們在獲得 所需的洞察力之前需要每晚等待提取、轉換大數據分析是利用對數據有意義的軟件的 支持針對于數據的頭時分析。和加載(ETL)以及轉換工作的完成。在一個傳統(tǒng)的分析系統(tǒng)中,平行是通過昂貴 的硬件,如大規(guī)模并行處理(MPP系統(tǒng)和/ 或對稱多處理(SMP系統(tǒng)來實現的。當在市場上有大數據分析的應用系統(tǒng)時, 它同樣可以通過通用的硬件和新一代的分 析軟件,像Hadoop或其他分析數據庫來實 現。主要的IT公司對分析軟件和應用系統(tǒng)供應商

3、的購買已經成為一種日常現象。我 們已經看到“大數據分析”這個詞匯被使用在許多企業(yè)的解決方案中。“大數據”是用來表示大量的沒有按照傳統(tǒng)的相關格式存儲在企業(yè)數據庫中的 非結構化數據的總術語。以下是大數據的一般特點。數據存儲量相對于當前企業(yè) TB(TERABYTES字節(jié)的存儲限制,定義在PB(PETA BYTES字節(jié),EXA字節(jié)以及更高的容量順序。通常它被認為是非結構化數據,并不適合企業(yè)已經習慣使用的關系型數據庫之下數據的生成使用的是數據輸入非傳統(tǒng)的手段,像無線射頻識別(RFID),傳感器網絡等。數據對時間敏感,且由數據的收集與相關的時區(qū)組成。在過去,專業(yè)術語“分析”應用于商業(yè)智能(BI)世界來提供

4、工具和智能,通過 對各種各樣可能的信息視角的快速的、一致的、交互式訪問獲得洞察力。與分析的概念非常接近,數據挖掘已經應用于企業(yè)以保持關鍵監(jiān)測和海量信息的 分析。最大的挑戰(zhàn)就是如何通過大量的數據挖掘出所有的隱藏信息。傳統(tǒng)數據倉庫(DW分析相對于大數據分析企業(yè)數據的分析朝著在一段時間內在那種內容中的信息的有意義的洞察,是大數據分析區(qū)別于傳統(tǒng)數據倉庫分析的原因所在。下表總結了一些它們之間的差別。大數據分析用例基于用例,企業(yè)可以理解大數據分析的價值和在大數據分析的幫助下如何解決傳 統(tǒng)的問題。以下是一些用法??蛻魸M意度和保證分析:也許這是基于產品的企業(yè)所擔心的最大的一個領域。在當今時代,沒有一個清晰的方

5、式來衡量產品的問題和與客戶滿意度相關的問題, 除非他們以一個正式的方式出現在一個電子表格中。信息質量方面,它是通過各種外部渠道收集的,而且大多數時候的數據沒有清洗因為數據是非結構化數據,無法關聯(lián)相關的問題,所以長期的解決方案提供給客 戶分類和分組的問題陳述都缺失了,導致企業(yè)不能對問題進行分組從上面的討論中,對客戶滿意度和保證分析使用大數據分析將幫助企業(yè)在急需的 客戶注意力設置中獲得洞察力,并有效地解決他們的問題以及在他們的新產品線 上避免這些問題。競爭對手的市場滲透率分析:在今天高度競爭的經濟環(huán)境下,我們需要通過一種 實時分析對競爭者強大的區(qū)域和他們的痛點進行衡量。 這種信息是可適用于各種 各

6、樣的網站、社交媒體網站和其他公共領域。對這種數據的大數據分析可以向企 業(yè)提供關于他們產品線的優(yōu)勢、劣勢、機遇、威脅等非常需要的信息。醫(yī)療保健/流行病的研究和控制:流行病和像流感這樣的季節(jié)性疾病在人群中以 一定的模式開始,如果沒有及早發(fā)現和控制,它們就會傳播到更大的區(qū)域。這對 發(fā)展中以及發(fā)達的國家都是一個最大的挑戰(zhàn)。 當前絕大部分時間的問題是人們之 間的癥狀各異,而且不同的醫(yī)護人員治療他們的方法也不同。 人群中也沒有一種 常見的癥狀分類。在這種典型的非結構化數據上采用大數據分析將有助于地方 ZF有效地應對疫情的情況。產品功能和用法分析:大多數產品企業(yè),尤其是消費品,不斷在他們的產品線上 增加許多功能,但有可能一些功能不會真正地被顧客所使用,而有些功能則更多 地被使用,對這種通過各種移動設備和其它基于無線射頻識別 (RFID)輸入捕捉 到的數據的有效分析,可以為產品企業(yè)提供有價值的洞察力。未來方向的分析:研究小組分析在各種業(yè)務中的趨勢,而這種信息通過行業(yè)特定 門戶網站甚至常見的博客可以獲得。對這種未來數據的不斷分析將有助于企業(yè)期 待未來,并將這些期待帶入他們的生產線。總結大數據分析為企業(yè)和ZF分析非結構化的數據提供了新的途徑,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論