協(xié)同OA辦公系統(tǒng)-數(shù)據(jù)倉庫_第1頁
協(xié)同OA辦公系統(tǒng)-數(shù)據(jù)倉庫_第2頁
協(xié)同OA辦公系統(tǒng)-數(shù)據(jù)倉庫_第3頁
協(xié)同OA辦公系統(tǒng)-數(shù)據(jù)倉庫_第4頁
協(xié)同OA辦公系統(tǒng)-數(shù)據(jù)倉庫_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

BI與數(shù)據(jù)倉庫理論泛普軟件議程:BI數(shù)據(jù)倉庫商業(yè)數(shù)據(jù)正在以幾何級速度在增長復雜的關系型數(shù)據(jù)庫需要IT的專業(yè)知識面臨激烈的競爭環(huán)境每周需要做出關鍵決策的次數(shù)是五年前的三倍信息用戶需要更多更復雜更頻繁的報表管理層做出明智決策的可用時間越來越緊迫信息用戶與業(yè)務數(shù)據(jù)的鴻溝“我們有很多數(shù)據(jù)但還是得不到足夠的信息”標準報表企業(yè)經(jīng)營數(shù)據(jù)信息人員決策過程現(xiàn)狀系統(tǒng)很少是集成的面向主題的數(shù)據(jù)整合銷售訂單

的信息生產(chǎn)的信息客戶服務的信息財務部的信息企業(yè)管理駕駛倉企業(yè)組織想要什么?在任何時間、任何地方能向任何用戶提供有價值的信息基礎設施查詢、分析、報表多維數(shù)據(jù)集多維數(shù)據(jù)集數(shù)據(jù)市場數(shù)據(jù)倉庫數(shù)據(jù)市場FileCRMERP閉環(huán)的知識鏈源系統(tǒng)信息采集和存儲信息整理和加工知識行動結(jié)果商業(yè)智能的歷史回顧直接聯(lián)接數(shù)據(jù)來源系統(tǒng)HR報表系統(tǒng)銷售報表系統(tǒng)客戶服務報表系統(tǒng)生產(chǎn)制作報表系統(tǒng)性能問題歷史回顧OLTP系統(tǒng)的數(shù)據(jù)抽取和復制復制的數(shù)據(jù)集HR報表系統(tǒng)銷售報表系統(tǒng)客戶服務報表系統(tǒng)生產(chǎn)制作報表系統(tǒng)數(shù)據(jù)的不一致性,多個版本的報表數(shù)據(jù)來源系統(tǒng)歷史回顧用戶自建的部門系統(tǒng)復制的數(shù)據(jù)集蜘蛛網(wǎng)問題數(shù)據(jù)來源系統(tǒng)歷史回顧——理論界數(shù)據(jù)庫、模型庫和方法庫三庫的概念和方法:數(shù)據(jù)庫用來存儲企業(yè)的數(shù)據(jù)信息;模型庫用來存儲輔助決策所需的各種模型;方法庫則用來存放各種運算方法。

大多數(shù)系統(tǒng)都只停留在演示階段,實用性、靈活性不夠。決策支持系統(tǒng)的開發(fā)常常處于方案設計和系統(tǒng)規(guī)劃階段,缺乏豐富的數(shù)據(jù)資源缺乏分析工具缺乏靈活性

操作型數(shù)據(jù)數(shù)據(jù)倉庫 面向應用,事務驅(qū)動面向分析,分析驅(qū)動支持許多并發(fā)用戶動態(tài)地不可更新,周期性刷新添加和修改數(shù)據(jù)細節(jié)性數(shù)據(jù)綜合性和提煉性數(shù)據(jù)當前值數(shù)據(jù)歷史數(shù)據(jù) 一次處理的數(shù)據(jù)量小 一次處理的數(shù)據(jù)量大快速響應相對較低

操作型數(shù)據(jù)和分析型數(shù)據(jù)事實表:包含了基本商業(yè)事務的所有詳細信息,由事實數(shù)據(jù)元素和維數(shù)據(jù)元素組成.事實表是多維模型的核心.事實數(shù)據(jù)是決策分析的數(shù)據(jù)基礎.維表:存放維數(shù)據(jù).描述性信息,觀察事物的角度1.維:是人們觀察數(shù)據(jù)的特定角度,是考慮問題時的一類屬性,屬性集合構(gòu)成一個維(時間維、地理維等)。2.維的層次:人們觀察數(shù)據(jù)的某個特定角度(即某個維)還可以存在細節(jié)程度不同的各個描述方面(時間維:日期、月份、季度、年)。3.維的成員:維的一個取值。是數(shù)據(jù)項在某維中位置的描述。(“某年某月某日”是在時間維上位置的描述)數(shù)據(jù)倉庫的模型設計OA(/)同一性——夢想而已整體數(shù)據(jù)倉庫OA

系統(tǒng)子集集市/分析型應用像許多以前的數(shù)據(jù)倉庫概念一樣,說起來不錯,做起來卻很不現(xiàn)實異構(gòu)性——才是現(xiàn)實客戶定制市場數(shù)據(jù)倉庫ThinkOne財務數(shù)據(jù)倉庫打包的I2供應鏈非結(jié)構(gòu)化的數(shù)據(jù)集市子集數(shù)據(jù)集市ThinkOne財務應用i2供應鏈CRM遺留系統(tǒng)e-Commerce?規(guī)劃解決方案支持數(shù)據(jù)倉庫管理(處理流程與操作)物理數(shù)據(jù)庫設計數(shù)據(jù)轉(zhuǎn)換應用開發(fā)數(shù)據(jù)挖掘服務設計與實現(xiàn)支持與增強解決方案體系結(jié)構(gòu)設計元數(shù)據(jù)管理數(shù)據(jù)倉庫評估應用增強邏輯數(shù)據(jù)模型回顧物理數(shù)據(jù)庫回顧性能調(diào)整容量規(guī)劃解決方案集成定制解決方案規(guī)劃詳細數(shù)據(jù)分析解決方案準備就緒解決方案實施建議現(xiàn)成解決方案規(guī)劃數(shù)據(jù)倉庫策略開發(fā)業(yè)務探索業(yè)務探索解決方案定義邏輯數(shù)據(jù)模型設計修改邏輯數(shù)據(jù)模型驗證解決方案數(shù)據(jù)倉庫的循環(huán)過程數(shù)據(jù)倉庫的實施查詢、分析、報表多維數(shù)據(jù)集多維數(shù)據(jù)集數(shù)據(jù)市場數(shù)據(jù)倉庫數(shù)據(jù)市場FileCRMERP閉環(huán)的知識鏈源系統(tǒng)信息采集和存儲信息整理和加工知識行動結(jié)果商業(yè)智能來源系統(tǒng)數(shù)據(jù)轉(zhuǎn)化引擎緩存來源主機或C/S系統(tǒng)轉(zhuǎn)化引擎C/S系統(tǒng)數(shù)據(jù)倉庫C/S系統(tǒng)企業(yè)元數(shù)據(jù)數(shù)據(jù)集市C/S系統(tǒng)數(shù)據(jù)集市數(shù)據(jù)集市C/S系統(tǒng)數(shù)據(jù)集市掃描元數(shù)據(jù)要求資源規(guī)劃交付用戶流程數(shù)據(jù)倉庫監(jiān)控任務調(diào)度數(shù)據(jù)抽取數(shù)據(jù)清洗數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)加載索引建立數(shù)據(jù)聚合元數(shù)據(jù)導入元數(shù)據(jù)維護

數(shù)據(jù)的提取和加載

用戶從數(shù)據(jù)源抽取出所需的數(shù)據(jù),經(jīng)過數(shù)據(jù)清洗、轉(zhuǎn)換,最終按照預先定義好的數(shù)據(jù)倉庫模型,將數(shù)據(jù)加載到數(shù)據(jù)倉庫中去。校驗數(shù)據(jù):檢查數(shù)據(jù)的完整性過濾數(shù)據(jù):過濾掉不必要的信息綜合數(shù)據(jù):將分散在多個數(shù)據(jù)來源的信息結(jié)合起來凈化數(shù)據(jù):使數(shù)據(jù)達到一致性

數(shù)據(jù)的提取和加載元數(shù)據(jù)是描述數(shù)據(jù)倉庫中數(shù)據(jù)的數(shù)據(jù)

Metadata的組成:表,數(shù)據(jù)元素,主鍵數(shù)據(jù)元素的物理特征各種定義數(shù)據(jù)抽取歷史數(shù)據(jù)匯總算法數(shù)據(jù)屬主關系及存取模式數(shù)據(jù)生命期以及淘汰規(guī)則數(shù)據(jù)安全性數(shù)據(jù)的度量單位設計映射抽取清洗轉(zhuǎn)換加載建立索引聚合數(shù)據(jù)復制數(shù)據(jù)集分布數(shù)據(jù)訪問&分析資源調(diào)度&配置分發(fā)元數(shù)據(jù)管理統(tǒng)一系統(tǒng)管理和用戶管理查詢、分析、報表多維數(shù)據(jù)集多維數(shù)據(jù)集數(shù)據(jù)市場數(shù)據(jù)倉庫數(shù)據(jù)市場FileCRMERP閉環(huán)的知識鏈源系統(tǒng)信息采集和存儲信息整理和加工知識行動結(jié)果商業(yè)智能多維數(shù)據(jù)集將數(shù)據(jù)倉庫數(shù)據(jù)以多維結(jié)構(gòu)表示,利用多維數(shù)據(jù)模型和數(shù)據(jù)聚合技術組織和匯總數(shù)據(jù)。以提供快速數(shù)據(jù)檢索和計算引擎。聚合:預先計算好的數(shù)據(jù)匯總,由于在問題提出之前已經(jīng)準備了答案,聚合可以改進查詢響應時間目的:對復雜的查詢分析提供快速回應時間地點產(chǎn)品山地車山地車地點時間$分析:切片、切塊時間地點全球美國歐洲紐約洛杉磯倫敦巴黎產(chǎn)品的分析:鉆取OA軟件/數(shù)據(jù)分析的四種模型與相應工具數(shù)據(jù)分析的四種模型:絕對模型屬于靜態(tài)數(shù)據(jù)分析.它通過比較歷史數(shù)據(jù)和行為來描述過去發(fā)生的事情.解釋模型屬于靜態(tài)數(shù)據(jù)分析.它通過層層細化,找出事實發(fā)生的原因.思考模型屬于動態(tài)數(shù)據(jù)分析.它通過引入一定參數(shù)后,預測將來會發(fā)生什么.公式模型最高級動態(tài)數(shù)據(jù)分析.它知道需要引入哪些參數(shù)以及所產(chǎn)生的結(jié)果.數(shù)據(jù)分析的工具有三種類型:查詢工具:指對分析結(jié)果的查詢,而不是記錄級的查詢.驗證型工具:從數(shù)據(jù)倉庫中發(fā)現(xiàn)事實.實現(xiàn)數(shù)據(jù)分析的前三種模型.挖掘型工具:從大量數(shù)據(jù)中發(fā)現(xiàn)模式.實現(xiàn)第四種分析模型.數(shù)據(jù)挖掘(

發(fā)現(xiàn)數(shù)據(jù)中存在的關系和規(guī)則,根據(jù)現(xiàn)有的數(shù)據(jù)預測未來的發(fā)展趨勢

廣州OA系統(tǒng)/數(shù)據(jù)挖掘-分析方法與分析過程數(shù)據(jù)挖掘有四種分析方法:關聯(lián)分析:挖掘出隱藏在數(shù)據(jù)間的相互關系.序列模式分析:分析數(shù)據(jù)間的前后(因果)關系.分類分析:先定義一組標記,再賦予每條記錄一個標記,從而實現(xiàn)對記錄的分類分析.典型的分類分析模型有:線性回歸模型,策略樹模型,基于規(guī)則的模型,神經(jīng)物理模型,聚類分析:是分類分析的逆過程.它根據(jù)一定的規(guī)則,對記錄進行合理的分類.通過分類分析可以發(fā)現(xiàn)分類規(guī)則

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論