商務智能的考試重點_第1頁
商務智能的考試重點_第2頁
商務智能的考試重點_第3頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1?商務智能的基本概念(簡答)對工業(yè)界來說,商務智能是一類技術或工具,利用他們可以對大量的數(shù)據(jù)進行收集、管理、分析和挖掘,以改善業(yè)務決策水平,增強金業(yè)競爭力。對學術界來說,商務智能是一套理論、方法、和應用,通過他們可以快速的發(fā)現(xiàn)海量數(shù)據(jù)中隱含的各種知識, 冇效的解決企業(yè)而臨的管理和決策問題,支持企業(yè)的戰(zhàn)略實施2.商務智能系統(tǒng)的開發(fā)過程規(guī)劃識別業(yè)務需求識別信i息需求時間成本規(guī)劃設計OLAP設計數(shù)據(jù)集市數(shù)據(jù)挖掘設計1 1V 1 /需求分析1詳細的需求分析技術:選擇1在線 分析 處理數(shù)據(jù)挖掘算法實現(xiàn)構建數(shù)據(jù)倉昨構建數(shù)據(jù)集市聊強 查詢 報表3?在線分析處理和在線事務處理 (簡答)在線事務處理在線分析處

2、理用戶普通職員管理人員和分析人員功能日常業(yè)務處理決策支持數(shù)據(jù)庫設計高度規(guī)范化非規(guī)范化數(shù)據(jù)處理在線插入、刪除、修改批量加載和刪除使用方式重復操作即時的、圖表形式的交互查詢執(zhí)仃單兀短的事務處理復雜的查詢數(shù)據(jù)當前的、細節(jié)的數(shù)據(jù)丿力史的匯總數(shù)據(jù)性能指標事務吞吐量查詢響應時間事務特性并發(fā)控制和事務恢復很重要并發(fā)控制和事務恢復不匣要4.決策支持系統(tǒng)的系統(tǒng)架構(1) 模型庫管理系統(tǒng)主要用于管理決策所需的各種模型,例如財務、統(tǒng)計、預測以及管理等方面的定量模型,利用這些模型可以進行問題分析。用戶利用該系統(tǒng)可以方便快捷的構建和操縱模型。系統(tǒng)提供對模型的分類、刪除、復制等維護功能,可以將已冇模型進行合并,以及對模型

3、的執(zhí)行情況進行跟蹤、分析和評價,如對變量進行嫩感度分析等。(2) 知識庫管理系統(tǒng)提供知識的表示、存儲和管理功能,用于支持定量模型無法解決的決策過程,幫助用戶建立、應用和管理描述性、過程性和推理性知識。(3) 對話產生與管理系統(tǒng)主要負責用戶與系統(tǒng) Z間的交互。接受用戶的輸入,能 夠與數(shù)據(jù)庫管理系統(tǒng)、模型庫管理系統(tǒng)和知識庫管理系統(tǒng)進行交互,以各種形式將結果返回給用戶,提供圖形用戶界面以及可視化功能。川戶對話產牛與管理系統(tǒng)知識庫管理系統(tǒng)知識庫數(shù)據(jù)咋倉理系統(tǒng)模型丿乍管理泵統(tǒng)模型庫數(shù)據(jù)庫6?回歸:回歸方法中最常用的是線性回歸,包括一元線性回歸、多元線性回歸以及非線性回歸。線性回歸方法不僅用于預測,也口J

4、 以用作解釋模型,以探尋變量 之間的關系。另外述有回歸樹和模型樹等模型。7.回歸系數(shù)的顯著性檢驗:回歸系數(shù)的顯著性檢驗可以采用 t 檢驗。對于每個回歸系數(shù) b (41, 2, ? ? ? ?)k , 顯著 性檢驗的兩個假設分別為 Ho: bK和h biHO。若6=0說明自變量&的變 化對因變量 沒冇線性影響,即變量冶對因變量的影響不顯著。為每個回歸系數(shù)b.構造變量S如式所示:式中 5 是對矩陣 C 二 XXF 的對角線上的第 i 個值。給定顯者性水平a,查自由度為(n-k-1)的t分布表,得到ta (n-k-1),若tbi>t ?(n-k-1),則拒絕假設H°,即回歸系

5、數(shù)b顯著。在通過以上顯著性檢驗之后,給定一個因變量位置的樣本(xti,Q將其帶入式5二b°bN+SXk屮的各個自變量取值屮就可以得到因變量的一個預測值。?回歸樹和模型樹:都是通過自頂向下分而治之的思想,將訓練集不斷分割成子 據(jù)集來不斷擴展樹枝,當滿足 - 定條件吋停止樹的生長9?聚類效果衡量方法:(概念)凝聚度:是用丁 ?衡量簇內各對象緊密程度的常用度量 分離度:用于衡量簇間齊對象的相異程度。輪廓系數(shù):也是將凝聚度和分離度相結合的一種度量10.4 類主要的數(shù)據(jù)預處理任務:(簡答)1 ) 數(shù)據(jù)規(guī)范化2) 數(shù)據(jù)離散化3) 數(shù)據(jù)清洗4) 特征提取與特征選擇噪音數(shù)據(jù)的處理以及數(shù)據(jù)不一致的 識

6、別11. 數(shù)據(jù)清洗的主要任務是數(shù)據(jù)缺失的處理、 和處理。以將填補數(shù)據(jù)缺失方法:將屬于同一類的對象的該屬性值的均值賦予此缺失值;還可 其轉換為分類問題或數(shù)值預測問題。他非噪音的處理方法可以分為兩類:一類是識別出噪音,將其去除;另一類是利用其 噪音數(shù)據(jù)降低噪音的影響,起到平滑的作用。12?多維數(shù)據(jù)模型 (名):又稱維度數(shù)據(jù)模型, 由維度表和事實表兩種類型的表構 成。 為了解企業(yè)內業(yè)務過程的績效, 通??梢酝ㄟ^多種度量指標加以衡量。 對于 每個度量, 可以從多種視角和方位進行分析,這就是不同維度。度量通常是定量 屬性(還有數(shù)值 型屬性),存放于事實表中;維度屬性綜合起來限定了度量的取 值粒度。13?

7、在線分析處理 OLAP 的定義:在線分析處理是一類軟件技術, 利用它可以使分 析 人員、管理人員以及主管從多種信息視角通過快速、一致和交互地訪問數(shù)據(jù) , 達到對 數(shù)據(jù)的洞察。這些視角是從原始數(shù)據(jù)轉換過來的,反映了金業(yè)的真實維度 , 易于被用 戶理解。14.積分卡和儀表盤(名詞解釋):是常用的兩種展示企業(yè)關鍵業(yè)務業(yè)務指標和度 量 的可視化工具。積分卡用于顯示企業(yè)的關鍵性能指標 (KPT),儀表盤綜合各種類型 的圖形和報表,提供豐富的可視化界面,提供一個金業(yè)在某個時間的業(yè)務狀態(tài)。15?云計算的定義:是一種基于互聯(lián)網的計算方式,通過這種方式,共享的軟碩 件資源和 信息可以按需捉供給計算機和其他設備1

8、?商務智能的系統(tǒng)構成 ( 填空/ 簡答/ 論述 )(1) 數(shù)據(jù)源 商務智能的根本是數(shù)據(jù)。數(shù)據(jù)的來源主要包括企業(yè)內部的操作型系統(tǒng),即支持各 業(yè) 務部分日常 ' 運營的信息系統(tǒng),以及企業(yè)外部的信息。(2) 數(shù)據(jù)倉庫各種數(shù)據(jù)源的數(shù)據(jù)經過抽取、傳換 Z 后需要被放到一個供分析使用的環(huán)境,以便對數(shù)據(jù)進行管理,這就是數(shù)據(jù)倉庫。 數(shù)據(jù)倉庫可以將分析數(shù)據(jù)與實現(xiàn)業(yè)務處理的操作型數(shù)據(jù)隔離,一方面不影響業(yè)務處理系統(tǒng)的性能,另一方面為數(shù)據(jù)的分析提供了一個綜合的、集成的、統(tǒng)一的數(shù)據(jù)管理平臺。(3) 在線分析處理 數(shù)據(jù)倉庫中的數(shù)據(jù)可以通過不同的方法進行分析。在線分析處理是其中的方式Z 一。利用該法,業(yè)務性能度量可

9、以通過多個維度、多個層次進行多種聚集匯總, 通過交 互的方式可以發(fā)現(xiàn)業(yè)務運行的關鍵性能指標的異常之處。(4) 數(shù)據(jù)探查數(shù)據(jù)探杳包括靈活的杳詢、即時報表以及統(tǒng)計方法等。該類方法屬于被動分析方 法, 因為這些分析方法需要基于分析者對于問題的假設。(5) 數(shù)據(jù)挖掘數(shù)據(jù)挖掘是從大量數(shù)據(jù)中自動發(fā)現(xiàn)隱含的信息和知識的過程, 屬于主動分析方法 , 不 需耍分析者的先驗假設,可以發(fā)現(xiàn)未知的知識。數(shù)據(jù)挖掘可以作用于結構化數(shù)據(jù),也可以對文木數(shù)據(jù)以及多媒體數(shù)據(jù)進行分析。常用分析方法包括分類、聚類、關聯(lián)分析、數(shù)值預測、序列分析、社會網絡分析等。(6) 業(yè)務績效管理業(yè)務績效管理,乂稱為企業(yè)績效管理,是對企業(yè)的關鍵性能指

10、標( 如銷售、成本、 利潤以及可盈利性等 ) 進行度量、監(jiān)控和比較的方法和工具。2?數(shù)據(jù)倉庫的體系結構:(論述)數(shù)據(jù)源部分:支持企業(yè)口常業(yè)務的操作性系統(tǒng)中的數(shù)據(jù)以及已經存檔的數(shù)據(jù) 都 是數(shù)據(jù)倉庫的數(shù)據(jù)來源。 各種數(shù)據(jù)源屮的數(shù)據(jù)通過一定的處理才能儲存到 數(shù)據(jù)倉庫 中,處理一般利用 ETL (抽取轉換加載)工具完成。抽取過程:從不同的數(shù)據(jù)源把需要的數(shù)據(jù)讀取出來就是抽取過程,不同的數(shù) 據(jù) 源的數(shù)據(jù)結構可能不同,因此,需要針對不同的數(shù)據(jù)源采用不同的抽取工具, 口 J 直接使用商品化的工具來抽取常見數(shù)據(jù)結構的數(shù)據(jù)。轉換過程:主要涉及數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)匯總等功能。加載過程:分為兩種情況:一種是數(shù)據(jù)倉庫建成之初,需要將各種數(shù)據(jù)源中 的 數(shù)據(jù)大批量的一次性導入到數(shù)據(jù)倉庫屮;另一種是數(shù)據(jù)倉庫正常運作之后,需 要將 操作性系統(tǒng)的數(shù)據(jù)更新定期加載到數(shù)據(jù)倉庫中。不同的數(shù)據(jù)的加載頻率可以 不同。元數(shù)據(jù)部分 : 是對數(shù)據(jù)倉庫小數(shù)據(jù)的描述信息。主要描述三方面的信息:數(shù) 據(jù)源

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論