商務(wù)智能復(fù)習(xí)題

上傳人：雪*** IP屬地：江蘇上傳時間：2022-09-19 格式：DOCX 頁數(shù)：13 大小：40.17KB 積分：15 舉報 版權(quán)申訴

已閱讀5頁，還剩8頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、-.z.z.一、選擇題此題共 5 道小題，每題 2 分，共 10 分數(shù)據(jù)倉庫是隨著時間變化的，下面的描述不正確的選項是 (C)。數(shù)據(jù)倉庫隨時間的變化不斷增加新的數(shù)據(jù)內(nèi)容捕捉到的新數(shù)據(jù)會覆蓋原來的快照數(shù)據(jù)倉庫隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容有關(guān)數(shù)據(jù)倉庫的開發(fā)特點，不正確的描述(B 。數(shù)據(jù)倉庫使用的需求在開發(fā)初期就要明確數(shù)據(jù)倉庫開發(fā)要從數(shù)據(jù)出發(fā)分析和處理更靈活，且沒有固定的模式在有關(guān)數(shù)據(jù)倉庫測試，以下說法不正確的選項是 (D。測試和系統(tǒng)測試。當(dāng)數(shù)據(jù)倉庫的每個單獨組件完成后，就需要對他們進展單元測試。系統(tǒng)的集成測試需要對數(shù)據(jù)倉庫的所有組件進展大量的功能測試和回歸測試。在測試之前沒必要制定詳細的測試方案

2、。關(guān)于根本數(shù)據(jù)的元數(shù)據(jù)是指 (D)。根本元數(shù)據(jù)與數(shù)據(jù)源、數(shù)據(jù)倉庫、數(shù)據(jù)集市和應(yīng)用程序等構(gòu)造相關(guān)的信息根本元數(shù)據(jù)包括與企業(yè)相關(guān)的管理方面的數(shù)據(jù)和信息根本元數(shù)據(jù)包括日志文件和簡歷執(zhí)行處理的時序調(diào)度信息下面關(guān)于數(shù)據(jù)粒度的描述不正確的選項是 (C)。粒度是指數(shù)據(jù)倉庫小數(shù)據(jù)單元的詳細程度和級別數(shù)據(jù)越詳細，粒度就越小，級別也就越高數(shù)據(jù)綜合度越高，粒度也就越大，級別也就越高粒度的具體劃分將直接影響數(shù)據(jù)倉庫中的數(shù)據(jù)量以及查詢質(zhì)量關(guān)于OLAP 的特性，下面正確的選項是D) (1)快速性 (2)可分析性 (3)多維性 (4)信息性 (5)共享A. (1) (2) (3)B. (2) (3) (4)C. (1) (

3、2) (3) (4)D. (1) (2) (3) (4) (5)關(guān)于OLAP 和OLTP 的區(qū)別描述，不正確的選項是： (C)OLAP 主要是關(guān)于如何理解聚集的大量不同的數(shù)據(jù)，它與OTAP 應(yīng)用程序不同。與OLAP 應(yīng)用程序不同，OLTPOLAPOLAP 是以數(shù)據(jù)倉庫為根底的，但其最終數(shù)據(jù)來源與OLTP 一樣均來自底層的數(shù)據(jù)庫系統(tǒng)，兩者面對的用戶是一樣的。關(guān)于OLAP 和OLTP 的說法，以下不正確的選項是： (A)OLAPOLAP 的最終數(shù)據(jù)來源與OLTPOLTPOLTPOLAP 技術(shù)的核心(D。在線性對用戶的快速響應(yīng)互操作性多維分析*超市研究銷售紀錄數(shù)據(jù)后發(fā)現(xiàn)，買啤酒的人很大概率也會購置尿

4、布，這種屬于數(shù)據(jù)掘的哪類問.(A)關(guān)聯(lián)規(guī)則B. 聚類C. 分類D. 自然語言處理分析型CRM C功能可以讓 CRM 對所進展的銷售活動相關(guān)信息進展存儲和理，將客戶所發(fā)生的交易與互動事件轉(zhuǎn)化為有意義、高獲利的銷售商機。促銷管理B. 個性化和標準化C. 客戶分析和建模D. 客戶溝通運用關(guān)鍵績效指標法設(shè)計組織關(guān)鍵績效指標依次經(jīng)過以下幾個步驟AA.確定關(guān)鍵成功領(lǐng)域、確定關(guān)鍵績效要素、確定關(guān)鍵績效指標方案目標、實施目標、評價結(jié)果、反響D.確定長期整體目標、確定短期目標什么是KDD. (A)A. 知識發(fā)現(xiàn) B. 領(lǐng)域知識發(fā)現(xiàn)C. 文檔知識發(fā)現(xiàn)D. 動態(tài)知識發(fā)現(xiàn)呼叫中心是一種基于D的一種新的綜合信息效勞系統(tǒng)

5、A IT 技術(shù)B CTI 技術(shù)C WEB 技術(shù)D CRM技術(shù).(C)頻繁模式挖掘B. 分類和預(yù)測C. 數(shù)據(jù)預(yù)處理D. 數(shù)據(jù)流挖掘.(B)分類B. 聚類C. 關(guān)聯(lián)分析D. 隱馬爾可夫鏈使用交互式的和可視化的技術(shù)，對數(shù)據(jù)進展探索屬于數(shù)據(jù)挖掘的哪一類任.A探索性數(shù)據(jù)分析B. 建模描述C. 預(yù)測建模D. 尋找模式和規(guī)則.(B)探索性數(shù)據(jù)分析B. 建模描述C. 預(yù)測建模D. 尋找模式和規(guī)則任務(wù).(C)根據(jù)內(nèi)容檢索B. 建模描述C. 預(yù)測建模D. 尋找模式和規(guī)則務(wù).(A)根據(jù)內(nèi)容檢索B. 建模描述C. 預(yù)測建模D. 尋找模式和規(guī)則21(D)A. 變量代換B. 離散化C. 聚集D. 估計遺漏值下面哪個不屬

6、于數(shù)據(jù)的屬性類( D)A.標稱B.序數(shù)區(qū)間D. 相異在上題中，屬于定量的屬性類型(C)A.標稱B.序數(shù)C. 區(qū)間D.相異只有非零值才重要的二元屬性被稱( C)。A.計數(shù)屬性B.離散屬性C. 非對稱的二元屬性D. 對稱屬性以下哪種方法不屬于特征選擇的標準方法 (D)。嵌入B.過濾C.包裝下面不屬于創(chuàng)立新屬性的相關(guān)方法的(C)。特征提取B. 特征修改C. 映射數(shù)據(jù)到新的空間D. 特征構(gòu)造下面哪個屬于映射數(shù)據(jù)到新的空間的方. (A) A.傅立葉變換B. 特征加權(quán)C.漸進抽樣D. 維歸企業(yè)所建立的預(yù)測模型的好壞取決于模型(A)上的表現(xiàn)效果。得分集B. 訓(xùn) 練集C. 測試集D. 評價集客戶在經(jīng)濟活動

7、中具有多重身份，下面哪一種不是其身份之(C)。行為身份B. 所有權(quán)身份C. 學(xué)習(xí)身份D. 決策身份以下四條描述中，正確的一條(B)。企業(yè)實施數(shù)據(jù)挖掘，必須要有數(shù)據(jù)倉庫。企業(yè)要實施數(shù)據(jù)挖掘最好的方式是請編外專家。來的現(xiàn)成模型設(shè)計之初的假設(shè)相吻合。在建模的時侯，增益最高的模型就是最好的模型。數(shù)據(jù)挖掘算法(D)形式來組織數(shù)據(jù)。行B. 列C. 記錄D.表格企業(yè)要建立預(yù)測模型，需準備建模數(shù)據(jù)集，以下四條描述建模數(shù)據(jù)集正確的選項(B)。數(shù)據(jù)越多越好。盡可能多的適合的數(shù)據(jù)。得分集數(shù)據(jù)是建模集數(shù)據(jù)的一局部。以上三條都正確。K均值類別偵測要求輸入的數(shù)據(jù)類型必須(B)。整型B. 數(shù) 值型C. 字符型D. 邏輯

8、型在決策樹和累計增益圖的關(guān)系轉(zhuǎn)化過程圖中決策樹*一頁節(jié)點的增益與累計增益圖的(D)相對應(yīng)。線段長度B. 線段斜率C. 相對應(yīng)的線段長度D. 相對應(yīng)的線段斜率企業(yè)為提升每個客戶的價值，應(yīng)實(C)最優(yōu)化。促銷活動B. 預(yù)算最優(yōu)化C. 客戶最優(yōu)化D. 三者都不是數(shù)據(jù)挖掘的經(jīng)典案例“啤酒與尿布試驗最主要是應(yīng)用(C)數(shù)據(jù)挖掘方法。分類B. 預(yù)測C. 組合或關(guān)聯(lián)法則D. 聚類企業(yè)成功實施數(shù)據(jù)挖掘，需要以(B)知識或技術(shù)。預(yù)先的規(guī)劃B.對商業(yè)文體的理解C. 綜合商業(yè)知識和技能D. 都需要以下哪個不是專門用于可視化時間空間數(shù)據(jù)的技(B)A.等高線圖 B. 餅圖C.曲面圖D.矢量場圖在抽樣方法中，當(dāng)適宜的樣

9、本容量很難確定時，可以使用的抽樣方法是 (D)A.有放回的簡單隨機抽樣B. 無放回的簡單隨機抽樣C. 分層抽樣D.漸進抽樣設(shè)*=1，2，3是頻繁項集，則可*產(chǎn)(C個關(guān)聯(lián)規(guī)則A. 4 B. 5 C. 6 D. 7概念分層圖(B圖。無向無環(huán) B. 有向無環(huán)C. 有向有環(huán)D. 無向有環(huán)以下哪些算法是分類算法B。A.DBSCAN B. C4.5 C. K-Mean D. EM以下哪些分類方法可以較好地防止樣本的不平衡問題A。 A. KNN B. SVM Bayes D. 神經(jīng)網(wǎng)絡(luò)以下關(guān)于人工神經(jīng)網(wǎng)絡(luò)ANN的描述錯誤的有 (A。神經(jīng)網(wǎng)絡(luò)對訓(xùn)練數(shù)據(jù)中的噪聲非常魯棒可以處理冗余特征訓(xùn)練ANN至少含有一個隱藏

10、層的多層神經(jīng)網(wǎng)絡(luò)通過聚集多個分類器的預(yù)測來提高分類準確率的技術(shù)稱為 (A) 。組(ensemble)B. 聚 (aggregate)C. 合 (bination)D. 投(voting)簡單地將數(shù)據(jù)對象集劃分成不重疊的子集，使得每個數(shù)據(jù)對象恰在一個子集中，這種類類型稱作B。層次聚類B. 劃分聚類C. 非互斥聚類D. 模糊聚類在根本 K 均值算法里，當(dāng)鄰近度函數(shù)采用A的時候，適宜的質(zhì)心是簇中各點的位數(shù)A. 曼哈頓距離B. 平方歐幾里德距離C. 余弦距離D. Bregman散度 C 是一個觀測值，它與其他觀測值的差異如此之大，以至于疑心它是由不同的機產(chǎn)生的A. 邊界點B. 質(zhì)心C. 離群點D.

11、核心點 48. 檢測一元正態(tài)分布中的離群點，屬于異常檢測中的基于 A 的離群點檢測。統(tǒng)計方法B. 鄰近度C. 密度D. 聚類技術(shù)DBSCAN 在最壞情況下的時間復(fù)雜度是 B A. O(m)B. O(m2)C. m)D. O(m*log m)關(guān)于 K 均值和DBSCAN 的比擬，以下說法不正確的選項是 AA. K 均值丟棄被它識別為噪聲的對象，而DBSCAN 一般聚類所有對象。B. K而 DBSCANC. K 均值很難處理非球形的簇和不同大小的簇，DBSCAN 可以處理不同大小和不同形狀的簇。D. K 均值可以發(fā)現(xiàn)不是明顯別離的簇，即便簇有重疊也可以發(fā)現(xiàn)，但是DBSCAN 會合并有重疊的簇。A

12、探索性數(shù)據(jù)分析B. 建模描述C. 預(yù)測建模D. 尋找模式和規(guī)52.下面哪種不屬于數(shù)據(jù)預(yù)處理的方. (D)A 變量代換B 離散化C 聚集D 估計遺漏值二、判斷題此題共 10 道小題，每題 1 分，共 10 分 T 1商務(wù)智能指收集、轉(zhuǎn)換、分析和發(fā)布數(shù)據(jù)的過程，目的是為了更好的決策。 F 2數(shù)據(jù)分析是整合企業(yè)原始數(shù)據(jù)的第一步，包括數(shù)據(jù)抽取、轉(zhuǎn)換和裝載三個過程。 T 3維是人們觀察數(shù)據(jù)的特定角度，是考慮問題時的一類屬性。 F 4獨立的數(shù)據(jù)集市架構(gòu)的優(yōu)點是企業(yè)內(nèi)數(shù)據(jù)一致，不會產(chǎn)生信息孤島。 T 5. 星型模型的核心是事實表，事實表把各種不同的維表連接起來。 F值。 T 7衡量客戶忠誠的唯一尺度就是客

13、戶是否重復(fù)或持久地購置企業(yè)的產(chǎn)品或者效勞。 T 8在BI 中，DW 是前提和根底，負責(zé)統(tǒng)一數(shù)據(jù)規(guī)則的處理和存儲。 F 9客戶效勞管理是對客戶意見或投訴以及售前、售中、售后效勞進展管理。 F 10. 平衡計分卡共包括三個層面，分別是財務(wù)層面、客戶層面、內(nèi)部業(yè)務(wù)流程層面。 T 11數(shù)據(jù)挖掘的主要任務(wù)是從數(shù)據(jù)中發(fā)現(xiàn)潛在的規(guī)則，從而能更好的完成描述數(shù)據(jù)、預(yù)測數(shù)據(jù)等任務(wù)。 F 12在聚類分析當(dāng)中，簇內(nèi)的相似性越大，簇間的差異越大，聚類的效果就越差。 F 13OLAP 是用來協(xié)助企業(yè)對響應(yīng)事件或事務(wù)的日常商務(wù)活動進展處理。 T 14數(shù)據(jù)倉庫是面向主題的、集成的、穩(wěn)定的、隨時間變化的數(shù)據(jù)集合，用以支持管理決

14、策的過程。 T 15. 數(shù)據(jù)預(yù)處理是整合企業(yè)原始數(shù)據(jù)的第一步，包括數(shù)據(jù)抽取、轉(zhuǎn)換和裝載三個過程。 F 16C4.5 決策樹算法是國際上最早、最有影響力的決策樹算法， T 17平衡計分卡是從財務(wù)、客戶、內(nèi)部運營、學(xué)習(xí)與成長四個角度，將組織的戰(zhàn)略落實為可操作的衡量指標和目標值的一種新型績效管理體系。 F 18客戶效勞管理是對客戶意見或投訴以及售前、售中、售后效勞進展管理。 F 19. 企業(yè)績效管理的目的在于進一步加強本錢的事前控制，同時有助于通過盈虧分析，輔助產(chǎn)品科學(xué)的報價。FFTF3FFID3TC4.5FFTFFTSQL Server 2005FFTFT數(shù)據(jù)挖掘的目標不在于數(shù)據(jù)采集策略，而在于對

15、于已經(jīng)存在的數(shù)據(jù)進展模式的開掘。 T 圖挖掘技術(shù)在社會網(wǎng)絡(luò)分析中扮演了重要的角色 T模式為對數(shù)據(jù)集的全局性總結(jié)，它對整個測量空間的每一點做出描述；模型則對變量化空間的一個有限區(qū)域做出描述 F尋找模式和規(guī)則主要是對數(shù)據(jù)進展干擾，使其符種規(guī)則以及模式F 離群點可以是合法的數(shù)據(jù)對象或者值。 T離散屬性總是具有有限個值。 F噪聲和偽像是數(shù)據(jù)錯誤這一一樣表述的兩種叫法。F用于分類的離散化方法之間的根本區(qū)別在于是否使用類信息。T特征提取技術(shù)并不依賴于特定的領(lǐng)域。FF定量屬性可以是整數(shù)值或者是連續(xù)值。T49. 可視化技術(shù)對于分析的數(shù)據(jù)類型通常不是專用性的。T50. DSS 主要是基于數(shù)據(jù)倉庫、聯(lián)機數(shù)據(jù)分析和

16、數(shù)據(jù)挖掘技術(shù)的應(yīng)用F51. OLAP 技術(shù)側(cè)重于把數(shù)據(jù)庫中的數(shù)據(jù)進展分析、轉(zhuǎn)換成輔助決策信息是繼數(shù)據(jù)庫技術(shù)開展之后迅猛開展起來的一種新技術(shù)T52. 商業(yè)智能系統(tǒng)與一般交易系統(tǒng)之間在系統(tǒng)設(shè)計上的主要區(qū)別在于：后者把構(gòu)造強加于商務(wù)之上，一旦系統(tǒng)設(shè)計完畢，其程序和規(guī)則不會輕易改變；而前者則是一個學(xué)習(xí)型系統(tǒng)，能自適應(yīng)商務(wù)不斷變化的要求T53. 數(shù)據(jù)倉庫中間層 OLAP 效勞器只能采用關(guān)系型OLAPF54數(shù)據(jù)倉庫系統(tǒng)的組成局部包括數(shù)據(jù)倉庫、倉庫管理、數(shù)據(jù)抽取、分析工具等四個局部。 (F)55.WebF 56.F 57. 聚類clusteringF58.(T)59. 對于 SVM本對分類結(jié)果沒有影響T

17、60. Bayes 法是一種在后驗概率與類條件概率的情況下的模式分類方法，待分樣本的分類結(jié)果取決于各類域中樣本的全體。 (F)三、名詞解釋此題共 4 道小題，每題 5 分，共 20 分1.商務(wù)智能決策，提升企業(yè)競爭力。數(shù)據(jù)倉庫數(shù)據(jù)倉庫是面向主題的、集成的、穩(wěn)定的、隨時間變化的數(shù)據(jù)集合，用以支持管理決策的過程。數(shù)據(jù)集成供全面的數(shù)據(jù)共享。OLAPOLAP 是使分析人員、管理人員或執(zhí)行人員能夠從多種角度對從原始數(shù)據(jù)中轉(zhuǎn)化出來的、能夠真正為用戶所理解的、并真實反映企業(yè)維特性的信息進展快速、一致、交互地存取，從而獲得對數(shù)據(jù)的更深入了解的一類軟件技術(shù)。數(shù)據(jù)挖掘數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的

18、、隨機的數(shù)據(jù)中提取正確的、有用的、未知的、綜合的以及人們感興趣的知識并用于決策支持的過程。孤立點：指數(shù)據(jù)庫中包含的一些與數(shù)據(jù)的一般行為或模型不一致的異常數(shù)據(jù)。01小數(shù)定標標準化。聚類：是將物理或抽象對象的集合分組成為多個類或簇(cluster中的對象之間具有較高的相似度，而不同簇中的對象差異較大。ROLAP通常采用星型或雪花型架構(gòu)，由一個事實表和多個維度表構(gòu)成。數(shù)據(jù)歸約：縮小數(shù)據(jù)的取值范圍，使其更適合于數(shù)據(jù)挖掘算法的需要，并且能夠得到和原始數(shù)據(jù)一樣的分析結(jié)果。以認為是以時間為關(guān)鍵屬性的關(guān)聯(lián)知識。掘的典型方法，可用于對新樣本進展分類。遺傳算法：是一種優(yōu)化搜索算法，它首先產(chǎn)生一個初始可行解群體，然

19、后對這個群體通創(chuàng)造、獲取和使用知識的過程知識的創(chuàng)造、儲存、分享、應(yīng)用和更新Web 挖掘：Web 挖掘是從大量Web 文檔的集合C 中發(fā)現(xiàn)隱含的、有用的模式P 的過程： CP 。四、簡答題此題共 5 道小題，每題 6 分，共 30 分1實現(xiàn)商務(wù)智能的四個階段是什么.答：實現(xiàn)商務(wù)智能的四個階段是數(shù)據(jù)預(yù)處理、建立數(shù)據(jù)倉庫、數(shù)據(jù)分析及數(shù)據(jù)展現(xiàn)2 分1 分數(shù)據(jù)倉庫則是處理海量數(shù)據(jù)的根底; 1 分數(shù)據(jù)分析是表達系統(tǒng)智能的關(guān)鍵，一般采用OLAP 和 DM1 分數(shù)據(jù)展現(xiàn)則主要保障系統(tǒng)分析結(jié)果的可視化1 分2. 數(shù)據(jù)庫系統(tǒng)的局限性雜。面這些細節(jié)數(shù)據(jù)會分散決策者的注意力。當(dāng)事務(wù)型處理環(huán)境和分析型處理環(huán)境在同一個

20、數(shù)據(jù)庫系統(tǒng)中的混亂。對于外部數(shù)據(jù)中的一些非構(gòu)造化數(shù)據(jù)，數(shù)據(jù)庫系統(tǒng)常常是無能為力。 3座模式，因為它能對多個相關(guān)的主題建模3市，流行星型或雪花模式，因為它們都適合對單個主題建模3 分4. OLAP 的特點快速性Fast：用戶對OLAP 的快速反響能力有很高的要求。可分析性Analysis：OLAP 系統(tǒng)應(yīng)能處理與應(yīng)用有關(guān)的任何邏輯分析和統(tǒng)計分析。多維性 Multidimensional：多維性是 OLAP 的關(guān)鍵屬性。系統(tǒng)必須提供對數(shù)據(jù)的多維視圖和分析,包括對層次維和多重層次維的完全支持。信息性Information：OLAP 系統(tǒng)應(yīng)能及時獲得信息，并且管理大容量信息。5簡述OLAP 的根本操作

21、有哪些.答：OLAP 的根本操作有：(Slice and 2鉆取(Drill) ：鉆取包含向下鉆取(Drill-down(Drill-up)/上卷(Roll-up的深度與維所劃分的層次相對應(yīng)2旋轉(zhuǎn)(Rotate)/(Pivot)：通過旋轉(zhuǎn)可以得到不同視角的數(shù)據(jù)2 分6簡述OLAP 與數(shù)據(jù)挖掘的區(qū)別和聯(lián)系。答：OLAP 側(cè)重于與用戶的交互、快速的響應(yīng)速度及提供數(shù)據(jù)的多維視圖，而數(shù)據(jù)挖掘則注重自動發(fā)現(xiàn)隱藏在數(shù)據(jù)中的模式和有用信息，盡管允許用戶指導(dǎo)這一過程3 分OLAP 深度，可以發(fā)現(xiàn)OLAP 所不能發(fā)現(xiàn)的更為復(fù)雜、細致的信息3 分7何謂數(shù)數(shù)據(jù)挖掘的功能包括：概念描述、關(guān)聯(lián)分析、分類與預(yù)測、聚類分析

22、、趨勢分析、孤立點分析以及偏差分析等。3 分為數(shù)據(jù)挖掘算法提供完整、干凈、準確、有針對性的數(shù)據(jù)，減少算法的計算量，提高挖掘效率和準確程度。簡述數(shù)據(jù)預(yù)處理方法和內(nèi)容。數(shù)據(jù)清洗：包括填充空缺值，識別孤立點，去掉噪聲和無關(guān)數(shù)據(jù)。據(jù)源的數(shù)據(jù)匹配問題、數(shù)值沖突問題和冗余問題等。數(shù)據(jù)變換：將原始數(shù)據(jù)轉(zhuǎn)換成為適合數(shù)據(jù)挖掘的形式。包括對數(shù)據(jù)的匯總、聚集、概化、標準化，還可能需要進展屬性的重構(gòu)。數(shù)據(jù)一樣的分析結(jié)果。聚類分析；分類分析；關(guān)聯(lián)分析；序列模式挖掘；回歸分析；時間序列分析。數(shù)據(jù)挖掘中的數(shù)據(jù)需要采用以下格式：所有數(shù)據(jù)應(yīng)該在一個表格/數(shù)據(jù)庫視圖中每一行對應(yīng)于與業(yè)務(wù)問題相關(guān)的一個案例忽略具有單一值/幾乎

23、單一值的列忽略所有行的值都不同的列刪除所有同義列對于預(yù)測模型，目標列必須是可識別的12簡述K-近鄰分類法的根本思想。答：根本思想：K近鄰分類是基于類比學(xué)習(xí)的，每個樣本代表d 維空間的一個點。3 分當(dāng)給定一個未知樣本時，K-近鄰分類法將搜索樣本空間，找出最接近未知樣本的 K 個訓(xùn)練樣本，這K 個訓(xùn)練樣本是未知樣本的K 個“近鄰。 3 分13關(guān)聯(lián)規(guī)則挖掘能發(fā)現(xiàn)什么知識.簡述其挖掘的根本步驟。答：關(guān)聯(lián)規(guī)則挖掘有助于發(fā)現(xiàn)交易數(shù)據(jù)庫中不同商品之間的聯(lián)系，找出顧客購置行為模式。2 分minSupp集稱其為頻繁項集2 分然后由頻繁項集生成關(guān)聯(lián)規(guī)則，對于頻繁項集A，假設(shè)BA，且置信度confidence

24、(B不小于最小置信度minConf，則 BA-B 構(gòu) 成關(guān) 聯(lián) 規(guī) 則 2 分 14遺傳算法與傳統(tǒng)尋優(yōu)算法相比有什么特.遺傳算法為群體搜索，有利于尋找到全局最優(yōu)解；遺傳算法處理的對象是個體而不是參變量，具有廣泛的應(yīng)用領(lǐng)域；遺傳算法具有隱含并行性，具有更高的運行效率。*本的類別。決策樹方法是數(shù)據(jù)挖掘中非常有效的分類方法。簡述K輸入：簇的數(shù)目k 和包含n 個對象的數(shù)據(jù)集。輸出：k 個簇，使平方誤差準則最小。步驟：任意選擇k 個對象作為初始的簇中心；計算其它對象與這k 個中心的距離，然后把每個對象歸入離它“最近的簇； 2 第 3簡述構(gòu)造智能CRM答：構(gòu)建一個完整的智能CRM 系統(tǒng)的幾個步驟:CR

25、MCRM 系統(tǒng)的企換，從而保證客戶數(shù)據(jù)的一致性2建立客戶數(shù)據(jù)倉庫：規(guī)劃數(shù)據(jù)倉庫，以企業(yè)的業(yè)務(wù)模型為根底，確定需要建立能夠描述制定數(shù)據(jù)存儲策略以及各種商業(yè)規(guī)則等2 分1 分118何謂數(shù)據(jù)倉庫.為什么要建立數(shù)據(jù)倉庫.3 分建立數(shù)據(jù)倉庫的目的有 3一是為了解決企業(yè)決策分析中的系統(tǒng)響應(yīng)問題規(guī)模決策分析的響應(yīng)速度。統(tǒng)事務(wù)數(shù)據(jù)庫不能直接提供的。3 分簡述數(shù)據(jù)倉庫設(shè)計的三級模型及其根本內(nèi)容。2關(guān)系模式、定義記錄系統(tǒng)2 分I/O率和維護代價等。數(shù)據(jù)、建立廣義索引等2 分聚類是將物理或抽象對象的集合分組成為多個類或簇(cluster對象之間具有較高的相似度，而不同簇中的對象差異較大3 分3 分它與信息檢索之間有

26、以下幾方面的區(qū)別1 分于用戶的信息需求，是用戶無法預(yù)知的。著眼點不同：信息檢索著重于文檔中字、詞和；而文本挖掘在于理解文本的內(nèi)容和構(gòu)造。求的文本子集；而文本挖掘是為了提醒文本中隱含的知識。簡潔性等來衡量所發(fā)現(xiàn)知識的有效性、可用性和可理解性。使用場合不同：文本挖掘是比信息檢索更高層次的技術(shù)，可用于信息檢索技術(shù)不能解決的 5 分遺傳算法為群體搜索，有利于尋找到全局最優(yōu)解；遺傳算法處理的對象是個體而不是參變量，具有廣泛的應(yīng)用領(lǐng)域；遺傳算法具有隱含并行性，具有更高的運行效率6 分商務(wù)智能應(yīng)用趨勢BI 到操作型或者實時型的關(guān)注價值、關(guān)注數(shù)據(jù)質(zhì)量。商務(wù)智能開展的特點實時；標準化；嵌入式商務(wù)智能；移動商務(wù)智能；群眾化趨勢；供給商的動向；易用性。 26內(nèi)涵不同；知識的管理過程和技術(shù)不同；關(guān)注的只是類型不同；面向的用戶不同。27. Web 日志挖掘的應(yīng)用獲取用戶訪問模式信息，理解用戶的意圖和行為分析用戶的存取模式，為用戶提供個性化的效勞確定的潛在客戶群，合理制訂網(wǎng)絡(luò)廣告策略等改良Web 站點的構(gòu)造，使點隨時間、用戶需求的變化而不斷調(diào)整對日志數(shù)據(jù)進展多種統(tǒng)計，包括頻繁訪問頁、單位時間訪問頻度、訪問量的時間分布等利用關(guān)聯(lián)規(guī)則確定相關(guān)Web 查詢查詢修正六、論述題共 10 分1、試舉

人人文庫> 全部分類> 應(yīng)用文書 > 項目管理

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

商務(wù)智能復(fù)習(xí)題

文檔簡介

溫馨提示

最新文檔

評論

商務(wù)智能復(fù)習(xí)題

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔