


版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、-.z.z.一、選擇題此題共 5 道小題,每題 2 分,共 10 分數(shù)據(jù)倉庫是隨著時間變化的,下面的描述不正確的選項是 (C)。數(shù)據(jù)倉庫隨時間的變化不斷增加新的數(shù)據(jù)內(nèi)容捕捉到的新數(shù)據(jù)會覆蓋原來的快照數(shù)據(jù)倉庫隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容有關(guān)數(shù)據(jù)倉庫的開發(fā)特點,不正確的描述(B 。數(shù)據(jù)倉庫使用的需求在開發(fā)初期就要明確數(shù)據(jù)倉庫開發(fā)要從數(shù)據(jù)出發(fā)分析和處理更靈活,且沒有固定的模式在有關(guān)數(shù)據(jù)倉庫測試,以下說法不正確的選項是 (D。測試和系統(tǒng)測試。當(dāng)數(shù)據(jù)倉庫的每個單獨組件完成后,就需要對他們進展單元測試。系統(tǒng)的集成測試需要對數(shù)據(jù)倉庫的所有組件進展大量的功能測試和回歸測試。在測試之前沒必要制定詳細的測試方案
2、。關(guān)于根本數(shù)據(jù)的元數(shù)據(jù)是指 (D)。根本元數(shù)據(jù)與數(shù)據(jù)源、數(shù)據(jù)倉庫、數(shù)據(jù)集市和應(yīng)用程序等構(gòu)造相關(guān)的信息根本元數(shù)據(jù)包括與企業(yè)相關(guān)的管理方面的數(shù)據(jù)和信息根本元數(shù)據(jù)包括日志文件和簡歷執(zhí)行處理的時序調(diào)度信息下面關(guān)于數(shù)據(jù)粒度的描述不正確的選項是 (C)。粒度是指數(shù)據(jù)倉庫小數(shù)據(jù)單元的詳細程度和級別數(shù)據(jù)越詳細,粒度就越小,級別也就越高數(shù)據(jù)綜合度越高,粒度也就越大,級別也就越高粒度的具體劃分將直接影響數(shù)據(jù)倉庫中的數(shù)據(jù)量以及查詢質(zhì)量關(guān)于OLAP 的特性,下面正確的選項是D) (1)快速性 (2)可分析性 (3)多維性 (4)信息性 (5)共享A. (1) (2) (3)B. (2) (3) (4)C. (1) (
3、2) (3) (4)D. (1) (2) (3) (4) (5)關(guān)于OLAP 和OLTP 的區(qū)別描述,不正確的選項是: (C)OLAP 主要是關(guān)于如何理解聚集的大量不同的數(shù)據(jù),它與OTAP 應(yīng)用程序不同。與OLAP 應(yīng)用程序不同,OLTPOLAPOLAP 是以數(shù)據(jù)倉庫為根底的,但其最終數(shù)據(jù)來源與OLTP 一樣均來自底層的數(shù)據(jù)庫系統(tǒng),兩者面對的用戶是一樣的。關(guān)于OLAP 和OLTP 的說法,以下不正確的選項是: (A)OLAPOLAP 的最終數(shù)據(jù)來源與OLTPOLTPOLTPOLAP 技術(shù)的核心(D。在線性對用戶的快速響應(yīng)互操作性多維分析*超市研究銷售紀錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會購置尿
4、布,這種屬于數(shù)據(jù)掘的哪類問.(A)關(guān)聯(lián)規(guī)則B. 聚類C. 分類D. 自然語言處理分析型CRM C功能可以讓 CRM 對所進展的銷售活動相關(guān)信息進展存儲和理,將客戶所發(fā)生的交易與互動事件轉(zhuǎn)化為有意義、高獲利的銷售商機。促銷管理B. 個性化和標準化C. 客戶分析和建模D. 客戶溝通運用關(guān)鍵績效指標法設(shè)計組織關(guān)鍵績效指標依次經(jīng)過以下幾個步驟AA.確定關(guān)鍵成功領(lǐng)域、確定關(guān)鍵績效要素、確定關(guān)鍵績效指標方案目標、實施目標、評價結(jié)果、反響D.確定長期整體目標、確定短期目標什么是KDD. (A)A. 知識發(fā)現(xiàn) B. 領(lǐng)域知識發(fā)現(xiàn)C. 文檔知識發(fā)現(xiàn)D. 動態(tài)知識發(fā)現(xiàn)呼叫中心是一種基于D的一種新的綜合信息效勞系統(tǒng)
5、A IT 技術(shù)B CTI 技術(shù)C WEB 技術(shù)D CRM技術(shù).(C)頻繁模式挖掘B. 分類和預(yù)測C. 數(shù)據(jù)預(yù)處理D. 數(shù)據(jù)流挖掘.(B)分類B. 聚類C. 關(guān)聯(lián)分析D. 隱馬爾可夫鏈使用交互式的和可視化的技術(shù),對數(shù)據(jù)進展探索屬于數(shù)據(jù)挖掘的哪一類任.A探索性數(shù)據(jù)分析B. 建模描述C. 預(yù)測建模D. 尋找模式和規(guī)則.(B)探索性數(shù)據(jù)分析B. 建模描述C. 預(yù)測建模D. 尋找模式和規(guī)則任務(wù).(C)根據(jù)內(nèi)容檢索B. 建模描述C. 預(yù)測建模D. 尋找模式和規(guī)則務(wù).(A)根據(jù)內(nèi)容檢索B. 建模描述C. 預(yù)測建模D. 尋找模式和規(guī)則21(D)A. 變量代換B. 離 散化C. 聚集D. 估計遺漏值下面哪個不屬
6、于數(shù)據(jù)的屬性類( D)A.標稱B.序數(shù)區(qū)間D. 相 異在上題中,屬于定量的屬性類型(C)A.標稱B.序數(shù)C. 區(qū)間D.相異只有非零值才重要的二元屬性被稱( C)。A.計數(shù)屬性B.離散屬性C. 非對稱的二元屬性D. 對稱屬性以下哪種方法不屬于特征選擇的標準方法 (D)。嵌入B.過濾C.包裝下面不屬于創(chuàng)立新屬性的相關(guān)方法的(C)。特征提取B. 特征修改C. 映射數(shù)據(jù)到新的空間D. 特征構(gòu)造下面哪個屬于映射數(shù)據(jù)到新的空間的方. (A) A.傅立葉變換B. 特征加權(quán)C.漸進抽樣D. 維歸企業(yè)所建立的預(yù)測模型的好壞取決于模型(A)上的表現(xiàn)效果。得分集B. 訓(xùn) 練集C. 測 試集D. 評價集客戶在經(jīng)濟活動
7、中具有多重身份,下面哪一種不是其身份之(C)。行為身份B. 所有權(quán)身份C. 學(xué)習(xí)身份D. 決策身份以下四條描述中,正確的一條(B)。企業(yè)實施數(shù)據(jù)挖掘,必須要有數(shù)據(jù)倉庫。企業(yè)要實施數(shù)據(jù)挖掘最好的方式是請編外專家。來的現(xiàn)成模型設(shè)計之初的假設(shè)相吻合。在建模的時侯,增益最高的模型就是最好的模型。數(shù)據(jù)挖掘算法(D)形式來組織數(shù)據(jù)。行B. 列C. 記錄D.表 格企業(yè)要建立預(yù)測模型,需準備建模數(shù)據(jù)集,以下四條描述建模數(shù)據(jù)集正確的選項(B)。數(shù)據(jù)越多越好。盡可能多的適合的數(shù)據(jù)。得分集數(shù)據(jù)是建模集數(shù)據(jù)的一局部。以上三條都正確。K均值類別偵測要求輸入的數(shù)據(jù)類型必須(B)。整型B. 數(shù) 值型C. 字 符型D. 邏輯
8、型在決策樹和累計增益圖的關(guān)系轉(zhuǎn)化過程圖中決策樹*一頁節(jié)點的增益與累計增益圖的(D)相對應(yīng)。線段長度B. 線段斜率C. 相對應(yīng)的線段長度D. 相對應(yīng)的線段斜率企業(yè)為提升每個客戶的價值,應(yīng)實(C)最優(yōu)化。促銷活動B. 預(yù)算最優(yōu)化C. 客戶最優(yōu)化D. 三者都不是數(shù)據(jù)挖掘的經(jīng)典案例“啤酒與尿布試驗最主要是應(yīng)用(C)數(shù)據(jù)挖掘方法。分類B. 預(yù)測C. 組合或關(guān)聯(lián)法則D. 聚 類企業(yè)成功實施數(shù)據(jù)挖掘, 需要以(B)知識或技術(shù)。預(yù)先的規(guī)劃B.對商業(yè)文體的理解C. 綜合商業(yè)知識和技能D. 都需要以下哪個不是專門用于可視化時間空間數(shù)據(jù)的技(B)A.等高線圖 B. 餅圖C.曲面圖D.矢量場圖在抽樣方法中,當(dāng)適宜的樣
9、本容量很難確定時,可以使用的抽樣方法是 (D)A.有放回的簡單隨機抽樣B. 無放回的簡單隨機抽樣C. 分層抽樣D.漸進抽樣設(shè)*=1,2,3是頻繁項集,則可*產(chǎn)(C個關(guān)聯(lián)規(guī)則A. 4 B. 5 C. 6 D. 7概念分層圖(B圖。無向無環(huán) B. 有向無環(huán)C. 有向有環(huán)D. 無向有環(huán)以下哪些算法是分類算法B。A.DBSCAN B. C4.5 C. K-Mean D. EM以下哪些分類方法可以較好地防止樣本的不平衡問題A。 A. KNN B. SVM Bayes D. 神經(jīng)網(wǎng)絡(luò)以下關(guān)于人工神經(jīng)網(wǎng)絡(luò)ANN的描述錯誤的有 (A。神經(jīng)網(wǎng)絡(luò)對訓(xùn)練數(shù)據(jù)中的噪聲非常魯棒可以處理冗余特征訓(xùn)練ANN至少含有一個隱藏
10、層的多層神經(jīng)網(wǎng)絡(luò)通過聚集多個分類器的預(yù)測來提高分類準確率的技術(shù)稱為 (A) 。組(ensemble)B. 聚 (aggregate)C. 合 (bination)D. 投(voting)簡單地將數(shù)據(jù)對象集劃分成不重疊的子集,使得每個數(shù)據(jù)對象恰在一個子集中,這種類類型稱作B。層次聚類B. 劃分聚類C. 非互斥聚類D. 模糊聚類在根本 K 均值算法里,當(dāng)鄰近度函數(shù)采用A的時候,適宜的質(zhì)心是簇中各點的位數(shù)A. 曼哈頓距離B. 平方歐幾里德距離C. 余弦距離D. Bregman散度 C 是一個觀測值,它與其他觀測值的差異如此之大,以至于疑心它是由不同的機產(chǎn)生的A. 邊界點B. 質(zhì)心C. 離 群點D.
11、核心點 48. 檢測一元正態(tài)分布中的離群點,屬于異常檢測中的基于 A 的離群點檢測。統(tǒng)計方法B. 鄰 近度C. 密度D. 聚類技術(shù)DBSCAN 在最壞情況下的時間復(fù)雜度是 B A. O(m)B. O(m2)C. m)D. O(m*log m)關(guān)于 K 均值和DBSCAN 的比擬,以下說法不正確的選項是 AA. K 均值丟棄被它識別為噪聲的對象,而DBSCAN 一般聚類所有對象。B. K而 DBSCANC. K 均值很難處理非球形的簇和不同大小的簇,DBSCAN 可以處理不同大小和不同形狀的簇。D. K 均值可以發(fā)現(xiàn)不是明顯別離的簇,即便簇有重疊也可以發(fā)現(xiàn),但是DBSCAN 會合并有重疊的簇。A
12、 探索性數(shù)據(jù)分析B. 建模描述C. 預(yù)測建模D. 尋找模式和規(guī)52.下面哪種不屬于數(shù)據(jù)預(yù)處理的方. (D)A 變量代換B 離散化C 聚集D 估計遺漏值二、判斷題此題共 10 道小題,每題 1 分,共 10 分 T 1商務(wù)智能指收集、轉(zhuǎn)換、分析和發(fā)布數(shù)據(jù)的過程,目的是為了更好的決策。 F 2數(shù)據(jù)分析是整合企業(yè)原始數(shù)據(jù)的第一步,包括數(shù)據(jù)抽取、轉(zhuǎn)換和裝載三個過程。 T 3維是人們觀察數(shù)據(jù)的特定角度,是考慮問題時的一類屬性。 F 4獨立的數(shù)據(jù)集市架構(gòu)的優(yōu)點是企業(yè)內(nèi)數(shù)據(jù)一致,不會產(chǎn)生信息孤島。 T 5. 星型模型的核心是事實表,事實表把各種不同的維表連接起來。 F值。 T 7衡量客戶忠誠的唯一尺度就是客
13、戶是否重復(fù)或持久地購置企業(yè)的產(chǎn)品或者效勞。 T 8在BI 中,DW 是前提和根底,負責(zé)統(tǒng)一數(shù)據(jù)規(guī)則的處理和存儲。 F 9客戶效勞管理是對客戶意見或投訴以及售前、售中、售后效勞進展管理。 F 10. 平衡計分卡共包括三個層面,分別是財務(wù)層面、客戶層面、內(nèi)部業(yè)務(wù)流程層面。 T 11數(shù)據(jù)挖掘的主要任務(wù)是從數(shù)據(jù)中發(fā)現(xiàn)潛在的規(guī)則,從而能更好的完成描述數(shù)據(jù)、預(yù)測數(shù)據(jù)等任務(wù)。 F 12在聚類分析當(dāng)中,簇內(nèi)的相似性越大,簇間的差異越大,聚類的效果就越差。 F 13OLAP 是用來協(xié)助企業(yè)對響應(yīng)事件或事務(wù)的日常商務(wù)活動進展處理。 T 14數(shù)據(jù)倉庫是面向主題的、集成的、穩(wěn)定的、隨時間變化的數(shù)據(jù)集合,用以支持管理決
14、策的過程。 T 15. 數(shù)據(jù)預(yù)處理是整合企業(yè)原始數(shù)據(jù)的第一步,包括數(shù)據(jù)抽取、轉(zhuǎn)換和裝載三個過程。 F 16C4.5 決策樹算法是國際上最早、最有影響力的決策樹算法, T 17平衡計分卡是從財務(wù)、客戶、內(nèi)部運營、學(xué)習(xí)與成長四個角度,將組織的戰(zhàn)略落實為可操作的衡量指標和目標值的一種新型績效管理體系。 F 18客戶效勞管理是對客戶意見或投訴以及售前、售中、售后效勞進展管理。 F 19. 企業(yè)績效管理的目的在于進一步加強本錢的事前控制,同時有助于通過盈虧分析,輔助產(chǎn)品科學(xué)的報價。FFTF3FFID3TC4.5FFTFFTSQL Server 2005FFTFT數(shù)據(jù)挖掘的目標不在于數(shù)據(jù)采集策略,而在于對
15、于已經(jīng)存在的數(shù)據(jù)進展模式的開掘。 T 圖挖掘技術(shù)在社會網(wǎng)絡(luò)分析中扮演了重要的角色 T模式為對數(shù)據(jù)集的全局性總結(jié),它對整個測量空間的每一點做出描述;模型則對變量化空間的一個有限區(qū)域做出描述 F尋找模式和規(guī)則主要是對數(shù)據(jù)進展干擾,使其符種規(guī)則以及模式F 離群點可以是合法的數(shù)據(jù)對象或者值。 T離散屬性總是具有有限個值。 F噪聲和偽像是數(shù)據(jù)錯誤這一一樣表述的兩種叫法。F用于分類的離散化方法之間的根本區(qū)別在于是否使用類信息。T特征提取技術(shù)并不依賴于特定的領(lǐng)域。FF定量屬性可以是整數(shù)值或者是連續(xù)值。T49. 可視化技術(shù)對于分析的數(shù)據(jù)類型通常不是專用性的。T50. DSS 主要是基于數(shù)據(jù)倉庫、聯(lián)機數(shù)據(jù)分析和
16、數(shù)據(jù)挖掘技術(shù)的應(yīng)用F51. OLAP 技術(shù)側(cè)重于把數(shù)據(jù)庫中的數(shù)據(jù)進展分析、轉(zhuǎn)換成輔助決策信息是繼數(shù)據(jù)庫技術(shù)開展之后迅猛開展起來的一種新技術(shù)T52. 商業(yè)智能系統(tǒng)與一般交易系統(tǒng)之間在系統(tǒng)設(shè)計上的主要區(qū)別在于:后者把構(gòu)造強加于商務(wù)之 上,一旦系統(tǒng)設(shè)計完畢,其程序和規(guī)則不會輕易改變;而前者則是一個學(xué)習(xí)型系統(tǒng),能自適應(yīng)商務(wù)不斷變化的要求T53. 數(shù)據(jù)倉庫中間層 OLAP 效勞器只能采用關(guān)系型OLAPF54數(shù)據(jù)倉庫系統(tǒng)的組成局部包括數(shù)據(jù)倉庫、倉庫管理、數(shù)據(jù)抽取、分 析工具等四個局部。 (F)55.WebF 56.F 57. 聚類clusteringF58.(T)59. 對于 SVM本對分類結(jié)果沒有影響T
17、60. Bayes 法是一種在后驗概率與類條件概率的情況下的模式分類方法,待分樣本的分類結(jié)果取決于各類域中樣本的全體。 (F)三、名詞解釋此題共 4 道小題,每題 5 分,共 20 分1.商務(wù)智能決策,提升企業(yè)競爭力。數(shù)據(jù)倉庫數(shù)據(jù)倉庫是面向主題的、集成的、穩(wěn)定的、隨時間變化的數(shù)據(jù)集合,用以支持管理決策的過程。數(shù)據(jù)集成供全面的數(shù)據(jù)共享。OLAPOLAP 是使分析人員、管理人員或執(zhí)行人員能夠從多種角度對從原始數(shù)據(jù)中轉(zhuǎn)化出來的、能夠真正為用戶所理解的、并真實反映企業(yè)維特性的信息進展快速、一致、交互地存取,從而獲得對數(shù)據(jù)的更深入了解的一類軟件技術(shù)。數(shù)據(jù)挖掘數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的
18、、隨機的數(shù)據(jù)中提取正確的、有用的、未知的、綜合的以及人們感興趣的知識并用于決策支持的過程。孤立點:指數(shù)據(jù)庫中包含的一些與數(shù)據(jù)的一般行為或模型不一致的異常數(shù)據(jù)。01小數(shù)定標標準化。聚類:是將物理或抽象對象的集合分組成為多個類或簇(cluster中的對象之間具有較高的相似度,而不同簇中的對象差異較大。ROLAP通常采用星型或雪花型架構(gòu),由一個事實表和多個維度表構(gòu)成。數(shù)據(jù)歸約:縮小數(shù)據(jù)的取值范圍,使其更適合于數(shù)據(jù)挖掘算法的需要,并且能夠得到和原始數(shù)據(jù)一樣的分析結(jié)果。以認為是以時間為關(guān)鍵屬性的關(guān)聯(lián)知識。掘的典型方法,可用于對新樣本進展分類。遺傳算法:是一種優(yōu)化搜索算法,它首先產(chǎn)生一個初始可行解群體,然
19、后對這個群體通 創(chuàng)造、獲取和使用知識的過程知識的創(chuàng)造、儲存、分享、應(yīng)用和更新Web 挖掘:Web 挖掘是從大量Web 文檔的集合C 中發(fā)現(xiàn)隱含的、有用的模式P 的過程: CP 。四、簡答題此題共 5 道小題,每題 6 分,共 30 分1實現(xiàn)商務(wù)智能的四個階段是什么.答:實現(xiàn)商務(wù)智能的四個階段是數(shù)據(jù)預(yù)處理、建立數(shù)據(jù)倉庫、數(shù)據(jù)分析及數(shù)據(jù)展現(xiàn)2 分1 分數(shù)據(jù)倉庫則是處理海量數(shù)據(jù)的根底; 1 分數(shù)據(jù)分析是表達系統(tǒng)智能的關(guān)鍵,一般采用OLAP 和 DM1 分數(shù)據(jù)展現(xiàn)則主要保障系統(tǒng)分析結(jié)果的可視化1 分2. 數(shù)據(jù)庫系統(tǒng)的局限性雜。面這些細節(jié)數(shù)據(jù)會分散決策者的注意力。當(dāng)事務(wù)型處理環(huán)境和分析型處理環(huán)境在同一個
20、數(shù)據(jù)庫系統(tǒng)中的混亂。對于外部數(shù)據(jù)中的一些非構(gòu)造化數(shù)據(jù),數(shù)據(jù)庫系統(tǒng)常常是無能為力。 3座模式,因為它能對多個相關(guān)的主題建模3市,流行星型或雪花模式,因為它們都適合對單個主題建模3 分4. OLAP 的特點快速性Fast:用戶對OLAP 的快速反響能力有很高的要求。可分析性Analysis:OLAP 系統(tǒng)應(yīng)能處理與應(yīng)用有關(guān)的任何邏輯分析和統(tǒng)計分析。多維性 Multidimensional:多維性是 OLAP 的關(guān)鍵屬性。系統(tǒng)必須提供對數(shù)據(jù)的多維視圖和分析,包括對層次維和多重層次維的完全支持。信息性Information:OLAP 系統(tǒng)應(yīng)能及時獲得信息,并且管理大容量信息。5簡述OLAP 的根本操作
21、有哪些.答:OLAP 的根本操作有:(Slice and 2鉆取(Drill) :鉆取包含向下鉆取(Drill-down(Drill-up)/上卷(Roll-up的深度與維所劃分的層次相對應(yīng)2旋轉(zhuǎn)(Rotate)/(Pivot):通過旋轉(zhuǎn)可以得到不同視角的數(shù)據(jù)2 分6簡述OLAP 與數(shù)據(jù)挖掘的區(qū)別和聯(lián)系。答:OLAP 側(cè)重于與用戶的交互、快速的響應(yīng)速度及提供數(shù)據(jù)的多維視圖,而數(shù)據(jù)挖掘則注重自動發(fā)現(xiàn)隱藏在數(shù)據(jù)中的模式和有用信息,盡管允許用戶指導(dǎo)這一過程3 分OLAP 深度,可以發(fā)現(xiàn)OLAP 所不能發(fā)現(xiàn)的更為復(fù)雜、細致的信息3 分7何謂數(shù)數(shù)據(jù)挖掘的功能包括:概念描述、關(guān)聯(lián)分析、分類與預(yù)測、聚類分析
22、、趨勢分析、孤立點分析以及偏差分析等。3 分為數(shù)據(jù)挖掘算法提供完整、干凈、準確、有針對性的數(shù)據(jù),減少算法的計算量,提高挖掘效率和準確程度。簡述數(shù)據(jù)預(yù)處理方法和內(nèi)容。數(shù)據(jù)清洗:包括填充空缺值,識別孤立點,去掉噪聲和無關(guān)數(shù)據(jù)。據(jù)源的數(shù)據(jù)匹配問題、數(shù)值沖突問題和冗余問題等。數(shù)據(jù)變換:將原始數(shù)據(jù)轉(zhuǎn)換成為適合數(shù)據(jù)挖掘的形式。包括對數(shù)據(jù)的匯總、聚集、概化、標準化,還可能需要進展屬性的重構(gòu)。數(shù)據(jù)一樣的分析結(jié)果。聚類分析;分類分析;關(guān)聯(lián)分析;序列模式挖掘;回歸分析;時間序列分析。數(shù)據(jù)挖掘中的數(shù)據(jù)需要采用以下格式: 所有數(shù)據(jù)應(yīng)該在一個表格/數(shù)據(jù)庫視圖中 每一行對應(yīng)于與業(yè)務(wù)問題相關(guān)的一個案例 忽略具有單一值/幾乎
23、單一值的列 忽略所有行的值都不同的列 刪除所有同義列 對于預(yù)測模型,目標列必須是可識別的12簡述K-近鄰分類法的根本思想。答:根本思想:K近鄰分類是基于類比學(xué)習(xí)的,每個樣本代表d 維空間的一個點。3 分當(dāng)給定一個未知樣本時,K-近鄰分類法將搜索樣本空間,找出最接近未知樣本的 K 個訓(xùn)練樣本,這K 個訓(xùn)練樣本是未知樣本的K 個“近鄰。 3 分13關(guān)聯(lián)規(guī)則挖掘能發(fā)現(xiàn)什么知識.簡述其挖掘的根本步驟。答:關(guān)聯(lián)規(guī)則挖掘有助于發(fā)現(xiàn)交易數(shù)據(jù)庫中不同商品之間的聯(lián)系,找出顧客購置行為模式。2 分minSupp集稱其為頻繁項集2 分然后由頻繁項集生成關(guān)聯(lián)規(guī)則,對于頻繁項集A,假設(shè)BA,且置信度confidence
24、(B不小于最小置信度minConf,則 BA-B 構(gòu) 成 關(guān) 聯(lián) 規(guī) 則 2 分 14遺傳算法與傳統(tǒng)尋優(yōu)算法相比有什么特.遺傳算法為群體搜索,有利于尋找到全局最優(yōu)解; 遺傳算法處理的對象是個體而不是參變量,具有廣泛的應(yīng)用領(lǐng)域;遺傳算法具有隱含并行性,具有更高的運行效率。*本的類別。決策樹方法是數(shù)據(jù)挖掘中非常有效的分類方法。簡述K輸入:簇的數(shù)目k 和包含n 個對象的數(shù)據(jù)集。輸出:k 個簇,使平方誤差準則最小。步驟:任意選擇k 個對象作為初始的簇中心;計算其它對象與這k 個中心的距離,然后把每個對象歸入離它“最近的簇; 2 第 3簡述構(gòu)造智能CRM答:構(gòu)建一個完整的智能CRM 系統(tǒng)的幾個步驟:CR
25、MCRM 系統(tǒng)的企換,從而保證客戶數(shù)據(jù)的一致性2建立客戶數(shù)據(jù)倉庫:規(guī)劃數(shù)據(jù)倉庫,以企業(yè)的業(yè)務(wù)模型為根底,確定需要建立能夠描述制定數(shù)據(jù)存儲策略以及各種商業(yè)規(guī)則等2 分1 分118何謂數(shù)據(jù)倉庫.為什么要建立數(shù)據(jù)倉庫.3 分建立數(shù)據(jù)倉庫的目的有 3一是為了解決企業(yè)決策分析中的系統(tǒng)響應(yīng)問題規(guī)模決策分析的響應(yīng)速度。統(tǒng)事務(wù)數(shù)據(jù)庫不能直接提供的。3 分簡述數(shù)據(jù)倉庫設(shè)計的三級模型及其根本內(nèi)容。2關(guān)系模式、定義記錄系統(tǒng)2 分I/O率和維護代價等。數(shù)據(jù)、建立廣義索引等2 分聚類是將物理或抽象對象的集合分組成為多個類或簇(cluster對象之間具有較高的相似度,而不同簇中的對象差異較大3 分3 分它與信息檢索之間有
26、以下幾方面的區(qū)別1 分于用戶的信息需求,是用戶無法預(yù)知的。著眼點不同:信息檢索著重于文檔中字、詞和;而文本挖掘在于理解文本的內(nèi)容和構(gòu)造。求的文本子集;而文本挖掘是為了提醒文本中隱含的知識。簡潔性等來衡量所發(fā)現(xiàn)知識的有效性、可用性和可理解性。使用場合不同:文本挖掘是比信息檢索更高層次的技術(shù),可用于信息檢索技術(shù)不能解決的 5 分遺傳算法為群體搜索,有利于尋找到全局最優(yōu)解; 遺傳算法處理的對象是個體而不是參變量,具有廣泛的應(yīng)用領(lǐng)域;遺傳算法具有隱含并行性,具有更高的運行效率6 分商務(wù)智能應(yīng)用趨勢BI 到操作型或者實時型的關(guān)注價值、關(guān)注數(shù)據(jù)質(zhì)量。商務(wù)智能開展的特點實時;標準化;嵌入式商務(wù)智能;移動商務(wù)智能;群眾化趨勢;供給商的動向; 易 用 性 。 26內(nèi)涵不同;知識的管理過程和技術(shù)不同;關(guān)注的只是類型不同;面向的用戶不同。27. Web 日志挖掘的應(yīng)用獲取用戶訪問模式信息,理解用戶的意圖和行為分析用戶的存取模式,為用戶提供個性化的效勞確定的潛在客戶群,合理制訂網(wǎng)絡(luò)廣告策略等改良Web 站點的構(gòu)造,使點隨時間、用戶需求的變化而不斷調(diào)整對日志數(shù)據(jù)進展多種統(tǒng)計,包括頻繁訪問頁、單位時間訪問頻度、訪問量的時間分布等利用關(guān)聯(lián)規(guī)則確定相關(guān)Web 查詢查詢修正六、論述題共 10 分1、試舉
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度股東借款轉(zhuǎn)增注冊資本及利潤分配調(diào)整合同
- 2025年度電力線路運維風(fēng)險管理與合同
- 2025年度電子產(chǎn)品退貨換貨服務(wù)合同范本
- 二零二五年度航空航天項目三方合同違約責(zé)任說明
- 公共安全應(yīng)急救援預(yù)案制定指南
- 數(shù)據(jù)中心運維服務(wù)合同及設(shè)備維護管理條款
- 中學(xué)生數(shù)學(xué)史故事征文
- 產(chǎn)品采購及供應(yīng)保障協(xié)議合同
- 企業(yè)信息化建設(shè)實施細則
- 企業(yè)資源共享合作協(xié)議書
- 2022年蘇州工業(yè)職業(yè)技術(shù)學(xué)院單招數(shù)學(xué)模擬試題(附答案解析)
- 2024年證券投資基金基礎(chǔ)知識真題答案及解析
- 泰州職業(yè)技術(shù)學(xué)院單招《英語》考試參考題庫(含答案)
- 《食品衛(wèi)生與安全》課程標準
- 第7課《誰是最可愛的人》公開課一等獎創(chuàng)新教學(xué)設(shè)計-2
- 骨盆骨折小講課護理課件
- 2016-2023年江蘇衛(wèi)生健康職業(yè)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試歷年考點試題甄選合集含答案解析
- 渣土車司機安全培訓(xùn)
- 燃氣公司消防培訓(xùn)課件
- 成事的時間管理
- 江西省2023年高等職業(yè)院校單獨招生考試-江西電力職業(yè)技術(shù)學(xué)院-樣卷
評論
0/150
提交評論