版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第一章
1、數(shù)據(jù)挖掘的概念。P3
數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取或者“挖掘”知識(shí)。
數(shù)據(jù)挖掘是個(gè)過(guò)程,目的是知識(shí)發(fā)現(xiàn)。
數(shù)據(jù)挖掘的過(guò)程:
1數(shù)據(jù)預(yù)處理:。1數(shù)據(jù)清理(消除重復(fù)的、不徹底的、違反語(yǔ)義約束的數(shù)據(jù)),0
數(shù)據(jù)集成(多種數(shù)據(jù)源可以組合在一起),。3數(shù)據(jù)選擇(從數(shù)據(jù)庫(kù)中檢索與
分析任務(wù)相關(guān)的數(shù)據(jù)),?數(shù)據(jù)變換(數(shù)據(jù)變換或者統(tǒng)一成適合挖掘的形式,如
通過(guò)匯總或者會(huì)萃操作)。
2數(shù)據(jù)挖掘(使用智能方法提取數(shù)據(jù)模式)
3模式評(píng)估(根據(jù)某種興趣度度量,識(shí)別表示知識(shí)的真正有趣的模式)
4知識(shí)表示(使用可視化和知識(shí)表示技術(shù),向用戶(hù)提供挖掘的知識(shí))
2、數(shù)據(jù)挖掘有哪些模式。P3
數(shù)據(jù)挖掘的模式:1分類(lèi)模式,2回歸模式,3時(shí)間序列模式,4聚類(lèi)模式,5關(guān)聯(lián)規(guī)
則模式,6序列模式。
3、什么是故意義的模式。
1)它易于理解。2)在某種必然程度上,對(duì)于新的或者檢驗(yàn)數(shù)據(jù)是有效的。3)
是潛在實(shí)用的。4)是新穎的。如果一個(gè)模式符合用戶(hù)確信的某種假設(shè),它也是
有趣的。有趣的模式就是知識(shí)。
4、數(shù)據(jù)挖掘中能否挖掘出所有模式。
數(shù)據(jù)挖掘可能產(chǎn)生數(shù)以千計(jì)的模式或者規(guī)則,但并非所有的模式或者規(guī)則都
是令人感興趣的。
第二個(gè)問(wèn)題——數(shù)“據(jù)挖掘系統(tǒng)能夠產(chǎn)生所有有趣的模式嗎?”一涉及數(shù)據(jù)挖掘算
法的徹底性。第三個(gè)問(wèn)題——數(shù)”據(jù)挖掘系統(tǒng)能夠僅產(chǎn)生有趣的模式嗎''一是數(shù)據(jù)
挖掘的優(yōu)化問(wèn)題。
5、數(shù)據(jù)挖掘的步驟(4),以及每一步驟的作用。P4
數(shù)據(jù)倉(cāng)庫(kù)
數(shù)據(jù)摩:展開(kāi)文件
圖1-4數(shù)據(jù)挖掘視為知識(shí)發(fā)現(xiàn)過(guò)程的一個(gè)步驟
6、數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)有什么關(guān)系。
有趣的數(shù)據(jù)挖掘模式代表知識(shí)。如果一個(gè)模式符合用戶(hù)確信的某種假設(shè),
它也是有趣的。有趣的模式就是知識(shí)。
7、數(shù)據(jù)挖掘的對(duì)象(11)。P6-13
1)數(shù)據(jù)存儲(chǔ)庫(kù)包括:關(guān)系數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、事務(wù)數(shù)據(jù)庫(kù)、高級(jí)數(shù)據(jù)庫(kù)系統(tǒng)、
普通文件、數(shù)據(jù)流和萬(wàn)維網(wǎng)。
2)高級(jí)數(shù)據(jù)庫(kù)系統(tǒng)包括對(duì)象一關(guān)系數(shù)據(jù)庫(kù)和面向特殊應(yīng)用的數(shù)據(jù)庫(kù),如空間
數(shù)據(jù)庫(kù)、時(shí)間序列數(shù)據(jù)庫(kù)、文本數(shù)據(jù)庫(kù)和多媒體數(shù)據(jù)庫(kù)。
2
8、數(shù)據(jù)挖掘的功能(6)。P14-18
功能:1概念/類(lèi)描述:特征化和區(qū)分;2挖掘頻繁模式,關(guān)聯(lián)和相關(guān);3分類(lèi)和
預(yù)測(cè);4聚類(lèi)分析;
9、數(shù)據(jù)挖掘5個(gè)相關(guān)學(xué)科、技術(shù)。P19圖
數(shù)據(jù)挖掘是交叉學(xué)科,受多個(gè)學(xué)科影響。包括數(shù)據(jù)庫(kù)系統(tǒng),統(tǒng)計(jì)學(xué),機(jī)器學(xué)習(xí),
可視化和信息科學(xué)還有其他科學(xué)。
第二章
1、數(shù)據(jù)挖掘的第一階段是數(shù)據(jù)預(yù)處理。
數(shù)據(jù)清理是用于去掉數(shù)據(jù)中的噪聲數(shù)據(jù),糾正不一致。
2、數(shù)據(jù)預(yù)處理的分類(lèi)、每一個(gè)分類(lèi)的作用、有什么技術(shù)。P31
1數(shù)據(jù)清理(可以去掉數(shù)據(jù)中的噪聲,糾正不一致):試圖填充缺失的值,光
滑噪聲并識(shí)別離群點(diǎn),并糾正數(shù)據(jù)的不一致。主要技術(shù):1缺失值;1忽略元
組2人工填寫(xiě)缺失值3使用全局常量填充缺失值4使用屬性的均值填充缺失值
5使用與給定元組屬同一類(lèi)的所有樣本的屬性均值6使用最可能得值填充缺失
值(使用推理進(jìn)行預(yù)測(cè));2光滑技術(shù):1分箱,2回歸,3聚類(lèi)
2數(shù)據(jù)集成(將多個(gè)數(shù)據(jù)源合并成一致的數(shù)據(jù)存儲(chǔ),構(gòu)成一個(gè)完整的數(shù)據(jù)集,
如數(shù)據(jù)倉(cāng)庫(kù)或者數(shù)據(jù)立方體);
3數(shù)據(jù)變換(將一種格式的數(shù)據(jù)轉(zhuǎn)換為另一格式的數(shù)據(jù)(如規(guī)范化)或者統(tǒng)一成
合適于挖掘的形式。;
主要技術(shù):
。1光滑(去掉數(shù)據(jù)中的噪聲,如分箱技術(shù),回歸,聚類(lèi));
。會(huì)萃(對(duì)數(shù)據(jù)進(jìn)行匯總或者會(huì)萃);數(shù)據(jù)泛化(分層,用高層概念代替低層);
。3規(guī)范化(1最大最小規(guī)范化
vmin...
v.Rew,哽)newA_min;
AA
3
[new_min,new_max]是映射后的區(qū)域,[min,max]是變換前數(shù)據(jù)的最大
AAAA
最小值。V是轉(zhuǎn)換后的數(shù)據(jù)。2z-scor規(guī)e范化VAX一分別是原始
AA
A
數(shù)據(jù)的平均值,和標(biāo)準(zhǔn)差);3小數(shù)定標(biāo)規(guī)范化、v/
10i
?屬性構(gòu)造;
4數(shù)據(jù)歸約(可以通過(guò)會(huì)萃、刪除冗余特性或者聚類(lèi)等方法來(lái)壓縮數(shù)據(jù)):
數(shù)據(jù)歸約是保持原來(lái)數(shù)據(jù)的完整性,將數(shù)據(jù)集變小,并不影響對(duì)結(jié)果的分析。
歸約的策略:1數(shù)據(jù)立方體會(huì)萃2屬性子集的選擇3維度歸約4數(shù)值歸約5離散
化和概念分層產(chǎn)生。
3、數(shù)據(jù)清理所需要的方法(6)。P39
數(shù)據(jù)清理可以分為有監(jiān)督和無(wú)監(jiān)督兩類(lèi)。
主要技術(shù):1缺失值;1忽略元組2人工填寫(xiě)缺失值3使用全局常量填充缺失值
4使用屬性的均值填充缺失值5使用與給定元組屬同一類(lèi)的所有樣本的屬性均
值6使用最可能得值填充缺失值(使用推理進(jìn)行預(yù)測(cè));2光滑技術(shù):1分箱,
2回歸,3聚類(lèi)
4、什么是噪聲數(shù)據(jù)。如何處理(3)。P40噪
聲是被測(cè)量的變量的隨機(jī)誤差或者方差。
處理:(19箱。(2)聚類(lèi)。(3)計(jì)算機(jī)和人工檢查結(jié)合.(4)回歸
5、數(shù)據(jù)集成的概念。用來(lái)干什么。方法有哪些。P43
數(shù)據(jù)集成是將多個(gè)數(shù)據(jù)源合并成一致的數(shù)據(jù)存儲(chǔ),構(gòu)成一個(gè)完整的數(shù)據(jù)集,
如數(shù)據(jù)倉(cāng)庫(kù)或者數(shù)據(jù)立方體
它需要統(tǒng)一原始數(shù)據(jù)中的所有矛盾之處,如字段的:同名異義、異名同義、
單位不統(tǒng)一
字長(zhǎng)不一致,從而把原始數(shù)據(jù)在最低層上加以轉(zhuǎn)換,提煉和集成。
4
1模式集成,2冗余問(wèn)題,3數(shù)據(jù)值沖突的檢測(cè)與處理
6、有哪些冗余(2),解決方法。P43-44
屬性冗余:常用的解決方法是相關(guān)分析檢測(cè);卡方檢驗(yàn)(分類(lèi)或者離散數(shù)據(jù));
元組冗余
7、數(shù)據(jù)變換內(nèi)容和含義(5)。P45
數(shù)據(jù)變換將數(shù)據(jù)轉(zhuǎn)換成適合于挖掘的形式。主要是找到數(shù)據(jù)的特征表示,
對(duì)數(shù)據(jù)進(jìn)行規(guī)格化處理。用維變換或者轉(zhuǎn)換方式減少有效變量的數(shù)目或者找
到數(shù)據(jù)的不變式
8、規(guī)范化有哪些方法。至少掌握2種計(jì)算方法。P45-46
。1最大最小規(guī)范化
vmin
-N(new-maxpew_理in)ne叱min;
maxmirr
AA
[new_min,new_max]是映射后的區(qū)域,[min,max]是變換前數(shù)據(jù)的最大
AAAA
最小值。V是轉(zhuǎn)換后的數(shù)據(jù)。
0z-score規(guī)范化V'一,分別是原始數(shù)據(jù)的平均值,和標(biāo)準(zhǔn)差);
AA
A
。3小數(shù)定標(biāo)規(guī)范化、vV
1Q
9、數(shù)據(jù)規(guī)約策略(47)。P47
歸約的策略:1數(shù)據(jù)立方體會(huì)萃2屬性子集的選擇3維度歸約4數(shù)值歸約5離散
化和概念分層產(chǎn)生。
10、屬性子集選擇的基本啟示式方法包括什么技術(shù)(4)。P48-49
5
1逐步向前選擇2逐步向后刪除3向前選擇和向后刪除的結(jié)合4決策樹(shù)歸納
第三章
1、數(shù)據(jù)倉(cāng)庫(kù)的概念、目的、特點(diǎn)。P67
數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的(環(huán)繞主題組織數(shù)據(jù)),集成的(由多個(gè)異構(gòu)數(shù)據(jù)源
集成),時(shí)變的和非易失的數(shù)據(jù)集合,支持管理部門(mén)的決策過(guò)程。
2、數(shù)據(jù)倉(cāng)庫(kù)的邏輯模式。P72
星形,雪花和事實(shí)星座模式
3、星型模式的事實(shí)表包括(2)。P73
事實(shí)表:包含度量值和關(guān)聯(lián)維度表的碼。
星形事實(shí)模型:包括維表和事實(shí)表。維表記錄的是基本信息,事實(shí)表記錄業(yè)務(wù)過(guò)
程。
所以星形事實(shí)模型中,普通在維表上建立主鍵,在事實(shí)表上建立外鍵。事實(shí)表包
括了外鍵和業(yè)務(wù)過(guò)程的數(shù)據(jù)。事實(shí)表包含聯(lián)系事實(shí)與維度表的數(shù)字度量值和鍵。
事實(shí)數(shù)據(jù)表包含描述業(yè)務(wù)內(nèi)特定事件的數(shù)據(jù)。
4、數(shù)據(jù)倉(cāng)庫(kù)的物理結(jié)構(gòu)(3:MRH-SQLServer是H*)。P86
5、OLAP操作(5)。P79
1上卷:就是將高維的數(shù)據(jù)壓縮到低維,是個(gè)數(shù)據(jù)的累加過(guò)程。Eg:從街道
上卷到城市。就是把同一城市的所有街道的數(shù)據(jù)累加起來(lái)。(維度高低是屬性
的個(gè)數(shù),維度高屬性個(gè)數(shù)多)。通過(guò)一個(gè)維德概念分層向上攀升,或者通過(guò)維
歸納,對(duì)數(shù)據(jù)立方體進(jìn)行會(huì)萃。
2下鉆:是把數(shù)據(jù)的維度進(jìn)一步分解,跟上卷相反。Eg:從城市分解到街道。
上卷操作的逆操作。從高層概括到底層概括,從不詳細(xì)到更加詳細(xì)。
3切片和切塊:就是固定某一維數(shù)據(jù),再觀察其它維度的數(shù)據(jù)。Eg:固定時(shí)
6
間維,觀察不同地點(diǎn)的銷(xiāo)售數(shù)量。
4投影和選擇。
轉(zhuǎn)軸:可視化操作,從不同角度觀察數(shù)據(jù)。
6、數(shù)據(jù)倉(cāng)庫(kù)的實(shí)現(xiàn)(3)。P88
高效的立方體計(jì)算技術(shù),存取方法和查詢(xún)處理技術(shù);
7、數(shù)據(jù)立方體的有效計(jì)算(2)。P88
olcomputecube操作與維災(zāi)難
Computecube操作對(duì)操作指定維的所有子集計(jì)算會(huì)萃。(立方體計(jì)算的方體或
者分組總數(shù)為2的N次方。如3維(3個(gè)屬性)數(shù)據(jù)的立方體,分組總數(shù):20=8)。
0部份物化:方體的選擇計(jì)算。(數(shù)據(jù)立方體的物化:不物化、徹底物化、部
分物化。)
8、維災(zāi)難概念。P89
徹底物化指定義數(shù)據(jù)立方體的格中所有的方體的計(jì)算。通常需要過(guò)多的存儲(chǔ)
空間,特殊是當(dāng)維數(shù)和相關(guān)聯(lián)的概念分層增長(zhǎng)時(shí),該問(wèn)題稱(chēng)為維災(zāi)難。
9、N維有多少個(gè)頂點(diǎn)。
2的N次方。2N
10、數(shù)據(jù)倉(cāng)庫(kù)的查詢(xún)(?。┓椒ǎ?)。P90
1位圖索引2連接索引3位圖連接索引。
11、OLAP查詢(xún)的有效處理步驟(2)。P92
1確定哪些操作應(yīng)當(dāng)在可利用的方體上執(zhí)行
2確定相關(guān)操作應(yīng)當(dāng)使用哪些物化的方法。
7
第四章
1、冰山立方體的概念。(多路數(shù)據(jù)會(huì)萃不能計(jì)算冰山立方體)。
冰山立方體:不能滿足閾值的單元,這種部份物化的單元稱(chēng)作冰山立方體。
2,BUC計(jì)算冰山立方體。P109
1從頂點(diǎn)方體向下計(jì)算冰山立方體。2Aprioii剪枝。3無(wú)共享會(huì)萃計(jì)算
優(yōu)點(diǎn):分治策略,減少不必要計(jì)算開(kāi)消。
計(jì)算流程:
1掃描整個(gè)輸入,計(jì)算整個(gè)度量。2針對(duì)方體的每一維進(jìn)行劃分。3針對(duì)每一個(gè)劃
分,對(duì)它進(jìn)行會(huì)萃,為該劃分創(chuàng)建一個(gè)元組并得到該元組的計(jì)算。判斷其分組計(jì)
算是否滿足最小支持度。4如果滿足,輸出該劃分的會(huì)萃元組,并在該劃分上對(duì)
下一維進(jìn)行遞歸調(diào)用,否則進(jìn)行剪枝操作。
3、OLAP估計(jì)算殼片段,缺點(diǎn)、計(jì)算。P116-118
4、點(diǎn)查詢(xún)、子立方體查詢(xún)概念、計(jì)算。P119-120
5、面向?qū)傩缘臍w納是用來(lái)干什么。過(guò)程有哪些。P128
面向?qū)傩缘臍w納用于復(fù)雜的數(shù)據(jù)類(lèi)型并依賴(lài)數(shù)據(jù)驅(qū)動(dòng)的泛化過(guò)程。
1使用數(shù)據(jù)庫(kù)查詢(xún)采集任務(wù)相關(guān)的數(shù)據(jù);2采集工作關(guān)系的統(tǒng)計(jì)量。3導(dǎo)出主關(guān)
系P
6、類(lèi)比較的過(guò)程。P136
1數(shù)據(jù)采集。2維相關(guān)分析。3同步泛化。4導(dǎo)出比較的表示。
8
7、類(lèi)描述:特征化和比較的表示?(這里不知道考什么)
第五章
1、支持度、置信度、提升度概念?P147
定義N為總事務(wù)數(shù),N(A)、N(B)分別為項(xiàng)集A、項(xiàng)集B浮現(xiàn)的次數(shù),N(AB)為項(xiàng)
集A、項(xiàng)集B同時(shí)浮現(xiàn)的次數(shù),A、B為不相交項(xiàng)集ACB=,規(guī)則A-B表示由
A推到B:
支持度:對(duì)整體
c,N(AB)
Support(At->B)=———
置信度:對(duì)條件
...(46N(AB)
Confidence[A->B)—…
N(A)
提升度:聯(lián)合概率
Lift(A-^S叩portM->0_NxN(AB)
,TSupj)ort(A)xSupport(B)N(A)xN(B)
2、頻繁項(xiàng)集概念。P147
項(xiàng)的集合稱(chēng)為項(xiàng)集。Eg:{computer,antivinjs_softwa是ne}2項(xiàng)集。支持
度計(jì)數(shù):項(xiàng)集浮現(xiàn)的頻率。
滿足最小支持度的閥值的項(xiàng)集就是頻繁項(xiàng)集。
3、Apriori算法、如何實(shí)現(xiàn)、缺點(diǎn)、改進(jìn)方法。P151?P156,P157-159
Apriori算法:是為布爾關(guān)聯(lián)規(guī)則挖掘頻繁項(xiàng)集的原創(chuàng)性算法。
性質(zhì):頻繁項(xiàng)集的所有非空子集也必須是頻繁的。
缺陷:1、它可能需要產(chǎn)生大量候選項(xiàng)集。
2、它可能需要重復(fù)地掃描數(shù)據(jù)庫(kù),通過(guò)模式匹配檢查一個(gè)很大的候選集
9
合。
改進(jìn):1、不候選產(chǎn)生挖掘頻繁項(xiàng)集。
2、使用垂直數(shù)據(jù)格式挖掘頻繁項(xiàng)集。
3、挖掘閉頻繁項(xiàng)集。
第六章
1、分類(lèi)、預(yù)測(cè)的區(qū)別、關(guān)系。P186
預(yù)測(cè)分為:分類(lèi)和數(shù)值預(yù)測(cè)。
分類(lèi)是的目標(biāo)值離散數(shù)據(jù)。
數(shù)值預(yù)測(cè)是的目標(biāo)值是連續(xù)值或者有序值。但是為了方便,把數(shù)值預(yù)測(cè)簡(jiǎn)稱(chēng)為預(yù)
測(cè)。
分類(lèi):*預(yù)測(cè)分類(lèi)標(biāo)號(hào)(或者離散值)
*根據(jù)訓(xùn)練數(shù)據(jù)集和類(lèi)標(biāo)號(hào)屬性,構(gòu)建模型來(lái)分類(lèi)現(xiàn)有數(shù)據(jù),并用來(lái)分類(lèi)
新數(shù)據(jù)
預(yù)測(cè):是構(gòu)造和使用模型評(píng)估無(wú)樣本類(lèi),或者評(píng)估給定樣本可能具有的屬性或者
值空間。
預(yù)測(cè)和分類(lèi)的異同
相同點(diǎn):*兩者都需要構(gòu)建模型
*都用模型來(lái)估計(jì)未知值
不同點(diǎn):*分類(lèi)法主要是用來(lái)預(yù)測(cè)類(lèi)標(biāo)號(hào)(分類(lèi)屬性值)
10
*預(yù)測(cè)法主要是用來(lái)估計(jì)連續(xù)值(量化屬性值)
2、決策樹(shù)算法過(guò)程,計(jì)算。P198
1計(jì)算信息量。2計(jì)算信息埔。3計(jì)算信息增益。4選擇根節(jié)點(diǎn),遞歸操作
3、信息增益公式、概念、如何計(jì)算。P192
-選擇信息場(chǎng)最大的作為分類(lèi)屬性
-設(shè)乃是D中任一元組屬于類(lèi)。的概率,用|Q;DI/|D|估計(jì)
?D中元組分類(lèi)所需的期望信息(entropy):
m
Info(D);一工)Jog23)
■Information按屬性A對(duì)D中元組進(jìn)行劃分所需的信息
'D.\
/吹(o=Z需"(4)
-信息漕益:原來(lái)的信息需求(近基于類(lèi)的)與新的需求
(即對(duì)A劃分之后得到的)之間的差
Gain(A)-Info(D)-Info^D)
4、神經(jīng)網(wǎng)絡(luò)輸入層、輸出層如何計(jì)算。P215-216
向前傳播輸入:IW-o
j?j?j
i1
輸出的計(jì)算:c,1
Lj1e)
神經(jīng)網(wǎng)絡(luò)的上一層輸出構(gòu)成下一層的輸入。
5、例題6-9。P261
11
6、線性回歸、最小二乘法計(jì)算。P231
(x.Xy.)
1XI
)2
uw
y1X
是y的平均值,是X的平均值
yX
最終回歸方程為:ywww
i0Ii
第七章
1、聚類(lèi)分析的數(shù)據(jù)類(lèi)型。不同數(shù)據(jù)類(lèi)型如何計(jì)算。P253-254
數(shù)據(jù)結(jié)構(gòu):數(shù)據(jù)矩陣(原數(shù)據(jù)),相異度矩陣(例如數(shù)據(jù)間的距離,反映對(duì)象
之間的相異度,測(cè)量差);
數(shù)據(jù)類(lèi)型:區(qū)間標(biāo)度變量,二元變量,分類(lèi)、序數(shù)和比例標(biāo)度變量,混合類(lèi)型的
變量
區(qū)間標(biāo)度變量:。1標(biāo)準(zhǔn)化:z'z是標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣。x原始數(shù)據(jù),
是x平均值,是x的方差。②計(jì)算距離dn(xy)2(歐氏距離)。把距
ijVjikjk
離小的規(guī)劃為一類(lèi)。
I*S
二元變量:*qrstq(l』)r(l』)s(O,l)t(l,O);
pm
d
分類(lèi)變量:ijF_P是全部變量總是,m是匹配數(shù)目
r
2、分類(lèi)、序數(shù)和比例標(biāo)度變量,計(jì)算例題7-3,7-5,7-6oP256-260
對(duì)象標(biāo)識(shí)符Testi(分類(lèi)的)T9st2序數(shù)的Test3比例標(biāo)
度
12
1Code-A優(yōu)秀445
2Code-B普通22
3Code-C好164
4Code-A優(yōu)秀1210
7-3:計(jì)算分類(lèi)變量的相異度
數(shù)據(jù)是Testi(分類(lèi)的)行是對(duì)象(記錄),列是屬性(惟獨(dú)一列【維】)o
7-5計(jì)算比例標(biāo)度量間的相異度。
數(shù)據(jù)是Test3比例標(biāo)度
先對(duì)照例標(biāo)度變量進(jìn)行對(duì)數(shù)變換。再計(jì)算距離。
Test3數(shù)據(jù)取對(duì)數(shù)得:2.65,1.34,2.21,3.08o求歐氏距離:
01.30590.43350.4344
1.305900.87241.7404
0.43350.872400.8679
0.43441.74040.86790
7-6計(jì)算混合類(lèi)型變量間的相異度
temp=log10(Test3得)到:
2.6484
1.3424
2.2148
3.0828
13
Temp2=temp/(max(temp)-min(temp))得至U
1.5217
0.7713
1.2726
1.7713
在對(duì)Temp2求距離。
00.75040.24910.2496
0.750400.50131.0000
0.24910.501300.4987|
0.24961.00000.49870
3、主要聚類(lèi)方法的分類(lèi)P261。
劃分法,層次法,基于網(wǎng)格的方法,基于模型的方法。
4、K均值、k中
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年稅務(wù)顧問(wèn)服務(wù)合同協(xié)議書(shū)適用于企業(yè)集團(tuán)6篇
- 二零二五年車(chē)輛限購(gòu)區(qū)域購(gòu)車(chē)指標(biāo)租賃協(xié)議書(shū)2篇
- 里程節(jié)約法課程設(shè)計(jì)
- 2025年度金融產(chǎn)品售后服務(wù)保障協(xié)議范本3篇
- 2025年度森林資源保護(hù)與利用二零二五版樹(shù)木租賃合同4篇
- 二零二五年度酒店智能門(mén)鎖采購(gòu)合同含智能卡片識(shí)別及管理平臺(tái)3篇
- 二零二五年度留學(xué)國(guó)際旅行保險(xiǎn)合同范本4篇
- 二零二五年生物制藥領(lǐng)域?qū)<移赣脜f(xié)議2篇
- 二零二五版教師勞動(dòng)爭(zhēng)議處理及仲裁合同范本3篇
- 2025年度新型電子產(chǎn)品買(mǎi)賣(mài)協(xié)議書(shū)范本4篇
- 《穿越迷宮》課件
- 《C語(yǔ)言從入門(mén)到精通》培訓(xùn)教程課件
- 2023年中國(guó)半導(dǎo)體行業(yè)薪酬及股權(quán)激勵(lì)白皮書(shū)
- 2024年Minitab全面培訓(xùn)教程
- 社區(qū)電動(dòng)車(chē)棚新(擴(kuò))建及修建充電車(chē)棚施工方案(純方案-)
- 項(xiàng)目推進(jìn)與成果交付情況總結(jié)與評(píng)估
- 鐵路項(xiàng)目征地拆遷工作體會(huì)課件
- 醫(yī)院死亡報(bào)告年終分析報(bào)告
- 建設(shè)用地報(bào)批服務(wù)投標(biāo)方案(技術(shù)方案)
- 工會(huì)工作人年度考核個(gè)人總結(jié)
- 上海民辦楊浦實(shí)驗(yàn)學(xué)校初一新生分班(摸底)語(yǔ)文考試模擬試卷(10套試卷帶答案解析)
評(píng)論
0/150
提交評(píng)論