數(shù)據(jù)挖掘原理與SPSS Clementine應(yīng)用寶典第20章 數(shù)據(jù)的圖形化展示_第1頁
數(shù)據(jù)挖掘原理與SPSS Clementine應(yīng)用寶典第20章 數(shù)據(jù)的圖形化展示_第2頁
數(shù)據(jù)挖掘原理與SPSS Clementine應(yīng)用寶典第20章 數(shù)據(jù)的圖形化展示_第3頁
數(shù)據(jù)挖掘原理與SPSS Clementine應(yīng)用寶典第20章 數(shù)據(jù)的圖形化展示_第4頁
數(shù)據(jù)挖掘原理與SPSS Clementine應(yīng)用寶典第20章 數(shù)據(jù)的圖形化展示_第5頁
已閱讀5頁,還剩91頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、數(shù)據(jù)挖掘原理與數(shù)據(jù)挖掘原理與spss clementine應(yīng)用寶典應(yīng)用寶典 元昌安元昌安 主編主編 鄧松李文敬劉海濤編著鄧松李文敬劉海濤編著 電子工業(yè)出版社電子工業(yè)出版社 第第20章章 數(shù)據(jù)的圖形化展數(shù)據(jù)的圖形化展 示示 本章的主要內(nèi)容本章的主要內(nèi)容 圖表類型 圖表的創(chuàng)建 使用圖表 散點圖的顯示 條形圖的繪制 繪制直方圖 收集圖顯示 多重散點圖 網(wǎng)絡(luò)圖顯示 評估節(jié)點圖 時間散點圖的顯示 圖圖20-1 圖形節(jié)點選項板圖形節(jié)點選項板 20.1圖表類型圖表類型 層疊圖 三維圖 動畫效果圖 20.1.1 層疊圖層疊圖 圖圖20-2以顏色為層次的圖以顏色為層次的圖圖圖20-3 以大小為層次的圖以大小為層

2、次的圖 圖圖20-4以顏色、大小、形狀和透明度為層次的圖以顏色、大小、形狀和透明度為層次的圖 圖圖20-5以面板圖為層次的圖以面板圖為層次的圖 20.1.2三維圖像三維圖像 有兩種創(chuàng)建 3-d圖像的方法: (1)將信息繪制在三維坐標軸上(真正的 3-d圖像)。 (2)將圖像用 3-d效果顯示。 這兩種方法對于散點圖和收集圖(如圖20-6所示)來說都是可用的。 圖圖20-6 三維收集圖三維收集圖 將信息繪制在一個三維坐標軸上步驟如下: 在圖表節(jié)點對話框中,選擇 “散點圖”頁簽。 單擊 “3-d”圖標按鈕啟動 z軸的選項 。 使用“字段選取器”圖標按鈕來為 z軸選擇一個字段。 在一些情況下,只可以

3、使用符號字段。字段選取器將顯示合 適的字段。 如果要對圖像加3-d效果顯示。可以在已經(jīng)創(chuàng)建圖表的輸出窗 口中選擇“圖形”對象,單擊“3-d”圖標按鈕來將視圖轉(zhuǎn)換為 三維圖像。 20.1.3動畫效果動畫效果 散點圖、多重散點圖和直方圖可以被設(shè)計為動畫形式。使用帶有 三個類別的變量的動畫點圖如圖20-7所示。 一旦用戶已經(jīng)作出了一個帶有動畫效果的圖像,就可以用各種方 式使用動畫工具: (1)在任何時點暫停動畫按鈕。 (2)使用拖動滑塊在想要觀看的點處觀看。 圖圖20-7動畫散點圖動畫散點圖 20.2 圖表的創(chuàng)建圖表的創(chuàng)建 對于所有圖形類型,用戶都可以為生成的文件名和顯示方式指定以下選項。 輸出到屏

4、幕:選擇在一個 clementine 窗口內(nèi)產(chǎn)生并顯示圖像。 輸出到文件: 選擇將生成的圖像保存為一個文件, 此文件的類型是文件類型下拉列表中給定 的。 文件類型:可用的文件類型有: (1)bitmap(.bmp) (2)jpeg(.jpg) (3)png(.png) (4)html document(.hml) (5)vizml(.xml) (6)output object(.cou). 文件名:指定生成的圖所用的文件名。使用自定義()按鈕來指定一個文件及其位置。 圖圖20-8 散點圖對話框輸出設(shè)置散點圖對話框輸出設(shè)置 對于除了條形圖以外的所有圖來說,用戶可以在圖創(chuàng)建之前或者探索已生 成圖時

5、指定外觀選項。如圖20-9所示為散點圖對話框外觀頁簽。 圖圖20-9散點圖對話框外觀設(shè)置散點圖對話框外觀設(shè)置 相關(guān)參數(shù)的說明如下: 設(shè)置用于:使用下拉列表來選擇 “標題” 、“說明” 或“標 簽”。 x(y)標簽:只可用于“標簽”中,用戶可選擇“定制”來 為x(y)軸指定一個常用標注。 z標簽:可以選擇“定制”來為z軸指定一個常用標注。 顯示網(wǎng)格線:這個選項是默認選定的,它在點或圖后面顯示出 網(wǎng)格線使得用戶可以更容易的確定區(qū)域和帶的分割點。網(wǎng)格線 常常顯示為白色,除非圖像背景也是白色的,這時它們顯示為 灰色。 用戶創(chuàng)建圖形后,可用一些方法制定和操作我們創(chuàng)建的圖形,允 許的操作方式包括: 使用鼠

6、標來選擇一個圖表區(qū)域以便進行更深入的操作。 使用菜單欄中可用的選項。不同的圖表可能有不同類型的可用 菜單和選項。 在選定區(qū)域上右擊鼠標右鍵,給這個區(qū)域提供可用的內(nèi)容菜單 ,如圖20-10所示。 圖圖20-10 在已選定區(qū)域中帶有內(nèi)容菜單的散點圖在已選定區(qū)域中帶有內(nèi)容菜單的散點圖 還可以依據(jù)已創(chuàng)建圖表的不同類型來執(zhí)行下述操作: 使用鼠標高亮度表示劃定的矩形數(shù)據(jù)區(qū)域。 通過點擊圖像區(qū)域,高亮度表示直方圖和收集圖上的數(shù)據(jù)帶。 識別并標注用戶的數(shù)據(jù)子集。 基于圖表上選定的區(qū)域來生成操作節(jié)點。 圖圖20-11 圖形窗口文件菜單和工具欄圖形窗口文件菜單和工具欄 20.3 散點圖的顯示散點圖的顯示 圖圖20

7、-12散點圖節(jié)點的設(shè)置散點圖節(jié)點的設(shè)置 相關(guān)參數(shù)的說明如下: x(y)字段:從列表中選擇一個字段并顯示在x(y)軸上, 也被稱為水平(垂直)軸或者橫(縱)坐標。 z字段:當(dāng)用戶點擊“3-d”圖標按鈕()時,第三個字段變得 可用,用戶可以從列表中選擇一個字段并顯示在z軸上。 交疊字段:包括顏色、大小、形狀、面板、動畫、透明度等。 交疊函數(shù):選擇指定一個已知函數(shù),將其比作實際的數(shù)值。 20.4.3使用散點圖使用散點圖 使用層疊,將會用圖示說明在申報(值或數(shù)字)和谷 物的類型之間是否存在一定的關(guān)系。如圖20-13所示 。 圖圖20-13 反映變量值和需求關(guān)系的散點圖反映變量值和需求關(guān)系的散點圖 20

8、.3.1 定義一個區(qū)域定義一個區(qū)域 使用鼠標來定義一個區(qū)域的步驟: 在圖中某個地方點擊鼠標的左鍵來定義區(qū)域的一角。 為了定義區(qū)域的另一個對角,將鼠標拖動到需要的位置。結(jié)果得到的矩形不能超過軸的邊界。 放開鼠標按鍵來為這個區(qū)域創(chuàng)建一個永久矩形。新創(chuàng)建的區(qū)域被默認稱為區(qū)域n,如圖20-14 所示。 圖圖20-14 定義一個區(qū)域定義一個區(qū)域 按照以下方式使用鼠標,這樣可以在圖像窗口中產(chǎn)生反 饋信息。 在數(shù)據(jù)點上方停留鼠標可以提供此點所特有的信息, 如圖20-15所示。 在一個區(qū)域中右擊并按住鼠標按鈕,以提供關(guān)于此區(qū) 域邊界的信息,如圖20-16所示。 直接在一個區(qū)域內(nèi)右擊鼠標來彈出一個帶有更多選項

9、的內(nèi)容菜單,比如產(chǎn)生過程節(jié)點。 圖圖20-15 提示區(qū)域內(nèi)某點特有的信息提示區(qū)域內(nèi)某點特有的信息 圖圖20-16提示區(qū)域邊界信息提示區(qū)域邊界信息 20.3.2 刪除已創(chuàng)建的區(qū)域刪除已創(chuàng)建的區(qū)域 在已定義區(qū)域的任何地方點擊鼠標右鍵。 從內(nèi)容菜單中,選擇“刪除區(qū)域”選項。 如果用戶已經(jīng)定義了一個區(qū)域,那么用戶可以選擇一組記錄,選 擇的標準是它們是否被包括在一個特定區(qū)域里或者在幾個區(qū)域 中。通過生成一個導(dǎo)出節(jié)點來標記記錄標記的標準是它們 是否被包括在一個區(qū)域中,用戶還可以為一條記錄合并區(qū)域信 息。 20.3.3 編輯圖像區(qū)域編輯圖像區(qū)域 選擇“編輯”/“圖形區(qū)域”菜單,即可打開如圖20-17所示的編

10、輯 圖形區(qū)域?qū)υ捒騺砭庉嫛?圖圖20-17 編輯圖形區(qū)域?qū)υ捒蚓庉媹D形區(qū)域?qū)υ捒?用戶可以用以下方式編輯圖像區(qū)域。 在區(qū)域名稱欄輸入對已定義區(qū)域名的調(diào)整。 手動的通過調(diào)整x,y的最小值,最大值來指定區(qū)域邊界。 通過指定名稱和邊界來加入新的區(qū)域。然后按下回車鍵來開始 新的一行。 通過在表格中選定一個區(qū)域,并單擊刪除按鈕來刪除一個區(qū)域 。 20.4 條形圖的繪制條形圖的繪制 一個條形圖像表現(xiàn)的是,在一個數(shù)據(jù)集中,符 號型(非數(shù)值型)變量值的發(fā)生情況。條形圖 節(jié)點的一個典型用途是展示出數(shù)據(jù)中的不平衡 。這種不平衡是可以通過在建構(gòu)一個模型之前 使用平衡節(jié)點來調(diào)整的。用戶可以利用一個條 形圖形窗口中的內(nèi)

11、容菜單來自動生成一個平衡 節(jié)點。 圖圖20-18條形圖節(jié)點設(shè)置條形圖節(jié)點設(shè)置 相關(guān)的參數(shù)設(shè)置如下: 散點圖:選擇 “選定字段”單選按鈕可以指出選定字段的分布。選擇 “所 有標志字段”單選按鈕可以為數(shù)據(jù)集中的標記字段指出其真實值的分布。 字段:用來顯示變量值的分布。 交疊字段:在上面已經(jīng)選定字段的每個變量值中說明它的變量值分布。 顏色:選擇按比例決定條形,以使得所有條形能占滿整個圖形的寬度。 排序:選擇在條形圖中用來顯示變量值的方法。 比例尺:選擇按比例決定的變量值分布。 圖圖20-19 反應(yīng)兒童反應(yīng)數(shù)量的條形圖反應(yīng)兒童反應(yīng)數(shù)量的條形圖圖圖20-20 條形圖生成菜單選項條形圖生成菜單選項 其下一

12、級子菜單選項說明如下: 選擇節(jié)點:從圖像中選擇任何一個單元來為這個類別產(chǎn)生一個選擇節(jié)點。 導(dǎo)出節(jié)點:從圖形中選擇任何一個單元來為這個類別產(chǎn)生一個導(dǎo)出標志節(jié) 點。平衡節(jié)點(增加):這個節(jié)點將增大較小數(shù)據(jù)子集的規(guī)模。 平衡節(jié)點(減少):使用這個選項來生成一個平衡節(jié)點,這個節(jié)點將減小 較大數(shù)據(jù)子集的規(guī)模。 重新分類節(jié)點(組):這個節(jié)點將按組分類以減少數(shù)據(jù)子集的規(guī)模。 重新分類節(jié)點(值):這個節(jié)點將按值分類以減少數(shù)據(jù)子集的規(guī)模。 從一個條形圖中選擇并且復(fù)制變量值,具體步驟如下: 單擊并按住鼠標左鍵不放,同時拖動鼠標來選擇一組變量值 。用戶可以使用“編輯”菜單來選擇所有變量值。 在“編輯”菜單中,選擇“

13、復(fù)制”命令。 貼到剪貼板上或者到想要放置的應(yīng)用程序中即可。 20.5 繪制直方圖繪制直方圖 圖圖20-21直方圖的參數(shù)設(shè)置直方圖的參數(shù)設(shè)置 相關(guān)的設(shè)置參數(shù)如下: 字段:選擇一個數(shù)值型字段,展示這個字段變量值的分布。 交疊字段 :選擇一個符號型字段來為以上選定的字段顯示變量 值的類別。 直方圖有種層疊方式,分別是:顏色、面板、動畫。 20.5.1 定義變量值的區(qū)域定義變量值的區(qū)域 點擊直方圖中的任何一個位置,設(shè)置一條線來定義一個變量值的區(qū)域?;蛘撸瑔螕?工具欄中的“區(qū)域”圖標按鈕,將圖像分成相等的區(qū)域。這種方法為工具欄添加了 更多選項,用戶可以使用這些選項來指定大量的相等區(qū)域。 如圖20-22所

14、示。 通過以下方式用鼠標在圖像窗口中生成一個反饋信息: 將鼠標放在條柱上不動,可以提供關(guān)于條柱的特定信息。 通過在一個區(qū)域中右擊鼠標并閱讀窗口底部的反饋顯示屏,可以檢查一個 區(qū)域的變量值范圍。 簡單地在一個區(qū)域中右擊鼠標,可以彈出一個帶有更多選項的內(nèi)容菜單, 比如生成過程節(jié)點。 通過在一個區(qū)域中右擊鼠標并選擇“重命名帶狀區(qū)域” 可以為區(qū)域重新命 名。區(qū)域的名字被預(yù)設(shè)為區(qū)域n,這里的 n等于從 x 軸左端到 x 右端的區(qū) 域個數(shù)。 通過用用戶的鼠標選定一條區(qū)域線并將它移動到 x 軸上所希望放置的位置 ,可以移動一個區(qū)域的邊界線。 通過在一條線上右擊鼠標并選定“刪除帶狀區(qū)域”選項,可以刪除區(qū)域。

15、20.5.2 在一個特定段中選擇或標在一個特定段中選擇或標 記記錄記記錄 在區(qū)域中單擊鼠標右鍵。注意區(qū)域的詳細信息 是顯示在圖形下部的反饋信息顯示屏中的。從 內(nèi)容菜單中選擇 “生成帶狀區(qū)域的選擇節(jié)點” 選項或者“生成帶狀區(qū)域的導(dǎo)出節(jié)點”選項。 “選擇節(jié)點”選項選定的是在區(qū)域中的所有記 錄。而“導(dǎo)出節(jié)點”選項則是為變量值落入?yún)^(qū) 域的記錄生成一個標記。標記的字段名稱與區(qū) 域名稱是相對應(yīng)的, 對于在區(qū)域內(nèi)部的記錄設(shè) 置標記為 t,而對于在外部的記錄則設(shè)置標記 為 f。 20.5.3 為所有區(qū)域中的記錄生成 集合 從圖像窗口的“生成”菜單中選擇“導(dǎo)出節(jié)點 ”選項一個新的導(dǎo)出設(shè)置節(jié)點出現(xiàn)在帶有選項 的流

16、程區(qū)域中,這些選項是為了給每個記錄創(chuàng) 建一個新的被稱為“區(qū)域” 的字段而設(shè)置的。 這個字段的變量值等于每個記錄落入的區(qū)域名 稱。 20.5.4 編輯圖型區(qū)域編輯圖型區(qū)域 選擇“編輯”菜單的“圖形帶狀區(qū)域”,打開編輯區(qū)域?qū)υ捒?,如圖20-23所 示。 在“帶狀區(qū)域名稱”欄用戶可以給已經(jīng)定義的區(qū)域名鍵入調(diào)整值。 用戶可以通過調(diào)整 x和 y的最大值和最小值來手動地指定區(qū)域的邊界通過 指定名稱和邊界來加入新的區(qū)域。然后按下回車鍵來開始新的一行。 通過在表格中選擇一個段并且點擊“刪除”按鈕來刪除段。 圖圖20-23 編輯圖形帶狀區(qū)域?qū)υ捒蚓庉媹D形帶狀區(qū)域?qū)υ捒?20.6 收集圖顯示收集圖顯示 圖圖20-

17、24 收集圖節(jié)點的參數(shù)設(shè)置收集圖節(jié)點的參數(shù)設(shè)置 相關(guān)設(shè)置的參數(shù)如下: 收集 :選擇一個字段,其變量值將在“超出”中被聚集,并顯示在下面給 定字段的變量值范圍中。只有尚未被定義為符號型的字段才能被列出。 超出:選擇一個字段,其變量值將被用來顯示上面指定的收集圖字段。 由:在創(chuàng)建一個3d圖像時被激活,這個選項允許用戶選擇一個用來按類 別顯示收集圖字段的設(shè)定或標記字段。 操作:選擇收集圖中的每個條柱都分別代表什么。選項包括“合計”、“ 平均值”、“最大值”、“最小值”、“標準差”。 交疊字段:選擇一個符號型字段來指示上述已選定字段的變量值的類別。 選擇一個轉(zhuǎn)換收集圖的交疊字段,可為每個類別都建立不同

18、顏色的多重條 柱。交疊方式有:顏色、面板、動畫。 圖圖20-25 3-d收集圖收集圖 圖圖20-26 二維收集圖二維收集圖 一旦用戶已經(jīng)創(chuàng)建了一個收集圖節(jié)點,圖像窗口中的一 些選項就可用了。例如,用戶可以: 將x 軸上的數(shù)值范圍劃分為區(qū)段 。 以是否包含在一個特殊段的數(shù)值范圍內(nèi)為依據(jù),生成 一個選擇或?qū)С鰳擞浌?jié)點。 選擇一個導(dǎo)出集合節(jié)點,它可以指示出哪個區(qū)段包含 一個記錄的變量值。 生成一個平衡節(jié)點來糾正資料中的不均衡狀況。 20.7多重散點圖節(jié)點多重散點圖節(jié)點 多重散點圖是一種特殊類型的散點圖,它顯示 的是一個單獨的 x字段對應(yīng)多個 y字段的情況 。 y字段被繪制成帶有顏色的線,而且每條線

19、都與一個y模式被設(shè)置為線、x模式被設(shè)置為“ 排序”的散點圖節(jié)點等價。當(dāng)用戶有時間序列 數(shù)據(jù),并希望能發(fā)掘出某些變量在一定時間內(nèi) 的波動狀況時,多重散點圖時十分有用的。 圖圖20-27 多重散點圖節(jié)點對話框多重散點圖節(jié)點對話框 相關(guān)設(shè)置參數(shù)如圖所示: x字段:選擇一個沿著x軸顯示的字段。 y字段:從列表中選擇一個或多個字段來顯示y字段變量值的 整個范圍。 交疊字段:有兩種方式:面板和動畫。 標準化:此選項是為了能在圖上顯示而將所有y變量值按比例 縮小到0和1之間。標準化可以幫助用戶發(fā)掘圖中沒有清楚顯示 出來的線條之間的關(guān)系。圖20-28、20-29所示分別為標準化前 和標準化后的多重散點圖。 圖

20、圖20-28 未標準化時的未標準化時的 多重散點圖多重散點圖 圖圖20-29 標準化后的標準化后的 多重散點圖多重散點圖 交疊字段函數(shù):選擇指定一個已知函數(shù),將其比作實際的數(shù)值 。 當(dāng)記錄數(shù)大于:指定一個繪制大規(guī)模數(shù)據(jù)集的方法。用戶可以 指定一個最大的數(shù)據(jù)集規(guī)模或者使用默認的2000個點。 間隔:當(dāng)數(shù)據(jù)集包含多于指定數(shù)目的記錄時,選擇進行間隔儲 存。間隔就是在真正繪制和計算每個格子單元中出現(xiàn)點的數(shù)目 之前,將圖像劃分出適當(dāng)?shù)母褡?。在最終的圖像中,一個點將 會被繪制每個的間隔質(zhì)心上的單元中。 樣本:按照文本框中的記錄數(shù)隨機對數(shù)據(jù)進行抽樣。 20.8 網(wǎng)絡(luò)圖顯示網(wǎng)絡(luò)圖顯示 網(wǎng)絡(luò)圖節(jié)點顯示的是兩個或

21、兩個以上符號型字段之間 關(guān)系的強弱程度。這種圖像通過使用各種不同類型的 線條指示聯(lián)系的強度來顯示關(guān)系。 例如,農(nóng)業(yè)研究者可以使用一個網(wǎng)絡(luò)圖節(jié)點來研究各 種農(nóng)作物與地區(qū)和土質(zhì)之間的關(guān)系。 圖圖20-30 網(wǎng)絡(luò)圖節(jié)點對話框網(wǎng)絡(luò)圖節(jié)點對話框 相關(guān)設(shè)置的參數(shù)如下所示: 網(wǎng)絡(luò):選擇創(chuàng)建一個網(wǎng)絡(luò)圖圖像,可以闡明所有指定字段之間 的關(guān)系強度。 導(dǎo)向網(wǎng)絡(luò):選擇創(chuàng)建一個有向網(wǎng)絡(luò)圖,可以闡明多個字段和一 個字段變量值之間的關(guān)系強度,例如性別和信仰。當(dāng)這個選項 被選定時,“結(jié)束字段”輸入框?qū)⒈患せ疃蚁旅娴淖侄慰刂?部分將被重新命名為 “源字段”以使之更加清晰。 結(jié)束字段:選擇一個標志或設(shè)置字段,用于一個有向網(wǎng)絡(luò)。

22、只 有尚未被明確設(shè)置為數(shù)值型的字段才能被列出。 源字段:選擇字段來創(chuàng)建一個網(wǎng)絡(luò)圖圖像。只有尚未被明確設(shè) 置為數(shù)值型的字段才能被列出。 僅顯示真值標志:選擇對一個標記字段只顯示真值的標志。這 個選項簡化了網(wǎng)絡(luò)圖顯示,并且經(jīng)常被用在正值的發(fā)生率具有 特殊重要性的數(shù)據(jù)里。 線值為:從下拉列表中選擇一個域值類型,分別為:絕對值、 總體百分比、“目標“字段/值的百分比、“源”字段/值的百 分比。 粗連接較重:這是被默認選定的查看字段間連接的標準方法。 弱連接較重:此選項顛倒了粗體線條顯示的連接的意義。這個 選項被頻繁地用在欺詐行為偵察或外來人員檢查中。 網(wǎng)絡(luò)圖節(jié)點被用來顯示兩個或兩個以上符號型字段變量值

23、之間關(guān)系的強度 。關(guān)系被顯示在一個圖中,這個圖用各種不同類型的線條來指示強度漸增 的關(guān)聯(lián)。用戶可以使用網(wǎng)絡(luò)圖節(jié)點,例如,探究膽固醇水平、血壓以及在 治療病人疾病方面十分有效的藥品三者之間的關(guān)系。如圖20-31所示: 圖圖20-31膽固醇水平、血壓和藥品之間的網(wǎng)絡(luò)圖節(jié)點膽固醇水平、血壓和藥品之間的網(wǎng)絡(luò)圖節(jié)點 說明: 強鏈接用加黑線條表示:這顯示出兩個變量值具有很強的關(guān)聯(lián) ,進而應(yīng)深入的研究。 中等鏈接用一條普通線條表示。 弱鏈接用一條虛線表示。 如果兩個變量值之間沒有任何線條鏈接,那么這就意味著兩個 變量值從未在同一記錄中出現(xiàn)過,或者也可能這種聯(lián)合是在網(wǎng) 絡(luò)圖節(jié)點對話框里給定的域值范圍之外的一些

24、記錄中出現(xiàn)的。 如果用戶已經(jīng)創(chuàng)建了一個網(wǎng)絡(luò)圖節(jié)點,那么這里有一些選項可 以調(diào)整圖像的顯示,并且為深層分析而生成節(jié)點。 對于網(wǎng)絡(luò)節(jié)點和有向網(wǎng)絡(luò)節(jié)點兩者來說,用戶可以: 改變網(wǎng)絡(luò)圖顯示的布局。 隱藏某些點以簡化顯示。 改變控制線條類型的域值。 突出顯示變量值之間的線條來指示出一個“經(jīng)過選擇的”關(guān)系 。 對于一個或多個“經(jīng)過選擇的”記錄生成一個選擇節(jié)點,或者 生成一個與網(wǎng)絡(luò)圖中一個或多個關(guān)系向關(guān)聯(lián)的導(dǎo)出標志節(jié)點。 在一個點上單擊鼠標并將它拖動到新的位置。 在網(wǎng)絡(luò)圖的一個點上右擊鼠標并且從內(nèi)容菜單中選 擇“隱藏”或“隱藏并重新計劃”選項。 所有被隱藏的點,從圖像窗口中的“網(wǎng)絡(luò)”菜單里 選擇“全部顯示并

25、重新計劃”選項,這樣就可以顯示 所有的點。 20.8.1 20.8.1 調(diào)整點調(diào)整點 20.8.2 20.8.2 為單一關(guān)系選擇或標記記錄為單一關(guān)系選擇或標記記錄 在代表所感興趣的關(guān)聯(lián)的那條線上右擊鼠標。 從內(nèi)容菜單中,選擇“生成鏈接的選擇節(jié)點”或者 “生成鏈接的導(dǎo)出節(jié)點”選項。 選擇節(jié)點將選定所有具有特定鏈接的記錄。 導(dǎo)出節(jié)點生成一個標記,這個標記將指示出對于在 整個數(shù)據(jù)集中的記錄來說,選定的鏈接是否為真值。 標志字段是通過合并鏈接中的兩個變量值來命名的。 20.8.3 為關(guān)聯(lián)選擇或標志記錄為關(guān)聯(lián)選擇或標志記錄 在代表所感興趣的鏈接的網(wǎng)絡(luò)圖里選擇線條。 從圖像窗口中的“生成”菜單,選擇“選擇

26、節(jié)點( 與)”,“選擇節(jié)點(或)”,“導(dǎo)出節(jié)點(與)” ,“導(dǎo)出節(jié)點(或)”選項。 20.8.4 調(diào)整網(wǎng)絡(luò)圖閾值調(diào)整網(wǎng)絡(luò)圖閾值 在用戶已經(jīng)創(chuàng)建了一個網(wǎng)絡(luò)圖以后,用戶可以使用工 具欄滑塊來調(diào)整控制線條類型的閾值,以改變最小的 可視線條。用戶也可以通過點擊工具欄上的黃色雙箭 頭圖標按鈕來查看更多的閾值選項,以擴展網(wǎng)絡(luò)圖形 窗口,如圖20-32所示。 圖圖20-32 帶有顯示和閾值選項的擴展窗口帶有顯示和閾值選項的擴展窗口 相關(guān)設(shè)置的參數(shù)如下所示: 閾值為:在網(wǎng)絡(luò)圖節(jié)點對話框中顯示創(chuàng)建過程中被選定閾值的類型。 絕對值:以包含每一對數(shù)值的記錄個數(shù)為基礎(chǔ)的絕對值閾值。 網(wǎng)絡(luò)顯示:為在輸出圖像中控制鏈接規(guī)

27、模而指定選項。 大小連續(xù)變化:選擇顯示一系列以真實數(shù)據(jù)值為基礎(chǔ)的、反映鏈接強度變 化的鏈接規(guī)模。 大小顯示強/正常/弱類別:選擇顯示三種強度的關(guān)系強、正常和弱。 以上粗鏈接:為強關(guān)聯(lián)(加重線)和規(guī)則關(guān)聯(lián)(正常線)指定一個閾值。 以下弱鏈接:為弱關(guān)聯(lián)(點線)和規(guī)則關(guān)聯(lián)(正常線)指定一個數(shù)字。 20.9.5 創(chuàng)建一個網(wǎng)絡(luò)圖匯總創(chuàng)建一個網(wǎng)絡(luò)圖匯總 用戶可以創(chuàng)建一個列出強、中等和弱鏈接的網(wǎng)絡(luò)圖匯 總文件,這個文件是通過點擊工具欄上的黃色雙箭頭 按鈕來擴展網(wǎng)絡(luò)圖圖像。然后選擇“匯總”頁簽來查 看每種類型的鏈接表。對每個表使用觸發(fā)按鈕可以進 行表的擴展或隱藏,如圖20-33所示。 圖圖20-33 引出各字

28、段之間關(guān)聯(lián)的網(wǎng)絡(luò)圖匯總引出各字段之間關(guān)聯(lián)的網(wǎng)絡(luò)圖匯總 20.9 評估節(jié)點圖評估節(jié)點圖 圖圖20-34 評估節(jié)點的設(shè)置項評估節(jié)點的設(shè)置項 相關(guān)參數(shù)說明如下: 圖表類型:提供5種類型包括收益圖、響應(yīng)圖、提升圖、利潤圖、投資 回報圖。 積累散點圖:選擇建立一個積累的圖表。積累圖中的變量值將被繪制為每 個分位點與所有更高點相加的和。 包含基線:選擇在圖中包括一個基線。 散點圖:從下拉列表中選擇將要繪制在圖表中的分位點的大小。 樣式 :選擇“線”或者“點”單選按鈕。 點類型:通過下拉選項選擇其中一個來指定點的類型,其包括:矩形、三 角形、五角形、六角形、點、加號、星形等。 評估圖展示了模型在預(yù)測某些特殊

29、結(jié)果時是如何執(zhí)行的 ,具體實現(xiàn)的步驟如下: 以預(yù)測值和對預(yù)測的置信度為基礎(chǔ)來為記錄分類。 將記錄劃分為同樣大小的組。 由高到低的為每一個分位點繪制商業(yè)標準的變量值。 多個模型在圖中被表示為多條相互獨立的線。 20.9.1 收益圖表收益圖表 收益被定義為在每個分位點上的成功總數(shù)的一定百分比。它是 用公式“(百分點位上的成功數(shù)/總的成功數(shù))*100%”來計算 的。收益圖表如圖20-35所示。 圖圖20-35 收益圖表收益圖表 20.9.2 響應(yīng)圖表響應(yīng)圖表 響應(yīng)就是簡單的分位點中的成功數(shù)占記錄數(shù)的百分比。它是用公式“(分 位點中的成功數(shù)、分位點中的記錄數(shù))*100”來計算的。用線表示的響 應(yīng)圖表如

30、圖20-36所示。 圖圖20-36 響應(yīng)圖表響應(yīng)圖表 20.9.3 提升圖表提升圖表 提升是將在每個分位點中成功數(shù)占記錄數(shù)的百分比與在訓(xùn)練數(shù)據(jù)中成功數(shù) 所占百分比做比較。它是用公式(分位點中成功數(shù)/分位點中記錄數(shù))/(總 成功數(shù)/總記錄數(shù))來計算的。提升圖表如圖20-37所示。 圖圖20-37 提升圖表提升圖表 20.9.4 利潤圖表利潤圖表 利潤等于每個記錄的收入減去此記錄的成本。一個分位點的利潤就是分位 點中所有記錄利潤的簡單加總。利潤通常被假設(shè)為只能應(yīng)用于成功,但成 本卻可以應(yīng)用于所有記錄。利潤和成本可以被固定或者按照數(shù)據(jù)中的字段 被定義。利潤是用公式“(分位點中所有記錄收入總和分位點中

31、所有記 錄成本總和”來計算的。 用線表示的利潤圖如圖19-38所示。 圖圖20-38 利潤圖表利潤圖表 20.9.5 投資回報率圖表投資回報率圖表 投資回報率與利潤是相似的,它們都包括了收入和成本的定義。投資回報 率是將分位點中的利潤與成本作比較。它是用公式“(分位點中的利潤/分 位點中成本)*100”來計算的。投資回報率圖表如圖20-39所示。 圖圖20-39 投資回報率圖表投資回報率圖表 20.9.6 讀取模型評估的結(jié)果讀取模型評估的結(jié)果 20.9.6.1 收益圖表收益圖表 累積收益圖表從左端到右端以0%為起點,以100%為 終點。對于一個好的模型來說,收益圖表將陡峭地升 高到100然后漸

32、漸變得平緩。而一個沒有提供任何 信息的模型將從較低的左端以斜對角線形狀上升到較 高的右端。 20.9.6.2 響應(yīng)圖表響應(yīng)圖表 累積響應(yīng)圖表基本上與提升圖表相似。只是縮放比例 尺有所不同。響應(yīng)圖表通常是從100%附近開始,逐 漸下降直到它們到達了圖表右端的整體響應(yīng)率為止。 對于一個好的模型來說, 這條線在左端將從 100附 近或恰好在 100上開始, 當(dāng)用戶向右移動時能夠保 持一個較高的穩(wěn)定狀況,然后在圖表右端突然急劇地 下降到整體響應(yīng)率。對沒有提供任何信息的模型來說 ,整個圖像中曲線將一直在整體響應(yīng)率附近圍繞。 20.9.6.3 提升圖表提升圖表 累積提升圖表趨向于從左到右,以高于1.0為起

33、始逐漸 下降直到到達1.0為止。圖表的右端邊緣代表的是整 個數(shù)據(jù)集,因此,累積圖的分位點中成功數(shù)與數(shù)據(jù)中 成功數(shù)的比率為1.0。對于一個好的模型來說,應(yīng)該 是恰好從左端高于 1.0 處開始,當(dāng)用戶移動到右邊時 能夠保持在一個高度穩(wěn)定的水平上,然后到圖像右端 時突然急劇地減小到 1.0。而對于一個沒有提供任何 信息的模型來說,整個圖像中曲線將一直在 1.0 附近 圍繞。 20.9.6.4 利潤圖表利潤圖表 累積利潤圖表顯示的是當(dāng)用戶從左端移動到右端,來 增加選定樣本的規(guī)模是利潤的總和。利潤圖表通常是 從0附近開始,隨著用戶移動到右端穩(wěn)定的增加,直 到它們在中部達到一個最高點或平穩(wěn)段,然后向表右

34、端邊緣逐漸下降。對于一個好的模型來說,利潤圖表 將會在圖表中部的某個地方展現(xiàn)一個定義得很好的最 高點。對于一個沒有提供任何信息的模型來說,這條 線將會相對地比較直。并且依據(jù)所應(yīng)用的成本/收入結(jié) 構(gòu)的不同可能是漸增的、漸減的或水平的。 20.9.6.5 投資回報率圖表投資回報率圖表 積累投資回報率圖表趨向于與響應(yīng)圖表和提升圖表相 似,除了縮放比例有所不同。投資回報圖表通常從高 于0%開始,逐漸下降直到它們到達整個數(shù)據(jù)集的整 體投資回報率為止。對于一個好的模型來說,這條線 應(yīng)該恰好在 0以上開始,隨著用戶向右端移動能夠 保持一個較高的平穩(wěn)狀態(tài),然后急劇地變小到圖表右 端的整體投資回報率。對于一個沒

35、有提供任何信息的 模型來說,這條線應(yīng)該在整體投資回報率附近圍繞。 20.10 時間散點圖的顯示時間散點圖的顯示 圖圖20-40 時間散點圖節(jié)點參數(shù)設(shè)置時間散點圖節(jié)點參數(shù)設(shè)置 相關(guān)參數(shù)說明如下: 系列:選擇系列。 在單獨面板上顯示系列:選擇此項,表示如果有兩個或多個以 上序列時,那么這些序列圖將顯示在不同的圖上,而不是共同 坐標軸。 標準化:此項是為了能在圖表上顯示而將所有x,y變量值按 比例縮小到0和1之間。 顯示:提供3種顯示方式(線、點和平滑線)。 限制記錄可繪制的最大記錄數(shù):用戶可以自定義畫點圖是需要 的記錄數(shù)的最大值。 圖圖20-53 一張時間散點圖一張時間散點圖 20.11狀態(tài)檢測范例 例20-1:利用clementine系統(tǒng)提供的數(shù)據(jù)集 cond1n,對一臺機器提供的狀態(tài)信息進行監(jiān)測 ,識別和預(yù)測故障狀態(tài)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論