用EXCEL進(jìn)行模糊聚類(lèi)分析 - 圖文-_第1頁(yè)
用EXCEL進(jìn)行模糊聚類(lèi)分析 - 圖文-_第2頁(yè)
用EXCEL進(jìn)行模糊聚類(lèi)分析 - 圖文-_第3頁(yè)
用EXCEL進(jìn)行模糊聚類(lèi)分析 - 圖文-_第4頁(yè)
用EXCEL進(jìn)行模糊聚類(lèi)分析 - 圖文-_第5頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第13卷第2期2000年6月聊城師院學(xué)報(bào)(自然科學(xué)版J ou rnal of Liaochen g T each ers U nivers ity(Nat.Sci.Vol.13No.2Ju n.2000用EXCEL進(jìn)行模糊聚類(lèi)分析a王文德1鞏建閩2石鳳來(lái)3(1聊城師范學(xué)院計(jì)算機(jī)系,聊城252059;2德州高專(zhuān);3聊城市建行摘要聚類(lèi)分析是統(tǒng)計(jì)方法中多元數(shù)據(jù)分析的三大方法之一,也是數(shù)據(jù)挖掘技術(shù)研究的方法之一,本文介紹了用電子表格軟件Ex cel實(shí)現(xiàn)模糊聚類(lèi)分析的方法.關(guān)鍵詞Excel,模糊聚類(lèi)分析,聚類(lèi)分析分類(lèi)號(hào)TP39作為一個(gè)國(guó)際流行的電子表格軟件,Ex cel的數(shù)據(jù)處理與統(tǒng)計(jì)分析、直觀的圖表功

2、能,為用戶(hù)提供了極大的方便.利用Excel“分析工具庫(kù)”中的分析工具(Excel為用戶(hù)提供了許多統(tǒng)計(jì)、金融和工程等函數(shù)可以進(jìn)行較為復(fù)雜的統(tǒng)計(jì)或工程分析.Excel也是工程技術(shù)人員、科研人員進(jìn)行數(shù)據(jù)處理與分析的有效工具之一.利用Excel的文件格式轉(zhuǎn)換器,可以打開(kāi)許多類(lèi)型的數(shù)據(jù)文件,如格式化文本文件. Lotusl-2-3的文件以及國(guó)內(nèi)眾多用戶(hù)使用的XBase的.dbf文件.這為用戶(hù)使用Ex cel進(jìn)行數(shù)據(jù)處理與分析提供了極大的方便,彌補(bǔ)了許多M IS管理軟件的不足.本文用Ex cel實(shí)現(xiàn)了對(duì)象間的模糊聚類(lèi)分析.聚類(lèi)分析是統(tǒng)計(jì)方法中多元數(shù)據(jù)分析的三大方法之一,也是當(dāng)前人們研究數(shù)據(jù)挖掘(Data

3、M ining技術(shù)的工具和方法之一,模糊聚類(lèi)分析是利用模糊數(shù)學(xué)的觀點(diǎn)來(lái)進(jìn)行分類(lèi),它是眾多聚類(lèi)分析方法中的一種.1模糊聚類(lèi)分析的數(shù)學(xué)模型假設(shè)有n個(gè)要進(jìn)行分類(lèi)的對(duì)象(樣本,記為x1,x2,x n,每個(gè)對(duì)象(樣本x i(i=1,2,n有m個(gè)量化的指標(biāo),記為x i1,x i2,x im,可以把每一個(gè)對(duì)象看成m維空間中的一個(gè)點(diǎn).把樣本列表表示如表1.顯然,表中的數(shù)據(jù)可以十分容易地在Excel中予以表示.表1指標(biāo)x1x2x3x4 y1x11x21x n1 y2x12x22x n2y m x1m x2mx nm聚類(lèi)分析的目的就是要把n個(gè)樣本對(duì)象按照一定的標(biāo)準(zhǔn)進(jìn)行“物以類(lèi)聚”.為此首先要定義樣本之間的距離或樣

4、本之間的相似系數(shù).樣本x i與x j的距離或相似數(shù)記為d ij,d ij 的定義方法很多,在Ex cel中的計(jì)算也比較容易.假設(shè)通過(guò)計(jì)算得到樣本x1,x2,x n間a收稿日期:1999-11-20的模糊矩陣RR =d 11d 12d 1n d 21d 22d 2n d n 1d n 2d nn.由于R 不一定是模糊關(guān)系矩陣,為此需要通過(guò)平方法對(duì)R 進(jìn)行改造,把模糊矩陣改造為模糊關(guān)系矩陣.即利用模糊矩陣的乘法:R 2=R .R ,R 2k =R k .R k ,k =1,2,4,直到找到最小的k ,使R 2k =R k 成立.記R =R k,則R 就是模糊關(guān)系矩陣.模糊聚類(lèi)分析依據(jù)模糊關(guān)系矩陣R

5、 進(jìn)行,取水平K 滿(mǎn)足0K 1,依次比較R 中的各元素,若該元素大于等于K ,則令該元素為1,否則為0,得到K 截矩陣R K ,由R K 進(jìn)行分類(lèi).記R 2=(d *ij ,d *ij 的計(jì)算公式為d *ij=nk =1(d jk d kj (i ,j =1,2,n .(12模糊聚類(lèi)分析的Excel 實(shí)現(xiàn)在Excel 工作表(sheet中樣本按下列條件x j k =1當(dāng)x i 具有第k 個(gè)特征時(shí),0當(dāng)x i 不具有第k 個(gè)特征時(shí),i =1,2,n ,k =1,2,m建立數(shù)據(jù)1,這里x ik 表示第i 個(gè)樣本的第k 個(gè)特征.為了確定樣本x i 與x j 的距離或相似數(shù),本例中將相似系數(shù)d ij

6、定義為d ij =mk =1xikx jk +mk =1(1-x ik (1-x jk m ,i ,j =1,2,n ,其中的分子部分為x i 與x j 所有對(duì)應(yīng)的取值中相同的個(gè)數(shù);若對(duì)應(yīng)的取值中相同的個(gè)數(shù)多,d ij 就大,說(shuō)明兩者關(guān)系近.反之,d ij 就小,說(shuō)明兩者關(guān)系遠(yuǎn).由于d ij 的計(jì)算只涉及兩列數(shù)據(jù)的乘積之和,因此利用Ex cel 的計(jì)算與填充功能進(jìn)行計(jì)算是十分容易的.在計(jì)算過(guò)程中應(yīng)注意靈活使用Ex cel 相對(duì)地址和絕對(duì)地址,這樣可以極大地提高計(jì)算效率.為了表述方便,我們僅取實(shí)際問(wèn)題中前5個(gè)樣本進(jìn)行聚類(lèi)R =A BCDE1 1.0020.71 1.0030.630.49 1.0

7、040.600.530.581.0050.680.670.480.49 1.00(原問(wèn)題參加聚類(lèi)的樣本=13,量化指標(biāo)=93,計(jì)算得到R (按sheet 中的表示.現(xiàn)在的問(wèn)題要對(duì)R 進(jìn)行平方法改造,按公式(1進(jìn)行矩陣的模糊乘法運(yùn)算,設(shè)在工作表(sheet中的數(shù)據(jù)安排如下31第2期王文德等:用EXCEL 進(jìn)行模糊聚類(lèi)分析 A B C D E1 1.000.710.630.600.6820.71 1.000.490.530.6730.630.49 1.000.580.4840.600.530.58 1.000.4950.680.670.480.491.00FG H I J 1.000.710.63

8、0.600.680.71 1.000.490.530.670.630.49 1.000.580.480.600.530.58 1.000.490.680.670.480.491.00K=L M N O P 1.000.710.630.600.680.71 1.000.630.600.680.630.63 1.000.600.630.600.600.60 1.000.600.680.680.630.601.00.其中,區(qū)域A1:E5為模糊矩陣R ,區(qū)域F1:J5為R 的副本,區(qū)域L1:P5為按公式(1計(jì)算的模糊矩陣R 2.在具體計(jì)算過(guò)程中,我們可以充分利用Ex cel 提供的函數(shù)來(lái)完成這一計(jì)算過(guò)

9、程,在引用單元格時(shí)應(yīng)靈活使用相對(duì)地址和絕對(duì)地址,這樣可以做到事半功倍.例如單元格L1中的函數(shù)表達(dá)式為=M AX(M IN (ÇA1,F Ç1,MIN (ÇB1,F Ç2,MIN (ÇC 1,F Ç3,MIN (ÇD 1,F Ç4,MIN (ÇE1,F Ç5圖1給出了在L1中嵌套使用函數(shù)的過(guò)程.用類(lèi)似辦法,通過(guò)數(shù)據(jù)和表達(dá)式的復(fù)制,不難計(jì)算出R 4=R 2.最終的模糊關(guān)系矩陣R (=R 2.模糊聚類(lèi)分析依據(jù)R 進(jìn)行,取水平K 滿(mǎn)足0K 1,依次比較R 中各元素,若該元素大于等于K ,則令該元素為1,

10、否則為0,得到K 截矩陣R K ,由R K 進(jìn)行分類(lèi).分別取K =0.60,0.63,0.68,0.7,可以得到R =L M N O P7 1.0080.71 1.0090.630.63 1.00100.600.600.60 1.00110.680.680.630.601.00相應(yīng)的分類(lèi)結(jié)果.實(shí)際操作中,我們可以利用IF(函數(shù),把K 的值作為變量存放在一個(gè)單元格中,本例中我們把K 的值放在單元格F13中.這樣,只需在單元格F13中輸入不同的K 值,就可以動(dòng)態(tài)地得到不同的分類(lèi)結(jié)果.在單元格L7中的計(jì)算公式如圖2所示.32聊城師院學(xué)報(bào)(自然科學(xué)版第13卷例如,在單元格F 13中輸入0.63,即讓K

11、 =0.63,可自動(dòng)得到分類(lèi)結(jié)果.這表明樣本分為兩類(lèi),一類(lèi)是x 1,x 2,x 3,x 5,另兩類(lèi)是x 4.實(shí)際上,只要靈活地應(yīng)用Ex cel ,如果再配合使用V BA R 0.63=L M N O P11211311140001511101及Excel 的宏功能,可以解決許多的實(shí)際問(wèn)題.筆者曾利用Ex cel 為一些單位進(jìn)行過(guò)諸如多元回歸分析、相關(guān)分析等統(tǒng)計(jì)分析工作.由于統(tǒng)計(jì)分析結(jié)果圖文并茂,用戶(hù)容易接受和掌握分析方法.在人們開(kāi)始重視數(shù)據(jù)挖掘(KDD的今天,當(dāng)各行各業(yè)已經(jīng)擁有了一些大大小小的數(shù)據(jù)庫(kù)系統(tǒng)時(shí),我們不僅要建立和管理好數(shù)據(jù)系統(tǒng),更應(yīng)該千方百計(jì)地利用已有的數(shù)據(jù),讓現(xiàn)有的數(shù)據(jù)發(fā)揮更大、更

12、有效的作用,為決策提供更加科學(xué)的依據(jù).在這方面,Excel 不失為數(shù)據(jù)處理與加工的一個(gè)良好工具,它的直觀性、用戶(hù)參與性,使得數(shù)據(jù)分析工作變的更容易為廣大技術(shù)人員掌握.參考文獻(xiàn)1肖蓓蕾,鞏建閩.從FU ZZY 聚類(lèi)分析的角度探討茄科的分類(lèi)地位.曲阜師范大學(xué)學(xué)報(bào),1989.22方開(kāi)泰,潘恩沛.聚類(lèi)分析.北京:地質(zhì)出版社,1982Making Fuzzy Clu stering Analysis with Microsoft ExcelWang Wende 1Gong Jianmin 2Shi Fenglai3(1Depar tm ent of Computer S cience ,Liaochen

13、g T eachers U nivers ity ,Liaochen g ;2Dezhou College;3Chin a Constru ction Bank Liaocheng Br anchAbstract Clustering analysis as a metho d of Data M ining is o ne o f the three metho d about M ultiv ar iate Statistics,this paper sho w s the w ay to make Fuzzy Cluttering Analysis w ith Microsoft Excel .Key words Excel ,Fuzzy Cluttering analysis ,Cluttering analysis (上接第29頁(yè)Realizing the Fill of Arbitbary Enclosed Graphic Zone by StackZheng Haiyang(Depar tm ent of M athem atics ,Guyuan T each ers College ,Guyuan 756000Abstract The paper discusses the algo rithm of re

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論