多元統(tǒng)計分析實驗報告聚類分析_第1頁
多元統(tǒng)計分析實驗報告聚類分析_第2頁
多元統(tǒng)計分析實驗報告聚類分析_第3頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、武漢理工大學(xué)實驗(實訓(xùn))報告項目名稱實驗2一聚類分析所屬課程名稱多元統(tǒng)計分析項目類型設(shè)計性實驗實驗(實訓(xùn))日期年月日班級學(xué)號姓名指導(dǎo)教師武漢理工大學(xué)統(tǒng)計學(xué)系制一、實驗(實訓(xùn))概述:【目的及要求】聚類分析的目的是將分類對象按一定規(guī)則分為若干類,這些類不是事先給定的,而是根據(jù)數(shù)據(jù)的特征確定的。在同一類里的這些對象在某種意義上傾向丁彼此相似,而在不同的類里的對象傾向丁不相似。按具體的題目要求完成實驗報告,并及時上傳到給定的FTP和課程網(wǎng)站!【基本原理】系統(tǒng)聚類法是聚類分析中用的最多的一種,其基本思想是:開始將n個對象各自作為一類,并規(guī)定對象之間的距離和類與類之間的距離,然后將距離最近的兩類合并成一個

2、新類,計算新類與其它類之間的距離;重復(fù)進行兩個最近類的合并,每次減少一類,直至所有的對象合并為一類?!緦嵤┉h(huán)境】(使用的材料、設(shè)備、軟件)SPSS等軟件二、實驗(實訓(xùn))內(nèi)容:【項目內(nèi)容】聚類分析?!痉桨冈O(shè)計】共含兩道題目:第一題為基丁距離矩陣的聚類分析;第二題為基丁原始數(shù)據(jù)的聚類分析三、指導(dǎo)教師評語及成績:成績:指導(dǎo)教師簽名:批閱日期:實驗報告2聚類分析(設(shè)計性實驗)實驗原理:聚類分析的目的是將分類對象按一定規(guī)則分為若干類,這些類不是事先給定的,而是根據(jù)數(shù)據(jù)的特征確定的。在同一類里的這些對象在某種意義上傾向丁彼此相似,而在不同的類里的對象傾向丁不相似。系統(tǒng)聚類法是聚類分析中用的最多的一種,其基

3、本思想是:開始將n個對象各自作為一類,并規(guī)定對象之間的距離和類與類之間的距離,然后將距離最近的兩類合并成一個新類,計算新類與其它類之間的距離;重復(fù)進行兩個最近類的合并,每次減少一類,直至所有的對象合并為一類。實驗題目一:為了對11種語言一一英語、挪威語、丹麥語、荷蘭語、德語、法語、西班牙語、意大利語、波蘭語、匈牙利語及芬蘭語進行比較研究,研究人員選取每種語言的1至10十個數(shù)字相應(yīng)的單詞列表分析。對丁同一數(shù)字,某兩種語言的第一個字母若相同,則稱這兩者在該數(shù)字上一致,否則非一致。將這11種語言兩兩比較后,計算每一對在十個數(shù)字上非一致的數(shù)目,得到下列距離矩陣:ENDaDuGFrSpIPHENDaDu

4、GFrSpIPHFic0A20210756064550666970665972066597110776108534098889101010100J99999999980(1) 對這11種語言分別用最小距離法(singlelinkage)、最大距離法(completelinkage)、平均距離法(averagelinkage進行聚類分析;(2) 畫出以上三種方法聚類分析結(jié)果的樹狀圖;(3) 結(jié)合三種方法的樹狀圖,你認為將11種語言分為哪幾類比較合適?(4) 用最大距離法將11種語言聚為3類,并將聚類結(jié)果存儲在一個SPSS數(shù)據(jù)文件中。實驗題目二:卜表給出了2010年湖北省省各地區(qū)的人均各項消費支出

5、情況表-1:2010年湖北省各地區(qū)人均各項消費支出市(縣)(代碼)食品類(元)衣著類(元)家庭設(shè)備(元)醫(yī)療保?。ㄔ┙煌ê屯ǎㄔ蕵方逃ㄔ┚幼。ㄔ┓?wù)項目(元)42013303645626.5444.1547.51079701442.942022985608845.1537590.51028706.7334.1420327445543806074968275823504204284362352945342466241440542053033527851.1317.5403.21347612.93384206288539474841645110637462614207325163254

6、24406759378543694208286450084158870992131438242093561566953.1463.1887.4967722.3434.3421026496671798372.3650.2844768.4541.74211243741013996714576348602234212237249779349340777443638942132200567708.6500.4781790.8606.5262.7實驗要求:(1)分別應(yīng)用最小距離法(singlelinkage)、最大距離法(completelinkage)、平均距離法(averagelinkage對湖北省的13個城市進行聚類分析;(2)畫出以上三種方法聚類分析結(jié)果的樹狀圖,比較異同;(3)用最小距離法將13個城市聚為3類,并將聚類結(jié)果存儲在一個SPSS數(shù)據(jù)文件中;(4)對表-1中的人均各項消費

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論