![應(yīng)用多元分析之聚類分析_第1頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2021-12/25/97ce7f97-8b8c-4a44-91d4-d7b46c522ad3/97ce7f97-8b8c-4a44-91d4-d7b46c522ad31.gif)
![應(yīng)用多元分析之聚類分析_第2頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2021-12/25/97ce7f97-8b8c-4a44-91d4-d7b46c522ad3/97ce7f97-8b8c-4a44-91d4-d7b46c522ad32.gif)
![應(yīng)用多元分析之聚類分析_第3頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2021-12/25/97ce7f97-8b8c-4a44-91d4-d7b46c522ad3/97ce7f97-8b8c-4a44-91d4-d7b46c522ad33.gif)
![應(yīng)用多元分析之聚類分析_第4頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2021-12/25/97ce7f97-8b8c-4a44-91d4-d7b46c522ad3/97ce7f97-8b8c-4a44-91d4-d7b46c522ad34.gif)
![應(yīng)用多元分析之聚類分析_第5頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2021-12/25/97ce7f97-8b8c-4a44-91d4-d7b46c522ad3/97ce7f97-8b8c-4a44-91d4-d7b46c522ad35.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、用聚類分析探究現(xiàn)實(shí)中的物以類聚人以群分研究目的:用聚類分析的方法,嘗試對(duì)現(xiàn)實(shí)中的人群進(jìn)行分類,然后與現(xiàn)實(shí)中已存在的小團(tuán)隊(duì)相比較,探究此方法用于人群分類的可行性研究意義:因?yàn)榇舜蔚臄?shù)據(jù)只來(lái)自本班的同學(xué),樣本小,代表性差,更多的只是滿足一下自己的好奇心,并沒(méi)有太大的意義。自己只是想試試看能不能成功分類,并借此方法驗(yàn)證一下的自己想法,要是能成功,就權(quán)當(dāng)給大家作為一個(gè)交友參考研究步驟:首先,選取本班同學(xué)作為樣本,一是收集數(shù)據(jù)方便,二是因?yàn)檫@樣更容易得知自己結(jié)果的可靠性如何然后給與每個(gè)同學(xué)附以各項(xiàng)屬性值,由于是學(xué)生,成績(jī)將被列為第一屬性,其次再加入性別、身高體重等指標(biāo)值。出于簡(jiǎn)單考慮,暫且各項(xiàng)屬性指標(biāo)的
2、權(quán)重相同 在此次模型中,為什么要加入成績(jī)呢,因?yàn)橐话阍谝黄鹜嫠5男』锇槌煽?jī)都不會(huì)相差太遠(yuǎn),但實(shí)際情況中,對(duì)于成績(jī)很好與成績(jī)很差的同學(xué)這個(gè)規(guī)律就不太適用,所以這也是模型的不合理之處,雖然將數(shù)據(jù)做了標(biāo)準(zhǔn)化的處理,但從分析出的結(jié)果來(lái)看,成績(jī)很好的更多的是被歸為一類,但這個(gè)與我們現(xiàn)實(shí)情況并不相符。其次,我為什么加入體側(cè)的成績(jī),因?yàn)轶w側(cè)的成績(jī)可以反映一個(gè)人的身體素質(zhì)與熱愛運(yùn)動(dòng)的程度,一般喜歡運(yùn)動(dòng)的會(huì)與喜歡運(yùn)動(dòng)的一起,不喜歡運(yùn)動(dòng)的一般更多會(huì)選擇同樣不喜歡運(yùn)動(dòng)的作伴,但是這個(gè)體側(cè)數(shù)據(jù)體現(xiàn)更多的是反映體能的數(shù)據(jù)而非興趣愛好,所以這是數(shù)據(jù)本身的不合理之處,但由于沒(méi)有更好的數(shù)據(jù),所以求其次,因此反映到結(jié)果上當(dāng)然也
3、是次的。 至于為什么想加入身高體重,則完全是個(gè)人猜想,畢竟有個(gè)形象理論嘛,就是人們?cè)谏缃恢袝?huì)更傾向與自己形態(tài)相似的人,所以加進(jìn)去只是想看看有沒(méi)有改善結(jié)果,事實(shí)證明,結(jié)果并沒(méi)有太大的改善,至于原因還有待研究 由上圖四個(gè)表得知,最長(zhǎng)距離法與類平均法分類的準(zhǔn)確度相對(duì)較高。但由于只有原數(shù)據(jù)只有數(shù)值型指標(biāo)(除性別屬性外),并且那八個(gè)數(shù)值型指標(biāo)中有些指標(biāo)相互之間有很強(qiáng)的相關(guān)性。所以結(jié)果并不盡人意。而且從上訴四種方法中分類較好的類平均法,其準(zhǔn)確度為 嚴(yán)格準(zhǔn)確度=與現(xiàn)實(shí)一致的類的個(gè)數(shù)/分類總個(gè)數(shù)=4/15 非嚴(yán)格準(zhǔn)確度=包含現(xiàn)實(shí)小團(tuán)體的類的個(gè)數(shù)/分類總個(gè)數(shù)=9/15 從結(jié)果上看,此次的模型是失敗的,因?yàn)槠渲杏?/p>
4、很多不足甚至不合理之處,粗糙度過(guò)高,但因此后續(xù)的改進(jìn)方向有1、 加入用戶行為數(shù)據(jù)指標(biāo)與性格屬性指標(biāo)(當(dāng)數(shù)值型指標(biāo)與非數(shù)值型指標(biāo)混在一起時(shí),我也不知怎么處理)2、 采用主成分分析,找出貢獻(xiàn)率最大的指標(biāo)3、 給予各指標(biāo)不同權(quán)重(只學(xué)過(guò)回歸的加權(quán),想這種分類的加權(quán)還真不知道怎么做,所以還有待研究)程序:install.packages("plyr")library(plyr)rm(list=ls()y=read.csv(file="dada.csv",header=T)fix(y)attach(y)dim(y)s(y)=y,1y=y,-1d=d
5、ist(scale(y) hc1=hclust(d) opar=par(mfrow=c(1,1), mar=c(4,2,2,0.01) plclust(hc1, hang = -1,main = "表1-1 最短距離法")rect.hclust(hc1, k=15, border="blue") hc2=hclust(d,"average") #類平均法opar=par(mfrow=c(1,1), mar=c(4,2,2,0.1) plclust(hc2,hang=-1,main = "表1-2 類平均法") re
6、ct.hclust(hc2, k=15, border="red") hc3=hclust(d,"centroid") #重心法opar=par(mfrow=c(1,1), mar=c(4,2,2,0.1) plclust(hc3,hang=-1,main = "表1-3 重心法")rect.hclust(hc3,k=15,border="yellow")hc4=hclust(d,"ward") #ward法opar=par(mfrow=c(1,1), mar=c(4,2,2,0.1) plclust(hc4,hang=-1,main = "表1-4 ward法")rect.hclust(hc4,k=10,border="green")dist.e=dist(y,method='euclidean')heatmap(as.matri
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年浙江公務(wù)員考試行測(cè)試題(A卷)
- 學(xué)習(xí)培訓(xùn)指導(dǎo)服務(wù)協(xié)議書(7篇)
- 2025年企業(yè)員工流動(dòng)性協(xié)議書
- 2025年彩涂板(卷)項(xiàng)目申請(qǐng)報(bào)告模板
- 2025年促銷禮品租賃合同文本
- 2025年音頻切換臺(tái)項(xiàng)目立項(xiàng)申請(qǐng)報(bào)告模板
- 2025年汽車保養(yǎng)維修服務(wù)合同示例
- 2025年保險(xiǎn)公司合作綜合協(xié)議
- 2025年共同投資申請(qǐng)諒解協(xié)議框架
- 2025年企業(yè)復(fù)蘇與和解協(xié)議大綱
- 銀行營(yíng)銷術(shù)語(yǔ)演練
- 醫(yī)院培訓(xùn)課件:《成人住院患者靜脈血栓栓塞癥的預(yù)防護(hù)理》
- 學(xué)校食品安全教育學(xué)習(xí)活動(dòng)食品安全講座課件
- 2024年河北省公務(wù)員考試《行測(cè)》真題及答案解析
- 綠色建筑項(xiàng)目造價(jià)咨詢服務(wù)方案
- 2024-2030年中國(guó)高油酸花生油市場(chǎng)供需趨勢(shì)與營(yíng)銷推廣渠道分析研究報(bào)告
- GB/T 44717-2024民用無(wú)人機(jī)可靠性飛行試驗(yàn)要求與方法
- 五年級(jí)上冊(cè)數(shù)學(xué)小數(shù)四則混合運(yùn)算練習(xí)100道及答案
- 2024年廣東省中考地理試題(含解析)
- 西安經(jīng)濟(jì)技術(shù)開發(fā)區(qū)管委會(huì)招聘考試真題
- 冀教版小學(xué)英語(yǔ)六年級(jí)下冊(cè)全冊(cè)教案
評(píng)論
0/150
提交評(píng)論