版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
《統(tǒng)計軟件》報告聚類分析和方差分析在統(tǒng)計學(xué)成果分析中的應(yīng)用班級:精算0801班姓名:張倪學(xué)號:2008111500報告時間:2011年11月指導(dǎo)老師:郝際貴成績:目錄一、背景及數(shù)據(jù)來源 2二、描述性統(tǒng)計分析 3三、聚類分析 5四、方差分析 8五、結(jié)果分析與結(jié)論 10聚類分析和方差分析在統(tǒng)計學(xué)成果分析中的應(yīng)用一、背景及數(shù)據(jù)來源SAS系統(tǒng)全稱為StatisticsAnalysisSystem,最早由北卡羅來納高校的兩位生物統(tǒng)計學(xué)探討生編制,并于1976年成立了SAS軟件探討所,正式推出了SAS軟件。SAS是用于決策支持的大型集成信息系統(tǒng),但該軟件系統(tǒng)最早的功能限于統(tǒng)計分析,至今,統(tǒng)計分析功能也仍是它的重要組成部分和核心功能。SAS系統(tǒng)是一個組合軟件系統(tǒng),它由多個功能模塊組合而成,其基本部分是BASESAS模塊。BASESAS模塊是SAS系統(tǒng)的核心,擔(dān)當(dāng)著主要的數(shù)據(jù)管理任務(wù),并管理用戶運(yùn)用環(huán)境,進(jìn)行用戶語言的處理,調(diào)用其他SAS模塊和產(chǎn)品。也就是說,SAS系統(tǒng)的運(yùn)行,首先必需啟動BASESAS模塊,它除了本身所具有數(shù)據(jù)管理、程序設(shè)計及描述統(tǒng)計計算功能以外,還是SAS系統(tǒng)的中心調(diào)度室。它除可單獨存在外,也可與其他產(chǎn)品或模塊共同構(gòu)成一個完整的系統(tǒng)。各模塊的安裝及更新都可通過其安裝程序特別便利地進(jìn)行。本文利用SAS軟件進(jìn)行描述性統(tǒng)計、聚類分析等統(tǒng)計分析方法,將學(xué)生依據(jù)多指標(biāo)綜合考慮進(jìn)行聚類。數(shù)據(jù)來源:選取2010—2011第一學(xué)期統(tǒng)計學(xué)選教課成果單,選取性別系別等變量進(jìn)行考察。將中文名稱改為英文。數(shù)據(jù)類型如下所示:學(xué)號性別班級系部課程名稱老師平常成果期末成果總評學(xué)年數(shù)值型數(shù)值型字符型字符型字符型字符型數(shù)值型數(shù)值型數(shù)值型數(shù)值型SnSexclassdepttitleteacherS1S2S3year當(dāng)輸入字符型的變量時,須要加上符號$在該變量的后面,用于區(qū)分?jǐn)?shù)值型變量,所以用$來作為后綴。刪除缺考錯誤分?jǐn)?shù)等異樣值。命名為2010stat.xls二、描述性統(tǒng)計分析(一)導(dǎo)入數(shù)據(jù)首先建立永久磁盤路徑,導(dǎo)入數(shù)據(jù)集statlibnamepath"D:\sas\";run;(二)描述性統(tǒng)計分析然后進(jìn)行描述性統(tǒng)計對性別、平常成果、期末成果、總評成果進(jìn)行計算,代碼如下:procmeansdata=path.stat;varsexs1s2s3;run;輸出結(jié)果如下:從結(jié)果可以分析出,總體學(xué)生平常成果平均分為86.28分,總評成果均分為77.15分。依據(jù)系別分類,每個系進(jìn)行描述性統(tǒng)計,代碼如下:procmeansdata=path.stat;varsexs1s2s3; classdept;run;運(yùn)行的輸出結(jié)果如下所示:從結(jié)果可以分析得出,各個系別學(xué)生成果的均值、觀測值、標(biāo)準(zhǔn)差及最大值和最小值。其中,會計系、財政系和市場營銷系人數(shù)眾多,除了經(jīng)濟(jì)系、市場營銷系和留學(xué)生以外,各系都有100分。(三)統(tǒng)計圖繪制頻率直方圖,直方圖可以良好的反映各系的人數(shù)和性別比例。代碼如下所示:procgchartdata=path.stat;vbardept/type=sumsubgroup=sex;run;統(tǒng)計直方圖如下所示:直方圖的橫軸是系別變量,縱軸是人數(shù)。藍(lán)色是男生紅色是女生。依據(jù)直方圖顯示會計系、營銷系、財政系三系人數(shù)最高。分別表示各系別男女生人數(shù)分布。三、聚類分析輸入代碼:procclusterdata=path.statmethod=wardouttree=treestandardpseudoccc;proctreedata=treegraphicshorizontal;run;上述程序說明白運(yùn)用系統(tǒng)聚類法來進(jìn)行探討,并且繪制出聚類分析結(jié)果的樹狀圖。ccc說明須要計算半偏R2、R2和CCC統(tǒng)計量。這三個統(tǒng)計量和下面的偽F和偽T2統(tǒng)計量主要用于檢驗聚類的效果。當(dāng)把數(shù)據(jù)從G+1類合并為G類時,半偏R2統(tǒng)計量說明白本次合并信息的損失程度,半偏R2統(tǒng)計量大說明信息的損失程度大。R2統(tǒng)計量反映了類內(nèi)離差平方和的大小,R2統(tǒng)計量大說明類內(nèi)離差平方和小。CCC統(tǒng)計量的值大說明聚類的效果好。Pseudo說明要計算偽F和偽T2統(tǒng)計量一般認(rèn)為偽F統(tǒng)計量在出現(xiàn)峰值的是所對應(yīng)的分類是較佳的分類選擇。當(dāng)把數(shù)據(jù)從G+1類合并為G類時,假如偽T2統(tǒng)計量的值大,說明不應(yīng)當(dāng)合并這兩類。后面的tree過程是用來繪制聚類分析結(jié)果的樹狀圖。運(yùn)行結(jié)果如下:上面的運(yùn)行結(jié)果給出了對樣品的聚類過程。SPRSQ為半偏R2統(tǒng)計量、RSQ為R2統(tǒng)計量、CCC為立方聚類標(biāo)準(zhǔn)、PSF為偽F統(tǒng)計量、PST2為偽T2統(tǒng)計量。結(jié)果分析:從半偏R2統(tǒng)計量的結(jié)果可以看出,當(dāng)樣本數(shù)據(jù)從3類合并為2類時,信息的損失程度較前面的的合并有明顯的增加。從R2統(tǒng)計量的結(jié)果可以看出,當(dāng)樣本數(shù)據(jù)從3類合并為2類時,R2統(tǒng)計量較前面的合并顯著減小,這意味著類內(nèi)離差平方和增加,違反了Word,s的分類原則。從CCC統(tǒng)計量的結(jié)果可以看出,最大值對應(yīng)的類數(shù)為3類。從6類合并為5類時,偽T2統(tǒng)計量顯著增加,偽T2統(tǒng)計量下降顯著。由聚類分析的分析結(jié)果的樹狀圖可知分為3類也是符合圖形的。綜合各類統(tǒng)計量的結(jié)果,學(xué)生的統(tǒng)計學(xué)成果分為3類比較合適。四、方差分析輸入代碼:procglm;classsexs3;models3=sexs3sex*s1/ss1ss2ss3ss4;meanss1/duncan;run;輸出結(jié)果如下所示:從輸出結(jié)果可以看出,平常成果對總評成果有顯著的影響。性別對成果影響中,女生成果要優(yōu)于男生,平均分比男生高,方差比男生小??梢?,在平常成果和性別對學(xué)生統(tǒng)計學(xué)總評成果的影響。五、結(jié)果分析與結(jié)論本文選取2010—2011年統(tǒng)計學(xué)成果作為樣本數(shù)據(jù),運(yùn)用SAS軟件先對學(xué)生成果進(jìn)行描述性統(tǒng)計分析,再選用聚類分析法,最終進(jìn)行方差分析。聚類分析(ClusterAnalysis)依據(jù)樣品的統(tǒng)計量將相像程度較大的樣品聚合到一個小的分類單位,相像程度較小的聚合到一個大的分類單位,使得同一類中的對象之間的相像性比與其他類的對象的相像性更強(qiáng),直到把全部的樣品都聚合完畢,形成一個由小到大的分類系統(tǒng),并將整個分類系統(tǒng)畫成一張譜系圖。方差分析(AnalysisofVariance)由于各種因素的影響,探討所得的數(shù)據(jù)呈現(xiàn)波動狀。造成波動的緣由可分成兩
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 四氯化鈦建設(shè)項目可行性研究報告申請立項備案
- 2025商鋪店面裝修合同范文
- 二零二五版墓地所有權(quán)轉(zhuǎn)讓與維護(hù)協(xié)議3篇
- 二零二五年度木材產(chǎn)業(yè)園區(qū)建設(shè)與運(yùn)營合作協(xié)議3篇
- 二零二四年度新能源儲能信息保密與市場合作合同3篇
- 2025版木雕工藝品產(chǎn)業(yè)鏈上下游企業(yè)合作框架協(xié)議4篇
- 2025版牧業(yè)廢棄物處理技術(shù)合作協(xié)議3篇
- 二零二五版智慧城市10千伏電力施工項目合同范本2篇
- 2025年度食品產(chǎn)品貨款抵押與質(zhì)量安全保證合同4篇
- 壽縣瀝青砼施工方案
- 2025水利云播五大員考試題庫(含答案)
- 中藥飲片驗收培訓(xùn)
- DB34T 1831-2013 油菜收獲與秸稈粉碎機(jī)械化聯(lián)合作業(yè)技術(shù)規(guī)范
- 創(chuàng)傷處理理論知識考核試題及答案
- 稅前工資反算表模板
- 2019級水電站動力設(shè)備專業(yè)三年制人才培養(yǎng)方案
- 肝素誘導(dǎo)的血小板減少癥培訓(xùn)課件
- 抖音認(rèn)證承諾函
- 高等數(shù)學(xué)(第二版)
- 四合一體系基礎(chǔ)知識培訓(xùn)課件
- ICD-9-CM-3手術(shù)與操作國家臨床版亞目表
評論
0/150
提交評論