spss實驗報告冊_第1頁
spss實驗報告冊_第2頁
spss實驗報告冊_第3頁
spss實驗報告冊_第4頁
spss實驗報告冊_第5頁
已閱讀5頁,還剩78頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 spss統(tǒng)計軟件應用實驗報告冊20 13 20 14 學年 第 一 學期班 級: 學 號: 姓 名: 實驗教師: 實驗學時: 實驗組號: 目錄實驗一 spss的數(shù)據(jù)管理1實驗二 描述性統(tǒng)計分析13實驗三 均值檢驗21實驗四 相關(guān)分析27實驗五 方差分析34實驗六 繪制統(tǒng)計圖40實驗七 因子分析44實驗八 聚類分析48實驗九 判別分析58實驗十 回歸分析67實驗十一 非參數(shù)檢驗75實驗一 spss的數(shù)據(jù)管理1、 實驗目的1.熟悉spss的菜單和窗口界面,熟悉spss各種參數(shù)的設(shè)置;2.掌握spss的數(shù)據(jù)管理功能。二、實驗內(nèi)容及步驟: 1、定義spss數(shù)據(jù)結(jié)構(gòu)。下表是某大學的一個問卷調(diào)查,要求將

2、問卷調(diào)查結(jié)果表示成spss可識別的數(shù)據(jù)文件,利用spss軟件進行分析和處理。練習:創(chuàng)建數(shù)據(jù)文件的結(jié)構(gòu),即數(shù)據(jù)文件的變量和定義變量的屬性。表1 大學教師基本情況調(diào)查表問題備選答案1姓名2 性別3年齡4學歷5 工作年月6職稱7本年度教學工作量(課時)4(1)??疲?)本科(3)碩士(4)博士(5)博士后6 (1)助教(2)講師(3)副教授(4)教授7 (1)0120 (2)120240 (3)240320 (4)320480 (5) 480以上8 本年度公開發(fā)表論文數(shù)9 本年度您的科研經(jīng)費總額(萬元)10.您認為學校對科研人員每年的科研成果要求是否合理(1)合理 (2)不合理 (3)無所謂11 您

3、最常用的全文期刊數(shù)據(jù)庫的名稱(多選,限選2個)(1)cnki (2)萬方 (3)springerlink (4)ebsco12 您對學??蒲泄芾聿块T的工作是否滿意(1)非常滿意 (2)滿意 (3)一般 (4)不滿意實驗步驟:(1)打開定義變量的界面啟動spss,進入主界面,單擊圖6-2所示的屏幕左下角的“variable view”選項卡,打開定義變量的表格。(2)輸入變量名,符合變量的命名規(guī)則在“name”列的第一個單元格輸入第一個變量名,如 “xm”。(3)確定變量類型,單擊“type”列的第一個單元格,如圖6-3所示,spss的默認變量類型為數(shù)值型。單擊數(shù)值型變量后的“”,彈出如圖6-4

4、所示的對話框,用戶可以從該對話框中選擇其他的變量類型。(4)設(shè)置字段值(5)依次按要求輸入完畢即可。結(jié)果如下:2 、高校提前錄取名單的確定 某高校今年對部分考生采取單獨出題、提前錄取的招生模式?,F(xiàn)有20名來自國內(nèi)不同省市的考生報考該校,7個錄取名額。見數(shù)據(jù)文件compute.sav. 該校制定了如下錄取原則:(1)文化課成績由數(shù)學、語文、英語和綜合四門成績組成。文化課成績制定最低錄取分數(shù)線:400分。(2)個人檔案中若有“不良記錄”,不予錄取。(3)對西部考生和少數(shù)民族考生,給予加分優(yōu)惠。少數(shù)民族考生加20分,西部考生加10分。(4)對參加過省以上競賽并取得三等獎以上名次的考生,每項加10分。

5、(5)文化課成績和加分總和構(gòu)成綜合分,錄取綜合排名為前7名的學生。實驗步驟:(1)打開數(shù)據(jù)文件compute.sav.(2)計算文化課成績,選transform菜單的compute命令項,在target variable指定一個變量(文化課成績),在numeric expression框中鍵入運算公式(數(shù)學+語文+英語+綜合),然后單擊ok.(3)選data菜單的select cases命令項,彈出select cases對話框,選中if condition is satisfied,單擊if按鈕,彈出select cases:if對話框,輸入條件文化課成績大于等于400,單擊continue

6、 ,在彈出的select cases對話框中,unselected cases are選擇deleted,然后單擊ok.(4)重復第三步,條件是“不良記錄=0”(5)少數(shù)民族考生加分,選transform菜單的compute命令項,在target variable指定一個變量(少數(shù)民族加分),在numeric expression框中鍵入運算公式(民族1)*20,然后單擊ok.(6)西部考生加分,步驟類似與5, (7)獎項加分(8)求綜合成績(9)按照升序排序,選擇“datasort cases”命令,彈出“sort cases”對話框,把“綜合成績”變量選入“sort by”中,并在sort

7、 order中選擇“descending(升序)”選項,將綜合成績按升序排列,如圖6-15所示,單擊“ok”按鈕。 實驗結(jié)果: 選取綜合成績升序排列后的前七名即可,如圖所示;錄取的分別是艾甫爾513分、孫悅婷495分、張國欣471分、郭東陽462分、楊樂451分、高超438分、易仲勃434分。實驗分析: 本實驗,主要是按照要求一步一步來設(shè)置條件,最后邊計算有點難,就是算加分,首先要解決不留空的,不然最后沒法求和。根據(jù)結(jié)果選出符合要求的即可。三、實驗小結(jié):實驗中遇到的問題及解決辦法、心得體會等等. 本實驗,第一小題,主要考察我們創(chuàng)建數(shù)據(jù)文件的結(jié)構(gòu),即數(shù)據(jù)文件的變量和定義變量的屬性。老師上課時給我

8、們演示很到位,在老師的詳細講解下,我熟悉了spss軟件界面,以及一些主要組成部分,但是里面的一些具體參數(shù)還不太清楚,不過常用主要屬性都掌握了,沒有太大問題。 第二小題,問題就相當大了,先是選擇不小于400分的,經(jīng)常排除不了,后來在同學的幫助之下,克服了。后來是加分部分比較難,最開始先符合一個加一個,但是后來發(fā)現(xiàn)不對,經(jīng)過反復嘗試,把需要加分的先列出來,最后匯總,但是沒加分的,我沒有計算,導致最后求和時,不能加,因為有的是空字符,而不是數(shù)字0,后來又經(jīng)改進,把沒有加分的同學,在相對加分位置是0表示,最后才完滿完成實驗。 我覺得學習還是認真聽講好,老師演示,我們聽了看了記了,做起來就相對簡單了。如

9、果自己搞的話,也會做出來,但是要嘗試很多次,浪費大量的時間,所以,學計算機軟件,還是不能狂妄自大,需要虛心求教。實驗二 描述性統(tǒng)計分析一、 實驗目的 1.利用spss進行描述性統(tǒng)計分析。要求掌握頻數(shù)分析(frequencies過程)、描述性分析(descriptives過程)、交叉列聯(lián)表分析(crosstabs過程)二、 實驗內(nèi)容及步驟 1.數(shù)據(jù)文件descriptives.sav,是從某校選取的3個班級共16名學生的體檢列表,要求以班級為單位列表計算年齡,體重和身高的統(tǒng)計量,包括極差,最小最大值,均值,標準差和方差。給出操作步驟和分析結(jié)果。實驗步驟:(1)文件descriptives.sav

10、,(2)單擊分析比較均值,在彈出的對話框中,選擇班級到自變量列表,選擇年齡、身高、體重到因變量列表。 (3)單擊選項按鈕,在彈出的對話框中,選擇極差,最小最大值,均值,標準差和方差,單擊繼續(xù)按鈕,然后按確定。實驗結(jié)果:實驗分析: 1班年齡的最大值為15,最小值為13,平均值為14.2,方差和標準差分別為0.700和0.837,年齡的極差為2歲;體重的最大值為50kg,最小值為38kg,平均值為44.6kg,方差和標準差分別為24.8和4.98,體重的極差為12kg;身高的最大值為160cm,最小值為149cm,平均值為154cm,方差和標準差分別為20.5和4.53,身高的極差為11cm。 2

11、班年齡的最大值為17,最小值為16,平均值為16.4,方差和標準差分別為0.300和0.548,年齡的極差為1歲;體重的最大值為65kg,最小值為50kg,平均值為58kg,方差和標準差分別為32.50和5.70,體重的極差為15kg;身高的最大值為175cm,最小值為160cm,平均值為167cm,方差和標準差分別為32.50和5.70,身高的極差為15cm。 3班年齡的最大值為18,最小值為16,平均值為17.33,方差和標準差分別為0.667和0.816,年齡的極差為2歲;體重的最大值為70kg,最小值為55kg,平均值為62.83kg,方差和標準差分別為34.167和5.845,體重的

12、極差為15kg;身高的最大值為180cm,最小值為160cm,平均值為169cm,方差和標準差分別為64.0和8.0,身高的極差為20cm。2、某醫(yī)生用國產(chǎn)呋喃硝胺治療十二指腸潰瘍,以甲氰咪胍作對照組,問兩種方法治療效果有無差別處 理愈 合未愈合合計呋喃硝胺54862甲氰咪胍442064合 計9828126(提示:由于此處給出的直接是頻數(shù)表,因此在建立數(shù)據(jù)集時可以直接輸入三個變量行變量、列變量和指示每個格子中頻數(shù)的變量,然后用weight cases對話框指定頻數(shù)變量,最后調(diào)用crosstabs過程進行x2檢驗。假設(shè)三個變量分別名為r、c和w,則數(shù)據(jù)集結(jié)構(gòu)和命令如下):rcw1.001.005

13、4.001.002.0044.002.001.008.002.002.0020.00實驗步驟:(1)將上邊給出的頻數(shù)表轉(zhuǎn)化為spss數(shù)據(jù)文件,定義三個變量yp、yh、jg,如下表:(2)輸入數(shù)據(jù):(3)選中菜單“dataweight cases”,在彈出的對話框中選中“weight cases by”,選中jg進入“frequency variable”。(4)選中菜單“analyze-descriptive- crosstabs”,將“yh”變量選入“rows:”行變量框中,將“yp”變量選入 “columns”列變量框中。選中display clustered bar charts。(5)

14、單擊“cell display”鈕,勾選observed、expected、rom、column、total、unstandardized、round cell counts。(6)單擊“continue”輸出實驗結(jié)果。實驗結(jié)果:實驗分析: 1.通過上表的檢驗結(jié)果可知,在62個樣本中,呋喃硝胺治愈了54人,未治愈8人;在64個樣本中,甲氰咪胍治愈了44人,未治愈20人。 2.在卡方檢驗的結(jié)果中,pearson卡方檢驗的值為6.133,連續(xù)校正值為5.118,似然比為6.304;fisher的精確雙側(cè)檢驗值為0.18,單側(cè)檢驗值為0.011;線性和線性組合值為6.084,雙側(cè)檢驗值為0.014,

15、有效案例中的n為126。 3.continuitycorrection和pearson卡方值處分別標注有a和b,表格下方為相應的注解:a.只為2*2表計算。b.0%個格子的期望頻數(shù)小于5,最小的期望頻數(shù)為13.78。因此,這里無須校正,直接采用第一行的檢驗結(jié)果,即x2=6.133,三、實驗小結(jié): 1.通過本次實驗,使我較好地掌握了利用spss進行描述性統(tǒng)計分析的方法,學會了頻數(shù)分析(frequencies過程)、描述性分析(descriptives過程)、交叉列聯(lián)表分析(crosstabs過程)。 2. 頻數(shù)分布分析主要通過頻數(shù)分布表、條形圖和直方圖,以及集中趨勢和離散趨勢的各種統(tǒng)計量來描述數(shù)

16、據(jù)的分布特征。 3. descriptives過程可對變量進行描述性統(tǒng)計分析,計算并列出一系列相應的統(tǒng)計指標,其功能和頻數(shù)分析過程類似,主要以計算數(shù)值型單變量的統(tǒng)計量為主。實驗三 均值檢驗一、 實驗目的1.學習利用spss進行單樣本、兩獨立樣本以及成對樣本的均值檢驗。二、 實驗內(nèi)容及步驟 1、一個生產(chǎn)高性能汽車的公司生產(chǎn)直徑為322mm的圓盤制動閘。公司的質(zhì)量控制部門隨機抽取不同機器生產(chǎn)的制動閘進行檢驗。共4臺機器,每臺機器抽取16支產(chǎn)品。見數(shù)據(jù)文件ttest1.sav,要求檢驗每個機器生產(chǎn)的產(chǎn)品均值和322在90%的置信水平下是否有顯著差異。實驗步驟: 1.打開數(shù)據(jù)文件ttest1.sav,

17、選擇菜單“datasplit file”,選擇“compare groups”鈕,選擇“機器編號”進入“groups based on”,選擇“sort the file by grouping variables”鈕,單擊“ok”。 2.選擇菜單“analyzecompare meansone-sample t test”。彈出“one-sample t test”對話框。在對話框左側(cè)的變量列表中選擇變量“制動閘直徑”進入“test variable(s)” 框;在“test value” 編輯框中輸入產(chǎn)品均值322. 3.單擊“options”鈕,設(shè)定“confidence interva

18、l”為90%。 4.單擊“continue”輸出實驗結(jié)果。實驗結(jié)果:實驗分析: 在90%的置信水平下,可知14號制動閘直徑的均值分別為321.9985、322.0143、321.9983、321.9954,第1號和第3號機器的雙尾數(shù)概率大于0.05,第2號和第4號機器的雙尾數(shù)概率小于0.05,說明第1號和第3號機器生產(chǎn)的制動閘直徑均值與322有顯著差異,第2號和第4號機器生產(chǎn)的產(chǎn)品均值與322無顯著差異。2、在體育課上記錄14名學生乒乓球得分的數(shù)據(jù),男女各7名。數(shù)據(jù)如下:男:82.00 80.00 85.00 85.00 78.00 87.00 82.00女:75.00 76.00 80.00

19、 77.00 80.00 77.00 73.00比較在置信度為95%的情況下男女生得分是否有顯著差別。實驗步驟:(1)定義變量名:gender為性別,df為得分,輸入原始數(shù)據(jù)。(2)選擇菜單“analyzecompare meansindependent-samples t test”項,彈出“independent- samples t test”對話框。從對話框左側(cè)的變量列表中選擇“df”進入“test variable(s)”框,選擇變量“gender”,進入“grouping variable”框,點擊“define groups”鈕彈出“define groups”定義框,在gend

20、er1中輸入1,在gender 2中輸入2。(3) 單擊“ok”,輸出實驗結(jié)果。試驗結(jié)果:實驗分析: 1.由組統(tǒng)計量可以看出,男、女生乒乓球得分的平均值分別為82.7143和76.8571,標準差分別為3.14718和2.54484,均值誤差分別為1.18952和0.96186。 2.對獨立樣本檢驗的結(jié)分析:首先進行方差齊性檢驗,0h=21=22,由f=0.622,相應的伴隨概率為sig.=0.445,大于顯著性水平0.05,不能拒絕方差相等的假設(shè),可以認為男、女生乒乓球得分的方差無顯著差異。 3.然后就是方差相等時t檢驗的結(jié)果,0h:1-2=0,由t=3.829,相應的伴隨概率為sig.=0

21、.002,小于顯著性水平0.05,拒絕t檢驗的原假設(shè),可以認為在置信度為95%的情況下,男、女生乒乓球得分有顯著差別。3、 某醫(yī)療結(jié)構(gòu)針對具有家族心臟病史的病人研發(fā)了一種新藥。為了檢驗這種新藥的療效是否顯著,對16位病人進行為期半年的觀察測試,測試指標為使用該藥之前和之后的體重以及甘油三酯的水平的變化。見數(shù)據(jù)文件ptest.sav.實驗步驟:(1)打開數(shù)據(jù)文件ptest.sav.,選擇菜單“analyzecompare meanspaired-samples t test”項,彈出“paired - samples t test”對話框。從對話框左側(cè)的變量列表中選擇變量tg0tg1、wgtow

22、gt1進入variables框。 (2) 單擊“ok”,輸出實驗結(jié)果。實驗結(jié)果:實驗分析: 1.由實驗結(jié)果可以看出,服藥前和服藥后甘油三酯水平分的平均值分別為138.44和124.38,誤差均值為7.260和7.353,服藥前后體重的平均值分別為198.38和190.31,誤差均值為8.368和8.377。 2.服藥前后甘油三酯水平平均變量的相關(guān)系數(shù)為-0.286,相應的p知大于0.05,不顯著,呈負相關(guān)。服藥前后體重平均變量的相關(guān)系數(shù)為0.996,相應的p知小于0.05,很顯著,相關(guān)程度較高。 3.由配對樣本t檢驗結(jié)果表可以看出,服藥前后甘油三酯水平差值序列的平均值為14.063,計算出的t

23、值為1.200,相應的伴隨概率p(sig.)=0.249,大于顯著性水平0.05,接受t檢驗的原假設(shè),也就是服藥前后甘油三酯水平?jīng)]有明顯變化。服藥前后體重差值序列的平均值為8.063,計算出的t值為11.175,相應的伴隨概率p(sig.)=0.000,小于顯著性水平0.05,不接受t檢驗的原假設(shè),也就是服藥前后體重有了明顯的變化。三、實驗小結(jié): 1.學習利用spss進行單樣本、兩獨立樣本以及成對樣本的均值檢驗。 2.在分析問題前要判斷是單樣本t測驗還是雙樣本t測驗,在第一遍的實驗過程中由于我沒有分清楚這個問題導致了實驗結(jié)果錯誤。實驗四 相關(guān)分析一、 實驗目的1.學習利用spss進行相關(guān)分析、

24、偏相關(guān)分析、距離分析。二、實驗內(nèi)容及實驗步驟 1.打開數(shù)據(jù)文件correlate1.sav, 要求分析汽車價格和汽車的燃油效率之間是否存在線性關(guān)系。實驗步驟:(1)打開數(shù)據(jù)文件correlate1.sav, 選擇菜單“analyzecorrelatebivariate” ,彈出“bivariate correlation”對話框。在對話框左側(cè)的變量列表中選price in thousands、fuel efficiency使之進入“variables”框;再在“correlation coefficients” 框中選擇pearson相關(guān)系數(shù)(r);在“test of significance

25、”框中選相關(guān)系數(shù)的 “two-tailed”(雙側(cè))檢驗。選中復選框“flag significant correlations”設(shè)置是否突出顯示顯著相關(guān)。(2)單擊“options”按鈕,彈出“bivariate correlation: options”對話框,選擇“means and standard deviations”和“cross-product deviations and covariances”項,輸出price in thousands、fuel efficiency的均數(shù)與標準差以及price in thousands、fuel efficiency交叉乘積的標準差與協(xié)

26、方差。實驗結(jié)果:實驗分析: 1.由描述性統(tǒng)計量分析結(jié)果可知,汽車價格的均值為27.339075,標準差14.351653,燃油效率的均值為23.84,標準差為4.283。 2.通過相關(guān)性分析可知,汽車價格和汽車的燃油效率的相關(guān)系數(shù)為-0.429,相關(guān)性不顯著,表明汽車燃油效率提高度對汽車價格影響不大。2、打開數(shù)據(jù)文件pcorrelation.sav,對身高、體重和肺活量進行變量距離分析。選相似性測度。進行結(jié)果解釋。實驗步驟:(1)打開數(shù)據(jù)文件pcorrelation.sav,擇菜單“analyzecorrelatepartial” ,彈出“partial correlations”對話框。在對

27、話框左側(cè)的變量列表中選變量“身高”、“肺活量” 進入variables框,選擇要控制的變量“體重”進入“controlling for”框中,以在控制體重的影響下對變量身高與肺活量進行偏相關(guān)分析;在“test of significance”框中選雙側(cè)檢驗。(2)單擊“options”按鈕,彈出“partial correlations: options”對話框。在“statistics”復選框組中選擇要輸出的統(tǒng)計量。(3) 單擊“ok”按鈕,得到輸出結(jié)果。實驗結(jié)果:實驗分析:通過相似性矩陣分析可以看出,身高和體重值向量間的相關(guān)性為0.735,相關(guān)程度較高;身高和肺活量值向量間的相關(guān)性為0.5

28、81,中度相關(guān);肺活量和體重值向量間的相關(guān)性為0.611,相關(guān)性比較顯著。3、打開數(shù)據(jù)文件distance.sav, 文件是利用三種不同的儀器對飛機的10只葉片的半徑分別進行了測量。要求對10只葉片進行距離分析。用euclidean distance。進行結(jié)果解釋。實驗步驟:(1)打開數(shù)據(jù)文件distance.sav(2)選擇菜單“analyzecorrelatedistance” ,彈出“distance”對話框。在對話框左側(cè)的變量列表中選變量第一次測量、第二次測量、第三次測量,進入“variables” 框。在“compute distances”框中選擇“between variable

29、s”,作變量之間的距離相關(guān)分析。在“measure”欄中選擇“similarities”。(3)單擊“measure” 按鈕,系統(tǒng)彈出“distance: similarity measure”對話框,選擇“pearson correlation” 為測量距離。(4) 單擊continue,然后單擊“ok”按鈕,得到輸出結(jié)果。實驗結(jié)果:實驗分析: 通過不相似性矩陣分析可以看出,第一次測量和第二次測量euclidean距離為0.750,表明這兩次測量結(jié)果一致,飛機葉片的半徑差別較??;第一次測量和第三次測量euclidean距離為0.774,這兩次測量結(jié)果也趨于一致,飛機葉片的半徑差別較??;第二次

30、測量和第三次測量的euclidean距離為1.209,這兩次測量結(jié)果不一致,飛機葉片的半徑差別較大。三、 實驗小結(jié): 1.通過對這一實驗的學習,我學會了利用spss進行相關(guān)分析、偏相關(guān)分析、距離分析。 2.距離相關(guān)分析是對觀測量之間或變量之間相似或不相似的程度的一種測量。距離相關(guān)分析可用于同一變量內(nèi)部各個取值間,以考察其相互接近程度;也可用于變量間,以考察預測值對實際值的擬合優(yōu)度。實驗五 方差分析一、實驗目的1、熟練使用spss進行單因素、雙因素方差分析二、實驗內(nèi)容及實驗步驟1、五個地區(qū)每天發(fā)生交通事故的次數(shù)如下:東部北部中部南部西部151210141317101491214131379111

31、71510140141281000079試以=0.01的顯著水平檢驗各地區(qū)平均每天交通事故次數(shù)是否相等。實驗步驟:(1)定義變量:地區(qū)為dq,每天發(fā)生交通事故的次數(shù)為cs,dq按1=東部、2=北部、3=中部、4=南部、5=西部輸入。(2)選擇菜單“analyzecompare means one-way anova”,彈出對話框,把cs移至dependent list,把dq移至factor。(3)單擊“post hoc”鈕,在彈出的對話框中選中l(wèi)sd,把significance level的值改為0.01,單擊“continue”按鈕,回到“one-way anova”對話框。(5)單擊“o

32、ptions”鈕,在對話框中選中statisticss下的“descriptive”和“homogeneity of variance test”以及missing values下的“exclude cases analysis by analysis”。(6) 單擊“continue”輸出實驗結(jié)果。實驗結(jié)果:實驗分析:上表中,第1欄是方差來源,包括組間變差“between groups”;組內(nèi)變差“within groups”和總變差“total”。第2欄是離差平方和“sum of squares”,組間離差平方和19.8,組內(nèi)離差平方和為670.5,總離差平方和為111.600,是組間離差

33、平方和與組內(nèi)離差平方和相加之 和。第3欄是自由度df,組間自由度為4,組內(nèi)自由度為25;總自由度為29。第4欄是均方“mean square”,是第2欄與第3欄之比;組間均方為4.950,組內(nèi)均方為26.820。第5欄是f值9.125(組間均方與組內(nèi)均方之比)。第6欄:f 值對應的概率值,針對假設(shè)h0:組間均值無顯著性差異.從顯著性慨率看,p0.01,說明各組的方差在a=0.05水平上沒有顯著性差異,即方差具有齊次性。三 實驗小結(jié): 本次實驗主要是學習方差分析,主要是把觀測的總變異的平方和自由度分解為不同變,異來源的平方和以及自由度,把系統(tǒng)誤差和其他隨機性誤差進行對比,來判斷各組樣本之間是否存

34、在顯著性差異,然后分析因素是否對總體存在顯著性影響。這次實驗我感覺收獲最大的是學會了lsd方法,主要是使用t檢驗對組均值之間的所有成對比較,這種方法的敏感度比較高。但是在多因素方差分析中碰到了困難,在因素的“兩兩比較”中,要成對比較確定哪些均值存在差值,包含假定方差和未假定方差齊性這里時,發(fā)現(xiàn)自己還沒有完全理解,于是我又把課件和實驗上的例題好好的看了一遍,在同學的指導下完成了本次實驗。所以不懂得地方只要我們努力去學,再通過同學之間的相互學習,交流,就可以使自己得到進步。實驗六 繪制統(tǒng)計圖一、 實驗目的1、學會利用spss繪制各種統(tǒng)計圖形二、實驗內(nèi)容及步驟直條圖實驗內(nèi)容:研究血壓狀態(tài)與冠心病各臨

35、床型發(fā)生情況的關(guān)系,分析資料如下所示,試繪制統(tǒng)計圖。血壓狀態(tài)年齡標化發(fā)生率(1/10萬)冠狀動脈機能不全猝死心絞痛心肌梗塞正常臨界異常8.9010.6319.8412.0018.0530.5534.7146.1873.0644.0067.24116.82實驗步驟:(1)建立數(shù)據(jù)文件,定義變量名:年齡標化發(fā)生率為rate,冠心病臨床型為disease,血壓狀態(tài)為bp。rate按原數(shù)據(jù)輸入,disease按冠狀動脈機能不全=1、猝死=2、心絞痛=3、心肌梗塞=4輸入,bp按正常=1、臨界=2、異常=3輸入。(2)選擇菜單“graphsbar”過程,彈出“bar chart”定義選項框。在定義選項框

36、的上方選擇復式直條圖“clustered”。(3)單擊“define”鈕,彈出“define clustered bar: summaries for groups of cases”對話框,在左側(cè)的變量列表中選擇變量rate,使之進入“bars represent”欄的“other summary function”選項的“variable”框,選擇變量disease,使之進入“category axis”框,并選擇變量bp進入“define clusters by”框。(4)單擊“titles”鈕,彈出“titles”對話框,在“title”欄內(nèi)輸入“血壓狀態(tài)與冠心病各臨床型年齡標化發(fā)生率

37、的關(guān)系”,單擊“continue”按鈕返回“define clustered chart: summaries for groups of cases對話框。(5)單擊“ok“按鈕,得到輸出結(jié)果。試驗結(jié)果:實驗分析:通過上圖可以看出血壓與人們的健康息息相關(guān),當血壓正常時發(fā)生機能不全、猝死、心絞痛、心肌梗塞的概率分別是8.9、12、34.71、44。當血壓處于臨界時發(fā)生機能不全、猝死、心絞痛、心肌梗塞的概率分別是10.63、18.05、46.18、67.24。當血壓正常時發(fā)生機能不全、猝死、心絞痛、心肌梗塞的概率分別是19.84、30.55、73.06、116.82。由條形圖可知血壓異常時各種疾

38、病的發(fā)生率越高,其中發(fā)生率最高的時心肌梗塞,最低的是機能不全。三 、實驗小結(jié):通過這個實驗的學習我學會了利用spss繪制直條圖,直條圖是用線條的長短或高低來表現(xiàn)性質(zhì)相近的間斷性資料的特征,適用于描繪分類變量的取值大小及比例。實驗七 因子分析一、 實驗目的1.學習利用spss進行因子分析。二、實驗內(nèi)容及步驟實驗內(nèi)容:1.下表資料為25名健康人的7項生化檢驗結(jié)果,7項生化檢驗指標依次命名為x1至x7,請對該資料進行因子分析。x1x2x3x4x5x6x73.768.596.227.579.035.513.278.749.649.738.597.124.695.511.665.909.848.394.

39、947.239.469.554.948.219.413.664.996.147.287.083.980.627.009.491.332.985.493.011.341.615.769.274.924.382.307.315.354.523.086.440.541.344.527.072.591.300.443.311.031.001.173.682.171.271.571.551.512.541.031.771.044.254.502.425.115.2810.029.8412.6611.766.923.3611.6813.579.879.179.725.985.812.808.8413.60

40、10.056.687.7912.0011.748.079.1012.509.777.502.171.794.545.337.633.5313.139.877.852.642.764.571.785.409.023.966.494.3911.582.771.793.752.4513.7410.162.732.106.227.308.844.7618.5211.069.913.433.555.382.097.5012.675.249.065.3716.183.512.104.663.104.782.131.090.821.282.408.391.122.353.702.621.192.013.43

41、3.721.971.751.432.812.272.421.051.291.720.91實驗步驟:(1)建立數(shù)據(jù)文件,定義變量名:分別為x1、x2、x3、x4、x5、x6、x7,按順序輸入相應數(shù)值,建立數(shù)據(jù)文件。(2)選擇菜單“analyzedata reductionfactor” ,彈出“factor analysis”對話框。在對話框左側(cè)的變量列表中選變量x1至x7,進入“variables”框,如圖1。(3)單擊“descriptives”按鈕,彈出“factor analysis: descriptives”對話框,在“statistics”中選“univariate descrip

42、tives”項,輸出各變量的均數(shù)與標準差,“在correlation matrix”欄內(nèi)選“coefficients”,計算相關(guān)系數(shù)矩陣,并選“kmo and bartletts test of sphericity”項,對相關(guān)系數(shù)矩陣進行統(tǒng)計學檢驗,如圖2。 圖1 圖2(4)單擊“extraction”按鈕,彈出“factor analysis: extraction”對話框,選用“principal components”方法提取因子,如圖3。圖3(5)單擊“rotation”按鈕,彈出“factor analysis: rotation”對話框,在“method”欄中選擇“varimax

43、”進行因子正交旋轉(zhuǎn),如圖4。 (6)單擊“scores”按鈕,彈出“factor analysis: scores”對話框,選擇“regression”項估計因子得分系數(shù),如圖5。(7)單擊“ok”鈕,即可輸出結(jié)果。實驗結(jié)果: 圖4 圖5實驗分析: 1.由描述統(tǒng)計分析得結(jié)果可知x1、x2、x3、x4、x5、x6、x7的均值分別為7.1000,4.7732,2.3488,9.1524,5.4584,7.1672,2.3460,標準差分別為2.3238,2.4178,1.6656,3.0141,3.2734,4.5582,1.6109。 2.從原始變量的相關(guān)系數(shù)矩陣可以看出,這七個變量中許多變量之

44、間存在高度相關(guān),能夠從中提取公因子,故進行因子分析是合適的。 3.本例中 kmo檢驗的值為0.321,bartlett球度檢驗統(tǒng)計量的觀測值為326.285,相應的伴隨概率為0.000,小于顯著性水平0.05,因此拒絕 bartlett球度檢驗的零假設(shè),認為相關(guān)系數(shù)矩陣與單位矩陣又顯著差異。,濟源右邊臉適合進行因子分析。 4.通過公共因子碎石圖可以看出,前 4個因子的特征變化非常明顯,到底 4四個特征更以后,特征根變化趨于明顯,因此提取 4個公因子是合適的,可以概括絕大部分信息。 5.由公因子方差分析可以看出,4個公因子變量共同解釋了原始變量x1、x2、x3、x4、x5、x6、x7方差的97.

45、7%,77.3%,85.9%,98.0%,98.3%,97.6%,83.4%,4個因子很好地解釋了 7個原始變量,因為每個原始變量的共同度都在77%以上。 6.第一個主成分解釋了 7個原始變量信息的48.503%,第二個主成分解釋了7個原始變量信息的40.090%,前兩個主成分集中了原始 7個變量信息88.593%,說明兩個主成分提供了原始變量的足夠信息,主成分分析的效果比較好。三、實驗小結(jié):實驗中遇到的問題及解決辦法、心得體會等等. 1.通過這次因子分析實驗,使我學會了 spss因子分析的方法。 2. 主成分析和因子分析都依賴于原始變量,變量之間越相關(guān),因子模型的分析效果就越好。在因子分析之

46、前需要通過變量之間的相關(guān)性分析來判斷進行因子分析是否合適。 3.主成分析和因子分析的出發(fā)點是一致的,其目的都是為了降低變量的維數(shù),在有關(guān)信息損失最小的情況下,將多個變量指標化為較少的幾個指標。 4. 主成分析中每個主成分對應的系數(shù)是唯一的,而因子分析中因子是不固定的,因子載荷的不唯一性有利于對公因子進行有效的解釋。實驗八:聚類分析一、實驗目的:1.運用聚類分析方法分析數(shù)據(jù)二、實驗內(nèi)容及步驟 1、29名兒童的血紅蛋白(g/100ml)與微量元素(g/100ml)測定結(jié)果如下表。由于微量元素的測定成本高、耗時長,故希望通過聚類分析(即r型指標聚類)篩選代表性指標,以便更經(jīng)濟快捷地評價兒童的營養(yǎng)狀態(tài)

47、。編號n0.鈣x1鎂x2鐵x3錳x4銅x5血紅蛋白x6123456789101112131415161718192021222324252627282954.8972.4953.8164.7458.8043.6754.8986.1260.3554.0461.2360.1769.6972.2855.1370.0863.0548.7552.2852.2149.7161.0253.6850.2265.3456.3966.1273.8947.3130.8642.6152.8639.1837.6726.1830.8643.7938.2034.2337.3533.6740.0140.1233.0236.8

48、135.0730.5327.1436.1825.4329.2728.7929.1729.9929.2931.9332.9428.55448.70467.30425.61469.80456.55395.78448.70440.13394.40405.60446.00383.20416.70430.80445.80409.80384.10342.90326.29388.54331.10258.94292.80292.60312.80283.00344.20312.50294.70 0.012 0.008 0.004 0.005 0.012 0.001 0.012 0.017 0.001 0.008

49、 0.022 0.001 0.012 0.000 0.012 0.012 0.000 0.018 0.004 0.024 0.012 0.016 0.048 0.006 0.006 0.016 0.000 0.064 0.0051.0101.6401.2201.2201.0100.5941.0101.7701.1401.3001.3800.9141.3501.2000.9181.1900.8530.9240.8171.0200.8971.1901.3201.0401.0301.3500.6891.1500.83813.5013.0013.7514.0014.2512.7512.5012.251

50、2.0011.7511.5011.2511.0010.7510.5010.2510.00 9.75 9.50 9.25 9.00 8.75 8.50 8.25 8.00 7.80 7.50 7.25 7.00實驗步驟:.(1)確定數(shù)據(jù)類型(variable view)(2)輸入數(shù)據(jù)(data view)并確定分析方法(3)通過分析(analyze),描述統(tǒng)計,打開描述分析(descriptive) 操作界面。用箭頭按鈕從左邊列表框中選擇想要分析的變量名移動到右邊,準備分析。(4)按上圖表示選擇完畢后要將標準化后變量值保存,單擊“確定”,得到第一次分析結(jié)果如下:(5)通過分析( analyze) 中的分類(classify) 進行類別分析,選擇系統(tǒng)聚類(hierarchicalcluster),彈出系統(tǒng)聚類分析對話框。 (6)在系統(tǒng)聚類分析(hierarchical cluster analysis) 中選擇zx1、zx2、zx3、zx4、zx5、zx6 進入變量(variable(s)中(7)在分群(cluster) 中選擇個案(cases),在輸出(display)中選擇統(tǒng)計量(statistics) 和圖( plots),輸出分析統(tǒng)計量和分析圖形。點擊統(tǒng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論