版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、Good is good, but better carries it.精益求精,善益求善。SPSS17中文版統(tǒng)計(jì)分析典型實(shí)例精粹-HYPERLINK/bookfiles/1315/SPSS17中文版統(tǒng)計(jì)分析典型實(shí)例精粹目錄第一篇SPSS17基礎(chǔ)知識第1章SPSS17入門.31.1SPSS軟件的特點(diǎn).31.2SPSS的組成與安裝.41.2.1SPSSforWindows17.0的模塊介紹.41.2.2SPSSforWindows17.0的安裝步驟.51.3SPSS的運(yùn)行方式.101.4SPSS的主要界面.101.4.1SPSS的啟動.101.4.2SPSS的數(shù)據(jù)編輯窗口.111.4.3SPSS
2、的結(jié)果輸出窗口151.5本章小結(jié).18第2章數(shù)據(jù)的基本操作.192.1建立數(shù)據(jù)文件.192.1.1輸入數(shù)據(jù)建立數(shù)據(jù)文件.192.1.2直接打開其他格式的數(shù)據(jù)文件.202.1.3使用數(shù)據(jù)庫查詢建立數(shù)據(jù)文件.212.1.4導(dǎo)入文本文件建立數(shù)據(jù)文件.222.2編輯數(shù)據(jù)文件.232.2.1輸入數(shù)據(jù).232.2.2定義數(shù)據(jù)的屬性.242.2.3插入或刪除數(shù)據(jù).332.2.4數(shù)據(jù)的排序.342.2.5選擇個(gè)案.352.2.6轉(zhuǎn)置數(shù)據(jù).382.2.7合并數(shù)據(jù)文件.382.2.8數(shù)據(jù)的分類匯總.442.2.9數(shù)據(jù)菜單的其他功能.462.3數(shù)據(jù)加工.472.3.1數(shù)據(jù)轉(zhuǎn)換.472.3.2數(shù)據(jù)的手動分組(編碼).
3、502.3.3數(shù)據(jù)的自動分組(編碼).542.3.4產(chǎn)生計(jì)數(shù)變量.552.3.5數(shù)據(jù)秩(序)的確定.572.3.6替換缺失值.592.4數(shù)據(jù)文件的保存或?qū)С?612.4.1保存數(shù)據(jù)文件.612.4.2導(dǎo)出數(shù)據(jù)文件.622.5本章小結(jié).62第3章SPSS基礎(chǔ)統(tǒng)計(jì)描述.633.1數(shù)理統(tǒng)計(jì)量概述.633.1.1均值(Mean)和均值標(biāo)準(zhǔn)誤差(S.E.Mean).633.1.2中位數(shù)(Median).643.1.3眾數(shù)(Mode).643.1.4全距(Range).653.1.5方差(Variance)和標(biāo)準(zhǔn)差(StandardDeviation).653.1.6峰度(Kurtosis)和偏度(Ske
4、wness).663.1.7四分位數(shù)(Quartiles)、十分位數(shù)(Deciles)和百分位數(shù)(Percentiles).663.2數(shù)據(jù)描述.673.3頻數(shù)分析.693.4探索分析.733.5交叉列聯(lián)表分析.783.6比率分析.843.7P-P圖和Q-Q圖.863.8圖表繪制.893.8.1條形圖.893.8.2線圖.943.8.3面積圖.963.8.4餅形圖.983.8.5高低圖.993.8.6箱圖.1013.8.7直方圖.1033.9本章小結(jié).104第4章SPSS基礎(chǔ)模塊分析.1054.1均值分析.1054.1.1均值的計(jì)算公式.1054.1.2均值分析菜單.1064.2方差分析.108
5、4.2.1單因素方差分析.1094.2.2其他方差分析.1134.3參數(shù)檢驗(yàn).1164.3.1單樣本T檢驗(yàn).1174.3.2其他參數(shù)檢驗(yàn).1194.4非參數(shù)檢驗(yàn).1204.4.1卡方檢驗(yàn).1214.4.2其他非參數(shù)檢驗(yàn).1244.5回歸分析.1314.5.1線性回歸.1314.5.2其他回歸分析.1384.6聚類分析.1464.6.1兩步聚類分析.1464.6.2其他聚類分析.1524.7判別分析.1544.7.1判別的函數(shù)公式.1554.7.2判別分析的菜單.1554.8因子分析與主成分分析.1614.8.1因子分析.1614.8.2主成分分析.1664.9時(shí)間序列分析.1674.9.1定義
6、日期變量.1684.9.2創(chuàng)建時(shí)間序列.1694.9.3填補(bǔ)缺失數(shù)據(jù).1714.9.4時(shí)間序列分析.1714.10生存分析.1724.10.1壽命表分析.1734.10.2其他生存分析.1744.11相關(guān)分析.1764.11.1簡單相關(guān)分析.1764.11.2散點(diǎn)圖.1814.11.3偏相關(guān)分析.1844.12信度分析.1864.12.1信度分析概述.1874.12.2SPSS信度分析.1894.12.3信度分析的其他問題.1924.13本章小結(jié).197第二篇SPSS17統(tǒng)計(jì)分析應(yīng)用實(shí)例第一部分調(diào)查統(tǒng)計(jì)第5章調(diào)查統(tǒng)計(jì)入門實(shí)例.2035.1硬幣均勻性判斷.2035.1.1實(shí)例內(nèi)容說明.2035.
7、1.2實(shí)現(xiàn)方法分析.2045.1.3具體操作步驟.2045.2使用回歸分析判斷住房與收入的關(guān)系.2075.2.1實(shí)例內(nèi)容說明.2075.2.2實(shí)現(xiàn)方法分析.2085.2.3具體操作步驟.2085.3不同性別同學(xué)成績的均值和方差分析.2165.3.1實(shí)例內(nèi)容說明.2165.3.2實(shí)現(xiàn)方法分析.2165.3.3具體操作步驟.2165.4本章小結(jié).220第6章調(diào)查統(tǒng)計(jì)提高實(shí)例.2216.1學(xué)生身高的探索性分析.2216.1.1實(shí)例內(nèi)容說明.2216.1.2實(shí)現(xiàn)方法分析.2226.1.3具體操作步驟.2226.2使用對數(shù)線性模型分析骨折資料.2296.2.1實(shí)例內(nèi)容說明.2296.2.2實(shí)現(xiàn)方法分析.
8、2296.2.3具體操作步驟.2306.3培訓(xùn)班學(xué)習(xí)成績的顯著性分析.2376.3.1實(shí)例內(nèi)容說明.2376.3.2實(shí)現(xiàn)方法分析.2386.3.3具體操作步驟.2386.4本章小結(jié).241第7章調(diào)查統(tǒng)計(jì)經(jīng)典實(shí)例.2437.1學(xué)習(xí)成績的聚類分析.2437.1.1實(shí)例內(nèi)容說明.2437.1.2實(shí)現(xiàn)方法分析.2437.1.3具體操作步驟.2447.2身體生長發(fā)育指標(biāo)的地區(qū)顯著性差異判斷.2517.2.1實(shí)例內(nèi)容說明.2517.2.2實(shí)現(xiàn)方法分析.2527.2.3具體操作步驟.2527.3復(fù)習(xí)時(shí)間和考試成績的關(guān)系判斷.2627.3.1實(shí)例內(nèi)容說明.2627.3.2實(shí)現(xiàn)方法分析.2637.3.3具體操作
9、步驟.2637.4本章小結(jié).266第二部分市場研究第8章市場研究入門實(shí)例.2698.1機(jī)電產(chǎn)品銷售額的影響因素分析.2698.1.1實(shí)例內(nèi)容說明.2698.1.2實(shí)現(xiàn)方法分析.2708.1.3具體操作步驟.2708.2消費(fèi)支出與可支配收入的線性回歸分析.2768.2.1實(shí)例內(nèi)容說明.2768.2.2實(shí)現(xiàn)方法分析.2778.2.3具體操作步驟.2778.3商品的季節(jié)性分析.2898.3.1實(shí)例內(nèi)容說明.2898.3.2實(shí)現(xiàn)方法分析.2908.3.3具體操作步驟.2908.4本章小結(jié).300第9章市場研究提高實(shí)例.3019.1保險(xiǎn)公司革新速度與規(guī)模及其類型間的關(guān)系分析.3019.1.1實(shí)例內(nèi)容說明
10、.3019.1.2實(shí)現(xiàn)方法分析.3029.1.3具體操作步驟.3029.2不同廠家同種產(chǎn)品的質(zhì)量分析.3139.2.1實(shí)例內(nèi)容說明.3139.2.2實(shí)現(xiàn)方法分析.3149.2.3具體操作步驟.3149.3合成纖維的強(qiáng)度與拉伸倍數(shù)的關(guān)系分析.3189.3.1實(shí)例內(nèi)容說明.3189.3.2實(shí)現(xiàn)方法分析.3199.3.3具體操作步驟.3199.4本章小結(jié).325第10章市場研究經(jīng)典實(shí)例.32710.1燈絲不同的燈泡的使用壽命分析.32710.1.1實(shí)例內(nèi)容說明.32710.1.2實(shí)現(xiàn)方法分析.32710.1.3具體操作步驟.32810.2不同商品的消費(fèi)者滿意度分析.33610.2.1實(shí)例內(nèi)容說明.3
11、3610.2.2實(shí)現(xiàn)方法分析.33710.2.3具體操作步驟.33710.3顧客對不同款式襯衣喜愛程度的分析.34410.3.1實(shí)例內(nèi)容說明.34410.3.2實(shí)現(xiàn)方法分析.34410.3.3具體操作步驟.34410.4本章小結(jié).348第三部分企業(yè)/政府?dāng)?shù)據(jù)分析第11章企業(yè)/政府?dāng)?shù)據(jù)分析入門實(shí)例.35111.1兒童身高數(shù)據(jù)頻數(shù)分析.35111.1.1實(shí)例內(nèi)容說明.35111.1.2實(shí)現(xiàn)方法分析.35211.1.3具體操作步驟.35211.2百姓對奧運(yùn)會評價(jià)的方差分析.36011.2.1實(shí)例內(nèi)容說明.36011.2.2實(shí)現(xiàn)方法分析.36111.2.3具體操作步驟.36111.3居民交通工具使用情
12、況的回歸分析.36911.3.1實(shí)例內(nèi)容說明.36911.3.2實(shí)現(xiàn)方法分析.37011.3.3具體操作步驟.37011.4本章小結(jié).377第12章企業(yè)/政府?dāng)?shù)據(jù)分析提高實(shí)例.37912.1衛(wèi)生部門對居民壽命情況的分析.37912.1.1實(shí)例內(nèi)容說明.37912.1.2實(shí)現(xiàn)方法分析.37912.1.3具體操作步驟.38012.2農(nóng)作物產(chǎn)量與降水量和平均溫度的相關(guān)性分析.38612.2.1實(shí)例內(nèi)容說明.38612.2.2實(shí)現(xiàn)方法分析.38612.2.3具體操作步驟.38712.3加強(qiáng)體育鍛煉與增強(qiáng)身體素質(zhì)的關(guān)系分析.39012.3.1實(shí)例內(nèi)容說明.39012.3.2實(shí)現(xiàn)方法分析.39012.3.
13、3具體操作步驟.39112.4本章小結(jié).394第13章企業(yè)/政府?dāng)?shù)據(jù)分析經(jīng)典實(shí)例.39513.1當(dāng)代大學(xué)生價(jià)值觀的因子分析.39513.1.1實(shí)例內(nèi)容說明.39513.1.2實(shí)現(xiàn)方法分析.39613.1.3具體操作步驟.39713.2職業(yè)女性家庭特征資料的信度評價(jià).40413.2.1實(shí)例內(nèi)容說明.40413.2.2實(shí)現(xiàn)方法分析.40513.2.3具體操作步驟.40513.3對國內(nèi)生產(chǎn)總值和零售總額之間的關(guān)系分析.41213.3.1實(shí)例內(nèi)容說明.41213.3.2實(shí)現(xiàn)方法分析.41313.3.3具體操作步驟.41413.4本章小結(jié).420第四部分醫(yī)學(xué)統(tǒng)計(jì)分析第14章醫(yī)學(xué)統(tǒng)計(jì)分析入門實(shí)例.4231
14、4.1血紅蛋白值描述性統(tǒng)計(jì)分析.42314.1.1實(shí)例內(nèi)容說明.42314.1.2實(shí)現(xiàn)方法分析.42414.1.3具體操作步驟.42414.2環(huán)氯胍的半數(shù)致死劑量計(jì)算.42814.2.1實(shí)例內(nèi)容說明.42814.2.2實(shí)現(xiàn)方法分析.42914.2.3具體操作步驟.42914.3發(fā)硒與血硒的相關(guān)分析.43514.3.1實(shí)例內(nèi)容說明.43514.3.2實(shí)現(xiàn)方法分析.43614.3.3具體操作步驟.43614.4本章小結(jié).439第15章醫(yī)學(xué)統(tǒng)計(jì)分析提高實(shí)例.44115.1用統(tǒng)計(jì)圖描述血壓狀態(tài)與冠心病的關(guān)系.44115.1.1實(shí)例內(nèi)容說明.44115.1.2實(shí)現(xiàn)方法分析.44115.1.3具體操作步驟
15、.44215.2判斷紅細(xì)胞計(jì)數(shù)的頻數(shù)是否呈正態(tài)分布.44815.2.1實(shí)例內(nèi)容說明.44815.2.2實(shí)現(xiàn)方法分析.44815.2.3具體操作步驟.44915.3胃癌患者發(fā)生術(shù)后院內(nèi)感染的影響因素分析.45215.3.1實(shí)例內(nèi)容說明.45215.3.2實(shí)現(xiàn)方法分析.45315.3.3具體操作步驟.45315.4本章小結(jié).462第16章醫(yī)學(xué)統(tǒng)計(jì)分析經(jīng)典實(shí)例.46316.1不同治療方案的生存率分析.46316.1.1實(shí)例內(nèi)容說明.46316.1.2實(shí)現(xiàn)方法分析.46416.1.3具體操作步驟.46516.2不同制劑的藥效分析.47316.2.1實(shí)例內(nèi)容說明.47316.2.2實(shí)現(xiàn)方法分析.4731
16、6.2.3具體操作步驟.47416.3同種藥物在不同治療階段的藥效分析.48116.3.1實(shí)例內(nèi)容說明.48116.3.2實(shí)現(xiàn)方法分析.48116.3.3具體操作步驟.48316.4本章小結(jié).487SPSS17中文版統(tǒng)計(jì)分析典型實(shí)例精粹:以經(jīng)典統(tǒng)計(jì)學(xué)軟件SPSS17中文版為寫作平臺,提供軟件命令的中英對照基礎(chǔ)篇學(xué)習(xí)軟件基本操作和統(tǒng)計(jì)描述知識,實(shí)例篇詳解案例應(yīng)用原理、流程和操作技巧36個(gè)實(shí)例典型、豐富,涉及調(diào)查統(tǒng)計(jì)、市場研究、企業(yè)政府?dāng)?shù)據(jù)分析和醫(yī)學(xué)統(tǒng)計(jì)領(lǐng)域循序漸進(jìn)、由淺入深,圍繞SPSS應(yīng)用的原理、流程和操作技巧娓娓闡述插圖:1.3SPSS的運(yùn)行方式SPSS提供了三種基本的運(yùn)行方式:完全窗口菜單
17、運(yùn)行方式、程序運(yùn)行方式和批處理方式。完全窗口菜單運(yùn)行方式簡單明了,除人工輸入數(shù)據(jù)需要鍵盤外,大部分的操作命令、統(tǒng)計(jì)分析方法的實(shí)現(xiàn)都是通過菜單、圖標(biāo)按鈕和對話框來完成的,使用者無需掌握編程知識就可以使用SPSS軟件,適用于傳統(tǒng)的統(tǒng)計(jì)分析人員。程序運(yùn)行方式和批處理方式則是從使用者特殊的分析需求出發(fā),編寫SPSS命令程序,通過語句直接運(yùn)行的。這兩種運(yùn)行方式要求使用者掌握專業(yè)的SPSS編程語法,對使用者的要求較高。1.4SPSS的主要界面1.4.1SPSS的啟動SPSS安裝完畢后,系統(tǒng)會自動在Windows的【開始】菜單下創(chuàng)建快捷方式。打開【開始】菜單,在“SPSSforWindows”下選中“SPS
18、Sl7.0forWindows”并單擊,即可啟動SPSS。當(dāng)用戶運(yùn)行SPSS軟件后,計(jì)算機(jī)屏幕上會出現(xiàn)一個(gè)SPSS啟動操作對話框,如圖1.10所示。在該對話框中,用戶可以選擇打開數(shù)據(jù)的方式。對話框中包括一個(gè)六選一的單選按鈕組和一個(gè)復(fù)選框,分別說明如下:“您希望做什么?(Whatwouldyouliketodo?)”單選按鈕組運(yùn)行教程(Runthetutorial):單擊選中后,SPSS將打開幫助教程,在教程中,用戶可選擇不同模塊的幫助說明進(jìn)行有針對性的輔導(dǎo)。輸入數(shù)據(jù)(Typeindata):需要手動輸入數(shù)據(jù),建立新的數(shù)據(jù)文件時(shí)可選擇此項(xiàng)。選中后,即進(jìn)入空白的SPSS數(shù)據(jù)編輯窗口。運(yùn)行現(xiàn)有查詢(
19、Runanexistingquery):選中后,可以選擇查詢文件(.spq)的位置,并可單擊打開。第3章SPSS基礎(chǔ)統(tǒng)計(jì)描述SPSS基礎(chǔ)統(tǒng)計(jì)描述是進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ)和前提。使用一些數(shù)學(xué)統(tǒng)計(jì)量來直觀地描述原始數(shù)據(jù)的集中程度、離散狀況和分布情況,之后就可以對數(shù)據(jù)的總體特征進(jìn)行較為準(zhǔn)確的歸納,從而便于選擇合適的統(tǒng)計(jì)分析方法?;A(chǔ)統(tǒng)計(jì)描述主要包括數(shù)據(jù)描述、頻數(shù)分析、探索分析、交叉列聯(lián)表分析、P-P圖、Q-Q圖等,下面將具體介紹。3.1數(shù)理統(tǒng)計(jì)量概述SPSS在描述性統(tǒng)計(jì)分析中,提供了多個(gè)統(tǒng)計(jì)量來描述數(shù)據(jù)特征,這些統(tǒng)計(jì)量包括均值、中位數(shù)、眾數(shù)、方差、標(biāo)準(zhǔn)差、四分位數(shù)、十分位數(shù)、百分位數(shù)、峰度系數(shù)、偏度系數(shù)
20、等。在進(jìn)行描述性統(tǒng)計(jì)分析之前,首先要對這些統(tǒng)計(jì)量在統(tǒng)計(jì)學(xué)上的定義及其計(jì)算公式有所了解。3.1.1均值(Mean)和均值標(biāo)準(zhǔn)誤差(S.E.Mean)均值(平均數(shù)、平均值)表示的是某個(gè)變量所有取值的集中趨勢或平均水平。例如,某班學(xué)生數(shù)學(xué)考試的平均成績、公司員工的平均收入、某年級學(xué)生的平均身高、某高校高招錄取平均分等。平均數(shù)有總體平均數(shù)和樣本平均數(shù)之分。總體平均數(shù):若一組數(shù)據(jù)X1,X2,XN代表一個(gè)大小為N的有限總體,則其總體平均數(shù)為:(3.1)樣本平均數(shù):若一組數(shù)據(jù)x1,x2,xn代表一個(gè)大小為n的有限樣本,則其樣本平均數(shù)為:(3.2)樣本數(shù)據(jù)是從總體數(shù)據(jù)中抽取出來的,但在不同次抽樣中得到的樣本是
21、不同的。雖然在一定程度上,樣本數(shù)據(jù)可以反映總體數(shù)據(jù)的特征,但由于抽樣等原因,樣本數(shù)據(jù)是總體數(shù)據(jù)的隨機(jī)變量。同樣,雖然樣本均值可以反映總體數(shù)據(jù)的特征,但在不同次抽樣中所得的樣本均值是不同的,并且它們與總體均值間存在差異。均值標(biāo)準(zhǔn)誤差(StandardErrorofMean,S.E.Mean,簡稱標(biāo)準(zhǔn)誤)就是描述這些樣本均值與總體均值之間平均差異程度的統(tǒng)計(jì)量。3.1.2中位數(shù)(Median)中位數(shù)是將總體數(shù)據(jù)的各個(gè)數(shù)值按大小順序排列,居于中間位置的變量,用Median表示。中位數(shù)將所有的數(shù)據(jù)等分成兩半,中位數(shù)兩端的數(shù)據(jù)個(gè)數(shù)相同,因此它也被稱為二分位數(shù)。中位數(shù)的確定,僅僅取決于它在數(shù)列中的位置,不受
22、極端值的影響,因此可以用它表示總體的一般水平。同時(shí),中位數(shù)比算術(shù)平均數(shù)具有更好的穩(wěn)定性。一個(gè)大小為N的數(shù)列,要求其中位數(shù),首先應(yīng)把該數(shù)列按大小順序排列,如果N為奇數(shù),那么該數(shù)列的中位數(shù)就是位置上的數(shù);如果N為偶數(shù),中位數(shù)則是該數(shù)列中第與第位置上的兩個(gè)數(shù)值的平均數(shù)。3.1.3眾數(shù)(Mode)眾數(shù)是指總體數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量,用Mode表示。它同樣不受數(shù)據(jù)極端值的影響,從而在一定程度上提高了平均水平的代表性。例如,制衣廠可以根據(jù)消費(fèi)者所需服裝尺碼的眾數(shù)來安排生產(chǎn)。此外,如果眾數(shù)的值出現(xiàn)的頻數(shù)或頻率較大,那么說明眾數(shù)的代表性就越高,數(shù)列的集中趨勢也就越顯著。確定眾數(shù)沒有明確的公式,一般只能用手工
23、統(tǒng)計(jì),故較為煩瑣。SPSS所提供的統(tǒng)計(jì)功能可以減少諸如此類煩瑣的過程。眾數(shù)、中位數(shù)與算術(shù)平均數(shù)之間存在一定的關(guān)系,這種關(guān)系決定于總體分布的狀況。當(dāng)總體分布呈對稱的鐘形分布時(shí),算術(shù)平均數(shù)位于分布曲線的對稱點(diǎn)上,而該點(diǎn)又是曲線的最高點(diǎn)和中心點(diǎn),因此,眾數(shù)、中位數(shù)和算術(shù)平均數(shù)三者相等。當(dāng)總體分布呈非對稱的鐘形分布時(shí),由于這三種平均數(shù)受極端數(shù)值影響程度的不同,因而它們的數(shù)值就存在一定的差別,但三者之間仍有一定的關(guān)系。當(dāng)分布右偏時(shí),算術(shù)平均數(shù)受偏高數(shù)值影響較大,其位置必然在眾數(shù)之右,中位數(shù)在眾數(shù)與算術(shù)平均數(shù)之間。反之,當(dāng)次數(shù)分布左偏時(shí),算術(shù)平均數(shù)受偏小數(shù)值的影響較大,其位置在眾數(shù)之左,中位數(shù)仍在眾數(shù)與算
24、術(shù)平均數(shù)之間。以上的均值、中位數(shù)和眾數(shù)都是反映數(shù)據(jù)集中趨勢的統(tǒng)計(jì)量。3.1.4全距(Range)全距,又稱極差,是數(shù)據(jù)的最大值(Maximum)與最小值(Minimum)之間的絕對差,借以表明總體標(biāo)志值最大可能的差異范圍。全距越長,說明數(shù)據(jù)越離散;反之,全距越小,說明數(shù)據(jù)越集中。用符號表示全距的計(jì)算公式為:(3.3)全距的缺點(diǎn)在于其方法過于粗略,因?yàn)樗豢紤]總體兩端數(shù)值的差異,沒有考慮中間數(shù)值差異的情況,因而它是測定離散程度的一種粗略的方法,不能全面反映總體數(shù)據(jù)的差異程度。要充分利用每一個(gè)數(shù)據(jù)的信息,就需要利用方差和標(biāo)準(zhǔn)差。3.1.5方差(Variance)和標(biāo)準(zhǔn)差(StandardDevia
25、tion)方差是總體所有變量值與其算術(shù)平均數(shù)偏差平方的平均值,它表示了一組數(shù)據(jù)分布的離散程度的平均值。標(biāo)準(zhǔn)差是方差的平方根,它表示了一組數(shù)據(jù)關(guān)于平均數(shù)的平均離散程度??傮w方差公式:(3.4)總體標(biāo)準(zhǔn)差公式:(3.5)樣本方差公式:(3.6)樣本標(biāo)準(zhǔn)差:(3.7)其中,m為總體平均數(shù),為樣本平均數(shù),N為總體的個(gè)數(shù),n為樣本的個(gè)數(shù)。雖然標(biāo)準(zhǔn)差有計(jì)量單位,而方差無計(jì)量單位,但兩者的作用一樣,故在此僅介紹標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)差用平方的方法消除了正負(fù)號,因而它是最常用、最重要的離散趨勢統(tǒng)計(jì)量。標(biāo)準(zhǔn)差越大,表示變量值之間的差異越大,各數(shù)據(jù)距離均值越遠(yuǎn),則平均數(shù)的代表性就越低。反之,標(biāo)準(zhǔn)差越小,表示變量值之間的差異
26、越小,各數(shù)據(jù)距離均值較近,則平均數(shù)的代表性就越高。標(biāo)準(zhǔn)差在實(shí)際生活中也有廣泛的應(yīng)用。例如,可以用標(biāo)準(zhǔn)差來測定居民收入分配的差異程度,還可以用來反映平均收支、平均結(jié)余、平均產(chǎn)量等經(jīng)濟(jì)變量的代表性等。全距、方差和標(biāo)準(zhǔn)差都是反映數(shù)據(jù)離散趨勢的統(tǒng)計(jì)量。3.1.6峰度(Kurtosis)和偏度(Skewness)峰度是描述總體中所有取值分布形態(tài)陡緩程度的統(tǒng)計(jì)量。這個(gè)統(tǒng)計(jì)量需要與正態(tài)分布相比較,峰度為0表示該總體數(shù)據(jù)分布與正態(tài)分布的陡緩程度相同;峰度大于0表示該總體數(shù)據(jù)分布與正態(tài)分布相比較為陡峭,為尖頂峰;峰度小于0表示該總體數(shù)據(jù)分布與正態(tài)分布相比較為平坦,為平頂峰。峰度的絕對值數(shù)值越大表示其分布形態(tài)的陡
27、緩程度與正態(tài)分布的差異程度越大。峰度的具體計(jì)算公式為:(3.8)偏度與峰度類似,它也是描述數(shù)據(jù)分布形態(tài)的統(tǒng)計(jì)量,其描述的是某總體取值分布的對稱性。這個(gè)統(tǒng)計(jì)量同樣需要與正態(tài)分布相比較,偏度為0表示其數(shù)據(jù)分布形態(tài)與正態(tài)分布的偏斜程度相同;偏度大于0表示其數(shù)據(jù)分布形態(tài)與正態(tài)分布相比為正偏或右偏,即有一條長尾巴拖在右邊,數(shù)據(jù)右端有較多的極端值;偏度小于0表示其數(shù)據(jù)分布形態(tài)與正態(tài)分布相比為負(fù)偏或左偏,即有一條長尾拖在左邊,數(shù)據(jù)左端有較多的極端值。偏度的絕對值數(shù)值越大表示其分布形態(tài)的偏斜程度越大。偏度的具體計(jì)算公式為:(3.9)3.1.7四分位數(shù)(Quartiles)、十分位數(shù)(Deciles)和百分位數(shù)
28、(Percentiles)四分位數(shù)是將一組數(shù)據(jù)由小到大(或由大到?。┡判蚝?,用3個(gè)點(diǎn)將全部數(shù)據(jù)分為4等份,與這3個(gè)點(diǎn)位置上相對應(yīng)的數(shù)值稱為四分位數(shù),分別記為Q1(第一四分位數(shù))、Q2(第二四分位數(shù),即中位數(shù))、Q3(第三四分位數(shù))。其中,Q3到Q1之間的距離的一半又稱為四分位差,記為Q。四分位差越小,說明中間部分的數(shù)據(jù)越集中;四分位數(shù)越大,則意味著中間部分的數(shù)據(jù)越分散。與四分位數(shù)類似,十分位數(shù)是將一組數(shù)據(jù)由小到大(或由大到?。┡判蚝螅?個(gè)點(diǎn)將全部數(shù)據(jù)分為10等份,與這9個(gè)點(diǎn)位置上相對應(yīng)的數(shù)值稱為十分位數(shù),分別記為D1,D2,D9,表示10%的數(shù)據(jù)落在D1下,20%的數(shù)據(jù)落在D2下,90%的數(shù)
29、據(jù)落在D9下。同理,百分位數(shù)是將一組數(shù)據(jù)由小到大(或由大到小)排序后分割為100等份,與99個(gè)分割點(diǎn)位置上相對應(yīng)的數(shù)值稱為百分位數(shù),分別記為P1,P2,P99,表示1%的數(shù)據(jù)落在P1下,2%的數(shù)據(jù)落在P2下,99%的數(shù)據(jù)落在P99下。通過四分位數(shù)、十分位數(shù)和百分位數(shù),可以大體看出總體數(shù)據(jù)在哪個(gè)區(qū)間內(nèi)更為集中,也就是說,它們在一定程度上可以反映數(shù)據(jù)的分布情況。上面的峰度系數(shù)、偏度系數(shù)和四分位數(shù)、十分位數(shù)、百分位數(shù),都是反映數(shù)據(jù)分布狀況的統(tǒng)計(jì)量。3.2數(shù)據(jù)描述描述性統(tǒng)計(jì)分析是對數(shù)據(jù)進(jìn)行基礎(chǔ)性的描述。通過得出的數(shù)據(jù)的平均值(Mean)、和(Sum)、標(biāo)準(zhǔn)差(Stddeviation)、最大值(Max
30、)、最小值(Min)、方差(Variance)、全距(Range)、均值標(biāo)準(zhǔn)誤差(S.E.Mean)、峰度(Kurtosis)、偏度(Skewness)等統(tǒng)計(jì)量,來估計(jì)原始數(shù)據(jù)的集中程度、離散狀況和分布情況。數(shù)據(jù)描述功能的操作步驟如下:01打開【分析】(Analyze)菜單,選擇【描述統(tǒng)計(jì)】(DescriptiveStatistics)命令下的【描述】(Descriptives)命令,如圖3-1所示。這里,需要提醒的是如果數(shù)據(jù)文件尚未打開,【分析】(Analyze)菜單下的任一功能都不能使用,SPSS會彈出一個(gè)對話框,如圖3-2所示,提醒用戶打開文件。打開文件后,【分析】(Analyze)菜單
31、下的統(tǒng)計(jì)功能才能正常使用。圖3-1【分析】(Analyze)菜單圖3-2未打開文件提醒對話框02選擇【描述】(Descriptives)命令后,SPSS將打開“描述性”(Descriptives)對話框,如圖3-3所示。圖3-3“描述性”主對話框在該主對話框中,用戶可以通過單擊按鈕從左邊原變量中選擇一個(gè)或者幾個(gè)變量進(jìn)入右邊的“變量”(Variable(s))列表框中。對話框底部有一個(gè)“將標(biāo)準(zhǔn)化得分另存為變量”(Savestandardizedvaluesasvariables)復(fù)選框,選擇該項(xiàng),將對“變量”(Variable(s))列表框中被選中變量的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,然后將標(biāo)準(zhǔn)化的結(jié)果保存到新
32、變量中。新變量的變量名為原變量的變量名前面添加字母“z”,并被添加在數(shù)據(jù)編輯窗口中變量的最后一列。數(shù)據(jù)標(biāo)準(zhǔn)化的計(jì)算公式為:(3.10)通過標(biāo)準(zhǔn)化,可以將均值為m、標(biāo)準(zhǔn)差為s的原變量轉(zhuǎn)化成均值為0、標(biāo)準(zhǔn)差為1的新變量?!懊枋鲂浴保―escriptives)主對話框的下端有5個(gè)按鈕,如果還未將左邊原變量中的變量添加至“變量”(Variable(s))列表框中,則【確定】(OK)和【粘貼】(Paste)按鈕為灰白顯示,不可單擊,但【重置】(Reset)、【取消】(Cancel)和【幫助】(Help)按鈕可以單擊。通過單擊【重置】(Reset)按鈕,用戶可以將已進(jìn)入右框的變量全部轉(zhuǎn)移至左框的變量列表中
33、,重新進(jìn)行選擇。03單擊【選項(xiàng)】(Options)按鈕,將打開“描述:選項(xiàng)”(Descriptives:Options)對話框,如圖3-4所示。在該對話框中,用戶可以選擇所要統(tǒng)計(jì)的統(tǒng)計(jì)量和圖表輸出方式。具體對話框中各選項(xiàng)的意義如下:(1)在對話框中最上面一行是均值(Mean)和合計(jì)(Sum)。(2)離散(Dispersion)欄中的統(tǒng)計(jì)量包括:標(biāo)準(zhǔn)差(StdDeviation)最小值(Minimum)方差(Variance)最大值(Maximum)范圍(極差)(Range)均值的標(biāo)準(zhǔn)誤(S.E.Mean)(3)分布(Distribution)欄中的統(tǒng)計(jì)量包括:峰度(Kurtosis)偏度(Sk
34、ewness)(4)顯示順序(DisplayOrder)欄中,用戶可以自行選擇輸出變量的排序方式,包括:l變量列表(VariableList):在結(jié)果輸出窗口中,用戶選擇輸出的變量將按照變量在數(shù)據(jù)編輯窗口中原來的排列順序進(jìn)行排列。l字母順序(Alphabetic):在結(jié)果輸出窗口中,用戶選擇輸出的變量將按照變量名的字母排列順序進(jìn)行排列。l按均值的升序排序(AscendingMeans):SPSS將計(jì)算每個(gè)輸出變量的平均值,并按照平均值從小到大對輸出變量的順序進(jìn)行排列。l按均值的降序排序(DescendingMeans):SPSS將計(jì)算每個(gè)輸出變量的平均值,并按照平均值從大到小對輸出變量的順序進(jìn)
35、行排列。用戶可在“選項(xiàng)”(Options)對話框第一行、離散(Dispersion)欄和分布(Distribution)欄中,選中所需統(tǒng)計(jì)的統(tǒng)計(jì)量(可多項(xiàng)選擇)。SPSS默認(rèn)的描述統(tǒng)計(jì)量包括均值、標(biāo)準(zhǔn)差、最小值、最大值。在“顯示順序”(DisplayOrder)一欄里,用戶只可選擇一種變量排序方式,SPSS的默認(rèn)選項(xiàng)為“變量列表”(VariableList)。進(jìn)行選擇后,單擊【繼續(xù)】(Continue)按鈕,即可返回“描述性”(Descriptives)主對話框。04單擊【確定】(OK)按鈕,即可在結(jié)果輸出窗口中得到描述性統(tǒng)計(jì)分析結(jié)果輸出表格。3.3頻數(shù)分析對于一組數(shù)據(jù),考察不同的數(shù)值出現(xiàn)的頻
36、數(shù),或者是數(shù)據(jù)落入指定區(qū)域內(nèi)的頻數(shù),可以了解數(shù)據(jù)的分布狀況。從SPSS15.0開始就提供了“頻數(shù)分析”這一功能。通過頻數(shù)分析,用戶在得到描述性統(tǒng)計(jì)結(jié)果的同時(shí),還能了解變量取值的分布情況,從而使總體數(shù)據(jù)的分布通過頻數(shù)分析得到更為清晰、準(zhǔn)確的輸出。頻數(shù)分析的具體操作步驟如下:01打開數(shù)據(jù)文件,選擇【分析】(Analyze)菜單,單擊【描述統(tǒng)計(jì)】(DescriptiveStatistics)命令下的【頻率】(Frequencies)命令。SPSS將彈出“頻率”(Frequencies)主對話框,如圖3-5所示。圖3-5“頻率”(Frequencies)主對話框在該主對話框中,同樣可以通過單擊按鈕從左
37、邊的原變量中選擇一個(gè)或者幾個(gè)變量進(jìn)入右邊的“變量”(Variable(s))列表框中。對話框底部有一項(xiàng)“顯示頻率表格”(Displayfrequencytables)復(fù)選框,SPSS默認(rèn)選擇此項(xiàng)。選擇此項(xiàng)后,輸出結(jié)果將顯示頻數(shù)分布表,否則只顯示直方圖,不顯示頻數(shù)分布表。“頻率”主對話框的右方有3個(gè)按鈕,從上到下依次為【統(tǒng)計(jì)量】(Statistics)按鈕、【圖表】(Charts)按鈕和【格式】(Format)按鈕。單擊可進(jìn)入對應(yīng)對話框。02單擊【統(tǒng)計(jì)量】按鈕,打開“頻率:統(tǒng)計(jì)量”(Frequencies:Statistics)對話框,如圖3-6所示。圖3-6“頻率:統(tǒng)計(jì)量”對話框在該對話框中,
38、用戶可以選擇所要統(tǒng)計(jì)的統(tǒng)計(jì)量。對話框中各選項(xiàng)的具體意義如下:(1)百分位值(PercentileValues)欄為復(fù)選項(xiàng),在此欄中可選擇多項(xiàng)。l四分位數(shù)(Quartile)l割點(diǎn)(Cutpoints):選擇此項(xiàng),在后面的文本框中輸入數(shù)值,假設(shè)為N(N為在2100之間的整數(shù)),則計(jì)算并顯示N分位數(shù)。l百分位數(shù)(Percentile(s)):選擇此項(xiàng),在后面的文本框中輸入數(shù)值,可以有選擇地顯示百分位數(shù)。在文本框中可以輸入0到100之間的數(shù),輸入后,單擊【添加】(Add)按鈕,將對應(yīng)的百分位數(shù)添加到方框內(nèi)的列表框中,利用【更改】(Change)按鈕和【刪除】(Remove)按鈕,可以對列表框中的選項(xiàng)
39、進(jìn)行修改和刪除。(2)離散(Dispersion)欄(復(fù)選項(xiàng)):標(biāo)準(zhǔn)差(StdDeviation)最小值(Minimum)方差(Variance)最大值(Maximum)范圍(極差)(Range)均值的標(biāo)準(zhǔn)誤(S.E.Mean)(3)集中趨勢(CentralTendency)欄(復(fù)選項(xiàng)):均值(Mean)、中位數(shù)(Median)、眾數(shù)(Mode)、合計(jì)(Sum)。“集中趨勢”欄下方有一個(gè)“值為組的中點(diǎn)”(Valuesaregroupmidpoints)復(fù)選框,如果假設(shè)數(shù)據(jù)已經(jīng)分組,而且數(shù)據(jù)取值為初始分組的中點(diǎn),選擇此項(xiàng),將計(jì)算百分位數(shù)統(tǒng)計(jì)和數(shù)據(jù)的中位數(shù)。(4)分布欄(Distribution)
40、(復(fù)選項(xiàng)):峰度(Kurtosis)、偏度(Skewness)。用戶在“頻率:統(tǒng)計(jì)量”對話框中單擊選中所要統(tǒng)計(jì)的統(tǒng)計(jì)量后,單擊【繼續(xù)】(Continue)按鈕,即可返回主對話框。03單擊【圖表】(Charts)按鈕,打開“頻率:圖表”(Frequencies:Charts)對話框,如圖3-7所示。在該對話框中,用戶可以選擇頻數(shù)分析的圖表類型。該對話框中各選項(xiàng)的具體意義如下:(1)圖表類型(ChartType)(單選項(xiàng)):無(None)(系統(tǒng)默認(rèn)選項(xiàng))、條形圖(Barcharts)、餅形圖(Piecharts)、直方圖(Histograms)。圖3-7“頻率:圖表”對話框(2)圖表值(Chart
41、Values)(單選項(xiàng)組):可選擇圖形中分類值的表現(xiàn)形式。l頻率(Frequencies):如果圖表類型是直方圖,則直方圖的縱軸為頻數(shù);如果圖表類型是餅形圖,則餅形圖中每塊表示屬于該組觀測值的頻數(shù)。l百分比(Percentage):如果圖表類型是直方圖,則直方圖的縱軸為百分比;如果圖表類型是餅形圖,則餅形圖中每塊表示該組的觀測量數(shù)占總數(shù)的百分比。l用戶在“頻率:圖表”對話框中選擇圖表類型和圖表分類值后,單擊【繼續(xù)】(Continue)按鈕,即可返回主對話框。04單擊【格式】(Format)按鈕,打開“頻率:格式”(Frequencies:Format)對話框,如圖3-8所示。圖3-8“頻率:格
42、式”對話框在該對話框中,用戶可以設(shè)置頻率分布表的輸出格式。對話框中各選項(xiàng)的意義如下:(1)排序方式(Orderby)欄:單選項(xiàng)組,用戶可以選擇頻數(shù)分布表中數(shù)值及其對應(yīng)頻率的排列順序。l按值的升序排序(Ascendingvalues):系統(tǒng)默認(rèn)選項(xiàng),頻數(shù)分布表中將按照數(shù)值從小到大排列。l按值的降序排序(Descendingvalues):頻數(shù)分布表中將按照數(shù)值從大到小排列。l按計(jì)數(shù)的升序排序(Ascendingcounts):頻數(shù)分布表中將按照計(jì)數(shù)從小到大排列。l按計(jì)數(shù)的降序排序(Descendingcounts):頻數(shù)分布表中將按照計(jì)數(shù)從大到小排列。如果用戶在“頻率:圖表”對話框中選擇輸出直方
43、圖,頻數(shù)分布表將按照數(shù)值順序排列。(2)多個(gè)變量(MultipleVariables)欄:單選項(xiàng)組,當(dāng)“頻率(Frequencies)”主對話框的“變量”(Variable(s))列表框中有多個(gè)變量時(shí),利用“多個(gè)變量”欄可以設(shè)置表格的顯示方式。l比較變量(Comparevariables):系統(tǒng)默認(rèn)選項(xiàng),SPSS將所有變量的描述統(tǒng)計(jì)的結(jié)果顯示在同一張表格中,方便用戶進(jìn)行比較分析。按變量組織輸出(Organizeoutputbyvariable):SPSS將對應(yīng)每個(gè)變量分別輸出單獨(dú)的描述統(tǒng)計(jì)表格。用戶在“頻率:格式”對話框中進(jìn)行選擇后,單擊【繼續(xù)】(Continue)按鈕,即可返回“頻率”主對話
44、框。一般情況下,對“頻率:格式”對話框的選項(xiàng)都默認(rèn)為系統(tǒng)默認(rèn)值,不作調(diào)整。05單擊【確定】(OK)按鈕,即可在結(jié)果輸出窗口中得到頻數(shù)分布表、描述性統(tǒng)計(jì)分析輸出表格和用戶選擇的對應(yīng)的輸出圖形。3.4探索分析探索分析是在對數(shù)據(jù)的基本特征統(tǒng)計(jì)量有初步了解的基礎(chǔ)上,對數(shù)據(jù)進(jìn)行的更為深入詳細(xì)的描述性觀察分析。它在一般描述性統(tǒng)計(jì)指標(biāo)的基礎(chǔ)上,增加了有關(guān)數(shù)據(jù)其他特征的文字與圖形描述,顯得更加細(xì)致與全面,有助于用戶思考對數(shù)據(jù)進(jìn)行進(jìn)一步分析的方案。主要的分析如下:(1)觀察數(shù)據(jù)的分布特征:通過繪制箱鎖圖和莖葉圖等圖形,直觀地反映數(shù)據(jù)的分布形式和數(shù)據(jù)的一些規(guī)律,包括考察數(shù)據(jù)中是否存在異常值等。過大或過小的數(shù)據(jù)均有
45、可能是奇異值、影響點(diǎn)或錯(cuò)誤數(shù)據(jù)。尋找異常值,并分析原因,然后決定是否從分析中刪除這些數(shù)據(jù)。因?yàn)槠娈愔岛陀绊扅c(diǎn)往往對分析的影響較大,不能真實(shí)地反映數(shù)據(jù)的總體特征。(2)正態(tài)分布檢驗(yàn):檢驗(yàn)數(shù)據(jù)是否服從正態(tài)分布。很多檢驗(yàn)?zāi)軌蜻M(jìn)行的前提即總體數(shù)據(jù)分布服從正態(tài)分布。因此,檢驗(yàn)數(shù)據(jù)是否符合正態(tài)分布,就決定了它們是否能用只對正態(tài)分布數(shù)據(jù)適用的分析方法。(3)方差齊性檢驗(yàn):用Levene檢驗(yàn)比較各組數(shù)據(jù)的方差是否相等,以判定數(shù)據(jù)的離散程度是否存在差異。例如在進(jìn)行獨(dú)立右邊的T檢驗(yàn)之前,就需要事先確定兩組數(shù)據(jù)的方差是否相同。如果通過分析發(fā)現(xiàn)各組數(shù)據(jù)的方差不同,還需要對數(shù)據(jù)進(jìn)行方差分析,那么就需要對數(shù)據(jù)進(jìn)行轉(zhuǎn)換使得
46、方差盡可能相同。Levene檢驗(yàn)進(jìn)行方差齊性檢驗(yàn)時(shí),不強(qiáng)求數(shù)據(jù)必須服從正態(tài)分布,它先計(jì)算出各個(gè)觀測值減去組內(nèi)均值的差,然后再通過這些差值的絕對值進(jìn)行單因素方差分析。如果得到的顯著性水平(Significance)小于0.05,那么就可以拒絕方差相同的假設(shè)。探索分析的具體操作步驟如下:01打開數(shù)據(jù)文件,選擇【分析】(Analyze)菜單,單擊【描述統(tǒng)計(jì)】(DescriptiveStatistics)命令下的【探索】(Explore)命令,SPSS將彈出“探索”(Explore)對話框,如圖3-9所示。在“探索”(Explore)對話框中,左邊的變量列表為原變量列表,通過單擊按鈕可選擇一個(gè)或者幾個(gè)
47、變量進(jìn)入右邊的“因變量列表”(DependentList)框、“因子列表”(FactorList)框和“標(biāo)注個(gè)案”(LabelCasesby)列表框。因變量是用戶所研究的目標(biāo)變量。因子變量是影響因變量的因素,例如分組變量。標(biāo)注個(gè)案是區(qū)分每個(gè)觀測量的變量,如雇員的ID等。例如,研究同一班級男生和女生的身高差距時(shí),就可將“身高”變量列入“因變量列表”(DependentList)框中,將“性別”列入“因子列表”(FactorList)框中,同時(shí)將學(xué)生的“學(xué)號”變量列入“標(biāo)注個(gè)案”(LabelCasesby)列表框中。圖3-9“探索”主對話框提示:如果有多個(gè)分組變量進(jìn)入“因子列表”列表框中,那么會以
48、分組變量的各種取值進(jìn)行組合分組。如兩個(gè)分組變量各有2種取值,那么輸出的結(jié)果就會有4種組合分組。在對話框下端的“輸出”(Display)框中有三個(gè)選項(xiàng):l兩者都(Both):默認(rèn)選項(xiàng),表示同時(shí)輸出描述統(tǒng)計(jì)量的統(tǒng)計(jì)表格和圖形。選擇此項(xiàng)將激活右邊的【統(tǒng)計(jì)量】(Statistics)和【繪制】(Plots)按鈕。l統(tǒng)計(jì)量(Statistics):表示只輸出統(tǒng)計(jì)表格,不輸出圖表。選擇此項(xiàng)將激活右邊的【統(tǒng)計(jì)量】(Statistics)按鈕,【繪制】(Plots)按鈕不被激活。l圖(Plots):表示只輸出圖表,不輸出統(tǒng)計(jì)表格。選擇此項(xiàng)將激活右邊的【繪制】(Plots)按鈕,【統(tǒng)計(jì)量】(Statistics
49、)按鈕不被激活。02單擊【統(tǒng)計(jì)量】(Statistics)按鈕,打開“探索:統(tǒng)計(jì)量(Explore:Statistics)”對話框,如圖3-10所示。圖3-10“探索:統(tǒng)計(jì)量”對話框在該對話框中,4個(gè)選擇項(xiàng)分別如下:l描述性(Descriptives):選擇此項(xiàng),將生成描述性統(tǒng)計(jì)表格。表中顯示樣本數(shù)據(jù)的描述統(tǒng)計(jì)量,包括平均值、中位數(shù)、5%調(diào)整平均數(shù)、標(biāo)準(zhǔn)誤、方差、標(biāo)準(zhǔn)差、最大值、最小值、組距、四分位數(shù)、峰度、偏度及峰度和偏度的標(biāo)準(zhǔn)誤。此項(xiàng)為默認(rèn)選項(xiàng),在下面的“均值的置信區(qū)間”(ConfidenceIntervalforMean)文本框中,用戶還可輸入數(shù)值指定均值的置信區(qū)間的置信度,系統(tǒng)默認(rèn)的置
50、信度為95%。lM-估計(jì)量(M-estimators):選擇此項(xiàng),將計(jì)算并生成穩(wěn)健估計(jì)量。M估計(jì)在計(jì)算時(shí)對所有觀測量賦予權(quán)重,隨觀測量距分布中心的遠(yuǎn)近而變化,通過給遠(yuǎn)離中心值的數(shù)據(jù)賦予較小的權(quán)重來減小異常值的影響。l界外值(Outliers):選擇此項(xiàng),將輸出分析數(shù)據(jù)中的5個(gè)最大值和5個(gè)最小值作為異常嫌疑值。l百分位數(shù)(Percentiles):選擇此項(xiàng),將計(jì)算并顯示指定的百分位數(shù),包括5%、10%、25%、50%、75%、90%和95%等?!疤剿鳎航y(tǒng)計(jì)量”對話框中的4個(gè)選項(xiàng)為復(fù)選框,用戶可進(jìn)行多項(xiàng)選擇,單擊【繼續(xù)】(Continue)按鈕,即可返回“探索”主對話框。03單擊【繪制】(Plot
51、s)按鈕,打開“探索:圖”(Explore:Plots)對話框,如圖3-11所示。圖3-11“探索:圖”對話框“探索:圖”對話框中有如下4個(gè)選擇組:(1)箱圖(Boxplots)欄(單選項(xiàng)組):箱圖,又稱箱鎖圖。如果用戶在“探索”主對話框的“因變量列表”(DependentList)框中輸入了多個(gè)變量名,則在此選擇組中進(jìn)行選擇,可確定箱鎖圖的生成方式。箱鎖圖中,底部的水平線段是數(shù)據(jù)的最小值(異常點(diǎn)除外),頂部的水平線段是數(shù)據(jù)的最大值(異常點(diǎn)除外),中間矩形箱子的底所在的位置是數(shù)據(jù)的第一個(gè)四分位數(shù)(即25%分位數(shù)),箱子頂部所在位置是數(shù)據(jù)的第三個(gè)四分位數(shù)據(jù)(即75%分位數(shù))。箱子中間的水平線段刻
52、畫的是數(shù)據(jù)的中位數(shù)(即50%分位數(shù))。l按因子水平分組(Factorlevelstogether,系統(tǒng)默認(rèn)):選擇此項(xiàng),將為每個(gè)因變量創(chuàng)建一個(gè)箱鎖圖,在每個(gè)箱鎖圖內(nèi)根據(jù)分組變量的不同水平的取值創(chuàng)建箱形單元。l不分組(Dependentstogether):選擇此項(xiàng),將為每個(gè)分組變量的水平創(chuàng)建一個(gè)箱鎖圖,在每個(gè)箱鎖圖內(nèi)用不同的顏色區(qū)分不同因變量所對應(yīng)的箱形單元,方便用戶進(jìn)行比較。l無(None):選擇此項(xiàng),不創(chuàng)建箱圖。(2)描述性(Descriptive)欄(復(fù)選項(xiàng)):選擇該組內(nèi)的選項(xiàng),可以生成莖葉圖和(或)直方圖。在箱圖(Boxplots)組內(nèi)選擇的選項(xiàng)不同,則生成的莖葉圖和直方圖也不相同。選
53、擇“按因子水平分組”單選按鈕時(shí),在創(chuàng)建莖葉圖和(或)直方圖時(shí),首先會根據(jù)因變量的不同進(jìn)行分類,為每一個(gè)因變量對應(yīng)的不同分組變量的不同水平創(chuàng)建一個(gè)莖葉圖和(或)直方圖;選擇“不分組”單選按鈕時(shí),在創(chuàng)建莖葉圖和(或)直方圖時(shí),則首先根據(jù)不同分組變量水平的不同,為每一個(gè)因變量創(chuàng)建一個(gè)莖葉圖和(或)直方圖。l莖葉圖(Stem-and-leaf,系統(tǒng)默認(rèn)):莖葉圖主要由3個(gè)部分組成,即頻率(Frequency)、莖(Stem)和葉(Leaf),在圖中按從左到右的順序依次排列,在圖的底端,注明了莖的寬度(StemWidth)和每一葉所代表的觀測量數(shù)(EachLeaf)。莖葉圖中,莖表示數(shù)據(jù)的整數(shù)部分,葉表
54、示數(shù)據(jù)的小數(shù)部分(小數(shù)位數(shù)只有一位,頻數(shù)的數(shù)值有多大,則對應(yīng)的小數(shù)就有多少個(gè)),將莖和葉的數(shù)值組合起來再乘以莖寬,便是該數(shù)據(jù)的值。由于莖葉圖不僅僅能表示數(shù)據(jù)的頻數(shù)分布,還能近似地表示數(shù)據(jù)的大小,因此它比直方圖表達(dá)的信息更全面。l直方圖(Histogram):直接繪制直方圖的步驟詳見第10章。(3)帶檢驗(yàn)的正態(tài)圖(Normalityplotswithtest,復(fù)選框):選擇此項(xiàng),將進(jìn)行正態(tài)性檢驗(yàn),并生成正態(tài)Q-Q概率圖和無趨勢正態(tài)Q-Q概率圖。(4)伸展與級別Levene檢驗(yàn)(SpreadvslevelwithLeveneTest)欄(單選項(xiàng)組):對所有的展布-水平圖進(jìn)行方差齊性檢驗(yàn)和數(shù)據(jù)轉(zhuǎn)換,
55、同時(shí)輸出回歸直線的斜率及方差齊性的Levene檢驗(yàn),但如果沒有指定分組變量,則此選項(xiàng)無效。l無(None):不進(jìn)行Levene檢驗(yàn),系統(tǒng)默認(rèn)。選擇此項(xiàng),SPSS將不產(chǎn)生回歸直線的斜率和方差齊性檢驗(yàn)。l冪估計(jì)(PowerEstimation):對每組數(shù)據(jù)產(chǎn)生一個(gè)中位數(shù)的自然對數(shù)及四個(gè)分位數(shù)的自然對數(shù)的散點(diǎn)圖。l已轉(zhuǎn)換(Transformed):變換原始數(shù)據(jù),用戶可在后面的參數(shù)框中選擇數(shù)據(jù)變換類型。l未轉(zhuǎn)換(Untransformed):不變換原始數(shù)據(jù)時(shí)選擇此項(xiàng)。用戶在“探索:圖”對話框中進(jìn)行選擇后,單擊【繼續(xù)】(Continue)按鈕,即可返回“探索”主對話框。04單擊【選項(xiàng)】(Options)
56、按鈕,打開“探索:選項(xiàng)”(Explore:Options)對話框,如圖3-12所示。圖3-12“探索:選項(xiàng)”對話框在該對話框中,可選擇缺失值的處理方式,SPSS提供了3種處理方式:l按列表排除個(gè)案(Excludecaseslistwise,系統(tǒng)默認(rèn)):選擇此項(xiàng),對所有的分析過程剔除分組變量和因變量中所有帶有缺失值的觀測量數(shù)據(jù);l按對排除個(gè)案(Excludecasespairwise):同時(shí)剔除帶缺失值的觀測量及與缺失值有成對關(guān)系的觀測量。在當(dāng)前分析過程中用到的變量數(shù)據(jù)中剔除帶有缺失值的觀測量數(shù)據(jù),在其他分析過程中可能包含缺失值;l報(bào)告值(Reportvalues):選擇此項(xiàng),將分組變量的缺失值
57、單獨(dú)分為一組,在輸出頻數(shù)表的同時(shí)輸出缺失值。用戶在“探索:選項(xiàng)”對話框中進(jìn)行選擇后,單擊【繼續(xù)】(Continue)按鈕,即可返回“探索”主對話框。05單擊【確定】(OK)按鈕,即可在結(jié)果輸出窗口中得到探索分析過程的數(shù)據(jù)概述、基本統(tǒng)計(jì)描述表、極端值列表、正態(tài)分布檢驗(yàn)、方差齊性檢驗(yàn)、莖葉圖、直方圖、箱鎖圖、正態(tài)分布Q-Q圖、離散正態(tài)分布Q-Q圖等圖表。3.5交叉列聯(lián)表分析在實(shí)際分析中,除了需要對單個(gè)變量的數(shù)據(jù)分布情況進(jìn)行分析外,還需要掌握多個(gè)變量在不同取值情況下的數(shù)據(jù)分布情況,從而進(jìn)一步深入分析變量之間的相互影響和關(guān)系,這種分析就稱為交叉列聯(lián)表分析。當(dāng)所觀察的現(xiàn)象同時(shí)與兩個(gè)因素有關(guān)時(shí),如某種服裝
58、的銷量受價(jià)格和居民收入的影響,某種產(chǎn)品的生產(chǎn)成本受原材料價(jià)格和產(chǎn)量的影響等,通過交叉列聯(lián)表分析,可以較好地反映出這兩個(gè)因素之間有無關(guān)聯(lián)性及兩個(gè)因素與所觀察現(xiàn)象之間的相關(guān)關(guān)系。因此,數(shù)據(jù)交叉列聯(lián)表分析主要包括兩個(gè)基本任務(wù):一是根據(jù)收集的樣本數(shù)據(jù),產(chǎn)生二維或多維交叉列聯(lián)表;二是在交叉列聯(lián)表的基礎(chǔ)上,對兩個(gè)變量間是否存在相關(guān)性進(jìn)行檢驗(yàn)。要獲得變量之間的相關(guān)性,僅僅靠描述性統(tǒng)計(jì)的數(shù)據(jù)是不夠的,還需要借助一些表示變量間相關(guān)程度的統(tǒng)計(jì)量和一些非參數(shù)檢驗(yàn)的方法。常用的衡量變量間相關(guān)程度的統(tǒng)計(jì)量是簡單相關(guān)系數(shù),但在交叉列聯(lián)表分析中,由于行列變量往往不是連續(xù)變量,不符合計(jì)算簡單相關(guān)系數(shù)的前提條件。因此,需要根據(jù)
59、變量的性質(zhì)選擇其他的相關(guān)系數(shù),如Kendall等級相關(guān)系數(shù)、Eta值等。SPSS提供了多種適用于不同類型數(shù)據(jù)的相關(guān)系數(shù)表達(dá),這些相關(guān)性檢驗(yàn)的零假設(shè)都是:行和列變量之間相互獨(dú)立,不存在顯著的相關(guān)關(guān)系。根據(jù)SPSS檢驗(yàn)后得出的相伴概率(ConcomitantSignificance)判斷是否存在相關(guān)關(guān)系。如果相伴概率小于顯著性水平0.05,那么拒絕零假設(shè),行列變量之間彼此相關(guān);如果相伴概率大于顯著性水平0.05,那么接受原假設(shè),行列變量之間彼此獨(dú)立。在交叉列聯(lián)表分析中,SPSS所提供的相關(guān)關(guān)系的檢驗(yàn)方法主要有以下3種:(1)卡方(2)統(tǒng)計(jì)檢驗(yàn):常用于檢驗(yàn)行列變量之間是否相關(guān)。計(jì)算公式為:(3.11
60、)其中,f0表示實(shí)際觀察頻數(shù),fe表示期望頻數(shù)??ǚ浇y(tǒng)計(jì)量服從(行數(shù)-1)(列數(shù)-1)個(gè)自由度的卡方統(tǒng)計(jì)。SPSS在計(jì)算卡方統(tǒng)計(jì)量時(shí),同時(shí)給出相應(yīng)的相伴概率,由此判斷行列變量之間是否相關(guān)。(2)列聯(lián)系數(shù)(Contingencycoefficient):常用于名義變量之間的相關(guān)系數(shù)計(jì)算。計(jì)算公式由卡方統(tǒng)計(jì)量修改而得,公式如下:(3.12)(3)y系數(shù)(PhiandCramersV):常用于名義變量之間的相關(guān)系數(shù)計(jì)算。計(jì)算公式由卡方統(tǒng)計(jì)量修改而得,公式如下:(3.13)y系數(shù)介于0和1之間,其中,K為行數(shù)和列數(shù)較小的實(shí)際數(shù)。交叉列聯(lián)表分析的具體操作步驟如下:01打開數(shù)據(jù)文件,選擇【分析】(Anal
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024招標(biāo)合同委托書格式
- 2024污水處理特許經(jīng)營權(quán)轉(zhuǎn)讓合同
- 2024房地產(chǎn)抵押反擔(dān)保合同范本
- 2024大型購物中心建設(shè)改造合同
- 2024年度智能家居產(chǎn)品設(shè)計(jì)與生產(chǎn)合同
- 2024專項(xiàng)資金借款合同書
- 2024技術(shù)機(jī)密保密協(xié)議書模板
- 企業(yè)股份制轉(zhuǎn)型發(fā)起人合作協(xié)議
- 業(yè)務(wù)經(jīng)理聘請協(xié)議書范本
- 2024委托代理合同樣書
- 固定資產(chǎn)情況表
- 水利工程管理單位定崗標(biāo)準(zhǔn)(試點(diǎn))
- 《建筑施工技術(shù)》課后習(xí)題答案(大學(xué)期末復(fù)習(xí)資料)
- 公司環(huán)境行政處罰事件處置預(yù)案
- 廣東開放大學(xué)風(fēng)險(xiǎn)投資(本2022春)-練習(xí)4答案
- DB65∕T 3253-2020 建筑消防設(shè)施質(zhì)量檢測評定規(guī)程
- 二年級蘇教版數(shù)學(xué)上冊《7的乘法口訣》教案(公開課三稿)
- (完整PPT)半導(dǎo)體物理與器件物理課件
- ASTM B366 B366M-20 工廠制造的變形鎳和鎳合金配件標(biāo)準(zhǔn)規(guī)范
- JIS G4304-2021 熱軋不銹鋼板材、薄板材和帶材
- 2022年中級經(jīng)濟(jì)師-人力資源管理專業(yè)押題模擬試卷3套及答案解析
評論
0/150
提交評論