




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第六章:描述性統(tǒng)計分析Descriptive Statistics菜單詳解描述性統(tǒng)計分析是統(tǒng)計分析的第一步,做好這第一步是下面進行正確統(tǒng)計推斷的先決條件。SPSS的許多模塊均可完成描述性分析,但專門為該目的而設(shè)計的幾個模塊則集中在Descriptive Statistics菜單中,最常用的是列在最前面的四個過程:Frequencies過程的特色是產(chǎn)生頻數(shù)表;Descriptives過程則進行一般性的統(tǒng)計描述;Explore過程用于對數(shù)據(jù)概況不清時的探索性分析;Crosstabs過程則完成計數(shù)資料和等級資料的統(tǒng)計描述和一般的統(tǒng)計檢驗,我們常用的X2 檢驗也在其中完成。本章講述的四個過程在9.0及
2、以前版本中被放置在Summarize菜單中。6.1 Frequencies過程頻數(shù)分布表是描述性統(tǒng)計中最常用的方法之一,F(xiàn)requencies過程就是專門為產(chǎn)生頻數(shù)表而設(shè)計的。它不僅可以產(chǎn)生詳細的頻數(shù)表,還可以按要求給出某百分位點的數(shù)值,以及常用的條圖,圓圖等統(tǒng)計圖。和國內(nèi)常用的頻數(shù)表不同,幾乎所有統(tǒng)計軟件給出的均是詳細頻數(shù)表,即并不按某種要求確定組段數(shù)和組距,而是按照數(shù)值精確列表。如果想用Frequencies過程得到我們所熟悉的頻數(shù)表,請先用第二章學過的Recode過程產(chǎn)生一個新變量來代表所需的各組段。6.1.1界面說明Frequencies對話框的界面如下所示:該界面在SPSS中實在太普
3、通了,無須多言,重點介紹一下各部分的功能如下:【Display frequency tables復選框】確定是否在結(jié)果中輸出頻數(shù)表?!維tatistics鈕】單擊后彈出Statistics對話框如下,用于定義需要計算的其他描述統(tǒng)計量。現(xiàn)將各部分解釋如下:o Percentile Values復選框組 定義需要輸出的百分位數(shù),可計算四分位數(shù)(Quartiles)、每隔指定百分位輸出當前百分位數(shù)(Cut points for equal groups)、或直接指定某個百分位數(shù)(Percentiles),如直接指定輸出P2.5和P97.5。 o Central tendency復選框組 用于定義描述
4、集中趨勢的一組指標:均數(shù)(Mean)、中位數(shù)(Median)、眾數(shù)(Mode)、總和(Sum)。 o Dispersion復選框組 用于定義描述離散趨勢的一組指標:標準差(Std.deviation)、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、標準誤(S.E.mean)。 o Distribution復選框組 用于定義描述分布特征的兩個指標:偏度系數(shù)(Skewness)和峰度系數(shù)(Kurtosis)。 o Values are group midpoints復選框 當你輸出的數(shù)據(jù)是分組頻數(shù)數(shù)據(jù),并且具體數(shù)值是組中值時,選中該復選框以通知
5、SPSS,免得它犯錯誤。眾數(shù)(Mode)指所有數(shù)值中出現(xiàn)頻率最高的一個值,在國內(nèi)用的非常少?!綜harts鈕】彈出Charts對話框,用于設(shè)定所做的統(tǒng)計圖。o Chart type單選鈕組 定義統(tǒng)計圖類型,有四種選擇:無、條圖(Bar chart)、圓圖(Pie chart)、直方圖Histogram),其中直方圖還可以選擇是否加上正態(tài)曲線(With normal curve)。 o Chart Values單選鈕組 定義是按照頻數(shù)還是按百分比做圖(即影響縱坐標刻度)。【Format鈕】彈出Format對話框,用于定義輸出頻數(shù)表的格式,不過用處不大,一般不管。o Order by單選鈕組 定義
6、頻數(shù)表的排列次序,有四個選項:Ascending values為根據(jù)數(shù)值大小按升序從小到大作頻數(shù)分布;Descending values為根據(jù)數(shù)值大小按降序從大到小作頻數(shù)分布;Ascending counts為根據(jù)頻數(shù)多少按升序從少到多作頻數(shù)分布;Descending counts為根據(jù)頻數(shù)多少按降序從多到少作頻數(shù)分布。 o Multiple Variables單選鈕組 如果選擇了兩個以上變量做頻數(shù)表,則Compare variables可以將他們的結(jié)果在同一個頻數(shù)表過程輸出結(jié)果中顯示,便于互相比較,Organize output by variables則將結(jié)果在不同的頻數(shù)表過程輸出結(jié)果中顯
7、示。 o Suppress Tables more than.復選框 當頻數(shù)表的分組數(shù)大于下面設(shè)定數(shù)值時禁止它在結(jié)果中輸出,這樣可以避免產(chǎn)生巨型表格。6.1.2 分析實例例6.1 某地101例健康男子血清總膽固醇值測定結(jié)果如下,請繪制頻數(shù)表、直方圖,計算均數(shù)、標準差、變異系數(shù)CV、中位數(shù)M、p2.5和p97.5(衛(wèi)統(tǒng)第三版p233 1.1題)。4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 4.12 5.18 5.77 4.79 5.12 5.20 5.
8、10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.
9、09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 3.05解:為節(jié)省篇幅,這里只給出精確頻數(shù)表的做法,假設(shè)數(shù)據(jù)已經(jīng)輸好,變量名為X,具體解法如下:1. Analyze=Descriptive Statistics=Frequencies 2. Variables框:選入X 3. 單擊Statistics鈕: 4. 選中Mean、Std.deviation、Median復選框 5. 單擊Percentiles:輸入2.5:單擊Add:輸入97.5:單擊Add: 6. 單擊Continue鈕 7. 單擊
10、Charts鈕: 8. 選中Bar charts 9. 單擊Continue鈕 10. 單擊OK得出結(jié)果后手工計算出CV。上面做出的直方圖分組太多,需要進一步編輯。6.1.3結(jié)果解釋上題除直方圖外的的輸出結(jié)果如下:Frequencies最上方為表格名稱,左上方為分析變量名,可見樣本量N為101例,缺失值0例,均數(shù)Mean=4.69,中位數(shù)Median=4.61,標準差STD=0.8616,P2.5=3.04,P97.5=6.45。系統(tǒng)對變量x作頻數(shù)分布表(此處只列出了開頭部分),Vaild右側(cè)為原始值,F(xiàn)requency為頻數(shù),Percent為各組頻數(shù)占總例數(shù)的百分比(包括缺失記錄在內(nèi)),Va
11、lid percent為各組頻數(shù)占總例數(shù)的有效百分比,Cum Percent為各組頻數(shù)占總例數(shù)的累積百分比。6.2 Descriptives過程Descriptives過程是連續(xù)資料統(tǒng)計描述應(yīng)用最多的一個過程,他可對變量進行描述性統(tǒng)計分析,計算并列出一系列相應(yīng)的統(tǒng)計指標。這和其他過程相比并無不同。但該過程還有個特殊功能就是可將原始數(shù)據(jù)轉(zhuǎn)換成標準正態(tài)評分值并以變量的形式存入數(shù)據(jù)庫供以后分析。6.2.1 界面說明【Save standardized values as variables復選框】確定是否將原始數(shù)據(jù)的標準正態(tài)評分存為新變量?!綩ptions鈕】彈出Options對話框,大部分內(nèi)容均在
12、前面Frequences過程的Statistics對話框中見過,只有最下方的Display Order單選鈕組是新的,可以選擇為變量列表順序、字母順序、均數(shù)升序或均數(shù)降序。6.2.2結(jié)果解釋下面是一個典型的Descriptives過程結(jié)果統(tǒng)計表:一望可知,這里的大部分內(nèi)容都在上一節(jié)見過,因此就不再多解釋了。講了兩個過程,也許大家已經(jīng)發(fā)現(xiàn)了:結(jié)果中的統(tǒng)計專業(yè)單詞多數(shù)在對話框中就已經(jīng)出現(xiàn),因此我們以后會詳細解釋對話框的內(nèi)容,結(jié)果中相同的單詞不再重復解釋。6.3 Explore過程Explore過程可對變量進行更為深入詳盡的描述性統(tǒng)計分析,主要用于對資料的性質(zhì)、分布特點等完全不清楚時,故又稱之為探索
13、性分析。它在一般描述性統(tǒng)計指標的基礎(chǔ)上,增加有關(guān)數(shù)據(jù)其他特征的文字與圖形描述,如枝葉圖、箱圖等,顯得更加詳細、全面,有助于用戶制定繼續(xù)分析的方案。6.3.1界面說明【Display單選鈕組】用于選擇輸出結(jié)果中是否包含統(tǒng)計描述、統(tǒng)計圖或兩者均包括?!綝ependent List框】用于選入需要分析的變量?!綟actor List框】如果想讓所分析的變量按某種因素取值分組分析,則在這里選入分組變量?!綥abel cases by框】選擇一個變量,他的取值將作為每條記錄的標簽。最典型的情況是使用記錄ID號的變量?!維tatistics鈕】彈出Statistics對話框,用于選擇所需要的描述統(tǒng)計量。有
14、如下選項:o Descriptives復選框:輸出均數(shù)、中位數(shù)、眾數(shù)、5%修正均數(shù)、標準誤、方差、標準差、最小值、最大值、全距、四分位全距、峰度系數(shù)、峰度系數(shù)的標準誤、偏度系數(shù)、偏度系數(shù)的標準誤及指定的均數(shù)可信區(qū)間。 o M-estimators復選框:作中心趨勢的粗略最大似然確定,輸出四個不同權(quán)重的最大似然確定數(shù)。 o Outliers復選框:輸出五個最大值與五個最小值。 o Percentiles復選框:輸出第5%、10%、25%、50%、75%、90%、95%位數(shù)?!綪lot鈕】彈出Plot對話框,用于選擇所需要的統(tǒng)計圖。有如下選項:o Boxplots單選框組:確定箱式圖的繪制方式,可
15、以是按組別分組繪制(Factor levels together),也可以不分組一起繪制(Depentends together),或者不繪制(None)。 o Descriptive復選框組:可以選擇繪制莖葉圖(Stem-and-leaf)和直方圖(Histogram)。 o Normality plots with test復選框:繪制正態(tài)分布圖并進行變量是否符合正態(tài)分布的檢驗。 o Spread vs. Level with Levene Test單選框組:當選擇了分組變量時,繪制spread-versus-level圖(我還沒有找到他的中文名字該叫什么),設(shè)置繪圖時變量的轉(zhuǎn)換方式,并進
16、行組間方差齊性檢驗。【Options鈕】用于選擇對缺失值的處理方式,可以是不分析有任一缺失值的記錄、不分析計算某統(tǒng)計量時有缺失值的記錄,或報告缺失值。6.3.2結(jié)果解釋以例6.1的數(shù)據(jù)為例,按默認方式下的選擇,Explore過程的輸出如下:Explore首先是例行的處理記錄缺失值情況報告,可見101例均為有效值。上表詳細列出了常用的描述統(tǒng)計量,如果有標準誤也會列出(如偏度和峰度系數(shù))。XX Stem-and-Leaf PlotFrequency Stem & Leaf 1.00 2 . 7 8.00 3 . 00123334 9.00 3 . 556689999 24.00 4 . 00000
17、1111222333333344444 25.00 4 . 5555556666677777777788899 17.00 5 . 01111111222333334 9.00 5 . 556778889 6.00 6 . 112333 1.00 6 . 5 1.00 Extremes (=7.2)Stem width: 1.0000Each leaf: 1 case(s)以上是莖葉圖,整數(shù)位為莖,小數(shù)位為葉。這樣可以非常直觀的看出數(shù)據(jù)的分布范圍及形態(tài),在國外非常流行。以上是箱式圖,中間的黑粗線為均數(shù),紅框為四分位間距的范圍,上下兩個細線為最大、最小值。6.4 Crosstabs過程Cross
18、tabs過程用于對計數(shù)資料和有序分類資料進行統(tǒng)計描述和簡單的統(tǒng)計推斷。在分析時可以產(chǎn)生二維至n維列聯(lián)表,并計算相應(yīng)的百分數(shù)指標。統(tǒng)計推斷則包括了我們常用的X2檢驗、Kappa值,分層X2(X2M-H)。如果安裝了相應(yīng)模塊,還可計算n維列聯(lián)表的確切概率(Fishers Exact Test)值。Crosstabs過程不能產(chǎn)生一維頻數(shù)表(單變量頻數(shù)表),該功能由Frequencies過程實現(xiàn)。6.4.1界面說明【Rows框】用于選擇行*列表中的行變量。【Columns框】用于選擇行*列表中的列變量。【Layer框】Layer指的是層,對話框中的許多設(shè)置都可以分層設(shè)定,在同一層中的變量使用相同的設(shè)置
19、,而不同層中的變量分別使用各自層的設(shè)置。如果要讓不同的變量做不同的分析,則將其選入Layer框,并用Previous和Next鈕設(shè)為不同層。Layer在這里用的比較少,在多元回歸中我們將進行詳細的解釋。【Display clustered bar charts復選框】顯示重疊條圖。【Suppress table復選框】禁止在結(jié)果中輸出行*列表。【Exact鈕】針對2*2以上的行*列表設(shè)定計算確切概率的方法,可以是不計算(Asymptotic only)、蒙特卡羅模擬(Monte Carlo)或確切計算(Exact)。蒙特卡羅模擬默認進行10000次模擬,給出99%可信區(qū)間;確切計算默認計算時間
20、限制在5分鐘內(nèi)。這些默認值均可更改。如果你在安裝SPSS時沒有安裝EXACT模塊,則此處對話框中不會出現(xiàn)Exact鈕。在3*3及以上的行*列表中,確切概率的精確計算是極為漫長的過程。我曾經(jīng)用SAS 6.12在P133機上計算過一個12格表的確切概率,整整跑了兩個小時后,SAS告訴我說機器內(nèi)存不足:(。SPSS的計算速度比SAS要慢許多倍,因此一般只需要選用蒙特卡羅模擬算出概率值的99%可信區(qū)間就行了,精度完全可以滿足需要,而速度極快(10000次模擬一般耗時在10秒左右)?!維tatistics鈕】彈出Statistics對話框,用于定義所需計算的統(tǒng)計量。o Chi-square復選框:計算X
21、2值。 o Correlations復選框:計算行、列兩變量的Pearson相關(guān)系數(shù)和Spearman等級相關(guān)系數(shù)。 o Norminal復選框組:選擇是否輸出反映分類資料相關(guān)性的指標,很少使用。a. Contingency coefficient復選框:即列聯(lián)系數(shù),其值界于01之間;b. Phi and Cramers V復選框:這兩者也是基于X2值的,Phi在四格表X2檢驗中界于-11之間,在R*C表X2檢驗中界于01之間;Cramers V 則界于01之間;c. Lambda復選框:在自變量預測中用于反映比例縮減誤差,其值為1時表明自變量預測應(yīng)變量好,為0時表明自變量預測應(yīng)變量差;d.
22、Uncertainty coefficient復選框:不確定系數(shù),以熵為標準的比例縮減誤差,其值接近1時表明后一變量的信息很大程度來自前一變量,其值接近0時表明后一變量的信息與前一變量無關(guān)。o Ordinal復選框組:選擇是否輸出反映有序分類資料相關(guān)性的指標,很少使用。a. Gamma復選框:界于01之間,所有觀察實際數(shù)集中于左上角和右下角時,其值為1;b. Somersd復選框:為獨立變量上不存在同分的偶對中,同序?qū)ψ訑?shù)超過異序?qū)ψ訑?shù)的比例;c. Kendalls tau-b復選框:界于-11之間;d. Kendalls tau-c復選框:界于-11之間;o Eta復選框:計算Eta值,其平
23、方值可認為是應(yīng)變量受不同因素影響所致方差的比例; o Kappa復選框:計算Kappa值,即內(nèi)部一致性系數(shù); o Risk復選框:計算比數(shù)比OR值; o McNemanr復選框:進行McNemanr檢驗(一種非參檢驗); o Cochrans and Mantel-Haenszel statistics復選框:計算X2M-H統(tǒng)計量(分層X2,也有寫為X2CMH的),可在下方輸出H0假設(shè)的OR值,默認為1?!綜ells鈕】彈出Cells對話框,用于定義列聯(lián)表單元格中需要計算的指標:o Counts復選框組:是否輸出實際觀察數(shù)(Observed)和理論數(shù)(Expected); o Percenta
24、ges復選框組:是否輸出行百分數(shù)(Row)、列百分數(shù)(Column)以及合計百分數(shù)(Total); o Residuals復選框組:選擇殘差的顯示方式,可以是實際數(shù)與理論數(shù)的差值(Unstandardized)、標化后的差值(Standardized,實際數(shù)與理論數(shù)的差值除理論數(shù)),或者由標準誤確立的單元格殘差(Adj. Standardized);【Format鈕】用于選擇行變量是升序還是降序排列。6.4.2分析實例例6.2 某醫(yī)生用國產(chǎn)呋喃硝胺治療十二指腸潰瘍,以甲氰咪胍作對照組,問兩種方法治療效果有無差別(醫(yī)統(tǒng)第二版P37 例3.10)?處 理愈 合未愈合合計呋喃硝胺54862甲氰咪胍442064合 計9828126解:由于此處給出的直接是頻數(shù)表,因此在建立數(shù)據(jù)集時可以直接輸入三個變量行變量、列變量和指示每個格子中頻數(shù)的變量,然后用Weight Cases對話框指定頻數(shù)變量,最后調(diào)用Crosstabs過程進行X2檢驗。假設(shè)三個變量分別名為R、C和W,則數(shù)據(jù)集結(jié)構(gòu)和命令如下:RCW1.001.0054.001.002.0044.002.001.008.002.002.0020.001. Data
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度新股東入資生物制藥產(chǎn)業(yè)合作協(xié)議
- 2025年度電子商務(wù)平臺員工勞務(wù)外包及運營合同
- 二零二五年度長租公寓退租服務(wù)保障協(xié)議
- 二零二五年度餐飲連鎖生意合作合同范本
- 房產(chǎn)證抵押貸款合同抵押物管理協(xié)議(2025年度)
- 二零二五年度精裝高層購房定金合同
- 2025年度私人宅基地買賣轉(zhuǎn)讓協(xié)議書及配套設(shè)施建設(shè)補充協(xié)議
- 2025年度租房押金監(jiān)管及退還標準合同
- 二零二五年度文化產(chǎn)業(yè)投資入股協(xié)議
- 2025年黑龍江貨運從業(yè)資格證的試題
- 山東省萊蕪市高職單招2023年綜合素質(zhì)練習題含答案
- 質(zhì)量管理軟件操作手冊
- 新人教版五年級上冊數(shù)學應(yīng)用題大全doc
- 翰威特任職資格撰寫培訓材料
- 大家排好隊說課
- 鐵氧體永磁材料
- 湘教版初中數(shù)學教材目錄
- 2023年新改版教科版四年級下冊科學精編練習題(含單元+期中+期末測試卷)
- 2021年劍橋國際少兒英語KidsBox2文本
- 金蝶云星辰初級考試題庫
- GM/T 0107-2021智能IC卡密鑰管理系統(tǒng)基本技術(shù)要求
評論
0/150
提交評論