spss_數(shù)據(jù)正態(tài)分布檢驗方法及意義.doc_第1頁
spss_數(shù)據(jù)正態(tài)分布檢驗方法及意義.doc_第2頁
spss_數(shù)據(jù)正態(tài)分布檢驗方法及意義.doc_第3頁
spss_數(shù)據(jù)正態(tài)分布檢驗方法及意義.doc_第4頁
spss_數(shù)據(jù)正態(tài)分布檢驗方法及意義.doc_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、.spss 數(shù)據(jù)正態(tài)分布檢驗方法及意義判讀要觀察某一屬性的一組數(shù)據(jù)是否符合正態(tài)分布,可以有兩種方法(目前我知道這兩種,并且這兩種方法只是直觀觀察,不是定量的正態(tài)分布檢驗):1:在 spss 里的基本統(tǒng)計分析功能里的頻數(shù)統(tǒng)計功能里有對某個變量各個觀測值的頻數(shù)直方圖中可以選擇繪制正態(tài)曲線。具體如下:Analyze-DescriptiveStatistics-Frequencies,打開頻數(shù)統(tǒng)計對話框,在Statistics 里可以選擇獲得各種描述性的統(tǒng)計量,如:均值、方差、分位數(shù)、峰度、標(biāo)準(zhǔn)差等各種描述性統(tǒng)計量。在 Charts 里可以選擇顯示的圖形類型,其中Histograms 選項為柱狀圖也就

2、是我們說的直方圖,同時可以選擇是否繪制該組數(shù)據(jù)的正態(tài)曲線(Withnorma curve ),這樣我們可以直觀觀察該組數(shù)據(jù)是否大致符合正態(tài)分布。如下圖:從上圖中可以看出,該組數(shù)據(jù)基本符合正態(tài)分布。2 :正態(tài)分布的Q-Q 圖:在 spss 里的基本統(tǒng)計分析功能里的探索性分析里面可以通過觀察數(shù)據(jù)的q-q 圖來判斷數(shù)據(jù)是否服從正態(tài)分布。具體步驟如下: Analyze-DescriptiveStatistics-Explore打開對話框,選擇Plots 選項,選擇 Normalityplots with tests 選項,可以繪制該組數(shù)據(jù)的q-q圖。圖的橫坐標(biāo)為改變量的觀測值,縱坐標(biāo)為分位數(shù)。若該組數(shù)

3、據(jù)服從正態(tài)分布,則圖中的點應(yīng)該靠近圖中直線??v坐標(biāo)為分位數(shù),是根據(jù)分布函數(shù)公式F(x)=i/n+1 得出的 .i 為把一組數(shù)從小到大排序后第i 個數(shù)據(jù)的位置, n 為樣本容量。若該數(shù)組服從正態(tài)分布則其q-q 圖應(yīng)該與理論的 q-q 圖(也就是圖中的直線)基本符合。對于理論的標(biāo)準(zhǔn)正態(tài)分布,其q-q 圖為 y=x 直線。非標(biāo)準(zhǔn)正態(tài)分布的斜率為樣本標(biāo)準(zhǔn)差,截距為樣本均值。如下圖:1/32.如何在 spss中進(jìn)行正態(tài)分布檢驗1(轉(zhuǎn) )(2009-07-22 11:11:57)標(biāo)簽: 雜談一、圖示法1、 P-P 圖以樣本的累計頻率作為橫坐標(biāo), 以安裝正態(tài)分布計算的相應(yīng)累計概率作為縱坐標(biāo), 把樣本值表現(xiàn)為

4、直角坐標(biāo)系中的散點。 如果資料服從整體分布, 則樣本點應(yīng)圍繞第一象限的對角線分布。2、 Q-Q 圖以樣本的分位數(shù)作為橫坐標(biāo), 以按照正態(tài)分布計算的相應(yīng)分位點作為縱坐標(biāo), 把樣本表現(xiàn)為指教坐標(biāo)系的散點。 如果資料服從正態(tài)分布, 則樣本點應(yīng)該呈一條圍繞第一象限對角線的直線。以上兩種方法以Q-Q 圖為佳,效率較高。3、直方圖判斷方法:是否以鐘形分布,同時可以選擇輸出正態(tài)性曲線。4、箱式圖判斷方法:觀測離群值和中位數(shù)。5、莖葉圖類似與直方圖,但實質(zhì)不同。二、計算法1、偏度系數(shù)(Skewness)和峰度系數(shù)(Kurtosis)2/32.計算公式:g1 表示偏度, g2 表示峰度,通過計算 g1 和 g2

5、 及其標(biāo)準(zhǔn)誤 g1 及 g2 然后作 U 檢驗。兩種檢驗同時得出 U0.05 的結(jié)論時,才可以認(rèn)為該組資料服從正態(tài)分布。由公式可見,部分文獻(xiàn)中所說的“偏度和峰度都接近0 可以認(rèn)為 近似服從正態(tài)分布”并不嚴(yán)謹(jǐn)。2、非參數(shù)檢驗方法非參數(shù)檢驗方法包括Kolmogorov-Smirnov檢驗( D 檢驗)和Shapiro- Wilk ( W 檢驗 )。SAS中規(guī)定:當(dāng)樣本含量n 2000 時 , 結(jié)果以 Shapiro Wilk (W 檢驗 ) 為準(zhǔn) , 當(dāng)樣本含量 n 2000 時 , 結(jié)果以 Kolmogorov Smirnov( D 檢驗 ) 為準(zhǔn)。SPSS中則這樣規(guī)定: (1)如果指定的是非整

6、數(shù)權(quán)重,則在加權(quán)樣本大小位于3 和 50 之間時,計算Shapiro-Wilk 統(tǒng)計量。 對于無權(quán)重或整數(shù)權(quán)重,在加權(quán)樣本大小位于3 和 5000之間時,計算該統(tǒng)計量。由此可見,部分SPSS教材里面關(guān)于“Shapiro Wilk 適用于樣本量 3-50 之間的數(shù)據(jù)”的說法是在是理解片面,誤人子弟。(2)單樣本Kolmogorov-Smirnov檢驗可用于檢驗變量(例如income)是否為正態(tài)分布。對于此兩種檢驗,如果P 值大于 0.05,表明資料服從正態(tài)分布。三、 SPSS操作示例SPSS中有很多操作可以進(jìn)行正態(tài)檢驗, 在此只介紹最主要和最全面最方便的操作:1、工具欄 -分析描述性統(tǒng)計探索性2

7、、選擇要分析的變量,選入因變量框內(nèi),然后點選圖表,設(shè)置輸出莖葉圖和直方圖,選擇輸出正態(tài)性檢驗圖表,注意顯示(Display)要選擇雙項( Both)。3/32.3、 Output 結(jié)果(1)Descriptives:描述中有峰度系數(shù)和偏度系數(shù),根據(jù)上述判斷標(biāo)準(zhǔn),數(shù)據(jù)不符合正態(tài)分布。Sk =0,Ku=0 時,分布呈正態(tài), Sk0時,分布呈正偏態(tài), Sk0曲線比較陡峭, KuCompare Means-Independent-Samples T Test運行結(jié)果:經(jīng)方差齊性檢驗:F= 0.393P=0.532 ,即兩方差齊。(因為p 大于 0.05 )所以選用 t檢驗的第一行方差齊情況下的t 檢驗

8、的結(jié)果:就是選用方差假設(shè)奇的結(jié)果所以, t=0.644,p=0.522,沒有顯著性差異。(因為p 0.05表示差異有顯著性)。均值相差: 113.30159解釋:7/32.使用 compare means 里的 independent smaples T test,檢驗結(jié)果里的Levenes Test for Equality of Variances就是對方差齊性的檢驗 , 如果 P 值大于 0.05 則認(rèn)為是方差齊, 統(tǒng)計量為F= S12/S2 F(n1-1,n2-1) ,顯著水平一般為0.05,0.01,原假設(shè)H0:方差相等。方差分析 (Anaylsis of Variance, ANO

9、VA)要求各組方差整齊,不過一般認(rèn)為,如果各組人數(shù)相若,就算未能通過方差整齊檢驗,問題也不大。One-Way ANOVA對話方塊中,點擊Options( 選項 ) 按扭,勾 Homogeneity-of-variance即可。它會產(chǎn)生Levene 、Cochran C 、Bartlett-Box F等檢驗值及其顯著性水平P 值,若 P 值Compare Means-Independent-samples T Test.再看看結(jié)果中p 值的大小是否 Descriptive Statistics-Frequencies ,把 hstarts 選入 Variables ,取消在 Display Fr

10、equency table 前的勾,在 Chart 里面 histogram ,在 Statistics 選項中如圖 18/32.圖 1分別選好均數(shù) (Mean),中位數(shù) (Median) ,眾數(shù) (Mode),總數(shù) (Sum),標(biāo)準(zhǔn)差 (Std. deviation) ,方差 (Variance) ,范圍 (range) ,最小值 (Minimum) ,最大值(Maximum),偏度系數(shù) (Skewness) ,峰度系數(shù) (Kutosis) ,按 Continue 返回,再按 OK,出現(xiàn)結(jié)果如圖 2圖 2表中,中位數(shù)與平均數(shù)接近,與眾數(shù)相差不大,分布良好。標(biāo)準(zhǔn)差大,即數(shù)據(jù)間的變化差異還還小。

11、峰度和偏度都接近 0,則數(shù)據(jù)基本接近于正態(tài)分布。下面圖3 的頻率分布圖就更直觀的觀察到這樣的情況9/32.圖 3二采用各種圖直觀觀察數(shù)據(jù)分布情況,如采用柱型圖觀察歸類的比例等。同樣以自帶文件 Trends chapter 13.sav 為例,我們可以觀察一下各年的數(shù)據(jù)總和的對比:1選擇 Graph-Bar-Simple ,在“ Data in chart are ”一項選擇 Summaryof groups of cases ,然后按 Define ,出現(xiàn)圖 4,10/32.圖 42 選擇 Bars Represent-Other statistic(e.g. mean),把 hstarts一

12、項選入Variable 里面,把 YEAR,Periodic 一項選入 Category Axis 項中,并按 Change Statistic 鍵,出現(xiàn)圖 5:圖 53在 Statistic 選項中選 Sum of values 一項,按 Continue 返回,按 OK即可出現(xiàn)圖 6:圖 6從圖中可以非常直觀的看出1965 年 -1975 年間,每年的總體數(shù)量對比和各數(shù)值多少。三通過列聯(lián)表來觀察,數(shù)據(jù)的交錯關(guān)系。以軟件自帶的文件University of Florida graduate salaries.sav來說明1、選擇 Tables-Basic Table ,在彈出對話框中,選擇

13、Graduate 到 Summaries 欄, College 到 Down ,Gender 到 Across 欄,如圖 711/32.圖 72、選擇 Statistics按鍵,選取 Count 和 layer% 到 Cell Statistics一欄,并按 Continue 鍵,如圖 8圖 812/32with value labels only.三、選擇 Layout 按鍵,選擇 Summary Variable Labels-In separate labels(匯總的標(biāo)簽,如本例的 Graduate ,放在表外), Statistics Labels-Across top (數(shù)據(jù)的標(biāo)簽

14、橫放在頂部,如本例的 Count 和 Layer%),并在 Label groups前選擇打勾 ( 表示只需要具體的標(biāo)簽名就可以,不需要匯總名,如本例 Gender 和 College) ,如圖 9圖 9四、選擇 Total按鍵,在 Totals over each group variable一項前選勾,則輸出表會有增加匯總一欄,如圖1013/32.圖 10提示,需要什么表格形式可以根據(jù)要求來調(diào)整, 但對輸出按鍵都需要熟悉, 多嘗試幾次就可以看出不同的區(qū)別。圖 11 為輸出的表格圖 11重要提示 :如果結(jié)果變成變量的匯總( SUM),則先選擇 Data-Weight Cases ,把 Gra

15、duate 的選項先選入 Weight Cases by 內(nèi),再選回 Do not weight Cases ,14/32.按 OK即可。對于其他帶有編號的一項都可以這樣做。這一點不知為何,本人屢次試過總需要這樣調(diào)整。參考圖 12圖 12幾種常用的統(tǒng)計方法應(yīng)用一般來說,最最常用的統(tǒng)計分析有假設(shè)檢驗和回歸分析,在 SPSS中也有很好的對應(yīng)工具來做這些分析, 但對其基本思路和要求都必須了解, 這樣才能更靈活的發(fā)揮。下面抄錄 EXCEL在市場調(diào)查中的應(yīng)用一書中關(guān)于這方面的內(nèi)容:1假設(shè)檢驗?zāi)康模菏怯脕?判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成 的統(tǒng)計推斷方法?;舅枷耄盒「怕史?/p>

16、證法思想。即 P0.01 或 P0.05 在一次試驗中基本不會生發(fā)。反證法思想是先提出假設(shè) (檢驗假設(shè) H0),再用適當(dāng)?shù)慕y(tǒng)計方法確定假設(shè)成立的可能性大小,如果可能性小, 則認(rèn)為假設(shè)不成立, 否則,還不能認(rèn)為假設(shè)不成立。方法: t 檢驗, u 檢驗,秩和檢驗,卡方檢驗應(yīng)用條件: A、各組資料具有可比性B、具正態(tài)分布C、方差齊性(即先作F 檢驗,如 F0.1,具方差齊性)2方差分析目的:又稱為變異系數(shù)分析或F 檢驗。用于推斷 兩組或多組資料的總體平均數(shù)是否相同,檢驗兩個或多個樣本平均數(shù)的差異是否具有統(tǒng)計意義( 也可認(rèn)為是檢驗多個總體均值是否有顯著性差異注 1,這樣可能更簡單一點 ) 。15/32

17、.基本思想:用組內(nèi)均方去除組間均方的商,即F 值,與 1 比較,若 F 值接近 1,則說明各驗均數(shù)間的差異沒有統(tǒng)計學(xué)意義,否則表示有統(tǒng)計學(xué)意義。應(yīng)用條件: A、各組資料具有可比性B、具正態(tài)分布C、方差齊性(即 F 檢驗)提示,在應(yīng)用 SPSS中,只要死死的記住一個顯著系數(shù) 0.05 就可以應(yīng)用(如果是雙尾系數(shù)需要除以 2),一般的大于 0.05 接受原假設(shè),小于 0.05 則拒絕。簡單的說,一般 結(jié)果拒絕就是說樣本有差異,樣本相對獨立 ,都是表示同一種意思,讀這方面書的時候,希望不要讓這些名詞混亂了思路。SPSS的方差檢驗中,需要注意下面問題:方差檢驗中, Post Hoc 鍵有 LSD的選項

18、:當(dāng)方差分析 F 檢驗否定了原假設(shè),即認(rèn)為至少有兩個總體的均值存在顯著性差異時, 須進(jìn)一步確定是哪兩個或哪幾個均值顯著地不同,則需要進(jìn)行 多重比較來檢驗 。LSD即是一種多因變量的三個或三個以上水平下均值之間進(jìn)行的兩兩比較檢驗。2 Independent Samples 檢驗中的 Mann-Whitney U檢驗與 K Independent Samples 中的 Kruskal-Walllis (克魯斯卡爾瓦里斯) H 檢驗法思想類似,常用來作為非參數(shù)檢驗。2 Related Samples非參數(shù)檢驗中,一般有Sign 普通符號檢驗法和Wilcoxon 威爾科克森符號秩檢驗法。前者用于研究的

19、問題 只有兩個可能的結(jié)果 :“是”或“非”,并且二者遵從二項分布; 后者是普通符號檢驗法的改進(jìn), 除了可以檢驗是非外,還可以了解差異的大小。K Related Samples 非參數(shù)檢驗中,主要有 Friedman 秩和檢驗與 Cochran Q 檢驗二種選擇,前者是對多個樣本是否來自同一總體的檢驗, 而后者是用于 只分為“成功”和“失敗”兩種結(jié)果的定類尺度 測量的數(shù)據(jù)。附錄: SPSS假設(shè)檢驗方法使用對照表圖 13其中相關(guān)、配對或有交互作用可以理解為 EXCEL的重復(fù),獨立或無交互作用可以理解為 EXCEL中的無重復(fù)。圖 13 表大部分參考數(shù)據(jù)分析與 SPSS應(yīng)用一書,特別說明3回歸分析16

20、/32.目的:研究一個變量 Y 與其它若干變量X 之間的一種數(shù)學(xué)工具。 它是一組試驗或觀測數(shù)據(jù)的基礎(chǔ)上, 尋找被隨機(jī)性掩蓋的變量之間的依存關(guān)系。A直線回歸方程Yc=a bXB回歸關(guān)系的檢驗:求回歸方程在總體中是否成立,即是否樣本代表的總體也有直線回歸關(guān)系。a. 方差分析:基本思想是將總變異分解為 SS回歸和 SS乘余,然后利用 F 檢驗來判斷方程是否成立。b. t 檢驗:基本思想是利用樣本回歸系數(shù) b 與總體平均數(shù)回歸系數(shù)進(jìn)行比較來判斷回歸方程是否成立。下面摘錄數(shù)據(jù)分析與 SPSS應(yīng)用一書關(guān)于相關(guān)回歸和時間序列分析一些概念解釋。數(shù)據(jù)變量間主要存在二類關(guān)系:一類是函數(shù)關(guān)系,一類是相關(guān)關(guān)系。前者是

21、變量間有確定關(guān)系,即一個變量的值能夠在其他變量取值確定的情況下,按某種函數(shù)關(guān)系唯一確定; 后者是變量間雖然具有的聯(lián)系, 并非確定關(guān)系, 如價格與銷量量,價格高了,銷售量可能會上去,但無法確定銷售量是多少。通過散點圖來觀察, 如果點都集中在一條直線附近, 是線性相關(guān), 如果在一條曲線附近,則為非線性相關(guān)。如果一個變量因另一個變量的增加而增加, 減少而減少,則二個變量間存在正相關(guān)關(guān)系,反之則為負(fù)相關(guān)關(guān)系。 極端的相關(guān)是完全相關(guān)和零相關(guān)。 如某地區(qū)購買自行車多少與購買大蒜多少無關(guān),是為零相關(guān)。按我的理解,相關(guān)分析就是推斷變量與變量之間關(guān)系的密切程度, 回歸就是在相關(guān)的基礎(chǔ)上, 找出變量間的擬合模型,

22、 從而進(jìn)一步推測出未來的趨勢和變量。 而時間序列則是以時間的作為觀察的序列,來推斷變量間的關(guān)系的一種模型。以自帶文件 Trends chapter 13.sav 為例,說明一下如何應(yīng)用這三種分析工具。1相關(guān)打開 Trends chapter 13.sav 文件,可以看到,這個文件的數(shù)據(jù)是以時間來排序的,在每個值前增加一行序列號變量,如圖 1417/32.圖 14一個時間序列的影響因素有四種變動: A長期趨勢( Secular Trend), B 季節(jié)變動( Seasonal Variation), C循環(huán)變動( Cyclical Variation), D 不規(guī)則變動( Irregular V

23、ariation)。我們可以觀察一下這些數(shù)據(jù)是否存在某種關(guān)系,打開 Graphs-Sequence,如圖 1518/32.圖 15把 hstarts 選入 Variables 項,把 No.選入 Time Axis Lables ,然后按 OK,出現(xiàn)圖 16:圖 16從圖可以看出,數(shù)據(jù)總是在一個周期內(nèi)反復(fù)在上下波動, 雖然高低的位置不一樣,但這種波動顯然是隨著時間的不同而變化。因此可以察看,因變量與時間的關(guān)系如何。選擇 Data-Define Dates ,出現(xiàn)圖 1719/32.圖 17在 Year 一欄填入 1965,Month 一欄填入 1,表示數(shù)據(jù)從 1965 年 1 月開始計算。選擇

24、 Analyze-Correlate-Bivariate,出現(xiàn)圖 18圖 1820/32.把 hstarts,Year 和 Month 都選入 Varibales選項, CorrelationCoefficients選擇 Pearson 和 Spearman(其實只需要選 Spearman就可以,這里只是試一下,作為比較)。注:相關(guān)檢驗中有 Pearson(皮爾森)相關(guān)系數(shù)和 Spearman(斯皮爾曼)等級相關(guān),前者也稱皮爾森相關(guān)系數(shù), 是對兩個定距變量 關(guān)系的刻畫; 后者是用來考察兩個變量中至少有 一個定序變量 時的相關(guān)關(guān)系。 Zero-order Correlations (零階偏聽偏相

25、關(guān)系數(shù)) 是按 Pearson 簡單相關(guān)系數(shù)公式計算得到的相關(guān)系數(shù)。 在皮爾森系數(shù) r 是對兩個定距變量關(guān)系的刻畫 :若 - 1r 1, |r| 越大,表明兩個變量之間的相關(guān)程度越強(qiáng)。若 0r1,表明兩個變量之間存在正相關(guān)。 若 r=1 ,則表明變量之間存在著完全正相關(guān)的關(guān)系。若 - 1rRegression-Curve Estimation ,出現(xiàn)圖 22圖 22把 hatarts 選入 Dependents 選項,Independent 選擇 Time,Models 選擇(Linear )線性回歸,(Quadratic )二次曲線回歸,(Cubic )三次曲線回歸,( Exponentia

26、l )指數(shù)回歸,選擇Include constant in equation表示方程式有常數(shù)項, Plotmodels 則表示用圖表示,然后按OK,出現(xiàn)圖 23圖 23線性方程: Y=70.43 0.135X二次曲線方程: Y=64.171 0.415X-0.02X 223三次曲線方程: Y=87.68-1.667X 0.037X( 0X )23/32.指數(shù)曲線方程: Y=68.229xe0.002從 Sig 值判斷,都小于 0.05 ,都接受回歸成立,這樣,只能從 R擬合度和 F 值較大來判斷三次曲線方程的擬合程度比較高。注意,如果方程成立的話, 想要增加預(yù)測, 則可以在 Save 選項中選

27、擇 Predicted Values 一項,如果還想預(yù)測未來的數(shù)值, 則可以在原表上增加若干行 (如 1 行),然后選擇 Predict Cases 下面 Predict through ,在 Year 填入 1976,在 Month 填入 1,這樣就表示預(yù)測值到 1976 年的一月。如圖 24 所示。圖 24注意,在 Independent 選擇 Time 和把 ID 選入結(jié)果一樣,則因為 ID 是以時間為序來排,所以結(jié)果一樣。3時間序列因為 R 的似合度分別為0.05 , 0.064 ,0.199 和 0.039 ,都比較低,方程的效果不太好,如果要預(yù)測數(shù)值還是選擇時間序列比較合適,因為從

28、剛才Sequence的圖也可以觀察到,數(shù)據(jù)是以后的時間來波動的變化關(guān)系。選擇 Analyze-Time Series-Exponential Smoothing,出現(xiàn)圖 2524/32.圖 25把 hstarts選入 Variables選項,并在 Model 選擇 Winters (注意,三種不同的模型的選擇:簡單指數(shù)平滑適用于不包含長期趨勢和季節(jié)成分的數(shù)據(jù); Holt 方法適合于包含長期趨勢但不包含季節(jié)成分的數(shù)據(jù); Winters 方法適合于包含季節(jié)成分(以及長期趨勢)的數(shù)據(jù)。 EXCEL中只有簡單的指數(shù)回歸,與這里的絕不相同,從這里也可以看到專業(yè)分析軟件的優(yōu)勢更具體更仔細(xì)),又按Save

29、鍵,如圖 2625/32.圖 26Predict Case選項中選擇 Predict through,并在 Year 欄填入 1976, month 填入 6,這樣就可以得到 1976 年 1-6 月份的預(yù)測值( 注意,此處與上面的回歸不同,不需要增加 6 個 ID ,不然結(jié)果會顯示有缺失值 )。返回,按 Parameters 鍵,如圖 2726/32.圖 27分別把 Alpha(截距項的平滑系數(shù)), Gamma(趨勢項的平滑系數(shù))和 Delta (季節(jié)指數(shù)的平滑系數(shù)),設(shè)為從 0 到 1 之間以步長 0.05 搜索最優(yōu)的參數(shù)值,其它選項采用默認(rèn)值。返回按 OK,出現(xiàn)結(jié)果如圖 28:圖 28從

30、圖可看到平滑指數(shù)分別是 Alpha 0.75 ,Gamma=0, Delta=0 ,而更重要的是,可以直接得到預(yù)測值,如圖 29:圖 2927/32.除了 Fit 一項的預(yù)測外,可以得到 1976 年 1-6 月的預(yù)測結(jié)果。同時,可以通過 FIT 1 的預(yù)測情況與上面三次曲線回歸方程比較,采用平均絕對誤差、均方根誤差和平均絕對百分誤差的結(jié)果選擇更佳的答案。與 EXCEL表現(xiàn)的比較和補(bǔ)充這一點是針對像我這樣開始只懂得用 EXCEL的人來說。從個人的體會來說, 二種軟件有一定相似,操作都簡便,同時又有一些可以互補(bǔ)的地方。一、圖型的表現(xiàn)力是SPSS的主要優(yōu)點之一應(yīng)該說, EXCEL的圖型表現(xiàn)主要是簡

31、便,對許多的人來說基本夠用,但對于科學(xué)的表現(xiàn), SPSS就更為詳細(xì)和準(zhǔn)確,這一點據(jù)說在所有統(tǒng)計軟件中都突出。因為大多的書里面都談到,這里從略。二、通過 SPSS檢驗方差齊性和數(shù)據(jù)分布假設(shè)檢驗中,采用的t 檢驗和方差檢驗都需要滿足二個要求,即1樣本方差齊性2樣本總體呈正態(tài)分布在 EXCEL中,提供了 F 檢驗來檢驗方差齊性問題。 也就是可以先通過 F 檢驗確定方差齊性與否來選擇下一步用哪個 T 檢驗或方差檢驗分析工具。 但只要數(shù)據(jù)多于二組則無從下手; 通過描述統(tǒng)計大約能從峰度和偏度來了解樣本的分布 (實際工作中,只要分布單峰且近似對稱分布,也可應(yīng)用注 2),但要具體確定樣本的分布也有難度。這二個

32、問題在SPSS就可以解決。A、用 SPSS檢驗方差齊性同樣以 University of Florida graduate salaries.sav 文件作為例子來檢驗性別數(shù)據(jù)是否方差齊性a.選擇 Analyze-Descriptive Statistics-Explore ,再選擇 Dependent List-Graduate ,F(xiàn)actor List-Gender , Display-Both ,如圖 3028/32.圖 30b. 點擊 Plot 按鍵,在對話框里選擇 Boxplots-None ,Spread vs.Level with Levene Test-Untransformed ,在 Descriptive 選擇中取消 Stem-and-leaf 一項,如圖 31圖 31然后,按 OK鍵,結(jié)果如圖 32 顯

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論