spss數(shù)據(jù)正態(tài)分布檢驗(yàn)方法及意義

上傳人：伐*** IP屬地：寧夏上傳時(shí)間：2021-10-13 格式：DOC 頁數(shù)：32 大?。?017.50KB 積分：15 舉報(bào) 版權(quán)申訴

spss數(shù)據(jù)正態(tài)分布檢驗(yàn)方法及意義_第2頁

spss數(shù)據(jù)正態(tài)分布檢驗(yàn)方法及意義_第3頁

spss數(shù)據(jù)正態(tài)分布檢驗(yàn)方法及意義_第4頁

spss數(shù)據(jù)正態(tài)分布檢驗(yàn)方法及意義_第5頁

已閱讀5頁，還剩27頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、spss 數(shù)據(jù)正態(tài)分布檢驗(yàn)方法及意義判讀要觀察某一屬性的一組數(shù)據(jù)是否符合正態(tài)分布，可以有兩種方法（目前我知道這兩種，并且這兩種方法只是直觀觀察，不是定量的正態(tài)分布檢驗(yàn)）：1：在spss里的基本統(tǒng)計(jì)分析功能里的頻數(shù)統(tǒng)計(jì)功能里有對某個(gè)變量各個(gè)觀測值的頻數(shù)直方圖中可以選擇繪制正態(tài)曲線。具體如下：analyze-descriptive statistics-frequencies，打開頻數(shù)統(tǒng)計(jì)對話框，在statistics里可以選擇獲得各種描述性的統(tǒng)計(jì)量，如：均值、方差、分位數(shù)、峰度、標(biāo)準(zhǔn)差等各種描述性統(tǒng)計(jì)量。在charts里可以選擇顯示的圖形類型，其中histograms選項(xiàng)為柱狀圖也就是我們說的直

2、方圖，同時(shí)可以選擇是否繪制該組數(shù)據(jù)的正態(tài)曲線（with norma curve），這樣我們可以直觀觀察該組數(shù)據(jù)是否大致符合正態(tài)分布。如下圖：從上圖中可以看出，該組數(shù)據(jù)基本符合正態(tài)分布。2：正態(tài)分布的q-q圖：在spss里的基本統(tǒng)計(jì)分析功能里的探索性分析里面可以通過觀察數(shù)據(jù)的q-q圖來判斷數(shù)據(jù)是否服從正態(tài)分布。具體步驟如下：analyze-descriptive statistics-explore打開對話框，選擇plots選項(xiàng)，選擇normality plots with tests選項(xiàng)，可以繪制該組數(shù)據(jù)的q-q圖。圖的橫坐標(biāo)為改變量的觀測值，縱坐標(biāo)為分位數(shù)。若該組數(shù)據(jù)服從正態(tài)分布，則圖中的點(diǎn)

3、應(yīng)該靠近圖中直線?？v坐標(biāo)為分位數(shù)，是根據(jù)分布函數(shù)公式f(x)=i/n+1得出的.i為把一組數(shù)從小到大排序后第i個(gè)數(shù)據(jù)的位置，n為樣本容量。若該數(shù)組服從正態(tài)分布則其q-q圖應(yīng)該與理論的q-q圖（也就是圖中的直線）基本符合。對于理論的標(biāo)準(zhǔn)正態(tài)分布，其q-q圖為y=x直線。非標(biāo)準(zhǔn)正態(tài)分布的斜率為樣本標(biāo)準(zhǔn)差，截距為樣本均值。如下圖：如何在spss中進(jìn)行正態(tài)分布檢驗(yàn)1(轉(zhuǎn))(2009-07-22 11:11:57)標(biāo)簽：雜談一、圖示法1、p-p圖以樣本的累計(jì)頻率作為橫坐標(biāo)，以安裝正態(tài)分布計(jì)算的相應(yīng)累計(jì)概率作為縱坐標(biāo)，把樣本值表現(xiàn)為直角坐標(biāo)系中的散點(diǎn)。如果資料服從整體分布，則樣本點(diǎn)應(yīng)圍繞第一象限的對角線

4、分布。2、q-q圖以樣本的分位數(shù)作為橫坐標(biāo)，以按照正態(tài)分布計(jì)算的相應(yīng)分位點(diǎn)作為縱坐標(biāo)，把樣本表現(xiàn)為指教坐標(biāo)系的散點(diǎn)。如果資料服從正態(tài)分布，則樣本點(diǎn)應(yīng)該呈一條圍繞第一象限對角線的直線。以上兩種方法以q-q圖為佳，效率較高。3、直方圖判斷方法：是否以鐘形分布，同時(shí)可以選擇輸出正態(tài)性曲線。4、箱式圖判斷方法：觀測離群值和中位數(shù)。5、莖葉圖類似與直方圖，但實(shí)質(zhì)不同。二、計(jì)算法1、偏度系數(shù)（skewness）和峰度系數(shù)（kurtosis）計(jì)算公式：g1表示偏度，g2表示峰度，通過計(jì)算g1和g2及其標(biāo)準(zhǔn)誤g1及g2然后作u檢驗(yàn)。兩種檢驗(yàn)同時(shí)得出u0.05的結(jié)論時(shí)，才可以認(rèn)為該組資料服從正態(tài)分布。由公式可見

5、，部分文獻(xiàn)中所說的“偏度和峰度都接近0可以認(rèn)為近似服從正態(tài)分布”并不嚴(yán)謹(jǐn)。2、非參數(shù)檢驗(yàn)方法非參數(shù)檢驗(yàn)方法包括kolmogorov-smirnov檢驗(yàn)（d檢驗(yàn)）和shapiro- wilk （w 檢驗(yàn)）。sas中規(guī)定：當(dāng)樣本含量n 2000時(shí)，結(jié)果以shapiro wilk（w 檢驗(yàn)）為準(zhǔn)，當(dāng)樣本含量n 2000 時(shí)，結(jié)果以kolmogorov smirnov（d 檢驗(yàn)）為準(zhǔn)。spss中則這樣規(guī)定：（1）如果指定的是非整數(shù)權(quán)重，則在加權(quán)樣本大小位于3和50之間時(shí)，計(jì)算 shapiro-wilk 統(tǒng)計(jì)量。對于無權(quán)重或整數(shù)權(quán)重，在加權(quán)樣本大小位于3 和 5000 之間時(shí)，計(jì)算該統(tǒng)計(jì)量。由此可見，部

6、分spss教材里面關(guān)于“shapiro wilk適用于樣本量3-50之間的數(shù)據(jù)”的說法是在是理解片面，誤人子弟。（2）單樣本 kolmogorov-smirnov 檢驗(yàn)可用于檢驗(yàn)變量（例如income）是否為正態(tài)分布。對于此兩種檢驗(yàn)，如果p值大于0.05，表明資料服從正態(tài)分布。三、spss操作示例spss中有很多操作可以進(jìn)行正態(tài)檢驗(yàn)，在此只介紹最主要和最全面最方便的操作：1、工具欄-分析描述性統(tǒng)計(jì)探索性2、選擇要分析的變量，選入因變量框內(nèi)，然后點(diǎn)選圖表，設(shè)置輸出莖葉圖和直方圖，選擇輸出正態(tài)性檢驗(yàn)圖表，注意顯示（display）要選擇雙項(xiàng)（both）。3、output結(jié)果（1）descripti

7、ves：描述中有峰度系數(shù)和偏度系數(shù)，根據(jù)上述判斷標(biāo)準(zhǔn)，數(shù)據(jù)不符合正態(tài)分布。sk=0，ku=0時(shí)，分布呈正態(tài)，sk0時(shí)，分布呈正偏態(tài)，sk0曲線比較陡峭，kucompare means-independent-samples t test運(yùn)行結(jié)果：經(jīng)方差齊性檢驗(yàn)： f= 0.393 p=0.532，即兩方差齊。（因?yàn)閜大于0.05）所以選用 t檢驗(yàn)的第一行方差齊情況下的t檢驗(yàn)的結(jié)果：就是選用方差假設(shè)奇的結(jié)果所以，t=0.644, p=0.522, 沒有顯著性差異。（因?yàn)?p 0.05 表示差異有顯著性）。均值相差：113.30159解釋：使用compare means里的independen

8、t smaples t test,檢驗(yàn)結(jié)果里的 levenes test for equality of variances就是對方差齊性的檢驗(yàn),如果p值大于0.05則認(rèn)為是方差齊,統(tǒng)計(jì)量為f= s12/s2 f(n1-1,n2-1) ,顯著水平一般為0.05,0.01,原假設(shè)h0:方差相等。方差分析(anaylsis of variance, anova)要求各組方差整齊，不過一般認(rèn)為，如果各組人數(shù)相若，就算未能通過方差整齊檢驗(yàn)，問題也不大。one-way anova對話方塊中，點(diǎn)擊options(選項(xiàng))按扭，勾homogeneity-of-variance即可。它會產(chǎn)生levene、co

9、chran c、bartlett-box f等檢驗(yàn)值及其顯著性水平p值，若p值compare means-independent-samples t test.再看看結(jié)果中p值的大小是否descriptive statistics-frequencies，把hstarts選入variables，取消在display frequency table前的勾，在chart里面histogram，在statistics選項(xiàng)中如圖1圖1分別選好均數(shù)(mean)，中位數(shù)(median)，眾數(shù)(mode)，總數(shù)(sum)，標(biāo)準(zhǔn)差(std. deviation)，方差(variance)，范圍(range)，

10、最小值(minimum)，最大值(maximum)，偏度系數(shù)(skewness)，峰度系數(shù)(kutosis)，按continue返回，再按ok，出現(xiàn)結(jié)果如圖2圖2表中，中位數(shù)與平均數(shù)接近，與眾數(shù)相差不大，分布良好。標(biāo)準(zhǔn)差大，即數(shù)據(jù)間的變化差異還還小。峰度和偏度都接近0，則數(shù)據(jù)基本接近于正態(tài)分布。下面圖3的頻率分布圖就更直觀的觀察到這樣的情況圖3二采用各種圖直觀觀察數(shù)據(jù)分布情況，如采用柱型圖觀察歸類的比例等。同樣以自帶文件trends chapter 13.sav為例，我們可以觀察一下各年的數(shù)據(jù)總和的對比：1 選擇graph-bar-simple，在“data in chart are”一項(xiàng)選擇

11、summary of groups of cases，然后按define，出現(xiàn)圖4，圖42 選擇bars represent-other statistic(e.g. mean)，把hstarts一項(xiàng)選入variable里面，把year, periodic一項(xiàng)選入category axis項(xiàng)中，并按change statistic鍵，出現(xiàn)圖5：圖53在statistic選項(xiàng)中選sum of values一項(xiàng)，按continue返回，按ok即可出現(xiàn)圖6：圖6從圖中可以非常直觀的看出1965年-1975年間，每年的總體數(shù)量對比和各數(shù)值多少。三通過列聯(lián)表來觀察，數(shù)據(jù)的交錯關(guān)系。以軟件自帶的文件uni

12、versity of florida graduate salaries.sav來說明1、選擇tables-basic table，在彈出對話框中，選擇graduate到summaries欄，college到down ，gender到across欄，如圖7圖72、選擇statistics按鍵，選取count和layer%到cell statistics一欄，并按continue鍵，如圖8圖8三、選擇layout按鍵，選擇summary variable labels-in separate labels（匯總的標(biāo)簽，如本例的graduate，放在表外），statistics labels-ac

13、ross top（數(shù)據(jù)的標(biāo)簽橫放在頂部，如本例的count和layer%），并在label groups with value labels only前選擇打勾(表示只需要具體的標(biāo)簽名就可以，不需要匯總名，如本例gender和college)，如圖9圖9四、選擇total按鍵，在totals over each group variable一項(xiàng)前選勾，則輸出表會有增加匯總一欄，如圖10圖10提示，需要什么表格形式可以根據(jù)要求來調(diào)整，但對輸出按鍵都需要熟悉，多嘗試幾次就可以看出不同的區(qū)別。圖11為輸出的表格圖11重要提示：如果結(jié)果變成變量的匯總（sum），則先選擇data-weight case

14、s，把graduate的選項(xiàng)先選入weight cases by內(nèi)，再選回do not weight cases，按ok即可。對于其他帶有編號的一項(xiàng)都可以這樣做。這一點(diǎn)不知為何，本人屢次試過總需要這樣調(diào)整。參考圖12圖12幾種常用的統(tǒng)計(jì)方法應(yīng)用一般來說，最最常用的統(tǒng)計(jì)分析有假設(shè)檢驗(yàn)和回歸分析，在spss中也有很好的對應(yīng)工具來做這些分析，但對其基本思路和要求都必須了解，這樣才能更靈活的發(fā)揮。下面抄錄excel在市場調(diào)查中的應(yīng)用一書中關(guān)于這方面的內(nèi)容：1假設(shè)檢驗(yàn)?zāi)康模菏怯脕砼袛鄻颖九c樣本，樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計(jì)推斷方法?；舅枷耄盒「怕史醋C法思想。即p0.01或p0

15、.05在一次試驗(yàn)中基本不會生發(fā)。反證法思想是先提出假設(shè)（檢驗(yàn)假設(shè)h0），再用適當(dāng)?shù)慕y(tǒng)計(jì)方法確定假設(shè)成立的可能性大小，如果可能性小，則認(rèn)為假設(shè)不成立，否則，還不能認(rèn)為假設(shè)不成立。方法：t檢驗(yàn)，u檢驗(yàn)，秩和檢驗(yàn)，卡方檢驗(yàn)應(yīng)用條件：a、各組資料具有可比性b、具正態(tài)分布c、方差齊性（即先作f檢驗(yàn)，如f0.1，具方差齊性）2方差分析目的：又稱為變異系數(shù)分析或f檢驗(yàn)。用于推斷兩組或多組資料的總體平均數(shù)是否相同，檢驗(yàn)兩個(gè)或多個(gè)樣本平均數(shù)的差異是否具有統(tǒng)計(jì)意義(也可認(rèn)為是檢驗(yàn)多個(gè)總體均值是否有顯著性差異注1，這樣可能更簡單一點(diǎn))?；舅枷耄河媒M內(nèi)均方去除組間均方的商，即f值，與1比較，若f值接近1，則說明各驗(yàn)

16、均數(shù)間的差異沒有統(tǒng)計(jì)學(xué)意義，否則表示有統(tǒng)計(jì)學(xué)意義。應(yīng)用條件：a、各組資料具有可比性b、具正態(tài)分布c、方差齊性（即f檢驗(yàn)）提示，在應(yīng)用spss中，只要死死的記住一個(gè)顯著系數(shù)0.05就可以應(yīng)用（如果是雙尾系數(shù)需要除以2），一般的大于0.05接受原假設(shè)，小于0.05則拒絕。簡單的說，一般結(jié)果拒絕就是說樣本有差異，樣本相對獨(dú)立，都是表示同一種意思，讀這方面書的時(shí)候，希望不要讓這些名詞混亂了思路。spss的方差檢驗(yàn)中，需要注意下面問題：方差檢驗(yàn)中，post hoc鍵有l(wèi)sd的選項(xiàng)：當(dāng)方差分析f檢驗(yàn)否定了原假設(shè)，即認(rèn)為至少有兩個(gè)總體的均值存在顯著性差異時(shí)，須進(jìn)一步確定是哪兩個(gè)或哪幾個(gè)均值顯著地不同，則需

17、要進(jìn)行多重比較來檢驗(yàn)。lsd即是一種多因變量的三個(gè)或三個(gè)以上水平下均值之間進(jìn)行的兩兩比較檢驗(yàn)。2 independent samples檢驗(yàn)中的mann-whitney u檢驗(yàn)與k independent samples中的kruskal-walllis（克魯斯卡爾瓦里斯）h檢驗(yàn)法思想類似，常用來作為非參數(shù)檢驗(yàn)。2 related samples非參數(shù)檢驗(yàn)中，一般有sign普通符號檢驗(yàn)法和wilcoxon威爾科克森符號秩檢驗(yàn)法。前者用于研究的問題只有兩個(gè)可能的結(jié)果：“是”或“非”，并且二者遵從二項(xiàng)分布；后者是普通符號檢驗(yàn)法的改進(jìn)，除了可以檢驗(yàn)是非外，還可以了解差異的大小。k related s

18、amples非參數(shù)檢驗(yàn)中，主要有friedman秩和檢驗(yàn)與cochran q檢驗(yàn)二種選擇，前者是對多個(gè)樣本是否來自同一總體的檢驗(yàn)，而后者是用于只分為“成功”和“失敗”兩種結(jié)果的定類尺度測量的數(shù)據(jù)。附錄：spss假設(shè)檢驗(yàn)方法使用對照表圖13其中相關(guān)、配對或有交互作用可以理解為excel的重復(fù)，獨(dú)立或無交互作用可以理解為excel中的無重復(fù)。圖13表大部分參考數(shù)據(jù)分析與spss應(yīng)用一書，特別說明3回歸分析目的：研究一個(gè)變量y與其它若干變量x之間的一種數(shù)學(xué)工具。它是一組試驗(yàn)或觀測數(shù)據(jù)的基礎(chǔ)上，尋找被隨機(jī)性掩蓋的變量之間的依存關(guān)系。a直線回歸方程 yc=a bxb回歸關(guān)系的檢驗(yàn)：求回歸方程在總體中是否

19、成立，即是否樣本代表的總體也有直線回歸關(guān)系。a. 方差分析：基本思想是將總變異分解為ss回歸和ss乘余，然后利用f檢驗(yàn)來判斷方程是否成立。b. t檢驗(yàn)：基本思想是利用樣本回歸系數(shù)b與總體平均數(shù)回歸系數(shù)進(jìn)行比較來判斷回歸方程是否成立。下面摘錄數(shù)據(jù)分析與spss應(yīng)用一書關(guān)于相關(guān)回歸和時(shí)間序列分析一些概念解釋。數(shù)據(jù)變量間主要存在二類關(guān)系：一類是函數(shù)關(guān)系，一類是相關(guān)關(guān)系。前者是變量間有確定關(guān)系，即一個(gè)變量的值能夠在其他變量取值確定的情況下，按某種函數(shù)關(guān)系唯一確定；后者是變量間雖然具有的聯(lián)系，并非確定關(guān)系，如價(jià)格與銷量量，價(jià)格高了，銷售量可能會上去，但無法確定銷售量是多少。通過散點(diǎn)圖來觀察，如果點(diǎn)都集中

20、在一條直線附近，是線性相關(guān)，如果在一條曲線附近，則為非線性相關(guān)。如果一個(gè)變量因另一個(gè)變量的增加而增加，減少而減少，則二個(gè)變量間存在正相關(guān)關(guān)系，反之則為負(fù)相關(guān)關(guān)系。極端的相關(guān)是完全相關(guān)和零相關(guān)。如某地區(qū)購買自行車多少與購買大蒜多少無關(guān)，是為零相關(guān)。按我的理解，相關(guān)分析就是推斷變量與變量之間關(guān)系的密切程度，回歸就是在相關(guān)的基礎(chǔ)上，找出變量間的擬合模型，從而進(jìn)一步推測出未來的趨勢和變量。而時(shí)間序列則是以時(shí)間的作為觀察的序列，來推斷變量間的關(guān)系的一種模型。以自帶文件trends chapter 13.sav為例，說明一下如何應(yīng)用這三種分析工具。1相關(guān)打開trends chapter 13.sav文件，

21、可以看到，這個(gè)文件的數(shù)據(jù)是以時(shí)間來排序的，在每個(gè)值前增加一行序列號變量，如圖14圖14一個(gè)時(shí)間序列的影響因素有四種變動：a長期趨勢（secular trend），b季節(jié)變動（seasonal variation），c循環(huán)變動（cyclical variation），d不規(guī)則變動（irregular variation）。我們可以觀察一下這些數(shù)據(jù)是否存在某種關(guān)系，打開graphs-sequence，如圖15圖15把hstarts選入variables項(xiàng)，把no.選入time axis lables，然后按ok，出現(xiàn)圖16：圖16從圖可以看出，數(shù)據(jù)總是在一個(gè)周期內(nèi)反復(fù)在上下波動，雖然高低的位置不一

22、樣，但這種波動顯然是隨著時(shí)間的不同而變化。因此可以察看，因變量與時(shí)間的關(guān)系如何。選擇data-define dates，出現(xiàn)圖17圖17在year一欄填入1965，month一欄填入1，表示數(shù)據(jù)從1965年1月開始計(jì)算。選擇analyze-correlate-bivariate，出現(xiàn)圖18圖18把hstarts，year和month都選入varibales選項(xiàng)，correlation coefficients選擇pearson和spearman（其實(shí)只需要選spearman就可以，這里只是試一下，作為比較）。注：相關(guān)檢驗(yàn)中有pearson（皮爾森）相關(guān)系數(shù)和spearman（斯皮爾曼）等級相關(guān)

23、，前者也稱皮爾森相關(guān)系數(shù)，是對兩個(gè)定距變量關(guān)系的刻畫；后者是用來考察兩個(gè)變量中至少有一個(gè)定序變量時(shí)的相關(guān)關(guān)系。zero-order correlations（零階偏聽偏相關(guān)系數(shù)）是按pearson簡單相關(guān)系數(shù)公式計(jì)算得到的相關(guān)系數(shù)。在皮爾森系數(shù)r是對兩個(gè)定距變量關(guān)系的刻畫:若-1r1，|r|越大，表明兩個(gè)變量之間的相關(guān)程度越強(qiáng)。若0r1，表明兩個(gè)變量之間存在正相關(guān)。若r=1，則表明變量之間存在著完全正相關(guān)的關(guān)系。若-1rregression-curve estimation，出現(xiàn)圖22圖22把hatarts選入dependents選項(xiàng)，independent選擇time，models選擇（li

24、near）線性回歸，（quadratic）二次曲線回歸，（cubic）三次曲線回歸，（exponential）指數(shù)回歸，選擇include constant in equation表示方程式有常數(shù)項(xiàng)，plot models則表示用圖表示，然后按ok，出現(xiàn)圖23圖23線性方程：y=70.43 0.135x二次曲線方程：y=64.171 0.415x-0.02x2三次曲線方程：y=87.68-1.667x 0.037x2( 0x3)指數(shù)曲線方程：y=68.229xe0.002從sig值判斷，都小于0.05，都接受回歸成立，這樣，只能從r擬合度和f值較大來判斷三次曲線方程的擬合程度比較高。注意，如果

25、方程成立的話，想要增加預(yù)測，則可以在save選項(xiàng)中選擇predicted values一項(xiàng)，如果還想預(yù)測未來的數(shù)值，則可以在原表上增加若干行（如1行），然后選擇predict cases下面predict through，在year填入1976，在month填入1，這樣就表示預(yù)測值到1976年的一月。如圖24所示。圖24注意，在independent選擇time和把id選入結(jié)果一樣，則因?yàn)閕d是以時(shí)間為序來排，所以結(jié)果一樣。3時(shí)間序列因?yàn)閞的似合度分別為0.05，0.064，0.199和0.039，都比較低，方程的效果不太好，如果要預(yù)測數(shù)值還是選擇時(shí)間序列比較合適，因?yàn)閺膭偛舠equence的

26、圖也可以觀察到，數(shù)據(jù)是以后的時(shí)間來波動的變化關(guān)系。選擇analyze-time series-exponential smoothing，出現(xiàn)圖25圖25把hstarts選入variables選項(xiàng)，并在model選擇winters（注意，三種不同的模型的選擇：簡單指數(shù)平滑適用于不包含長期趨勢和季節(jié)成分的數(shù)據(jù)；holt方法適合于包含長期趨勢但不包含季節(jié)成分的數(shù)據(jù)；winters方法適合于包含季節(jié)成分（以及長期趨勢）的數(shù)據(jù)。excel中只有簡單的指數(shù)回歸，與這里的絕不相同，從這里也可以看到專業(yè)分析軟件的優(yōu)勢更具體更仔細(xì)），又按save鍵，如圖26圖26predict case選項(xiàng)中選擇predic

27、t through，并在year欄填入1976，month填入6，這樣就可以得到1976年1-6月份的預(yù)測值（注意，此處與上面的回歸不同，不需要增加6個(gè)id，不然結(jié)果會顯示有缺失值）。返回，按parameters鍵，如圖27圖27分別把a(bǔ)lpha（截距項(xiàng)的平滑系數(shù)），gamma（趨勢項(xiàng)的平滑系數(shù)）和delta（季節(jié)指數(shù)的平滑系數(shù)），設(shè)為從0到1之間以步長0.05搜索最優(yōu)的參數(shù)值，其它選項(xiàng)采用默認(rèn)值。返回按ok，出現(xiàn)結(jié)果如圖28：圖28從圖可看到平滑指數(shù)分別是alpha0.75，gamma=0，delta=0，而更重要的是，可以直接得到預(yù)測值，如圖29：圖29除了fit一項(xiàng)的預(yù)測外，可以得到19

28、76年1-6月的預(yù)測結(jié)果。同時(shí)，可以通過fit 1的預(yù)測情況與上面三次曲線回歸方程比較，采用平均絕對誤差、均方根誤差和平均絕對百分誤差的結(jié)果選擇更佳的答案。與excel表現(xiàn)的比較和補(bǔ)充這一點(diǎn)是針對像我這樣開始只懂得用excel的人來說。從個(gè)人的體會來說，二種軟件有一定相似，操作都簡便，同時(shí)又有一些可以互補(bǔ)的地方。一、圖型的表現(xiàn)力是spss的主要優(yōu)點(diǎn)之一應(yīng)該說，excel的圖型表現(xiàn)主要是簡便，對許多的人來說基本夠用，但對于科學(xué)的表現(xiàn)，spss就更為詳細(xì)和準(zhǔn)確，這一點(diǎn)據(jù)說在所有統(tǒng)計(jì)軟件中都突出。因?yàn)榇蠖嗟臅锩娑颊劦?，這里從略。二、通過spss檢驗(yàn)方差齊性和數(shù)據(jù)分布假設(shè)檢驗(yàn)中，采用的t檢驗(yàn)和方差檢

29、驗(yàn)都需要滿足二個(gè)要求，即1樣本方差齊性2樣本總體呈正態(tài)分布在excel中，提供了f檢驗(yàn)來檢驗(yàn)方差齊性問題。也就是可以先通過f檢驗(yàn)確定方差齊性與否來選擇下一步用哪個(gè)t檢驗(yàn)或方差檢驗(yàn)分析工具。但只要數(shù)據(jù)多于二組則無從下手；通過描述統(tǒng)計(jì)大約能從峰度和偏度來了解樣本的分布（實(shí)際工作中，只要分布單峰且近似對稱分布，也可應(yīng)用注2），但要具體確定樣本的分布也有難度。這二個(gè)問題在spss就可以解決。a、用spss檢驗(yàn)方差齊性同樣以university of florida graduate salaries.sav文件作為例子來檢驗(yàn)性別數(shù)據(jù)是否方差齊性a. 選擇analyze-descriptive statistics-explore，再選擇dependent list-graduate，factor list-gender，display-both，如圖30圖30b. 點(diǎn)擊plot按鍵，在對話框里選擇boxplots-none，spread vs.level with levene test-untransformed，在descriptive選擇中取消stem-and-leaf一項(xiàng)，如圖31圖31然后，按ok鍵，結(jié)果如圖32顯示：圖

人人文庫> 全部分類> 應(yīng)用文書 > 年終總結(jié)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

spss數(shù)據(jù)正態(tài)分布檢驗(yàn)方法及意義

文檔簡介

溫馨提示

最新文檔

評論

spss數(shù)據(jù)正態(tài)分布檢驗(yàn)方法及意義

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔