spss數(shù)據(jù)正態(tài)分布檢驗(yàn)方法及意義_第1頁
spss數(shù)據(jù)正態(tài)分布檢驗(yàn)方法及意義_第2頁
spss數(shù)據(jù)正態(tài)分布檢驗(yàn)方法及意義_第3頁
spss數(shù)據(jù)正態(tài)分布檢驗(yàn)方法及意義_第4頁
spss數(shù)據(jù)正態(tài)分布檢驗(yàn)方法及意義_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、spss 數(shù)據(jù)正態(tài)分布檢驗(yàn)方法及意義判讀要觀察某一屬性的一組數(shù)據(jù)是否符合正態(tài)分布,可以有兩種方法(目前我知道這兩種,并且這兩種方法只是直觀觀察,不是定量的正態(tài)分布檢驗(yàn)):1:在spss里的基本統(tǒng)計(jì)分析功能里的頻數(shù)統(tǒng)計(jì)功能里有對某個(gè)變量各個(gè)觀測值的頻數(shù)直方圖中可以選擇繪制正態(tài)曲線。具體如下:analyze-descriptive statistics-frequencies,打開頻數(shù)統(tǒng)計(jì)對話框,在statistics里可以選擇獲得各種描述性的統(tǒng)計(jì)量,如:均值、方差、分位數(shù)、峰度、標(biāo)準(zhǔn)差等各種描述性統(tǒng)計(jì)量。在charts里可以選擇顯示的圖形類型,其中histograms選項(xiàng)為柱狀圖也就是我們說的直

2、方圖,同時(shí)可以選擇是否繪制該組數(shù)據(jù)的正態(tài)曲線(with norma curve),這樣我們可以直觀觀察該組數(shù)據(jù)是否大致符合正態(tài)分布。如下圖:從上圖中可以看出,該組數(shù)據(jù)基本符合正態(tài)分布。2:正態(tài)分布的q-q圖:在spss里的基本統(tǒng)計(jì)分析功能里的探索性分析里面可以通過觀察數(shù)據(jù)的q-q圖來判斷數(shù)據(jù)是否服從正態(tài)分布。具體步驟如下:analyze-descriptive statistics-explore打開對話框,選擇plots選項(xiàng),選擇normality plots with tests選項(xiàng),可以繪制該組數(shù)據(jù)的q-q圖。圖的橫坐標(biāo)為改變量的觀測值,縱坐標(biāo)為分位數(shù)。若該組數(shù)據(jù)服從正態(tài)分布,則圖中的點(diǎn)

3、應(yīng)該靠近圖中直線??v坐標(biāo)為分位數(shù),是根據(jù)分布函數(shù)公式f(x)=i/n+1得出的.i為把一組數(shù)從小到大排序后第i個(gè)數(shù)據(jù)的位置,n為樣本容量。若該數(shù)組服從正態(tài)分布則其q-q圖應(yīng)該與理論的q-q圖(也就是圖中的直線)基本符合。對于理論的標(biāo)準(zhǔn)正態(tài)分布,其q-q圖為y=x直線。非標(biāo)準(zhǔn)正態(tài)分布的斜率為樣本標(biāo)準(zhǔn)差,截距為樣本均值。如下圖:如何在spss中進(jìn)行正態(tài)分布檢驗(yàn)1(轉(zhuǎn))(2009-07-22 11:11:57)標(biāo)簽:雜談 一、圖示法1、p-p圖以樣本的累計(jì)頻率作為橫坐標(biāo),以安裝正態(tài)分布計(jì)算的相應(yīng)累計(jì)概率作為縱坐標(biāo),把樣本值表現(xiàn)為直角坐標(biāo)系中的散點(diǎn)。如果資料服從整體分布,則樣本點(diǎn)應(yīng)圍繞第一象限的對角線

4、分布。2、q-q圖以樣本的分位數(shù)作為橫坐標(biāo),以按照正態(tài)分布計(jì)算的相應(yīng)分位點(diǎn)作為縱坐標(biāo),把樣本表現(xiàn)為指教坐標(biāo)系的散點(diǎn)。如果資料服從正態(tài)分布,則樣本點(diǎn)應(yīng)該呈一條圍繞第一象限對角線的直線。以上兩種方法以q-q圖為佳,效率較高。3、直方圖判斷方法:是否以鐘形分布,同時(shí)可以選擇輸出正態(tài)性曲線。4、箱式圖判斷方法:觀測離群值和中位數(shù)。5、莖葉圖類似與直方圖,但實(shí)質(zhì)不同。二、計(jì)算法1、偏度系數(shù)(skewness)和峰度系數(shù)(kurtosis)計(jì)算公式:g1表示偏度,g2表示峰度,通過計(jì)算g1和g2及其標(biāo)準(zhǔn)誤g1及g2然后作u檢驗(yàn)。兩種檢驗(yàn)同時(shí)得出u0.05的結(jié)論時(shí),才可以認(rèn)為該組資料服從正態(tài)分布。由公式可見

5、,部分文獻(xiàn)中所說的“偏度和峰度都接近0可以認(rèn)為近似服從正態(tài)分布”并不嚴(yán)謹(jǐn)。2、非參數(shù)檢驗(yàn)方法非參數(shù)檢驗(yàn)方法包括kolmogorov-smirnov檢驗(yàn)(d檢驗(yàn))和shapiro- wilk (w 檢驗(yàn))。sas中規(guī)定:當(dāng)樣本含量n 2000時(shí),結(jié)果以shapiro wilk(w 檢驗(yàn))為準(zhǔn),當(dāng)樣本含量n 2000 時(shí),結(jié)果以kolmogorov smirnov(d 檢驗(yàn))為準(zhǔn)。spss中則這樣規(guī)定:(1)如果指定的是非整數(shù)權(quán)重,則在加權(quán)樣本大小位于3和50之間時(shí),計(jì)算 shapiro-wilk 統(tǒng)計(jì)量。對于無權(quán)重或整數(shù)權(quán)重,在加權(quán)樣本大小位于3 和 5000 之間時(shí),計(jì)算該統(tǒng)計(jì)量。由此可見,部

6、分spss教材里面關(guān)于“shapiro wilk適用于樣本量3-50之間的數(shù)據(jù)”的說法是在是理解片面,誤人子弟。(2)單樣本 kolmogorov-smirnov 檢驗(yàn)可用于檢驗(yàn)變量(例如income)是否為正態(tài)分布。對于此兩種檢驗(yàn),如果p值大于0.05,表明資料服從正態(tài)分布。三、spss操作示例spss中有很多操作可以進(jìn)行正態(tài)檢驗(yàn),在此只介紹最主要和最全面最方便的操作:1、工具欄-分析描述性統(tǒng)計(jì)探索性2、選擇要分析的變量,選入因變量框內(nèi),然后點(diǎn)選圖表,設(shè)置輸出莖葉圖和直方圖,選擇輸出正態(tài)性檢驗(yàn)圖表,注意顯示(display)要選擇雙項(xiàng)(both)。3、output結(jié)果(1)descripti

7、ves:描述中有峰度系數(shù)和偏度系數(shù),根據(jù)上述判斷標(biāo)準(zhǔn),數(shù)據(jù)不符合正態(tài)分布。sk=0,ku=0時(shí),分布呈正態(tài),sk0時(shí),分布呈正偏態(tài),sk0曲線比較陡峭,kucompare means-independent-samples t test運(yùn)行結(jié)果:經(jīng)方差齊性檢驗(yàn): f= 0.393 p=0.532,即兩方差齊。(因?yàn)閜大于0.05)所以選用 t檢驗(yàn)的第一行方差齊情況下的t檢驗(yàn)的結(jié)果 :就是選用方差假設(shè)奇的結(jié)果所以,t=0.644, p=0.522, 沒有顯著性差異。 (因?yàn)?p 0.05 表示差異有顯著性)。均值相差:113.30159解釋:使用compare means里的independen

8、t smaples t test,檢驗(yàn)結(jié)果里的 levenes test for equality of variances就是對方差齊性的檢驗(yàn),如果p值 大于0.05則認(rèn)為是方差齊,統(tǒng)計(jì)量為f= s12/s2 f(n1-1,n2-1) ,顯著水平一般為0.05,0.01,原假設(shè)h0:方差相等。方差分析(anaylsis of variance, anova)要求各組方差整齊,不過一般認(rèn)為,如果各組人數(shù)相若,就算未能通過方差整齊檢驗(yàn),問題也不大。one-way anova對話方塊中,點(diǎn)擊options(選項(xiàng))按扭,勾homogeneity-of-variance即可。它會產(chǎn)生levene、co

9、chran c、bartlett-box f等檢驗(yàn)值及其顯著性水平p值,若p值compare means-independent-samples t test.再看看結(jié)果中p值的大小是否descriptive statistics-frequencies,把hstarts選入variables,取消在display frequency table前的勾,在chart里面histogram,在statistics選項(xiàng)中如圖1圖1分別選好均數(shù)(mean),中位數(shù)(median),眾數(shù)(mode),總數(shù)(sum),標(biāo)準(zhǔn)差(std. deviation),方差(variance),范圍(range),

10、最小值(minimum),最大值(maximum),偏度系數(shù)(skewness),峰度系數(shù)(kutosis),按continue返回,再按ok,出現(xiàn)結(jié)果如圖2圖2表中,中位數(shù)與平均數(shù)接近,與眾數(shù)相差不大,分布良好。標(biāo)準(zhǔn)差大,即數(shù)據(jù)間的變化差異還還小。峰度和偏度都接近0,則數(shù)據(jù)基本接近于正態(tài)分布。下面圖3的頻率分布圖就更直觀的觀察到這樣的情況圖3二采用各種圖直觀觀察數(shù)據(jù)分布情況,如采用柱型圖觀察歸類的比例等。同樣以自帶文件trends chapter 13.sav為例,我們可以觀察一下各年的數(shù)據(jù)總和的對比:1 選擇graph-bar-simple,在“data in chart are”一項(xiàng)選擇

11、summary of groups of cases,然后按define,出現(xiàn)圖4,圖42 選擇bars represent-other statistic(e.g. mean),把hstarts一項(xiàng)選入variable里面,把year, periodic一項(xiàng)選入category axis項(xiàng)中,并按change statistic鍵,出現(xiàn)圖5:圖53在statistic選項(xiàng)中選sum of values一項(xiàng),按continue返回,按ok即可出現(xiàn)圖6:圖6從圖中可以非常直觀的看出1965年-1975年間,每年的總體數(shù)量對比和各數(shù)值多少。三通過列聯(lián)表來觀察,數(shù)據(jù)的交錯關(guān)系。以軟件自帶的文件uni

12、versity of florida graduate salaries.sav來說明1、選擇tables-basic table,在彈出對話框中,選擇graduate到summaries欄,college到down ,gender到across欄,如圖7圖72、選擇statistics按鍵,選取count和layer%到cell statistics一欄,并按continue鍵,如圖8圖8三、選擇layout按鍵,選擇summary variable labels-in separate labels(匯總的標(biāo)簽,如本例的graduate,放在表外),statistics labels-ac

13、ross top(數(shù)據(jù)的標(biāo)簽橫放在頂部,如本例的count和layer%),并在label groups with value labels only前選擇打勾(表示只需要具體的標(biāo)簽名就可以,不需要匯總名,如本例gender和college),如圖9圖9四、選擇total按鍵,在totals over each group variable一項(xiàng)前選勾,則輸出表會有增加匯總一欄,如圖10圖10提示,需要什么表格形式可以根據(jù)要求來調(diào)整,但對輸出按鍵都需要熟悉,多嘗試幾次就可以看出不同的區(qū)別。圖11為輸出的表格圖11重要提示:如果結(jié)果變成變量的匯總(sum),則先選擇data-weight case

14、s,把graduate的選項(xiàng)先選入weight cases by內(nèi),再選回do not weight cases,按ok即可。對于其他帶有編號的一項(xiàng)都可以這樣做。這一點(diǎn)不知為何,本人屢次試過總需要這樣調(diào)整。參考圖12圖12幾種常用的統(tǒng)計(jì)方法應(yīng)用一般來說,最最常用的統(tǒng)計(jì)分析有假設(shè)檢驗(yàn)和回歸分析,在spss中也有很好的對應(yīng)工具來做這些分析,但對其基本思路和要求都必須了解,這樣才能更靈活的發(fā)揮。下面抄錄excel在市場調(diào)查中的應(yīng)用一書中關(guān)于這方面的內(nèi)容:1假設(shè)檢驗(yàn)?zāi)康模菏怯脕砼袛鄻颖九c樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計(jì)推斷方法?;舅枷耄盒「怕史醋C法思想。即p0.01或p0

15、.05在一次試驗(yàn)中基本不會生發(fā)。反證法思想是先提出假設(shè)(檢驗(yàn)假設(shè)h0),再用適當(dāng)?shù)慕y(tǒng)計(jì)方法確定假設(shè)成立的可能性大小,如果可能性小,則認(rèn)為假設(shè)不成立,否則,還不能認(rèn)為假設(shè)不成立。方法:t檢驗(yàn),u檢驗(yàn),秩和檢驗(yàn),卡方檢驗(yàn)應(yīng)用條件:a、各組資料具有可比性b、具正態(tài)分布c、方差齊性(即先作f檢驗(yàn),如f0.1,具方差齊性)2方差分析目的:又稱為變異系數(shù)分析或f檢驗(yàn)。用于推斷兩組或多組資料的總體平均數(shù)是否相同,檢驗(yàn)兩個(gè)或多個(gè)樣本平均數(shù)的差異是否具有統(tǒng)計(jì)意義(也可認(rèn)為是檢驗(yàn)多個(gè)總體均值是否有顯著性差異注1,這樣可能更簡單一點(diǎn))?;舅枷耄河媒M內(nèi)均方去除組間均方的商,即f值,與1比較,若f值接近1,則說明各驗(yàn)

16、均數(shù)間的差異沒有統(tǒng)計(jì)學(xué)意義,否則表示有統(tǒng)計(jì)學(xué)意義。應(yīng)用條件:a、各組資料具有可比性b、具正態(tài)分布c、方差齊性 (即f檢驗(yàn))提示,在應(yīng)用spss中,只要死死的記住一個(gè)顯著系數(shù)0.05就可以應(yīng)用(如果是雙尾系數(shù)需要除以2),一般的大于0.05接受原假設(shè),小于0.05則拒絕。簡單的說,一般結(jié)果拒絕就是說樣本有差異,樣本相對獨(dú)立,都是表示同一種意思,讀這方面書的時(shí)候,希望不要讓這些名詞混亂了思路。spss的方差檢驗(yàn)中,需要注意下面問題:方差檢驗(yàn)中,post hoc鍵有l(wèi)sd的選項(xiàng):當(dāng)方差分析f檢驗(yàn)否定了原假設(shè),即認(rèn)為至少有兩個(gè)總體的均值存在顯著性差異時(shí),須進(jìn)一步確定是哪兩個(gè)或哪幾個(gè)均值顯著地不同,則需

17、要進(jìn)行多重比較來檢驗(yàn)。lsd即是一種多因變量的三個(gè)或三個(gè)以上水平下均值之間進(jìn)行的兩兩比較檢驗(yàn)。2 independent samples檢驗(yàn)中的mann-whitney u檢驗(yàn)與k independent samples中的kruskal-walllis(克魯斯卡爾瓦里斯)h檢驗(yàn)法思想類似,常用來作為非參數(shù)檢驗(yàn)。2 related samples非參數(shù)檢驗(yàn)中,一般有sign普通符號檢驗(yàn)法和wilcoxon威爾科克森符號秩檢驗(yàn)法。前者用于研究的問題只有兩個(gè)可能的結(jié)果:“是”或“非”,并且二者遵從二項(xiàng)分布;后者是普通符號檢驗(yàn)法的改進(jìn),除了可以檢驗(yàn)是非外,還可以了解差異的大小。k related s

18、amples非參數(shù)檢驗(yàn)中,主要有friedman秩和檢驗(yàn)與cochran q檢驗(yàn)二種選擇,前者是對多個(gè)樣本是否來自同一總體的檢驗(yàn),而后者是用于只分為“成功”和“失敗”兩種結(jié)果的定類尺度測量的數(shù)據(jù)。附錄:spss假設(shè)檢驗(yàn)方法使用對照表圖13其中相關(guān)、配對或有交互作用可以理解為excel的重復(fù),獨(dú)立或無交互作用可以理解為excel中的無重復(fù)。圖13表大部分參考數(shù)據(jù)分析與spss應(yīng)用一書,特別說明3回歸分析目的:研究一個(gè)變量y與其它若干變量x之間的一種數(shù)學(xué)工具。它是一組試驗(yàn)或觀測數(shù)據(jù)的基礎(chǔ)上,尋找被隨機(jī)性掩蓋的變量之間的依存關(guān)系。a直線回歸方程 yc=a bxb回歸關(guān)系的檢驗(yàn):求回歸方程在總體中是否

19、成立,即是否樣本代表的總體也有直線回歸關(guān)系。a. 方差分析:基本思想是將總變異分解為ss回歸和ss乘余,然后利用f檢驗(yàn)來判斷方程是否成立。b. t檢驗(yàn):基本思想是利用樣本回歸系數(shù)b與總體平均數(shù)回歸系數(shù)進(jìn)行比較來判斷回歸方程是否成立。下面摘錄數(shù)據(jù)分析與spss應(yīng)用一書關(guān)于相關(guān)回歸和時(shí)間序列分析一些概念解釋。數(shù)據(jù)變量間主要存在二類關(guān)系:一類是函數(shù)關(guān)系,一類是相關(guān)關(guān)系。前者是變量間有確定關(guān)系,即一個(gè)變量的值能夠在其他變量取值確定的情況下,按某種函數(shù)關(guān)系唯一確定;后者是變量間雖然具有的聯(lián)系,并非確定關(guān)系,如價(jià)格與銷量量,價(jià)格高了,銷售量可能會上去,但無法確定銷售量是多少。通過散點(diǎn)圖來觀察,如果點(diǎn)都集中

20、在一條直線附近,是線性相關(guān),如果在一條曲線附近,則為非線性相關(guān)。如果一個(gè)變量因另一個(gè)變量的增加而增加,減少而減少,則二個(gè)變量間存在正相關(guān)關(guān)系,反之則為負(fù)相關(guān)關(guān)系。極端的相關(guān)是完全相關(guān)和零相關(guān)。如某地區(qū)購買自行車多少與購買大蒜多少無關(guān),是為零相關(guān)。按我的理解,相關(guān)分析就是推斷變量與變量之間關(guān)系的密切程度,回歸就是在相關(guān)的基礎(chǔ)上,找出變量間的擬合模型,從而進(jìn)一步推測出未來的趨勢和變量。而時(shí)間序列則是以時(shí)間的作為觀察的序列,來推斷變量間的關(guān)系的一種模型。以自帶文件trends chapter 13.sav為例,說明一下如何應(yīng)用這三種分析工具。1相關(guān)打開trends chapter 13.sav文件,

21、可以看到,這個(gè)文件的數(shù)據(jù)是以時(shí)間來排序的,在每個(gè)值前增加一行序列號變量,如圖14圖14一個(gè)時(shí)間序列的影響因素有四種變動:a長期趨勢(secular trend),b季節(jié)變動(seasonal variation),c循環(huán)變動(cyclical variation),d不規(guī)則變動(irregular variation)。我們可以觀察一下這些數(shù)據(jù)是否存在某種關(guān)系,打開graphs-sequence,如圖15圖15把hstarts選入variables項(xiàng),把no.選入time axis lables,然后按ok,出現(xiàn)圖16:圖16從圖可以看出,數(shù)據(jù)總是在一個(gè)周期內(nèi)反復(fù)在上下波動,雖然高低的位置不一

22、樣,但這種波動顯然是隨著時(shí)間的不同而變化。因此可以察看,因變量與時(shí)間的關(guān)系如何。選擇data-define dates,出現(xiàn)圖17圖17在year一欄填入1965,month一欄填入1,表示數(shù)據(jù)從1965年1月開始計(jì)算。選擇analyze-correlate-bivariate,出現(xiàn)圖18圖18把hstarts,year和month都選入varibales選項(xiàng),correlation coefficients選擇pearson和spearman(其實(shí)只需要選spearman就可以,這里只是試一下,作為比較)。注:相關(guān)檢驗(yàn)中有pearson(皮爾森)相關(guān)系數(shù)和spearman(斯皮爾曼)等級相關(guān)

23、,前者也稱皮爾森相關(guān)系數(shù),是對兩個(gè)定距變量關(guān)系的刻畫;后者是用來考察兩個(gè)變量中至少有一個(gè)定序變量時(shí)的相關(guān)關(guān)系。zero-order correlations(零階偏聽偏相關(guān)系數(shù))是按pearson簡單相關(guān)系數(shù)公式計(jì)算得到的相關(guān)系數(shù)。在皮爾森系數(shù)r是對兩個(gè)定距變量關(guān)系的刻畫:若-1r1,|r|越大,表明兩個(gè)變量之間的相關(guān)程度越強(qiáng)。若0r1,表明兩個(gè)變量之間存在正相關(guān)。若r=1,則表明變量之間存在著完全正相關(guān)的關(guān)系。若-1rregression-curve estimation,出現(xiàn)圖22圖22把hatarts選入dependents選項(xiàng),independent選擇time,models選擇(li

24、near)線性回歸,(quadratic)二次曲線回歸,(cubic)三次曲線回歸,(exponential)指數(shù)回歸,選擇include constant in equation表示方程式有常數(shù)項(xiàng),plot models則表示用圖表示,然后按ok,出現(xiàn)圖23圖23線性方程:y=70.43 0.135x二次曲線方程:y=64.171 0.415x-0.02x2三次曲線方程:y=87.68-1.667x 0.037x2( 0x3)指數(shù)曲線方程:y=68.229xe0.002從sig值判斷,都小于0.05,都接受回歸成立,這樣,只能從r擬合度和f值較大來判斷三次曲線方程的擬合程度比較高。注意,如果

25、方程成立的話,想要增加預(yù)測,則可以在save選項(xiàng)中選擇predicted values一項(xiàng),如果還想預(yù)測未來的數(shù)值,則可以在原表上增加若干行(如1行),然后選擇predict cases下面predict through,在year填入1976,在month填入1,這樣就表示預(yù)測值到1976年的一月。如圖24所示。圖24注意,在independent選擇time和把id選入結(jié)果一樣,則因?yàn)閕d是以時(shí)間為序來排,所以結(jié)果一樣。3時(shí)間序列因?yàn)閞的似合度分別為0.05,0.064,0.199和0.039,都比較低,方程的效果不太好,如果要預(yù)測數(shù)值還是選擇時(shí)間序列比較合適,因?yàn)閺膭偛舠equence的

26、圖也可以觀察到,數(shù)據(jù)是以后的時(shí)間來波動的變化關(guān)系。選擇analyze-time series-exponential smoothing,出現(xiàn)圖25圖25把hstarts選入variables選項(xiàng),并在model選擇winters(注意,三種不同的模型的選擇:簡單指數(shù)平滑適用于不包含長期趨勢和季節(jié)成分的數(shù)據(jù);holt方法適合于包含長期趨勢但不包含季節(jié)成分的數(shù)據(jù);winters方法適合于包含季節(jié)成分(以及長期趨勢)的數(shù)據(jù)。excel中只有簡單的指數(shù)回歸,與這里的絕不相同,從這里也可以看到專業(yè)分析軟件的優(yōu)勢更具體更仔細(xì)),又按save鍵,如圖26圖26predict case選項(xiàng)中選擇predic

27、t through,并在year欄填入1976,month填入6,這樣就可以得到1976年1-6月份的預(yù)測值(注意,此處與上面的回歸不同,不需要增加6個(gè)id,不然結(jié)果會顯示有缺失值)。返回,按parameters鍵,如圖27圖27分別把a(bǔ)lpha(截距項(xiàng)的平滑系數(shù)),gamma(趨勢項(xiàng)的平滑系數(shù))和delta(季節(jié)指數(shù)的平滑系數(shù)),設(shè)為從0到1之間以步長0.05搜索最優(yōu)的參數(shù)值,其它選項(xiàng)采用默認(rèn)值。返回按ok,出現(xiàn)結(jié)果如圖28:圖28從圖可看到平滑指數(shù)分別是alpha0.75,gamma=0,delta=0,而更重要的是,可以直接得到預(yù)測值,如圖29:圖29除了fit一項(xiàng)的預(yù)測外,可以得到19

28、76年1-6月的預(yù)測結(jié)果。同時(shí),可以通過fit 1的預(yù)測情況與上面三次曲線回歸方程比較,采用平均絕對誤差、均方根誤差和平均絕對百分誤差的結(jié)果選擇更佳的答案。與excel表現(xiàn)的比較和補(bǔ)充這一點(diǎn)是針對像我這樣開始只懂得用excel的人來說。從個(gè)人的體會來說,二種軟件有一定相似,操作都簡便,同時(shí)又有一些可以互補(bǔ)的地方。一、圖型的表現(xiàn)力是spss的主要優(yōu)點(diǎn)之一應(yīng)該說,excel的圖型表現(xiàn)主要是簡便,對許多的人來說基本夠用,但對于科學(xué)的表現(xiàn),spss就更為詳細(xì)和準(zhǔn)確,這一點(diǎn)據(jù)說在所有統(tǒng)計(jì)軟件中都突出。因?yàn)榇蠖嗟臅锩娑颊劦?,這里從略。二、通過spss檢驗(yàn)方差齊性和數(shù)據(jù)分布假設(shè)檢驗(yàn)中,采用的t檢驗(yàn)和方差檢

29、驗(yàn)都需要滿足二個(gè)要求,即1樣本方差齊性2樣本總體呈正態(tài)分布在excel中,提供了f檢驗(yàn)來檢驗(yàn)方差齊性問題。也就是可以先通過f檢驗(yàn)確定方差齊性與否來選擇下一步用哪個(gè)t檢驗(yàn)或方差檢驗(yàn)分析工具。但只要數(shù)據(jù)多于二組則無從下手;通過描述統(tǒng)計(jì)大約能從峰度和偏度來了解樣本的分布(實(shí)際工作中,只要分布單峰且近似對稱分布,也可應(yīng)用注2),但要具體確定樣本的分布也有難度。這二個(gè)問題在spss就可以解決。a、用spss檢驗(yàn)方差齊性同樣以university of florida graduate salaries.sav文件作為例子來檢驗(yàn)性別數(shù)據(jù)是否方差齊性a. 選擇analyze-descriptive statistics-explore,再選擇dependent list-graduate,factor list-gender,display-both,如圖30圖30b. 點(diǎn)擊plot按鍵,在對話框里選擇boxplots-none,spread vs.level with levene test-untransformed,在descriptive選擇中取消stem-and-leaf一項(xiàng),如圖31圖31然后,按ok鍵,結(jié)果如圖32顯示:圖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論