




已閱讀5頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
SPSS期末考試復(fù)習(xí)筆記【整本書(附有菜單分析、SPSS操作步驟和圖解以及期末考試押題)】描述樣本數(shù)據(jù) 一般的,一組數(shù)據(jù)拿出來,需要先有一個(gè)整體認(rèn)識(shí)。除了我們平時(shí)最常用的集中趨勢(shì)外,還需要一些離散趨勢(shì)的數(shù)據(jù)。這方面EXCEL就能一次性的給全了數(shù)據(jù),但對(duì)于SPSS,就需要用多個(gè)工具了,感覺上表格方面不如EXCEL好用。個(gè)人感覺,通過描述需要了解整體數(shù)據(jù)的集中趨勢(shì)和離散趨勢(shì),再借用各種圖觀察數(shù)據(jù)的分布形態(tài)。對(duì)于SPSS提供的OLAP cubes(在線分析處理表),Case Summary(觀察值摘要分析表),Descriptives (描述統(tǒng)計(jì))不太常用,反喜歡用Frequencies(頻率分析),Basic Table(基本報(bào)表),Crosstabs(列聯(lián)表)這三個(gè),另外再配合其它圖來觀察。這個(gè)可以根據(jù)個(gè)人喜好來選擇。一使用頻率分析(Frequencies)觀察數(shù)值的分布。頻率分布圖與分析數(shù)據(jù)結(jié)合起來,可以更清楚的看到數(shù)據(jù)分布的整體情況。以自帶文件Trends chapter 13.sav為例,選擇Analyze-Descriptive Statistics-Frequencies,把hstarts選入Variables,取消在Display Frequency table前的勾,在Chart里面histogram,在Statistics選項(xiàng)中如圖1圖1 分別選好均數(shù)(Mean),中位數(shù)(Median),眾數(shù)(Mode),總數(shù)(Sum),標(biāo)準(zhǔn)差(Std. deviation),方差(Variance),范圍(range),最小值(Minimum),最大值(Maximum),偏度系數(shù)(Skewness),峰度系數(shù)(Kutosis),按Continue返回,再按OK,出現(xiàn)結(jié)果如圖2圖2 表中,中位數(shù)與平均數(shù)接近,與眾數(shù)相差不大,分布良好。標(biāo)準(zhǔn)差大,即數(shù)據(jù)間的變化差異還還小。峰度和偏度都接近0,則數(shù)據(jù)基本接近于正態(tài)分布。下面圖3的頻率分布圖就更直觀的觀察到這樣的情況圖3 二采用各種圖直觀觀察數(shù)據(jù)分布情況,如采用柱型圖觀察歸類的比例等。 同樣以自帶文件Trends chapter 13.sav為例,我們可以觀察一下各年的數(shù)據(jù)總和的對(duì)比:1選擇Graph-Bar-Simple,在“Data in chart are”一項(xiàng)選擇Summary of groups of cases,然后按Define,出現(xiàn)圖4,圖4 2選擇Bars Represent-Other statistic(e.g. mean),把hstarts一項(xiàng)選入Variable里面,把YEAR, Periodic一項(xiàng)選入Category Axis項(xiàng)中,并按Change Statistic鍵,出現(xiàn)圖5:圖5 3在Statistic選項(xiàng)中選Sum of values一項(xiàng),按Continue返回,按OK即可出現(xiàn)圖6:圖6 從圖中可以非常直觀的看出1965年-1975年間,每年的總體數(shù)量對(duì)比和各數(shù)值多少。三通過列聯(lián)表來觀察,數(shù)據(jù)的交錯(cuò)關(guān)系。 以軟件自帶的文件University of Florida graduate salaries.sav來說明1、選擇Tables-Basic Table,在彈出對(duì)話框中,選擇Graduate到Summaries欄,College到Down ,Gender到Across欄,如圖7圖7 2、選擇Statistics按鍵,選取Count和layer%到Cell Statistics一欄,并按Continue鍵,如圖8圖8 三、選擇Layout按鍵,選擇Summary Variable Labels-In separate labels(匯總的標(biāo)簽,如本例的Graduate,放在表外),Statistics Labels-Across top(數(shù)據(jù)的標(biāo)簽橫放在頂部,如本例的Count和Layer%),并在Label groups with value labels only前選擇打勾(表示只需要具體的標(biāo)簽名就可以,不需要匯總名,如本例Gender和College),如圖9圖9 四、選擇Total按鍵,在Totals over each group variable一項(xiàng)前選勾,則輸出表會(huì)有增加匯總一欄,如圖10圖10 提示,需要什么表格形式可以根據(jù)要求來調(diào)整,但對(duì)輸出按鍵都需要熟悉,多嘗試幾次就可以看出不同的區(qū)別。圖11為輸出的表格圖11 重要提示:如果結(jié)果變成變量的匯總(SUM),則先選擇Data-Weight Cases,把Graduate的選項(xiàng)先選入Weight Cases by內(nèi),再選回Do not weight Cases,按OK即可。對(duì)于其他帶有編號(hào)的一項(xiàng)都可以這樣做。這一點(diǎn)不知為何,本人屢次試過總需要這樣調(diào)整。參考圖12圖12 幾種常用的統(tǒng)計(jì)方法應(yīng)用 一般來說,最最常用的統(tǒng)計(jì)分析有假設(shè)檢驗(yàn)和回歸分析,在SPSS中也有很好的對(duì)應(yīng)工具來做這些分析,但對(duì)其基本思路和要求都必須了解,這樣才能更靈活的發(fā)揮。下面抄錄EXCEL在市場(chǎng)調(diào)查中的應(yīng)用一書中關(guān)于這方面的內(nèi)容:1假設(shè)檢驗(yàn) 目的:是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計(jì)推斷方法?;舅枷耄盒「怕史醋C法思想。即P0.01或PSequence,如圖15圖15 把hstarts選入Variables項(xiàng),把No.選入Time Axis Lables,然后按OK,出現(xiàn)圖16:圖16 從圖可以看出,數(shù)據(jù)總是在一個(gè)周期內(nèi)反復(fù)在上下波動(dòng),雖然高低的位置不一樣,但這種波動(dòng)顯然是隨著時(shí)間的不同而變化。因此可以察看,因變量與時(shí)間的關(guān)系如何。選擇Data-Define Dates,出現(xiàn)圖17圖17 在Year一欄填入1965,Month一欄填入1,表示數(shù)據(jù)從1965年1月開始計(jì)算。選擇Analyze-Correlate-Bivariate,出現(xiàn)圖18圖18 把hstarts,Year和Month都選入Varibales選項(xiàng),Correlation Coefficients選擇Pearson和Spearman(其實(shí)只需要選Spearman就可以,這里只是試一下,作為比較)。注:相關(guān)檢驗(yàn)中有Pearson(皮爾森)相關(guān)系數(shù)和Spearman(斯皮爾曼)等級(jí)相關(guān),前者也稱皮爾森相關(guān)系數(shù),是對(duì)兩個(gè)定距變量關(guān)系的刻畫;后者是用來考察兩個(gè)變量中至少有一個(gè)定序變量時(shí)的相關(guān)關(guān)系。Zero-order Correlations(零階偏聽偏相關(guān)系數(shù))是按Pearson簡(jiǎn)單相關(guān)系數(shù)公式計(jì)算得到的相關(guān)系數(shù)。在皮爾森系數(shù)r是對(duì)兩個(gè)定距變量關(guān)系的刻畫:若-1r1,|r|越大,表明兩個(gè)變量之間的相關(guān)程度越強(qiáng)。若0若-1rRegression-Curve Estimation,出現(xiàn)圖22圖22 把hatarts選入Dependents選項(xiàng),Independent選擇Time,Models選擇(Linear)線性回歸,(Quadratic)二次曲線回歸,(Cubic)三次曲線回歸,(Exponential)指數(shù)回歸,選擇Include constant in equation表示方程式有常數(shù)項(xiàng),Plot models則表示用圖表示,然后按OK,出現(xiàn)圖23圖23 線性方程:Y=70.43 0.135X二次曲線方程:Y=64.171 0.415X-0.02X2 三次曲線方程:Y=87.68-1.667X 0.037X2( 0X3)指數(shù)曲線方程:Y=68.229xe0.002 從Sig值判斷,都小于0.05,都接受回歸成立,這樣,只能從R擬合度和F值較大來判斷三次曲線方程的擬合程度比較高。注意,如果方程成立的話,想要增加預(yù)測(cè),則可以在Save選項(xiàng)中選擇Predicted Values一項(xiàng),如果還想預(yù)測(cè)未來的數(shù)值,則可以在原表上增加若干行(如1行),然后選擇Predict Cases下面Predict through,在Year填入1976,在Month填入1,這樣就表示預(yù)測(cè)值到1976年的一月。如圖24所示。圖24 注意,在Independent選擇Time和把ID選入結(jié)果一樣,則因?yàn)镮D是以時(shí)間為序來排,所以結(jié)果一樣。3時(shí)間序列 因?yàn)镽的似合度分別為0.05,0.064,0.199和0.039,都比較低,方程的效果不太好,如果要預(yù)測(cè)數(shù)值還是選擇時(shí)間序列比較合適,因?yàn)閺膭偛臩equence的圖也可以觀察到,數(shù)據(jù)是以后的時(shí)間來波動(dòng)的變化關(guān)系。選擇Analyze-Time Series-Exponential Smoothing,出現(xiàn)圖25圖25 把hstarts選入Variables選項(xiàng),并在Model選擇Winters(注意,三種不同的模型的選擇:簡(jiǎn)單指數(shù)平滑適用于不包含長(zhǎng)期趨勢(shì)和季節(jié)成分的數(shù)據(jù);Holt方法適合于包含長(zhǎng)期趨勢(shì)但不包含季節(jié)成分的數(shù)據(jù);Winters方法適合于包含季節(jié)成分(以及長(zhǎng)期趨勢(shì))的數(shù)據(jù)。EXCEL中只有簡(jiǎn)單的指數(shù)回歸,與這里的絕不相同,從這里也可以看到專業(yè)分析軟件的優(yōu)勢(shì)更具體更仔細(xì)),又按Save鍵,如圖26圖26 Predict Case選項(xiàng)中選擇Predict through,并在Year欄填入1976,month填入6,這樣就可以得到1976年1-6月份的預(yù)測(cè)值(注意,此處與上面的回歸不同,不需要增加6個(gè)ID,不然結(jié)果會(huì)顯示有缺失值)。返回,按Parameters鍵,如圖27圖27 分別把Alpha(截距項(xiàng)的平滑系數(shù)),Gamma(趨勢(shì)項(xiàng)的平滑系數(shù))和Delta(季節(jié)指數(shù)的平滑系數(shù)),設(shè)為從0到1之間以步長(zhǎng)0.05搜索最優(yōu)的參數(shù)值,其它選項(xiàng)采用默認(rèn)值。返回按OK,出現(xiàn)結(jié)果如圖28: 圖28 從圖可看到平滑指數(shù)分別是Alpha0.75,Gamma=0,Delta=0,而更重要的是,可以直接得到預(yù)測(cè)值,如圖29: 圖29 除了Fit一項(xiàng)的預(yù)測(cè)外,可以得到1976年1-6月的預(yù)測(cè)結(jié)果。同時(shí),可以通過FIT 1的預(yù)測(cè)情況與上面三次曲線回歸方程比較,采用平均絕對(duì)誤差、均方根誤差和平均絕對(duì)百分誤差的結(jié)果選擇更佳的答案。 與EXCEL表現(xiàn)的比較和補(bǔ)充 這一點(diǎn)是針對(duì)像我這樣開始只懂得用EXCEL的人來說。從個(gè)人的體會(huì)來說,二種軟件有一定相似,操作都簡(jiǎn)便,同時(shí)又有一些可以互補(bǔ)的地方。一、圖型的表現(xiàn)力是SPSS的主要優(yōu)點(diǎn)之一應(yīng)該說,EXCEL的圖型表現(xiàn)主要是簡(jiǎn)便,對(duì)許多的人來說基本夠用,但對(duì)于科學(xué)的表現(xiàn),SPSS就更為詳細(xì)和準(zhǔn)確,這一點(diǎn)據(jù)說在所有統(tǒng)計(jì)軟件中都突出。因?yàn)榇蠖嗟臅锩娑颊劦剑@里從略。二、通過SPSS檢驗(yàn)方差齊性和數(shù)據(jù)分布假設(shè)檢驗(yàn)中,采用的t檢驗(yàn)和方差檢驗(yàn)都需要滿足二個(gè)要求,即1樣本方差齊性2樣本總體呈正態(tài)分布在EXCEL中,提供了F檢驗(yàn)來檢驗(yàn)方差齊性問題。也就是可以先通過F檢驗(yàn)確定方差齊性與否來選擇下一步用哪個(gè)T檢驗(yàn)或方差檢驗(yàn)分析工具。但只要數(shù)據(jù)多于二組則無從下手;通過描述統(tǒng)計(jì)大約能從峰度和偏度來了解樣本的分布(實(shí)際工作中,只要分布單峰且近似對(duì)稱分布,也可應(yīng)用注2),但要具體確定樣本的分布也有難度。這二個(gè)問題在SPSS就可以解決。A、用SPSS檢驗(yàn)方差齊性同樣以University of Florida graduate salaries.sav文件作為例子來檢驗(yàn)性別數(shù)據(jù)是否方差齊性a.選擇Analyze-Descriptive Statistics-Explore,再選擇Dependent List-Graduate,F(xiàn)actor List-Gender,Display-Both,如圖30圖30 b.點(diǎn)擊Plot按鍵,在對(duì)話框里選擇Boxplots-None,Spread vs.Level with Levene Test-Untransformed,在Descriptive選擇中取消Stem-and-leaf一項(xiàng),如圖31圖31 然后,按OK鍵,結(jié)果如圖32顯示:圖32 圖32中可以看出,顯著值sig都大于0.05,因此不能拒絕H0方差齊性的假設(shè),即數(shù)據(jù)的方差齊性。提示,在SPSS中,應(yīng)用t檢驗(yàn)是不需要單獨(dú)檢驗(yàn)方差齊性問題。結(jié)果中就有Levene檢驗(yàn)的結(jié)果,從中就可以選擇方差分別作為相等與不等假設(shè)時(shí)的結(jié)果,如圖33圖33 而在方差檢驗(yàn)中, Option的按鍵有一個(gè)Homogeneity of Variance test的按鍵,選擇后,輸出就有方差齊性的檢驗(yàn)結(jié)果。B、用SPSS檢驗(yàn)樣本總體的分布。以軟件自帶文件World 95 for Missing Values.sav作為例子檢驗(yàn)出生率的分布是否服從正態(tài)a. 選擇Data-Weight Cases,并把Birth rate per 1000 people選入Weight cases by的選項(xiàng),如圖34圖34 b.選擇Analyze-Nonparametric Tests- 1 sample K-S,把Birth rate per 1000 people選入test Variable List選項(xiàng),Test distribution選Normal,如圖35圖35 c.按OK可以看到結(jié)果如圖20,兩側(cè)檢驗(yàn)率為0,則表示拒絕接受Ho(數(shù)據(jù)整體服從正態(tài)分布)的假設(shè),數(shù)據(jù)分布不服從正態(tài)分布。圖36 提示,除了正態(tài)(Normal)外,還可以檢驗(yàn)其它分布,只要在圖中選項(xiàng)中選擇Uniform(均勻分布),Poisson(泊松分布),Exponential(指數(shù)分布)即可。當(dāng)然,如果樣本過大,可能SPSS也會(huì)拒絕運(yùn)算。三、感覺在數(shù)據(jù)和表格處理上,EXCEL要強(qiáng)一點(diǎn)。像圖11中,想把男性和女性的個(gè)數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 公交營(yíng)運(yùn)工作管理制度
- 巾幗建功學(xué)校管理制度
- 全面成本要素管理制度
- 公司在岸人員管理制度
- 商業(yè)公司售后管理制度
- 橋梁橋墩裝修方案(3篇)
- 車位整體劃轉(zhuǎn)方案(3篇)
- 碳鋼儲(chǔ)罐維修方案(3篇)
- 土方工程資料管理制度
- 購(gòu)置廠房付款方案(3篇)
- 配餐學(xué)校接餐管理制度
- 各村項(xiàng)目管理制度
- 必修三第九課全面推進(jìn)依法治國(guó)的基本要求第四框全民守法導(dǎo)學(xué)案
- 2024年溫州大學(xué)輔導(dǎo)員考試真題
- 智能電網(wǎng)運(yùn)營(yíng)行業(yè)跨境出海戰(zhàn)略研究報(bào)告
- 業(yè)主房屋裝修管理中的常見違規(guī)行為處置
- 青年紅色筑夢(mèng)之旅活動(dòng)
- 2025人教版八年級(jí)下冊(cè)物理期末復(fù)習(xí)全冊(cè)考點(diǎn)知識(shí)提綱填空練習(xí)題(含答案)
- 鐵路工務(wù)檢測(cè)技術(shù)
- 《水利水電工程壓力鋼管制造安裝及驗(yàn)收規(guī)范SLT 432-2024》知識(shí)培訓(xùn)
- DB37-T 5316-2025《外墻外保溫工程質(zhì)量鑒定技術(shù)規(guī)程》
評(píng)論
0/150
提交評(píng)論