版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第一章SPSS概覽--數(shù)據(jù)分析實例詳解1.1數(shù)據(jù)的輸入和保存1.1.1SPSS的界面1.1.2定義變量1.1.3輸入數(shù)據(jù)1.1.4保存數(shù)據(jù)1.2數(shù)據(jù)的預(yù)分析1.2.1數(shù)據(jù)的簡單描述1.2.2繪制直方圖1.3按題目要求進行統(tǒng)計分析1.4保存和導(dǎo)出分析結(jié)果1.4.1保存文件1.4.2導(dǎo)出分析結(jié)果歡迎加入SPSS使用者的行列,首先祝賀你選擇了權(quán)威統(tǒng)計軟件中界面最為友好,使用最為方便的SPSS來完成自己的工作。由于該軟件極為易學(xué)易用(當(dāng)然還至少要有不太高的英語水平),我們準(zhǔn)備在課程安排上做一個新的嘗試,即不急于介紹它的界面,而是先從一個數(shù)據(jù)分析實例入手:當(dāng)你將這個例題做完,SPSS的基本使用方法也就已經(jīng)被你掌握了。從下一章開始,我們再詳細(xì)介紹SPSS各個模塊的精確用法。我們教學(xué)時是以為藍(lán)本講述的--什么?你還在用7.0版!那好,由于10.0版在數(shù)據(jù)管理的界面操作上和以前版本有較大區(qū)別,本章我們將特別照顧一下老版本,在數(shù)據(jù)管理界面操作上將按9.0及以前版本的情況講述,但具體的統(tǒng)計分析功能則按10.0版本講述。沒關(guān)系,基本操作是完全一樣的。好,說了這么多廢話,等急了吧,就讓我們開始吧!。例1.1某克山病區(qū)測得11例克山病患者與13名健康人的血磷值(mmol/L)如下,問該地急性克山病患者與健康人的血磷值是否不同(衛(wèi)統(tǒng)第三版例4.8)?讓我們把要做的事情理理順:首先要做的肯定是打開計算機(廢話),然后進入瘟98或瘟2000(還是廢話,以下省去廢話2萬字),在進入SPSS后,具體工作流程如下:將數(shù)據(jù)輸入SPSS,并存盤以防斷電。進行必要的預(yù)分析(分布圖、均數(shù)標(biāo)準(zhǔn)差的描述等),以確定應(yīng)采用的檢驗方法。按題目要求進行統(tǒng)計分析。保存和導(dǎo)出分析結(jié)果。下面就按這幾步依次講解。§1.1數(shù)據(jù)的輸入和保存1.1.1SPSS的界面當(dāng)打開SPSS后,展現(xiàn)在我們面前的界面如下:請將鼠標(biāo)在上圖中的各處停留,很快就會彈出相應(yīng)部位的名稱。請注意窗口頂部顯示為“SPSSforWindowsDataEditor”,表明現(xiàn)在所看到的是SPSS的數(shù)據(jù)管理窗口。這是一個典型的Windows軟件界面,有菜單欄、工具欄。特別的,工具欄下方的是數(shù)據(jù)欄,數(shù)據(jù)欄下方則是數(shù)據(jù)管理窗口的主界面。該界面和EXCEL極為相似,由若干行和列組成,每行對應(yīng)了一條記錄,每列則對應(yīng)了一個變量。由于現(xiàn)在我們沒有輸入任何數(shù)據(jù),所以行、列的標(biāo)號都是灰色的。請注意第一行第一列的單元格邊框為深色,表明該數(shù)據(jù)單元格為當(dāng)前單元格。對Windows操作界面不熟悉的朋友可參見SAS入門第一課中的相關(guān)內(nèi)容。對數(shù)據(jù)表界面操作不熟悉的朋友可先學(xué)習(xí)一下EXCEL的操作(因為它的幫助是中文的)。有的SPSS系統(tǒng)打開時會出現(xiàn)一個導(dǎo)航對話框,請單擊右下方的Cancer按鈕,即可進入上面的主界面。1.1.2定義變量該資料是定量資料,設(shè)計為成組設(shè)計,因此我們需要建立兩個變量,一個變量代表血磷值,習(xí)慣上取名為X,另一個變量代表觀察對象是健康人還是克山病人,習(xí)慣上取名為GROUP。對數(shù)據(jù)的統(tǒng)計分析格式不太熟悉的朋友請先學(xué)習(xí)統(tǒng)計軟件第一課。選擇菜單Data==>DefineVariable。系統(tǒng)彈出定義變量對話框如下:該變量定義對話框在SPSS10.0版中已被取消,這里的操作只適合9.0~7.0版的用戶。對話框最上方為變量名,現(xiàn)在顯示為“VAR00001”,這是系統(tǒng)的默認(rèn)變量名;往下是變量情況描述,可以看到系統(tǒng)默認(rèn)該變量為數(shù)值型,長度為8,有兩位小數(shù)位,尚無缺失值,顯示對齊方式為右對齊;第三部分為四個設(shè)置更改按鈕,分別可以設(shè)定變量類型、標(biāo)簽、缺失值和列顯示格式;第四部分實際上是用來定義變量屬于數(shù)值變量、有序分類變量還是無序分類變量,現(xiàn)在系統(tǒng)默認(rèn)新變量為數(shù)值變量;最下方則依次是確定、取消和幫助按鈕。好,先來建立分組變量GROUP。請將變量名改為GROUP,然后單擊OK按鈕。有沒有搞錯?!折騰了半天就改個名字!難道連變量格式、標(biāo)簽等都不改?是這樣的,在SPSS中所有的數(shù)據(jù)均以最大位數(shù)保存(好象是雙精度),也就是說,上面雖然默認(rèn)只有兩位小數(shù),但那指的是計算精度,實際保存的數(shù)據(jù)位數(shù)是非常長的(可以輸入Pi值試一下)。在絕大多數(shù)情況下,SPSS給出的默認(rèn)數(shù)據(jù)類型和數(shù)據(jù)精度完全可以滿足需要,只是不太好看而已。至于標(biāo)簽等比較花哨的選項,反正我也很少用?,F(xiàn)在我們才剛剛?cè)腴T,一切從簡。以后我會詳細(xì)介紹各種設(shè)置的用法。在第一列灰色的“var”上雙擊,同樣會彈出定義變量對話框?,F(xiàn)在SPSS的數(shù)據(jù)管理窗口如下所示:第一列的名稱已經(jīng)改為了“group”,這就是我們所定義的新變量“group”?,F(xiàn)在我們來建立變量X。單擊第一行第二列的單元格,然后選擇菜單Data==>DefineVariable,同樣,將變量名改為X,然后確認(rèn)。此時SPSS的數(shù)據(jù)管理窗口如下所示:現(xiàn)在,第一、第二列的名稱均為深色顯示,表明這兩列已經(jīng)被定義為變量,其余各列的名稱仍為灰色的“var”,表示尚未使用。同樣地,各行的標(biāo)號也為灰色,表明現(xiàn)在還未輸入過數(shù)據(jù),即該數(shù)據(jù)集內(nèi)沒有記錄。1.1.3輸入數(shù)據(jù)我們先來輸入變量X的值,請確認(rèn)一行二列單元格為當(dāng)前單元格,棄鼠標(biāo)而用鍵盤,輸入第一個數(shù)據(jù)0.84,此時界面顯示如圖A所示:圖A圖B請注意:在回車之前,你輸入的數(shù)據(jù)在數(shù)據(jù)欄內(nèi)顯示,而不是在單元格內(nèi)顯示,現(xiàn)在回車,界面如圖B所示:首先,當(dāng)前單元格下移,變成了二行二列單元格,而一行二列單元格的內(nèi)容則被替換成了0.84;其次,第一行的標(biāo)號變黑,表明該行已輸入了數(shù)據(jù);第三,一行一列單元格因為沒有輸入過數(shù)據(jù),顯示為“.”,這代表該數(shù)據(jù)為缺失值。用類似的輸入方式,我們將患者的血磷值輸入完畢,并將相應(yīng)的變量GROUP均取值為1,此時數(shù)據(jù)管理窗口如下所示:從第12行開始輸入健康人的數(shù)據(jù),并將相應(yīng)的GROUP變量取值為2。最終該數(shù)據(jù)集應(yīng)該有24條記錄。1.1.4保存數(shù)據(jù)選擇菜單File==>Save,由于該數(shù)據(jù)從來沒有被保存過,所以彈出Saveas對話框如下:單擊保存類型列表框,可以看到SPSS所支持的各種數(shù)據(jù)類型,有DBF、FoxPro、EXCEL、ACCESS等,這里我們?nèi)匀粚⑵浯鏋镾PSS自己的數(shù)據(jù)格式(*.sav文件)。在文件名框內(nèi)鍵入Li1_1并回車,可以看到數(shù)據(jù)管理窗口左上角由Untitled變?yōu)榱爽F(xiàn)在的變量名Li1_1。為什么這里的對話框會出現(xiàn)漢字?是這樣的,需要從編程的角度來解釋:SPSS在彈出該對話框時會調(diào)用Windows系統(tǒng)的公用函數(shù),由于我們用的是中文Windows系統(tǒng),所以調(diào)用出來的就是中文?!?.2數(shù)據(jù)的預(yù)分析1.2.1數(shù)據(jù)的簡單描述首先我們需要知道數(shù)據(jù)的基本情況,如均數(shù)、標(biāo)準(zhǔn)差等。選擇Analyze==>DescriptiveStatistics==>Descriptives菜單,系統(tǒng)彈出描述對話框如下:如果按SPSS標(biāo)準(zhǔn)的叫法,這里應(yīng)該是調(diào)用了Descriptives過程,為了避免太生硬,我們稱為調(diào)用對話框,等大家熟悉SPSS了以后,在統(tǒng)計分析各章中可能兩種稱呼會混用。該對話框可分為左右兩大部分,左側(cè)為所有可用的侯選變量列表,右側(cè)為選入變量列表。我們只需要描述X,用鼠標(biāo)選中X,單擊中間的,變量X的標(biāo)簽就會移入右側(cè),注意這時OK按鈕變黑,表明已經(jīng)可以進行分析了,單擊它,系統(tǒng)會彈出一個新的界面如下所示:該窗口上方的名稱為SPSSforWindowsViewer,即(結(jié)果)瀏覽窗口,整個的結(jié)構(gòu)和資源管理器類似,左側(cè)為導(dǎo)航欄,右側(cè)為具體的輸出結(jié)果。結(jié)果表格給出了樣本數(shù)、最小值、最大值、均數(shù)和標(biāo)準(zhǔn)差這幾個常用的統(tǒng)計量。從中可以看到,24個數(shù)據(jù)總的均數(shù)為1.2846,標(biāo)準(zhǔn)差為0.4687。我們以上的做法對嗎?當(dāng)然有問題!光看總的描述是不夠的,還應(yīng)當(dāng)看看分組的描述情況。這里要用到文件分割功能,請切換回數(shù)據(jù)管理窗口,選擇Data==>SplitFile菜單,系統(tǒng)彈出文件分割對話框如下:選擇單選按鈕Organizeoutputbygroups,將變量GROUP選入右側(cè)的選入變量框,單擊OK鈕,此時界面不會有任何改變,但請再做一次數(shù)據(jù)描述,你就可以看到現(xiàn)在數(shù)據(jù)是分Group=1和Group=2兩種情況在描述了!從描述可知兩組的均數(shù)和標(biāo)準(zhǔn)差分別為1.5209、1.0846和0.4218、0.4221。如果定義了文件分割,則它會在以后的所有統(tǒng)計分析中起作用,直到你重新定義文件分割方式為止。1.2.2繪制直方圖統(tǒng)計指標(biāo)只能給出數(shù)據(jù)的大致情況,沒有直方圖那樣直觀,我們就來畫個直方圖瞧瞧!選擇Graphs==>Histogram,系統(tǒng)會彈出繪制直方圖對話框如下:將變量X選入Variable選擇框內(nèi),單擊OK按鈕。此時結(jié)果瀏覽窗口內(nèi)會繪制出如下兩個直方圖:兩組的數(shù)據(jù)沒有特別偏的分布,也沒有十分突出的離群值,因此無須變換,可以直接采用參數(shù)分析方法來分析。綜合設(shè)計類型,最終確定采用成組設(shè)計兩樣本均數(shù)比較的t檢驗來分析。最后,我們還要取消變量分割,免得它影響以后的統(tǒng)計分析,再次調(diào)出變量分割對話框,選擇單選按鈕中的“Analyzeallcases,donotcreatgroup”,單擊OK按鈕就可以了?!?.3按題目要求進行統(tǒng)計分析下面我們要用SPSS來做成組設(shè)計兩樣本均數(shù)比較的t檢驗,選擇Analyze==>CompareMeans==>Independent-SamplesTtest,系統(tǒng)彈出兩樣本t檢驗對話框如下:將變量X選入test框內(nèi),變量group選入grouping框內(nèi),注意這時下面的DefineGroups按鈕變黑,表示該按鈕可用,單擊它,系統(tǒng)彈出比較組定義對話框如右圖所示:該對話框用于定義是哪兩組相比,在兩個group框內(nèi)分別輸入1和2,表明是變量group取值為1和2的兩組相比。然后單擊Continue按鈕,再單擊OK按鈕,系統(tǒng)經(jīng)過計算后會彈出結(jié)果瀏覽窗口,首先給出的是兩組的基本情況描述,如樣本量、均數(shù)等(糟糕,剛才的半天工夫白費了),然后是t檢驗的結(jié)果如下:IndependentSamplesTest
Levene'sTestforEqualityofVariancest-testforEqualityofMeansFSig.tdfSig.(2-tailed)MeanDifferenceStd.ErrorDifference95%ConfidenceIntervaloftheDifferenceLowerUpperXEqualvariancesassumed.032.86022.019.4363.1729.7948Equalvariancesnotassumed
.020.4363.1729.7954可見該結(jié)果分為兩大部分:第一部分為Levene's方差齊性檢驗,用于判斷兩總體方差是否齊,這里的戒嚴(yán)結(jié)果為F,p,可見在本例中方差是齊的;第二部分則分別給出兩組所在總體方差齊和方差不齊時的t檢驗結(jié)果,由于前面的方差齊性檢驗結(jié)果為方差齊,第二部分就應(yīng)選用方差齊時的t檢驗結(jié)果,即上面一行列出的t,ν=22,p。從而最終的統(tǒng)計結(jié)論為按α水準(zhǔn),拒絕H0,認(rèn)為克山病患者與健康人的血磷值不同,從樣本均數(shù)來看,可認(rèn)為克山病患者的血磷值較高?!?.4保存和導(dǎo)出分析結(jié)果1.4.1保存結(jié)果文件前面我們已經(jīng)做出了分析結(jié)果,但是,可是,可但是,但可是呢?再好的結(jié)果只要一斷電就會全部消失(廢話),對于這一問題人們早已想出了三種解決辦法,他們分別是:需要結(jié)果的時候再運行一次分析程序。用筆將結(jié)果抄在紙上。直接保存結(jié)果文件。顯然,最方便快捷、最符合信息時代特征的就是第三種方法,在結(jié)果瀏覽窗口中(注意:一定要在結(jié)果瀏覽窗口中)選擇菜單File==>Save,由于該結(jié)果也從來沒有被保存過,所以彈出和前面保存數(shù)據(jù)時極為相似的一個Saveas對話框,和前面相比,他唯一的區(qū)別就是文件的保存類型只有ViewFiles(*.spo)一種。好,閑言少敘,在文件名框中鍵入“Li1_1”并回車,該結(jié)果文件就會按文件名Li1_1.spo被存儲。不是文件保存類型還有一種“ALLFiles(*.*)”嗎?別費勁了,這種類型是SPSS公司放在那里哄人的,在該對話框里無論怎么折騰,都只能按SPO文件的格式來保存。1.4.2導(dǎo)出分析結(jié)果文件倒是保存了,但問題還沒有完全解決:我們從來寫文章什么的都用的是文字處理軟件,尤其是WORD,可WORD不能直接讀取SPO格式的文件,怎么辦呢?沒關(guān)系,SPSS提供了將結(jié)果導(dǎo)出為純文本格式或網(wǎng)頁格式的功能,在結(jié)果瀏覽窗口中選擇菜單File==>Export,系統(tǒng)會彈出ExprotOutput對話框如下:最上方的Export下拉式列表可以選擇輸出的內(nèi)容,可以為含圖表的輸出文檔、無圖表的輸出文檔和只有統(tǒng)計圖表三種;中部的ExprotFile對話框則填入輸出的目標(biāo)文件名;左下方的ExportWhat單選框可以選擇輸出結(jié)果的哪些部分,可以是所有結(jié)果、所有可見結(jié)果或只輸出選擇的結(jié)果,一般選輸出所有可見結(jié)果;右下方的輸出文件類型下拉式列表已被我打開,可見里面有網(wǎng)頁格式和純文本格式兩種,在一切按所需選擇完畢后按OK鈕,則結(jié)果文件就會輸出為你想要的類型。好,到這里,就象我們剛開始所說的一樣,你實際上已經(jīng)完全掌握了SPSS的基本使用方法。我們以后將要做的工作就是“百尺竿頭,更進一步”,將從下一章開始詳細(xì)介紹SPSS各個模塊的精確用法,使大家能盡快的從SPSS新手向SPSS高手過度。第二章數(shù)據(jù)文件的管理(上)2.1建立與保存數(shù)據(jù)文件-File菜單2.1.1新建數(shù)據(jù)文件2.1.2.1直接打開2.1.2.2使用數(shù)據(jù)庫查詢打開2.1.2.3使用文本導(dǎo)入向?qū)ёx入文本文件2.1.2打開其他格式的數(shù)據(jù)文件2.1.3保存數(shù)據(jù)文件2.1.4File菜單中的其他條目2.2編輯數(shù)據(jù)文件2.2.1定義新變量2.2.1.1直接定義新變量2.2.1.2從原有變量計算新變量-Transform菜單2.2.2數(shù)據(jù)的錄入2.2.2.1直接錄入2.2.2.2數(shù)據(jù)錄入技巧2.3進一步整理數(shù)據(jù)文件-Data菜單不言而喻,一切統(tǒng)計分析都是以數(shù)據(jù)為基礎(chǔ)的,因此統(tǒng)計軟件的數(shù)據(jù)管理能力非常重要。SPSS以其豪華的界面為依托,為用戶提供的便捷的數(shù)據(jù)管理功能,下面我們就來具體看一下?!?.1建立與保存數(shù)據(jù)文件和大多數(shù)應(yīng)用軟件相同,SPSS中數(shù)據(jù)文件的管理功能基本上都集中在了File菜單上,該菜單的組織結(jié)構(gòu)和WORD等也極為相似,因此這里我們只介紹比較有特色的幾個菜單項。SPSS10.0有三個主要窗口界面:數(shù)據(jù)管理窗口、程序編輯窗口和結(jié)果瀏覽窗口;另有兩個不常用的窗口:結(jié)果草稿瀏覽窗口和VBs腳本語言編輯窗口。他們共享許多菜單項,如File菜單就大部分相同,這里介紹的許多內(nèi)容在五個窗口中都是通用的。2.1.1新建數(shù)據(jù)文件如果你正從頭開始進行一個新的課題,剛剛把數(shù)據(jù)收集上來,要做統(tǒng)計分析,自然需要新建一個數(shù)據(jù)庫,然后將所有的數(shù)據(jù)從紙上請到計算機里。在SPSS中,新建一個數(shù)據(jù)庫容易的不得了--已經(jīng)到了什么都不用做的地步!是這樣,當(dāng)你進入SPSS系統(tǒng)時,系統(tǒng)就已經(jīng)生成了一個空數(shù)據(jù)文件,即你看到的空白的數(shù)據(jù)管理界面。你只要按自己的需要定義變量,輸入數(shù)據(jù)然后存盤就是了(這些操作馬上會講到)。2.1.2
打開其他格式的數(shù)據(jù)文件凡是做過數(shù)據(jù)輸入工作的人都知道:這活又費眼睛又累人,出錯太多了還要挨批評,非常影響個人的光輝形象。算了,還是在有限的經(jīng)費里劃幾百美元出來雇個打字小姐吧(怎么用美元?因為我請了個老外?。???墒欠浅2恍遥撏局粫肊XCEL2000(又是一個被微軟成功洗腦的家伙),數(shù)據(jù)現(xiàn)已輸好,怎么轉(zhuǎn)成SPSS數(shù)據(jù)文件呢?沒關(guān)系,SPSS提供了以下幾種方法來打開其他格式的數(shù)據(jù)文件。2.1.2.1
直接打開SPSS現(xiàn)在可以直接讀入許多格式的數(shù)據(jù)文件,其中就包括EXCEL各個版本的數(shù)據(jù)文件。選擇菜單File==>Open==>Data或直接單擊快捷工具欄上的“”按鈕,系統(tǒng)就會彈出OpenFile對話框,單擊“文件類型”列表框,在里面能看到直接打開的數(shù)據(jù)文件格式,分別是:SPSS(*.sav)SPSS數(shù)據(jù)文件(6.0~10.0版)SPSS/PC+(*.sys)Systat(*.syd)*.syd格式的Systat數(shù)據(jù)文件Systat(*.sys)*.sys格式的Systat數(shù)據(jù)文件SPSSportable(*.por)SPSS便攜格式的數(shù)據(jù)文件EXCEL(*.xls)EXCEL數(shù)據(jù)文件(從5.0版~2000版)Lotus(*.w*)Lotus數(shù)據(jù)文件SYLK(*.slk)SYLK數(shù)據(jù)文件dBase(*.dbf)dBase系列數(shù)據(jù)文件,(從dBaseII~IV)Text(*.txt)純文本格式的數(shù)據(jù)文件data(*.dat)純文本格式的數(shù)據(jù)文件選擇所需的文件類型,然后選中需要打開的文件,SPSS就會按你的要求打開你要使用的數(shù)據(jù)文件,并自動轉(zhuǎn)換為數(shù)據(jù)SPSS格式。也許有視力好的朋友會注意到右下方除了“打開”和“取消”兩個按鈕外,中間還有一個“Paste”按鈕,該按鈕在SPSS的大多數(shù)對話框中都存在,是用于自動生成SPSS程序的,我們以后會專門講解該問題。2.1.2.2
使用數(shù)據(jù)庫查詢打開SPSS可以直接打開許多類型的數(shù)據(jù)文件,但這并不是說它可以打開所有類型的數(shù)據(jù)文件(廢話),比如FoxPro3.0以上版本的*.dbf文件就不能直接打開(有興趣的話你可以試試)。為此,SPSS還提供了另一個適用范圍更廣、但使用上較為專業(yè)的數(shù)據(jù)接口--數(shù)據(jù)庫查詢。實際上,SPSS在這里使用的是一種叫ODBC(OpenDatabaseCapture)的數(shù)據(jù)接口,該接口被大多數(shù)數(shù)據(jù)庫軟件和辦公軟件(如MSOffice)支持,通過它,應(yīng)用程序可以直接訪問以結(jié)構(gòu)化查詢語言(SQL)做為數(shù)據(jù)訪問標(biāo)準(zhǔn)的數(shù)據(jù)庫管理系統(tǒng)。由于SPSS10.0可以直接打開EXCEL所有系列的數(shù)據(jù)文件,因此數(shù)據(jù)庫查詢接口的用處不是很大。但是,在9.0及以前的版本中,該查詢?nèi)允侵苯哟蜷_EXCEL95、97及2000數(shù)據(jù)文件的唯一辦法。ODBC數(shù)據(jù)引擎是獨立與各種應(yīng)用軟件,直接安裝到Windows系統(tǒng)中的,因此你所用的系統(tǒng)中ODBC所支持的數(shù)據(jù)類型取決于所安裝的ODBC引擎的情況。還好,大多數(shù)支持該接口的軟件都會在安裝光盤上附送該引擎的安裝文件(如MSOffice)。不過有一點要提醒大家,許多機器的OBDC數(shù)據(jù)引擎安裝有問題(尤其是D版),在SPSS中使用它往往要死機。選擇菜單File==>OpenDatabase==>NewQuery,系統(tǒng)會彈出數(shù)據(jù)庫向?qū)У牡谝粋€窗口,其中會列出你使用的機器上已安裝的所有數(shù)據(jù)庫驅(qū)動程序,選中所需的數(shù)據(jù)源,然后單擊下一步,向?qū)徊揭徊降奶崾灸闳绾巫?,直至將?shù)據(jù)讀入SPSS。我原來準(zhǔn)備舉一個具體例子,但后來發(fā)現(xiàn)不同版本的ODBC引擎所彈出的對話框并不相同!不僅如此,不同的數(shù)據(jù)驅(qū)動程序其對話框也各不相同!比如說,有的需要你的LoginID和Password,有的又不需要,因此我這里就不再講了。由于它使用上太專業(yè)(尤其在10.0版中,9.0版還好些),如果確實要用,請找一個對數(shù)據(jù)庫接口比較熟的人來幫你。2.1.2.3
使用文本導(dǎo)入向?qū)ёx入文本文件選擇菜單File==>ReadTextData,系統(tǒng)就會彈出OpenFile對話框,對!和前面的情況完全一樣,只是文件類型自動跳到了Text(*.txt)。實際上,該功能在SPSS中已被整合到了OpenFile對話框中之所以在菜單上保留該條目有兩個原因:1.讀入純文本的情況非常普遍,放在這里更加醒目;2.為了和SPSS老版本的使用上保持兼容。例2.1現(xiàn)有一數(shù)據(jù)文件以純文本的形式存為“c:\Li2_1.txt”,且第一行為變量名,請將其讀入SPSS。解:在OpenFile對話框選中相應(yīng)的文件名并單擊“確定”,系統(tǒng)會自動啟動文本導(dǎo)入向?qū)υ捒蛉缦拢涸赟PSS10.0中,該向?qū)Р]有重新設(shè)計,因此仍然有問題被截斷無法顯示完的情況出現(xiàn)??梢钥吹皆撓?qū)Ч卜?步,這是第一步。中部為一對單選按鈕,問題為“你的文本文件和預(yù)定義格式相一致嗎?”,下方為按預(yù)定義格式讀入的數(shù)據(jù)文件的預(yù)覽。顯然,SPSS的預(yù)定義格式并沒有正確識別該文件。因此選擇“No”并單擊“下一步”,系統(tǒng)彈出向?qū)У南乱粋€對話框如下:最上方的問題是“你的變量是如何排列的?”,下面的選項分別為Delimite(用某種字符區(qū)分)和FixedWidth(固定寬度),一般都是Delimite,第二個問題是“變量名包括在文件最前面了嗎?”,我們當(dāng)然選“Yes”,單擊“下一步”,系統(tǒng)彈出第三個對話框:最上方的句子意為“第一條記錄從第幾行開始?”,右側(cè)可以輸入行數(shù)。由于我們所用的數(shù)據(jù)第一行為變量名,因此這里輸入2。下面的問題是“你的記錄是怎樣存儲在文件中的?”??梢允恰懊恳恍写硪粭l記錄”,或者“每**個變量代表一條記錄”,數(shù)據(jù)一般都是第一種情況。下一個問題是“你想導(dǎo)入多少條記錄?”,可以是“所有記錄”、“前**條”或“隨機導(dǎo)入**%的記錄”。一般也選前者。單擊“下一步”,第四個對話框如下:我這里寫的非常詳細(xì),但實際使用中你可以不管大多數(shù)問題,因為SPSS一般都能自動正確設(shè)置。最上方的問題為“變量間用的是哪種分隔符?”,可選的有Tab鍵、空格、逗號、分號或自行定義的其他符號。本數(shù)據(jù)采用的是空格,可見系統(tǒng)已經(jīng)自動識別并選擇了空格,而下方的數(shù)據(jù)預(yù)覽窗口顯示出了正確的數(shù)據(jù)讀入情況。單擊“下一步”,第五個對話框如下:上方的提示為“定義在數(shù)據(jù)預(yù)覽窗口中所選擇的變量?!薄n櫭剂x,在這個對話框中你可以在數(shù)據(jù)預(yù)覽窗口中選擇某一列變量,然后更改其變量名和類型。當(dāng)然,在這里我們不用這樣做,直接單擊“下一步”,系統(tǒng)彈出文本導(dǎo)入向?qū)У淖詈笠粋€對話框如下:最上面的問題為“你愿意保存這次的文件(讀入)格式設(shè)置以備下次使用嗎?”,第二個問題為“你是否愿意將以上操作粘貼為SPSS語句?”,一般這兩個問題我們都可以不管。單擊“完成”,系統(tǒng)最終成功的讀入了Li2_1.txt。2.1.3保存數(shù)據(jù)文件在對數(shù)據(jù)做了修改后,保存數(shù)據(jù)文件是必不可少的工作之一。選擇菜單File==>Save,如果數(shù)據(jù)文件曾經(jīng)存儲過,則系統(tǒng)會自動按原文件名保存數(shù)據(jù);否則,就會彈出和選擇Saveas菜單時相同的Saveas對話框。里面可以保存的數(shù)據(jù)類型和可以打開的幾乎一樣多,選擇合適的類型,確定就是了。
Save命令的快捷鍵為^S,如果你曾經(jīng)領(lǐng)教過Windows死機的巨大潛力,那么你一定會同意習(xí)慣性的隨手按^S至少不能算是一個壞習(xí)慣。如果你準(zhǔn)備將數(shù)據(jù)存為SPSS以外的其他類型,要注意有些設(shè)置可能會丟失,如標(biāo)簽和缺失值等。尤其是缺失值,如果想存的數(shù)據(jù)格式不支持缺失值,那你的數(shù)據(jù)可能會變的面目全非。2.1.4File菜單中的其他條目【DispDataInfo】該菜單項用于顯示數(shù)據(jù)的基本信息,選擇它后會彈出非常類似于打開文件的一個對話框用于選擇數(shù)據(jù)文件,選擇好后按OK,系統(tǒng)就會在結(jié)果窗口中列出所選數(shù)據(jù)的基本情況,如建立時間、標(biāo)簽設(shè)置、記錄數(shù)、變量設(shè)置等?!続pplyDataDictionary】即使用數(shù)據(jù)字典,該功能使你可以直接在新數(shù)據(jù)集中套用以前定義好的變量設(shè)置(格式、標(biāo)簽等,但不包括數(shù)據(jù)類型),舉個例子吧:請打開Li1_1.sav文件,將變量x的長度從8改為4,標(biāo)簽刪掉,然后選擇菜單File==>ApplyDataDictionary,在文件對話框中選擇Li1_1.sav并按OK(即將Li1_1.sav的變量設(shè)置按相同變量名一一套用在現(xiàn)在的數(shù)據(jù)集上),怎么樣?一切都變回去了吧?!綜acheData】建立數(shù)據(jù)緩沖區(qū)。以前SPSS每執(zhí)行一條命令都會重新讀取所需的數(shù)據(jù),如果是從遠(yuǎn)程用SQL調(diào)用數(shù)據(jù)庫,這會非常的費時?,F(xiàn)在使用CacheData,可以將數(shù)據(jù)全部讀入暫存盤,建立活動數(shù)據(jù)的緩沖區(qū)。大大加快處理速度。不過我特意試了一下,如果是處理本機數(shù)據(jù)的話,該命令對速度的提升不是非常明顯:(?!綪rint和PrintPreview】這兩個菜單項用于將數(shù)據(jù)管理窗口中的數(shù)據(jù)以表格的形式打印出來,其中PrintPreview是新增加的,使用上和WPS2000的打印預(yù)覽非常相似(其實用的是同樣的程序),不過和SPSS結(jié)果的打印程序一樣,用SPSS直接打印數(shù)據(jù)非常的浪費紙張,用不用你自己決定吧?!維topProcessor】用于停止執(zhí)行當(dāng)前的SPSS命令。由于SPSS處理速度非常的慢,如果你正在對一個大型的數(shù)據(jù)執(zhí)行統(tǒng)計命令,等了半天都沒有結(jié)束,此時你的另一半約你逛街的時間又要到了,可是你的結(jié)果還沒有存,執(zhí)行命令時又存不了,怎么辦呢?試試這個命令吧。
并非所有的命令都可以喊停的,許多數(shù)據(jù)庫操作命令(計算變量,合并等)好象就停不了。§2.2編輯數(shù)據(jù)文件在SPSS中,數(shù)據(jù)文件的編輯、整理等功能被集中在了Data和Transform兩個菜單項中,這兩個菜單的內(nèi)容如下所示:Data菜單項Transform菜單項下面我們將根據(jù)其功能來分別講述。2.2.1定義新變量2.2.1.1直接定義新變量大多數(shù)情況下我們需要從頭定義變量,在SPSS10.0中,定義變量的操作界面和FoxPro等數(shù)據(jù)庫非常相似,只需單擊左下方的VariableView標(biāo)簽就可以切換到變量定義界面開始定義新變量。如Li1_1.sav的變量定義如下所示:以變量x為例:變量名為x,類型為Numeric,寬度為4,小數(shù)位數(shù)2位(因小數(shù)點還要占一位,故整數(shù)位只有一位),變量標(biāo)簽位為“血磷值”。右側(cè)在圖中未能看到的依次為Values,用于定義具體變量值的標(biāo)簽;Missing,用于定義變量缺失值;Colomns,定義顯示列寬;Align,定義顯示對齊方式;Measure,定義變量類型是連續(xù)、有序分類還是無序分類。使用該窗口,我們可以一次定義許多新變量,不會象老版本那樣一個一個的定義了。由于SPSS是英文軟件,變量名采用中文會有潛在的沖突(100%的兼容性是不存在的,典型的例子就是微軟公司的產(chǎn)品)。對于喜歡搞點花樣的用戶,這里有必要介紹一下SPSS中標(biāo)簽和缺失值的定義方法:標(biāo)簽
和老版本不同,現(xiàn)在變量標(biāo)簽和變量值標(biāo)簽被分開設(shè)置,變量標(biāo)簽就在Label框中直接輸入,變量值標(biāo)簽則在它右側(cè)的Value框定義。以group為例,單擊Value框右半部的省略號,會彈出變量值標(biāo)簽對話框如下:上部的兩個文本框分別為變量值輸入框和變量值標(biāo)簽輸入框,分別在其中輸入“1”和“克山病患者”,此時下方的Add鈕變黑,單擊它,該變量值標(biāo)簽就會被加入下方的標(biāo)簽框內(nèi)。與此類似定義變量值“2”為“健康人”,最后按OK,變量值標(biāo)簽就設(shè)置完成。此時你做任何分析,在結(jié)果中都有相應(yīng)的標(biāo)簽出現(xiàn)。如果你現(xiàn)在就想看效果,切換回DataView界面,然后選擇菜單View==>ValueLabels,怎么樣,看到了嗎?缺失值
單擊missing框右側(cè)的省略號,會彈出缺失值對話框如下:界面上有一列三個單選鈕,默認(rèn)值為最上方的“無缺失值”;第二項為“不連續(xù)缺失值保疃囁梢遠(yuǎn)ㄒ?個值;最后一項為“缺失值范圍加可選的一個缺失值”,文如其意,不用我多解釋了吧。第二章數(shù)據(jù)文件的管理(下)2.1建立與保存數(shù)據(jù)文件-File菜單2.1.1新建數(shù)據(jù)文件2.1.2.1直接打開2.1.2.2使用數(shù)據(jù)庫查詢打開2.1.2.3使用文本導(dǎo)入向?qū)ёx入文本文件2.1.2打開其他格式的數(shù)據(jù)文件2.1.3保存數(shù)據(jù)文件2.1.4File菜單中的其他條目2.2編輯數(shù)據(jù)文件2.2.1定義新變量2.2.1.1直接定義新變量2.2.1.2從原有變量計算新變量-Transform菜單2.2.2數(shù)據(jù)的錄入2.2.2.1直接錄入2.2.2.2數(shù)據(jù)錄入技巧2.3進一步整理數(shù)據(jù)文件-Data菜單用于數(shù)據(jù)管理的菜單項2.3.2正交設(shè)計菜單項2.2.1.2從原有變量計算新變量從頭定義變量的情況多數(shù)在建立數(shù)據(jù)集時出現(xiàn)。但是,當(dāng)數(shù)據(jù)集已經(jīng)建立,需要整理、轉(zhuǎn)換變量時,碰到的更多情況是需要根據(jù)某種條件從原有變量計算新變量。下面我們將按菜單條目的順序依次講解他們的功能。但是,首先我們需要了解一下所用的對話框界面的情況?!維PSS對話框元素介紹】下面是我們在第一章曾經(jīng)見過的兩樣本t檢驗對話框:這是一個非常典型的SPSS對話框。它包含了許多具有SPSS特色的對話框元素:對話框左側(cè)為候選變量列表框,里面列出了可被該對話框使用的變量;右上方為TestVariables框,可將變量選入其中;注意在兩個框的中間用“”相連,這是變量移動按鈕,其方向表明是將變量從那個框移動到哪個框,上圖中我們選中了變量group,兩個移動按鈕均變黑并向右指,表明變量group可以移動到他們右側(cè)的兩個框里去,改變當(dāng)前框(在其他兩個框里單擊),移動按鈕就會轉(zhuǎn)向、變灰等以表明不同的意思(墻頭草一個,可別小看這個功能,我想用VB實現(xiàn)這個功能,也是費了些工夫才把它搞定了);右側(cè)為一排五個按鈕,分別是確定、粘貼、重置、取消和幫助。這五個兄弟也是幾乎永遠(yuǎn)一起出現(xiàn)的,另外四個大家都比較熟悉了,重置(Reset)按鈕用于取消對話框內(nèi)已做的選擇,恢復(fù)到默認(rèn)的狀態(tài);最下方有個Options按鈕,用于設(shè)置專門用于該對話框的選項;OK、Paste兩個按鈕為灰色,表明所需條件尚未滿足,該按鈕暫不可用。同理,GroupingVariable框下方的DefineGroups按鈕為灰色顯示,也表明暫不可用?!綜omputeVariable對話框】例3.2
在li1_1.sav中建立新變量temp,令其值當(dāng)血磷值大于1時為2,否則為1。解:這里需要用到ComputeVariable對話框,外加一點技巧。首先給變量temp均賦值為1,然后將血磷值大于1的記錄其temp變量值改為2即可。選擇菜單Transform==>Compute,彈出ComputeVariable對話框如下:左上角為需要計算的變量名,在其中鍵入“temp”,此時“Type&Lable”按鈕就會變黑,喜歡精確的朋友可以在這里對temp進行詳細(xì)的定義,但如果你和我一樣非常懶,就可以對它視而不見(不要生氣,聰明人大多都非常懶:));左下方為候選變量列表,現(xiàn)在還用不著;中部為類似計算器的軟鍵盤,可以用鼠標(biāo)按鍵輸入數(shù)字和符號,這里我們直接輸入“1”,輸入的內(nèi)容回立刻在右上方的數(shù)值表達式窗口中出現(xiàn);軟鍵盤右側(cè)為函數(shù)窗口,可以在這里找到并使用所需的SPSS函數(shù);這次也用不到。好,現(xiàn)在“OK”按鈕已經(jīng)變黑,單擊他,系統(tǒng)就會自動生成一個新變量temp,并且取值均為1。軟鍵盤上幾個奇奇怪怪的符號的含義如下:~=&|**~不等號,等價于<>邏輯符號AND邏輯符號OR乘方,相當(dāng)于函數(shù)EXP()邏輯符號NOT在函數(shù)窗口中選中某個函數(shù)并單擊右鍵,系統(tǒng)就會彈出該函數(shù)的用法說明。函數(shù)主要是和變量名組合起來使用的,比如說ABS(x)就是取變量x的絕對值。好,現(xiàn)在開始進行第二步,再次選擇菜單Transform==>Compute,系統(tǒng)也再次彈出這個對話框--等等!注意到了嗎?該對話框自動記住了你上次輸入的內(nèi)容,幾乎所有SPSS的對話框都有這個特性,這會大大方便我們的使用。好,將數(shù)值表達式窗口中的1改為2,然后單擊中下部的“If”按鈕,系統(tǒng)彈出記錄選擇對話框如下:不需要太多解釋,大部分內(nèi)容都是前面見過的。由于我們這里不是對所有記錄做變換,因此選中第二個單選鈕“Includeifcasestatisfiesconfition:”,此時下方的所有窗口變亮,表明現(xiàn)在可用;而“Continue”按鈕變灰,表明當(dāng)前還沒有提供所需的信息,好,我們就來提供,在左側(cè)選中血磷值(x),然后單擊“”,x就被引入了右側(cè)的變量框,任你用鍵盤或者用鼠標(biāo),總之將下面這個算式補充完:x>1?,F(xiàn)在可見“Continue”按鈕再度變黑。在它又變灰之前趕快單擊它(開個玩笑),系統(tǒng)回到ComputeVariable對話框,請注意If按鈕右側(cè)的變化:x>2。如果你做的結(jié)果不一樣,請重來一遍?,F(xiàn)在單擊“OK”按鈕,由于我們要替換變量值,系統(tǒng)會彈出一個確認(rèn)對話框,確認(rèn)替換,馬上你就會看到,我們已經(jīng)把這道題做完了?!綜ount對話框】Count對話框用于計算某個值或某些值在某個變量的取值中是否出現(xiàn)(好象有點拗口),比如我們想看看有哪些記錄的血磷值在2~3之間,選擇菜單Transform==>Count,系統(tǒng)彈出Count對話框如下:TargetVariable框中用于指定記錄變量值是否出現(xiàn)的變量名,在這里輸入temp2;選中血磷值(x),將其選入Variables窗口,此時“DefineValues”按鈕變黑,單擊它,系統(tǒng)彈出變量值定義窗口如下:左半部為變量值定義窗口,可以定義某個值、系統(tǒng)缺失值、系統(tǒng)或用戶定義缺失值、變量值范圍、小于某值或大于某值。我們這里是第四種情況:選擇Range,在through兩側(cè)分別鍵入2、3,然后單擊已變黑的“Add”按鈕,“2thru3”就會被加入“ValuestoCount”框內(nèi)。然后單擊“Continue”,再單擊Count對話框的“OK”,可以看到系統(tǒng)自動生成變量temp2,其中10、11號記錄因血磷值介于2和3之間,temp2取值為1,其余的記錄temp2取值均為0。SOS,SOS,請大家千萬注意,Count對話框有一個潛在的bugs,當(dāng)你需要計算同時滿足兩個變量取值條件的記錄數(shù)有多少時,直接用該對話框會得出完全錯誤的結(jié)果。這里有一點技巧,需要對對話框生成的指令加以修改,至于怎么修改嘛,我們將在Syntax(語法)窗口使用詳解一章中講述:)?!綬ecode對話框】Recode對話框用于從原變量值按照某種一一對應(yīng)的關(guān)系生成新變量值,可以將新值賦給原變量,也可以生成一個新變量。例2.3
在Li1_1.sav中生成新變量temp3,當(dāng)血磷值小于1時取值為0,1~2時取值為10,大于2時取值為20。解:選擇菜單Transform==>Record==>IntoDifferentVariables,Recode對話框如下:將血磷值(x)選入InputVariable->OutputVariable框,此時OutputVariable框變黑,在其中鍵入新變量名temp3并單擊Change,可見原來的x->?變成了x->temp3?,F(xiàn)在單擊“OldandNewValues”,系統(tǒng)彈出變量值定義對話框如下:許多東西和前面類似,不再重復(fù)。按照題目的要求,選擇Range:Lowestthrough,在右側(cè)框中鍵入1,然后在右上方的Value右側(cè)框中鍵入對應(yīng)的新變量值0,此時下方Add鍵變黑,單擊它,Old->New框中就會加入Lowestthru1->0,按照類似的方法依次加入另兩條轉(zhuǎn)換規(guī)則,最終Old->New框中共有Lowestthru1->0、1thru2->10、Else->20三條,現(xiàn)在單擊Continue,再單擊OK,系統(tǒng)就會按要求生成新變量temp3。哎呀不得了,圖片太多了,雖然這樣非常直觀,但下載速度太慢了。等大家對基本界面操作熟悉了后,我們將對比較簡單的對話框試著對操作用文字的方式描述,比如上面的操作我們將用文字表達為:OutputVariable框:選入xOutputVariableName框:鍵入temp3:單擊Change鈕選中x->temp3:單擊OldandNewValues鈕:Range:Lowestthrough單選鈕:鍵入1:NewValueValue單選鈕:鍵入0:單擊Add鈕Range:through單選鈕:兩側(cè)分別鍵入1、2:NewValueValue單選鈕:鍵入10:單擊Add鈕Range:Allothervalues單選鈕:NewValueValue單選鈕:鍵入20:單擊Add鈕單擊Continue單擊OK怎么樣,還能理解吧。【CategorizeVariables對話框】CategorizeVariables對話框用于將連續(xù)性變量自動按要求分成等間距的幾類。其界面非常簡單,許多東西都是我們所熟悉的,唯一特別的是右下方的numberofcategories框,用于輸入變量的等級數(shù),默認(rèn)為4,比如我們希望將血磷值按大小分成5個等級,先將血磷值選入CreateCategories框,然后將下面的4改為5,單擊OK,就會看到系統(tǒng)產(chǎn)生了一個新變量nx(即numberofx之意),其取值就對應(yīng)了血磷值相應(yīng)的5個等級(1~5)。重復(fù)一下,具體操作步驟為:CreateCategories框:選入xNumberofcategories框:5OK【RankCases對話框】例2.4
請分組計算血磷值的秩和。解:選擇菜單Transform==>RankCases,彈出RankCases對話框如下:將血磷值選入Variable框,分組變量選入By框,單擊OK即可。系統(tǒng)會建立一個新變量rx(即原變量名前加r表示Rank之意),其取值為x分組的秩次。解釋一下RankCases對話框的其他幾個零件:左下角的AssignRank1to框架用于選擇將秩次1賦給最小值還是最大值;中下部的Displaysummarytables復(fù)選框用于確定是否在結(jié)果窗口內(nèi)輸出結(jié)果報表;RankTypes鈕用于定義秩次類型,有Rank(秩分?jǐn)?shù))、Savage評分(新變量值按指數(shù)分布)、Fractionalrank(新變量值是秩分?jǐn)?shù)除以非缺失值觀測量的權(quán)重之和)、Fractionalrank%(新變量值是秩分?jǐn)?shù)除以非缺失值觀測量數(shù)乘100)、Sumofcaseweights(新變量值是各觀測量的權(quán)重之和)、Ntiles(新變量值是按所選變量的百分位數(shù)分組的組序號),默認(rèn)值為Rank。單擊More按鈕,還會有更多的設(shè)置,這里就不再講了。Ties鈕用于定義對相同值觀測量的處理方式,可以是取平均秩次、最小值、最大值或當(dāng)作一個記錄處理,默認(rèn)值為取平均秩次?!続utomaticRecord對話框】該對話框用于按原變量值的大小生成新變量,變量值就是原值的大小次序,功能和RankCases對話框重復(fù)(等價于相同值觀測量當(dāng)作一個記錄處理的情況)?!綜reateTimeSeries對話框】用于自動生成時間序列變量,由于太專業(yè),這里不做過多解釋?!綬eplaceMissingValue對話框】用于填充缺失值,結(jié)果存入一個新變量。填充方法有:序列的均數(shù)、相鄰若干點的均數(shù)、相鄰若干點的中位數(shù)、線性內(nèi)插、線性外延,默認(rèn)值為序列的均數(shù)。2.2.2
數(shù)據(jù)的錄入2.2.2.1
直接錄入我想直接錄入的問題就不用多講了吧,直接敲就是了!2.2.2.2
數(shù)據(jù)錄入技巧和其他常用統(tǒng)計軟件相比,SPSS數(shù)據(jù)界面最大的優(yōu)勢就是支持鼠標(biāo)的拖放操作,以及拷貝粘貼等命令,下面的數(shù)據(jù)錄入技巧就是對這些功能的利用?!具B續(xù)多個相同值的輸入】如前面group變量有連續(xù)多個1,如果直接輸入,可以在第一格內(nèi)輸入1并回車,然后回到剛才的單元格并單擊右鍵,選擇copy,最后用拖放方式選中所有應(yīng)輸入1的單元格,單擊右鍵并選擇paste,所有選中的單元格就會都被剛才拷貝的1填充?!緦XCEL數(shù)據(jù)直接引入SPSS】Excel已經(jīng)打開原數(shù)據(jù),并且數(shù)據(jù)量較少的時候,可以直接用拷貝粘貼的方法將數(shù)據(jù)引入SPSS:先在EXCEL中選中所有的數(shù)據(jù)(不包括變量名),然后選擇拷貝命令;然后切換到SPSS,最好使行1列1單元格成為當(dāng)前單元格,然后執(zhí)行粘貼命令,數(shù)據(jù)就會全部轉(zhuǎn)入SPSS,再定義相應(yīng)的變量即可。2.3
進一步整理數(shù)據(jù)文件--Data菜單在許多情況下,我們需要先對數(shù)據(jù)進行一些整理(如分組、合并、加權(quán)等)才能將其用于最終的統(tǒng)計分析。這些功能基本上都集中在Data菜單項中,下面我們就對這些對話框做逐一介紹。2.3.1用于數(shù)據(jù)管理的菜單項【SortCases對話框】例2.5
對數(shù)據(jù)集li1_1.sav按group升序,x降序的次序排列。解:選擇菜單Data==>SortCases,系統(tǒng)彈出SortCases對話框,該對話框并不復(fù)雜,其中比較特殊的是下方的SortOrder單選鈕,有升序和降序兩種選擇。請注意,該單選鈕是和上方的SortBy框一起使用的,具體方法如下:確認(rèn)升序單選鈕被選擇,將Group選入SortBy框;選擇降序單選鈕,將x選入SortBy框。請注意:group和x后面分別跟著Ascending和Descending,表明前者是按升序、后者按降序排列;由于Group在前,因此排序時以Group優(yōu)先?!綯ransepose對話框】該對話框用于對數(shù)據(jù)進行行列轉(zhuǎn)置,可以在原數(shù)據(jù)文件中指定一個變量記錄轉(zhuǎn)置后的變量名。原變量名則自動保存在系統(tǒng)產(chǎn)生的名為case_lbl的字符變量中。該對話框也非常簡單,左側(cè)為候選變量框;右上方為Variable框,用于選入需要轉(zhuǎn)置的變量,一般應(yīng)選入除名稱變量外的所有其他變量,如果有變量未選入,則轉(zhuǎn)置時會被自動丟棄;右下方為NameVariable框,用于指定原數(shù)據(jù)文件中記錄轉(zhuǎn)置后變量名的字符變量,但不是必需的,此時系統(tǒng)會將新變量自動按var001、var002...的順序命名?!綧ergeFiles對話框】用于合并數(shù)據(jù)文件,實際上包括了兩個對話框,分別對應(yīng)了兩種合并方式:1.從外部數(shù)據(jù)文件中增加記錄到當(dāng)前數(shù)據(jù)文件中,稱為縱向合并,用AddCases對話框完成,相互合并的數(shù)據(jù)文件中應(yīng)該有相同的變量。選擇菜單Data==>MergeFiles==>AddCases,系統(tǒng)首先彈出打開數(shù)據(jù)文件對話框,選中需要添加的數(shù)據(jù)文件并按OK,系統(tǒng)才彈出AddCases對話框,左側(cè)顯示的是新、老數(shù)據(jù)文件中不匹配的變量名,右側(cè)顯示的是已經(jīng)匹配的變量名??梢杂肦ename按鈕對不匹配變量改名(先選中)或用鼠標(biāo)強行匹配(即先按Ctrl鍵選中匹配的兩個變量再單擊Pair鈕)。右下方的Indicatecasesourceasvariable復(fù)選框用于定義一個新變量以區(qū)分哪些記錄是后來添加的。選擇停當(dāng)后單擊OK,該操作就完成了。實際上右側(cè)顯示的是將要包括在合并后數(shù)據(jù)集中的變量,如果有哪個你不需要,把它弄到左側(cè)框中即可。2.從外部數(shù)據(jù)文件增加變量到當(dāng)前數(shù)據(jù)文件,稱為橫向合并,用AddVariable對話框完成,相互合并的數(shù)據(jù)文件中應(yīng)包含同樣的記錄。選擇菜單Data==>MergeFiles==>AddVariable對話框,系統(tǒng)同樣先彈出打開數(shù)據(jù)文件對話框,單擊OK后彈出和前面相似的AddVariable對話框。按需選擇即可?!続ggregate對話框】用于對數(shù)據(jù)進行分類匯總,所謂分類匯總就是按指定的分類變量對觀測值進行分組,對每組記錄的各變量值求指定的描述統(tǒng)計量,結(jié)果可以存入新數(shù)據(jù)文件,也可以替換當(dāng)前數(shù)據(jù)文件。上圖中各個零件的含義如下:BreakVariables框:用于選擇分組變量;AggregateVariables框:用于選擇被匯總的變量;Name&Label鈕:用于定義新產(chǎn)生的匯總變量的名稱和標(biāo)簽;Function鈕:用于定義匯總函數(shù),共有三組函數(shù),以最常用的第一組為例,可選的函數(shù)有均數(shù)、同組的第一個觀測值、最后一個觀測值、同組記錄數(shù)、標(biāo)準(zhǔn)差、最小值、和、最大值共8個;SaveNumberofcasesinbreakgroupasvariable復(fù)選框:用于定義一個新變量以存儲同組的記錄數(shù);Createnewdatafile單選鈕:定義一個新文件以存儲匯總的結(jié)果,右側(cè)的File鈕用于具體文件名的定義,默認(rèn)文件名為AGGR.sav;Replaceworkingdatafile單選鈕:用匯總的結(jié)果替換原來的數(shù)據(jù)。例2.6
計算Li1_1.sav中兩組的血磷值標(biāo)準(zhǔn)差。解:該題完全可以用更簡單的方法完成,這里只是演示一下匯總對話框的用法。BreakVariables框:GroupAggregateVariables框:xFunction鈕:(Standarddeviation單選鈕:Continue鈕)Replaceworkingdatafile單選鈕:選中OK【SplitFile對話框】用于將數(shù)據(jù)文件分組進行處理,該對話框我們在第一章時已經(jīng)使用過了,這里再介紹一下各個對話框元素的用途:Analyzeallcases單選框:和下面的兩個單選框為一組,選中本框不拆分文件;Comparegroups單選框:按所選變量拆分文件,各組分析結(jié)果緊挨在一起便于相互比較;Organizeoutputbygroups單選框:按所選變量拆分文件,各組分析結(jié)果單獨放置;Groupsbasedon框:用于選擇拆分?jǐn)?shù)據(jù)文件的變量;Sortthefilebygroupingvariables單選框:將數(shù)據(jù)按所用的拆分變量排序;Fileisalreadysorted單選框:數(shù)據(jù)保持原狀,不按所用的拆分變量排序。【SelectCases對話框】很多時候我們不需要分析全部的數(shù)據(jù),而是按某種要求分析其中的一部分(比如只分析男性的身高、只對前200個數(shù)據(jù)進行分析以了解大概情況),這時使用SelectCases對話框可以大大簡化工作。該對話框界面如下所示:其中主要的對話框元素為:Allcases單選鈕:和下面的4個單選鈕為一組,選中它則分析所有的記錄;Ifconditionissatisfied單選鈕:只分析滿足條件的記錄;If按鈕:和If單選鈕一起使用,單擊后彈出If對話框;Randomsampleofcases單選鈕:從原數(shù)據(jù)中按某種條件抽樣;Sample按鈕:和Random單選鈕一起使用,可以設(shè)定按百分比抽取記錄,或者精確設(shè)定從前若干個記錄中抽取多少個記錄;Basedontimeorcaserange單選鈕:基于記錄序號來選擇記錄;Range按鈕:和Based單選鈕一起使用,用于輸入記錄序號范圍;Usefiltervariable單選鈕:使用篩選指示變量來選擇記錄,必需在下面選入一個篩選指示變量,該變量取值為非0的記錄將被選中,進入以后的分析;Filtered單選鈕:和下面的Deleted單選鈕為一組,表示未被選中的記錄只是被隔離,這些記錄的記錄號會被加上斜杠以示區(qū)別;Deleted單選鈕:未被選中的記錄將被刪除,一般不要使用。當(dāng)對數(shù)據(jù)集做出篩選后,所做的篩選將在以后的分析中一直有效,直到再次改變選擇條件為止。同時在多數(shù)情況下,系統(tǒng)會自動產(chǎn)生一個名為filter_$的篩選指示變量,被選中的記錄該變量取值為1,反之則為0?!網(wǎng)eightCases對話框】在默認(rèn)情況下,每一行就是一條記錄,這在多數(shù)情況下沒有什么問題,但有時卻非常麻煩,想想看如果你需要計算一個四格表卡方,有100例,如果每一行就是一條記錄,你就需要輸入100條記錄!如果希望在計算過程中利用不同的變量對數(shù)據(jù)進行加權(quán)處理,就需要用到WeightCases對話框。該對話框的使用極為簡單,界面上有兩個單選鈕,分別是不權(quán)重記錄和用某變量權(quán)重記錄,如果選擇后者,則需要選中一個權(quán)重變量。【Data菜單中的其余對話框】Definedates對話框:可以自動生成時間變量。InsertVariable命令:在當(dāng)前列插入新變量。Insertcases命令:在當(dāng)前行插入新記錄。Gotocases對話框:到達指定記錄號的記錄,該命令在記錄數(shù)極多時(1000條以上)非常有用。2.3.2
正交設(shè)計菜單項正交設(shè)計不包含在SPSS/BASE模塊中,因此由于解密范圍的問題,有的D版中不含該菜單項,不過我用的10.0版里是有的:)。以前我以為SPSS不能作正交設(shè)計,感謝網(wǎng)友edof@sh的提醒,經(jīng)研究,在SPSS中可以直接進行正交設(shè)計,OrthogonalDesign子菜單項就是專門用于完成該任務(wù)的,具體做法用下面的例子說明如下:例2.7做A、B兩個因素的正交設(shè)計,A因素有三個水平,B因素有兩個水平。解:選擇Data-->OrthogonalDesign-->generate,彈出的就是正交設(shè)計窗口,操作如下:Factorname框:輸入A;單擊ADD鈕;確定變量A被選中,單擊Definevalue鈕;
Value列:頭三行分別輸入1、2和3,代表變量A的三個水平;
單擊continue鈕;Factorname框:輸入B;單擊ADD鈕;確定變量B被選中,單擊Definevalue鈕;
Value列:頭兩行分別輸入1、2,代表變量B的兩個水平;
單擊continue鈕;單擊OK在第10步定義完后,對話框應(yīng)如下圖所示:在其他沒有用到的選擇項中,各種LABELS當(dāng)然適用于定義相應(yīng)的各種標(biāo)簽的;DataFiles單選框組用來定義產(chǎn)生的數(shù)據(jù)文件是存為制定的文件名,還是直接替換當(dāng)前工作文件;而DefineValue對話框中的Autofit框可以自動填充從1到你輸入的那個數(shù)值這么多個水平的定義,特別適合我這種懶人。這里我們直接替換當(dāng)前工作文件,在這個自動產(chǎn)生的正交設(shè)計數(shù)據(jù)集中,前兩個變量就是要分析的A和B,各個水平已經(jīng)按正交設(shè)計的要求排列好了。后面的status_和card_變量是系統(tǒng)產(chǎn)生的LOG變量,可以不管它?,F(xiàn)在你再建立一個結(jié)果變量,輸入實驗結(jié)果,就可以進行正交設(shè)計的分析了。第三章:程序編輯窗口用法詳解3.0.1程序編輯窗口界面3.0.2邂逅Paste按鈕3.0.3用程序編輯窗口加快我們的工作3.0.4用程序編輯窗口完成對話框無法完成的工作3.0.5再羅嗦幾句在某年某月的某一天,你和你的另一半正在街上為地球表面的平整而貢獻自己的綿薄之力。突然(也許是必然),你覺得有些餓了。這是一個問題,當(dāng)然,不用說大家也知道解決問題的方法就是--吃。不過就是吃也有講究,可以隨便找個面館簡單的填飽肚子;要求高的話還可以去幾星級的地方享受一下;當(dāng)然還有的人覺得自己回去做口味也合適,花費也不多;更有些超級美食家,星級水準(zhǔn)也不滿意,需要親自給一級廚師露一手,指點他們一下,才會吃的滿意。好,使用SPSS進行統(tǒng)計分析的方式就象上面填飽肚子的方法一樣有幾種選擇,如果你烹飪工夫還欠火候,或者習(xí)慣了享受星級服務(wù),那么直接使用SPSS為你提供的對話框進行操作就是了;而如果你習(xí)慣了DIY,甚或?qū)υ捒蛞矡o法滿足你的統(tǒng)計分析要求(別瞪眼,下面你就會看到了),就請你在本章學(xué)習(xí)一下如何寫SPSS程序吧。什么?SPSS還有程序?!是的,如果大家以前用過SPSS/PC+4.0,就一定不會對SPSS的程序感到陌生:在那個非常遙遠(yuǎn)的DOS時代(大約15年前),學(xué)習(xí)SPSS程序的語法,掌握如何編寫SPSS程序是熟練使用SPSS的必要條件(但還不充分)。隨著Windows旋風(fēng)的登陸,軟件的易操作性被推進到了前所未有的高度,而SPSS顯然是統(tǒng)計軟件中做的最成功的一個。他的操作界面是如此的成功,讓使用者可以完全無須了解SPSS的語法而使用其99%的功能,使得SPSS程序被人逐漸忘記。其實,適當(dāng)?shù)氖褂肧PSS程序可以大大提高我們的工作效率,并且SPSS在設(shè)計時也充分注意到了編程功能和使用界面的結(jié)合--還記得Paste按鈕嗎?下面我們就結(jié)合幾個實例來學(xué)習(xí)如何使用程序編輯窗口。請注意:我們不準(zhǔn)備教大家那些枯燥的SPSS語法,現(xiàn)在寫SPSS程序就象在WORD中記錄宏一樣簡單,所需要做的只是略加修改而已。3.0.1程序編輯窗口界面選擇菜單File==>new==>syntax,系統(tǒng)會開啟一個新的程序編輯窗口如下:Syntax從字面上應(yīng)該翻譯為句法、語法的意思,這里從實際用途出發(fā),翻譯為程序。和以前見過的數(shù)據(jù)管理窗口相比,這個窗口簡單的不能再簡單了。菜單項中的File、Edit、View、Analyze、Graphs等菜單都是通用的,唯一特殊的是Run菜單,該窗口的特殊功能均在這里實現(xiàn)。3.0.2邂逅Paste按鈕Paste按鈕在幾乎所有SPSS對話框中均存在,它是專門為編程準(zhǔn)備的。以第一章的那個t檢驗為例,如果最終選擇完畢后不單擊OK而是單擊Paste,則程序編輯窗中會自動生成以下語句:T-TESTGROUPS=group(12)/MISSING=ANALYSIS/VARIABLES=x/CRITERIA=CIN(.95).這就是你剛才想做的工作,如果運行它,就可以得到t檢驗的結(jié)果!怎么運行?選擇菜單Run==>all,看到了嗎?Paste按鈕如何能生成程序?在SPSS中,操作界面實際上起的就是“操作界面”的作用。當(dāng)你用對話框選定某項操作,單擊OK后,SPSS就將你的選擇翻譯成程序語句,然后提交系統(tǒng)執(zhí)行。如果你單擊Paste按鈕,SPSS就不將生成的程序語句提交執(zhí)行,而是傳送到程序編輯窗中供你折騰。說的再廣一些,不光SPSS,SAS等其他統(tǒng)計軟件也是這么做的。從上面的語句可以看到SPSS程序的基本結(jié)構(gòu):一條語句可占多行,最前面為語句主體,具體的選項用斜杠和語句主體相連,最后用小數(shù)點結(jié)束語句。3.0.3用程序編輯窗口加快我們的工作如果程序編輯窗口只能帶來“暫?!惫δ艿脑挘乙簿筒挥迷偻聦懥?。幸好,它的作用還遠(yuǎn)不止與此。當(dāng)需要成批次的處理數(shù)據(jù)時,當(dāng)你需要重復(fù)進行相同的統(tǒng)計分析時,當(dāng)你要做許多統(tǒng)計分析,每一步均費時較長而你又不想等時...,使用Paste按鈕是你的救命稻草。仍以第一章為例,如果從預(yù)分析一開始就連續(xù)使用Paste按鈕,則到分析結(jié)束我們會得到如下程序:DESCRIPTIVES
VARIABLES=x
/STATISTICS=MEANSTDDEVMINMAX.
SORTCASESBYgroup.
SPLITFILE
SEPARATEBYgroup.
DESCRIPTIVES
VARIABLES=x
/STATISTICS=MEANSTDDEVMINMAX.
GRAPH
/HISTOGRAM=x.
T-TEST
GROUPS=group(12)
/MISSING=ANALYSIS
/VARIABLES=x
/CRITERIA=CIN(.95).現(xiàn)在你可以再次啟用Run菜單來一次完成所需的統(tǒng)計分析。特別的,如果你的數(shù)據(jù)還會不斷添加(試驗尚未結(jié)束),就可以把該程序存為程序文件(*.sps),下次讀入新數(shù)據(jù)后再運行一次就可以直接得到新的結(jié)果。Run菜單幾個選項的含義分別為:ALL運行全部程序。SELECTION運行所選擇的程序語句。CURRENT運行當(dāng)前光標(biāo)所在行的語句。TOEND從當(dāng)前語句起一直運行到程序結(jié)束。3.0.4用程序編輯窗口完成對話框無法完成的工作如果程序編輯窗口的本事只限于上面介紹的這一點,那么在Windows時代,它仍然不配我來專門寫一章。還記得嗎?上面我提到用SPSS的圖形界面可以完成99%的工作,可有時候你偏偏需要用另外那1%的功能,請看下面的例子:例3.1請打開SPSS提供的cars.sav數(shù)據(jù),假設(shè)每條記錄代表一輛車,現(xiàn)在將按下列條件挑選一些車出來:Year<=76、Cylinder<=4、Weight>=3000,并且要看看每輛車符合了以上三條要求中的幾條。解:沒有什么難的,從第二章的知識我們了解到Count對話框就是做這類事情的,好,在Count對話框進行操作如下:Targetvariable框:鍵入G1(新變量名)Numericvariable框:選入Year單擊Definevalues鈕:Rangelowestthrough:鍵入76:單擊ADD鈕單擊Continue鈕Numericvariable框:選入cylinder單擊Definevalues鈕:Rangelowestthrough:鍵入4:單擊ADD鈕單擊Continue鈕Numericvariable框:選入Weight單擊Definevalues鈕Rangethroughhigest:鍵入3000:單擊ADD鈕單擊Continue鈕單擊OK好了,做完了--不過好象不大對勁呀!怎么前面做的條件選擇在后面定義的時候仍然出現(xiàn)?再看看結(jié)果,更不對了!看來有問題。毛病出在哪里呢?請再次開啟Count對話框,選擇好的條件仍然在里面,單擊Paste鈕,可以看到這些選擇產(chǎn)生的SPSS語句如下:COUNTG1=yearcylinderweight(Lowestthru76)yearcylinderweight(Lowestthru4)yearcylinderweight(3000thruHighest).EXECUTE.仔細(xì)看看,這個語句不對呀!明明Lowestthru76應(yīng)該是對變量Year的限制,怎么year、cylinder、weight這三個變量都在它前面?再看另兩個條件,一樣“大家有份”,這還了得,改!將語句改為正確的格式如
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2030年中國大數(shù)據(jù)行業(yè)應(yīng)用趨勢調(diào)查及投資規(guī)劃分析報告
- 2024-2030年中國固廢處理行業(yè)發(fā)展趨勢規(guī)劃研究報告
- 2024-2030年中國嘟米融資商業(yè)計劃書
- 2024年度環(huán)保產(chǎn)業(yè)融資合同書a正規(guī)范文本2篇
- 眉山藥科職業(yè)學(xué)院《蒙臺梭利教育與實踐》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年度乒乓球國家隊教練團隊聘請合同3篇
- 2024年新編小額短期借款協(xié)議電子版一
- 2024年版樁基工程承包標(biāo)準(zhǔn)協(xié)議模板版B版
- 2024年度家政服務(wù)標(biāo)準(zhǔn)協(xié)議版A版
- 2024年小學(xué)三年級數(shù)學(xué)(北京版)-連乘問題第二課時-3學(xué)習(xí)任務(wù)單
- 2023年全國碩士研究生入學(xué)統(tǒng)一考試MPA綜合真題及參考答案
- 冶金行業(yè)特殊工種有哪些崗位
- 第六單元名著導(dǎo)讀《西游記》孫悟空的成長之路 統(tǒng)編版語文七年級上冊
- 分布式光伏發(fā)電項目投標(biāo)技術(shù)方案(純方案)
- 修井作業(yè)安全操作規(guī)程
- 外傷性白內(nèi)障
- 勞動教育課學(xué)習(xí)通課后章節(jié)答案期末考試題庫2023年
- 初中部綜合素質(zhì)評價實施方案范本(三篇)
- 防洪排澇綜合整治工程監(jiān)理細(xì)則
- 電氣自動化技術(shù)專業(yè)群行業(yè)產(chǎn)業(yè)現(xiàn)狀及發(fā)展趨勢分析報告
- 2023年外交學(xué)院招考聘用筆試題庫含答案解析
評論
0/150
提交評論