




免費(fèi)預(yù)覽已結(jié)束,剩余21頁可下載查看
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
北京大學(xué)社會學(xué)系 數(shù)據(jù)分析課程講義 劉愛玉 2004年SPSS數(shù)據(jù)分析技術(shù)課程提綱教材:自編講義 阮桂海主編, 2000,SPSS實(shí)用教程電子工業(yè)出版社課程內(nèi)容第一講 SPSS基本知識及數(shù)據(jù)錄入一概述二SPSS的基本模塊三SPSS的基本窗口四SPSS文件類型五問卷及編碼六什么是數(shù)據(jù)七數(shù)據(jù)錄入問卷資料轉(zhuǎn)變?yōu)樵紨?shù)據(jù)文件(一)WORD中錄入(二)在 EXCEL中錄入數(shù)據(jù)(三)在SPSS中錄入(四)Epidat錄入(六)數(shù)據(jù)文件的編輯與管理第二講 SPSS命令文件的編寫 一 SPSS的命令文件(一)Data list(二)Variable label的命令格式(三)value label的命令格式 (四)程序中的缺少值(Missing Value命令) 第三講 用Frequencies做數(shù)據(jù)匯總一. 數(shù)據(jù)匯總使用的數(shù)據(jù)類型二頻次統(tǒng)計(jì)及統(tǒng)計(jì)量的計(jì)算(一)Statistics統(tǒng)計(jì)量(二)畫圖第四講 描述性統(tǒng)計(jì)(Descriptives與Explore的應(yīng)用)一Descriptives(一)應(yīng)用實(shí)例(二)統(tǒng)計(jì)量分析二Explore分析第五講 數(shù)據(jù)變換一Recode 命令對數(shù)據(jù)重新編碼二用Compute命令創(chuàng)建新變量三COUNT命令四用If命令做條件變換和邏輯校第六講 交叉匯總與關(guān)聯(lián)分析(Crosstabs的應(yīng)用)一 交叉匯總表的一般形式及其特點(diǎn)二 交互表的檢驗(yàn)兩個(gè)變量之間是否相關(guān)三 兩個(gè)變量之間相關(guān)的強(qiáng)度(一)定類定類(二)定序定序(三)定類定距(四)定距定距四運(yùn)用CRPSSTABS做交互表及對變量之間的關(guān)系進(jìn)行測量第七講 引進(jìn)其他變量后的交互分析一 因果分析explanation model二 闡明分析Interpretation analysis三 條件分析 conditional analysis 第八講 描述子總體均值的差異(Means過程的應(yīng)用)一Means過程運(yùn)行二One Sample T-Test第九講 均值比較分析(TTest過程)一獨(dú)立樣本T檢驗(yàn)二成對樣本T-TEST三注意事項(xiàng) 第十講 方差分析ANOVA一 實(shí)例二 解釋第十一講 相關(guān)分析(Correlate過程分析)一Bivariate Correlate二Partial correlation偏相關(guān)(也叫凈相關(guān))三距離分析(Distance)第十二講 簡單線性相關(guān)(一元線性回歸分析)一回歸分析對變量的要求(假設(shè)條件)二一元線性回歸模型及其含義三在對話框中做一元線性回歸模型第十三講 SPSS統(tǒng)計(jì)圖形一Bar條形圖二Line線圖年齡與收入三Area面積圖四 Pie餅圖五 High-LOW 高低圖六Pareto 帕雷托圖七Control 控制圖八Boxplot 箱圖九Error Bar 誤差條圖十Scatter 散點(diǎn)圖十一.Histogram 直方圖十二P-P:P-P 概率圖十三Q-Q:Q-Q 概率圖十四Sequence 序列圖十五Time Series 時(shí)間序列圖第十四講 非參數(shù)檢驗(yàn)SPSS數(shù)據(jù)分析技術(shù)第一講 SPSS基本知識及數(shù)據(jù)錄入一概述SPSS(statistical package for the social science)是美國SPSS公司開發(fā)的社會科學(xué)統(tǒng)計(jì)軟件,SPSS最初的幾個(gè)版本都是在DOS系統(tǒng)下運(yùn)行,雖然功能比較強(qiáng),但在用戶界面、輸入、輸出環(huán)境等方面并不十分理想。80年代末,Microsoft推出Windows后,SPSS迅速向Windows移植。90年代以來,由于MS Windows的普及,SPSS公司于1992、1993、1994年相繼推出了在Windows操作系統(tǒng)下的5.0, 6.0 6.1版本,隨著Windows95與WindowsNT3.5以上版本的32位操作系統(tǒng)的出現(xiàn),1997年以來又相繼推出了8.0,9.0,10.0及11.5版本。11.5版本的界面與10.0版本相比沒有什么變化,只是增加了一些統(tǒng)計(jì)功能和方法。與其他版本相比,11.5版本的用戶界面更為友好,使用更加方便,統(tǒng)計(jì)功能更為強(qiáng)大。它的基本特點(diǎn)有四個(gè):1大多數(shù)操作是通過菜單、圖表按鈕、對話框完成,操作簡單方便;2命令語句、子命令、選擇項(xiàng)大部分通過對話框來進(jìn)行,無需記憶大量的命令、過程與選擇項(xiàng);3可以與其他數(shù)據(jù)轉(zhuǎn)換接口,其他軟件生成的數(shù)據(jù),可以轉(zhuǎn)化為SPSS數(shù)據(jù)4與其他Windows兼容,輸出結(jié)果可以復(fù)制到WORD,以便進(jìn)一步編輯。二SPSS的啟動及基本模塊 BSPSS 11.0版一共由十個(gè)模塊組成 SPSS BaseAdvanced Models Regression Models Tables Trends Categories Conjoint Exact Tests Missing Value Analysis Maps三 SPSS的基本窗口(一)打開SPSS(二)基本窗口Data EditorFile 文件管理菜單,完成對數(shù)據(jù)文件的建立、讀取、存儲、打印等操作。Edit 文件編輯菜單,完成對數(shù)據(jù)文件的重新編輯、檢索、拷貝、剪貼與替換等操作。View 瀏覽編輯,完成文本或數(shù)據(jù)內(nèi)容的狀態(tài)欄、工具欄、字體、網(wǎng)格線以及數(shù)值標(biāo)簽等功能的操作。Data 數(shù)據(jù)管理,數(shù)據(jù)的選擇、排序菜單,包括對數(shù)據(jù)行的增加、合并、變量值的選擇等Transform 數(shù)據(jù)變換菜單,創(chuàng)建新變量、重新編碼、計(jì)算同值的次數(shù)等。Analyze 統(tǒng)計(jì)過程菜單,完成各種統(tǒng)計(jì)分析。Graphs 統(tǒng)計(jì)圖表,完成統(tǒng)計(jì)圖表的建立與編輯Utilities 實(shí)用程序,有關(guān)命令解釋、字體選擇、文件信息、定義輸出標(biāo)題和窗口設(shè)計(jì)等。Windows 窗口控制,可進(jìn)行窗口的排列、選擇和顯示操作Help 幫助文件, 幫助文件的調(diào)用、選擇和顯示等操作。(三)SPSS的其他窗口在SPSS的主窗口中還有兩個(gè)窗口,一個(gè)是數(shù)據(jù)管理窗口,其標(biāo)題名稱是“Newdata”,且默認(rèn)為激活狀態(tài)。數(shù)據(jù)管理器是一種典型的電子表格形式,用戶可通過定義變量名、格式化數(shù)據(jù)類型后輸入原始數(shù)值,并可根據(jù)需要對數(shù)據(jù)進(jìn)行增刪、剪貼、修改、存儲等操作。另一個(gè)是結(jié)果輸出窗口,標(biāo)題名稱是“!Output1”,啟動時(shí)為非活動窗口,只有當(dāng)完成一項(xiàng)處理后,才在該窗口顯示處理過程提示和計(jì)算結(jié)果。當(dāng)進(jìn)行某項(xiàng)具體的統(tǒng)計(jì)方法操作時(shí),可點(diǎn)擊對話框的“Paste”鈕激活命令編輯窗口,其標(biāo)題名稱是“!Syntax1”,或選Window菜單的!Syntax1項(xiàng)也可激活命令編輯窗口。用戶可利用該窗口進(jìn)行SPSS命令的輸入、編輯和運(yùn)行,這對熟悉DOS版本的SPSS用戶是十分方便的。上述三個(gè)窗口在實(shí)際操作時(shí),經(jīng)常因?yàn)閮?nèi)容很多,一個(gè)窗口中無法看到全部內(nèi)容。有兩種方法可幫助用戶看到全部內(nèi)容:1、使用窗口的滾動條 每個(gè)窗口的右側(cè)有一個(gè)垂直滾動條,用鼠標(biāo)點(diǎn)擊滾動條上下兩頭的箭號鈕或用鼠標(biāo)按住滾動條中的方塊上下拖動,可使窗口中的內(nèi)容前后翻滾;底邊有一個(gè)水平滾動條,用鼠標(biāo)點(diǎn)擊滾動條左右兩頭的箭號鈕或用鼠標(biāo)按住滾動條中的方塊左右拖動,可使窗口中的內(nèi)容左右移動。如此,用戶便可看清所有內(nèi)容。2、改變窗口的大小 一般情況下,鼠標(biāo)指針是一個(gè)朝左上方的箭頭,當(dāng)把鼠標(biāo)指針指向窗口邊界時(shí),鼠標(biāo)指針變成雙向箭頭形。這時(shí),若按住鼠標(biāo)左鍵移動,可改變窗口的大小,同樣可看清窗口內(nèi)容。SPSS的退出完成SPSS的統(tǒng)計(jì)分析后,退出該系統(tǒng)的方法是:選File菜單的Exit項(xiàng),回答系統(tǒng)提出的有關(guān)是否需要存儲原始數(shù)據(jù)、計(jì)算結(jié)果和SPSS命令之后,即退到Windows的程序管理器中。SPSS的求助系統(tǒng)SPSS提供了豐富且詳盡的在線幫助。主要有下列幾種方式:1、主窗口的Help菜單:在軟件運(yùn)行的任何時(shí)候,點(diǎn)擊Help菜單選相關(guān)的子菜單,可得到所需的各種幫助。2、主窗口的Utilities菜單:在Utilities菜單中,有Command index.子菜單,它提供有關(guān)SPSS各項(xiàng)統(tǒng)計(jì)分析技術(shù)能解決什么問題的信息。3、各種對話框中的Help鈕:在具體操作過程中,當(dāng)彈出某一對話框時(shí),一般總有Help鈕,點(diǎn)擊該鈕,用戶可得到這一對話框選項(xiàng)內(nèi)容的詳細(xì)幫助。4、結(jié)果輸出窗口中的Grossary鈕:當(dāng)用戶在瀏覽計(jì)算結(jié)果時(shí),可點(diǎn)擊結(jié)果輸出窗的Grossary鈕,它顯示各種專用統(tǒng)計(jì)術(shù)語的解釋信息以便用戶理解。5、命令編輯窗口中的Syntax鈕:激活命令編輯窗,可見一Syntax鈕,點(diǎn)擊該鈕,可得到與用戶正在編輯的命令相關(guān)的命令語法提示。四SPSS文件類型1原始數(shù)據(jù)文件及其類型*. Dat(原來還有ASCII碼)生成方法DOS中的EDITWORD中的TXTEXCEL中的XLSDBASE中的DBF以上形式的數(shù)據(jù)文件在SPSS中可以直接調(diào)用打開一個(gè)已有的數(shù)據(jù)文件的方式如下:2數(shù)據(jù)文件*SAV *SAS(原來)數(shù)據(jù)文件可以根據(jù)原始數(shù)據(jù)的轉(zhuǎn)換獲得3圖形文件 *CHT4命令文件 *SPS5結(jié)果文件 *SPO(OUTPUT, 原來是LST)五問卷及編碼1 多選擇題的處理(0,1編碼)2 多位題(要補(bǔ)位)3 缺失值,以9結(jié)尾,如年齡,編碼為99,如答案正好是9,以0替補(bǔ)4 不適用,以8結(jié)尾,8,98,998,如答案正好是8,以0替補(bǔ)。如有四個(gè)可選項(xiàng)的多選題而不適用,則為8888。六什么是數(shù)據(jù)數(shù)據(jù)是一個(gè)矩陣,行是一個(gè)case在多維空間下的位置,列是不同空間的維度用來分析用行收集到的資料。數(shù)據(jù)分析:用微觀的方法分析宏觀的資料,分析平均人、平均的體系;這個(gè)分析都是在平均的基礎(chǔ)上,這種推斷是不能還原到個(gè)案的,分析的過程是不斷拋棄個(gè)人影響的過程。數(shù)據(jù)的計(jì)算機(jī)表示法:變量-問卷中的每一個(gè)問題, 在dBASE中稱為字段(Field) 變量名-變量名以字母為首,后面跟A-Z, 0-9字符(字符8個(gè)字符), 變量名不能帶擴(kuò)展名,如 A11。 變量值-變量的答案七數(shù)據(jù)錄入問卷資料轉(zhuǎn)變?yōu)樵紨?shù)據(jù)文件(一) WORD中錄入,存成TXT1方法:打開WORD文檔,錄入數(shù)據(jù)固定格式:這種數(shù)據(jù)要根據(jù)已經(jīng)確定的欄目位置對號入座地錄入數(shù)據(jù),在對問卷進(jìn)行編碼時(shí),指定了各個(gè)項(xiàng)目的數(shù)值與欄位(書P10),給數(shù)據(jù)指定欄目位置時(shí),前后數(shù)據(jù)一般不留空格,這樣可以提高數(shù)據(jù)錄入的速度,缺點(diǎn)是前后的數(shù)據(jù)不太容易區(qū)分。如:欄位(列號)1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 0 0 0 0 1 2 2 6 1 5 0 00 0 0 0 2 2 3 1 4 0 0 自由格式P22:按照問卷編碼方案將某個(gè)個(gè)案數(shù)據(jù)直接錄入,中間可以沒有任何空格和其他符號,也可以在輸入時(shí)在不同的變量之間以空擋、逗號、分號等把變量分開,不同個(gè)案之間的數(shù)據(jù)要對齊,數(shù)據(jù)錄入完成以后,存成*TXT文件2把 TXT文件轉(zhuǎn)變?yōu)?SAV文件SPSSFile-Read Text Data-點(diǎn)選*TXT-對話框(六步),即Text Import Wizard-Fixed wide-No-下一步-The first case begins on which line-劃線即可-下一步完成SPSSFile-Read Text Data-點(diǎn)選*TXT-對話框(六步),即Text Import Wizard-Delimite-下一步-SPACE-下一步-完成如果特殊數(shù)據(jù)、負(fù)數(shù)、小數(shù)點(diǎn)多時(shí),則不用這種方法,可以用EXCEL錄入。(二) 在 EXCEL中錄入數(shù)據(jù)打開EXCEL表不用補(bǔ)0,可以錄入漢字,速度較慢,一般在小樣本時(shí)用比較好。第一行錄入變量,第二行開始錄入數(shù)據(jù)文件保存類型:*XLS(工作簿BOOK)轉(zhuǎn)變?yōu)闉?SAV文件:SPSS-File-Open-Data-點(diǎn)選文件類型*XLS-點(diǎn)選BOOK-OK-存成SPSS的*SAV文件即可用EXCEL錄入的優(yōu)點(diǎn):1可以進(jìn)行各種計(jì)算,如數(shù)學(xué)與三角函數(shù)2可以進(jìn)行位置計(jì)算,還可以直接COPY3可以用EXCEL做輔助分析,進(jìn)行數(shù)據(jù)變換4可以作表,非常方便(三)在SPSS中錄入 直接在SPSS WIN中錄入數(shù)據(jù)方法:SPSSFILENEW DATA點(diǎn)選Data View(數(shù)據(jù)瀏覽界面)錄入數(shù)據(jù)存成*SAV,適合于較小的樣本在Data View(數(shù)據(jù)瀏覽界面)中錄入的數(shù)據(jù)還沒有在各個(gè)數(shù)據(jù)之間區(qū)分意義,可以在Variable View(變量瀏覽界面)中對錄入數(shù)據(jù)的意義進(jìn)行界定,這個(gè)工作也可以在問卷數(shù)據(jù)錄入前做,也可以在數(shù)據(jù)錄入后做。點(diǎn)擊Variable View(變量瀏覽界面),對變量進(jìn)行定義。定義變量有10種功能選項(xiàng),1Name: 變量欄名,在這個(gè)欄目中輸入變量名,如 V1、V2、 age sex 或其他名稱。定義變量名注意:A變量名以字母為首,后面跟A-Z, 0-9字符(字符8個(gè)字符), ? ! / 等不能作為變量名, 變量名也不能帶擴(kuò)展名,如 A11。B有些關(guān)鍵詞不能作為變量的名字,如 AND OR NOT EQ LT LE GT GE NE NE TO BYcrosstabs WITH ALL THRU P-Percentage SPSS中不區(qū)別大小寫字符 可以用中文做變量名,但最好不用,因?yàn)樯婕耙粋€(gè)兼容性問題。2Type:變量類型, 有8種類型可供選擇Numeric:數(shù)值型變量,系統(tǒng)默認(rèn)值為數(shù)值型,系統(tǒng)默認(rèn)長度為8,小數(shù)位數(shù)為2Comma:帶逗號的數(shù)值型變量,即整數(shù)部分每3位數(shù)加一逗號,其余定義方式同數(shù)值型。輸入:1,287,300,顯示:1,287,300Dot:帶圓點(diǎn)的數(shù)值型變量,3位加點(diǎn)數(shù)值型,無論數(shù)值大小,均以整數(shù)形式顯示,每3位加一小點(diǎn)(但不是小數(shù)點(diǎn)),可定義小數(shù)位置,但都顯示0,且小數(shù)點(diǎn)用逗號表示。如1.2345顯示為 12.345,00(實(shí)際是12345E-4). Scientific notion:科學(xué)記數(shù)法 輸入:253.7E2,輸出:253.7E2Date:日期型變量,有27種表示方法。點(diǎn)date即可以看到Dollar:貨幣型變量,有12種表示方法Custom currency: 自定義型變量,是一種用戶利用Edit 菜單的Options功能定義的。String:字符型變量一般最常用的是數(shù)字型變量與字符型變量。日期型變量格式:ddmmmyyyy 日日-月月月-年年年年mm/dd/yyyy 月月/日日/年年年年qQyyyy 季度Q年年年年mMmyy 月份年年 wWWKyy 周數(shù)WK年年hh:mm:ss 時(shí)時(shí)分分秒秒SPSS中存儲的實(shí)際上是該時(shí)間與1582年10月14日零點(diǎn)相差的秒數(shù),如1582年10月15日存儲的就是60602486400,在我們把變量類型變換為數(shù)值型時(shí)可以看到這種數(shù)字。如定date的類型為mm/dd/yyyy,輸入10/15/1582, 當(dāng)我們把日期型數(shù)據(jù)轉(zhuǎn)變?yōu)閿?shù)值型數(shù)據(jù)時(shí),看到數(shù)據(jù)變?yōu)?6400。貨幣型變量格式格式總長度小數(shù)位數(shù)$# 20$# #30$# # #40$# # # #72$# ,# # #60$# , # # # # #90$# # #,# # #,# # #,# # #160$# # #,# # #,# # #,# # # # #192要求:能夠辨別數(shù)值型、字符型與日期型變量就可以。3width:寬度,指的是運(yùn)算寬度,默認(rèn)值為8,運(yùn)算寬度實(shí)際上只會改變輸出結(jié)果的顯示寬度,數(shù)據(jù)的存儲結(jié)果與運(yùn)算的精度不受寬度的影響。4Decimals:小數(shù)位數(shù),根據(jù)每個(gè)變量數(shù)據(jù)的大小,定義小數(shù)的位數(shù)5Label :變量標(biāo)簽, 給相應(yīng)的變量以文字說明6values:數(shù)值標(biāo)簽, value 1value 男add最后點(diǎn)OK7missing values缺失值,有三種選項(xiàng)No missing values 沒有缺失值Discrete missing values 定義13個(gè)單一數(shù)為缺失值Range plus optional discrete values 定義指定范圍為缺失值,同時(shí)指定另外一個(gè)不在這一范圍內(nèi)的單一數(shù)為缺失值缺失值的意義是指某一項(xiàng)值數(shù)值缺失,軟件在進(jìn)行統(tǒng)計(jì)時(shí)不將其考慮進(jìn)去。用戶自己把特定的數(shù)據(jù)界定為缺失值,則為用戶缺失值user-missing. 如可以把把被調(diào)查者拒絕回答或者問題不合適而沒有回答的情況界定為用戶缺失值9 系統(tǒng)缺失值 system missing主要是指計(jì)算機(jī)默認(rèn)的缺失方式,如果在錄入數(shù)據(jù)時(shí)空缺了某些數(shù)據(jù),計(jì)算機(jī)就把其界定為缺失值,這是的數(shù)據(jù)標(biāo)記為 ,而用戶界定的缺失值則不會在數(shù)據(jù)顯示時(shí)出現(xiàn) 。8columns:定義數(shù)據(jù)管理器縱列的長度9字符排列方向:有三種選擇left左對齊right 右對齊center 居中10 measure:數(shù)據(jù)量度選擇,有三種:scale 連續(xù)型變量,是測量的最高層次。ordinal 定序型變量Nominal 定類型變量將變量定義完畢,點(diǎn)擊數(shù)據(jù)編輯窗口,定義的變量會自動地出現(xiàn)在窗口中。如何定義,進(jìn)行操作演示數(shù)據(jù)錄入和變量定義完畢,可以將其存成*sav文件,然后就可以用這些數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析(四)Epidat錄入http:/101/php/index.phphttp:/www.epidata.dk下載軟件Epidat建立數(shù)據(jù)描述文件建立數(shù)據(jù)文件數(shù)據(jù)錄入數(shù)據(jù)輸出*qes *rec dbase; excel;txt;data屏幕設(shè)計(jì) 邏輯校驗(yàn)*chk 1 打開Epidat1Define data點(diǎn)選new qes file建立一個(gè)空的untitled1文件,qes是qustionaire的縮寫2把空文件untitled1文件存成一個(gè)你想要的文件名(如存成first.qes)方法:file菜單 save as 出來一個(gè)對話框把untitled1改成 first.qes3在空白的EpiEditor中錄入相當(dāng)于變量名、變量標(biāo)簽、變量值的界定錄入原則:A 必須有一個(gè)變量的名字,如V1, Sex, occupation等B 對變量進(jìn)行描述,如V1 “個(gè)案號” “出生年月”等C 對變量錄入的定義說明:Shift +#號鍵變量有幾個(gè)碼,就打幾個(gè)#鍵V1 sex# 1:M 2:F V2 Income #4錄入完成以后存盤。File-save as -first.qes或Ctrl+S5看一下錄入變量的格式找preview the dataform(左邊工具欄第三個(gè)), 或按一下Ctral + T鍵。在屏幕上你可以看到變量的格式,這相當(dāng)于預(yù)覽,在里面的空白處錄入東西沒有用。2 Make datafileMake datafileMake datafile默認(rèn) Enter name of qes Enter name of datafile(當(dāng)然也可以改成自己喜歡的路徑,但qes 與rec不能改)點(diǎn)OK生成firstrec文件firstqes是數(shù)據(jù)描述文件,firstrec為建立了數(shù)據(jù)文件rec為record 的縮寫3Add Checks經(jīng)常出現(xiàn)Checks無法進(jìn)入,碰到這種情況,點(diǎn)FileClose all, 把所有打開的文檔關(guān)閉即可)對錄入數(shù)據(jù)的方式進(jìn)行某種專門的規(guī)定,如果沒有可修改的,則直接錄入數(shù)據(jù)修改檢查A Value label賦值(sex income等)B Range/legal規(guī)定變量值的范圍(10-80,99)C Jumps跳答1write 如果是回答1的 ,跳到職業(yè)(S2):錄入1S2D Must enter一定要錄入某個(gè)值(yes )E RepeatNo 一般選擇NO,把以前錄入的某個(gè)值在出現(xiàn)類似情況時(shí)進(jìn)行復(fù)制。修改完成以后或邏輯校驗(yàn)完成以后的數(shù)據(jù)存成fiestchk4Enter Data對話框找firstrec錄入完畢點(diǎn)File-close form5 Document6 Export data存成SPSS等7 打開SPSS- File-open-syntax-first.sps-select all-點(diǎn)黑-RUN(運(yùn)行)點(diǎn)數(shù)據(jù)窗口-可以看到已經(jīng)轉(zhuǎn)換好的數(shù)據(jù)FILE-SAVE AS 存成SPSS的SAV文件。(五)數(shù)據(jù)文件的編輯與管理數(shù)據(jù)錄入完成以后,對數(shù)據(jù)進(jìn)行編輯與管理非常重要,這可以為分析打下基礎(chǔ)。編輯與管理主要的操作有:1.增加新的變量(Insert Variable)激活待增加新變量區(qū)的那個(gè)變量, Data-Insert Variable,系統(tǒng)會自動為用戶插入一個(gè)新的變量var00001,用戶可以根據(jù)需要對其進(jìn)行定義并錄入數(shù)據(jù)。2.增加新的個(gè)案(Insert case)如果要在第29個(gè)個(gè)案之前增加一個(gè)新的個(gè)案,可先激活第29個(gè)個(gè)案的任一單元格,然后點(diǎn)擊Data菜單中的Insert case, 系統(tǒng)會自動為用戶增加一個(gè)新的觀察行,默認(rèn)為第29個(gè)個(gè)案,原來的第29個(gè)個(gè)案觀察值變?yōu)榈?0個(gè)觀察值,然后可以錄入數(shù)據(jù)。2.刪除一個(gè)變量列(Delete Variable)點(diǎn)選要刪除的列,點(diǎn)Edit菜單中的CUT或按Delete鍵3.刪除一個(gè)個(gè)案(delete case)點(diǎn)選要刪除的那個(gè)個(gè)案,點(diǎn)Edit菜單中的CUT或按Delete鍵4.查找個(gè)案(Go To Case)如果數(shù)據(jù)量很答,查找某一個(gè)觀察值就很有必要,如果想查找第10個(gè)觀察值,則點(diǎn)擊Data中的Go To Case, 出現(xiàn)對話框 case number 10-OK即可5.數(shù)據(jù)的排序(Sort Case)Ascending 升排序Descending 降排序可以對某一個(gè)變量為基準(zhǔn)進(jìn)行排序5. 數(shù)據(jù)的行列對換(Transpose) 點(diǎn)擊Data菜單中Transpose,出現(xiàn)對話框 對話框左側(cè)是需要轉(zhuǎn)換的變量,全部點(diǎn)擊進(jìn)入對話框右側(cè)OK 轉(zhuǎn)換后的數(shù)據(jù)行列的位置發(fā)生了改變6.數(shù)據(jù)文件的拆分(Split File)在進(jìn)行數(shù)據(jù)處理時(shí)經(jīng)常要對文件中的觀察值進(jìn)行分組分析,如要求求出不同性別人員的平均收入,但是男女的收入數(shù)據(jù)是在一個(gè)數(shù)據(jù)文件中,在進(jìn)行分析以前,可以對數(shù)據(jù)進(jìn)行拆分,這里的拆分不是將一個(gè)數(shù)據(jù)分成兩個(gè)文件,而是進(jìn)行按性別變量為基礎(chǔ)的排序,創(chuàng)造對男女收入數(shù)據(jù)進(jìn)行分別分析的條件。 點(diǎn)擊Data菜單中的Split File,打開Split File對話框, 為了獲得對不同組別觀察值的各自分析,選擇Compare Groups選項(xiàng),系統(tǒng)默認(rèn)的是對數(shù)據(jù)文件中所有的觀察值進(jìn)行分析,選擇性別進(jìn)入Groups Based On對話框,指以性別作為分組的依據(jù)。在Groups Based On對話框下有兩個(gè)選項(xiàng): File is already sorted指數(shù)據(jù)文件已經(jīng)按照選擇的變量排序;Sort the file by grouping variables是指要求按照所選擇的變量對數(shù)據(jù)文件進(jìn)行排序,在本例選擇這一項(xiàng)。 然后點(diǎn)擊OK,即可完成對數(shù)據(jù)文件的拆分。7.數(shù)據(jù)文件的合并(Merge Files)合并數(shù)據(jù)文件包括兩種方式:一種是從外部數(shù)據(jù)文件中增加觀察量到當(dāng)前數(shù)據(jù)文件中add cases; 另一種是從外部數(shù)據(jù)文件中增加變量到當(dāng)前數(shù)據(jù)文件add variables. 將liu1sav的個(gè)案添加到liusavadd cases: 點(diǎn)擊Data-Merge File-add cases-彈出Add Cases: Read File對話框打開liu1sav彈出對話框Add Cases From D:liu1.sav對話框左側(cè)為不能匹配的變量,右側(cè)是可以匹配的變量,如果在合并時(shí)出現(xiàn)兩個(gè)數(shù)據(jù)文件的變量不能匹配的情況,就一定要對變量進(jìn)行處理,使其能夠完全匹配,然后再進(jìn)行合并。add variables:要將liu2sav中的變量橫向合并到liusav中去,以某個(gè)變量為基點(diǎn)將同源的兩部分?jǐn)?shù)據(jù)連接在一起,一般是用ID或身份記號, * 原文件中的變量; +新文件中的變量。8 數(shù)據(jù)文件的分類匯總(Aggregate)9 對數(shù)據(jù)進(jìn)行分類匯總就是按照指定的分類變量值對觀察值進(jìn)行分組,對每組觀察量的各個(gè)變量求描述統(tǒng)計(jì),生成新的數(shù)據(jù)文件,在新數(shù)據(jù)文件中對應(yīng)分類變量的每一個(gè)值產(chǎn)生一個(gè)觀察量。如在liusav中要對30個(gè)人的身高、體重按照年齡、性別進(jìn)行分類匯總,求平均值。具體操作為:Data-Aggregate-彈出Aggregate對話框?qū)⑿詣e、年齡變量選入Break Variables框中,表示要以年齡、性別作為分組變量在Aggregate Variables框選入身高、體重,表示要將身高、體重進(jìn)行匯總。系統(tǒng)會默認(rèn)新的變量名,但是我們可以根據(jù)自己的需要對變量名進(jìn)行變換。用Aggregate換可以進(jìn)行其他很多計(jì)算,如 means of values:求平均值Standard deviation 標(biāo)準(zhǔn)差First value 只保留該組的第一個(gè)數(shù)值Minimum value 只保留該組的最小值Last Value 只保留該組的最后一個(gè)數(shù)值Maximum value 只保留該組的最大值Number of cases 合計(jì)該組的觀察數(shù)值Sum of values 求和Percentage above 先確定一個(gè)數(shù)值,求大于該數(shù)值的所有個(gè)案占總個(gè)案的百分比(%)Percentage below 先確定一個(gè)數(shù)值,求小于該數(shù)值的所有個(gè)案占總個(gè)案的百分比Fraction above 先確定一個(gè)數(shù)值,求大于該數(shù)值的所有個(gè)案占總個(gè)案的比例(0-1)Fraction below 先確定一個(gè)數(shù)值,求小于該數(shù)值的所有個(gè)案占總個(gè)案的比例(0-1)Percentage inside 先確定一個(gè)下限,再確定一個(gè)上限,求在該區(qū)間內(nèi)個(gè)案占總個(gè)案的百分比(0-100%)Percentage outside先確定一個(gè)下限,再確定一個(gè)上限,求在該區(qū)間之外個(gè)案占總個(gè)案的百分比(0-100%)Fraction inside 先確定一個(gè)下限,再確定一個(gè)上限,求在該區(qū)間內(nèi)個(gè)案占總個(gè)案的比例(0-1)Fraction outside 先確定一個(gè)下限,再確定一個(gè)上限,求在該區(qū)間內(nèi)個(gè)案占總個(gè)案的比例(0-1)Aggregate命令非常有用,如我們?nèi)霊粽{(diào)查得到了一家人所有的資料,包括編號、年齡、收入。根據(jù)這些資料,我們可以計(jì)算家庭負(fù)擔(dān)系數(shù),即大于60歲和小于18歲的人口占家庭總?cè)丝诘谋壤?。DATA-Aggregate-age-per-outside Low 18 High 59-continue-新生成的變量即為家庭負(fù)擔(dān)系數(shù)還可以算年齡均值、人均月收入。選擇-percentage, value-1家庭人口數(shù)-INC-number of cases家庭總收入-INC- number of cases然后把這些新得到的變量存成默認(rèn)值或者是你希望的文件,然后你可以看一下生成的到底是什么變量。 File -open-找文件-新生成的變量與一般調(diào)查得到的變量是一致的,因此可以進(jìn)行匹配,這個(gè)時(shí)候可以用Merge命令9數(shù)據(jù)的選擇( S
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 酒店中餐擺臺培訓(xùn)
- 重卡銷售培訓(xùn)
- 痛風(fēng)病人飲食護(hù)理
- 職業(yè)安全健康管理
- 財(cái)會合規(guī)培訓(xùn)
- 腫瘤護(hù)理專家共識
- 銷售業(yè)績分解培訓(xùn)
- 加油站全流程診斷體系構(gòu)建
- 稽核監(jiān)察財(cái)務(wù)培訓(xùn)
- 互聯(lián)網(wǎng)+教育精準(zhǔn)扶貧:2025年實(shí)踐案例分析報(bào)告
- 2025年食品安全管理員考試試題及答案
- 2025-2030骨科植入器材產(chǎn)業(yè)市場深度分析及發(fā)展趨勢與投資戰(zhàn)略研究報(bào)告
- T/SHPTA 071.1-2023高壓電纜附件用橡膠材料第1部分:絕緣橡膠材料
- 湖北省浠水縣聯(lián)考2025年七下數(shù)學(xué)期末質(zhì)量檢測試題含解析
- 生產(chǎn)基層管理培訓(xùn)課程
- 2025年春季《中華民族共同體概論》第一次平時(shí)作業(yè)-國開(XJ)-參考資料
- 聯(lián)想電腦展廳設(shè)計(jì)方案
- 保安考試試題及答案
- Arduino智能小車避障系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
- 2025-2030中國高純氧市場競爭態(tài)勢與未來營銷戰(zhàn)略分析研究報(bào)告
- 國開電大軟件工程形考作業(yè)3參考答案 (一)
評論
0/150
提交評論