SPSS基礎(chǔ)教程講解

上傳人：建*** IP屬地：上海上傳時間：2022-01-31 格式：DOCX 頁數(shù)：15 大?。?5.42KB 積分：20 舉報 版權(quán)申訴

已閱讀5頁，還剩10頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、SPSS基礎(chǔ)目錄第一章 SPSS簡介1.1 SPSS概述1.2 SPSS窗口1、數(shù)據(jù)編輯窗口（data editor)2、輸出窗口(Viewer)3程序編輯窗口1.3 SPSS系統(tǒng)參數(shù)的設(shè)置 Options選擇對話框通用參數(shù)設(shè)置結(jié)果輸出窗口參數(shù)設(shè)置 Currency窗口參數(shù)設(shè)置第二章數(shù)據(jù)文件的編輯與管理 2.1建立與保存數(shù)據(jù)文件2.1.1 定義新變量1變量名(Name)：2.變量類型(Type) 3變量長度(Width):4變量小數(shù)點占位(Decimal):5變量標(biāo)簽(Lable):6變量值標(biāo)簽(Values)：7缺失值的定義方式(Missing):8變量的顯示寬度(Columns

2、):9變量顯示的對齊方式(Align)10變量的度量方式(Measure): 數(shù)據(jù)的輸入數(shù)據(jù)的保存2.2讀如其他格式的數(shù)據(jù)文件例讀入EXCEL數(shù)據(jù)文件student.xls,并保存為同名的SPSS數(shù)據(jù)集student.sav2.3 File菜單中的其他條目2.4數(shù)據(jù)文件的編輯單元值的查找增加或刪除一個觀測分析數(shù)據(jù)的排序分析數(shù)據(jù)集的轉(zhuǎn)置選取數(shù)據(jù)的觀測子集分析數(shù)據(jù)歸類分組匯總缺失值的替代 2.5數(shù)據(jù)變量的操作增加或刪除一個變量從原有變量構(gòu)造新變量數(shù)據(jù)排秩產(chǎn)生計數(shù)變量數(shù)據(jù)重新編碼產(chǎn)生自動分組變量變量集的定義和使用2.6 數(shù)據(jù)文件的合并與拆分?jǐn)?shù)據(jù)文件的縱向合并數(shù)據(jù)文件的橫向合并數(shù)據(jù)文件的拆分第一章S

3、PSS簡介1.1 SPSS概述Statistical package for Social Science，社會科學(xué)統(tǒng)計軟件包是一個組合式軟件包，它集數(shù)據(jù)整理、分析過程、結(jié)果輸出等功能于一身，是世界上著名的統(tǒng)計分析軟件之一。但是隨著SPSS產(chǎn)品服務(wù)領(lǐng)域的擴(kuò)大和服務(wù)深度的增加，SPSS公司已于2000年正式將英文全稱更改為“Statistical Product and Service Solutions”，意為“統(tǒng)計產(chǎn)品與服務(wù)解決方案”，標(biāo)志著SPSS 軟件的應(yīng)用領(lǐng)域有了重大拓展。SPSS解決方案廣泛應(yīng)用于市場研究、電訊、衛(wèi)生保健、銀行、財務(wù)金融、保險、制造業(yè)、零售等領(lǐng)域。SPSS的5大特色l

4、智能操作，易學(xué)易用l 一般情況下無須編寫程序l 數(shù)據(jù)轉(zhuǎn)換接口有很好的兼容性l 具有豐富的統(tǒng)計分析功能和完善的分析報告功能l Complex Samples模塊增加了統(tǒng)計建模的功能SPSS公司的歷史 1968年：美國斯坦福大學(xué)的三位專業(yè)背景截然不同的研究生Norman H. Nie、C. Hadlai (Tex) Hull 和 Dale H. Bent開發(fā)了最早的統(tǒng)計軟件系統(tǒng)，他們稱呼這個軟件系統(tǒng)為“社會科學(xué)統(tǒng)計軟件包”，簡稱“SPSS”。他們的出發(fā)點是使用統(tǒng)計方法來將原始數(shù)據(jù)轉(zhuǎn)變?yōu)闆Q策所必需的信息。Nie是一位社會科學(xué)家、斯坦福大學(xué)的博士生，承擔(dān)了用戶的角色，提出應(yīng)用需求；Bent是斯坦福大

5、學(xué)的運(yùn)籌學(xué)博士生，擁有著數(shù)據(jù)分析方面的專業(yè)知識，設(shè)計出了SPSS系統(tǒng)文件結(jié)構(gòu)；Hull剛從斯坦福大學(xué)獲得MBA學(xué)位，由他來負(fù)責(zé)編程。1975年：在芝加哥成立SPSS總部 1984年：推出用于個人電腦的SPSS/PC+ 1992年：推出Windows版本，同時在納斯達(dá)克上市，股票代碼為SPSS。目前在全球100多個國家和地區(qū)有分支機(jī)構(gòu)或合作伙伴，直系員工超過2000人。SPSS軟件家族廣泛應(yīng)用于自然科學(xué)、技術(shù)科學(xué)、社會科學(xué)的各個領(lǐng)域，世界上許多有影響的報刊雜志紛紛就SPSS的自動統(tǒng)計繪圖、數(shù)據(jù)的深入分析、使用方便、功能齊全等方面給予了高度的評價與稱贊。SPSS是世界上應(yīng)用最廣泛的專業(yè)統(tǒng)計軟件，全

6、球約有25萬家SPSS公司產(chǎn)品的用戶，它們分布于通訊、醫(yī)療、銀行、證券、保險、制造、商業(yè)、市場研究、科研教育等多個領(lǐng)域和行業(yè)，全球500強(qiáng)中有80%的公司使用SPSS，而在市場研究和市場調(diào)查領(lǐng)域有超過80%的市場占有率。在國際學(xué)術(shù)界有條不成文的規(guī)定，即在國際學(xué)術(shù)交流中，凡是用SPSS軟件完成的計算和統(tǒng)計分析，可以不必說明算法，由此可見其影響之大和信譽(yù)之高。 1.2 SPSS 窗口1、數(shù)據(jù)編輯窗口（data editor)基本功能建立SPSS數(shù)據(jù)文件主要構(gòu)件l 標(biāo)題欄和系統(tǒng)狀態(tài)欄l 菜單欄l 工具欄文件以.sav為擴(kuò)展名2輸出窗口(Viewer)· 以.spo為擴(kuò)展名3程序編輯窗口編

7、輯SPSS程序，通過運(yùn)行主菜單的RUN命令將編輯好的程序一次性地提交給計算機(jī)執(zhí)行。也可以將編好的程序保存為一個后綴為.sps的文件供以后需要的時候調(diào)用。1.3 SPSS系統(tǒng)參數(shù)的設(shè)置 Options選擇對話框 Edit=>Options通用參數(shù)設(shè)置結(jié)果輸出窗口參數(shù)設(shè)置1.3.4 Currency窗口參數(shù)設(shè)置第二章數(shù)據(jù)文件的編輯與管理 2.1建立與保存數(shù)據(jù)文件定義新變量大多數(shù)情況下我們需要從頭定義變量，在SPSS 10.0中，定義變量的操作界面和FoxPro等數(shù)據(jù)庫非常相似，只需單擊左下方的Variable View標(biāo)簽就可以切換到變量定義界面開始定義新變量。1變量名(Name

8、)：變量名必須以字母、漢字或開頭,剩下的字符可以是字母,數(shù)字,句點,#,_,$等變量名不能以句點結(jié)尾名字長度不能超過8個字符空格和特殊字符不能被用,如?,!,* 每一個變量名必須是唯一的,重復(fù)的變量名是不被允許的變量名無大小寫之分下列關(guān)鍵詞不能用作變量名 all NE EQ TO le lt by or gt and not ge with 舉例: location loc#5 x.1 over$5002.變量類型(Type): 變量類型可由變量類型對話框確定在SPSS數(shù)據(jù)集中，變量分為8種類型,主要有字符型變量（String）和數(shù)值型變量(numeric)。Numeric 數(shù)值型

9、Comma 加有逗號的數(shù)值型Dot 加有圓點的數(shù)值型Scientific notation 科學(xué)計數(shù)型Date 日期型Dollar 貨幣型Custom currency 用戶自定義型String 字符型3變量長度(Width):4變量小數(shù)點占位(Decimal):5變量標(biāo)簽(Lable):6變量值標(biāo)簽(Values)：變量值標(biāo)簽則在它右側(cè)的Value框定義。以性別為例，單擊Value框右半部的省略號，會彈出變量值標(biāo)簽對話框如下：上部的兩個文本框分別為變量值輸入框和變量值標(biāo)簽輸入框，分別在其中輸入“f”和“女生”，此時下方的Add鈕變黑，單擊它，該變量值標(biāo)簽就會被加入下方的標(biāo)簽框內(nèi)。與此類似定義

10、變量值“m”為“男生”，最后按OK，變量值標(biāo)簽就設(shè)置完成。切換回Data View界面，然后選擇菜單View=>Value Labels.7缺失值的定義方式(Missing):定義缺失值的作用：凡是在定義的缺失值范圍內(nèi)的數(shù)據(jù)不參與統(tǒng)計分析。SPSS有兩類缺失值：系統(tǒng)缺失值和用戶缺失值。數(shù)據(jù)長方形中任何空的數(shù)字單元都被認(rèn)為是系統(tǒng)缺失值，用點“”表示。由特殊原因造成的信息缺失值被認(rèn)為是用戶缺失值，例如調(diào)查問卷中，被調(diào)查者不愿意回答的項目可定義為用戶缺失值。單擊missing框下相應(yīng)變量右側(cè)的省略號，會彈出缺失值對話框如下：no missing values:無缺失值,系統(tǒng)默認(rèn)選項；discr

11、ete missing values:定義離散缺失值，選擇該選項后，激活下面3個輸入框，可以在其中指定3個數(shù)值作為缺失值，也可以少于3個。例如對于性別變量，值2，3，4都被認(rèn)為是非法的，在輸入數(shù)據(jù)過程中有可能輸入了這幾個數(shù)，則可以把這3個值分別輸入到3個矩形框中；range puls one optional discrete miss:定義一個缺失值的范圍，選擇該選項后，激活下面3個輸入框。在low和hight輸入框中分別輸入缺失值的下限和上限。可以在最下方的discrete框中輸入范圍之外的一個離散值。8變量的顯示寬度(Columns):9變量顯示的對齊方式(Align)選擇變量值顯示時的

12、對齊方式，系統(tǒng)默認(rèn)是右對齊。備選方式： l Left 左對齊l Right 右對齊l Center 居中對齊10變量的度量方式(Measure): 為了區(qū)分變量在分析中的不同作用，又按變量的度量方式分為三類：選擇變量的度量方式，系統(tǒng)默認(rèn)是定距變量。備選方式： l Scale 定距變量必須是數(shù)值型變量，可以對其觀測值進(jìn)行四則運(yùn)算。l Ordinal 順序變量，可以是數(shù)值型的，也可以是字符型的，可以對其觀測值進(jìn)行排序。l Nominal 名義變量可以是數(shù)值型的，也可以是字符型的，常起分類作用。使用該窗口，我們可以一次定義許多新變量，不會象老版本那樣一個一個的定義了。2.1.2 數(shù)據(jù)的輸入2.1

13、.3 數(shù)據(jù)的保存在對數(shù)據(jù)做了修改后，保存數(shù)據(jù)文件是必不可少的工作之一。選擇菜單File=>Save，如果數(shù)據(jù)文件曾經(jīng)存儲過，則系統(tǒng)會自動按原文件名保存數(shù)據(jù)；否則，就會彈出和選擇Save as 菜單時相同的Save as對話框。里面可以保存的數(shù)據(jù)類型和可以打開的幾乎一樣多，選擇合適的類型，確定就是了。2.2 讀如其他格式的數(shù)據(jù)文件SPSS可以直接讀入許多格式的數(shù)據(jù)文件，選擇菜單File=>Open=>Data或直接單擊快捷工具欄上的“”按鈕，系統(tǒng)就會彈出Open File對話框，單擊“文件類型”列表框，在里面能看到直接打開的數(shù)據(jù)文件格式，分別是：SPSS(*.sav)SPSS數(shù)

14、據(jù)文件（6.010.0版）SPSS/PC+(*.sys)SPSS 4.0版數(shù)據(jù)文件Systat(*.syd)*.syd格式的Systat數(shù)據(jù)文件Systat(*.sys)*.sys格式的Systat數(shù)據(jù)文件SPSS portable(*.por)SPSS便攜格式的數(shù)據(jù)文件EXCEL(*.xls)EXCEL數(shù)據(jù)文件（從5.0版2000版）Lotus(*.w*)Lotus數(shù)據(jù)文件SYLK(*.slk)SYLK數(shù)據(jù)文件dBase(*.dbf)dBase系列數(shù)據(jù)文件，（從dBase IIIV）Text(*.txt)純文本格式的數(shù)據(jù)文件data(*.dat)純文本格式的數(shù)據(jù)文件選擇所需的文件類型，然后選

15、中需要打開的文件，SPSS就會按你的要求打開你要使用的數(shù)據(jù)文件，并自動轉(zhuǎn)換為數(shù)據(jù)SPSS格式。例2.2.1讀入EXCEL數(shù)據(jù)文件student.xls,并保存為同名的SPSS數(shù)據(jù)集student.sav2.3File菜單中的其他條目【Disp Data Info】該菜單項用于顯示數(shù)據(jù)的基本信息，選擇它后會彈出非常類似于打開文件的一個對話框用于選擇數(shù)據(jù)文件，選擇好后按OK，系統(tǒng)就會在結(jié)果窗口中列出所選數(shù)據(jù)的基本情況，如建立時間、標(biāo)簽設(shè)置、記錄數(shù)、變量設(shè)置等。【Apply Data Dictionary】即使用數(shù)據(jù)字典，該功能使你可以直接在新數(shù)據(jù)集中套用以前定義好的變量設(shè)置（格式、標(biāo)簽等，但不包括

16、數(shù)據(jù)類型），例：打開Li1_1.sav文件，將變量x的長度從8改為4，標(biāo)簽刪掉，然后選擇菜單File=>Apply Data Dictionary，在文件對話框中選擇Li1_1.sav并按OK（即將Li1_1.sav的變量設(shè)置按相同變量名一一套用在現(xiàn)在的數(shù)據(jù)集上）?！綜ache Data】建立數(shù)據(jù)緩沖區(qū)。以前SPSS每執(zhí)行一條命令都會重新讀取所需的數(shù)據(jù)，如果是從遠(yuǎn)程用SQL調(diào)用數(shù)據(jù)庫，這會非常的費(fèi)時。現(xiàn)在使用Cache Data，可以將數(shù)據(jù)全部讀入暫存盤，建立活動數(shù)據(jù)的緩沖區(qū)。大大加快處理速度。如果是處理本機(jī)數(shù)據(jù)的話，該命令對速度的提升不是非常明顯?！綪rint和Print Previe

17、w】這兩個菜單項用于將數(shù)據(jù)管理窗口中的數(shù)據(jù)以表格的形式打印出來，其中Print Preview是新增加的，使用上和WPS2000的打印預(yù)覽非常相似（其實用的是同樣的程序），不過和SPSS結(jié)果的打印程序一樣，用SPSS直接打印數(shù)據(jù)非常的浪費(fèi)紙張?！維top Processor】用于停止執(zhí)行當(dāng)前的SPSS命令。由于SPSS處理速度非常的慢，如果你正在對一個大型的數(shù)據(jù)執(zhí)行統(tǒng)計命令，等了半天都沒有結(jié)束，可是你的結(jié)果還沒有存，執(zhí)行命令時又存不了，怎么辦呢？試試這個命令吧。但并非所有的命令都可以喊停的，許多數(shù)據(jù)庫操作命令（計算變量，合并等）好象就停不了。2.4數(shù)據(jù)文件的編輯在SPSS中，數(shù)據(jù)文件的編輯、整

18、理等功能被集中在了Edit,Data和Transform三個菜單項中。Data：Insert Variable:在選中的單元格之前的一列插入一個新變量。Insert Cases: 在選中的單元格之前的一行插入一個新觀測。Goto Case:定位到指定的觀測值Sort Case:按某變量的取值對觀測值進(jìn)行排序。Transpose:對數(shù)據(jù)文件進(jìn)行轉(zhuǎn)置。Merge Files:合并數(shù)據(jù)文件。Aggregate: 對數(shù)據(jù)進(jìn)行分類和不分類的匯總。Orthogonal Design:正交設(shè)計。Split File:按照某個分組變量對數(shù)據(jù)文件進(jìn)行拆分。Select Cases:選擇觀測值。Weight Ca

19、ses:對觀測值加權(quán)。下面我們將根據(jù)其功能來分別講述。觀測與變量的查找編輯（Edit）轉(zhuǎn)至個案（Go to Case）打開轉(zhuǎn)至（G）(Go to Case)對話框增加或刪除一個觀測l 增加一個新的行激活需要添加行的下一行的任意單元，選擇EditInsert Casel 刪除一個行單擊要刪除行的行頭，將該行全部選中，按Delete鍵分析數(shù)據(jù)的排序觀測數(shù)據(jù)的排序，特別是逐級排序，可以從統(tǒng)計角度了解整體數(shù)據(jù)的取值情況。例將數(shù)據(jù)集補(bǔ)鈣產(chǎn)品.sav按“性別”降序，再按“問卷編號”升序排序操作：選擇菜單數(shù)據(jù)（Data）=>排序個案（Sort Cases），系統(tǒng)彈出排序個案（Sort

20、Cases）對話框下方的排列順序（Sort Order）單選鈕，有升序和降序兩種選擇。請注意，該單選鈕是和上方的Sort By框一起使用的，具體方法如下：確認(rèn)降序單選鈕被選擇，將“性別”選入Sort By框；選擇升序單選鈕，將“問卷編號”選入Sort By框。分析數(shù)據(jù)集的轉(zhuǎn)置將觀測(行)和變量(列)位置互換，特別適用于實現(xiàn)存/取Excel文件進(jìn)行數(shù)據(jù)共享功能前/后的預(yù)操作。例將數(shù)據(jù)集“補(bǔ)鈣產(chǎn)品.sav”中的變量“性別”，“年齡”和“居住時間”進(jìn)行轉(zhuǎn)置操作選擇菜單數(shù)據(jù)（Data）=>Transpose，打開 Transpose對話框；將需要轉(zhuǎn)置的變量移入Variable列表框；如

21、果在數(shù)據(jù)文件中有一個變量是代表轉(zhuǎn)置后各變量的變量名，則將該變量移入Name Variable列表框中；否則轉(zhuǎn)置后數(shù)據(jù)集的變量將被分別命名為“Var001”, “Var002”“Var003”；單擊OK選取觀測的子集在統(tǒng)計分析時，有時并不需要對所有的觀測進(jìn)行分析，只需要對某些觀測進(jìn)行分析，例如在補(bǔ)鈣產(chǎn)品的市場調(diào)查中，我們只對女性被調(diào)查者的情況感興趣，或者只有在本市居住時間超過3年的被調(diào)查者才具有統(tǒng)計分析價值。另一種情況是在全部樣品中抽取一小部分樣品進(jìn)行分析，SPSS的Select Cases可以實現(xiàn)這種樣本篩選的功能。仍以補(bǔ)鈣產(chǎn)品數(shù)據(jù)為例來說明。操作選擇菜單數(shù)據(jù)（Data）=>選擇個案（

22、Select Cases）打開選擇個案（Select Cases）對話框；制定樣本篩選方式：Select Cases對話框右上Select下共有5種篩選方式· All cases：不進(jìn)行篩選，選中它則分析所有的記錄；· If condition is satisfied：按指定條件篩選，單擊下面的If按鈕在彈出的Select Cases If對話框可以設(shè)置篩選條件。在右上方的輸入框中輸入條件表達(dá)式。條件表達(dá)式可以用鍵盤直接輸入，也可以左側(cè)的變量列表中選擇變量，從下面的計算器中選擇數(shù)字和運(yùn)算符號。在右下方的Functions列表中有SPSS的常用函數(shù)供用戶選擇。在本例中如果

23、只相對居住時間超過3年的被調(diào)查者進(jìn)行分析，則在輸入框中輸入表達(dá)式time>3· Random sample of cases：隨機(jī)抽取觀測，單擊下面的sample按鈕, 在彈出的Select Cases Random sample對話框中設(shè)定隨機(jī)抽取的觀測數(shù)，有兩種選擇：按百分比抽取記錄，在本例中如果想從所有的觀測中抽取30%進(jìn)行分析，則在Approximately后的框中輸入30；或者精確設(shè)定從前n個觀測中隨機(jī)精確抽取一定量的觀測，在本例中如果想從前10個觀測中隨機(jī)抽取5個，則按下表填寫。· Based on time or case range：按順序抽樣。單擊R

24、ange按鈕，在彈出的Select Cases：range子對話框中設(shè)定被篩選的觀測的起止序號。· Use filter variable：使用指定的過濾變量進(jìn)行觀測篩選。選擇這一項的前提是數(shù)據(jù)文件中已經(jīng)存在一個過濾變量。所謂過濾變量即只取“0”“1”兩個值的變量。該變量取值為“1”的觀測將被選中，取值為“0”的觀測將被刪除。確定未被選中的觀測的處理辦法在Select Cases對話框的左下output下有3種選擇· Filter out unselect Cases：則在數(shù)據(jù)文件中根據(jù)用戶定義的選擇條件自動生成一個變量名為filter_&的新篩選變量，同時未被選擇

25、的觀測左端的觀測序號上將被打上一個斜杠，以后的分析將把這些觀測排除在外，但這些觀測并沒有從數(shù)據(jù)文件中刪除。· Copy select Cases to a new dataset: 建立一個新數(shù)據(jù)集，僅包含選中的觀測，將新數(shù)據(jù)集的名輸入 dataset name 后的框中。· Deleted：未被選中的觀測將被刪除，一般不要使用。注意：當(dāng)對數(shù)據(jù)集做出篩選后，所做的篩選將在以后的分析中一直有效，直到再次改變選擇條件為止。分析數(shù)據(jù)歸類分組匯總用于對數(shù)據(jù)進(jìn)行分類匯總，所謂分類匯總就是按指定的一個或多個分類變量（一般為離散型變量）對觀測值進(jìn)行分組，對每組觀測的其余變量（一般為連續(xù)

26、型變量）值進(jìn)行指定的描述統(tǒng)計分析，結(jié)果可以存入新數(shù)據(jù)文件，也可以替換當(dāng)前數(shù)據(jù)文件。例如在補(bǔ)鈣產(chǎn)品的市場調(diào)查中，我們想要知道按性別分類后，男性和女性被調(diào)查者的平均年齡、平均年收入以及收入差距的大小。操作：選擇菜單(Data) =>分類匯總（Aggregate），打開分類匯總（Aggregate）對話框選擇分類變量：把分類變量移入分組變量（Break Variables）框，這里把變量gender移入選擇匯總變量：即想要對其計算描述性統(tǒng)計量的變量，這里把變量age和income 移入Aggregate of Variable(s)列表框中。由于收入要計算均值和標(biāo)準(zhǔn)差兩個統(tǒng)計量，所以這里

27、要將變量income移入兩次選擇要計算的統(tǒng)計量系統(tǒng)默認(rèn)計算的統(tǒng)計量是均值（mean）,要想改變計算的統(tǒng)計量，單擊Aggregate Variable列表框中的某個變量，在單擊Functions,打開Aggregate Function子對話框共有5組函數(shù)· Summary:為最常用的均值、中位數(shù)、標(biāo)準(zhǔn)差等統(tǒng)計量；· Specific Value: 同組的第一個觀測值、最后一個觀測值、最小值和最大值· Number of cases: 分組后各組的觀測數(shù)；· Percentages和Functions：分別給出處于某個取值區(qū)間的觀測占各組觀測總數(shù)的百分比

28、和比率。例如，可以計算男性和女性被調(diào)查者分別有多少人的年齡超過40歲。單擊Name & Lable 對產(chǎn)生的新變量重新命名。選中 save number of cases in break group as variable 將各組的觀測數(shù)作為新變量保存。選擇新生成的數(shù)據(jù)文件的保存方式，有兩個選項：· Create new data file：定義一個新文件以存儲匯總的結(jié)果，右側(cè)的File鈕用于具體文件名的定義，默認(rèn)文件名為AGGR.sav；· Replace working data file單選鈕：用匯總的結(jié)果替換原來的數(shù)據(jù)。單擊OK.缺失值的替代 SP

29、SS有兩類缺失值：系統(tǒng)缺失值和用戶缺失值。數(shù)據(jù)長方形中任何空的數(shù)字單元都被認(rèn)為是系統(tǒng)缺失值，用點“”表示。由特殊原因造成的信息缺失值被認(rèn)為是用戶缺失值，例如調(diào)查問卷中，被調(diào)查者不愿意回答的項目可定義為用戶缺失值。SPSS統(tǒng)對用戶缺失值有較好的替代方法操作：選擇菜單轉(zhuǎn)換（Transform） => 替換缺失值（Replace missing values），打開替換缺失值（Replace missing values）對話框選擇左側(cè)的變量名列表框中選擇有缺失值的變量，將其添加到New Variable(s)框中，這時系統(tǒng)自動產(chǎn)生一個新變量，變量名默認(rèn)為在原變量名后加上“_1”，用于替

30、代含有缺失值的變量，用戶也可以在Name框中自己定義替代的新變量名。在method的下拉列表中選擇缺失值的替代方法，有5種方法Series mean 用該變量所有非缺失值的均值代替缺失值；Mean of near by points用缺失值相鄰點的非缺失值的均值作替代，對缺失值有多個相鄰點時，替代方式?jīng)]有限制；Median of near by points 用缺失值相鄰點的非缺失值的中位數(shù)作替代，對缺失值有多個相鄰點時，替代方式?jīng)]有限制；Linear interpolation 用缺失值相鄰兩點的非缺失值的均值作替代；Linear trend at point 利用回歸分析，用線性預(yù)測值替

31、代缺失值。 2.5數(shù)據(jù)變量的操作增加或刪除一個變量在SPSS數(shù)據(jù)文件中，每一列對應(yīng)一個變量，增加或刪除一個變量其實就是增加一個新的列或刪除一個已有的列。（1）增加一個變量有3種方法：我們只介紹其中的2種例如要在第4列前增加一個新的列，先單擊第4列的列頭，這是整個第4列被選中。單擊鼠標(biāo)右鍵，在彈出的菜單中選擇Insert Variables選項，這時系統(tǒng)自動在第4列前插入一個新的變量列，原第4列自動右移一列成為第5列。打開變量定義窗口，單擊鼠標(biāo)右鍵，在彈出的菜單中選擇Insert Variables選項,這時系統(tǒng)自動在第4行前插入一個新的行，原第4行自動下移一行成為第5行。（2）刪除一個變

32、量刪除一個變量就是刪除一個已有的列。例如要刪除第4列，先單擊第4列的列頭，這是整個第4列被選中，這時按Delete鍵。從原有變量構(gòu)造新變量從頭定義變量的情況多數(shù)在建立數(shù)據(jù)集時出現(xiàn)。但是，當(dāng)數(shù)據(jù)集已經(jīng)建立，需要整理、轉(zhuǎn)換變量時，碰到的更多情況是需要根據(jù)某種條件從數(shù)據(jù)集中的原有變量構(gòu)造出新變量。例如在studendf.sav中建立新變量w/h2，令其值為體重/身高的平方。菜單Transform =>Compute Variabl打開Compute Variable對話框選擇ok軟鍵盤上幾個符號的含義如下：=&|*不等號，等價于<>邏輯符號AND邏輯符號OR乘方，相當(dāng)于函

33、數(shù)EXP()邏輯符號NOT在函數(shù)窗口中選中某個函數(shù)并單擊右鍵，系統(tǒng)就會彈出該函數(shù)的用法說明。函數(shù)主要是和變量名組合起來使用的，比如說ABS(x)就是取變量x的絕對值。2.5.3數(shù)據(jù)排秩所謂“秩”，是指對變量排序之后觀測的順序號。在很多非參數(shù)檢驗的方法中都要用到變量的秩，并形成新的秩變量，下面以補(bǔ)鈣產(chǎn)品的市場調(diào)查數(shù)據(jù)為例來介紹數(shù)據(jù)排秩的操作步驟操作：選擇菜單轉(zhuǎn)換（Transform） =>個案排秩（Rank Cases）打開個案排秩（Rank Cases）對話框選擇排秩變量將排秩變量選入變量（Variables）列表框, 這里選擇居住時間（time）的秩；選擇排秩方式：Ass

34、ign Rank 1 to (把秩值1分配給) 后有兩個選項 Smallest value 將秩值1分配給最小的值，即按升序排秩； Largest value 將秩值1分配給最大的值，即按降序排秩。這里按居住時間的升序排秩選擇秩變量的類型:單擊RankType 按鈕，彈出Types子對話框。該對話框用于指定生成的新變量的計算方式，默認(rèn)選項為Rank，即生成的新變量就是排秩變量的秩，變量名為排秩變量名前加“s”,其余的選項并不常用 ; 選擇相同值的秩的取值方法：單擊Ties按鈕，彈出Ties子對話框，各選項的意義如下：l Mean 相同值的秩取平均值，系統(tǒng)默認(rèn)值；l Low 相同值的秩取最小

35、值的秩；l High相同值的秩取最大值的秩；l Sequential ranks to unique values: 相同值的秩取第一個出現(xiàn)的秩值。2.5.4產(chǎn)生計數(shù)變量在數(shù)據(jù)統(tǒng)計中，常常需要進(jìn)行一些計數(shù)工作，主要是針對所有觀測或滿足一定條件的觀測實現(xiàn)計數(shù)，計算出若干個變量中有幾個變量的值落在指定區(qū)間內(nèi)，并將計算結(jié)果存入一個新變量即計數(shù)變量。例如在補(bǔ)鈣產(chǎn)品的市場調(diào)查數(shù)據(jù)中要統(tǒng)計居住時間在3到8年之間，年齡在50歲以上被調(diào)查者人數(shù)。操作：選擇菜單轉(zhuǎn)換（Transform）=>對個案內(nèi)的值計數(shù)（Count Values within Cases）打開計算個案內(nèi)值的出現(xiàn)次數(shù)（Count O

36、ccurrences of Values within Cases）對話框首先在Target Variable框中指定一個變量，可以是變量列表中已有的變量，也可以是將要生成的新變量。然后將需要計數(shù)的變量添加到Numeric Variables框中，這里選擇居住時間（time）和年齡（age）；確定需要計數(shù)的數(shù)值范圍，單擊Define Values,打開Values to Count對話框其選項有· Value：輸入某個指定值作為計數(shù)值；· System -missing ：表示以系統(tǒng)指定的缺失值作為計數(shù)值；· System or user -missing ：

37、表示以系統(tǒng)或用戶指定的缺失值作為計數(shù)值；· Range 指定數(shù)值范圍為計數(shù)區(qū)間。第2個Range指定為只需要輸入最大值，不需要輸入最小值的半閉區(qū)間（Lowest through n），即小于等于n的區(qū)間。第3個Range指定為只需要輸入最小值，不需要輸入最大值的半閉區(qū)間（n through highest），即大于等于n的區(qū)間。這里選擇第3個Range輸入50，再選擇第一個Range輸入3 through 8單擊Continue指定條件來選擇參與計數(shù)的觀測：單擊if 按鈕,打開Count Occurrences:if Cases對話框。一般用系統(tǒng)默認(rèn)的全部觀測參與統(tǒng)計2.5.5數(shù)據(jù)重

38、新編碼（產(chǎn)生分組變量）有時候搜集到的數(shù)據(jù)不太適合直接做統(tǒng)計分析,例如對補(bǔ)鈣產(chǎn)品數(shù)據(jù)按居住時間(time)分析，但變量time取值過于分散，不利于分析，希望對居住不同時間段的被調(diào)查者進(jìn)行分析。可以利用SPSS提供的重新編碼對變量time分組，根據(jù)原始數(shù)據(jù)，我們希望將time分為3組，3年，46年，7年。操作：重新編碼變量覆蓋原變量Transeform=>Into Same Variables打開Recode Into Same Variables重新編碼變量為新變量Transeform=>Into Different Variables打開Recode Into Different Variables單擊old and new values在原數(shù)據(jù)文件中增加變量nem_time。2.5.6產(chǎn)生自動分組變量在2.5.5中的重新編碼可以按用戶要求對數(shù)據(jù)分組，本節(jié)提供一種按分位數(shù)對變量分組的工具，例如對補(bǔ)鈣產(chǎn)品數(shù)據(jù)希望對居住時間(time) 按分位數(shù)分組。操作：選擇Transeform=>Categorize Variables打開Categorize Variables對話框；將分組變量time移入Create Variables列表框；在Number of categories輸入框中輸入分組數(shù)目3；單及ok。在原數(shù)據(jù)文件中增加新變量n

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

SPSS基礎(chǔ)教程講解

文檔簡介

溫馨提示

最新文檔

評論

SPSS基礎(chǔ)教程講解

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔