版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、SPSS基礎(chǔ)目錄第一章 SPSS簡介1.1 SPSS概述1.2 SPSS窗口1、數(shù)據(jù)編輯窗口(data editor)2、輸出窗口(Viewer)3程序編輯窗口1.3 SPSS系統(tǒng)參數(shù)的設(shè)置 Options選擇對話框通用參數(shù)設(shè)置結(jié)果輸出窗口參數(shù)設(shè)置 Currency窗口參數(shù)設(shè)置第二章 數(shù)據(jù)文件的編輯與管理 2.1建立與保存數(shù)據(jù)文件2.1.1 定義新變量1變量名(Name):2.變量類型(Type) 3變量長度(Width):4變量小數(shù)點占位(Decimal):5變量標簽(Lable):6變量值標簽(Values):7缺失值的定義方式(Missing):8變量的顯示寬度(Columns
2、):9變量顯示的對齊方式(Align)10變量的度量方式(Measure): 數(shù)據(jù)的輸入數(shù)據(jù)的保存2.2讀如其他格式的數(shù)據(jù)文件例讀入EXCEL數(shù)據(jù)文件student.xls,并保存為同名的SPSS數(shù)據(jù)集student.sav2.3 File菜單中的其他條目2.4數(shù)據(jù)文件的編輯單元值的查找增加或刪除一個觀測分析數(shù)據(jù)的排序分析數(shù)據(jù)集的轉(zhuǎn)置選取數(shù)據(jù)的觀測子集分析數(shù)據(jù)歸類分組匯總 缺失值的替代 2.5數(shù)據(jù)變量的操作增加或刪除一個變量從原有變量構(gòu)造新變量數(shù)據(jù)排秩產(chǎn)生計數(shù)變量數(shù)據(jù)重新編碼產(chǎn)生自動分組變量變量集的定義和使用2.6 數(shù)據(jù)文件的合并與拆分數(shù)據(jù)文件的縱向合并數(shù)據(jù)文件的橫向合并數(shù)據(jù)文件的拆分第一章S
3、PSS簡介1.1 SPSS概述Statistical package for Social Science,社會科學(xué)統(tǒng)計軟件包是一個組合式軟件包,它集數(shù)據(jù)整理、分析過程、結(jié)果輸出等功能于一身,是世界上著名的統(tǒng)計分析軟件之一。但是隨著SPSS產(chǎn)品服務(wù)領(lǐng)域的擴大和服務(wù)深度的增加,SPSS公司已于2000年正式將英文全稱更改為“Statistical Product and Service Solutions”,意為“統(tǒng)計產(chǎn)品與服務(wù)解決方案”,標志著SPSS 軟件的應(yīng)用領(lǐng)域有了重大拓展。SPSS解決方案廣泛應(yīng)用于市場研究、電訊、衛(wèi)生保健、銀行、財務(wù)金融、保險、制造業(yè)、零售等領(lǐng)域。SPSS的5大特色l
4、 智能操作,易學(xué)易用l 一般情況下無須編寫程序l 數(shù)據(jù)轉(zhuǎn)換接口有很好的兼容性l 具有豐富的統(tǒng)計分析功能和完善的分析報告功能l Complex Samples模塊增加了統(tǒng)計建模的功能SPSS公司的歷史 1968年:美國斯坦福大學(xué)的三位專業(yè)背景截然不同的研究生Norman H. Nie、C. Hadlai (Tex) Hull 和 Dale H. Bent開發(fā)了最早的統(tǒng)計軟件系統(tǒng),他們稱呼這個軟件系統(tǒng)為“社會科學(xué)統(tǒng)計軟件包”,簡稱“SPSS”。他們的出發(fā)點是使用統(tǒng)計方法來將原始數(shù)據(jù)轉(zhuǎn)變?yōu)闆Q策所必需的信息。Nie是一位社會科學(xué)家、斯坦福大學(xué)的博士生,承擔了用戶的角色,提出應(yīng)用需求;Bent是斯坦福大
5、學(xué)的運籌學(xué)博士生,擁有著數(shù)據(jù)分析方面的專業(yè)知識,設(shè)計出了SPSS系統(tǒng)文件結(jié)構(gòu);Hull剛從斯坦福大學(xué)獲得MBA學(xué)位,由他來負責編程。1975年:在芝加哥成立SPSS總部 1984年:推出用于個人電腦的SPSS/PC+ 1992年:推出Windows版本,同時在納斯達克上市,股票代碼為SPSS。目前在全球100多個國家和地區(qū)有分支機構(gòu)或合作伙伴,直系員工超過2000人。SPSS軟件家族廣泛應(yīng)用于自然科學(xué)、技術(shù)科學(xué)、社會科學(xué)的各個領(lǐng)域,世界上許多有影響的報刊雜志紛紛就SPSS的自動統(tǒng)計繪圖、數(shù)據(jù)的深入分析、使用方便、功能齊全等方面給予了高度的評價與稱贊。SPSS是世界上應(yīng)用最廣泛的專業(yè)統(tǒng)計軟件,全
6、球約有25萬家SPSS公司產(chǎn)品的用戶,它們分布于通訊、醫(yī)療、銀行、證券、保險、制造、商業(yè)、市場研究、科研教育等多個領(lǐng)域和行業(yè),全球500強中有80%的公司使用SPSS,而在市場研究和市場調(diào)查領(lǐng)域有超過80%的市場占有率。在國際學(xué)術(shù)界有條不成文的規(guī)定,即在國際學(xué)術(shù)交流中,凡是用SPSS軟件完成的計算和統(tǒng)計分析,可以不必說明算法,由此可見其影響之大和信譽之高。 1.2 SPSS 窗口1、數(shù)據(jù)編輯窗口(data editor)基本功能 建立SPSS數(shù)據(jù)文件主要構(gòu)件l 標題欄和系統(tǒng)狀態(tài)欄l 菜單欄l 工具欄文件以.sav為擴展名2輸出窗口(Viewer)· 以.spo為擴展名3程序編輯窗口編
7、輯SPSS程序,通過運行主菜單的RUN命令將編輯好的程序一次性地提交給計算機執(zhí)行。也可以將編好的程序保存為一個后綴為.sps的文件供以后需要的時候調(diào)用。1.3 SPSS系統(tǒng)參數(shù)的設(shè)置 Options選擇對話框 Edit=>Options通用參數(shù)設(shè)置結(jié)果輸出窗口參數(shù)設(shè)置1.3.4 Currency窗口參數(shù)設(shè)置第二章 數(shù)據(jù)文件的編輯與管理 2.1建立與保存數(shù)據(jù)文件定義新變量大多數(shù)情況下我們需要從頭定義變量,在SPSS 10.0中,定義變量的操作界面和FoxPro等數(shù)據(jù)庫非常相似,只需單擊左下方的Variable View標簽就可以切換到變量定義界面開始定義新變量。1變量名(Name
8、): 變量名必須以字母、漢字或開頭,剩下的字符可以是字母,數(shù)字,句點,#,_,$等 變量名不能以句點結(jié)尾 名字長度不能超過8個字符 空格和特殊字符不能被用,如?,!,* 每一個變量名必須是唯一的,重復(fù)的變量名是不被允許的 變量名無大小寫之分 下列關(guān)鍵詞不能用作變量名 all NE EQ TO le lt by or gt and not ge with 舉例: location loc#5 x.1 over$5002.變量類型(Type): 變量類型可由變量類型對話框確定在SPSS數(shù)據(jù)集中,變量分為8種類型,主要有字符型變量(String)和數(shù)值型變量(numeric)。Numeric 數(shù)值型
9、Comma 加有逗號的數(shù)值型Dot 加有圓點的數(shù)值型Scientific notation 科學(xué)計數(shù)型Date 日期型Dollar 貨幣型Custom currency 用戶自定義型String 字符型3變量長度(Width):4變量小數(shù)點占位(Decimal):5變量標簽(Lable):6變量值標簽(Values):變量值標簽則在它右側(cè)的Value框定義。以性別為例,單擊Value框右半部的省略號,會彈出變量值標簽對話框如下:上部的兩個文本框分別為變量值輸入框和變量值標簽輸入框,分別在其中輸入“f”和“女生”,此時下方的Add鈕變黑,單擊它,該變量值標簽就會被加入下方的標簽框內(nèi)。與此類似定義
10、變量值“m”為“男生”,最后按OK,變量值標簽就設(shè)置完成。切換回Data View界面,然后選擇菜單View=>Value Labels.7缺失值的定義方式(Missing):定義缺失值的作用:凡是在定義的缺失值范圍內(nèi)的數(shù)據(jù)不參與統(tǒng)計分析。SPSS有兩類缺失值:系統(tǒng)缺失值和用戶缺失值。數(shù)據(jù)長方形中任何空的數(shù)字單元都被認為是系統(tǒng)缺失值,用點“”表示。由特殊原因造成的信息缺失值被認為是用戶缺失值,例如調(diào)查問卷中,被調(diào)查者不愿意回答的項目可定義為用戶缺失值。單擊missing框下相應(yīng)變量右側(cè)的省略號,會彈出缺失值對話框如下:no missing values:無缺失值,系統(tǒng)默認選項;discr
11、ete missing values:定義離散缺失值,選擇該選項后,激活下面3個輸入框,可以在其中指定3個數(shù)值作為缺失值,也可以少于3個。例如對于性別變量,值2,3,4都被認為是非法的,在輸入數(shù)據(jù)過程中有可能輸入了這幾個數(shù),則可以把這3個值分別輸入到3個矩形框中;range puls one optional discrete miss:定義一個缺失值的范圍,選擇該選項后,激活下面3個輸入框。在low和hight輸入框中分別輸入缺失值的下限和上限??梢栽谧钕路降膁iscrete框中輸入范圍之外的一個離散值。8變量的顯示寬度(Columns):9變量顯示的對齊方式(Align)選擇變量值顯示時的
12、對齊方式,系統(tǒng)默認是右對齊。備選方式: l Left 左對齊l Right 右對齊l Center 居中對齊10變量的度量方式(Measure): 為了區(qū)分變量在分析中的不同作用,又按變量的度量方式分為三類:選擇變量的度量方式,系統(tǒng)默認是定距變量。備選方式: l Scale 定距變量 必須是數(shù)值型變量,可以對其觀測值進行四則運算。l Ordinal 順序變量,可以是數(shù)值型的,也可以是字符型的,可以對其觀測值進行排序。l Nominal 名義變量 可以是數(shù)值型的,也可以是字符型的,常起分類作用。使用該窗口,我們可以一次定義許多新變量,不會象老版本那樣一個一個的定義了。2.1.2 數(shù)據(jù)的輸入2.1
13、.3 數(shù)據(jù)的保存在對數(shù)據(jù)做了修改后,保存數(shù)據(jù)文件是必不可少的工作之一。選擇菜單File=>Save,如果數(shù)據(jù)文件曾經(jīng)存儲過,則系統(tǒng)會自動按原文件名保存數(shù)據(jù);否則,就會彈出和選擇Save as 菜單時相同的Save as對話框。里面可以保存的數(shù)據(jù)類型和可以打開的幾乎一樣多,選擇合適的類型,確定就是了。2.2 讀如其他格式的數(shù)據(jù)文件SPSS可以直接讀入許多格式的數(shù)據(jù)文件,選擇菜單File=>Open=>Data或直接單擊快捷工具欄上的“”按鈕,系統(tǒng)就會彈出Open File對話框,單擊“文件類型”列表框,在里面能看到直接打開的數(shù)據(jù)文件格式,分別是:SPSS(*.sav)SPSS數(shù)
14、據(jù)文件(6.010.0版)SPSS/PC+(*.sys)SPSS 4.0版數(shù)據(jù)文件Systat(*.syd)*.syd格式的Systat數(shù)據(jù)文件Systat(*.sys)*.sys格式的Systat數(shù)據(jù)文件SPSS portable(*.por)SPSS便攜格式的數(shù)據(jù)文件EXCEL(*.xls)EXCEL數(shù)據(jù)文件(從5.0版2000版)Lotus(*.w*)Lotus數(shù)據(jù)文件SYLK(*.slk)SYLK數(shù)據(jù)文件dBase(*.dbf)dBase系列數(shù)據(jù)文件,(從dBase IIIV)Text(*.txt)純文本格式的數(shù)據(jù)文件data(*.dat)純文本格式的數(shù)據(jù)文件選擇所需的文件類型,然后選
15、中需要打開的文件,SPSS就會按你的要求打開你要使用的數(shù)據(jù)文件,并自動轉(zhuǎn)換為數(shù)據(jù)SPSS格式。例2.2.1讀入EXCEL數(shù)據(jù)文件student.xls,并保存為同名的SPSS數(shù)據(jù)集student.sav2.3File菜單中的其他條目【Disp Data Info】該菜單項用于顯示數(shù)據(jù)的基本信息,選擇它后會彈出非常類似于打開文件的一個對話框用于選擇數(shù)據(jù)文件,選擇好后按OK,系統(tǒng)就會在結(jié)果窗口中列出所選數(shù)據(jù)的基本情況,如建立時間、標簽設(shè)置、記錄數(shù)、變量設(shè)置等?!続pply Data Dictionary】即使用數(shù)據(jù)字典,該功能使你可以直接在新數(shù)據(jù)集中套用以前定義好的變量設(shè)置(格式、標簽等,但不包括
16、數(shù)據(jù)類型),例:打開Li1_1.sav文件,將變量x的長度從8改為4,標簽刪掉,然后選擇菜單File=>Apply Data Dictionary,在文件對話框中選擇Li1_1.sav并按OK(即將Li1_1.sav的變量設(shè)置按相同變量名一一套用在現(xiàn)在的數(shù)據(jù)集上)?!綜ache Data】建立數(shù)據(jù)緩沖區(qū)。以前SPSS每執(zhí)行一條命令都會重新讀取所需的數(shù)據(jù),如果是從遠程用SQL調(diào)用數(shù)據(jù)庫,這會非常的費時?,F(xiàn)在使用Cache Data,可以將數(shù)據(jù)全部讀入暫存盤,建立活動數(shù)據(jù)的緩沖區(qū)。大大加快處理速度。如果是處理本機數(shù)據(jù)的話,該命令對速度的提升不是非常明顯?!綪rint和Print Previe
17、w】這兩個菜單項用于將數(shù)據(jù)管理窗口中的數(shù)據(jù)以表格的形式打印出來,其中Print Preview是新增加的,使用上和WPS2000的打印預(yù)覽非常相似(其實用的是同樣的程序),不過和SPSS結(jié)果的打印程序一樣,用SPSS直接打印數(shù)據(jù)非常的浪費紙張?!維top Processor】用于停止執(zhí)行當前的SPSS命令。由于SPSS處理速度非常的慢,如果你正在對一個大型的數(shù)據(jù)執(zhí)行統(tǒng)計命令,等了半天都沒有結(jié)束,可是你的結(jié)果還沒有存,執(zhí)行命令時又存不了,怎么辦呢?試試這個命令吧。但并非所有的命令都可以喊停的,許多數(shù)據(jù)庫操作命令(計算變量,合并等)好象就停不了。2.4數(shù)據(jù)文件的編輯在SPSS中,數(shù)據(jù)文件的編輯、整
18、理等功能被集中在了Edit,Data和Transform三個菜單項中。Data:Insert Variable:在選中的單元格之前的一列插入一個新變量。Insert Cases: 在選中的單元格之前的一行插入一個新觀測。Goto Case:定位到指定的觀測值Sort Case:按某變量的取值對觀測值進行排序。Transpose:對數(shù)據(jù)文件進行轉(zhuǎn)置。Merge Files:合并數(shù)據(jù)文件。Aggregate: 對數(shù)據(jù)進行分類和不分類的匯總。Orthogonal Design:正交設(shè)計。Split File:按照某個分組變量對數(shù)據(jù)文件進行拆分。Select Cases:選擇觀測值。Weight Ca
19、ses:對觀測值加權(quán)。下面我們將根據(jù)其功能來分別講述。觀測與變量的查找 編輯(Edit)轉(zhuǎn)至個案(Go to Case) 打開 轉(zhuǎn)至(G)(Go to Case)對話框增加或刪除一個觀測l 增加一個新的行激活需要添加行的下一行的任意單元,選擇EditInsert Casel 刪除一個行 單擊要刪除行的行頭,將該行全部選中,按Delete鍵分析數(shù)據(jù)的排序觀測數(shù)據(jù)的排序,特別是逐級排序,可以從統(tǒng)計角度了解整體數(shù)據(jù)的取值情況。 例 將數(shù)據(jù)集補鈣產(chǎn)品.sav按“性別”降序,再按“問卷編號”升序排序操作: 選擇菜單 數(shù)據(jù)(Data)=>排序個案(Sort Cases),系統(tǒng)彈出排序個案(Sort
20、Cases)對話框 下方的排列順序(Sort Order)單選鈕,有升序和降序兩種選擇。請注意,該單選鈕是和上方的Sort By框一起使用的,具體方法如下:確認降序單選鈕被選擇,將“性別”選入Sort By框;選擇升序單選鈕,將“問卷編號”選入Sort By框。分析數(shù)據(jù)集的轉(zhuǎn)置 將觀測(行)和變量(列)位置互換,特別適用于實現(xiàn)存/取Excel文件進行數(shù)據(jù)共享功能前/后的預(yù)操作。 例 將數(shù)據(jù)集“補鈣產(chǎn)品.sav”中的變量“性別”,“年齡”和“居住時間”進行轉(zhuǎn)置操作選擇菜單 數(shù)據(jù)(Data)=>Transpose,打開 Transpose對話框;將需要轉(zhuǎn)置的變量移入Variable列表框;如
21、果在數(shù)據(jù)文件中有一個變量是代表轉(zhuǎn)置后各變量的變量名,則將該變量移入Name Variable列表框中;否則轉(zhuǎn)置后數(shù)據(jù)集的變量將被分別命名為“Var001”, “Var002”“Var003”;單擊OK選取觀測的子集 在統(tǒng)計分析時,有時并不需要對所有的觀測進行分析,只需要對某些觀測進行分析,例如在補鈣產(chǎn)品的市場調(diào)查中,我們只對女性被調(diào)查者的情況感興趣,或者只有在本市居住時間超過3年的被調(diào)查者才具有統(tǒng)計分析價值。另一種情況是在全部樣品中抽取一小部分樣品進行分析,SPSS的Select Cases可以實現(xiàn)這種樣本篩選的功能。仍以補鈣產(chǎn)品數(shù)據(jù)為例來說明。操作選擇菜單數(shù)據(jù)(Data)=>選擇個案(
22、Select Cases)打開 選擇個案(Select Cases)對話框;制定樣本篩選方式:Select Cases對話框右上Select下共有5種篩選方式· All cases:不進行篩選,選中它則分析所有的記錄;· If condition is satisfied:按指定條件篩選,單擊下面的If按鈕在彈出的Select Cases If對話框可以設(shè)置篩選條件。在右上方的輸入框中輸入條件表達式。條件表達式可以用鍵盤直接輸入,也可以左側(cè)的變量列表中選擇變量,從下面的計算器中選擇數(shù)字和運算符號。在右下方的Functions列表中有SPSS的常用函數(shù)供用戶選擇。在本例中如果
23、只相對居住時間超過3年的被調(diào)查者進行分析,則在輸入框中輸入表達式time>3· Random sample of cases:隨機抽取觀測,單擊下面的sample按鈕, 在彈出的Select Cases Random sample對話框中設(shè)定隨機抽取的觀測數(shù),有兩種選擇:按百分比抽取記錄,在本例中如果想從所有的觀測中抽取30%進行分析,則在Approximately后的框中輸入30;或者精確設(shè)定從前n個觀測中隨機精確抽取一定量的觀測,在本例中如果想從前10個觀測中隨機抽取5個,則按下表填寫。· Based on time or case range:按順序抽樣。單擊R
24、ange按鈕,在彈出的Select Cases:range子對話框中設(shè)定被篩選的觀測的起止序號。· Use filter variable:使用指定的過濾變量進行觀測篩選。選擇這一項的前提是數(shù)據(jù)文件中已經(jīng)存在一個過濾變量。所謂過濾變量即只取“0”“1”兩個值的變量。該變量取值為“1”的觀測將被選中,取值為“0”的觀測將被刪除。確定未被選中的觀測的處理辦法在Select Cases對話框的左下output下有3種選擇· Filter out unselect Cases:則在數(shù)據(jù)文件中根據(jù)用戶定義的選擇條件自動生成一個變量名為filter_&的新篩選變量,同時未被選擇
25、的觀測左端的觀測序號上將被打上一個斜杠,以后的分析將把這些觀測排除在外,但這些觀測并沒有從數(shù)據(jù)文件中刪除。· Copy select Cases to a new dataset: 建立一個新數(shù)據(jù)集,僅包含選中的觀測,將新數(shù)據(jù)集的名輸入 dataset name 后的框中。· Deleted:未被選中的觀測將被刪除,一般不要使用。注意:當對數(shù)據(jù)集做出篩選后,所做的篩選將在以后的分析中一直有效,直到再次改變選擇條件為止。分析數(shù)據(jù)歸類分組匯總 用于對數(shù)據(jù)進行分類匯總,所謂分類匯總就是按指定的一個或多個分類變量(一般為離散型變量)對觀測值進行分組,對每組觀測的其余變量(一般為連續(xù)
26、型變量)值進行指定的描述統(tǒng)計分析,結(jié)果可以存入新數(shù)據(jù)文件,也可以替換當前數(shù)據(jù)文件。例如在補鈣產(chǎn)品的市場調(diào)查中,我們想要知道按性別分類后,男性和女性被調(diào)查者的平均年齡、平均年收入以及收入差距的大小。操作:選擇菜單(Data) =>分類匯總(Aggregate),打開 分類匯總(Aggregate)對話框 選擇分類變量:把分類變量移入分組變量(Break Variables)框,這里把變量gender移入 選擇匯總變量:即想要對其計算描述性統(tǒng)計量的變量,這里把變量age和income 移入Aggregate of Variable(s)列表框中。由于收入要計算均值和標準差兩個統(tǒng)計量,所以這里
27、要將變量income移入兩次 選擇要計算的統(tǒng)計量系統(tǒng)默認計算的統(tǒng)計量是均值(mean),要想改變計算的統(tǒng)計量,單擊Aggregate Variable列表框中的某個變量,在單擊Functions,打開Aggregate Function子對話框共有5組函數(shù)· Summary:為最常用的均值、中位數(shù)、標準差等統(tǒng)計量;· Specific Value: 同組的第一個觀測值、最后一個觀測值、最小值和最大值· Number of cases: 分組后各組的觀測數(shù);· Percentages和Functions:分別給出處于某個取值區(qū)間的觀測占各組觀測總數(shù)的百分比
28、和比率。例如,可以計算男性和女性被調(diào)查者分別有多少人的年齡超過40歲。 單擊Name & Lable 對產(chǎn)生的新變量重新命名。 選中 save number of cases in break group as variable 將各組的觀測數(shù)作為新變量保存。 選擇新生成的數(shù)據(jù)文件的保存方式,有兩個選項:· Create new data file:定義一個新文件以存儲匯總的結(jié)果,右側(cè)的File鈕用于具體文件名的定義,默認文件名為AGGR.sav;· Replace working data file單選鈕:用匯總的結(jié)果替換原來的數(shù)據(jù)。 單擊OK.缺失值的替代 SP
29、SS有兩類缺失值:系統(tǒng)缺失值和用戶缺失值。數(shù)據(jù)長方形中任何空的數(shù)字單元都被認為是系統(tǒng)缺失值,用點“”表示。由特殊原因造成的信息缺失值被認為是用戶缺失值,例如調(diào)查問卷中,被調(diào)查者不愿意回答的項目可定義為用戶缺失值。SPSS統(tǒng)對用戶缺失值有較好的替代方法操作: 選擇菜單 轉(zhuǎn)換(Transform) => 替換缺失值(Replace missing values),打開替換缺失值(Replace missing values)對話框 選擇左側(cè)的變量名列表框中選擇有缺失值的變量,將其添加到New Variable(s)框中,這時系統(tǒng)自動產(chǎn)生一個新變量,變量名默認為在原變量名后加上“_1”,用于替
30、代含有缺失值的變量,用戶也可以在Name框中自己定義替代的新變量名。 在method的下拉列表中選擇缺失值的替代方法,有5種方法Series mean 用該變量所有非缺失值的均值代替缺失值;Mean of near by points用缺失值相鄰點的非缺失值的均值作替代,對缺失值有多個相鄰點時,替代方式?jīng)]有限制;Median of near by points 用缺失值相鄰點的非缺失值的中位數(shù)作替代,對缺失值有多個相鄰點時,替代方式?jīng)]有限制;Linear interpolation 用缺失值相鄰兩點的非缺失值的均值作替代;Linear trend at point 利用回歸分析,用線性預(yù)測值替
31、代缺失值。 2.5數(shù)據(jù)變量的操作增加或刪除一個變量 在SPSS數(shù)據(jù)文件中,每一列對應(yīng)一個變量,增加或刪除一個變量其實就是增加一個新的列或刪除一個已有的列。 (1)增加一個變量有3種方法:我們只介紹其中的2種例如要在第4列前增加一個新的列,先單擊第4列的列頭,這是整個第4列被選中。單擊鼠標右鍵,在彈出的菜單中選擇Insert Variables選項,這時系統(tǒng)自動在第4列前插入一個新的變量列,原第4列自動右移一列成為第5列。打開變量定義窗口,單擊鼠標右鍵,在彈出的菜單中選擇Insert Variables選項,這時系統(tǒng)自動在第4行前插入一個新的行,原第4行自動下移一行成為第5行。 (2)刪除一個變
32、量 刪除一個變量就是刪除一個已有的列。例如要刪除第4列,先單擊第4列的列頭,這是整個第4列被選中,這時按Delete鍵。從原有變量構(gòu)造新變量從頭定義變量的情況多數(shù)在建立數(shù)據(jù)集時出現(xiàn)。但是,當數(shù)據(jù)集已經(jīng)建立,需要整理、轉(zhuǎn)換變量時,碰到的更多情況是需要根據(jù)某種條件從數(shù)據(jù)集中的原有變量構(gòu)造出新變量。例如在studendf.sav中建立新變量w/h2,令其值為體重/身高的平方。菜單Transform =>Compute Variabl打開Compute Variable對話框選擇ok軟鍵盤上幾個符號的含義如下:=&|*不等號,等價于<>邏輯符號AND邏輯符號OR乘方,相當于函
33、數(shù)EXP()邏輯符號NOT在函數(shù)窗口中選中某個函數(shù)并單擊右鍵,系統(tǒng)就會彈出該函數(shù)的用法說明。函數(shù)主要是和變量名組合起來使用的,比如說ABS(x)就是取變量x的絕對值。2.5.3數(shù)據(jù)排秩 所謂“秩”,是指對變量排序之后觀測的順序號。在很多非參數(shù)檢驗的方法中都要用到變量的秩,并形成新的秩變量,下面以補鈣產(chǎn)品的市場調(diào)查數(shù)據(jù)為例來介紹數(shù)據(jù)排秩的操作步驟操作: 選擇菜單 轉(zhuǎn)換(Transform) =>個案排秩(Rank Cases)打開個案排秩(Rank Cases)對話框 選擇排秩變量 將排秩變量選入 變量(Variables)列表框, 這里選擇居住時間(time)的秩; 選擇排秩方式:Ass
34、ign Rank 1 to (把秩值1分配給) 后有兩個選項 Smallest value 將秩值1分配給最小的值,即按升序排秩; Largest value 將秩值1分配給最大的值,即按降序排秩。 這里按居住時間的升序排秩 選擇秩變量的類型:單擊RankType 按鈕,彈出Types子對話框。該對話框用于指定生成的新變量的計算方式,默認選項為Rank,即生成的新變量就是排秩變量的秩,變量名為排秩變量名前加“s”,其余的選項并不常用 ; 選擇相同值的秩的取值方法:單擊Ties按鈕,彈出Ties子對話框,各選項的意義如下:l Mean 相同值的秩取平均值,系統(tǒng)默認值;l Low 相同值的秩取最小
35、值的秩;l High相同值的秩取最大值的秩;l Sequential ranks to unique values: 相同值的秩取第一個出現(xiàn)的秩值。2.5.4產(chǎn)生計數(shù)變量在數(shù)據(jù)統(tǒng)計中,常常需要進行一些計數(shù)工作,主要是針對所有觀測或滿足一定條件的觀測實現(xiàn)計數(shù),計算出若干個變量中有幾個變量的值落在指定區(qū)間內(nèi),并將計算結(jié)果存入一個新變量即計數(shù)變量。例如在補鈣產(chǎn)品的市場調(diào)查數(shù)據(jù)中要統(tǒng)計居住時間在3到8年之間,年齡在50歲以上被調(diào)查者人數(shù)。操作:選擇菜單 轉(zhuǎn)換(Transform)=>對個案內(nèi)的值計數(shù)(Count Values within Cases)打開 計算個案內(nèi)值的出現(xiàn)次數(shù)(Count O
36、ccurrences of Values within Cases)對話框 首先在Target Variable框中指定一個變量,可以是變量列表中已有的變量,也可以是將要生成的新變量。然后將需要計數(shù)的變量添加到Numeric Variables框中,這里選擇居住時間(time)和年齡(age); 確定需要計數(shù)的數(shù)值范圍,單擊Define Values,打開Values to Count對話框其選項有· Value:輸入某個指定值作為計數(shù)值;· System -missing :表示以系統(tǒng)指定的缺失值作為計數(shù)值;· System or user -missing :
37、表示以系統(tǒng)或用戶指定的缺失值作為計數(shù)值;· Range 指定數(shù)值范圍為計數(shù)區(qū)間。第2個Range指定為只需要輸入最大值,不需要輸入最小值的半閉區(qū)間(Lowest through n),即小于等于n的區(qū)間。第3個Range指定為只需要輸入最小值,不需要輸入最大值的半閉區(qū)間(n through highest),即大于等于n的區(qū)間。這里選擇第3個Range輸入50,再選擇第一個Range輸入3 through 8單擊Continue指定條件來選擇參與計數(shù)的觀測:單擊if 按鈕,打開Count Occurrences:if Cases對話框。一般用系統(tǒng)默認的全部觀測參與統(tǒng)計2.5.5數(shù)據(jù)重
38、新編碼(產(chǎn)生分組變量)有時候搜集到的數(shù)據(jù)不太適合直接做統(tǒng)計分析,例如對補鈣產(chǎn)品數(shù)據(jù)按居住時間(time)分析,但變量time取值過于分散,不利于分析,希望對居住不同時間段的被調(diào)查者進行分析。可以利用SPSS提供的重新編碼對變量time分組,根據(jù)原始數(shù)據(jù),我們希望將time分為3組,3年,46年,7年。操作:重新編碼變量覆蓋原變量Transeform=>Into Same Variables打開Recode Into Same Variables重新編碼變量為新變量Transeform=>Into Different Variables打開Recode Into Different Variables單擊old and new values在原數(shù)據(jù)文件中增加變量nem_time。2.5.6產(chǎn)生自動分組變量 在2.5.5中的重新編碼可以按用戶要求對數(shù)據(jù)分組,本節(jié)提供一種按分位數(shù)對變量分組的工具,例如對補鈣產(chǎn)品數(shù)據(jù)希望對居住時間(time) 按分位數(shù)分組。操作: 選擇Transeform=>Categorize Variables打開Categorize Variables對話框; 將分組變量time移入Create Variables列表框; 在Number of categories輸入框中輸入分組數(shù)目3; 單及ok。在原數(shù)據(jù)文件中增加新變量n
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度數(shù)據(jù)中心服務(wù)器租賃合同
- 2024醫(yī)院病房清潔服務(wù)合同
- 2024年展覽保險服務(wù)協(xié)議
- 2024年度0kv線路工程建設(shè)的合作開發(fā)合同
- 2024年度婚禮主持委托合同
- 2024年定制版太陽能系統(tǒng)維護合同
- 2024年度太陽能熱水系統(tǒng)安裝合同
- 2024年度城市供水供電供氣合同
- 2024年三人股東責任承擔協(xié)議
- 04版建筑工程合同
- QC七大手法與新QC七大手法
- 照明路燈工程 投標文件(技術(shù)方案)
- 數(shù)控車削編程試卷及答案
- 大學(xué)思政課價值觀課件
- 2024年教師普通話培訓(xùn)心得體會范文3篇
- 車寨礦井及選煤廠1.5Mt-a新建工程環(huán)評
- 2024年T8聯(lián)考高三第二次學(xué)業(yè)質(zhì)量語文試題答案講評課件
- 【川教版】一年級上冊 《生命 生態(tài) 安全》第一課 我和我的布娃娃 課件
- 設(shè)備管理的標準化與規(guī)范化
- 公司組織架構(gòu)圖
- 藥品非處方藥市場調(diào)研報告
評論
0/150
提交評論