spss簡介和基本操作.ppt_第1頁
spss簡介和基本操作.ppt_第2頁
spss簡介和基本操作.ppt_第3頁
spss簡介和基本操作.ppt_第4頁
spss簡介和基本操作.ppt_第5頁
已閱讀5頁,還剩103頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、SPSS應用1:基本知識,1. SPSS簡介2. SPSS菜單命令3. SPSS數(shù)據(jù)文件的建立:變量定義及數(shù)據(jù)錄入4. SPSS數(shù)據(jù)的預處理:一些基本操作,SPSS的基本知識,1. SPSS簡介,SPSS是世界著名的統(tǒng)計分析軟件之一。經(jīng)近40余年的發(fā)展,在全球已擁有大量的用戶。目前,SPSS使用Windows的窗口方式展示各種管理和分析數(shù)據(jù)的方法,可方便地用于特定的科研統(tǒng)計。概要介紹SPSS的發(fā)展、主要版本、運行方式、啟動與退出以及幫助系統(tǒng)的使用。,1.1 SPSS的發(fā)展,1968年,3位美國斯坦福大學的學生開發(fā)了最早的SPSS系統(tǒng),并基于這一系統(tǒng)于1975年在芝加哥合伙成立了SPSS公司。

2、SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等。 SPSS最初名為社會學統(tǒng)計軟件包(Solutions Statistical Package for the Social Sciences),這是為了強調(diào)其社會科學應用的一面(因為社會科學研究中的許多現(xiàn)象都是隨機的,要使用統(tǒng)計學和概率論的定理來進行研究)。 但是隨著SPSS產(chǎn)品服務領域的擴大和服務深度的增加,SPSS公司已于2000年正式將英文全稱更改為“統(tǒng)計產(chǎn)品與服務解決方案” (Statistical Product and Service Solutions)。,1.2 SPSS的版本,到目前為止,SPSS已成為適合于D

3、OS,Windows,UNIX,Macintosh及OS/2等多種操作系統(tǒng)使用的產(chǎn)品,國內(nèi)常用的是其適用于DOS和Windows的版本。 SPSS for DOS通常稱為SPSS/PC+,現(xiàn)已較少使用。 2009年4月9日 美國芝加哥SPSS公司宣布重新包裝旗下的SPSS產(chǎn)品線,定位為預測統(tǒng)計分析軟件(Predictive Analytics Software) PASW,IBM于2009年7月28日宣布以12億美元收購SPSS公司,SPSS正式成為IBM Information Management產(chǎn)品線下品牌。 2010年:隨著SPSS公司被IBM公司并購,各子產(chǎn)品家族名稱前面不再以PAS

4、W為名,修改為統(tǒng)一加上IBM SPSS字樣。,1.2 SPSS的版本,SPSS版本升級在近幾年非???,目前市場上已出現(xiàn)IBM SPSS Statistics 21.0。 spss17.0版本占用空間小且運行快,非常適合使用。 PASW 18.0具有過度性, IBM SPSS Statistics 19.0在最新教材中開始使用。19.0是多國語言版。 SPSS的系列產(chǎn)品有 SPSS Statistics (統(tǒng)計分析軟件),SPSS Collection(數(shù)據(jù)收集產(chǎn)品),SPSS Modeler(數(shù)據(jù)挖掘產(chǎn)品)等。SPSS功能強大,在國際學術界有條不成文的規(guī)定,即在國際學術交流中,凡是使用SPSS

5、完成的計算和統(tǒng)計分析,可以不說明算法,可見該軟件的影響之大和信譽之高。,1.3 SPSS的運行方式,SPSS主要有3種運行方式: 完全窗口菜單運行方式:錄入數(shù)據(jù)后,大部分操作和統(tǒng)計方法的實現(xiàn)都是通過菜單、圖標和對話框來完成 批處理方式和程序運行方式是從使用者的特殊的分析需求出發(fā),編寫SPSS命令程序,通過語句直接運行的。,圖1-1 命令(Syntax)窗口/語法窗口,1.4.1 安裝與啟動SPSS,1.4 SPSS的啟動、主界面和退出,SPSS安裝完畢后,系統(tǒng)會自動在Windows菜單中創(chuàng)建快捷方式。,1.4.2 SPSS的數(shù)據(jù)編輯窗口,SPSS主界面主要有兩個,一個是SPSS數(shù)據(jù)編輯窗口,另

6、一個是SPSS輸出窗口。 數(shù)據(jù)編輯窗口由標題欄、菜單欄、工具欄、編輯欄、變量名欄、內(nèi)容區(qū)、窗口切換標簽頁和狀態(tài)欄組成,如圖1-2所示。,圖1-2 數(shù)據(jù)編輯窗口,標題欄,菜單欄,編輯欄,變量名欄,內(nèi)容區(qū),窗口切,換標簽,頁,狀態(tài)欄,工具攔,該窗口下方有兩個標簽:“Data View”(數(shù)據(jù)視圖)和“Variable View”(變量視圖)。 如果使用過電子表格,如Microsoft Excel等,那么數(shù)據(jù)編輯窗口中“Data View”所對應表格許多功能應該已經(jīng)熟悉。但是它和一般的電子表格處理軟件還有以下區(qū)別。,(1)一個列對應一個變量,即每一列代表一個變量(Variable)或一個被觀測量的特

7、征。例如問卷上的每一項就是一個變量。 (2)行是觀測,即每一行代表一個個體、一個觀測、一個樣品,在SPSS中稱為事件/個案(Case)。例如,問卷上的每一個人就是一個觀測。,(3)單元包含值,即每個單元包括一個觀測中的單個變量值。單元(Cell)是觀測和變量的交叉。 (4)數(shù)據(jù)文件是一張長方形的二維表。數(shù)據(jù)文件的范圍是由觀測和變量的數(shù)目決定的??梢栽谌我粏卧休斎霐?shù)據(jù)。如果在定義好的數(shù)據(jù)文件邊界以外鍵入數(shù)據(jù),SPSS將數(shù)據(jù)長方形延長到可包括那個單元和文件邊界之間的任何行和列。,1.4.3 SPSS結果輸出窗口,SPSS結果輸出窗口名為Viewer,它是顯示和管理SPSS統(tǒng)計分析結果、報表及圖形

8、的窗口??梢詫⒋舜翱谥械膬?nèi)容以結果文件.spv的形式保存。,結果輸出部分分成左右兩個部分,左邊部分是索引輸出區(qū),用于顯示已有的分析結果標題和內(nèi)容索引;右邊部分是各個分析的具體結果,稱為詳解輸出區(qū)。這和Word的文檔結構視圖十分類似。編輯輸出的表格時,可以雙擊在輸出窗口中顯示,也可以在點“透視透視托盤”在新的窗口顯示。編輯圖形可以雙擊或者點右鍵選擇,1.4.4 退出SPSS,選擇數(shù)據(jù)編輯窗口的“File”菜單中的“Exit”命令,或單擊標題欄上的“關閉”按鈕退出SPSS。,1.4.5 有關統(tǒng)計方法指導,SPSS對一些基本模塊中的統(tǒng)計提供了Statistics Coach幫助,也就是“手把手”式的

9、指導,2. SPSS菜單命令,2.1 基本菜單欄,SPSS中英文界面的轉換,當首次安裝軟件時,SPSS界面為英文顯示,此時可以采用如下方法將其轉換為中文界面。 1. 選擇菜單欄中的【Edit(編輯)】菜單中的【Option(選項)】命令。 2.在彈出的對話框的【User Interface(用戶界面)】選項卡的【Language(語言)】選項組中點選【Simplified Chinese(簡體中文)】單選鈕,表示選定軟件中文界面顯示。 3.最后單擊【OK(確定)】按鈕,表示SPSS軟件的界面語言轉換過程結束。 如果需要從中文界面轉換為英文界面,也可按照上述操作來實現(xiàn)。,3. SPSS的數(shù)據(jù)文件

10、建立變量定義及數(shù)據(jù)錄入,3.1 變量的定義 3.2 創(chuàng)建和讀取SPSS數(shù)據(jù)文件 3.3 變量及數(shù)據(jù)顯示的相關設置,3. SPSS的變量定義及數(shù)據(jù)錄入,1.SPSS數(shù)據(jù)的屬性及其定義方法,一個完整的SPSS數(shù)據(jù)結構包括: 變量名、變量類型、變量取值的長度、變量名標簽、變量的小數(shù)點位數(shù)、變量名的標簽、變量值的標簽、缺失值的定義、變量在數(shù)據(jù)窗口顯示的長度、變量在數(shù)據(jù)格中的對齊方式、度量的尺度(變量取值的測量類型)、角色(定義變量在后繼分析中的功能作用,目標:輸出變量;分區(qū):劃分樣本),3.1 變量的定義,3.1.1 變量名,首字符必須是字母或漢字,后面可以是除(!、?*)之外的任意字符。 變量名的結

11、尾不能是圓點、句點、下劃線 變量名的長度:版本差異 變量名必須唯一,不可以有空格,不區(qū)分大小寫 SPSS的保留字不能作為變量名(ALL、NE、LE、BY、GE、EQ、GT、AND、OR、NOT、WITH等) 如不指定變量名,則系統(tǒng)默認變量名以VAR開頭后面跟5個數(shù)字 為了便于記憶和理解,變量名與其所代表的具體含義最好一致。,3.1.2 變量的類型(Type),數(shù)值型:根據(jù)其功能和形式又可細分為(標準數(shù)值型、逗號型、句點型、科學計數(shù)型、美元型和自定義貨幣型)默認長度為8,小數(shù)位數(shù)為2 字符串型 日期型 系統(tǒng)默認為標準數(shù)值型,(1) 數(shù)值型變量,標準型:是SPSS默認的類型,寬度8、小數(shù)點2、小數(shù)

12、點用圓點。 科學計數(shù)類型:適合數(shù)值很大或很小的變量,變量顯示為指數(shù)形式。如:-1.28E+002表示-1.28102 逗號型(comma ):整數(shù)部分從右到左每三位用,分割 圓點型(Dot):整數(shù)部分從右到左每三位用.分割,小數(shù)點用,表示 美元型(Dollar) 自定義貨幣型,(2) 日期型變量(Date),用于表示日期和時間的變量類型SPSS提供了多達29種日期型變量的格式.,(3) 字符型變量(String),是非數(shù)值型變量類型,其值是由字符串組成的.對其定義的對話框只有一個輸入項,不參與運算,且區(qū)分大小寫,(4) 修改數(shù)據(jù)變量的默認值,對于SPSS變量的參數(shù),系統(tǒng)都會自動給出默認值.也可

13、通過Edit菜單中的Data對話框重新設置,點擊,3.1.3 變量標簽(Label),變量名標簽(variable label) 對變量名含義的進一步補充說明。,變量值標簽(alue Label) 是對數(shù)值型變量各個取值的含義給予進一步的解釋和說明,3.1.4 變量缺失數(shù)據(jù)(missing value),系統(tǒng)默認無缺失值:如當前變量測試值、記錄完全正確、無遺漏,則可用無缺失值。,離散缺失值:如性別0、3、4都是非法的,可分 別填入,點擊,定義缺失值范圍:這種缺失值針對連續(xù)的變量值。當指定某一范圍的值出現(xiàn)在當前定義的變量中,則被當作缺失值處理。如在性別變量值中輸入了3、4、5、6??梢栽贚OW后

14、面輸入3,HIGHT后面輸入6。注意這個定義范圍內(nèi)不能有合法值。,”0“就是包括不了的離散值,如果不能明確數(shù)據(jù)中可能存在的缺失值,可以選擇“數(shù)據(jù)定義變量屬性”來確認。 SPSS默認缺失值用一個圓點表示,3.1.5 度量標準,度量(S):定距 (scale)以上尺度,包括定距和定比尺度,可以表示如溫度、重量等含義的連續(xù)性數(shù)值變量,也可以表示年齡、次數(shù)等離散型變量.還可以表示時間的日期變量或者貨幣的貨幣型變量,但不能是字符型變量. 序號(O):定序尺度(ordinal),其值表示一種順序的前后,如職稱變量可分為高中低三個檔次,可用A(1)、B(2)、C(3)表示,定序型變量可以是數(shù)值型也可以字符型

15、 名義(N):即定類尺度(nominal) ,該變量不存在變量值之間的大小、順序的前后等。只表示屬于的類別。如性別中“1”表示男,“2”表示女等,可以是數(shù)值型也可以字符型,3.2 創(chuàng)建和讀取SPSS數(shù)據(jù)文件,SPSS數(shù)據(jù)文件由數(shù)據(jù)結構和數(shù)據(jù)內(nèi)容構成, 結構規(guī)定了數(shù)據(jù)文件的基本構成屬性 (變量名、變量類型、變量名標簽、變量值標簽、缺失值定義、度量尺度及數(shù)據(jù)顯示屬性如寬度列寬度和對齊方式等) 如一個班考試成績表包含姓名、考號、各科科目成績(英語、數(shù)學、政治、專業(yè))等六個變量。對每一個變量定義其屬性,如“姓名”變量定義為字符型、寬度定義為8個字符,度量尺度為定類型,由于變量含義清楚,無須定義變量標簽

16、和變量值標簽,缺失值默認為0,3.2 創(chuàng)建和讀取SPSS數(shù)據(jù)文件,1. 在“變量視圖”窗口定義變量及其變量的屬性 2.在“數(shù)據(jù)視圖” 窗口錄入數(shù)據(jù)文件的內(nèi)容 瀏覽數(shù)據(jù)文件變量名的三種方法 在Variable View視區(qū)中瀏覽 在SPSS菜單中選擇實用程序Utilities Varibles 在SPSS主界面選擇File Display Date File information,3. 2 創(chuàng)建和讀取SPSS數(shù)據(jù)文件,當變量的屬性定義完成后就可以開始進行數(shù)據(jù)的輸入 切換窗口從Variables View Date View出現(xiàn)了二維的空白表格如Excel(見03 Date1) Enter輸入一

17、列相同參數(shù) Tab 輸入一行同一案例的數(shù)據(jù)Shift+Tab光標左移,多項選擇題的變量定與編碼 不定項選擇:每個選項看作一個變量,選則編碼為1,不選則編碼為0 定項選擇:限選幾項就定義幾個變量,編碼與單項選擇一樣 排序題:根據(jù)參與排序的選項數(shù)目定義變量個數(shù),編碼與單項選擇一樣 開放式問題的編碼:時候抽查部分問卷結果確定 缺失值編碼:沒有回答的問題,用研究者容易識別的數(shù)字表示,SPSS數(shù)據(jù)的編輯,保證錄入的數(shù)據(jù)準確無誤,需要對SPSS數(shù)據(jù)進行修改、刪除、插入、復制、定位等操作。,3.2 創(chuàng)建和讀取SPSS數(shù)據(jù)文件,缺失值的處理方法:轉換替換缺失值 刪除法:刪除所有缺失值,但會減少樣本容量 插補法

18、:在計算相關系數(shù)時,去掉這些位置上的缺失數(shù)據(jù)上的點,以最可能的值來插補缺失值。信息缺失少,該變量的所有非缺失值的均數(shù)做替代,用缺失值相鄰點的非缺失值的均數(shù)做替代,用缺失值相鄰點的非缺失值的中位數(shù)做替代,用該列數(shù)據(jù)缺失值前一個數(shù)據(jù)和后一個數(shù)據(jù)建立插值直線,然后用缺失點在線性插值函數(shù)的函數(shù)值填充該缺失值,應用缺失值所在的整個序列建立線性回歸方程,然后用該回歸方程在缺失點的預測值填充缺失值,例:對“就業(yè)意愿.Sav”數(shù)據(jù)中的工資缺失值進行替換 執(zhí)行如下操作,在數(shù)據(jù)窗口中會出現(xiàn)一個無缺失值的新變量,選擇進入缺失值分析的變量,分析時按列表排除個案,按配對的方式對缺失值進行分析,用Expectationt

19、 Maxiumum方法對缺失值進行修補,用線性回歸的方法對對缺失值進行修補,缺失值的分析方法:分析缺失值分析,3.2 創(chuàng)建和讀取SPSS數(shù)據(jù)文件,直接通過SPSS數(shù)據(jù)編輯窗口定義變量輸入數(shù)據(jù)(如前所述) 通過打開不同格式的數(shù)據(jù)文件,間接創(chuàng)建SPSS數(shù)據(jù)文件。 支持*.doc,*.xls,*.txt等,保存SPSS數(shù)據(jù),經(jīng)讀取、修改后把SPSS窗口的數(shù)據(jù)以數(shù)據(jù)文件的形式保存到外部的儲介質中。,3. 2創(chuàng)建和讀取SPSS數(shù)據(jù)文件,3.3變量及數(shù)據(jù)顯示的相關設置,編輯選項,3.3 變量顯示的相關設置,在數(shù)據(jù)窗口及分析窗口,順序顯示的規(guī)則,角色設置:輸入(自變量),輸出(因變量),分區(qū)(區(qū)分、檢驗、驗

20、證樣本,無(無角色分配),設置單元格的度量單位,程序運行結果顯示方式,設置輸出文字的字體、顏色、大小等,設置數(shù)據(jù)處理過程的更新方式、新變量的顯示格式、隨機數(shù)的生成等,先掛起,下次用到再計算,可加快速度,新的生成器,設置輸出結果中的標簽選項(可以方便的觀察個變量的實際意義),設置輸出窗口的圖形默認參數(shù):比例、邊框、線形、顏色、填充方式等,指定新輸出圖表的填充方式,圖表邊框設置,即:要點表,能方便地改變表格行、列的交叉顯示方式,設置樞紐表的顯示風格、調(diào)整列款方式和編輯模式等,最近使用的文件列表,在文件下拉菜單最近使用的文件的顯示數(shù)量,為缺失值的標記和生成可能的數(shù)值進行設定,4. SPSS數(shù)據(jù)的預處

21、理:一些基本操作,4. SPSS數(shù)據(jù)的預處理:一些基本操作,4.1 個案標識,4. SPSS數(shù)據(jù)的預處理:一些基本操作,4.1 個案標識 數(shù)據(jù)檢查,識別無效個案、變量或數(shù)值,并采取糾偏措施,標識出異常個案 (1)數(shù)據(jù)驗證:數(shù)據(jù)驗證驗證數(shù)據(jù) 首先要定義驗證規(guī)則 單變量規(guī)則:對單一變量的特定檢查(SPSS提供了一些單變量驗證規(guī)則) 交叉變量規(guī)則:變量之間關系,邏輯表達式 操作: (2)標識重復個案:數(shù)據(jù)標識重復個案 (3)標識異常個案:數(shù)據(jù)標識異常個案,4. SPSS數(shù)據(jù)的預處理:一些基本操作,4.2 個案排序:數(shù)據(jù)排序個案 按照某個變量進行排序:于數(shù)據(jù)的瀏覽,有助于了解數(shù)據(jù)的取值狀況、缺失值數(shù)量

22、的多少等;快捷的找到數(shù)據(jù)的最值,進而可計算數(shù)據(jù)的全距,初步把握離散程度;發(fā)現(xiàn)數(shù)據(jù)的異常值等。 舉例:將“休閑調(diào)查”數(shù)據(jù)文件按照“年齡”和“住房面積”兩個變量重新排序。 應用舉例: 2005GDP.sav列出了2005年我國部分省份的地區(qū)生產(chǎn)總值及第一產(chǎn)業(yè)、第二產(chǎn)業(yè)和第三產(chǎn)業(yè)的生產(chǎn)總值,請根據(jù)這些數(shù)據(jù)分析不同省份經(jīng)濟發(fā)展狀況的差異性。,4. SPSS數(shù)據(jù)的預處理:一些基本操作,4.3 變量排列:數(shù)據(jù)排列變量 操作與個案排序相似,選擇之后可以形成一個新變量,用于恢復原來的變量排序,4. SPSS數(shù)據(jù)的預處理:一些基本操作,4.4 數(shù)據(jù)文件的轉置:數(shù)據(jù)轉置 對社會調(diào)查結果的分析,有時既需要對變量進行

23、分析,也需要對個案進行分析。SPSS主要是針對變量進行分析的,而需要對個案進行分析時,需要先把個案轉變成變量。 轉置之后會形成一個新的數(shù)據(jù)文件 例:對數(shù)據(jù)文件“休閑調(diào)查1”中的“滿意度1”、至“滿意度7”、進行轉置。,名稱變量:可以使數(shù)據(jù)文件中的序號變量,也可以使在每個個案上取值都是唯一的變量。在轉置后的文件中,名稱變量的值稱為新變量的變量名。,4. SPSS數(shù)據(jù)的預處理:一些基本操作,4.5 合并文件:數(shù)據(jù)合并文件 添加個案:即觀測量合并,將兩個文件的個案合并在一起,具體事把外部文件的與當前工作文件具有相同變量的觀測量添加到當前工作文件中 添加變量:將兩個文件的變量合并在一起 直接合并: 按

24、關鍵變量合并: 注意:按某一關鍵變量進行合并,需要先對兩個數(shù)據(jù)文件按照該關鍵變量進行升序排序,4. SPSS數(shù)據(jù)的預處理:一些基本操作,4.5合并 文件:數(shù)據(jù)合并文件 例1:將“休閑調(diào)查1”和 “休閑調(diào)查2”中的個案合并,合并過程中對不匹配的變量要作出處理(進入新變量or不進入) 例2:已知固定投資1.sav、固定投資2.sav和固定投資3.sav中的數(shù)據(jù)是部分省市在2005年部分行業(yè)的固定投資額(億元)數(shù)據(jù),分別執(zhí)行個案合并( 固定投資1.sav+固定投資2.sav,省份不同但行業(yè)類型相同)和變量合并( 固定投資1.sav、固定投資3.sav,省份相同但行業(yè)類型不同 )。,非成對變量即兩個數(shù)

25、據(jù)文件不匹配的變量,兩個文件中變量名不相同的變量,或者變量名雖相同但變量定義不同的變量。,選中則生成一個新的變量,用于表明每個個案的來源:是來自當前文件還是外部文件,已排除的變量:兩文件中的同名變量,關鍵變量:兩文件中的相同變量(變量名、變量類型、變量值排序完全相同),4. SPSS數(shù)據(jù)的預處理:一些基本操作,4.6分割文件:數(shù)據(jù)拆分文件 (為了后繼分析) 兩種分割形式: 比較組:分割之后,進行其它分析,輸出分析結果時,各組分析結果放在同一表格中,可對比 按組織輸出:分割之后,進行其它分析,輸出分析結果時,單獨顯示每一分組的分析結果 舉例:將“職工工資.sav”數(shù)據(jù)按“行業(yè)類型”變量進行分割,

26、并分別統(tǒng)計不同組的平均值 將“休閑調(diào)查1.sav”數(shù)據(jù)按“性別”變量進行分割,可以選擇多個變量進入,4. SPSS數(shù)據(jù)的預處理:一些基本操作,4.7數(shù)據(jù)重組:數(shù)據(jù)重組 分析數(shù)據(jù)時,常常需要分析變量隨著某個條件如何變化,而在數(shù)據(jù)文件中關于變量的信息可能位于多個列中,關于個案的信息可能位于多個行中。如果分析所需要的數(shù)據(jù)結構與當前的數(shù)據(jù)文件中的結構不符合,則就需進行重組來變換數(shù)據(jù)結構。,4. SPSS數(shù)據(jù)的預處理:一些基本操作,4.7數(shù)據(jù)重組:數(shù)據(jù)重組 個案組結構:變量與因子記錄在單獨的列中,一個因子的每個水平占一行或不止一行,一個因子的若干水平稱為一個個案組。在SPSS數(shù)據(jù)分析中,當數(shù)據(jù)以這種方式

27、構造時,因子通常稱為分組變量。(單因素方差分析、多因素方差分析、獨立樣本體檢驗等) 變量組結構:變量與因子記錄在同一列中,一個因子的每個水平占一列,一個因素的若干列稱為一個變量組。在SPSS數(shù)據(jù)分析中,當數(shù)據(jù)以這種方式構造時,因子通常稱為重復度量。(重復測量的方差分析、協(xié)方差分析、配對樣本T檢驗),肥料的不同水平,高度的不同水平,變量或因素,4. SPSS數(shù)據(jù)的預處理:一些基本操作,以文件“西紅柿.sav”為例 數(shù)據(jù)重組 選擇“將個案 重組為變量”,肥料的不同水平,高度的不同水平,變量或因素,選擇個案組的標識符變量或索引變量,用于標識個案組的變量,以便能將每個組合并到新文件的單獨一行中,用于組

28、成新變量組的變量,選擇是否對當前數(shù)據(jù)進行排序。系統(tǒng)根據(jù)上一步選擇的標識符變量,每次遇到標識值的新組合時,將創(chuàng)建一個新行,因此當前文件的個案應按標識符變量的值排序,順序與“標識符變量”列表中列出變量的順序相同。 選擇:是 下一步,設置應用于重組數(shù)據(jù)文件的選項,用于表明觀測的一個值是 出現(xiàn)(1)還是缺失(2),用于在心數(shù)據(jù)文件中創(chuàng)建行的 當前數(shù)據(jù)中的行數(shù),完成操作 還可以反過來操作,把變量組結構轉換為個案組結構。不再講解!,用于表明觀測的一個值是 出現(xiàn)(1)還是缺失(2),用于在心數(shù)據(jù)文件中創(chuàng)建行的 當前數(shù)據(jù)中的行數(shù),4. SPSS數(shù)據(jù)的預處理:一些基本操作,4.8 分類匯總:數(shù)據(jù)分類匯總 以指定

29、分類變量的取值為依據(jù),將另一個或多個變量按照分類的結果進行統(tǒng)計,并將統(tǒng)計結果生成新的數(shù)據(jù)文件 分類變量必須為定序變量或定類變量 匯總變量必須為定序及以上的數(shù)值型變量 例:對“考試成績”中的各門課程按照“班級號”分類,以各科成績的平均值為內(nèi)容進行分類匯總 將“班級號”進入到“分組變量”中,將五門課程進入到“匯總變量”中,此時激活下面的兩個按鈕:“函數(shù)”,“變量名和標簽”,這兩個按鈕就是要輸出的匯總變量的描述統(tǒng)計內(nèi)容。 選定“個案數(shù)”,命名文件,然后選擇存放地址,決定了按照什么量合并,4. SPSS數(shù)據(jù)的預處理:一些基本操作,4.9 選擇個案/數(shù)據(jù):數(shù)據(jù)篩選,選出符合需要的數(shù)據(jù),分析時只對這些數(shù)據(jù)

30、進行分析。數(shù)據(jù)選擇個案 舉例:在“休閑調(diào)查1”中選擇年齡50歲以上的個案 ;從前100個個案中隨機選擇30個個案;選擇第3到第6個個案;選擇文化程度為過濾變量,在該變量中有缺失值的個案將被過濾掉,4. SPSS數(shù)據(jù)的預處理:一些基本操作,4.10 數(shù)據(jù)加權:數(shù)據(jù)加權個案 加權操作對于列聯(lián)表分析非常重要,在繪制散點圖、直方圖以及回歸分析等過程中都非常重要。 某經(jīng)銷商希望掌握菜市場的蔬菜銷售的平均價格,收集數(shù)據(jù)見數(shù)據(jù)文件“蔬菜銷售.sav”?,F(xiàn)請利用這些數(shù)據(jù),求出這些蔬菜的平均價格。,分析:由于經(jīng)銷商要求掌握蔬菜的平均價格,如果僅僅只用蔬菜的單價進行簡單的算術平均是很不合理的,這是因為不同蔬菜的銷

31、售量不同,所以要考慮銷售量對平均價格的影響。因此,我們以蔬菜的銷售量為權重計算各種蔬菜銷售的平均價格更為合適。 這里選擇“銷售量”變量作為權重變量,將其放入頻率變量列表框中,此時就可以進行后續(xù)的求平均值工作了。,4. SPSS數(shù)據(jù)的預處理:一些基本操作,4.11 SPSS運算符與函數(shù),4. SPSS數(shù)據(jù)的預處理:一些基本操作,4.11 變量計算:轉換計算變量 目的:產(chǎn)生新變量,例如根據(jù)職工的基本工資、失業(yè)保險、獎金等數(shù)據(jù),計算實際月收入;對原變量進行必要的轉換處理(尤其是對數(shù)據(jù)的原有分布狀態(tài)進行轉換),由于數(shù)據(jù)分析和建模中某些模型對數(shù)據(jù)的分布有一定的要求,因此可以利用變量計算對原有數(shù)據(jù)的分布進

32、行轉換。如預測問題、產(chǎn)生比率數(shù)據(jù)、偏態(tài)數(shù)據(jù)的正態(tài)處理、時間序列的平穩(wěn)處理等。 包括變量的重置和計算,4. SPSS數(shù)據(jù)的預處理:一些基本操作,4.11 變量計算:轉換計算變量 (1)變量的重置: 例:“貧困調(diào)查”數(shù)據(jù)是2006年在哈爾濱和沈陽進行的,當時詢問的是被調(diào)查者的出生年份,現(xiàn)將該變量的內(nèi)容重置為年齡。 解:定義年齡變量,年齡=2006-出生年份,輸入“數(shù)字表達式”內(nèi),確定即可 例:在上例數(shù)據(jù)中,將來自哈爾濱的個案的問卷編號前加1,來自沈陽的個案問卷編號前加2。 解:單擊對話框中的if按鈕,選擇”如果個案滿足條件則包括”,輸入“所在城市=1”,繼續(xù),回到原對話框,在“數(shù)字表達式”中輸入:

33、問卷編號+1000。同理,沈陽的也如此操作。,4. SPSS數(shù)據(jù)的預處理:一些基本操作,4.11 變量計算:轉換計算變量 (2)新變量的生成: 例: “貧困調(diào)查”數(shù)據(jù)中的“糧油”、“副食”、“水果”三個變量是貧困家庭的食品總支出,變量“總支出”是貧困家庭一個月所有支出之和,計算貧困家庭的恩格爾系數(shù)。 解:恩格爾系數(shù)=食品總支出/總支出 =(糧油 + 副食 + 水果) / 月支出,4. SPSS數(shù)據(jù)的預處理:一些基本操作,4.12 計數(shù)過程:轉換對個案內(nèi)的值計數(shù) 計算一些變量在同一個觀測量中滿足要求的特定變量值出現(xiàn)的次數(shù)。例如:在產(chǎn)品市場調(diào)查中,要了解被調(diào)查者中有多少人使用過該產(chǎn)品。 例:利用我國城鄉(xiāng)消費價格分類指數(shù)數(shù)據(jù)(數(shù)據(jù)文件

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論