統(tǒng)計分析與Spss應用第二章(數(shù)據(jù)與數(shù)據(jù)文件)_第1頁
統(tǒng)計分析與Spss應用第二章(數(shù)據(jù)與數(shù)據(jù)文件)_第2頁
統(tǒng)計分析與Spss應用第二章(數(shù)據(jù)與數(shù)據(jù)文件)_第3頁
統(tǒng)計分析與Spss應用第二章(數(shù)據(jù)與數(shù)據(jù)文件)_第4頁
統(tǒng)計分析與Spss應用第二章(數(shù)據(jù)與數(shù)據(jù)文件)_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第二章 SPSS數(shù)據(jù)與數(shù)據(jù)文件 2.1 數(shù)據(jù)的來源與分類數(shù)據(jù)是數(shù)據(jù)分析的關鍵之一,數(shù)據(jù)通常和我們研究的對象聯(lián)系在一起。個體就是一組數(shù)據(jù)描述的對象;變量就是一個個體的任意特征。將數(shù)據(jù)按照不同的標準進行分類,有助于對數(shù)據(jù)來源和用途及其分析方法的深入理解和研究。2.1.1觀測數(shù)據(jù)與試驗數(shù)據(jù)觀測數(shù)據(jù):是愛自然的未被控制的條件下觀測到的數(shù)據(jù),如社會商品零售額,消費價格指數(shù),降雨量等。抽樣調(diào)查、普查都是重要的觀測研究,得到的數(shù)據(jù)是觀測數(shù)據(jù)。試驗數(shù)據(jù):是在人工干預和操縱下產(chǎn)生的數(shù)據(jù),這種數(shù)據(jù)通常來自于科學和技術試驗。 將數(shù)據(jù)分為觀測數(shù)據(jù)和實驗數(shù)據(jù)是基于觀測的對象是在自然的還是在可控的實驗條件下產(chǎn)生的。他們是

2、數(shù)據(jù)最根本的兩個來源。對這兩種類型的數(shù)據(jù)要通過建立文件才能使用SPSS進行分析。2.1.2一手數(shù)據(jù)與二手數(shù)據(jù)一手數(shù)據(jù):針對特定的研究問題,通過專門收集、調(diào)查或試驗取得的數(shù)據(jù)稱為一手數(shù)據(jù)。(要通過建立文件才能使用SPSS進行分析)二手數(shù)據(jù):由各種媒體、機構發(fā)布的數(shù)據(jù),如證券市場行情、物價指數(shù)、利率、國民生產(chǎn)總值等,對于數(shù)據(jù)分析人員來說,可以根據(jù)研究的問題,從這些數(shù)據(jù)中加以選擇,這樣間接得到的數(shù)據(jù)稱為二手數(shù)據(jù)。(要通過外部文件引入才能使用SPSS進行分析)一手數(shù)據(jù)和二手數(shù)據(jù)是根據(jù)數(shù)據(jù)分析人員獲取數(shù)據(jù)的方式是直接還是間接的來劃分的。2.1.3時間序列數(shù)據(jù)與橫截面數(shù)據(jù)這是計量經(jīng)濟學中的數(shù)據(jù)分類方法。時

3、間序列數(shù)據(jù)是對同一研究對象按時間順序收集得到的數(shù)據(jù),如國內(nèi)生產(chǎn)總值、失業(yè)率等。這類數(shù)據(jù)是按照一定的時間間隔如每日、每周、每月、每季、每年收集的;橫截面數(shù)據(jù)是指在同一時點上不同研究對象的數(shù)據(jù)的集合,如2007年滬深股市上市公司中期業(yè)績。由這兩類數(shù)據(jù)衍生出合并數(shù)據(jù),合并數(shù)據(jù)中既有時間序列數(shù)據(jù)又有橫截面數(shù)據(jù)。時間序列數(shù)據(jù)和橫截面數(shù)據(jù)是數(shù)據(jù)沿時間與個體兩個維度上的視圖。2.2 數(shù)據(jù)文件的建立建立數(shù)據(jù)文件步驟:1、定義變量:定義變量名、指定變量類型、寬度、小數(shù)位數(shù)、定義變量標簽、變量值標簽。2、數(shù)據(jù)錄入與編輯3、保存數(shù)據(jù)文件數(shù)據(jù)標識數(shù)據(jù)類型數(shù)據(jù)標識數(shù)據(jù)類型SPSS(*.sav) SPSS 數(shù)據(jù)文件(6.

4、012.0 版)SPSS/PC+(*.sys) SPSS 4.0 版數(shù)據(jù)文件Systat(*.syd) *.syd 格式的Systat 數(shù)據(jù)文件Systat(*.sys) *.sys 格式的Systat 數(shù)據(jù)文件SPSS Portable(*.por) SPSS 便攜格式的數(shù)據(jù)文件EXCEL(*.xls) EXCEL 數(shù)據(jù)文件(從5.0 版2000 版)Lotus(*.w*) Lotus 數(shù)據(jù)文件SYLK(*.slk) SYLK 數(shù)據(jù)文件dBase(*.dbf) dBase 系列數(shù)據(jù)文件(從dBaseIIIV)SAS Long File Name(*.sas7bdat) SAS 78 版長文件

5、名類型數(shù)據(jù)文件SAS Short File Name(*.sd7) SAS 78 版短文件名類型數(shù)據(jù)文件SAS v6 for Windows(*.sd2) SAS 6 版(for Windows)數(shù)據(jù)文件SAS v6 for UNIX(*.ssd01) SAS 6 版(for UNIX)數(shù)據(jù)文件SAS Transport(*.xpt) SAS 便攜格式的數(shù)據(jù)文件Text(*.txt) 純文本格式的數(shù)據(jù)文件data(*.dat) 純文本格式的數(shù)據(jù)文件 簡單數(shù)據(jù)定義和輸入實例簡單數(shù)據(jù)定義和輸入實例欲比較A公司與B公司普通員工的收入(月薪)有無差距,隨機調(diào)查了各五人,數(shù)據(jù)如下: A公司:2000,3

6、000,4000,3000,4500 B公司:3000,3000,3500,4000,5000請建立數(shù)據(jù)文件,并進行分析。2.2 .1 數(shù)據(jù)類型1. 常量與變量(1) SPSS 常量 (a)數(shù)值型常量 數(shù)值型常量就是程序在SPSS 語句中的數(shù)字,一般使用兩種書寫方式,一種是普通書寫方式例如26 、38.4 等;另一種書寫方式是科學記數(shù)法,用于表示特別大或特別小的數(shù)字例如1.23E18 、2.56E-16 等。(b) 字符串常量 字符串常量是被單引號或雙引號括起來的一串字符,如果字符串中帶有字符“ ”,則該字符串常量必須使用雙引號括起來例如 :“BOY S BOOK ”(2)SPSS 變量設計(

7、a) 為變量命名應該遵循以下幾個原則 SPSS 變量的變量名由字符組成。首字母是字母,其后可為字母或數(shù)字或除“?、!、*” 以外的字符,但應該注意不能以連接線“-”和圓點“. ” 作為變量名的最后一個字符。變量名不能與SPSS 保留字相同,SPSS 的保留字有ALL AND BY EQ GE GTLE LT NE NOT OR TO WITH系統(tǒng)不區(qū)分變量名中的大小寫字符例如ABC 和abc 被認為是同一個變量變量設計的基本原則不同觀察對象的數(shù)據(jù)不能在同一條記錄中出現(xiàn)每一個測量指標/影響因素只能占據(jù)一列的位置,即同一個指標的測量數(shù)值都應當錄入到同一個變量中去最終的數(shù)據(jù)集應當能夠包含原始數(shù)據(jù)的所

8、有信息可以出現(xiàn)違反這些原則的例外情況,如重復測量數(shù)據(jù)(b) 變量類型與默認長度 SPSS 變量有三種基本類型:數(shù)值型、字符型、日期型。定義時有以下可選的數(shù)據(jù)類型:Numeric(標準數(shù)值型) Comma(帶逗點的數(shù)值型) Dot(逗點作小數(shù)點的數(shù)值型)ScientificNotation(科學記數(shù)法) Date(日期型) Dollar(帶有美元符號的數(shù)值型) CustomCurrency(自定義型) String(字符型)(c)變量標簽和變量值標簽變量變量變量標簽變量標簽變量值變量值變量值標簽變量值標簽Gender性別性別f男男m女女Height身高身高1=1.80m返回(d) 變量的格式變量

9、值標簽是對變量的可能的取值所附加的進一步說明對分類變量往往要定義其取值標簽當然變量值標簽也是一個可選擇的屬性可以定義也可以不定義 例如: 變量 值 值標簽 Sex f Female m Male格格 式式總長總長度度小數(shù)位小數(shù)位數(shù)數(shù)格格 式式總長總長度度小數(shù)位小數(shù)位數(shù)數(shù)$# #30# # #.# 51#,# # #60#,# # # . # #82e)變量度量(Measurement)在統(tǒng)計學上按照對事物描述的精確尺度,將所采用的測量尺度從低級到高級分為4個層次:定類尺度、定序尺度、定距尺度(interval measurement)和定比尺度。下面是SPSS可以定義的變量測量尺度類型scal

10、e: 定距數(shù)據(jù)Ordinal:定序數(shù)據(jù)Nominal:定類數(shù)據(jù)2 操作符與表達式(1) 算術運算符與算術表達式(2) 比較算符與比較表達式(3) 邏輯運算符與邏輯表達式數(shù)學運算操作符 關系運算符 邏輯運算符+ 加 (GT) :大于 | Or :或* 乘 =(GE) : 大于等于* * 冪 = EQ 等于( ) 括號 = NT 不等于輸入數(shù)據(jù)之前首先要定義變量定義變量即要定義變量名、變量類型、變量長度(小數(shù)位數(shù))、變量標簽(或值標簽)和變量的格式(顯示寬度對齊方式缺失值標記等)(1) 對一般文件的變量定義(2) 調(diào)查問卷中開放題的變量定義(3)調(diào)查問卷中簡單單選題變量定義(值標簽)(4)調(diào)查問卷

11、中對多選題變量定義(a.多重二分法 b.多重分類法)2.2.2 變量的定義Data View和Variable View返回定義變量的普通方法返回定義變量類型返回定義值標簽返回定義用戶缺失值返回列格式、對齊、測度方式返回定類尺度(Nominal ):對事物的類別或?qū)傩缘囊环N測度,可按某屬性對其分類或分組定序尺度(ordinal ):對事物之間等級或順序差別的一種測度,可以比較優(yōu)劣或排序定比尺度(scale):能夠測算兩個測度值之間比值的一種計量尺度,表現(xiàn)為數(shù)值2.2.3 數(shù)據(jù)錄入與編輯數(shù)據(jù)輸入方法數(shù)據(jù)輸入方法1按變量輸入數(shù)據(jù)2按觀測量輸入數(shù)據(jù)(case)概率事件觀測量(Cases) 在數(shù)據(jù)編輯

12、器的二維表格中每行都是數(shù)據(jù)文件的一個記錄,在統(tǒng)計學中稱作一個概率事件。在SPSS 的菜單中或幫助信息中用Cases 這個單詞表示,每個Cases 是由各變量的一定的值組成,是一個事件或者說是對一個被觀測對象的各種特征的實測值組成。因此相對應變量來說可以稱之為觀測量單元格中的數(shù)據(jù)即是某個觀測量中的一個值,因此可以稱之為變量值,也可以稱之為某個觀測值,在Help 信息中往往使用Case 這個單詞。(1)對一般文件的數(shù)據(jù)錄入a按變量輸入數(shù)據(jù)b按觀測量輸入數(shù)據(jù)(case)(2) 調(diào)查問卷中開放題的數(shù)據(jù)錄入a按變量輸入數(shù)據(jù)b按觀測量輸入數(shù)據(jù)(case)(3)調(diào)查問卷中簡單單選題數(shù)據(jù)錄入a.直接錄入 b.

13、字符代碼+值標簽 c.數(shù)值代碼+值標簽(4)調(diào)查問卷中對多選題數(shù)據(jù)錄入a.多重二分法 b.多重分類法2.2.4 數(shù)據(jù)文件的保存1、 文件類型SPSS(*.sav) (6.0以上)SPSS(*.sys) (4.0版)SPSS Portable (*.por) Tab-delimited (*.dat) Fixed ASCII (*.dat) Excel (*.xls)1-2-3 Rel 3.0 (*.wk3)1-2-3 Rel 2.0 (*.wkl) 1-2-3 Rel 1.0 (*.wks)SYLK (*.slk) dBASEIV(*.dbf) dBASEIII(*.DBF) dBASEII(

14、*.dbf)2、保存數(shù)據(jù)文件、保存數(shù)據(jù)文件 在數(shù)據(jù)編輯器中定義變量輸入修改數(shù)據(jù)形成一個可供SPSS 分析的數(shù)據(jù)文件,使用Edit 菜單項中的各種功能可以對數(shù)據(jù)文件進行編輯處理。 如果將數(shù)據(jù)文件存盤磁盤數(shù)據(jù)文件的擴展名為SAV ,利用菜單項File 的Data或Save As 功能展開的對話框指定存儲路徑位置和磁盤文件名,將數(shù)據(jù)窗中的數(shù)據(jù)保存為.sav格式的數(shù)據(jù)文件或者其他的數(shù)據(jù)文件如數(shù)據(jù)庫文件等。2.2.5 數(shù)據(jù)編輯數(shù)據(jù)編輯器1.數(shù)據(jù)編輯器的組成(1) 窗口標題欄(2) 窗口狀態(tài)欄(3) 數(shù)據(jù)輸入欄(4) 數(shù)據(jù)顯示區(qū)2 數(shù)據(jù)編輯器的功能概述 (1) 變量與觀測量的編輯功能 (2) 數(shù)據(jù)編輯功能

15、已輸入數(shù)據(jù)的修改1 在一個區(qū)域中修改數(shù)據(jù)2 恢復刪除或修改前的數(shù)據(jù) 數(shù)據(jù)的剪切復制與粘貼 (1) 選擇變量 (2) 選擇觀測量 (3) 選擇屬于某個變量的若干個連續(xù)的單元格 (4) 選擇屬于某個觀測量的若干個連續(xù)的單元格 變量觀測量的插入與刪除1 插入一個變量2 刪除一個變量3 插入一個觀測量4 刪除一個觀測量 恢復刪除或修改前的數(shù)據(jù)如果對本次的修改與刪除不滿想恢復操作前的狀態(tài),只要使用鼠標單擊系統(tǒng)菜單中的Edit 展開下拉菜單選擇第一項Undo 鼠標單擊之即可2.3其他格式數(shù)據(jù)文件的導入直接打開(如excel文件)使用數(shù)據(jù)庫查詢打開使用導入向?qū)胛谋疚募?.3.1 Excel文件讀入步驟:

16、1, file-open-data 彈出文件操作對話框2,通過查找范圍查找要轉換文件所在路徑3,選擇要打開文件類型:exel(*.xls)4,找到要轉換的文件選定,按“打開”按鈕彈出一個對話框5,保留默認選項,選擇“ok”6,將讀入的文件保存file-save,選擇正確路徑,根據(jù)要求命名保存即可。2.3.2使用導入向?qū)胛谋疚募?,選擇菜單File=Read Text Data,系統(tǒng)就會彈出Open File對話框,文件類型自動跳到了Text (*.txt)。選中要讀入的文件,打開2,does your file match a preddfined format 選擇 “no”,選下一步3

17、,how are your variables arranged 一般選擇Delitmited are variable names included at the top of your file,根據(jù)御覽窗口可以看到第一行是變量還是數(shù)據(jù),一般選擇:yes ,然后選擇“下一步”4,The first cases of data begins on which默認:2(因為第一行一般是變量名)How are your cases represented?一般選擇:each lineHow many cases you want to import通常選擇:all選好后選擇“下一步”5,whic

18、h delimiters appear between variables?變量間用的哪種分隔符,一般系統(tǒng)會自己有判斷,選擇默認的即可What is the text qualifier數(shù)據(jù)中采用的是什么文本限定符,一般選擇“none”默認,但如果有,應該指定。都選擇好后按“下一步”6,specifications for variables selected in the data preview:定義在數(shù)據(jù)御覽窗口所選擇的變量。默認,選下一步7,默認,選“完成”8,將讀入的文件按要求保存2.3.3使用數(shù)據(jù)庫查詢打開數(shù)據(jù)庫文件選擇菜單File=Open Database=New Query,系統(tǒng)會彈出數(shù)據(jù)庫向?qū)У牡谝?/p>

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論