SPSS數(shù)據(jù)的錄入_第1頁
SPSS數(shù)據(jù)的錄入_第2頁
SPSS數(shù)據(jù)的錄入_第3頁
SPSS數(shù)據(jù)的錄入_第4頁
SPSS數(shù)據(jù)的錄入_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第一講,數(shù)據(jù)輸入,學習目的,學會常用數(shù)據(jù)的錄入方法 掌握資料錄入前的工作,整理課件,3,本章主要內(nèi)容,一 錄入數(shù)據(jù) 錄入單選數(shù)據(jù) 錄入多選數(shù)據(jù) 二 統(tǒng)計分析前的準備工作,包括: 資料的審查 資料編碼,一 錄入單選數(shù)據(jù),變量/指標名稱 變量/指標類型 變量/指標的顯示方式 錄入數(shù)據(jù),整理課件,5,SPSS11.0變量定義項目,SPSS11.0中變量定義的一共有10個項目:變量名(name)、變量類型(type)、變量長度(width)、小數(shù)位數(shù)(decimals)、變量標簽(label)、變量值標簽(values)、缺省值(missing)、變量顯示寬度(columns)、變量對齊方式(alig

2、n)、變量測量尺度(measure)。 注意區(qū)分變量的標簽(Variable Labels)與變量值的標簽(Value Labels)。,整理課件,6,定義變量,步驟: 首先啟動SPSS,進入 SPSS 的主畫面 - 數(shù)據(jù)編輯窗口 激活定義變量對話框 定義變量名 定義變量類型 定義變量標簽和變量值標簽 定義變量的顯示格式,整理課件,7,定義變量名 定義變量名應遵循如下原則: (1)變量名最長不超過8個字符(4個漢字)。 (2)首字符必須是英文字母或漢字,不能以下劃線“”或圓點“.”結(jié)尾。 (3) 變量名不能使用SPSS的保留字。SPSS的保留字有:ALL、AND、BY、OR、NOT、EQ、GE

3、、GT、LE、LT、NE、TO、WIIH等。 (4)變量名中不能有空格或某些特殊符號,如!、?和等。 (5)系統(tǒng)中不區(qū)分變量名中的大小寫字符。例如WANG與wang被認為是同一變量。,整理課件,8,定義變量標簽(Variable Label),定義標簽是對該變量名所表示的數(shù)據(jù)項內(nèi)涵的進一步說明。由于變量名最多只能由8個字符組成,8個字符不足以表示該變量的內(nèi)涵。而變量標簽最多可由256個字符組成。在統(tǒng)計分析過程的輸出中會在變量名對應的位置顯示該變量的標簽,有助于理解輸出結(jié)果。變量標簽為可選項(option),可以定義,也可以不定義。,整理課件,9,定義變量取值標簽(Value label),每個

4、變量名對應一個數(shù)據(jù)項,每個變量取不同的值,表示數(shù)據(jù)項中的不同信息。有時為了更好理解統(tǒng)計分析過程中的輸出結(jié)果,要給變量的取值(簡稱變量值)賦以標簽。那么在輸出結(jié)果的相應位置上就會出現(xiàn)該標簽,使讀者一目了然。并不是所有變量值都要取標簽,一般來說離散變量才給變量值定義標簽。,整理課件,10,例如:變量名 變量值 變量取值(標簽)Gender 1 男2 女,整理課件,11,定義變量類型,變量類型種類(見下表): Numeric“ 標準數(shù)值型變量,系統(tǒng)默認 Comma 帶逗點的數(shù)值型變量:千進位用逗號分隔, 小數(shù)與整數(shù)間用圓點分隔 “Dot” 圓點數(shù)值型變量:千進位用圓點分隔,小數(shù)與整數(shù)間用逗號分隔 “

5、Scientific notation” 科學計數(shù)法 “Date” 日期型變量 “Dollar” 帶美元符號的數(shù)值型變量 “Custom currency” 自定義變量 String 字符型變量,整理課件,12,變量的類型,整理課件,13,概率事件(觀測量):在數(shù)據(jù)編輯器的二維表中, 每列為一個變量,每行記錄 一次觀測(Case),一次觀 測的值,輸入數(shù)據(jù),數(shù)據(jù)編輯器,錄入數(shù)據(jù),整理課件,14,定義缺省值,整理課件,15,數(shù)據(jù)錄入,數(shù)據(jù)錄入的一般方式: (1)按變量輸入數(shù)據(jù) (2)按觀察序號輸入數(shù)據(jù) (3)按全屏幕任意單元格輸入數(shù)據(jù),整理課件,16,保存數(shù)據(jù),單擊保存類型列表框,可以看到SPS

6、S所支持的各種數(shù)據(jù)類型,有DBF、FoxPro、EXCEL、ACCESS等,這里我們?nèi)匀粚⑵浯鏋镾PSS自己的數(shù)據(jù)格式(*.sav文件)。在文件名框內(nèi)鍵入變量名并回車,可以看到數(shù)據(jù)管理窗口左上角由Untitled變?yōu)榱爽F(xiàn)在的新變量名。,SPSS for Windows提供兩種數(shù)據(jù)保存方式:1.保存為SPSS for Windows數(shù)據(jù)文件中2.保存為其他格式的數(shù)據(jù)文件SPSS的文件類型數(shù)據(jù)文件:擴展名為.sav結(jié)果文件:擴展名為.spo圖形文件:擴展名為.cht命令文件:擴展名為.sps,整理課件,18,SPSS11.0中變量定義的操作,單擊Variable View 進入;,單擊, 定義 變

7、量 名,單擊,定義變量類型,定義變量標簽,變量標簽值,定義測度層次,定義變量寬度,定義對齊方式,定義變量類型對話框,定義變量標簽值對話框,定義變量定義缺省值對話框,整理課件,19,資料審查 資料編碼,一、統(tǒng)計分析前的準備工作,整理課件,20,資料審查,主要考察三個方面: 資料的完整性 資料的統(tǒng)一性 資料的合格性,整理課件,21,資料的完整性,包括資料總體上的完整性和每份資料的完整性。 資料總體的完整性主要考慮問卷發(fā)放的數(shù)量、回收率等。 每份資料的完整性主要看問卷的填答情況,是否是有效問卷。,整理課件,22,資料的統(tǒng)一性審查,檢查所有問卷、報表填答的方法是否統(tǒng)一。 檢查統(tǒng)一指標的數(shù)值所使用的量度

8、單位是否統(tǒng)一,不同的表格對同一指標所使用的計算方法是否統(tǒng)一。 對于統(tǒng)計資料,尤其要注意: 指標的定義和分析的標準是否與自己的研究分類相一致; 審查指標總體范圍是否一致,整理課件,23,資料的合格性審查,審查提供資料者的身份是否符合規(guī)定的調(diào)查對象的身份。 審查所提供的資料是否符合填答的要求。 審查所提供的資料是否正確。通常有三種方法: 判斷檢驗:依據(jù)已知情況來判斷是否真實正確。 邏輯檢驗:從資料的邏輯關(guān)系來檢驗是否正確。 計算檢驗:通過各種數(shù)字的運算來檢驗是否正確。,整理課件,24,編碼,幾個基本概念 編碼 變量與取值 變量標簽與取值標簽,整理課件,25,幾個基本概念,編碼:將文字資料轉(zhuǎn)化為數(shù)字

9、形式的過程。編碼的過程實質(zhì)上就是確定變量、變量取值以及選擇的過程,變量與變量取值 變量: 變量是概念的一種類型,是概念的具體化。概念是對研究范圍內(nèi)同一類現(xiàn)象的概括性表述。概念、變量、陳述、形式共同構(gòu)成了理論。例如,公民這一概念,具體化為一個國家的所有公民后,就成為了變量。變量反映了概念的可變動性,說明了現(xiàn)象在規(guī)模、重量、密度、速度等方面的變化。(袁方) 反映對象某一特性的指標。例如,性別、年齡等 變量取值:是變量所有可供選擇的范圍。例如性別的取值范圍是男、女,那么;年齡的取值范圍是0-100歲(當然有長壽的)。,變量標簽(label)與取值標簽(value label) 標簽:標簽是對物體的說

10、明,是對物體信息的描述。例如,中藥箱子里的標簽是提醒醫(yī)生藥的具體地點;商品標簽則說明了商品的產(chǎn)地、質(zhì)量、品牌等信息。 變量標簽是對變量的說明。例如gender=“性別” 取值標簽是對取值的說明。例如1=男,2=女。,比如:您的性別: (1)男 (2)女,變量的取值,選擇為 2,這種情況被稱為預先編碼,編碼就是確定變量、變量取值和變量取值標簽(選擇),又比如:您認為打工的外地人對太原市的社會秩序是否有影響?(單選) 1有很大影響 2有較大影響 3沒有影響 4不好說,4,編碼,選擇,這種情況被稱為邊緣編碼,整理課件,30,再比如:您有幾個兒子?幾個女兒? 1兒子_人 2女兒_人,2,3,問題,變量

11、1,變量2,變量1的值,變量2的值,還比如:請將您的父母的學歷寫在下面的橫線上。 父親:中學 母親: 小學 編碼步驟是: (1)編碼:將學歷按照“未上過學”=1,“小學”=2,“中學”=3依次列出 (2)各變量為“父親學歷、母親學歷”,取值為“未上過學,小學,中學,” (3)輸入問卷時,按照編碼中的“小學”=2,“中學=3”輸入“父親學歷 3”,“母親學歷 2”即可。,這種情況稱為事后編碼,要盡量少用。,附帶說明:關(guān)于無回答與不適用的編碼,無回答:建議采用“99”/”9”/”999”等作為無回答的編碼 不適用:采用“98”/998”等作為編碼,整理課件,33,幾種常見的編碼方式,封閉性問卷 單

12、項選擇題 多項選擇題 多項排序選擇題 固定選擇項 不固定選擇項 開放性問卷,整理課件,34,2,1,整理課件,35,有6個選項,故應設(shè)6個變量,運用0-1編碼方法 編碼,即:1,0,1,0,1,1。 此外,多選還有另外一種編碼方法,即直接編碼輸入法,編碼為1,3,5,6, , 。(此處“ ”表示無回答,我們建議使用“99”),1 3 5 6,整理課件,36,3 1 6,問題012:您擇業(yè)中考慮的主要因素有(依據(jù)重要性大小排列,限選三項),1 經(jīng)濟收入 2 專業(yè)對口 3 發(fā)展前途 4 地理區(qū)位 5 個人愛好 6 風險大小 7 勞動強度 8 社會福利 9 社會地位 10 其他,因為是依據(jù)重要性大小

13、排列,限選三項,故應設(shè)三個變量,編碼依次為3,1,6。,整理課件,37,例如:擇業(yè)中考慮的主要因素(依據(jù)重要性先后排列),1、經(jīng)濟收入 2、專業(yè)對口 3、發(fā)展前途 4、地理區(qū)位 5、個人愛好 6、風險大小 7、勞動強度 8、社會福利 9、其他,3 1 6 4 7 8 5,因為是依據(jù)重要性排列,不限制選項,故應設(shè)九個變量,編碼依次為: 3,1,6,4,7,8,5,99,99。,(利用99表示未回答或者空),整理課件,38,擇業(yè)中考慮的主要因素(多選),1、經(jīng)濟收入 2、專業(yè)對口 3、發(fā)展前途 4、地理區(qū)位 5、個人愛好 6、風險大小 7、勞動強度 8、社會福利 9、其他,編碼應為:1,0,1,1,1,0,1,1,0。 或1,3,4,5,7,8,0,0,0。(此處用0表示未選擇),應該設(shè)置9個變量,,整理課件,39,開放性問卷的處理方法,對回答進行分類。一般首先隨機抽取一部分問卷,了解回答的情況,依據(jù)回答對問卷進行分類,主要考慮語氣強弱、觀點確定等方面。 建立

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論