數(shù)據(jù)的編碼錄入與整理_第1頁
數(shù)據(jù)的編碼錄入與整理_第2頁
數(shù)據(jù)的編碼錄入與整理_第3頁
數(shù)據(jù)的編碼錄入與整理_第4頁
數(shù)據(jù)的編碼錄入與整理_第5頁
已閱讀5頁,還剩44頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

數(shù)據(jù)的編碼錄入與整理第1頁,課件共49頁,創(chuàng)作于2023年2月SPSS背景介紹SPSS是世界上最早的統(tǒng)計分析軟件,由美國斯坦福大學的三位研究生于1968年研開發(fā)成功,同時成立了SPSS公司,并于1975年成立法人組織、在芝加哥組建了SPSS總部。1984年SPSS總部首先推出了世界上第一個統(tǒng)計分析軟件微機版本SPSS/PC+,開創(chuàng)了SPSS微機系列產(chǎn)品的開發(fā)方向,極大地擴充了它的應用范圍,并使其能很快地應用于自然科學、技術科學、社會科學的各個領域。世界上許多有影響的報刊雜志紛紛就SPSS的自動統(tǒng)計繪圖、數(shù)據(jù)的深入分析、使用方便、功能齊全等方面給予了高度的評價。2009年7月28日,IBM公司宣布將用12億美元現(xiàn)金收購統(tǒng)計分析軟件提供商SPSS公司。如今SPSS已出至版本20.0,而且更名為IBMSPSS。它和SAS、BMDP并稱為國際上最有影響的三大統(tǒng)計軟件。在國際學術界有條不成文的規(guī)定,即在國際學術交流中,凡是用SPSS軟件完成的計算和統(tǒng)計分析,可以不必說明算法,由此可見其影響之大和信譽之高。在我國的社會科學、自然科學的各個領域發(fā)揮了巨大作用。該軟件還可以應用于經(jīng)濟學、生物學、心理學、地理學、醫(yī)療衛(wèi)生、體育、農(nóng)業(yè)、林業(yè)、商業(yè)、金融等各個領域。第2頁,課件共49頁,創(chuàng)作于2023年2月調(diào)查問卷序號調(diào)查內(nèi)容選項1您的性別:(1)男(2)女2你的文化程度:(1)沒上過學(2)小學(3)初中(4)高中(5)大專以上3您想選擇下列哪些擇偶條件(任選三項):(1)相貌(2)文化水準(3)氣質(zhì)風度(4)志同道合(5)人品(6)家庭條件(7)個人收入(8)其他4您購買房屋時,會考慮哪些因素(任選):(1)離工作地點的遠近(2)小孩所就讀的學校(3)居家附近的環(huán)境5您對心理學感興趣:(1)不感興趣(2)感興趣(3)非常感興趣6您對學英語感到厭惡:(1)不厭惡(2)厭惡(3)非常厭惡一、數(shù)據(jù)的編碼、錄入與整理第3頁,課件共49頁,創(chuàng)作于2023年2月一、數(shù)據(jù)的編碼、錄入與整理原理是研究者利用SPSS進行統(tǒng)計分析的必要前提。就是把通過問卷調(diào)查獲得的資料轉(zhuǎn)變?yōu)镾PSS能夠識別的數(shù)據(jù)文件,為各種統(tǒng)計分析做好準備。數(shù)據(jù)編碼概念數(shù)據(jù)編碼是指把需要加工處理的數(shù)據(jù)庫信息,用特定的數(shù)字來表示的一種技術。根據(jù)一定數(shù)據(jù)結(jié)構和目標的定性特征,將數(shù)據(jù)轉(zhuǎn)換為代碼或編碼字符,在數(shù)據(jù)傳輸中表示數(shù)據(jù)的組成,并作為傳送、接受和處理的一組規(guī)則和約定。編碼調(diào)查問卷數(shù)據(jù)文件第4頁,課件共49頁,創(chuàng)作于2023年2月二、數(shù)據(jù)問卷與編碼(舉例)變量名編碼樣例第1題1-男;0-女男1第2題1-沒上過學;2-小學;3-初中;4-高中;5-大專以上小學2第3題-11-相貌;2-文化水準;3-氣質(zhì)風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他文化水準2第3題-21-相貌;2-文化水準;3-氣質(zhì)風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他志同道合4第3題-31-相貌;2-文化水準;3-氣質(zhì)風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他人品5第4題-工作1-選;0-不選選1第4題-學校1-選;0-不選不選0第4題-環(huán)境1-選;0-不選選1第5題ABC(A-1,B-2,C-3)A1第6題ABC(A-3,B-2,C-1)A3問卷編碼方案第5頁,課件共49頁,創(chuàng)作于2023年2月三、編碼類型數(shù)值型數(shù)據(jù)的編碼數(shù)值型數(shù)據(jù)的編碼就是根據(jù)調(diào)查問卷的評分標準對變量賦予分值。通常采用三點計分、四點計分和五點計分等方式進行評分

如選項A、B、C計分為1、2、3

如選項A、B、C、D計分為1、2、3、4

編碼示例中的第5、6題就是屬于數(shù)值型編碼變量名編碼樣例第5題ABC(A-1,B-2,C-3)A1第6題ABC(A-3,B-2,C-1)A3正向數(shù)值型(被選項的程度越高,分值越大)反向數(shù)值型(被選項的程度越高,分值越小)第6頁,課件共49頁,創(chuàng)作于2023年2月三、編碼類型非數(shù)值型數(shù)據(jù)的編碼

非數(shù)值型數(shù)據(jù)的編碼,首先要確定編碼規(guī)則,然后根據(jù)規(guī)則對變量賦予分值。

變量名編碼樣例第1題1-男;0-女男1第2題1-沒上過學;2-小學;3-初中;4-高中;5-大專以上小學2雙值型變量的編碼多采用“0、1”或“1、2”來賦值多值型變量的編碼采用“1、2、3、…”來賦值通常對非數(shù)值型數(shù)據(jù)編碼,主要起到分組的作用,不能進行各種算術運算第7頁,課件共49頁,創(chuàng)作于2023年2月三、編碼類型多項選擇題

多項選擇題就是題目答案的選項是多選項變量名編碼樣例第3題-11-相貌;2-文化水準;3-氣質(zhì)風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他文化水準2第3題-21-相貌;2-文化水準;3-氣質(zhì)風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他志同道合4第3題-31-相貌;2-文化水準;3-氣質(zhì)風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他人品5第4題-工作1-選;0-不選選1第4題-學校1-選;0-不選不選0第4題-環(huán)境1-選;0-不選選1限定多選項分類法限定了一次最多可以選擇項目的個數(shù);不能直接對題目進行編碼,必須先確定最多選擇,并給每個選項建立一個變量;任意多項二分法表示每一次可以任選幾個選項;編碼方法把每一個被選項作為一個變量來定義,每個變量只能選擇“1或0”;第8頁,課件共49頁,創(chuàng)作于2023年2月四、缺失值的處理概念

缺失值是指在數(shù)據(jù)采集與整理過程中丟失的內(nèi)容,往往會給統(tǒng)計分析帶來一些麻煩和誤差。類型

用戶缺失值在問卷調(diào)查中把不回答的選項當作缺失值來處理缺失值可用研究者能識別的數(shù)字來表示如“0、9、99”系統(tǒng)缺失值指計算機默認的缺失方式,如輸入數(shù)據(jù)空缺、輸入非法字符等通常把缺失值標記為“.”第9頁,課件共49頁,創(chuàng)作于2023年2月四、缺失值的處理缺失值處理方法

替代法:采用統(tǒng)計命令或在相關統(tǒng)計功能中利用參數(shù)替代

Transform→ReplaceMissingValues

剔出法:剔除有缺失值的題目或剔除有缺失值的整份問卷第10頁,課件共49頁,創(chuàng)作于2023年2月五、數(shù)據(jù)處理中的操作術語個案(Cases)一個研究對象就是一個個案;一個個案就是一條記錄;在數(shù)據(jù)表格中表示為“一行”每一個個案記錄的是一個研究對象各個屬性的具體數(shù)值,如學生信息(姓名、性別、年齡等)變量(Variable)

是指問卷中每一個問題,數(shù)據(jù)庫里字段,數(shù)據(jù)表格中表示為“一列”量值(Value)

是指問卷中的答案,也稱為觀測值,在SPSS系統(tǒng)里,單元格中的數(shù)值就是變量值樣本(Sample)是指具有共同屬性的所有研究對象,如某班學生的所有信息樣本包含多個個案,在數(shù)據(jù)表格中表示為“n行”第11頁,課件共49頁,創(chuàng)作于2023年2月五、數(shù)據(jù)處理中的操作術語學號姓名性別出生日期專業(yè)編號0604231張三男87-1-1010604253李四女88-6-30020605321王五女88-8六男88-12-2402變量學生表個案量值樣本第12頁,課件共49頁,創(chuàng)作于2023年2月六、界面設置啟動SPSS第13頁,課件共49頁,創(chuàng)作于2023年2月六、界面設置英文界面設置第14頁,課件共49頁,創(chuàng)作于2023年2月六、界面設置退出SPSS,再重新啟動,得到全英文界面的SPSS第15頁,課件共49頁,創(chuàng)作于2023年2月七、定義變量啟動SPSS后進入數(shù)據(jù)編輯窗口,顯示為一個空文件,輸入數(shù)據(jù)前首先要定義變量。建立數(shù)據(jù)文件數(shù)據(jù)加工整理統(tǒng)計分析解釋分析結(jié)果定義數(shù)據(jù)文件結(jié)構錄入、修改、保存數(shù)據(jù)定義變量輸入和查看數(shù)據(jù)第16頁,課件共49頁,創(chuàng)作于2023年2月七、定義變量定義變量所包含的內(nèi)容:變量名(Name):變量的名稱變量類型(Type):變量的類型寬度(Width):存儲變量值的最大值對字符型變量:1-可存儲1個字節(jié)的字符,2-可存儲1個漢字;對數(shù)值型變量:表示運算寬度,默認為8位,不用改小數(shù)位數(shù)(Decimals):變量為數(shù)值類型時,小數(shù)點后的位數(shù)變量標簽(Label):對變量名的注釋。光標在變量名上時,會顯示該標簽變量值標簽(Values):變量標簽的取值??梢允褂肰iew菜單下的ValueLabels選項顯示值缺失值(MissingValues):定義缺失的值,例如,當定義99為缺失值時,當該變量的值為99時,把它認為是缺失值第17頁,課件共49頁,創(chuàng)作于2023年2月七、定義變量顯示數(shù)據(jù)的列寬(Colums):與上面“寬度”不同,它只管顯示對齊方式(Align):左對齊、右對齊、居中量度類型(Measure):定比變量(Scale)、定序變量(Ordinal)、定類變量(Nominal)。只用于統(tǒng)計制圖時坐標軸變量的區(qū)分和SPSS決策樹模塊的變量定義。定比測量:測量的最高水平定序測量:比定比測量的信息量少一些,測量數(shù)值代表了一些有序分類,如用1,2,3,4代表優(yōu)、良、中和差定類測量:測量中的最低水平,其數(shù)值僅代表某些分類或?qū)傩裕热缬?,2,3,4代表不同的血型(A,B,AB,O)。第18頁,課件共49頁,創(chuàng)作于2023年2月七、定義變量單擊數(shù)據(jù)編輯窗口左下方的“VariableView”標簽或雙擊列的題頭(Var),打開變量定義窗口,進行變量定義。第19頁,課件共49頁,創(chuàng)作于2023年2月七、定義變量定義變量名

在定義變量窗口中Name下的單元格中輸入變量名變量名必須以字母開頭,長度不超過8個SPSS保留的關鍵詞不能作為變量名AND、OR、NOT、WITH、TO、BY、GT、GE、LT、LE、EQ、NE、ALL等

SPSS中允許使用中文變量名,但盡量不要使用,以免出現(xiàn)兼容性問題第20頁,課件共49頁,創(chuàng)作于2023年2月七、定義變量定義變量類型、寬度及小數(shù)位數(shù)

在Type下單擊單元格,打開變量類型窗口,選擇變量類型常用變量類型有:數(shù)值型(Numeric)日期型(Date)貨幣型(Dollar)字符型(String)

在Width、Decimal下單元格,選擇寬度和小數(shù)位數(shù),系統(tǒng)默認為“8”和“2”;或者在變量類型窗口中設置第21頁,課件共49頁,創(chuàng)作于2023年2月七、定義變量定義變量標簽

在Label下單擊單元格,輸入變量標簽SPSS允許變量標簽長度為255字節(jié)定義變量值標簽

變量值標簽是對變量的每一可能取值進一步描述,當變量是定類或定序變量時,非常有用。變量值標簽系統(tǒng)默認為None在Values下單擊單元格,打開變量值標簽窗口,輸入變量值標簽第22頁,課件共49頁,創(chuàng)作于2023年2月七、定義變量定義缺失值在Missing下單擊單元格,打開缺失值窗口,輸入缺失值Nomissingvalues:沒有缺失值Discretemissingvalues:定義1~3個單一數(shù)為缺失值Rangeplusoneoptionaldiscretemissingvalues:定義指定范圍為缺失值,同時指定另外一個不在這一范圍的單一數(shù)為缺失值第23頁,課件共49頁,創(chuàng)作于2023年2月七、定義變量變量定義的信息復制如果有多個變量的類型相同,可以先定義一個變量,然后把該變量定義的信息復制給新變量操作步驟:先定義一個變量在該變量行號上單擊右鍵,在快捷菜單中選擇“Copy”選擇同類型新變量所在行,單擊右鍵,在快捷菜單中選擇“Paste”

第24頁,課件共49頁,創(chuàng)作于2023年2月八、數(shù)據(jù)的錄入定義完所有變量后,單擊“DataView”標簽,在數(shù)據(jù)編輯窗口輸入數(shù)據(jù)。數(shù)據(jù)錄入如果按逐行進行,按Tab鍵改變行數(shù)據(jù)錄入如果按逐列進行,按Enter鍵改變列系統(tǒng)默認的數(shù)據(jù)文件保存類型為“.sav”第25頁,課件共49頁,創(chuàng)作于2023年2月九、數(shù)據(jù)的導入SPSS具有強大的與其他軟件共享數(shù)據(jù)文件的功能,所以能夠?qū)攵喾N格式的數(shù)據(jù)能夠?qū)隨PSS的數(shù)據(jù)文件:

*.sys、*.por、*.xls、*.slk、*.w*、*.dbf、*.dat、*.syd、*.sas7dbat等導入數(shù)據(jù)文件的操作步驟:執(zhí)行菜單命令File→Open→Data”選擇導入數(shù)據(jù)文件的類型

通過復制粘貼導入數(shù)據(jù)在原系統(tǒng)中打開需要導入的數(shù)據(jù)文件復制粘貼到SPSS中第26頁,課件共49頁,創(chuàng)作于2023年2月九、數(shù)據(jù)的導入例一(1):把Access中shift-MIS.mdb中的“學生表”信息導入到SPSS中.a).打開shift-MIS.mdb文件,選中“表”對象,再選中“學生表”。第27頁,課件共49頁,創(chuàng)作于2023年2月九、數(shù)據(jù)的導入例一(1):把Access中shift-MIS.mdb中的“學生表”信息導入到SPSS中.b).菜單上,外部數(shù)據(jù)→導出→Excel…,“保存類型”選擇“Excel97-Excel2003工作簿

”,文件名自動為“學生表”→“確定”

第28頁,課件共49頁,創(chuàng)作于2023年2月九、數(shù)據(jù)的導入例一(1):把Access中shift-MIS.mdb中的“學生表”信息導入到SPSS中.c).啟動SPSS,F(xiàn)ile→Open→Data,“文件類型”選擇“Excel(*.xls)”,找到“學生表.xls”文件后→“打開”d).保存為:學生表.sav第29頁,課件共49頁,創(chuàng)作于2023年2月九、數(shù)據(jù)的導入例一(2):數(shù)據(jù)的導入將EXCEL文件2-recode.xls導入到SPSS中啟動SPSS;方法一:File→Open→Data.

數(shù)據(jù)導入后,查看“VariableView”標簽中的字段名、類型、寬度等。方法二:練習通過復制、粘帖的辦法

把2-recode.xls中的數(shù)據(jù)通過復制,在SPSS中粘帖的辦法導入到SPSS中把導入后的數(shù)據(jù)文件保存為2-recode.sav第30頁,課件共49頁,創(chuàng)作于2023年2月十、數(shù)據(jù)的整理概念數(shù)據(jù)整理是對錄入的數(shù)據(jù)進行轉(zhuǎn)換、檢測、量表統(tǒng)分、個案選擇、文件拆分與合并等操作,使原始數(shù)據(jù)生成后續(xù)研究所需要的數(shù)據(jù)。操作SPSS實現(xiàn)數(shù)據(jù)整理的功能主要集中在“Data”和“Transform”兩個菜單第31頁,課件共49頁,創(chuàng)作于2023年2月十、數(shù)據(jù)的整理例二:數(shù)據(jù)分值的轉(zhuǎn)換

數(shù)據(jù)分值的轉(zhuǎn)換是通過對數(shù)據(jù)進行重新編碼來實現(xiàn)的。在SPSS中主要通過Recode命令來實現(xiàn)第32頁,課件共49頁,創(chuàng)作于2023年2月十、數(shù)據(jù)的整理例二:數(shù)據(jù)分值的轉(zhuǎn)換IntoSameVariables:編碼后數(shù)據(jù)存放在原變量中,覆蓋原數(shù)據(jù)IntoDifferentVariables:編碼后數(shù)據(jù)存放在新定義的變量中,保留原數(shù)據(jù)

第33頁,課件共49頁,創(chuàng)作于2023年2月十、數(shù)據(jù)的整理例二:數(shù)據(jù)分值的轉(zhuǎn)換假設一套量表共10題,每題有A、B、C三個選項,現(xiàn)有10個被試作答。要求根據(jù)評分規(guī)則,將被試的原始數(shù)據(jù)選擇轉(zhuǎn)換為量表分數(shù)注意:1、2、4、7、8、10:正向題3、5、6、9:反向題量表評分規(guī)則

題號選項12345678910A1131331131B2222222222C331311331310名被試的作答結(jié)果表

題號被試123456789101ABBBABCACB2ABBCABCACB3ACBBABCABB4BBBBBACBCB5ACABBABABC6BCABABBBBA7BCCCABCABB8ACABBABACB9ABBBBACACB10BBBBABCBCC第34頁,課件共49頁,創(chuàng)作于2023年2月十、數(shù)據(jù)的整理例二:數(shù)據(jù)分值的轉(zhuǎn)換原數(shù)據(jù)轉(zhuǎn)換后數(shù)據(jù)第35頁,課件共49頁,創(chuàng)作于2023年2月十、數(shù)據(jù)的整理例二:數(shù)據(jù)分值的轉(zhuǎn)換數(shù)據(jù)輸入:打開數(shù)據(jù)文件(2-recode.sav)Transform→Recode→IntoDifferentVariables

打開“Recode”對話框,定義新變量名打開“OldandNewValue…”對話框,定義轉(zhuǎn)換規(guī)則第36頁,課件共49頁,創(chuàng)作于2023年2月十、數(shù)據(jù)的整理例三:量表的統(tǒng)分在數(shù)據(jù)錄入過程中,輸入的是最原始、最穩(wěn)定的反應選項,但在后續(xù)的統(tǒng)計分析中通常需要對量表的總分進行推斷統(tǒng)計。量表的統(tǒng)分工作包括分量表的統(tǒng)分和總量表的統(tǒng)分,SPSS中通常用“Compute”命令實現(xiàn)量表的統(tǒng)分工作第37頁,課件共49頁,創(chuàng)作于2023年2月十、數(shù)據(jù)的整理例三:量表的統(tǒng)分以分值轉(zhuǎn)化后的數(shù)據(jù)文件2-recode.sav為例。假定該量表由2個分量表構成,其中1個量表由第1、2、5、8、9題組成,另一個量表由第3、4、6、7、10題組成。計算出每一個被試的分量表分和總量表分。第38頁,課件共49頁,創(chuàng)作于2023年2月十、數(shù)據(jù)的整理例三:量表的統(tǒng)分打開數(shù)據(jù)文件2-recode.sav。Transform→Compute(計算分量表分flb1、flb2和總量表分zlb)

統(tǒng)分結(jié)果保存為2-lb.sav第39頁,課件共49頁,創(chuàng)作于2023年2月十、數(shù)據(jù)的整理例四:數(shù)據(jù)的排序

在數(shù)據(jù)統(tǒng)計分析中,通常需要限定選擇部分個案進行研究,如抽取40%個案來研究在SPSS中,主要通過Data→SortCases第40頁,課件共49頁,創(chuàng)作于2023年2月十、數(shù)據(jù)的整理例四:數(shù)據(jù)的排序以數(shù)據(jù)文件2-lb.sav為例,找出變量zlb的高低分組的分組一般以總個案

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論