問卷數(shù)據(jù)的錄入與清理_第1頁
問卷數(shù)據(jù)的錄入與清理_第2頁
問卷數(shù)據(jù)的錄入與清理_第3頁
問卷數(shù)據(jù)的錄入與清理_第4頁
問卷數(shù)據(jù)的錄入與清理_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

問卷數(shù)據(jù)的錄入與清理本章內(nèi)容3.1問卷數(shù)據(jù)的錄入3.2在Excel中錄入數(shù)據(jù)3.3核對(duì)和清理數(shù)據(jù)3.4在Excel中核對(duì)數(shù)據(jù)3.5在SPSS中錄入數(shù)據(jù)3.6在SPSS中核對(duì)數(shù)據(jù)附錄ⅠExcel數(shù)據(jù)分析工具附錄Ⅱ在Excel中生成隨機(jī)數(shù)第2頁,共30頁,2024年2月25日,星期天問卷數(shù)據(jù)的錄入與清理進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析之前,必須先將問卷數(shù)據(jù)錄入計(jì)算機(jī)。為了保證不“GIGO,GarbageInGarbageOut”(垃圾進(jìn)垃圾出),在統(tǒng)計(jì)分析之前,需要對(duì)錄入的數(shù)據(jù)進(jìn)行核對(duì)和清理。第3頁,共30頁,2024年2月25日,星期天3.1

問卷數(shù)據(jù)的錄入數(shù)據(jù)輸入就是將問卷數(shù)據(jù)所對(duì)應(yīng)的編碼通過掃描或用鍵盤輸入計(jì)算機(jī),建立數(shù)據(jù)文件的過程。目前,數(shù)據(jù)輸入的方式主要有三種:人工輸入計(jì)算機(jī)輔助系統(tǒng)轉(zhuǎn)換光電輸入第4頁,共30頁,2024年2月25日,星期天3.1 問卷數(shù)據(jù)的錄入(人工輸入)人工輸入的注意事項(xiàng):要規(guī)定統(tǒng)一的輸入內(nèi)容和輸入格式。挑選和培訓(xùn)數(shù)據(jù)輸入人員。數(shù)據(jù)輸入過程中需要注意:第一,統(tǒng)一規(guī)定數(shù)據(jù)文件名。第二,數(shù)據(jù)輸入時(shí)要為每一個(gè)輸入人員提供一份有關(guān)輸入內(nèi)容和格式的手冊(cè)。第三,要為每個(gè)輸入人員提供足夠的空間擺放問卷,避免不同輸入人員的問卷或者同一輸入人員已輸入和未輸入的問卷發(fā)生混淆,造成漏輸或重復(fù)輸入,影響問卷的質(zhì)量。第四,每個(gè)輸入人員在完成各自負(fù)責(zé)的問卷的輸入任務(wù)后,由研究者把他們的數(shù)據(jù)合并成一個(gè)總的數(shù)據(jù)文件,以供統(tǒng)計(jì)分析使用。為了避免數(shù)據(jù)丟失,要把每個(gè)輸入人員輸入的數(shù)據(jù)單獨(dú)存檔,以備查找。第5頁,共30頁,2024年2月25日,星期天3.2 在Excel中錄入數(shù)據(jù)(單選題)1.確定取得單一答案2.盡可能使用單選題3.單選題如何編碼和輸入Q1.請(qǐng)問您現(xiàn)在是否擁有手機(jī)?□1.有 □2.沒有(跳至Q12題)例3-1在Excel中錄入單選題Q1的數(shù)據(jù)單選題的編碼和輸入(用文字當(dāng)列名,圖3-1)單選題的編碼和輸入(用題號(hào)當(dāng)列名,圖3-2)第6頁,共30頁,2024年2月25日,星期天3.2 在Excel中錄入數(shù)據(jù)(單選題)例3-1在Excel中錄入單選題Q1的數(shù)據(jù)單選題的編碼和輸入(用文字當(dāng)列名,圖3-1)單選題的編碼和輸入(用題號(hào)當(dāng)列名,圖3-2)第7頁,共30頁,2024年2月25日,星期天3.2 在Excel中錄入數(shù)據(jù)(多選題)多選題分為多項(xiàng)限選題、多項(xiàng)排序題、多項(xiàng)任選題。

Q2.請(qǐng)問您當(dāng)初購買手機(jī)的原因是什么?(可多選,最多3項(xiàng)) □1.方便與家人聯(lián)絡(luò)□2.方便與朋友同學(xué)聯(lián)絡(luò)□3.追求流行 □4.工作需要 □5.同學(xué)間比較的心理 □6.別人贈(zèng)送 □7.手機(jī)價(jià)格下降 □8.廠商推出的促銷方案 □9.網(wǎng)內(nèi)互打較便宜□10.其他例3-2在Excel中錄入多選題Q2的數(shù)據(jù)多選題的編碼有2種:分類法和二分法?!胺诸惙ā本幋a和輸入(圖3-3)“二分法”編碼和輸入有關(guān)“分類法”和“二分法”編碼,請(qǐng)參見P72~74凍結(jié)窗格(比較圖3-4和圖3-5)第8頁,共30頁,2024年2月25日,星期天3.2 在Excel中錄入數(shù)據(jù)(多選題)例3-2在Excel中錄入多選題Q2的數(shù)據(jù)“分類法”編碼和輸入(圖3-3)第9頁,共30頁,2024年2月25日,星期天3.2 在Excel中錄入數(shù)據(jù)(多選題)例3-2在Excel中錄入多選題Q2的數(shù)據(jù)凍結(jié)窗格(比較圖3-4和圖3-5)第10頁,共30頁,2024年2月25日,星期天3.2

在Excel中錄入數(shù)據(jù)(填空題)填空題也稱開放題,不提示任何答案,要求使用者直接填寫。對(duì)數(shù)值型的數(shù)據(jù),為了取得其真正的數(shù)字(如:55),而非只取得區(qū)間(如:41~60),會(huì)采用填空題的方式取得數(shù)據(jù)(定量數(shù)據(jù),數(shù)值型數(shù)據(jù)),例如:

請(qǐng)問您平均每個(gè)月手機(jī)的話費(fèi)約

元?定量數(shù)據(jù)可不經(jīng)任何轉(zhuǎn)換,即可計(jì)算各種統(tǒng)計(jì)量:均值、標(biāo)準(zhǔn)差、最大值、最小值等,而且也可以直接進(jìn)行均值比較與檢驗(yàn),甚至可以作為回歸分析的因變量或自變量。如果為了取得數(shù)據(jù)的方便,就設(shè)計(jì)成選擇題(單選題):

請(qǐng)問您平均每個(gè)月手機(jī)的話費(fèi)約多少錢? □1.20元及以下 □2.21~40元 □3.41~60元 □4.61~80元 □5.81~100元 □6.101元及以上例3-3在Excel中錄入填空題的數(shù)據(jù)(圖3-6)第11頁,共30頁,2024年2月25日,星期天3.2

在Excel中錄入數(shù)據(jù)(填空題)例3-3在Excel中錄入填空題的數(shù)據(jù)(圖3-6)第12頁,共30頁,2024年2月25日,星期天3.2

在Excel中錄入數(shù)據(jù)(量表)量表其實(shí)是一種順序尺度(有序變量),只有大小先后的關(guān)系,無倍數(shù)關(guān)系。量表有多種編碼方式,如P60的表3-2是量表常用的三種編碼方式。例3-4在Excel中錄入量表的數(shù)據(jù)(圖3-7)產(chǎn)品屬性非常重要重要普通不重要非常不重要(1)大小適中□5□4□3□2□1(2)重量輕巧□5□4□3□2□1(3)顏色炫麗□5□4□3□2□1(4)外型大方□5□4□3□2□1(5)符合人體工學(xué)□5□4□3□2□1(6)附屬功能多□5□4□3□2□1補(bǔ)充:輸入數(shù)據(jù)時(shí),對(duì)于量表編碼,要取得同向,如P34的例2-26,反向題要正向編碼后再輸入第13頁,共30頁,2024年2月25日,星期天3.2

在Excel中錄入數(shù)據(jù)(量表)例3-4在Excel中錄入量表的數(shù)據(jù)(圖3-7)第14頁,共30頁,2024年2月25日,星期天3.2在Excel中錄入數(shù)據(jù)(排名題)排名(多項(xiàng)排序)是一種衡量的方式。如:下列幾種手機(jī)的入網(wǎng)方式,請(qǐng)問您認(rèn)為哪一種的收費(fèi)最便宜?請(qǐng)依排名順序,填入1、2、3、4、5:全球通

神州行

如意通

動(dòng)感地帶

新時(shí)空

分此種類型的問卷,作為被排名的對(duì)象也不宜太多。否則,受訪者也無法排列好。排個(gè)5、6項(xiàng)基本就是上限了。例3-5在Excel中錄入排名題的數(shù)據(jù)(圖3-8)可將排名題改為單選題第15頁,共30頁,2024年2月25日,星期天3.2在Excel中錄入數(shù)據(jù)(排名題)例3-5在Excel中錄入排名題的數(shù)據(jù)(圖3-8)第16頁,共30頁,2024年2月25日,星期天3.3

核對(duì)和清理數(shù)據(jù)數(shù)據(jù)有效范圍的清理對(duì)數(shù)據(jù)中的奇異值進(jìn)行清理。數(shù)據(jù)邏輯一致性的清理依據(jù)問卷中的問題相互之間所存在的某種內(nèi)在的邏輯聯(lián)系,來檢查前后數(shù)據(jù)之間的合理性,主要針對(duì)的是相倚問題和多項(xiàng)限選題。數(shù)據(jù)質(zhì)量的抽查個(gè)案(Case):一份問卷的數(shù)據(jù)在計(jì)算機(jī)中的編碼值,占一行第17頁,共30頁,2024年2月25日,星期天3.4在Excel中核對(duì)數(shù)據(jù)篩選出范圍不合理的單列例3-6在Excel中核對(duì)“大小適中”的數(shù)據(jù)用自動(dòng)篩選找出不合理的關(guān)聯(lián)題例3-7在Excel中核對(duì)關(guān)聯(lián)題“是否有手機(jī)”與“平均月費(fèi)”的數(shù)據(jù)用高級(jí)篩選找出重復(fù)的記錄例3-8用Excel處理重復(fù)的記錄第18頁,共30頁,2024年2月25日,星期天3.4在Excel中核對(duì)數(shù)據(jù)篩選出范圍不合理的單列例3-6在Excel中核對(duì)“大小適中”的數(shù)據(jù)第19頁,共30頁,2024年2月25日,星期天3.4在Excel中核對(duì)數(shù)據(jù)用自動(dòng)篩選找出不合理的關(guān)聯(lián)題例3-7在Excel中核對(duì)關(guān)聯(lián)題“是否有手機(jī)”與“平均月費(fèi)”的數(shù)據(jù)沒有手機(jī)但有手機(jī)話費(fèi)有手機(jī)但沒有手機(jī)話費(fèi)第20頁,共30頁,2024年2月25日,星期天3.4在Excel中核對(duì)數(shù)據(jù)用高級(jí)篩選找出重復(fù)的記錄例3-8用Excel處理重復(fù)的記錄第21頁,共30頁,2024年2月25日,星期天3.5在SPSS中錄入數(shù)據(jù)手工建立數(shù)據(jù)文件例3-9在SPSS中,手工建立調(diào)查問卷的數(shù)據(jù)文件1. 調(diào)查問卷(P68-69)2. 確定變量的個(gè)數(shù)3. 在SPSS中定義變量4. 單選題的變量定義5. 多選題的變量定義:二分法和分類法

從Excel獲取數(shù)據(jù)文件例3-10將Excel中的數(shù)據(jù)導(dǎo)入到SPSS數(shù)據(jù)文件中方法一:先在SPSS中定義好變量,然后通過“復(fù)制-粘貼”方式將數(shù)據(jù)從Excel復(fù)制到SPSS中。方法二:利用打開數(shù)據(jù)文件的方法直接把Excel中的數(shù)據(jù)導(dǎo)入到SPSS中,然后再定義變量屬性。第22頁,共30頁,2024年2月25日,星期天3.5在SPSS中錄入數(shù)據(jù)多選題的變量定義:二分法和分類法

二分法(MultipleDichotomiesMethod):將每個(gè)可能的答案設(shè)為一個(gè)變量,變量的取值最多有兩個(gè)(1和0),分別表示“選”或“不選”(在實(shí)際應(yīng)用中,經(jīng)常只有一個(gè)取值1,表示“選”,而用空值表示“不選”)。這種方法的缺點(diǎn)是需要的變量個(gè)數(shù)比較多;優(yōu)點(diǎn)是比較簡單。二分法常用于“不限選”和“限選不排名”。分類法(MultipleCategoryMethod):分類法常用于“限選”(很少用于“不限選”),包括“限選不排名”和“限選排名”。按照限選的最多答案設(shè)置變量個(gè)數(shù),每個(gè)變量的取值為選項(xiàng)值。比如,一個(gè)多選題,如果最多可選3個(gè)答案,那就設(shè)置3個(gè)變量,分別用來存放3個(gè)可能的答案。如果某受訪者只填答兩個(gè),那么第3個(gè)變量的取值為缺失值;如果某受訪者只填答一個(gè),那么第2、3個(gè)變量的取值均為缺失值。分類法的優(yōu)點(diǎn)是需要的變量個(gè)數(shù)比較少。第23頁,共30頁,2024年2月25日,星期天補(bǔ)充:限選不排序多選題的兩種編碼三種組合方式以問題5(Q5)限選不排序多選題為例方式1:二分法編碼:P73的表3-5(4個(gè)變量,編碼為1)

方式2:分類法編碼:P73的表3-6(2個(gè)變量,編碼為1、2、3、4)補(bǔ)充方式3:變量個(gè)數(shù)采用二分法(4個(gè)變量),編碼采用分類法(1、2、3、4),具體如下:

NameTypeLabelValues例子的取值Q5_1N家庭就業(yè)人數(shù)增加1=家庭就業(yè)人數(shù)增加,2=工資增加,3=獎(jiǎng)金和津貼增加,4=其他收入來源增加Q5_2N工資增加同上2Q5_3N獎(jiǎng)金和津貼增加同上

3Q5_4N其他收入來源增加同上

建議:應(yīng)用案例實(shí)驗(yàn)1,如果限選不排序多選題的選項(xiàng)超過了2項(xiàng)(如:可多選,最多3項(xiàng)),建議采用方式3,這樣的好處是核對(duì)容易。請(qǐng)參見“補(bǔ)充:多選題兩種編碼和核對(duì).xls”實(shí)際應(yīng)用中,建議采用方式2。因?yàn)橐话阒缓藢?duì)單列數(shù)據(jù)有效范圍,很少核對(duì)邏輯一致性第24頁,共30頁,2024年2月25日,星期天改錯(cuò):P74的表3-9改為由于采用“分類法”編碼,所以在SPSS中的Values也應(yīng)該是分類法編碼,而不是簡單的“選”或空白。修改的目的:在用SPSS進(jìn)行多選變量的頻率分析時(shí)(具體見第六章),SPSS的輸出結(jié)果可讀性好。Name變量名Type類型Label變量名標(biāo)簽Values變量值標(biāo)簽例子的取值Q7_1N銀行理財(cái)1=銀行理財(cái),2=股票,3=債券,4=股票型基金,5=貨幣基金,6=外匯,7=其他Q7_2N股票同上2Q7_3N債券同上3Q7_4N股票型基金同上Q7_5N貨幣基金同上Q7_6N外匯同上6Q7_7N其他同上第25頁,共30頁,2024年2月25日,星期天3.5在SPSS中錄入數(shù)據(jù)從Excel獲取數(shù)據(jù)文件例3-10將Excel中的數(shù)據(jù)導(dǎo)入到SPSS數(shù)據(jù)文件中方法一:先在SPSS中定義好變量,然后通過“復(fù)制-粘貼”方式將數(shù)據(jù)從Excel復(fù)制到SPSS中。方法二:利用打開數(shù)據(jù)文件的方法直接把Excel中的數(shù)據(jù)導(dǎo)入到SPSS中,然后再定義變量屬性。具體如下:①在SPSS中,單擊菜單“File”->“Open”->“Data”,進(jìn)入“OpenFile”對(duì)話框,在最下面的“文件類型”框中選擇“Excel(*.xls)”,然后選擇錄入好數(shù)據(jù)的Excel文件(要求該文件暫時(shí)沒有被Excel打開),單擊“打開”,進(jìn)入“OpeningExcelDataSource”對(duì)話框,單擊“OK”。②定義變量屬性:對(duì)每個(gè)變量進(jìn)行進(jìn)一步的定義(如變量名標(biāo)簽、變量值標(biāo)簽等),以期達(dá)到SPSS分析所要求的目的第26頁,共30頁,2024年2月25日,星期天3.6在SPSS中核對(duì)數(shù)據(jù)利用SPSS的一維頻率分析Frequencies命令可以發(fā)現(xiàn)單變量范圍不合理的數(shù)據(jù)。利用SPSS的交叉表分析Crosstabs命令可以發(fā)現(xiàn)兩個(gè)變量之間的邏輯一致性問題。第27頁,共30頁,2024年2月25日,星期天實(shí)踐題1999年關(guān)于外商投資企業(yè)雇員調(diào)查問卷(P80~81)要求:(1)確定問卷中每個(gè)問題應(yīng)該設(shè)置的變量的個(gè)數(shù),并區(qū)分是定性(分類)變量還是定量(數(shù)值型)變量。(2)給每個(gè)變量定義變量名、數(shù)據(jù)類型、變量名標(biāo)簽。(3)對(duì)于定性(分類)變量,定義相應(yīng)的變量值標(biāo)簽(類

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論