




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
問卷數(shù)據(jù)的錄入與清理本章內(nèi)容3.1問卷數(shù)據(jù)的錄入3.2在Excel中錄入數(shù)據(jù)3.3核對和清理數(shù)據(jù)3.4在Excel中核對數(shù)據(jù)3.5在SPSS中錄入數(shù)據(jù)3.6在SPSS中核對數(shù)據(jù)附錄ⅠExcel數(shù)據(jù)分析工具附錄Ⅱ在Excel中生成隨機(jī)數(shù)第2頁,共30頁,2024年2月25日,星期天問卷數(shù)據(jù)的錄入與清理進(jìn)行數(shù)據(jù)統(tǒng)計分析之前,必須先將問卷數(shù)據(jù)錄入計算機(jī)。為了保證不“GIGO,GarbageInGarbageOut”(垃圾進(jìn)垃圾出),在統(tǒng)計分析之前,需要對錄入的數(shù)據(jù)進(jìn)行核對和清理。第3頁,共30頁,2024年2月25日,星期天3.1
問卷數(shù)據(jù)的錄入數(shù)據(jù)輸入就是將問卷數(shù)據(jù)所對應(yīng)的編碼通過掃描或用鍵盤輸入計算機(jī),建立數(shù)據(jù)文件的過程。目前,數(shù)據(jù)輸入的方式主要有三種:人工輸入計算機(jī)輔助系統(tǒng)轉(zhuǎn)換光電輸入第4頁,共30頁,2024年2月25日,星期天3.1 問卷數(shù)據(jù)的錄入(人工輸入)人工輸入的注意事項:要規(guī)定統(tǒng)一的輸入內(nèi)容和輸入格式。挑選和培訓(xùn)數(shù)據(jù)輸入人員。數(shù)據(jù)輸入過程中需要注意:第一,統(tǒng)一規(guī)定數(shù)據(jù)文件名。第二,數(shù)據(jù)輸入時要為每一個輸入人員提供一份有關(guān)輸入內(nèi)容和格式的手冊。第三,要為每個輸入人員提供足夠的空間擺放問卷,避免不同輸入人員的問卷或者同一輸入人員已輸入和未輸入的問卷發(fā)生混淆,造成漏輸或重復(fù)輸入,影響問卷的質(zhì)量。第四,每個輸入人員在完成各自負(fù)責(zé)的問卷的輸入任務(wù)后,由研究者把他們的數(shù)據(jù)合并成一個總的數(shù)據(jù)文件,以供統(tǒng)計分析使用。為了避免數(shù)據(jù)丟失,要把每個輸入人員輸入的數(shù)據(jù)單獨存檔,以備查找。第5頁,共30頁,2024年2月25日,星期天3.2 在Excel中錄入數(shù)據(jù)(單選題)1.確定取得單一答案2.盡可能使用單選題3.單選題如何編碼和輸入Q1.請問您現(xiàn)在是否擁有手機(jī)?□1.有 □2.沒有(跳至Q12題)例3-1在Excel中錄入單選題Q1的數(shù)據(jù)單選題的編碼和輸入(用文字當(dāng)列名,圖3-1)單選題的編碼和輸入(用題號當(dāng)列名,圖3-2)第6頁,共30頁,2024年2月25日,星期天3.2 在Excel中錄入數(shù)據(jù)(單選題)例3-1在Excel中錄入單選題Q1的數(shù)據(jù)單選題的編碼和輸入(用文字當(dāng)列名,圖3-1)單選題的編碼和輸入(用題號當(dāng)列名,圖3-2)第7頁,共30頁,2024年2月25日,星期天3.2 在Excel中錄入數(shù)據(jù)(多選題)多選題分為多項限選題、多項排序題、多項任選題。
Q2.請問您當(dāng)初購買手機(jī)的原因是什么?(可多選,最多3項) □1.方便與家人聯(lián)絡(luò)□2.方便與朋友同學(xué)聯(lián)絡(luò)□3.追求流行 □4.工作需要 □5.同學(xué)間比較的心理 □6.別人贈送 □7.手機(jī)價格下降 □8.廠商推出的促銷方案 □9.網(wǎng)內(nèi)互打較便宜□10.其他例3-2在Excel中錄入多選題Q2的數(shù)據(jù)多選題的編碼有2種:分類法和二分法?!胺诸惙ā本幋a和輸入(圖3-3)“二分法”編碼和輸入有關(guān)“分類法”和“二分法”編碼,請參見P72~74凍結(jié)窗格(比較圖3-4和圖3-5)第8頁,共30頁,2024年2月25日,星期天3.2 在Excel中錄入數(shù)據(jù)(多選題)例3-2在Excel中錄入多選題Q2的數(shù)據(jù)“分類法”編碼和輸入(圖3-3)第9頁,共30頁,2024年2月25日,星期天3.2 在Excel中錄入數(shù)據(jù)(多選題)例3-2在Excel中錄入多選題Q2的數(shù)據(jù)凍結(jié)窗格(比較圖3-4和圖3-5)第10頁,共30頁,2024年2月25日,星期天3.2
在Excel中錄入數(shù)據(jù)(填空題)填空題也稱開放題,不提示任何答案,要求使用者直接填寫。對數(shù)值型的數(shù)據(jù),為了取得其真正的數(shù)字(如:55),而非只取得區(qū)間(如:41~60),會采用填空題的方式取得數(shù)據(jù)(定量數(shù)據(jù),數(shù)值型數(shù)據(jù)),例如:
請問您平均每個月手機(jī)的話費約
元?定量數(shù)據(jù)可不經(jīng)任何轉(zhuǎn)換,即可計算各種統(tǒng)計量:均值、標(biāo)準(zhǔn)差、最大值、最小值等,而且也可以直接進(jìn)行均值比較與檢驗,甚至可以作為回歸分析的因變量或自變量。如果為了取得數(shù)據(jù)的方便,就設(shè)計成選擇題(單選題):
請問您平均每個月手機(jī)的話費約多少錢? □1.20元及以下 □2.21~40元 □3.41~60元 □4.61~80元 □5.81~100元 □6.101元及以上例3-3在Excel中錄入填空題的數(shù)據(jù)(圖3-6)第11頁,共30頁,2024年2月25日,星期天3.2
在Excel中錄入數(shù)據(jù)(填空題)例3-3在Excel中錄入填空題的數(shù)據(jù)(圖3-6)第12頁,共30頁,2024年2月25日,星期天3.2
在Excel中錄入數(shù)據(jù)(量表)量表其實是一種順序尺度(有序變量),只有大小先后的關(guān)系,無倍數(shù)關(guān)系。量表有多種編碼方式,如P60的表3-2是量表常用的三種編碼方式。例3-4在Excel中錄入量表的數(shù)據(jù)(圖3-7)產(chǎn)品屬性非常重要重要普通不重要非常不重要(1)大小適中□5□4□3□2□1(2)重量輕巧□5□4□3□2□1(3)顏色炫麗□5□4□3□2□1(4)外型大方□5□4□3□2□1(5)符合人體工學(xué)□5□4□3□2□1(6)附屬功能多□5□4□3□2□1補充:輸入數(shù)據(jù)時,對于量表編碼,要取得同向,如P34的例2-26,反向題要正向編碼后再輸入第13頁,共30頁,2024年2月25日,星期天3.2
在Excel中錄入數(shù)據(jù)(量表)例3-4在Excel中錄入量表的數(shù)據(jù)(圖3-7)第14頁,共30頁,2024年2月25日,星期天3.2在Excel中錄入數(shù)據(jù)(排名題)排名(多項排序)是一種衡量的方式。如:下列幾種手機(jī)的入網(wǎng)方式,請問您認(rèn)為哪一種的收費最便宜?請依排名順序,填入1、2、3、4、5:全球通
神州行
如意通
動感地帶
新時空
分此種類型的問卷,作為被排名的對象也不宜太多。否則,受訪者也無法排列好。排個5、6項基本就是上限了。例3-5在Excel中錄入排名題的數(shù)據(jù)(圖3-8)可將排名題改為單選題第15頁,共30頁,2024年2月25日,星期天3.2在Excel中錄入數(shù)據(jù)(排名題)例3-5在Excel中錄入排名題的數(shù)據(jù)(圖3-8)第16頁,共30頁,2024年2月25日,星期天3.3
核對和清理數(shù)據(jù)數(shù)據(jù)有效范圍的清理對數(shù)據(jù)中的奇異值進(jìn)行清理。數(shù)據(jù)邏輯一致性的清理依據(jù)問卷中的問題相互之間所存在的某種內(nèi)在的邏輯聯(lián)系,來檢查前后數(shù)據(jù)之間的合理性,主要針對的是相倚問題和多項限選題。數(shù)據(jù)質(zhì)量的抽查個案(Case):一份問卷的數(shù)據(jù)在計算機(jī)中的編碼值,占一行第17頁,共30頁,2024年2月25日,星期天3.4在Excel中核對數(shù)據(jù)篩選出范圍不合理的單列例3-6在Excel中核對“大小適中”的數(shù)據(jù)用自動篩選找出不合理的關(guān)聯(lián)題例3-7在Excel中核對關(guān)聯(lián)題“是否有手機(jī)”與“平均月費”的數(shù)據(jù)用高級篩選找出重復(fù)的記錄例3-8用Excel處理重復(fù)的記錄第18頁,共30頁,2024年2月25日,星期天3.4在Excel中核對數(shù)據(jù)篩選出范圍不合理的單列例3-6在Excel中核對“大小適中”的數(shù)據(jù)第19頁,共30頁,2024年2月25日,星期天3.4在Excel中核對數(shù)據(jù)用自動篩選找出不合理的關(guān)聯(lián)題例3-7在Excel中核對關(guān)聯(lián)題“是否有手機(jī)”與“平均月費”的數(shù)據(jù)沒有手機(jī)但有手機(jī)話費有手機(jī)但沒有手機(jī)話費第20頁,共30頁,2024年2月25日,星期天3.4在Excel中核對數(shù)據(jù)用高級篩選找出重復(fù)的記錄例3-8用Excel處理重復(fù)的記錄第21頁,共30頁,2024年2月25日,星期天3.5在SPSS中錄入數(shù)據(jù)手工建立數(shù)據(jù)文件例3-9在SPSS中,手工建立調(diào)查問卷的數(shù)據(jù)文件1. 調(diào)查問卷(P68-69)2. 確定變量的個數(shù)3. 在SPSS中定義變量4. 單選題的變量定義5. 多選題的變量定義:二分法和分類法
從Excel獲取數(shù)據(jù)文件例3-10將Excel中的數(shù)據(jù)導(dǎo)入到SPSS數(shù)據(jù)文件中方法一:先在SPSS中定義好變量,然后通過“復(fù)制-粘貼”方式將數(shù)據(jù)從Excel復(fù)制到SPSS中。方法二:利用打開數(shù)據(jù)文件的方法直接把Excel中的數(shù)據(jù)導(dǎo)入到SPSS中,然后再定義變量屬性。第22頁,共30頁,2024年2月25日,星期天3.5在SPSS中錄入數(shù)據(jù)多選題的變量定義:二分法和分類法
二分法(MultipleDichotomiesMethod):將每個可能的答案設(shè)為一個變量,變量的取值最多有兩個(1和0),分別表示“選”或“不選”(在實際應(yīng)用中,經(jīng)常只有一個取值1,表示“選”,而用空值表示“不選”)。這種方法的缺點是需要的變量個數(shù)比較多;優(yōu)點是比較簡單。二分法常用于“不限選”和“限選不排名”。分類法(MultipleCategoryMethod):分類法常用于“限選”(很少用于“不限選”),包括“限選不排名”和“限選排名”。按照限選的最多答案設(shè)置變量個數(shù),每個變量的取值為選項值。比如,一個多選題,如果最多可選3個答案,那就設(shè)置3個變量,分別用來存放3個可能的答案。如果某受訪者只填答兩個,那么第3個變量的取值為缺失值;如果某受訪者只填答一個,那么第2、3個變量的取值均為缺失值。分類法的優(yōu)點是需要的變量個數(shù)比較少。第23頁,共30頁,2024年2月25日,星期天補充:限選不排序多選題的兩種編碼三種組合方式以問題5(Q5)限選不排序多選題為例方式1:二分法編碼:P73的表3-5(4個變量,編碼為1)
方式2:分類法編碼:P73的表3-6(2個變量,編碼為1、2、3、4)補充方式3:變量個數(shù)采用二分法(4個變量),編碼采用分類法(1、2、3、4),具體如下:
NameTypeLabelValues例子的取值Q5_1N家庭就業(yè)人數(shù)增加1=家庭就業(yè)人數(shù)增加,2=工資增加,3=獎金和津貼增加,4=其他收入來源增加Q5_2N工資增加同上2Q5_3N獎金和津貼增加同上
3Q5_4N其他收入來源增加同上
建議:應(yīng)用案例實驗1,如果限選不排序多選題的選項超過了2項(如:可多選,最多3項),建議采用方式3,這樣的好處是核對容易。請參見“補充:多選題兩種編碼和核對.xls”實際應(yīng)用中,建議采用方式2。因為一般只核對單列數(shù)據(jù)有效范圍,很少核對邏輯一致性第24頁,共30頁,2024年2月25日,星期天改錯:P74的表3-9改為由于采用“分類法”編碼,所以在SPSS中的Values也應(yīng)該是分類法編碼,而不是簡單的“選”或空白。修改的目的:在用SPSS進(jìn)行多選變量的頻率分析時(具體見第六章),SPSS的輸出結(jié)果可讀性好。Name變量名Type類型Label變量名標(biāo)簽Values變量值標(biāo)簽例子的取值Q7_1N銀行理財1=銀行理財,2=股票,3=債券,4=股票型基金,5=貨幣基金,6=外匯,7=其他Q7_2N股票同上2Q7_3N債券同上3Q7_4N股票型基金同上Q7_5N貨幣基金同上Q7_6N外匯同上6Q7_7N其他同上第25頁,共30頁,2024年2月25日,星期天3.5在SPSS中錄入數(shù)據(jù)從Excel獲取數(shù)據(jù)文件例3-10將Excel中的數(shù)據(jù)導(dǎo)入到SPSS數(shù)據(jù)文件中方法一:先在SPSS中定義好變量,然后通過“復(fù)制-粘貼”方式將數(shù)據(jù)從Excel復(fù)制到SPSS中。方法二:利用打開數(shù)據(jù)文件的方法直接把Excel中的數(shù)據(jù)導(dǎo)入到SPSS中,然后再定義變量屬性。具體如下:①在SPSS中,單擊菜單“File”->“Open”->“Data”,進(jìn)入“OpenFile”對話框,在最下面的“文件類型”框中選擇“Excel(*.xls)”,然后選擇錄入好數(shù)據(jù)的Excel文件(要求該文件暫時沒有被Excel打開),單擊“打開”,進(jìn)入“OpeningExcelDataSource”對話框,單擊“OK”。②定義變量屬性:對每個變量進(jìn)行進(jìn)一步的定義(如變量名標(biāo)簽、變量值標(biāo)簽等),以期達(dá)到SPSS分析所要求的目的第26頁,共30頁,2024年2月25日,星期天3.6在SPSS中核對數(shù)據(jù)利用SPSS的一維頻率分析Frequencies命令可以發(fā)現(xiàn)單變量范圍不合理的數(shù)據(jù)。利用SPSS的交叉表分析Crosstabs命令可以發(fā)現(xiàn)兩個變量之間的邏輯一致性問題。第27頁,共30頁,2024年2月25日,星期天實踐題1999年關(guān)于外商投資企業(yè)雇員調(diào)查問卷(P80~81)要求:(1)確定問卷中每個問題應(yīng)該設(shè)置的變量的個數(shù),并區(qū)分是定性(分類)變量還是定量(數(shù)值型)變量。(2)給每個變量定義變量名、數(shù)據(jù)類型、變量名標(biāo)簽。(3)對于定性(分類)變量,定義相應(yīng)的變量值標(biāo)簽(類
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于隱結(jié)構(gòu)和因子分析的男性不育癥常見中醫(yī)證候研究
- 胸腔積液穿刺引流護(hù)理
- 大班健康爭分奪秒
- 初中地理中國課件
- 初中歷史說課課件模板
- 繪畫教育體系構(gòu)建與教學(xué)實踐
- 防蚊防蠅健康教育
- Thaigranatumin-B-生命科學(xué)試劑-MCE
- SCUT1-2-生命科學(xué)試劑-MCE
- 初中入學(xué)心理健康課件
- 緩和醫(yī)療與護(hù)理課件
- 企業(yè)消防安全責(zé)任制模板
- 學(xué)堂在線 軍事理論 章節(jié)測試答案
- 2025屆黑龍江省哈爾濱四十七中學(xué)七年級英語第二學(xué)期期末統(tǒng)考試題含答案
- 《工程勘察設(shè)計收費標(biāo)準(zhǔn)》(2002年修訂本)
- TCGMA0330012018壓縮空氣站能效分級指南
- 戰(zhàn)略定位與企業(yè)核心競爭力課件
- 授權(quán)簽字人考試參閱題-附答案
- DB14-T 2550-2022廚房食品切配用具顏色標(biāo)識指南
- 保潔人員地面清潔標(biāo)準(zhǔn)作業(yè)規(guī)程
- 99S203消防水泵接合器安裝圖集
評論
0/150
提交評論