版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
(優(yōu)選)第八章資料處理史亞蕾現(xiàn)在是1頁\一共有56頁\編輯于星期二調(diào)查資料的整理的主要內(nèi)容
原始資料的審核和復查1
數(shù)據(jù)清理3
統(tǒng)計表與統(tǒng)計圖4
資料轉(zhuǎn)化與錄入2現(xiàn)在是2頁\一共有56頁\編輯于星期二第一節(jié)原始資料的審核與復查1、資料的審核
定義:它是指研究者對調(diào)查所收集回的原始資料(主要是問卷)進行初步的審查和核實,校正錯填、誤填的答案,剔除亂填、空白和嚴重缺答的廢卷目的:使得原始資料具有較好的準確性、完整性和真實性,從而為后續(xù)資料整理錄入與統(tǒng)計分析工作打下較好的基礎(chǔ)。現(xiàn)在是3頁\一共有56頁\編輯于星期二檢查出文件資料中存在的問題重新向被調(diào)查者核實
資料的審核工作資料審核有兩種不同的做法:一種是實地審核;另一種是系統(tǒng)審核或集中審核現(xiàn)在是4頁\一共有56頁\編輯于星期二實地審核:在調(diào)查的過程中進行,即邊調(diào)查邊審核優(yōu)點:特別及時,且效果較好;缺點:要求調(diào)查工作的組織和安排要特別仔細,調(diào)查員個人處理各種情況的能力要比較強現(xiàn)在是5頁\一共有56頁\編輯于星期二集中審核:先將調(diào)查資料全部收集回來,然后再集中時間進行審核優(yōu)點:調(diào)查工作便于統(tǒng)一組織安排和管理,審核工作也可以統(tǒng)一在研究者的指導下進行,審核的標準比較一致,檢查的質(zhì)量也相對好一些;缺點:整個調(diào)查工作的周期則會相對拉長,少數(shù)個案的重新詢問和核實工作有時因時間相隔較長或調(diào)查地點較遠而無法落實?,F(xiàn)在是6頁\一共有56頁\編輯于星期二
2、資料的復查定義:指的是研究者在調(diào)查資料收回后,又由其他人對所調(diào)查的樣本中的一部分個案進行第二次調(diào)查,以檢查和核實第一次調(diào)查的質(zhì)量基本做法:從原來的調(diào)查員所調(diào)查過的樣本中,隨機抽取5%-15%的個案重新進行調(diào)查調(diào)查內(nèi)容:一方面核實原來的調(diào)查員是否真的對個案進行過調(diào)查;另一方面可將兩次調(diào)查的結(jié)果進行對比,以檢查第一次調(diào)查的質(zhì)量現(xiàn)在是7頁\一共有56頁\編輯于星期二通過審核和復查,研究者可以發(fā)現(xiàn)并糾正原始資料中所存在的一些錯誤,可以剔除一些無法進行再調(diào)查但又有明顯錯誤的問卷,還可以普遍了解整個資料收集工作的質(zhì)量,從而對資料的真實性和準確性具有更大的信心?,F(xiàn)在是8頁\一共有56頁\編輯于星期二第二節(jié)資料轉(zhuǎn)換與錄入1、問卷資料轉(zhuǎn)換編碼手冊:為了減少資料轉(zhuǎn)換工作中的誤差,保證數(shù)據(jù)的質(zhì)量,研究者需要編制一份編碼手冊(也稱編碼簿)發(fā)給從事問卷資料轉(zhuǎn)換工作的人員,以便他們按編碼手冊的要求,統(tǒng)一進行資料轉(zhuǎn)換工作現(xiàn)在是9頁\一共有56頁\編輯于星期二在編碼手冊中,研究者要將需要編碼的項目和問題一一列出,逐一規(guī)定它們的代碼、寬度、欄碼、簡要名稱、答案賦值方式及其他特殊規(guī)定等等。整個編碼手冊的格式要規(guī)范統(tǒng)一,指示要明確,且容易理解,便于操作?,F(xiàn)在是10頁\一共有56頁\編輯于星期二
現(xiàn)在是11頁\一共有56頁\編輯于星期二
現(xiàn)在是12頁\一共有56頁\編輯于星期二“項目名稱”所列的是問卷中的問題或有關(guān)項目;“變量名”則是調(diào)查問卷中所實際測量的一個變量;“含義”是簡要地指出該變量的內(nèi)涵,它往往是變量的核心內(nèi)容的反映;“答案賦值”一項十分關(guān)鍵,它可以說是編碼手冊的真正內(nèi)容。在這一欄中,研究者要詳細地標明每一種答案的賦值安排,以及某些特殊形式的答案賦值方法現(xiàn)在是13頁\一共有56頁\編輯于星期二2、數(shù)據(jù)錄入經(jīng)過前述的資料轉(zhuǎn)換處理,調(diào)查所收回的問卷中的一個個具體答案都已成功地、系統(tǒng)地轉(zhuǎn)換成了由0-9這10個阿拉伯數(shù)字構(gòu)成的數(shù)碼,接下來的任務就是將這些數(shù)碼輸入計算機內(nèi),以便進行統(tǒng)計分析了。這就是數(shù)據(jù)錄入的工作現(xiàn)在是14頁\一共有56頁\編輯于星期二現(xiàn)在是15頁\一共有56頁\編輯于星期二數(shù)據(jù)錄入的方式主要有兩種:一種是直接從問卷上將編好碼的數(shù)據(jù)輸入計算機;另一種是先將問卷上編好碼的數(shù)據(jù)轉(zhuǎn)錄到專門的登錄表上,然后再從登錄表上將數(shù)據(jù)輸入計算機。登錄表的橫欄為問題及變量名,且都有給定的欄碼,縱欄為不同的個案記錄數(shù)據(jù)現(xiàn)在是16頁\一共有56頁\編輯于星期二現(xiàn)在是17頁\一共有56頁\編輯于星期二目前運用較普遍的統(tǒng)計分析軟件主要有SPSS,SAS等,尤其是SPSS應用更為廣泛。從目前情況看,研究者主要采用兩種方法來輸入數(shù)據(jù)。一種方法是直接在SPSS軟件上輸入數(shù)據(jù)。另一類是采用比較專門的數(shù)據(jù)庫管理軟件,如FOXBASE,Excel等,兩種方法各有特點現(xiàn)在是18頁\一共有56頁\編輯于星期二現(xiàn)在是19頁\一共有56頁\編輯于星期二在SPSS中輸入比較直觀,打開SPSS后,顯示的是一個數(shù)據(jù)錄入窗口,每一個縱欄表示一個變量,每一橫行代表一個個案。輸入前需要定義變量,做法是先用鼠標點擊表下面的Variableview,進入到到變量定義窗口(橫行上面分別為變量名、變量類型、變量寬度、小數(shù)點位數(shù)、變量標簽等、縱欄的1、2、3等表示個案)再用鼠標點擊表下方Dataview,返回數(shù)據(jù)錄入窗口?,F(xiàn)在是20頁\一共有56頁\編輯于星期二現(xiàn)在是21頁\一共有56頁\編輯于星期二這時就可以第一行開始,直接將每一個個案的數(shù)據(jù)逐行一個一個地敲到方格中,數(shù)據(jù)錄完后存盤。然后就可以隨時調(diào)用作分析了。但是,直接輸入有時候很容易出錯,且輸入時也不容易發(fā)現(xiàn);而另一類專門性的數(shù)據(jù)庫管理軟件則往往更能保證輸入的正確性,更能減少輸入數(shù)據(jù)時產(chǎn)生的差錯現(xiàn)在是22頁\一共有56頁\編輯于星期二由于一項問卷調(diào)查的數(shù)據(jù)總量(每份問卷的欄碼總數(shù)乘以全部問卷,即為輸入數(shù)碼或字符總數(shù))往往是很大的,故實踐中常常是有多人共同輸入來完成的。因此,研究者必須對數(shù)據(jù)的輸入工作進行精心組織和安排。具體說來,他要做好以下幾方面工作:現(xiàn)在是23頁\一共有56頁\編輯于星期二①挑選和培訓輸入人員。數(shù)據(jù)輸入人員應該是熟悉計算機操作,熟悉調(diào)查問卷的人,通??蓮拇髮W生調(diào)查員中挑選。對選出的錄入人員要進行一定的培訓,熟悉輸入方式和具體軟件,并合理分工和加強管理。現(xiàn)在是24頁\一共有56頁\編輯于星期二②統(tǒng)一規(guī)定數(shù)據(jù)輸入格式和數(shù)據(jù)文件名。由于多人輸入,每個輸入人員應采取統(tǒng)一的輸入格式,并各自規(guī)定自己存放數(shù)據(jù)的文件名,以防與他人輸入的數(shù)據(jù)格式不同或發(fā)生混淆和丟失。尤其是輸入格式一旦確定,每個輸入人員都必須嚴格遵守執(zhí)行,否則以后很難處理,這一點十分關(guān)鍵?,F(xiàn)在是25頁\一共有56頁\編輯于星期二③每個輸入人員獨立完成各自所輸?shù)哪且徊糠謫柧恚煌斎肴藛T的問卷相互之間,以及同一個輸入人員已輸和未輸?shù)膯柧碇g,千萬不要混淆搞亂,以免造成漏輸或重復輸入,影響數(shù)據(jù)質(zhì)量。④在每個輸入人員完成各自所負責的問卷輸入任務后,由研究者把他們的數(shù)據(jù)合起來形成一個總的數(shù)據(jù)文件,以供統(tǒng)計分析時調(diào)用。現(xiàn)在是26頁\一共有56頁\編輯于星期二第三節(jié)數(shù)據(jù)清理現(xiàn)在是27頁\一共有56頁\編輯于星期二1、有效范圍清理對于問卷中的任何一個變量來說,它的有效的編碼值往往都有某種范圍,而當數(shù)據(jù)中的數(shù)字超出了這一范圍時,可以肯定這個數(shù)字一定是錯誤的現(xiàn)在是28頁\一共有56頁\編輯于星期二當然,這種錯誤數(shù)字的出現(xiàn)可以發(fā)生在資料處理的每一個階段。首先,發(fā)生在原始問卷中的回答上;其次,發(fā)生在編碼員對問卷的編碼結(jié)果上;第三,發(fā)生在計算機錄入員輸入數(shù)據(jù)的過程中。現(xiàn)在是29頁\一共有56頁\編輯于星期二要檢查出所有不符合要求的超出有效范圍的編碼值,我們只需在計算機上用SPSS軟件(或其他軟件)執(zhí)行一條統(tǒng)計各變量頻數(shù)分布的命令,計算機很快就給出下列形式的結(jié)果:現(xiàn)在是30頁\一共有56頁\編輯于星期二現(xiàn)在是31頁\一共有56頁\編輯于星期二找有問題的個案的方法同樣離不開計算機及SPSS軟件的運用。在SPSS軟件中,我們先打開數(shù)據(jù)文件,然后執(zhí)行“查找數(shù)據(jù)”命令。選擇數(shù)據(jù)中的A5欄,讓計算機逐個查找在這一變量欄中編碼值為6的那9個個案。再根據(jù)這9個個案的編號找出原始問卷,進行核對現(xiàn)在是32頁\一共有56頁\編輯于星期二如果原始問卷上的回答是2,而編碼為6,則是編碼員的錯誤,將數(shù)據(jù)中的這個6改為2即可;如果原始問卷上是2,編碼也是2,則是錄入員的錯誤,也直接將數(shù)據(jù)改正即可;如果核對時,發(fā)現(xiàn)是原始問卷中的填答錯誤,則只能將該個案在這一變量上的回答記為0(即無回答),作為缺省值處理現(xiàn)在是33頁\一共有56頁\編輯于星期二2、邏輯一致性清理其基本思路是依據(jù)問卷中的問題相互之間所存在的某種內(nèi)在的邏輯聯(lián)系,來檢查前后數(shù)據(jù)之間的合理性?,F(xiàn)在是34頁\一共有56頁\編輯于星期二比如,一項對青年夫婦進行的社會調(diào)查中,有這樣一對相倚問題。其過濾性問題是:“你們有孩子嗎?”答案為“有(編碼為1”和“沒有(編碼為2。而后續(xù)性問題是:“請問你們的孩子今年多大了?”那么,對于那些在前一問題中的回答“沒有”的人(即編碼為2的人),在后一問題中的回答應該是空白(即為缺省值,用0表示)。如果在這些人中,有的人的第二個答案上出現(xiàn)了4、6等數(shù)字,則這些個案的數(shù)據(jù)就可能有毛病現(xiàn)在是35頁\一共有56頁\編輯于星期二3、數(shù)據(jù)質(zhì)量抽查采用隨機抽樣的方法,從樣本的全部個案中,抽取一部分個案,進行校對工作。用這一部分個案校對的結(jié)果,來估計和評價全部數(shù)據(jù)的質(zhì)量。根據(jù)樣本中個案數(shù)目的多少,以及每份問卷中變量數(shù)和總字符數(shù)的多少,研究者往往抽取2%-5%的個案進行校對現(xiàn)在是36頁\一共有56頁\編輯于星期二一項調(diào)查樣本規(guī)模為1000個個案,一份問卷的字符數(shù)(數(shù)據(jù)的個數(shù))為200。研究者從中隨機抽取3%的個案(即30份問卷)進行對照檢查,結(jié)果發(fā)現(xiàn)有2個字符輸入錯誤,這樣可知錯誤率在0.03%左右。也就是說在總共20萬個數(shù)據(jù)中,大約有60個左右的錯誤。現(xiàn)在是37頁\一共有56頁\編輯于星期二第四節(jié)統(tǒng)計表與統(tǒng)計圖現(xiàn)在是38頁\一共有56頁\編輯于星期二1、統(tǒng)計表的構(gòu)成與制作(1)統(tǒng)計表的構(gòu)成從統(tǒng)計表的結(jié)構(gòu)上看,通常都由表號、總標題、橫行標題、縱欄標題、數(shù)字注釋和資料來源等要素所構(gòu)成表號:表的序號,位于表頂端左角。其作用是便于指示和查找現(xiàn)在是39頁\一共有56頁\編輯于星期二總標題:是表的名稱,它位于表的頂端,緊接在表號后面。橫行標題:是橫行的名稱,又稱橫標目。它位于表的左側(cè),對于頻數(shù)統(tǒng)計表來說,橫行標題一般用來統(tǒng)計所要說明的主題;而對于交互分類統(tǒng)計表來說,則表示其中一個變量類別現(xiàn)在是40頁\一共有56頁\編輯于星期二縱欄標題:是縱欄的名稱,又稱縱標目,位于表的最上一格。對于一般的頻數(shù)統(tǒng)計表,它指示調(diào)查指標或統(tǒng)計指標的名稱;而對于交互分類表來說,它也是表示其中的一個變量的類別數(shù)字:是統(tǒng)計表的實質(zhì)性內(nèi)容,是對調(diào)查資料進行統(tǒng)計匯總、整理和計算的結(jié)果體現(xiàn)。它位于由橫行標題與縱欄標題所包圍的范圍中?,F(xiàn)在是41頁\一共有56頁\編輯于星期二注釋或資料來源是對表中資料的一種說明,位于表的下端。現(xiàn)在是42頁\一共有56頁\編輯于星期二(2)統(tǒng)計表的制作統(tǒng)計表制作原則是:科學、規(guī)范、簡明、實用、美觀。具地說,在制作統(tǒng)計表時,應注意以下幾個方面:首先,表的標題要簡短明了,其次,表的縱欄標題與橫行標題要準確反映變量取值的含義,現(xiàn)在是43頁\一共有56頁\編輯于星期二第三,表中的數(shù)據(jù)資料必須注明計量單位,現(xiàn)在是44頁\一共有56頁\編輯于星期二第四,對于一般頻數(shù)分布表,則應列出合計欄,以便獲得整體情況的資料??傆嫽蚝嫌嫏谕旁诒淼淖钕乱桓?;對于交互分類表,則將各種專門的統(tǒng)計量放在表的最下面一格現(xiàn)在是45頁\一共有56頁\編輯于星期二最后,各種表格均應以橫線為主,能夠不用豎線則盡量不用。即便需要用豎線的表格,也應是開口式的,即表的左右兩端不劃豎線在不致混淆的情況下,也可將其豎線去掉,成為以下形式現(xiàn)在是46頁\一共有56頁\編輯于星期二而交互分類表則可制成以下表8-7形式除表的最上面一條橫線與最下面一條橫線用粗線外,其余橫線均用細線現(xiàn)在是47頁\一共有56頁\編輯于星期二2、統(tǒng)計圖統(tǒng)計圖具有直觀、形象、一目了然、通俗易懂的特點,它主要用于調(diào)查資料初級統(tǒng)計結(jié)果的描述,特別適合于對調(diào)查總體的內(nèi)部構(gòu)成進行描述,對不同現(xiàn)象的分布進行比較以及對現(xiàn)象變化的趨勢進行展示等。統(tǒng)計圖主要有條形圖、圓形圖和折線圖三種現(xiàn)在是48頁\一共有56頁\編輯于星期二(1)條形圖條形圖又稱矩形圖,它是以寬度相等、長度不等的長條來表示不同的統(tǒng)計數(shù)字,如表示頻數(shù)或百分比的多少等等現(xiàn)在是49頁\一共有56頁\編輯于星期二簡單條形圖現(xiàn)在是50頁\一共有56頁\編輯于星期二復雜條形圖:現(xiàn)在是51頁\一共有56頁\編輯于星期二(2)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度數(shù)據(jù)中心服務器租賃合同
- 2024醫(yī)院病房清潔服務合同
- 2024年展覽保險服務協(xié)議
- 2024年度0kv線路工程建設(shè)的合作開發(fā)合同
- 2024年度婚禮主持委托合同
- 2024年定制版太陽能系統(tǒng)維護合同
- 2024年度太陽能熱水系統(tǒng)安裝合同
- 2024年度城市供水供電供氣合同
- 2024年三人股東責任承擔協(xié)議
- 04版建筑工程合同
- GDX2包裝機組工藝流程簡介
- 個人獨資企業(yè)有限公司章程(模板)
- 小學生安全用電知識(課堂PPT)
- 裝飾自己的名字說課稿
- 人教版(PEP)四年級上冊英語unit 1 My classroom圖文完美版(課堂PPT)
- 幼小銜接中存在的問題及對策
- 中級漢語期末考試測試題(共5頁)
- 《國家電網(wǎng)公司安全生產(chǎn)事故隱患排查治理管理辦法》(國家電網(wǎng)安監(jiān)[
- 水保監(jiān)理報告范文
- xx售樓部鋼結(jié)構(gòu)及玻璃幕墻工程拆除施工方案
- 云南沿邊高校青年教師發(fā)展現(xiàn)狀及問題分析
評論
0/150
提交評論