


下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、信息采集技術-調(diào)查問卷中的編碼魏巍巍(北京信息職業(yè)技術學院)摘要:介紹編碼的概念,編碼的種類及如何對調(diào)查問卷中的問題進行編碼。關鍵詞:編碼;調(diào)查問卷;手工編碼;自動編碼1 編碼編碼是給問題的每項答案賦予一個數(shù)值代碼,以便于數(shù)據(jù)錄入和作進一步處理的過程。編碼方案的制定目標。應該是能將調(diào)查中所得到的各種回答分成若干有意義且有本質(zhì)差別的類別。制定一個好的編碼方案并不容易,要按照調(diào)查、匯總制表或數(shù)據(jù)分析的目標,考慮編碼的詳細程度。最好是先列出一個不能再細分的大表,然后在此表格的基礎上根據(jù)具體需要對某些類別進行合并。因為分類太少會掩蓋某些信息,產(chǎn)生誤導,而“其他”類太大則對研究問題也沒有益處。類別??梢?/p>
2、壓縮、歸并,但是在事后要將一個類別拆分開來則是困難的。進行編碼時,建議使用標準碼,如行業(yè)、地理和職業(yè)代碼。1.1 編碼功能1.1.1 鑒別 編碼是鑒別信息分類對象的唯一標識。 1.1.2 分類 當分類對象按一定屬性分類時,對每一類別設計一個編碼,這時編碼可以作為區(qū)分對象類別的標識。這種標識要求結(jié)構清晰,毫不含糊。 1.1.3 排序 由于編碼所有的符號都具有一定的順序,因而可以方便地按此順序進行排序。 1.1.4 專用含義 由于某種需要,當采用一些專用符號代表特定事物或概念時,編碼就提供一定的專用含義,如某些分類對象的技術參數(shù)、性能指標等。1.2 編碼的方法編碼工作通常包括手工操作和自動化操作兩
3、個方面,具體方法很多,包括:問卷中已預先編碼;在數(shù)據(jù)收集完畢之后進行手工編碼;通過文本識別軟件進行自動編碼(即借助軟件給一串字符賦予一個代碼)。1.2.1 預先編碼的問卷對預先編碼的問卷,調(diào)查人員或被調(diào)查者在調(diào)查時需要做的只是在合適的代碼上打勾或畫圈即可??陬^的或手寫的原始回答并不需要錄入。代碼框可以緊挨著要編碼的選項,也可以放在問卷的邊緣。預先編碼只適用于封閉式問題,對開放式問題則不適用。以下是關于一項對航空公司的服務質(zhì)量測評的例子:您認為海南航空公司的以下服務那種是最應該提升的:(只選一項,在選項前面打) 食品服務 行李服務 衛(wèi)生服務 售票服務 登機時間 其他若采用計算機輔助方式收集數(shù)據(jù),
4、調(diào)查人員或被調(diào)查者選擇答案時,代碼就會自動錄入;但采用紙張問卷調(diào)查時,回答的代碼需在數(shù)據(jù)收集后錄入。對問卷預先進行編碼可以節(jié)省大量的時間和費用,但是預先編碼也具有一定的局限性。我們無法確切知道被調(diào)查者的原始回答,這就會給檢驗編碼的質(zhì)量帶來困難,而且以后也無法更改代碼(特別是細分代碼)或添加代碼。對于問卷上沒有預先編碼的封閉式問題或開放式問題,調(diào)查人員對被調(diào)查者的回答應逐字記錄,然后用手工或自動方式進行編碼。編碼是確定問卷中各項目答案所對應的計算機代碼,主要考慮的問題有變量的定義和取值的含義。變量的定義是考慮問卷中涉及的每一個問題應當對應計算機數(shù)據(jù)庫中的什么變量,以及變量的類型等。對于不同類型問
5、題,變量定義是不同的。取值的含義是指對應一個變量,其值所代表的內(nèi)容。一般,變量的值就表示在題目中選擇的選項序號,但在多項選擇和數(shù)字型變量的場合,這一規(guī)定有所變化。1.2.2 手工編碼對于開放式的問題,在手工編碼過程中,編碼員(通常在數(shù)據(jù)收集之后)要閱讀、理解問題的書面回答并把它編成數(shù)字代碼,數(shù)字代碼可以錄入計算機,也可以直接標在問卷上。數(shù)據(jù)收集完畢后,編碼員有時只需給答案找到一個特定的選項,有時卻要根據(jù)回答所提供的信息和編碼規(guī)則將答案進行歸類,再將它歸入具體的選項類別。編碼可能基于一個問題的回答,也可能基于幾個相關問題的回答,這時編碼的質(zhì)量在很大程度上就取決于最初的審核工作的質(zhì)量、編碼方案的完
6、善性和編碼員的技能。手工編碼的原則:(1)唯一性。盡管編碼對象可能有不同的名稱、不同的描述,但對應于此對象的代碼必須唯一,即代碼與相應的編碼對象一一對應。(2)合理性代碼的結(jié)構與形式要與編碼對象的分類體系相適應,可以從代碼上來識別一個編碼對象在其分類體系中的位置。(3)可擴展性代碼的結(jié)構必須適應編碼對象的發(fā)展與變化,為新的編碼對象留有足夠的備用代碼。(4)簡潔性在滿足應用要求和可擴展性的前提下,代碼的結(jié)構應當簡潔,代碼位數(shù)盡可能短,以節(jié)省計算機的處理時間和存儲空間,降低差錯率。(5)可識別性代碼從結(jié)構上應盡可能多地反映編碼對象的屬性與特征,便于人們和計算機識別。有些代碼的設計還要考慮到便于機器
7、或人工檢驗可能出現(xiàn)的差錯。(6)穩(wěn)定性在應用環(huán)境與需求發(fā)生變化時,代碼的結(jié)構應當保持相對穩(wěn)定,具有適應變化和容納變化的能力。在實際應用中,代碼結(jié)構的變化要消耗人、財、物等資源,因此,凡已形成各級(國際、國家、地方、行業(yè)、企業(yè))特征的代碼結(jié)構需要調(diào)整時,必須由相應的標準化組織機構來進行。不同編碼員之間的差別是在所難免的,因此對每一位所做的第一批問卷都應該逐份進行仔細的檢查,找出錯誤,并且確認是否有必要進行進一步培訓。之后,還要對編碼的質(zhì)量進行定期的檢查。1.2.3 自動編碼過去編碼都是手工完成的。但是由于技術的進步,和對時效性與質(zhì)量的要求,編碼正越來越發(fā)展成為一種自動化的操作過程。通常,自動編碼
8、系統(tǒng)需要輸入兩個文件,其中包含了典型的書面答案和相應的數(shù)字代碼。自動編碼的第一步是解析。解析就是把被調(diào)查者的回答標準化,使計算機能夠識別的過程。解析通常包括消除無關字符,如標點,消除雙重詞、無關重要的詞、某些前綴和后綴等。這一步,系統(tǒng)將對需要編碼的文件和參考文件分別進行解析。下一步,對編碼文件中需要編碼的記錄,從參考文件中去查找完全匹配的選項。找到了,就把參考文件中相應選項的代碼復制到調(diào)查文件中,這樣,這一條記錄的編碼就完成了。如果找不到完全匹配的選項,就要試圖找最接近的選項。參考文件中的每條記錄都有一個得分,用來度量參考文件中選項的表述與調(diào)查回答相接近的程度。得分是按照預先確定的參數(shù)(用它來減少出錯的風險)來評估的。如果找到一個足夠接近的匹配項,對應的代碼就被賦予被調(diào)查者的回答,編碼就完成了。通過分析近似匹配的選項,參考文件中有時會出
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)院門禁施工方案
- 河邊堤壩加固施工方案
- 快拼箱施工方案
- 富錦打井施工方案
- 我的中國夢作文100字篇
- 二零二五年度燃氣泄漏報警器安裝合同
- 二零二五年度情侶旅行計劃與費用分攤合同
- 二零二五年度餐飲單位市場拓展合作合同
- 二零二五年度房屋出租中介服務合同(含租賃合同解除條件)
- 2025年度餐飲廚師營養(yǎng)健康食譜開發(fā)合同
- 2025年湖南鐵道職業(yè)技術學院單招職業(yè)技能測試題庫帶答案
- 2025年江蘇揚州市儀征市眾鑫建設開發(fā)有限公司招聘筆試參考題庫附帶答案詳解
- 大象版四年級下冊《科學》全套教學課件
- 安徽毛坦廠實驗中學2025屆高三11月期中考試英語+答案
- 部編高教版2023·職業(yè)模塊 中職語文 2.《寧夏閩寧鎮(zhèn):昔日干沙灘今日金沙灘》 課件
- 安全環(huán)保職業(yè)健康法律法規(guī)清單2024年
- 2022年袋鼠數(shù)學競賽真題一二年級組含答案
- 人工智能引論智慧樹知到課后章節(jié)答案2023年下浙江大學
- 銀行保潔服務投標方案(技術標)
- 2023年高考語文全國乙卷《長出一地的好蕎麥》解析
- 中國石油天然氣集團公司保密管理規(guī)定
評論
0/150
提交評論