


下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、信息采集技術-調查問卷中的編碼魏巍?。ū本┬畔⒙殬I(yè)技術學院)摘要:介紹編碼的概念,編碼的種類及如何對調查問卷中的問題進行編碼。關鍵詞:編碼;調查問卷;手工編碼;自動編碼1 編碼編碼是給問題的每項答案賦予一個數(shù)值代碼,以便于數(shù)據(jù)錄入和作進一步處理的過程。編碼方案的制定目標。應該是能將調查中所得到的各種回答分成若干有意義且有本質差別的類別。制定一個好的編碼方案并不容易,要按照調查、匯總制表或數(shù)據(jù)分析的目標,考慮編碼的詳細程度。最好是先列出一個不能再細分的大表,然后在此表格的基礎上根據(jù)具體需要對某些類別進行合并。因為分類太少會掩蓋某些信息,產(chǎn)生誤導,而“其他”類太大則對研究問題也沒有益處。類別常可以
2、壓縮、歸并,但是在事后要將一個類別拆分開來則是困難的。進行編碼時,建議使用標準碼,如行業(yè)、地理和職業(yè)代碼。1.1 編碼功能1.1.1 鑒別 編碼是鑒別信息分類對象的唯一標識。 1.1.2 分類 當分類對象按一定屬性分類時,對每一類別設計一個編碼,這時編碼可以作為區(qū)分對象類別的標識。這種標識要求結構清晰,毫不含糊。 1.1.3 排序 由于編碼所有的符號都具有一定的順序,因而可以方便地按此順序進行排序。 1.1.4 專用含義 由于某種需要,當采用一些專用符號代表特定事物或概念時,編碼就提供一定的專用含義,如某些分類對象的技術參數(shù)、性能指標等。1.2 編碼的方法編碼工作通常包括手工操作和自動化操作兩
3、個方面,具體方法很多,包括:問卷中已預先編碼;在數(shù)據(jù)收集完畢之后進行手工編碼;通過文本識別軟件進行自動編碼(即借助軟件給一串字符賦予一個代碼)。1.2.1 預先編碼的問卷對預先編碼的問卷,調查人員或被調查者在調查時需要做的只是在合適的代碼上打勾或畫圈即可??陬^的或手寫的原始回答并不需要錄入。代碼框可以緊挨著要編碼的選項,也可以放在問卷的邊緣。預先編碼只適用于封閉式問題,對開放式問題則不適用。以下是關于一項對航空公司的服務質量測評的例子:您認為海南航空公司的以下服務那種是最應該提升的:(只選一項,在選項前面打) 食品服務 行李服務 衛(wèi)生服務 售票服務 登機時間 其他若采用計算機輔助方式收集數(shù)據(jù),
4、調查人員或被調查者選擇答案時,代碼就會自動錄入;但采用紙張問卷調查時,回答的代碼需在數(shù)據(jù)收集后錄入。對問卷預先進行編碼可以節(jié)省大量的時間和費用,但是預先編碼也具有一定的局限性。我們無法確切知道被調查者的原始回答,這就會給檢驗編碼的質量帶來困難,而且以后也無法更改代碼(特別是細分代碼)或添加代碼。對于問卷上沒有預先編碼的封閉式問題或開放式問題,調查人員對被調查者的回答應逐字記錄,然后用手工或自動方式進行編碼。編碼是確定問卷中各項目答案所對應的計算機代碼,主要考慮的問題有變量的定義和取值的含義。變量的定義是考慮問卷中涉及的每一個問題應當對應計算機數(shù)據(jù)庫中的什么變量,以及變量的類型等。對于不同類型問
5、題,變量定義是不同的。取值的含義是指對應一個變量,其值所代表的內(nèi)容。一般,變量的值就表示在題目中選擇的選項序號,但在多項選擇和數(shù)字型變量的場合,這一規(guī)定有所變化。1.2.2 手工編碼對于開放式的問題,在手工編碼過程中,編碼員(通常在數(shù)據(jù)收集之后)要閱讀、理解問題的書面回答并把它編成數(shù)字代碼,數(shù)字代碼可以錄入計算機,也可以直接標在問卷上。數(shù)據(jù)收集完畢后,編碼員有時只需給答案找到一個特定的選項,有時卻要根據(jù)回答所提供的信息和編碼規(guī)則將答案進行歸類,再將它歸入具體的選項類別。編碼可能基于一個問題的回答,也可能基于幾個相關問題的回答,這時編碼的質量在很大程度上就取決于最初的審核工作的質量、編碼方案的完
6、善性和編碼員的技能。手工編碼的原則:(1)唯一性。盡管編碼對象可能有不同的名稱、不同的描述,但對應于此對象的代碼必須唯一,即代碼與相應的編碼對象一一對應。(2)合理性代碼的結構與形式要與編碼對象的分類體系相適應,可以從代碼上來識別一個編碼對象在其分類體系中的位置。(3)可擴展性代碼的結構必須適應編碼對象的發(fā)展與變化,為新的編碼對象留有足夠的備用代碼。(4)簡潔性在滿足應用要求和可擴展性的前提下,代碼的結構應當簡潔,代碼位數(shù)盡可能短,以節(jié)省計算機的處理時間和存儲空間,降低差錯率。(5)可識別性代碼從結構上應盡可能多地反映編碼對象的屬性與特征,便于人們和計算機識別。有些代碼的設計還要考慮到便于機器
7、或人工檢驗可能出現(xiàn)的差錯。(6)穩(wěn)定性在應用環(huán)境與需求發(fā)生變化時,代碼的結構應當保持相對穩(wěn)定,具有適應變化和容納變化的能力。在實際應用中,代碼結構的變化要消耗人、財、物等資源,因此,凡已形成各級(國際、國家、地方、行業(yè)、企業(yè))特征的代碼結構需要調整時,必須由相應的標準化組織機構來進行。不同編碼員之間的差別是在所難免的,因此對每一位所做的第一批問卷都應該逐份進行仔細的檢查,找出錯誤,并且確認是否有必要進行進一步培訓。之后,還要對編碼的質量進行定期的檢查。1.2.3 自動編碼過去編碼都是手工完成的。但是由于技術的進步,和對時效性與質量的要求,編碼正越來越發(fā)展成為一種自動化的操作過程。通常,自動編碼
8、系統(tǒng)需要輸入兩個文件,其中包含了典型的書面答案和相應的數(shù)字代碼。自動編碼的第一步是解析。解析就是把被調查者的回答標準化,使計算機能夠識別的過程。解析通常包括消除無關字符,如標點,消除雙重詞、無關重要的詞、某些前綴和后綴等。這一步,系統(tǒng)將對需要編碼的文件和參考文件分別進行解析。下一步,對編碼文件中需要編碼的記錄,從參考文件中去查找完全匹配的選項。找到了,就把參考文件中相應選項的代碼復制到調查文件中,這樣,這一條記錄的編碼就完成了。如果找不到完全匹配的選項,就要試圖找最接近的選項。參考文件中的每條記錄都有一個得分,用來度量參考文件中選項的表述與調查回答相接近的程度。得分是按照預先確定的參數(shù)(用它來減少出錯的風險)來評估的。如果找到一個足夠接近的匹配項,對應的代碼就被賦予被調查者的回答,編碼就完成了。通過分析近似匹配的選項,參考文件中有時會出
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣西賀州市桂梧高級中學2025屆高一化學第二學期期末質量跟蹤監(jiān)視試題含解析
- 甘肅省慶陽市長慶中學2025年高二下化學期末調研模擬試題含解析
- 北京集體資產(chǎn)管理辦法
- 公司出國證件管理辦法
- 智慧手環(huán)使用管理辦法
- 晉中市健康碼管理辦法
- 內(nèi)貿(mào)船舶衛(wèi)生管理辦法
- 農(nóng)業(yè)智能化生產(chǎn)系統(tǒng)
- 醫(yī)療產(chǎn)品售賣管理辦法
- 除害滅蟲施工方案:全面指南與實施建議
- 智慧型陸基式漁業(yè)產(chǎn)業(yè)園項目可行性研究報告模板-備案拿地
- 廣告安裝培訓課件
- 海底撈寢室管理制度
- 2025年重慶市中考數(shù)學試卷真題及答案詳解(精校打印版)
- 云倉代發(fā)貨合同協(xié)議書
- A-Level數(shù)學PureMath1函數(shù)與三角函數(shù)2025年春季模擬試卷
- 汾酒集團招聘考試試題及答案
- 碳資產(chǎn)管理與碳金融 課件 第1-5章 碳排放與氣候變化政策分析-溫室氣體排放量的核查
- 《全媒體營銷》課件-項目一 全媒體營銷基礎與產(chǎn)業(yè)變革
- 內(nèi)網(wǎng)滲透面試題及答案
- 2025-2030中國循環(huán)腫瘤細胞(CTC)和癌癥干細胞(CSC)行業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報告
評論
0/150
提交評論