調(diào)查數(shù)據(jù)處理與分析_第1頁
調(diào)查數(shù)據(jù)處理與分析_第2頁
調(diào)查數(shù)據(jù)處理與分析_第3頁
調(diào)查數(shù)據(jù)處理與分析_第4頁
調(diào)查數(shù)據(jù)處理與分析_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、工作任務五工作任務五 調(diào)查數(shù)據(jù)處理和分析調(diào)查數(shù)據(jù)處理和分析l學習目標學習目標 l1.知識目標l(1)理解數(shù)據(jù)處理的涵義;l(2)了解調(diào)查數(shù)據(jù)的審查的內(nèi)容、方法和基本步驟;l(3)掌握市場調(diào)查缺失數(shù)據(jù)的處理技術和方法;l(4)了解數(shù)據(jù)分析的的涵義、特點和原則;l(5)掌握數(shù)據(jù)分析的方法。l2.技能目標l(1)會調(diào)查數(shù)據(jù)的編碼、錄入與匯總;l(2)會運用統(tǒng)計表,統(tǒng)計圖表達調(diào)查數(shù)據(jù)信息;l(3)會運用總量、相對和動態(tài)指標對調(diào)查數(shù)據(jù)進行分析;l(4)會運用集中趨勢分析技術對調(diào)查數(shù)據(jù)進行分析;l(5)會運用離中趨勢分析技術對調(diào)查數(shù)據(jù)進行分析。5.1數(shù)據(jù)處理數(shù)據(jù)處理l5.1.1數(shù)據(jù)處理概述數(shù)據(jù)處理概述l1

2、.數(shù)據(jù)處理的含義l數(shù)據(jù)處理,又稱數(shù)據(jù)資料整理,是指將調(diào)查所得的原始資料按照調(diào)查目的和調(diào)查任務的要求,運用科學的方法進行加工整理,使之條理化、系統(tǒng)化,并能反映調(diào)查現(xiàn)象總體特征的綜合資料的工作過程。 l2.數(shù)據(jù)處理的內(nèi)容l主要有以下幾個方面:對調(diào)查所得原始資料進行審查;缺失數(shù)據(jù)的處理;調(diào)查數(shù)據(jù)的排序、分類、編碼、錄入、匯總;將整理后的數(shù)據(jù)繪制成圖表。5.1.2調(diào)查數(shù)據(jù)的審查調(diào)查數(shù)據(jù)的審查l1.數(shù)據(jù)審查的內(nèi)容數(shù)據(jù)審查的內(nèi)容l(1)數(shù)據(jù)資料的完整性l(2)數(shù)據(jù)資料的準確性l(3)數(shù)據(jù)資料的及時性l(4)數(shù)據(jù)資料的一致性5.1.2調(diào)查數(shù)據(jù)的審查調(diào)查數(shù)據(jù)的審查l2.數(shù)據(jù)資料準確性的審查方法數(shù)據(jù)資料準確性的

3、審查方法l(1)經(jīng)驗判斷,即根據(jù)已有的經(jīng)驗,判斷數(shù)據(jù)的真實性和準確性 。 l(3)計算審核,即根據(jù)調(diào)查項目有關指標之間存在的數(shù)量關系,檢查所接受資料數(shù)據(jù)的正確性,審查過程中,主要看各個數(shù)字在計算方法和計算結果上有無錯誤。l(2)邏輯檢查,就是根據(jù)調(diào)查項目之間的內(nèi)在聯(lián)系和實際情況,對數(shù)據(jù)進行邏輯判斷,看其是否有違背常理或者前后矛盾的地方。5.1.3有問題問卷的處置有問題問卷的處置l1.無效問卷l(1)回答不完全。如果一份問卷中至少有三分之一的問題沒有回答,這份問卷應視為無效問卷。l(2)調(diào)查對象不符合要求。如有的調(diào)查中規(guī)定某類的人員不能成為調(diào)查對象,如果問卷是由這類人員作答,就是無效問卷。l(3

4、)答案選擇高度一致,即回答沒有什么變化。如,不管什么問題都選擇第一個答案。l(4)截止日期后收回的問卷,即這些問卷其回答的可靠性很低,提供的極有可能是虛假信息。虛假信息的危害非常大,甚至比缺乏信息帶來的還要大,所以這些問卷要全部作廢。5.1.3有問題問卷的處置有問題問卷的處置l2.不滿意的問卷l(1)模糊不清。可能由于調(diào)查員記錄的原因,把“”畫在兩個答案之間。l(2)前后不一致或有明顯錯誤的。如一個年齡為20歲的被訪者職稱是教授;一個月收入低于1 000元的被訪者卻擁有一處豪宅等。l(3)模棱兩可。要求單項選擇的閉式問題卻選擇了多個答案。l(4)不符合作答要求。比如跳答或不按要求回答。5.1.

5、3有問題問卷的處置有問題問卷的處置l3.有問題問卷的處理方法l(1)退回問卷重新調(diào)查l(2)放棄不用l(3)視為缺失數(shù)據(jù)的處理,如果不滿意問卷數(shù)量所占比例較少,而且涉及的變量不是關鍵變量,在無法退回問卷做重新調(diào)查時,可以按缺失數(shù)據(jù)的處理方式進行處理。5.1.3缺失數(shù)據(jù)的處理缺失數(shù)據(jù)的處理l1.推理插補l推理插補,是對缺失或不一致的數(shù)據(jù)通過推斷來確定。這種推理一般是根據(jù)數(shù)據(jù)資料中其他回答項的數(shù)據(jù)推理得來的。l例如,一個三項數(shù)值的和是100,其中的兩項分別是30和40,剩下的一項數(shù)值可以推算出是30。其數(shù)據(jù)間的邏輯關系是,第三項數(shù)值是三項數(shù)值之和與已知兩項數(shù)值之差。5.1.3缺失數(shù)據(jù)的處理缺失數(shù)據(jù)

6、的處理l2.均值插補l均值插補,是對缺失或不一致的數(shù)據(jù)用數(shù)列的均值來代替的插補方法。l(1)當原數(shù)列沒有明顯升降趨勢和季節(jié)波動時,用整個數(shù)列的平均值插補缺項。l(2)當原數(shù)列各期增(減)量大體相同時,可以用前期數(shù)據(jù)加平均增(減)量來插補缺項。5.1.3缺失數(shù)據(jù)的處理缺失數(shù)據(jù)的處理l2.均值插補l均值插補,是對缺失或不一致的數(shù)據(jù)用數(shù)列的均值來代替的插補方法。l(1)當原數(shù)列沒有明顯升降趨勢和季節(jié)波動時,用整個數(shù)列的平均值插補缺項l(2)當原數(shù)列各期增(減)量大體相同時,可以用前期數(shù)據(jù)加平均增(減)量來插補缺項。5.1.3缺失數(shù)據(jù)的處理缺失數(shù)據(jù)的處理l3.比例插補,是根據(jù)事物之間的比例關系推算所缺

7、數(shù)據(jù)的插補方法。l4.熱平臺插補l熱平臺插補是使用相似類型被調(diào)查者的已有記錄的信息(供者)來代替一個缺失的或的或不一致的數(shù)據(jù)(受者)。熱平臺插補有序貫熱平臺插補和隨機熱平臺插補兩種基本類型。5.1.4調(diào)查數(shù)據(jù)資料的排序調(diào)查數(shù)據(jù)資料的排序l調(diào)查數(shù)據(jù)資料的排序是指把收集到的數(shù)據(jù)資料按照某一數(shù)量標志或指標數(shù)值的大小順序重新排列。一般來說,錄入數(shù)據(jù)清單的數(shù)據(jù)資料是無序的,不能反映現(xiàn)象的本質和規(guī)律性,為了使用方便,通常要將收集到的所有數(shù)據(jù)資料進行排序。5.1.5 數(shù)據(jù)資料的分類(分組)l審核后的數(shù)據(jù)資料只有進行分類(分組)和匯總,才能為市場分析提供系統(tǒng)化和條理化的綜合指標數(shù)據(jù),這也是保證數(shù)據(jù)資料客觀準確

8、的重要條件。 l1、分組的類型l1)按品質標志分組l2)按數(shù)量標志分組l3)簡單分組l4)復合分組5.1.5 數(shù)據(jù)資料的分類(分組)l2、分組(分類)的步驟l第一,選擇恰當?shù)姆纸M標志l第二,確定分組形式l第三,確定組距和組數(shù)l第四,確定組限與組中值組數(shù)最小變量值最大變量值組距=組中值=2下限上限 缺下限的開口組組中值=2鄰組組距上限缺上限的開口組組中值=2鄰組組距下限 5.1.6調(diào)查數(shù)據(jù)的編碼、錄入調(diào)查數(shù)據(jù)的編碼、錄入l1.調(diào)查數(shù)據(jù)的編碼l(1)編碼的含義l利用計算機對調(diào)查資料進行加工整理時,需要對調(diào)查項目進行編碼,以保證計算機對錄入信息的高效處理。所謂編碼,就是將調(diào)查表中的各個項目進行編號,

9、將其所承載的信息轉化為符號或數(shù)字代碼,通過計算機語言對調(diào)查資料進行進行分類匯總和統(tǒng)計分析。 5.1.6調(diào)查數(shù)據(jù)的編碼、錄入調(diào)查數(shù)據(jù)的編碼、錄入l(2)編碼的作用l1)減少數(shù)據(jù)錄入和分析的工作量,節(jié)省費用和時間,提高工作效率。l2)將定性數(shù)據(jù)轉化為定量數(shù)據(jù),把整個問卷的信息轉化為規(guī)范標準的數(shù)據(jù)庫,進而可以利用統(tǒng)計軟件,采用統(tǒng)計分析方法進行定量分析。l3)減少誤差。量化的數(shù)據(jù)簡單易懂,不像文字資料容易丟失重要信息,在編碼過程中,還可以利用編碼修正回答誤差,替代缺失值,因此編碼有助于減少調(diào)查誤差。5.1.6調(diào)查數(shù)據(jù)的編碼、錄入調(diào)查數(shù)據(jù)的編碼、錄入l(3)幾種常見的編碼方法l對甄別條件的設定、甄別質量

10、的控制和主持人的主持水平要求高;l所取得的信息是方向性的,不易精確地進行定量分析,不能將結論推及總體;l有些涉及隱私、保密等問題,不容易當眾詢問;l由于受時間的限制,需在有限時間內(nèi)完成規(guī)定的內(nèi)容,容易造成無法深入討論。 5.1.6調(diào)查數(shù)據(jù)的編碼、錄入調(diào)查數(shù)據(jù)的編碼、錄入l1)順序編碼法l順序編碼法又稱系列編碼法,是指用一個標準對信息資料進行分類,并按照一定的順序用連續(xù)的數(shù)據(jù)或字母進行編碼的方式。l例如,一項對家庭年收入的調(diào)查項目,把不同年收入的家庭劃分為以下五個檔次。l20000元及以下 (1)l2000040000元 (2)l4000060000元 (3)l6000080000元 (4)l8

11、0000元及以上 (5)5.1.6調(diào)查數(shù)據(jù)的編碼、錄入調(diào)查數(shù)據(jù)的編碼、錄入l2)分組編碼法l分組編碼法又稱區(qū)間編碼法,是根據(jù)調(diào)查事物的特性和信息資料分類及其處理的要求,將具有一定位數(shù)的代碼單元分成若干個組,每一個組的數(shù)字均代表一定的意義。l分組編碼法編碼簡單,便于計算機處理,但位數(shù)過多,容易造成系統(tǒng)維護上的困難。5.1.6調(diào)查數(shù)據(jù)的編碼、錄入調(diào)查數(shù)據(jù)的編碼、錄入個人基本情況的調(diào)查個人基本情況的調(diào)查若某被調(diào)查者的信息是:女性,居住地某大城市,單身,月收入30006000元,信息碼是2112。5.1.6調(diào)查數(shù)據(jù)的編碼、錄入調(diào)查數(shù)據(jù)的編碼、錄入l3)信息組碼編碼法l信息組碼編碼法,是指把調(diào)查信息資料

12、區(qū)分成一定的組,每個組給予一定的組碼進行編碼的方法。l 某地市場商品價格變動情況的調(diào)查,調(diào)查組碼分類如下:l級別名稱碼l百貨組0125l食品組2650l服裝組5170l家電組7180l其他組811005.1.6調(diào)查數(shù)據(jù)的編碼、錄入調(diào)查數(shù)據(jù)的編碼、錄入l4)表意式文字編碼法l表意式文字編碼法,又稱助記編碼法,是用數(shù)字、文字、符號等表明編碼對象的屬性,并依此方式進行信息資料編碼的方法。l例如,用210BXJ表示容量為210升的進口電冰箱,其中210為暗箱容量,BX表示冰箱,J表示進口。l這種編碼方法表現(xiàn)直觀,易于理解,便于記憶。5.1.6調(diào)查數(shù)據(jù)的編碼、錄入調(diào)查數(shù)據(jù)的編碼、錄入l2.調(diào)查數(shù)據(jù)的錄入

13、調(diào)查數(shù)據(jù)的錄入l(1)數(shù)據(jù)錄入的含義l數(shù)據(jù)錄入,是將經(jīng)過編碼的數(shù)據(jù)資料輸入到計算機存儲設備中的過程。市場調(diào)查發(fā)達的國家在數(shù)據(jù)采集中常常采用計算機輔助電話調(diào)查(CATI)、計算機輔助面訪(CAPI)等調(diào)查方式,計算機錄入工作在調(diào)查訪問時就完成了。 5.1.6調(diào)查數(shù)據(jù)的編碼、錄入調(diào)查數(shù)據(jù)的編碼、錄入l(2)數(shù)據(jù)錄入質量的檢查l1)數(shù)據(jù)庫軟件自動檢查法l通過數(shù)據(jù)庫結構的編輯,可以對錄入的過程進行邏輯檢查,避免數(shù)據(jù)錄入過程中出現(xiàn)某種類型的邏輯錯誤。l2)重復輸入數(shù)據(jù)l重復輸入數(shù)據(jù)的核查方式主要有雙機錄入或三機錄入。雙機錄入,是指將同一份問卷,分別由兩個錄入人員在計算機上進行兩次錄入,將兩次錄入的結果逐

14、一進行比較,相同的部分被認定為沒有錯誤,不同部分立即檢查問卷進行核對,及時修正錯誤;5.1.6數(shù)據(jù)資料的顯示數(shù)據(jù)資料的顯示l1.統(tǒng)計表統(tǒng)計表l(1)統(tǒng)計表的結構l統(tǒng)計表從結構形式上看,一般由表號、總標題、橫行標題、縱欄標題和數(shù)字資料等幾個部分組成。l(2)統(tǒng)計表的種類l統(tǒng)計表根據(jù)制表的方式不同,可分為簡單表和交叉表。5.1.6數(shù)據(jù)資料的顯示數(shù)據(jù)資料的顯示l2.統(tǒng)計圖統(tǒng)計圖l(1)條形圖 5.1.6數(shù)據(jù)資料的顯示數(shù)據(jù)資料的顯示l(2)折線圖 5.1.6數(shù)據(jù)資料的顯示數(shù)據(jù)資料的顯示l(3)圓形圖 5.2調(diào)查數(shù)據(jù)的分析調(diào)查數(shù)據(jù)的分析 l 1.數(shù)據(jù)分析的的涵義l調(diào)查數(shù)據(jù)分析,是根據(jù)研究的目的和要求,運

15、用科學的方法和手段,對調(diào)查數(shù)據(jù)進行定性和定量分析,揭示現(xiàn)象的本質和規(guī)律,為決策和管理提供咨詢服務的過程。數(shù)據(jù)分析所采用的主要是一些統(tǒng)計分析技術。 5.2調(diào)查數(shù)據(jù)的分析調(diào)查數(shù)據(jù)的分析 l2.調(diào)查數(shù)據(jù)分析的特點l(1)數(shù)據(jù)分析過程要定性分析和定量分析相結合l(2)數(shù)據(jù)的定量分析以統(tǒng)計分析方法為主l(3)數(shù)據(jù)分析不能孤立于被調(diào)查研究的現(xiàn)象獨立地進行l(wèi)(4)數(shù)據(jù)分析過程是一次認識上的質的飛躍5.2調(diào)查數(shù)據(jù)的分析調(diào)查數(shù)據(jù)的分析l3. 調(diào)查數(shù)據(jù)分析的基本原則l(1)科學性原則是指在數(shù)據(jù)分析中,應該根據(jù)調(diào)查數(shù)據(jù)的屬性和特點、調(diào)查數(shù)據(jù)的來源渠道、調(diào)查研究的任務和目的,選擇科學合理的分析方法進行分析。l(2)客

16、觀性原則是指在數(shù)據(jù)分析中,必須遵守實事求是原則,充分了解研究對象的各種實際情況,尊重調(diào)查數(shù)據(jù)事實,保證分析結果的公正與客觀。l(3)目的性原則是指數(shù)據(jù)分析必須圍繞調(diào)查研究的任務和目的來進行,其分析的結果必須能夠滿足調(diào)查研究的需要。l(4)系統(tǒng)性原則是指數(shù)據(jù)分析要將所研究的現(xiàn)象進行分解,然后對各種復雜的聯(lián)系進行分析和綜合。5.2.2總量指標分析總量指標分析l總量指標的計算方法有直接計算法、推算與估算法。l(1)直接計量法是指對研究的現(xiàn)象進行直接讀數(shù)、點數(shù)或測量后,將總量數(shù)值計算出來的方法。l(2)推算與估算法l1)因素關系推算法。因素關系推算法是指利用社會經(jīng)濟現(xiàn)象的各個影響因素之間的關系,根據(jù)已

17、知因素來推算未知因素的方法。l2)比例關系推算法。比例關系推算法是指利用各種相關現(xiàn)象的比例關系進行推算的一種方法。l 3)平穩(wěn)關系推算法。平穩(wěn)關系推算法是指利用各種平穩(wěn)關系來推算未知指標的方法。5.2.3 相對指標分析相對指標分析l(1)結構相對指標 結構相對指標是在對總體進行分組的基礎上,各組數(shù)值與總體數(shù)值對比得到的相對數(shù)。用來反映社會經(jīng)濟現(xiàn)象總體內(nèi)部的構成情況,說明總體內(nèi)各部分在總體中的地位。結構相對指標通常用百分數(shù)表示,其計算公式為:總體的全部數(shù)值總體各部分(各組)數(shù)值結構相對指標= 100%5.2.3 相對指標分析相對指標分析l(2)比例相對指標l比例相對指標又稱比例相對數(shù),是在同一時

18、間內(nèi)同一經(jīng)濟現(xiàn)象的總體內(nèi)部不同部分指標數(shù)值之間的比例關系,用來表示總體內(nèi)部各組成部分的構成比例。比例相對指標可用百分數(shù)或系數(shù)來表示,也可用1:m:n的連比形式表示,其計算公式為:總體中另一部分(組)數(shù)值總體中某一部分(組)數(shù)值比例相對指標=5.2.3 相對指標分析相對指標分析l(3)比較相對指標l比較相對指標是把同一時間內(nèi)同類經(jīng)濟現(xiàn)象的指標在不同空間狀態(tài)下的數(shù)值對比構成的相對指標。它可以反映同類事物在不同國家、不同地區(qū)或不同單位之間的差異程度,一般用百分數(shù)、系數(shù)或倍數(shù)表示。計算公式為: 另一地區(qū)(單位)的同類指標數(shù)值某一地區(qū)(單位)的某類指標數(shù)值比較相對指標=5.2.3 相對指標分析相對指標分

19、析l(4)強度相對指標。強度相對指標是由兩個性質不同但又有聯(lián)系的總量指標進行對比的比值,用來反映社會現(xiàn)象之強度、密度、普及程度。其計算公式為:的總量指標數(shù)值另一有聯(lián)系而性質不同某一總量指標數(shù)值強度相對指標 5.2.4 動態(tài)指標分析動態(tài)指標分析 20042008 20042008年我國城鎮(zhèn)人均純收入年我國城鎮(zhèn)人均純收入5.2.5 數(shù)據(jù)的集中趨勢分析數(shù)據(jù)的集中趨勢分析l(1)眾數(shù)。l眾數(shù)是總體中各單位在某一標志上出現(xiàn)次數(shù)最多的變量值。大學生每周上網(wǎng)次數(shù)的調(diào)查表大學生每周上網(wǎng)次數(shù)的調(diào)查表5.2.5 數(shù)據(jù)的集中趨勢分析數(shù)據(jù)的集中趨勢分析l(2)中位數(shù)。l中位數(shù)是將總體各單位的變量值按大小順序排列,處于

20、中間位置的那個變量值。 21n中位數(shù)的位置5.2.5 數(shù)據(jù)的集中趨勢分析數(shù)據(jù)的集中趨勢分析l案例案例5-13 某項對消費者每月去大型超市購物次數(shù)的調(diào)查,20個被調(diào)查者每月去大型超市的次數(shù)按順序排列是:0,1,1,1,2,2,2,2,3,3,3,3,3,4,4,4,5,5,6,7,則中位數(shù)是多少? l 解:5 .102120中位數(shù)的位置這說明中位數(shù)的位置在第10位和第11位中間,因此,中位數(shù)應是第10個數(shù)與第11個數(shù)的算術平均數(shù)。即等于35.2.5 數(shù)據(jù)的集中趨勢分析數(shù)據(jù)的集中趨勢分析l(3)算術平均數(shù) l1)簡單算術平均數(shù),是在未分組的資料條件下計算簡單算術平均數(shù),其公式為:nxnxxxxxn

21、3215.2.5 數(shù)據(jù)的集中趨勢分析數(shù)據(jù)的集中趨勢分析l2)加權算術平均數(shù),在資料已分組并得出次數(shù)分布資料時,要計算加權算術平均數(shù),其公式為:fxfffffxfxfxxnnn.2122115.2.5 數(shù)據(jù)的集中趨勢分析數(shù)據(jù)的集中趨勢分析fxxf 2010 2010年某院校大學生生活費用支出情況年某院校大學生生活費用支出情況學生人數(shù)組中值).(700170119000元fxfx5.2.6 數(shù)據(jù)的離中趨勢分析數(shù)據(jù)的離中趨勢分析l(1)極差l極差是數(shù)據(jù)中最變量大值和最變量小值之差。其基本公式為:l 極差=最變量大值最變量小值l案例案例5-16 某高校有8位學生,他們每月的生活費支出分別是: 500、550、600、650、700、750、800、850元則他們生活費支出的極差:l極差=850500=350(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論