資料整理與分析_第1頁
資料整理與分析_第2頁
資料整理與分析_第3頁
資料整理與分析_第4頁
資料整理與分析_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第九章

資料的整理與分析

中國礦業(yè)大學(xué)管理學(xué)院學(xué)習(xí)目標(biāo)理解數(shù)據(jù)控制和檢測(cè)的重要性掌握數(shù)據(jù)錄入的過程及其方法學(xué)習(xí)將調(diào)查數(shù)據(jù)表格化的方法學(xué)會(huì)建立和解釋交叉列表(橫列表)掌握統(tǒng)計(jì)分析的基本技巧一、資料整理確認(rèn)和編輯編碼數(shù)據(jù)錄入數(shù)據(jù)清理1.確認(rèn)確認(rèn)的目的是盡可能確保每份問卷都是有效問卷。有效是指訪談是否按適當(dāng)?shù)姆绞竭M(jìn)行,訪問員有沒有作假。確認(rèn)被調(diào)查者是否真正接受了調(diào)查?被調(diào)查者是否符合抽樣條件?確認(rèn)調(diào)查是否按要求的方式進(jìn)行?確認(rèn)調(diào)查是完整?其他方面的問題。2、編輯:現(xiàn)場(chǎng)編輯現(xiàn)場(chǎng)編輯(fieldediting)就是初步編輯,其主要任務(wù)是發(fā)現(xiàn)資料出非常明顯的遺漏和錯(cuò)誤,幫助控制和管理實(shí)地調(diào)查隊(duì)伍,應(yīng)在問卷實(shí)施后盡快執(zhí)行,以便問卷能在調(diào)查員解散之前得到校正。1問卷填寫是否完整,有無漏答的問題2檢查每份問卷是否按規(guī)定填寫,字跡是否

清楚。3相關(guān)問題是否產(chǎn)生矛盾,不一致的現(xiàn)象,

“其他”選項(xiàng)說明是否填寫清楚4開放式問題是否都有詳細(xì)的文字記錄5若發(fā)現(xiàn)問卷漏答、矛盾、不合邏輯的問題

超過5題,該份問卷應(yīng)該作廢。2、編輯:辦公室編輯辦公室編輯(in-houseediting)現(xiàn)場(chǎng)編輯的工作最后歸結(jié)到復(fù)查和訪問上,辦公室的編輯工作最后歸結(jié)到對(duì)查出的問題如何處理上。主要問題:不完整答卷:①大面積無回答;②個(gè)別問題無回答;③相當(dāng)多的問卷對(duì)同一個(gè)問題無回答。明顯的錯(cuò)誤答案:指那些前后不一致的答案,或答非所問的答案。3.編碼編碼是對(duì)一個(gè)問題的不同回答進(jìn)行分組和確定數(shù)字代碼的過程。大多數(shù)問卷中的大多數(shù)問題是封閉式問題,并且已經(jīng)預(yù)先編碼。

開放式和半開放式問題的編碼列出答案合并答案設(shè)置編碼輸入如編碼

你為什么最喜歡喝彭城啤酒?

1口感好2比較清淡3我喜歡這種口味4大家都喝這種品牌5市場(chǎng)上這種啤酒最暢銷6不知道7朋友們都喝這種啤酒8價(jià)格便宜9因?yàn)樗切缕放?0它是徐州人自己的啤酒11它的口味不如別的啤酒重12平時(shí)在商店購買方便13沒什么特殊的理由14我無所謂15大多數(shù)人都喝它16說不出來17我喜歡彭城啤酒這個(gè)品牌答案歸類要點(diǎn)回答項(xiàng)分好的數(shù)字編碼喜歡這種口味1,2,3,11

1價(jià)格因素8

2從眾因素4,5,7,15

3購買方便12

4不知道6,13,14,16

5區(qū)域因素10

6品牌喜好9,17

74.數(shù)據(jù)錄入與清理數(shù)據(jù)錄入:p239對(duì)錄入數(shù)據(jù)的審核二、應(yīng)用于市場(chǎng)調(diào)研的統(tǒng)計(jì)分析類型描述分析Descriptiveanalysis推理分析Inferentialanalysis差別分析

Differencesanalysis聯(lián)合分析Associativeanalysis預(yù)測(cè)分析Predictiveanalysis描述分析DescriptiveanalysisCertainmeasuressuchasthemean,mode,standarddeviationorrangeareformofdescriptiveanalysis作用數(shù)據(jù)抽象與減縮方法次數(shù)分布,算術(shù)平均數(shù),中位數(shù),眾數(shù),標(biāo)準(zhǔn)差與全距(極差)推理分析Inferentialanalysis作用確定總體參數(shù),進(jìn)行假設(shè)檢驗(yàn)例估計(jì)總體數(shù)值方法參數(shù)估計(jì),假設(shè)檢驗(yàn),顯著差異檢驗(yàn)差別分析

Differencesanalysis作用確定兩組間所存在的差異是否顯著例一個(gè)樣本中的兩個(gè)均值之間的差異是否顯著方法差異檢驗(yàn),方差分析聯(lián)合分析Associativeanalysis作用確定現(xiàn)象間的關(guān)系例確定兩個(gè)變量間是否存在相互關(guān)系,如顧客滿意度與企業(yè)形象方法相關(guān)分析方法,交叉表

預(yù)測(cè)分析Predictiveanalysis作用基于統(tǒng)計(jì)模型的預(yù)測(cè)例根據(jù)一個(gè)變量的數(shù)值來預(yù)測(cè)另一個(gè)變量的數(shù)值方法時(shí)間數(shù)列分析,回歸分析1.頻數(shù)分布有時(shí)營銷調(diào)研人員需要了解有關(guān)單個(gè)變量的信息本品牌的使用者中有多少稱得上是品牌忠誠者?有多少個(gè)顧客對(duì)新產(chǎn)品很熟悉?多少比較熟悉?有多少顧客對(duì)飯菜的口味滿意?多少不滿意?頻數(shù)分布:了解對(duì)一個(gè)變量選擇不同取值的調(diào)查對(duì)象數(shù)量。對(duì)一個(gè)變量的頻數(shù)分布會(huì)產(chǎn)生頻數(shù)、百分比、累積百分比幾個(gè)數(shù)據(jù)。頻數(shù)分布作用:有助于明確未回答者的多少,同時(shí)也能顯示不合格答案的多少;可以檢驗(yàn)奇異值和極端值;根據(jù)頻數(shù)分布可以劃出各種統(tǒng)計(jì)圖形。頻數(shù)分布頻數(shù)分布所想購買的戶型頻數(shù)百分比有效百分比累積百分比一室一廳一衛(wèi)32.132.192.19兩室一廳一衛(wèi)3927.6628.4730.66兩室兩廳一衛(wèi)128.518.7639.42兩室兩廳兩衛(wèi)96.386.5745.99三室一廳一衛(wèi)3222.7023.3669.34三室一廳兩衛(wèi)1510.6410.9580.29三室兩廳一衛(wèi)42.842.9283.21三室兩廳兩衛(wèi)107.097.3090.51四室兩廳兩衛(wèi)10.710.7391.24措層21.421.4692.70越層21.421.4694.16其他85.675.84100.00Total13797.16100.00Missing42.84Total141100.00

頻數(shù)分布2.描述性統(tǒng)計(jì)分析

集中趨勢(shì)統(tǒng)計(jì)指標(biāo)均值/平均數(shù)(mean)眾數(shù)(mode)中位數(shù)(median)離散程度指標(biāo)全距/極差(range)方差(variance)和標(biāo)準(zhǔn)差(standarddeviation)平均數(shù)反映總體分布的集中趨勢(shì);反映總體現(xiàn)象的共性特征;是總體分布的重要數(shù)量特征值;平均數(shù)的局限性一個(gè)身高180的不會(huì)游泳的人想涉水過河,已知河的平均深度為1米,此人是否過河?為什么?某人想購買一臺(tái)冰箱,現(xiàn)有如下信息:

冰箱品牌AB平均使用年限1010最多使用年限2012最少使用年限28陳述總平均平均值差別有無錄象機(jī)是必需品4.65.64.11.6目前錄象機(jī)價(jià)格太貴5.34.16.1-1.9國產(chǎn)錄象機(jī)質(zhì)量尚可3.94.23.70.5樣本大小500185315例:人們對(duì)與錄象機(jī)有關(guān)的問題的看法眾數(shù)M眾數(shù)是出現(xiàn)最頻繁的數(shù)值,是分布中的高峰。無眾數(shù)

數(shù)據(jù): 10.3 4.9 8.9 11.7 6.3 7.7一個(gè)眾數(shù)

數(shù)據(jù): 6.3 4.9 8.9 6.3 4.9

4.9一個(gè)以上的眾數(shù)

數(shù)據(jù): 21 28

28 41 43

43中位數(shù)中位數(shù)是指把所有數(shù)據(jù)按照升序或降序排列后居中的數(shù)值。如果數(shù)據(jù)為奇數(shù)項(xiàng),中位數(shù)是中間位置的數(shù)值如果數(shù)據(jù)為偶數(shù)項(xiàng),中位數(shù)是中間位置兩個(gè)數(shù)值的平均數(shù)中位數(shù)數(shù)據(jù):10.3 4.9 8.9 11.7 6.3 7.7順序:4.9 6.3 7.7

8.9 10.3 11.7位置:1 2 3

4 5 6當(dāng)總體單位數(shù)n為奇數(shù)時(shí)當(dāng)總體單位數(shù)n為偶數(shù)時(shí)小故事:騙人的“平均數(shù)”M:吉斯莫先生有一個(gè)小工廠,生產(chǎn)超級(jí)小玩意兒。M:管理人員由吉斯莫先生、他的弟弟、六個(gè)親戚組成。工作人員由5個(gè)領(lǐng)工和10個(gè)工人組成。工廠經(jīng)營得很順利,現(xiàn)在需要一個(gè)新工人。M:現(xiàn)在吉斯莫先生正在接見薩姆,談工作問題。吉斯莫:我們這里報(bào)酬不錯(cuò)。平均薪金是每周300元。你在學(xué)徒期間每周得75元,不過很快就可以加工資。騙人的“平均數(shù)”M:薩姆工作了幾天之后,要求見廠長(zhǎng)。薩姆;你欺騙我!我已經(jīng)找其他工人核對(duì)過了,沒有一個(gè)人的工資超過每周100元。平均工資怎么可能是一周300元呢?吉斯莫:啊,薩姆,不要激動(dòng)。平均工資是300元。我要向你證明這一點(diǎn)。吉斯莫:這是我每周付出的酬金。我得2400元,我弟弟得1000元,我的六個(gè)親戚每人得250元,五個(gè)領(lǐng)工每人得200元,10個(gè)工人每人100元。總共是每周6900元,付給23個(gè)人,對(duì)吧?騙人的“平均數(shù)”薩姆:對(duì),對(duì),對(duì)!你是對(duì)的,平均工資是每周300元??赡氵€是蒙騙了我。吉斯莫;我不同意!你實(shí)在是不明白。我已經(jīng)把工資列了個(gè)表,并告訴了你,工資的中位數(shù)是200元,可這不是平均工資,而是中等工資。薩姆:每周100元又是怎么回事呢?吉斯莫:那稱為眾數(shù),是大多數(shù)人掙的工資。吉斯莫:老弟,你的問題是出在你不懂平均數(shù)、中位數(shù)和眾數(shù)之間的區(qū)別。薩姆:好,現(xiàn)在我可懂了。我……我辭職!離散程度指標(biāo):①全距測(cè)量的是數(shù)據(jù)的分散程度,就是樣本中最大值與最小值之差。全距直接到奇異值的影響反映標(biāo)志值的變動(dòng)范圍全距計(jì)算簡(jiǎn)便,易于理解,應(yīng)用普遍。全距的計(jì)算:全距=最大標(biāo)志值-最小標(biāo)志值離散程度指標(biāo):②標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差是各單位標(biāo)志值與其平均數(shù)的離差平方的算術(shù)平均數(shù)的平方根,它表示每個(gè)標(biāo)志值與平均數(shù)的平均距離。例子教育程度均值中位數(shù)眾數(shù)方差全距初中1.151.001.000.492.00高中/技校1.231.001.000.582.00中專1.481.001.001.044.00大專1.791.001.001.525.00大學(xué)本科或以上2.051.001.001.905.00Total1.471.001.001.165.00各種統(tǒng)計(jì)數(shù)量適用的情況尺度類別尺度順序尺度等距尺度與比率尺度集中趨勢(shì)眾數(shù)中位數(shù)均值離散趨勢(shì)頻率或百分比分布累計(jì)百分率分布標(biāo)準(zhǔn)差,全距3.橫列表(交叉列表)分析需要研究的問題:品牌忠誠者中有多少是男性?對(duì)新產(chǎn)品的熟悉程度與年齡和教育水平有關(guān)嗎?產(chǎn)品的擁有狀況與收入的高低有關(guān)嗎?產(chǎn)品的使用量與對(duì)戶外活動(dòng)的興趣有關(guān)嗎?3.橫列表(交叉列表)分析1)橫列表分析的意義:

橫列表分析就是同時(shí)將兩個(gè)或兩個(gè)以上的變量,按照一定的順序排列在一張表中,從中分析變量間的關(guān)系,得出科學(xué)的結(jié)論橫列表分析及其結(jié)果很容易接受和理解;許多市場(chǎng)研究項(xiàng)目的數(shù)據(jù)處理分析可以依賴其得到解決;通過一系列的橫列表分析,可以深入分析和認(rèn)識(shí)復(fù)雜的事物或現(xiàn)象;清楚明確的解釋能使調(diào)研結(jié)果很快成為經(jīng)營管理措施的有力依據(jù);橫列表中變量(因素)的選擇例:某保險(xiǎn)公司對(duì)影響保險(xiǎn)戶開車事故率的因素進(jìn)行調(diào)查,并對(duì)各種因素進(jìn)行橫列表分析。有無事故百分比%有39無61樣本量(人)17800有無事故男女有4434無5666樣本量(人)9320848039%的保險(xiǎn)戶在開車時(shí)出現(xiàn)過事故。男性在開車時(shí)出現(xiàn)事故的百分比高于女性。距離事故男(%)女(%)>1萬KM≤1萬KM>1萬KM≤1萬KM有49275027無51735073樣本量(人)7170215024306050事故率與駕駛距離成正比而與性別無關(guān)。選擇和確定橫列表分析中的變量,包括其內(nèi)容和數(shù)量,應(yīng)根據(jù)調(diào)研項(xiàng)目的特征而異。

橫列表使用成功取決于研究者選擇關(guān)鍵變量以及根據(jù)這些因素組成橫列表的能力。在簡(jiǎn)單的事實(shí)收集研究中,要考慮的因素已在調(diào)研要求中明確列出,只不過把資料按需要的形式組合。例:家庭收入水平與攝像機(jī)的擁有率。在描述性研究中,研究者有較大的自由度來選擇因素,表中所需因素取決于委托人的要求和研究者直觀的探索。在探索性研究中,可憑直覺選擇所有的用于橫列表的因素。例:影

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論