版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
市場調(diào)查與分析職業(yè)教育市場營銷專業(yè)教學(xué)資源庫建設(shè)項目模塊六:整理、分析調(diào)查數(shù)據(jù)6.1整理調(diào)查數(shù)據(jù)
目錄頁CONTENTSPAGE6.1.1
調(diào)查數(shù)據(jù)的審核6.1.1
調(diào)查數(shù)據(jù)的審核學(xué)習(xí)目標(biāo)掌握調(diào)理數(shù)據(jù)整理的概念、流程、原則;能對收集調(diào)查數(shù)據(jù)進行合理審核;能對問題數(shù)據(jù)進行科學(xué)處理。學(xué)習(xí)重點調(diào)查數(shù)據(jù)的審核。引言調(diào)查數(shù)據(jù)整理是調(diào)查數(shù)據(jù)回收后的第一步工作,首先是要確保調(diào)查數(shù)據(jù)準(zhǔn)確、真實、完整和一致,提高調(diào)查數(shù)據(jù)的可信度,就必須對數(shù)據(jù)進行審查核實,避免調(diào)查數(shù)據(jù)的遺漏、錯誤或重復(fù)。引導(dǎo)案例:某大學(xué)針對本校大學(xué)生月消費情況調(diào)查對本次回收的問卷進行資料登記與整理對本次回收的問卷進行審核對有問題的問卷進行合理處置對本次回收的問卷進行分組和編碼采用Excel軟件建立數(shù)據(jù)庫用圖表方式列示市場調(diào)查數(shù)據(jù)導(dǎo)入數(shù)據(jù)整理,就是根據(jù)調(diào)查研究的目的與任務(wù),對搜集到的各種數(shù)據(jù),采用科學(xué)的方法,進行審核匯總與初步加工,使之條理化、系統(tǒng)化,并以圖表的方式顯示數(shù)據(jù)特征,以符合數(shù)據(jù)分析需要的工作過程。認(rèn)識數(shù)據(jù)整理1.數(shù)據(jù)整理的人概念
2.調(diào)查數(shù)據(jù)整理的流程認(rèn)識數(shù)據(jù)整理完整性準(zhǔn)確性邏輯性及時性真實性調(diào)查資料錄入調(diào)查資料統(tǒng)計質(zhì)量標(biāo)志分組數(shù)量標(biāo)志分組空間標(biāo)志分組時間標(biāo)志分組數(shù)據(jù)的審核數(shù)據(jù)的編碼數(shù)據(jù)的分組數(shù)據(jù)的匯總數(shù)據(jù)列示計算機匯總手工匯總表格列示圖形列示3.調(diào)查數(shù)據(jù)整理的原則(1)真實性原則(2)準(zhǔn)確性原則(3)科學(xué)性原則(4)目的性原則認(rèn)識數(shù)據(jù)整理調(diào)查數(shù)據(jù)的回收與登記1、歸類存放2、填寫登記表格3、做好標(biāo)記
調(diào)查數(shù)據(jù)的審核【例6-1】您對當(dāng)前大學(xué)生中出現(xiàn)的崇洋消費、炫富消費、攀比消費等不理性的消費方式有什么看法?
開放題
答:無1.完整性審核【例6-2】調(diào)查問題:您家里現(xiàn)在使用的空調(diào)品牌有哪些?(可多選)
答:格力(√)美的(√)海爾(√)科龍(√)
奧克斯(√)海信(√)志高(√)LG(√)該問題上被調(diào)查者答案全選,不符合常情,可視為不準(zhǔn)確數(shù)據(jù)。2.準(zhǔn)確性審核
調(diào)查數(shù)據(jù)的審核3.邏輯性審核【例6-3】某調(diào)查問題一:您目前使用的手機品牌是什么?
答:蘋果。問題二:您目前使用的手機操作系統(tǒng)是什么?
答:安卓android。
調(diào)查數(shù)據(jù)的審核4.及時性審核
審查各被調(diào)查單位是否都按規(guī)定日期填寫和送出,填寫的資料是否是最新資料?,F(xiàn)代市場活動節(jié)奏越來越快,只有代表市場活動最新狀態(tài)的市場信息才是使用價值最高的信息,切勿將失效、過時的信息引入決策中,此外,要剔除不必要的資料,把重要的資料篩選出來。
調(diào)查數(shù)據(jù)的審核5.真實性審核
對問卷真實性審核要看調(diào)查員有沒有不實或做假行為,目前調(diào)查員偷工減料、弄虛作假情況時有發(fā)生,例如有些電話訪問、入戶調(diào)查等,不可能在訪談實際發(fā)生現(xiàn)場觀察和監(jiān)督,就容易出現(xiàn)調(diào)查不實行為,因此在審核調(diào)查問卷還可以采取抽查、一定比例復(fù)查等方式對問卷的真實性進行審查。
調(diào)查數(shù)據(jù)的審核1.重新調(diào)查
問題數(shù)據(jù)的處置
如果有問題的問卷數(shù)量較多,把不滿意的問卷退回實施現(xiàn)場,要求調(diào)查員再次去接觸訪問者重新調(diào)查。
這種方法適用于調(diào)查規(guī)模小,且調(diào)查對象容易找到的情況。2.缺失處理(1)問卷數(shù)量較少(2)問卷中令人不滿意的答案的(3)涉及的變量不是關(guān)鍵變量按缺失處理需滿足以下條件
問題數(shù)據(jù)的處置3.作廢處理存在以下這些情況下,可以將問卷作廢處理:
(1)不合格問卷比例很??;
(2)樣本量很大;(3)單份問卷中不合格答案的比例比較大;
(3)關(guān)鍵變量的回答缺失。
問題數(shù)據(jù)的處置小結(jié)本節(jié)內(nèi)容主要講述數(shù)據(jù)整理的含義、流程、原則,調(diào)查數(shù)據(jù)回收后的審核,對問題數(shù)據(jù)進行科學(xué)處理等內(nèi)容。重點是做好審核,難點是對問題數(shù)據(jù)的處理。/snsj/
目錄頁CONTENTSPAGE6.1.2
調(diào)查數(shù)據(jù)的編碼模塊六:整理、分析調(diào)查數(shù)據(jù)6.1整理調(diào)查數(shù)據(jù)6.1.2
調(diào)查數(shù)據(jù)的編碼學(xué)習(xí)目標(biāo)能對調(diào)查資料進行編碼。學(xué)習(xí)重點調(diào)查數(shù)據(jù)的審核。引言數(shù)據(jù)編碼是調(diào)查數(shù)據(jù)審查核實后,為了對數(shù)據(jù)進行科學(xué)的整理而進行編號,便于分析。編碼的類型事前編碼事后編碼編碼的方法(1)順序編碼法可用①-④分別代表從低到高的四個檔次。①5000元以下
②5000-10000元③10001-15000元
④15000元及以上這種編碼方式簡單易于管理,但不適于進行分組處理。
分組編碼法又稱區(qū)間編碼法,是根據(jù)調(diào)查對象的特性和信息資料分類及其處理的要求,把具有一定位數(shù)的代碼單元分成若干個小組(或區(qū)間),每一小組的數(shù)字均代表一定的意義。例如:(2)分組編碼法編碼的方法戶口類型性別家庭月收入生活費來源1=城鎮(zhèn)2=農(nóng)村1=男2=女01=5000元以下02=5001-10000元03=100001-15000元04=15000元及以上01=獎學(xué)金02=做家教03=家中補給04=校內(nèi)勤工儉學(xué)05=校外課余打工06=自己開店07=網(wǎng)上兼職08=其他表5-7某大學(xué)生月消費情況調(diào)查的分組編碼(2)分組編碼法根據(jù)此表,編碼210104表示該消費的大學(xué)生為來自農(nóng)村的男生,家庭月收入低于5000元,其本人生活費主要來源于校內(nèi)勤工儉學(xué)。這種方法使用比較廣泛,容易理解,但位數(shù)過多會造成系統(tǒng)維護困難。編碼的方法
該方法是用數(shù)字、文字、符號等表明編碼對象的屬性,并按此進行信息資料編碼的方法。例如:42TVC表示42英寸彩色電視機,其中TV是電視機的縮寫,C是color首字母。這種方法比較直觀,易于理解,便于記憶。(3)表達式文字編碼法編碼的方法
該方法是把慣用的編寫字直接用作代碼進行編碼,如FT-英尺,KG-千克,YD-碼。(4)編寫編碼法編碼的方法在編碼過程中,應(yīng)遵循以下原則:(1)準(zhǔn)確性原則。設(shè)計的編碼要能準(zhǔn)確、有效地替代原信息。(2)完整性原則。在轉(zhuǎn)換信息形式的同時盡量不丟失信息,減少信息的損失和浪費。編碼時一般需預(yù)留足夠的位置,以適應(yīng)調(diào)整代碼或插入新號碼的需要。編碼的原則(3)效率性原則。編碼要易于操作,節(jié)省人力物力。(4)兼容性原則。即通用性原則,以便與其他系統(tǒng)接軌,增加調(diào)查資料的使用范圍。(5)標(biāo)準(zhǔn)化原則。一般每一個代碼只代表一個數(shù)據(jù),代碼的設(shè)計要避免混淆和誤解。編碼的原則(1)掌握分組的尺度。對資料中的某個研究問題分組過細(xì),會增加分析的復(fù)雜程度;分組過粗,會造成資料信息的流失以及信息分析的深入程度,所以根據(jù)實際分析的需要,設(shè)置合理的分組尺度是資料編碼的首要問題。一般對于較細(xì)分組的資料可進一步轉(zhuǎn)化為分組較粗的資料,而對分組較粗的資料,除非保留了原始資料,否則不能轉(zhuǎn)化為分組較細(xì)的資料。
編碼的注意事項(2)如果分組種類過多,可設(shè)置一個“其他”的分類來彌補分類的不足。(3)分組與編碼應(yīng)遵從含義明確且獨立這一原則。編碼的注意事項(4)對錯誤或疏漏的回答可作為特殊的分組,并指定一個特殊的數(shù)字或字符代表,如用“!”或“*”等,而不應(yīng)將其歸入類別中。(5)在資料編碼的過程中,應(yīng)盡量避免將無意義的資料進行隨意錄入。在資料搜集過程中,應(yīng)該與相關(guān)工作人員展開交流合作,保證資料的豐富度。編碼的注意事項小結(jié)主節(jié)主要講述數(shù)據(jù)編碼的原則及如何編碼。
目錄頁CONTENTSPAGE6.1.3
調(diào)查數(shù)據(jù)的分組模塊六:整理、分析調(diào)查數(shù)據(jù)6.1整理調(diào)查數(shù)據(jù)6.1.3
調(diào)查數(shù)據(jù)的分組學(xué)習(xí)目標(biāo)掌握數(shù)據(jù)分組的含義;了解數(shù)據(jù)分組的原則;能對不同的調(diào)查數(shù)據(jù)選擇合適的標(biāo)志進行科學(xué)分組。學(xué)習(xí)重點調(diào)查數(shù)據(jù)的分組。引言調(diào)查數(shù)據(jù)分組是調(diào)查數(shù)據(jù)整理的第三步工作,是進一步對數(shù)據(jù)進行科學(xué)分類的基礎(chǔ)工作。
數(shù)據(jù)分組及原則
數(shù)據(jù)分組是根據(jù)統(tǒng)計研究任務(wù)的要求和研究現(xiàn)象總體的內(nèi)在特點,按照一定的標(biāo)志將總體劃分成性質(zhì)不同的若干部分或組別的一種統(tǒng)計方法。數(shù)據(jù)分組通常又稱為統(tǒng)計分組,總體的變異性是分組的客觀依據(jù)。數(shù)據(jù)分組是總體內(nèi)進行的一種定性分類,它把總體劃分為一個個性質(zhì)不同的范圍更小的總體。1.數(shù)據(jù)分組的概念
(1)必須符合“窮盡原則”,就是使總體中的每一個單位都應(yīng)有組可歸,或者說各分組的空間足以容納總體的所有單位。(2)必須遵守“互斥原則”,即總體任一單位都只能歸屬于一組,而不能同時或可能歸屬于幾個組。2.數(shù)據(jù)分組的原則
數(shù)據(jù)分組及原則
數(shù)據(jù)分組標(biāo)志(1)品質(zhì)標(biāo)志分組
品質(zhì)標(biāo)志分組是說明事物的性質(zhì)或?qū)傩蕴卣鞯姆纸M方法,它反映的是總體單位在性質(zhì)上的差異,它不能用數(shù)值來表現(xiàn)。
按品質(zhì)標(biāo)志分組,標(biāo)志一經(jīng)確定,組數(shù)和組限都非常明顯,不存在組與組之間界限難以劃分的問題。1.常用的分組標(biāo)志有四種:
數(shù)量標(biāo)志分組又稱變量分組,能夠直接反映所研究的市場現(xiàn)象的數(shù)量特征。按數(shù)量標(biāo)志分組,能直接反映總體單位之間的數(shù)量差異,有利于從數(shù)量上準(zhǔn)確認(rèn)識客觀事物,研究和分析不同數(shù)量特征事物之間的關(guān)系。(2)數(shù)量標(biāo)志分組
數(shù)據(jù)分組標(biāo)志
按研究對象的地理位置、區(qū)域范圍等空間特性分組,如行政區(qū)劃、經(jīng)濟區(qū)劃等分組。按空間標(biāo)志分組,可以把不同地域的事物區(qū)別開來,有利于了解事物的空間分布狀況,便于對不同地理位置、區(qū)域范圍內(nèi)的環(huán)境現(xiàn)象進行比較研究。(3)空間標(biāo)志分組
數(shù)據(jù)分組標(biāo)志
時間標(biāo)志分組是以調(diào)查問卷中的一些時間屬性的調(diào)查項目(如購買時間、需求時間)作為分組標(biāo)志,對被調(diào)查者的時間選項進行分組而形成的時間數(shù)列。按時間標(biāo)志分組,有利于認(rèn)識事物在不同時點或時期的變化,揭示事物運動、變化、發(fā)展的趨勢。(4)時間標(biāo)志分組
數(shù)據(jù)分組標(biāo)志
(1)集中所有同一個開放式問題的全部文字性答案,通過閱讀、思考和分析,把握被調(diào)查者的思想認(rèn)識。(2)將被調(diào)查者的全部文字性答案,按照其思想認(rèn)識不同歸納為若干類型,并計算各種類型出現(xiàn)的頻數(shù)后,制成全部答案分布表。(3)對全部答案分布表中的答案進行挑選歸并,確定可以接受的分組數(shù)。一般來說,應(yīng)在符合調(diào)研項目的前提下,保留頻數(shù)多的答案,然后把頻數(shù)很少的答案盡可能歸并成含義相近的幾組,應(yīng)根據(jù)調(diào)研的目的和答案類型的多少而確定,一般來說應(yīng)控制在10組之內(nèi)。(4)為確定的分組選擇正式的描述詞匯或短語。不同組別的描述詞匯或短語應(yīng)體現(xiàn)質(zhì)的差別,力求中肯、精煉、概括。(5)根據(jù)分類歸納的結(jié)果,制成正式的答案分布表。2.開放性問題的分組
數(shù)據(jù)分組標(biāo)志對開放式問題答案的分組整理可遵循如下思路和程序:同步訓(xùn)練請對本班全體同學(xué)身高、年齡、愛好分別進行分組。小結(jié)本節(jié)主要講述數(shù)據(jù)分組的標(biāo)志與方法,要求學(xué)生對數(shù)據(jù)選擇不同的標(biāo)志進行分組。
目錄頁CONTENTSPAGE6.1.4
調(diào)查數(shù)據(jù)的列示模塊六:整理、分析調(diào)查數(shù)據(jù)6.1整理調(diào)查數(shù)據(jù)6.1.4
調(diào)查數(shù)據(jù)的列示學(xué)習(xí)目標(biāo)掌握表格、圖形列示數(shù)據(jù)方法;能對不同的調(diào)查數(shù)據(jù)選擇合適的列示方法。學(xué)習(xí)重點調(diào)查數(shù)據(jù)的列示。引言調(diào)查數(shù)據(jù)列示是調(diào)查數(shù)據(jù)整理的最后一步,是使調(diào)查數(shù)據(jù)列直觀的方法。
數(shù)據(jù)統(tǒng)計完成后,還需要用一定的表格或圖形將數(shù)據(jù)列示出來。統(tǒng)計表是以縱橫交叉的線條所繪制表格來列示數(shù)據(jù)的一種形式。在資料整理過程中,把經(jīng)過大量調(diào)查得來的統(tǒng)計資料繪制成表格進行列示。以表格方式列示1.單變量頻數(shù)表的制作與列示例如:引導(dǎo)案例中對XX學(xué)校大學(xué)生月消費水平調(diào)查,如果想了解該校大學(xué)生戶籍情況,根據(jù)戶籍情況來分析大學(xué)生的月消費水平。
頻數(shù)頻率(100%)城鎮(zhèn)12462%農(nóng)村7638%合計200100%表6-8XX學(xué)校大學(xué)生戶籍情況表以表格方式列示(1)雙變量交叉列表
交叉列表是用于提供基本調(diào)查結(jié)果的最常用形式。交叉列表可以清楚表示兩個分組變量之間的相互關(guān)系,也可以看成是分組的頻數(shù)表,即一個變量的頻數(shù)分布是根據(jù)另一個變量的取值來進一步細(xì)分的。2.交叉列表的制作與列示以表格方式列示2.交叉列表的制作與列示
月消費情況性別1000元以下1001—1500元1501—2000元2001-2500元2500元及以上總計女生
3
14男生2211
6總計2511110
該表當(dāng)初為了錄入和統(tǒng)計的方便,將問題和答案進行了數(shù)字化編碼,現(xiàn)在我們將數(shù)字編碼置換成文字后,表格為:表6-9男女生月消費情況表2以表格方式列示(1)雙變量交叉列表2.交叉列表的制作與列示(2)三變量交叉列表第一:更精確反映原有二變量之間的關(guān)系第二:揭示原有相關(guān)關(guān)系為虛假相關(guān)第三:顯示原先被隱含的聯(lián)系三變量交叉列表的優(yōu)點第四:不改變原有的相關(guān)關(guān)系以表格方式列示2.交叉列表的制作與列示(2)三變量交叉列表實踐真知6-5:小轎車購買意向的市場調(diào)查
假設(shè)某項小轎車購買意向的市場調(diào)查,最初以被調(diào)查者受教育程度和小轎車購買意向兩個變量進行分析,用雙變量交叉列表分析得到的結(jié)果如表6-10所示。以表格方式列示2.交叉列表的制作與列示(2)三變量交叉列表小轎車購買意向低于大學(xué)程度低于大學(xué)是32%21%否68%79%列總計100%100%被調(diào)查者數(shù)(人)250750表6-11小轎車購買意向表1以表格方式列示分析:上表顯示,大學(xué)程度的被調(diào)查者中32%有購買小轎車的意向,而低于大學(xué)程度的被調(diào)查者中只有21%有購買小轎車的意向。這一分析結(jié)果似乎說明受教育程度的高低是影響小轎車購買意向的一個重要因素。如果我們將被調(diào)查者的收入考慮進去,將上表的雙變量改為三變量列表,如表。小轎車購買意向低收入高收入大學(xué)程度低于大學(xué)大學(xué)程度低于大學(xué)是20%20%40%40%否80%80%60%60%列總計100%100%100%100%被調(diào)查者數(shù)(人)10070015050以表格方式列示
三變量交叉列表的方法類似于雙變量交叉列表,我們同樣可以通過“數(shù)據(jù)透視表”的方法,將問題1,2,4設(shè)定為三個變量,將統(tǒng)計數(shù)據(jù)進行分組匯總?!咀鲆蛔觥?/p>
就XX學(xué)校大學(xué)生月消費調(diào)查數(shù)據(jù)中“月生活費”情況為例演示餅形圖的繪制方法。假設(shè)對回收的200份問卷,通過數(shù)據(jù)錄入與整理,數(shù)據(jù)如下:
月生活費頻數(shù)頻率(100%)
1000元以下2110.5%
1001—1500元7738.5%
1501—2000元5427%
2001-2500元3618%
2500元及以上126%
總計200100%XX學(xué)校學(xué)生月消費情況表作業(yè):用柱形圖進行數(shù)據(jù)的整理用折線圖進行數(shù)據(jù)的整理制作成果演示PPT小結(jié)本節(jié)主要講述數(shù)據(jù)列示的方法,要求學(xué)生對不同的數(shù)據(jù)選擇不同的列示方法,使數(shù)據(jù)更直觀。THANKYOU職業(yè)教育市場營銷專業(yè)教學(xué)資源庫建設(shè)項目市場調(diào)查與分析職業(yè)教育市場營銷專業(yè)教學(xué)資源庫建設(shè)項目模塊六:整理、分析調(diào)查數(shù)據(jù)6.2分析調(diào)查數(shù)據(jù)
目錄頁CONTENTSPAGE6.2.1認(rèn)識調(diào)查數(shù)據(jù)分析學(xué)習(xí)目標(biāo)掌握數(shù)據(jù)分析含義;了解數(shù)據(jù)分析的原則、特點;掌握數(shù)據(jù)分析的流程。學(xué)習(xí)重點數(shù)據(jù)分析的含義引言市場調(diào)查的數(shù)據(jù)整理后,要正確使用這些數(shù)據(jù),就必須進行分析,如何進行分析的呢?
調(diào)查數(shù)據(jù)分析,是根據(jù)研究的目的和要求,運用科學(xué)的方法和手段,對調(diào)查數(shù)據(jù)進行定性和定量分析,揭示現(xiàn)象的本質(zhì)和規(guī)律,為決策和管理提供咨詢服務(wù)的過程。調(diào)查數(shù)據(jù)分析的含義調(diào)查數(shù)據(jù)分析的作用1.數(shù)據(jù)分析是調(diào)查研究不可缺少的重要環(huán)節(jié)。2.數(shù)據(jù)分析是充分發(fā)揮調(diào)查研究作用的重要保證。4.通過數(shù)據(jù)分析還可以促進調(diào)查數(shù)據(jù)分析方法的研究。
3.數(shù)據(jù)分析在檢驗調(diào)查研究其他環(huán)節(jié)的工作質(zhì)量中有著特殊的作用。調(diào)查數(shù)據(jù)分析的原則1.科學(xué)性原則2.客觀性原則3.目的性原則4.系統(tǒng)性原則調(diào)查數(shù)據(jù)分析的特點1.數(shù)據(jù)分析過程要定性分析和定量分析相結(jié)合2.數(shù)據(jù)的定量分析以統(tǒng)計分析方法為主3.數(shù)據(jù)分析不能孤立于被調(diào)查研究的現(xiàn)象獨立地進行4.數(shù)據(jù)分析過程是一次認(rèn)識上的質(zhì)的飛躍想想將一張紙對折50次,看看有多厚?調(diào)查數(shù)據(jù)分析的流程小結(jié)本節(jié)主要是讓同學(xué)們認(rèn)識什么是數(shù)據(jù)分析,原則有哪些,分析的流程有哪些。/snsj/
目錄頁CONTENTSPAGE6.2.2學(xué)會定性分析方法模塊六:整理、分析調(diào)查數(shù)據(jù)6.2分析調(diào)查數(shù)據(jù)學(xué)習(xí)目標(biāo)掌握定性分析方法的種類;能正確運用不同定性分析方法。學(xué)習(xí)重點不同定性分析方法的運用。引言定性分析方法,是人們根據(jù)事實,運用經(jīng)驗和判斷能力、邏輯思維方法、哲學(xué)方法和相關(guān)專業(yè)理論,對現(xiàn)象進行判斷、歸納、推理和概括,得出對事物的本質(zhì)和規(guī)律性的認(rèn)識的方法體系。歸納分析法1.完全歸納法是根據(jù)某類事物中每一個對象都具有或不具有某種屬性,從而歸納出該類事物的全部對象都具有或不具有這種屬性的歸納方法。(1)簡單枚舉法是根據(jù)某類事物中部分對象具有或不具有某種屬性,且又沒有發(fā)現(xiàn)反例,從而推論出該類事物都具有或不具有某種屬性的歸納法。(2)科學(xué)歸納法是根據(jù)某類事物中的部分對象與某種屬性之間的必然聯(lián)系,推論出該類事物的所有對象都具有某種屬性的歸納方法。2.不完全歸納法歸納分析法演繹分析法調(diào)查研究中的演繹分析,就是把調(diào)查數(shù)據(jù)的整體分解為不同部分、方面、因素,形成分類數(shù)據(jù),并通過對這些數(shù)據(jù)的研究,分別把握其特征和本質(zhì),然后將這些分類研究得到的認(rèn)識聯(lián)結(jié)起來,形成對調(diào)查數(shù)據(jù)整體認(rèn)識的邏輯方法。比較分析法比較分析法也稱為比較法,是通過對各種現(xiàn)象或事物的比較,來確定它們的共同點和相異點,并揭示它們相互區(qū)別的本質(zhì)特征的方法。常見的比較分析法有類型比較法和歷史比較法。1.類型比較法是對各種類型進行比較的方法。這種方法有兩個作用,一是由點到面,由個別到一般,逐步地建立類型,由此上升到對整體的一般性認(rèn)識;二是抽象出事物的本質(zhì)特征,以便比較和認(rèn)識表面上差異極大或表面上很相似的現(xiàn)象。2.歷史比較法是對不同時期現(xiàn)象的異同點進行比較和分析,由此揭示現(xiàn)象的發(fā)展趨勢和發(fā)展規(guī)律的方法。
因果分析法
因果分析法是一種探尋現(xiàn)象之間因果關(guān)系的方法。因果分析法有許多種,屬于定性分析的方法,如求同法、求異法、求同求異法、共變法和剩余法另一些屬于定量分析的方法,如相關(guān)分析、回歸分析、因素分析等統(tǒng)計方法,另一些則是。結(jié)構(gòu)分析法
主要分析各部分之間的比例以及所起的作用大小,分析哪些作用是主要的,哪些作用是次要的。通過分析加深對這一事物的認(rèn)識并確定對其施加影響的切入點。例如,根據(jù)對1000名被調(diào)查者的調(diào)查,受過大學(xué)教育程度的250人中32%擁有小汽車;低于大學(xué)教育程度的750人中,15%的擁有小汽車。因此,可得出結(jié)論:受過大學(xué)教育程度的人群中擁有小汽車的比率比低于大學(xué)教育程度人群中擁有小汽車的比率要高一倍多。由此可見,結(jié)構(gòu)分析法是從結(jié)構(gòu)分析導(dǎo)出定性結(jié)論。1.分析現(xiàn)象的內(nèi)部結(jié)構(gòu)。包括確定功能關(guān)系的性質(zhì),研究功能存在的必要條件,揭示滿足功能的機制,即促使各因素之間發(fā)生相互影響和作用的手段和方法。2.分析現(xiàn)象的內(nèi)部功能結(jié)構(gòu)分析法主要分析研究對象在整個特定系統(tǒng)或宏觀環(huán)境中的地位和作用,分析其與其他現(xiàn)象的相互關(guān)系和相互作用,它與外部環(huán)境(如制度、政策、市場、社會風(fēng)氣等方面)之間的相互影響。3.分析現(xiàn)象的外部結(jié)構(gòu)和外部功能結(jié)構(gòu)分析法本章小節(jié)本節(jié)內(nèi)容主要講述各種定性分析的含義,要求學(xué)生通過理解不同定性分析方法,能在不同情況下正確運用。/snsj//snsj/如果某專業(yè)2014年招生367人,則肯定有2名同學(xué)是同一天生日,為什么?再想想為什么我們班大部分同學(xué)是同一年出生的?想一想
目錄頁CONTENTSPAGE6.2.3掌握定量分析方法模塊六:整理、分析調(diào)查數(shù)據(jù)6.2分析調(diào)查數(shù)據(jù)學(xué)習(xí)目標(biāo)掌握數(shù)據(jù)分析的含義;能正確運用定性分析方法對不同數(shù)據(jù)進行分析;能正確運用不同的定量分析方法對不同數(shù)據(jù)進行分析。學(xué)習(xí)重點定性分析、定量分析引言定量分析方法分類:根據(jù)研究的目的不同,可分為描述性分析和解析性分析。根據(jù)涉及的變量多少不同,可分為單變量統(tǒng)計分析、雙變量統(tǒng)計分析和多變量統(tǒng)計分析。根據(jù)涉及的數(shù)列性質(zhì)不同,可分為品質(zhì)數(shù)列分析、變量數(shù)列分析、時間數(shù)列分析、空間數(shù)列分析、相關(guān)數(shù)列分析、平衡數(shù)列分析。本教材主要講述以下常用的定量分析方法。
對調(diào)查數(shù)據(jù)的集中趨勢分析是對被調(diào)查總體的特征進行準(zhǔn)確描述的重要前提。集中趨勢分析主要用平均指標(biāo)進行描述。眾數(shù)中位數(shù)算術(shù)平均數(shù)幾何平均數(shù)調(diào)和平均數(shù)數(shù)據(jù)集中趨勢分析(1)簡單算術(shù)平均數(shù)
依據(jù)未分組的原始數(shù)據(jù),將總體單位的標(biāo)志值簡單加總求和,除以總體單位數(shù)所得的結(jié)果為簡單算術(shù)平均數(shù)。其計算公式為:式中,為算術(shù)平均數(shù);
為各單位的標(biāo)志值;為總體單位數(shù)。數(shù)據(jù)集中趨勢分析1.算術(shù)平均數(shù)【即學(xué)即練】5名工人日產(chǎn)零件數(shù)為12、13、14、14、15,則平均每人日產(chǎn)量為:數(shù)據(jù)集中趨勢分析(2)加權(quán)算術(shù)平均數(shù)
原始資料按照數(shù)量標(biāo)志分組,編成變量數(shù)列,將各組的標(biāo)志值乘以相應(yīng)的次數(shù)(權(quán)數(shù)),然后再加總求和,再除以總次數(shù)(總體單位數(shù))所得到的結(jié)果為加權(quán)算術(shù)平均數(shù)。其計算公式為:數(shù)據(jù)集中趨勢分析例如:某企業(yè)工人的生產(chǎn)情況如下表所示:日產(chǎn)量/件人數(shù)20121422623824122510267272合計50
某企業(yè)工人日產(chǎn)量分布表數(shù)據(jù)集中趨勢分析則其平均日產(chǎn)量為:上例是根據(jù)單項式數(shù)列計算加權(quán)算術(shù)平均數(shù),如果已知資料為組距數(shù)列,可用組中值代表各組標(biāo)志值計算平均數(shù)。數(shù)據(jù)集中趨勢分析例如:某企業(yè)員工的月工資資料如下表所示:月工資/元人數(shù)X
組中值fxf2500以下402250900002500~30008027502200003000~350012032503900003500~400015037505625004000~45007042502975004500以上404750190000合計500—1750000某企業(yè)員工的月工資數(shù)據(jù)資料表則該企業(yè)員工的月平均工資為:數(shù)據(jù)集中趨勢分析
調(diào)和平均數(shù)是對變量值的倒數(shù)求得的平均數(shù),又稱倒數(shù)平均數(shù),其又可以分為簡單調(diào)和平均數(shù)和加權(quán)調(diào)和平均數(shù)兩種。式中,為算術(shù)平均數(shù);
為變量值的個數(shù)。【例6-8】某種蔬菜價格早晨為1元/千克,中午為0.8元/千克,晚上為0.5元/千克。若某人早晨、中午、晚上各買1元錢的該種蔬菜,則某人一天中買菜的平均價格為:(1)簡單調(diào)和平均數(shù)數(shù)據(jù)集中趨勢分析2.調(diào)和平均數(shù)(2)加權(quán)調(diào)和平均數(shù)加權(quán)調(diào)和平均數(shù)是各單位標(biāo)志值倒數(shù)的加權(quán)算術(shù)平均數(shù)的倒數(shù),以表示各項權(quán)數(shù),其計算公式為:
數(shù)據(jù)集中趨勢分析【即學(xué)即練】某種蔬菜價格早晨為1元/千克,中午為0.8元/千克,晚上為0.5元/千克。若某人早晨、中午、晚上分別買2元、3元、4元錢的該種蔬菜,則某人一天中買菜的平均價格為:數(shù)據(jù)集中趨勢分析
3.幾何平均數(shù)
幾何平均數(shù)是n個變量值連乘積的n次方根。因為幾何平均數(shù)的特征與社會經(jīng)濟現(xiàn)象發(fā)展的平均速度和平均比率的客觀過程相一致,因此,它適用于計算平均速度和平均比率。(1)簡單幾何平均數(shù)簡單幾何平均數(shù)是n個標(biāo)志值乘積的n次方根。其計算公式為:數(shù)據(jù)集中趨勢分析【例6-9】某流水線有前后銜接的五道工序。某日各道工序的合格率分別為95%、92%、90%、85%、80%,則整個流水線的平均合格率為:數(shù)據(jù)集中趨勢分析(2)加權(quán)幾何平均數(shù)
對于分組資料,且各組變量值出現(xiàn)的次數(shù)(權(quán)數(shù))不相等時應(yīng)采用加權(quán)幾何平均數(shù),其計算公式為:
數(shù)據(jù)集中趨勢分析【即學(xué)即練】某地區(qū)25年的年經(jīng)濟增長速度分別是;1年3%、4年5%、8年8%10年10%、2年15%,則該地區(qū)經(jīng)濟的平均年增長速度為:數(shù)據(jù)集中趨勢分析
中位數(shù)是指將總體各單位的標(biāo)志值由小到大排列,處在中間位置的那個標(biāo)志值,用Me表示。中位數(shù)把全部標(biāo)志值等分為兩個部分,一半標(biāo)志值比它小,一半標(biāo)志值比它大。當(dāng)平均值不易計算時,可用中位數(shù)代表總體的一般水平。數(shù)據(jù)集中趨勢分析
3.中位數(shù)數(shù)據(jù)集中趨勢分析中位數(shù):也就是選取中間的數(shù)。一種衡量集中趨勢的方法。要確定中位數(shù)第一步,首先需要從小到大排序。例如這組數(shù)據(jù):23、29、20、32、23、21、33、25;我們將數(shù)據(jù)排序20、21、23、23、25、29、32、33;第二步,計算位置。1.若有n個數(shù),n為奇數(shù),則選擇第(n+1)/2個為中位數(shù);2.若n為偶數(shù),則中位數(shù)是(n/2以及n/2+1)的平均數(shù)此例中選擇中位數(shù)為24,即(23+25)÷2=245.眾數(shù)
眾數(shù)是總體中各總體單位出現(xiàn)次數(shù)最多的那個標(biāo)志值,也就是各總體單位中最普通、最常出現(xiàn)的標(biāo)志值,用表示。眾數(shù)也可以表明社會經(jīng)濟現(xiàn)象的一般水平。數(shù)據(jù)集中趨勢分析
一般來說,一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)就叫這組數(shù)據(jù)的眾數(shù)。
例如:1,2,3,3,4的眾數(shù)是3。但是,如果有兩個或兩個以上個數(shù)出現(xiàn)次數(shù)都是最多的,那么這幾個數(shù)都是這組數(shù)據(jù)的眾數(shù)。例如:1,2,2,3,3,4的眾數(shù)是2和3。還有,如果所有數(shù)據(jù)出現(xiàn)的次數(shù)都一樣,那么這組數(shù)據(jù)沒有眾數(shù)。例如:1,2,3,4,5沒有眾數(shù)。數(shù)據(jù)集中趨勢分析上面所提到的五種平均數(shù)——算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)、中位數(shù)和眾數(shù),都是用來反映客觀現(xiàn)象在某個數(shù)量上所達到的一般水平,它們的含義和作用基本相同,但有各自的特點,所以在實際應(yīng)用中應(yīng)根據(jù)具體情況進行合理的選擇。數(shù)據(jù)集中趨勢分析數(shù)據(jù)的離散程度分析
數(shù)據(jù)的離散程度是用來測度各變量值遠(yuǎn)離其中心值的程度。極差平均差標(biāo)準(zhǔn)差離散系數(shù)極差又稱全距,是總體各單位標(biāo)志的最大值和最小值之差,用R表示:1.極差數(shù)據(jù)的離散程度分析平均差是總體中各單位標(biāo)志值與其算術(shù)平均數(shù)的離差絕對值的算術(shù)平均數(shù)。由于各標(biāo)志值與其算術(shù)平均數(shù)離差總和等于零,為防止正負(fù)離差相互抵消,要取其絕對值計算。平均差與極差的區(qū)別在于平均差涉及總體的全部數(shù)據(jù),更能綜合反映總體數(shù)據(jù)的離散程度。根據(jù)資料的不同,平均差可分為簡單平均差和加權(quán)平均差。簡單平均差是在資料未分組的情況下使用的,用表示,其計算公式為:
式中,AD為平均差;
為標(biāo)志值;為平均值;
為總體單位數(shù)。2.平均差數(shù)據(jù)的離散程度分析工人項目甲班組乙班組日產(chǎn)量/件離差絕對離差日產(chǎn)量/件離差絕對離差第一人35-7728-1414第二人38-4434-88第三人40-224200第四人45334866第五人521010581616合計210026210044平均4205.24208.8
由計算可知,乙班組平均差大,說明乙班組平均日產(chǎn)量的代表性小,乙班組日產(chǎn)零件水平的差異大于甲班組日產(chǎn)零件水平的差異。數(shù)據(jù)的離散程度分析【實踐真知6-7】某車間甲、乙兩班組5名工人日產(chǎn)零件如下(單位:件):
甲班:35,38,40,45,52;乙班:28,34,42,48,58。試計算甲、乙兩班組工人日產(chǎn)零件的平均差。3.標(biāo)準(zhǔn)差
標(biāo)準(zhǔn)差又稱均方差,是各單位標(biāo)志值與其算術(shù)平均數(shù)離差平方的算術(shù)平均數(shù)的平方根。標(biāo)準(zhǔn)差是進行離散程度測度時用得最多、最重要的指標(biāo),它對現(xiàn)象的穩(wěn)定程度的反應(yīng)非常敏感。根據(jù)資料的不同,標(biāo)準(zhǔn)差可分為簡單標(biāo)準(zhǔn)差和加權(quán)標(biāo)準(zhǔn)差。簡單標(biāo)準(zhǔn)差加權(quán)標(biāo)準(zhǔn)差
標(biāo)準(zhǔn)差彌補了平均差和全距的不足,但是利用標(biāo)準(zhǔn)差不能比較性質(zhì)不同的數(shù)列(水平高低不等,計量單位不同)離散程度。數(shù)據(jù)的離散程度分析3.標(biāo)準(zhǔn)差
一組學(xué)生的年齡分別是18,19,20,21,22歲,試求所有學(xué)生年齡的標(biāo)準(zhǔn)差。簡單標(biāo)準(zhǔn)差加權(quán)標(biāo)準(zhǔn)差數(shù)據(jù)的離散程度分析4.離散系數(shù)
離散系數(shù)又稱變異系數(shù),是一類相對數(shù)形式的變異指標(biāo)。它將各種變異指標(biāo)(全距、平均差、標(biāo)準(zhǔn)差)與其平均指標(biāo)對比,以反映總體單位標(biāo)志值的離散程度。離散系數(shù)主要用于比較性質(zhì)不同的總體數(shù)據(jù)的離散程度。離散系數(shù)有全距系數(shù)、平均差系數(shù)、標(biāo)準(zhǔn)差系數(shù)等。其中最常用的是標(biāo)準(zhǔn)差與算術(shù)平均數(shù)對比的離散系數(shù),即標(biāo)準(zhǔn)差系數(shù),通常用
表示。其計算公式為:
標(biāo)準(zhǔn)差系數(shù)愈大,標(biāo)志變異程度愈大,平均數(shù)的代表性愈低;標(biāo)準(zhǔn)差系數(shù)愈小,標(biāo)志變異程度愈小,平均數(shù)的代表性愈高。數(shù)據(jù)的離散程度分析
資料的相對程度分析是從兩個有聯(lián)系的統(tǒng)計指標(biāo)對比計算的相對數(shù)出發(fā),對其反映的事物間的關(guān)系進行的研究分析。相對程度分析使那些利用總量指標(biāo)不能直接對比的現(xiàn)象找到了可比的基礎(chǔ)。市場調(diào)查分析中常用的相對指標(biāo)有計劃完成程度相對指標(biāo)、結(jié)構(gòu)相對指標(biāo)、比較相對指標(biāo)、比例相對指標(biāo)、強度相對指標(biāo)和動態(tài)相對指標(biāo)等。
數(shù)據(jù)相對程度分析1.總量指標(biāo)
總量指標(biāo)是說明總體在一定時間、地點和條件下的總規(guī)?;蚩偹降慕y(tǒng)計指標(biāo)??偭恐笜?biāo)用絕對數(shù)形式表示,因此也稱為絕對指標(biāo)。直接計量法推算估算法總量指標(biāo)的計算方法
數(shù)據(jù)相對程度分析2.相對指標(biāo)
相對指標(biāo)也稱相對數(shù),是兩個有聯(lián)系的總量指標(biāo)對比得到的一種抽象的比值,用以反映總體的發(fā)展程度、結(jié)構(gòu)、強度、普遍程度或比例關(guān)系。一般用系數(shù)、倍數(shù)、成數(shù)、百分?jǐn)?shù)或千分?jǐn)?shù)表示。市場調(diào)查分析中常用的相對指標(biāo)有:計劃完成程度相對指標(biāo)比例相對指標(biāo)結(jié)構(gòu)相對指標(biāo)
數(shù)據(jù)相對程度分析計劃完成程度相對指標(biāo)是某一時期實際完成的指標(biāo)數(shù)值與計劃指標(biāo)數(shù)值對比的結(jié)果。其計算公式為:(1)計劃完成程度相對指標(biāo)
數(shù)據(jù)相對程度分析【例6-10】
某商業(yè)企業(yè)某年商品銷售額計劃為2000萬元,實際完成2200萬元,則;計算表明,該企業(yè)超額10%完成了商品銷售額計劃。
數(shù)據(jù)相對程度分析某公司勞動生產(chǎn)率計劃規(guī)定2013年比2012年提高8%,但實際提高了10%,則該公司的計劃完成程度為:
數(shù)據(jù)相對程度分析(2)結(jié)構(gòu)相對指標(biāo)2024/12/7
結(jié)構(gòu)相對指標(biāo)是總體各組成部分與總體數(shù)值對比得出的比重或比率,用來表明總體的構(gòu)成情況,一般用百分?jǐn)?shù)表示。它從靜態(tài)上反映總體的內(nèi)部構(gòu)成,揭示事物的本質(zhì)特征,其動態(tài)變化可以反映事物的結(jié)構(gòu)發(fā)展變化趨勢和規(guī)律性,總體各組的結(jié)構(gòu)相對指標(biāo)可以說明該組在總體中的地位和作用,對于計算平均指標(biāo)有特殊意義。其計算公式為:
數(shù)據(jù)相對程度分析2019年我國GDP總值為636463億元:其中第一產(chǎn)業(yè)58332億元,第二產(chǎn)業(yè)271392億元,第三產(chǎn)業(yè)306739億元,則有:
數(shù)據(jù)相對程度分析
由于總體內(nèi)部各組成部分之間存在一定的聯(lián)系,并在客觀上保持一定的比例,為了反映這種比例關(guān)系,需要計算比例相對指標(biāo)比例相對指標(biāo)是指同一總體內(nèi)不同部分的指標(biāo)數(shù)值對比得到的相對數(shù),它表明總體中各部分的比例關(guān)系,通常用倍數(shù)或百分?jǐn)?shù)表示,也可以用一比幾或幾比幾的形式來表示。其計算公式為:(3)比例相對指標(biāo)
數(shù)據(jù)相對程度分析
某市有人口202萬人,其中男性102萬人,女性100萬人,那么該市的性別比例指標(biāo)為102%(以女性為100),或男性人口數(shù)與女性人口數(shù)之比為1.02:1(102:100)
數(shù)據(jù)相對程度分析2024/12/7客觀事物的發(fā)展是不平衡的,對事物在不同地區(qū)、不同單位之間即不同空間發(fā)展的差異程度進行研究,需要運用比較相對指標(biāo)。比較相對指標(biāo)即反映在同一時間不同空間上同類現(xiàn)象數(shù)量對比關(guān)系的指標(biāo),一般用百分?jǐn)?shù)或倍數(shù)表示,其計算公式為:(4)比較相對指標(biāo)
數(shù)據(jù)相對程度分析2019年A市城鎮(zhèn)居民人均可支配收入為47710元,B市城鎮(zhèn)居民人均可支配收入為43910元,則2019年A市城鎮(zhèn)居民人均可支配收入和B市相比:
數(shù)據(jù)相對程度分析
強度相對指標(biāo)又稱強度相對數(shù),是指兩個性質(zhì)不同但有聯(lián)系的總量指標(biāo)對比得出的相對數(shù),是用來表示現(xiàn)象的強度、密度和普遍程度的指標(biāo)。例如,以人口數(shù)與土地面積對比得到的人口密度,以主要產(chǎn)品產(chǎn)量與人口數(shù)對比得到的每人平均產(chǎn)品產(chǎn)量,以醫(yī)院病床數(shù)與人口數(shù)對比得到的每一萬人平均分?jǐn)偟尼t(yī)院病床數(shù),均稱為強度相對指標(biāo)。其計算公式為:(5)強度相對指標(biāo)
數(shù)據(jù)相對程度分析某城市人口1000000人,零售商店3000個。則:計算結(jié)果表明,該城市每千人擁有3個商業(yè)網(wǎng)點。指標(biāo)數(shù)值越大,商業(yè)越發(fā)達,人民生活越方便,表示強度越高,這是正指標(biāo)。如果把分子和分母對換,則:計算結(jié)果表明,該城市每個商業(yè)網(wǎng)點為333人服務(wù)。指標(biāo)數(shù)值越大,需要服務(wù)的人數(shù)越多,商業(yè)欠發(fā)達,即表示強度越低,這是逆指標(biāo)。
數(shù)據(jù)相對程度分析動態(tài)相對指標(biāo)即兩個時期間同一指標(biāo)數(shù)值的對比,是反映現(xiàn)象發(fā)展變化程度的指標(biāo),把作為比較的時期稱為基期,把同基期對比的時期稱為報告期。動態(tài)相對指標(biāo)對于分析研究社會經(jīng)濟現(xiàn)象的發(fā)展變化過程具有重要意義。動態(tài)相對指標(biāo)通常用百分?jǐn)?shù)表示。其計算公式為:(6)動態(tài)相對指標(biāo)
數(shù)據(jù)相對程度分析某地2019年社會消費品零售總額為34153億元,2018年社會消費品零售總額為31135億元,則該地2019年社會消費品零售總額和2011年相比:計算結(jié)果表明,該地2019年社會消費品零售總額和2018年相比,增長了9.7%。
數(shù)據(jù)相對程度分析
相關(guān)分析相關(guān)關(guān)系是指現(xiàn)象之間確實存在著的,但其數(shù)量表現(xiàn)又是不確定、不規(guī)則的一種相互依存關(guān)系,在這種關(guān)系中,當(dāng)一個或一組變量取一定數(shù)值時,與之相對應(yīng)的另一個變量的數(shù)值是不能確定的,只是按照某種規(guī)律在一定范圍內(nèi)變化。這種關(guān)系不能用嚴(yán)格的函數(shù)式來表示。1.相關(guān)關(guān)系的概念(1)按相關(guān)關(guān)系涉及變量(或因素)多少的不同,可將其劃分為單相關(guān)和復(fù)相關(guān)。(2)按相關(guān)關(guān)系表現(xiàn)形式的不同,可將其分為線性相關(guān)和非線性相關(guān)。(3)按照相關(guān)現(xiàn)象變化方向的不同,可將相關(guān)關(guān)系劃分為正相關(guān)和負(fù)相關(guān)。(4)按照相關(guān)程度的不同,可將相關(guān)關(guān)系劃分為完全相關(guān)、完全不相關(guān)和不完全相關(guān)。2.相關(guān)關(guān)系的種類
相關(guān)分析相關(guān)分析的主要內(nèi)容有以下兩點:(1)判斷現(xiàn)象之間的相關(guān)狀態(tài)(2)判斷相關(guān)關(guān)系的密切程度
3.相關(guān)分析的主要內(nèi)容
相關(guān)分析回歸分析就是對具有相關(guān)關(guān)系的兩個或兩個以上變量之間數(shù)量變化的一般關(guān)系進行測定,確定一個相應(yīng)的數(shù)學(xué)表達式,來近似地表達變量間的平均變化關(guān)系。
回歸分析1.回歸分析的概念根據(jù)自變量x和因變量y的相關(guān)關(guān)系,建立x與y的線性關(guān)系式,用統(tǒng)計回歸分析法求解關(guān)系式中的參數(shù),故x與y的關(guān)系式就稱回歸方程回歸方程的一般形式為:第t期因變量值回歸參數(shù),回歸直線的斜率回歸參數(shù),y軸上的截距第t期自變量值
回歸分析2.一元線性回歸根據(jù)某地區(qū)10年農(nóng)民“人均年純收入”資料,和該地區(qū)相應(yīng)年份的“銷售額”資料,分析該地區(qū)市場銷售額。觀察期資料見下表:
回歸分析根據(jù)表中x與y觀察期10年資料繪制散點圖散點圖表明,x與y存在相關(guān)關(guān)系散點基本集中在一條直線上,說明相關(guān)程度較高,農(nóng)民人均年純收入(x)與銷售額(y)表現(xiàn)較高程度的直線正相關(guān)可采用一元線性相關(guān)回歸分析模型
回歸分析應(yīng)用最小平方法求回歸方程參數(shù),建立分析模型example求參數(shù)a、b解得方程:標(biāo)準(zhǔn)方程:
回歸分析一元線性相關(guān)回歸市場分析計算表
回歸分析應(yīng)用最小平方法求回歸方程參數(shù),建立分析模型求解a、b值:則回歸方程為:
回歸分析THANKYOU職業(yè)教育市場營銷專業(yè)教學(xué)資源庫建設(shè)項目市場調(diào)查與分析職業(yè)教育市場營銷專業(yè)教學(xué)資源庫建設(shè)項目
目錄頁CONTENTSPAGE6.3.1大數(shù)據(jù)認(rèn)知模塊六:整理、分析調(diào)查數(shù)據(jù)6.3大數(shù)據(jù)分析應(yīng)用學(xué)習(xí)目標(biāo)了解大數(shù)據(jù)的特點和商業(yè)應(yīng)用方向;掌握大數(shù)據(jù)分析流程;能根據(jù)業(yè)務(wù)問題,做出科學(xué)的大數(shù)據(jù)分析規(guī)劃,并利用可視化工具進行數(shù)據(jù)分析與展示。學(xué)習(xí)重點利用可視化工具進行數(shù)據(jù)分析與展示
大數(shù)據(jù)的定義大數(shù)據(jù)又稱巨量資料,是指無法通過人腦甚至主流軟件工具,在合理時間內(nèi)對其內(nèi)容進行擷取、管理、處理和整理的數(shù)據(jù)集合。狹義數(shù)據(jù)量龐大數(shù)據(jù)種類繁多無法用常規(guī)歸類方法應(yīng)用計算
大數(shù)據(jù)特點5VVolume(大量)Velocity(高速)Variety(多樣)Value(低價值密度)Veracity(真實性)
大數(shù)據(jù)特點數(shù)據(jù)量大(Volume)1大數(shù)據(jù)最基本的特點就是數(shù)據(jù)量龐大,它是獲取真實數(shù)據(jù)價值和有效潛在信息的前提。隨著云計算、物聯(lián)網(wǎng)等技術(shù)的發(fā)展,數(shù)據(jù)的采集、計算、存儲量也在飛速增長。近4億的會員每天產(chǎn)生的商品交易數(shù)據(jù)約20TB約10億的用戶每天產(chǎn)生的日志數(shù)據(jù)超過300TB
大數(shù)據(jù)特點數(shù)據(jù)流轉(zhuǎn)快速(Velocity)2大數(shù)據(jù)時代,數(shù)據(jù)增長速度快,其獲取和處理速度也快,數(shù)據(jù)的實時性要求越來越明確,這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)處理最顯著的特征。汽車無人駕駛需要快速獲取道路數(shù)據(jù),依據(jù)數(shù)據(jù)進行正確研判并做出及時反應(yīng),才能實現(xiàn)安全駕駛。
大數(shù)據(jù)特點數(shù)據(jù)類型多樣(Variety)3因為數(shù)據(jù)源不同,數(shù)據(jù)類型和形式也越來越豐富,已經(jīng)打破傳統(tǒng)的結(jié)構(gòu)性數(shù)據(jù)范疇,出現(xiàn)了半結(jié)構(gòu)與非結(jié)構(gòu)數(shù)據(jù)。地理信息圖片音頻視頻
大數(shù)據(jù)特點價值密度低(Value)4傳統(tǒng)數(shù)據(jù)基本都是結(jié)構(gòu)化數(shù)據(jù),每個字段都是有用的,價值密度非常高。大數(shù)據(jù)時代,越來越多數(shù)據(jù)都是半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),雖然數(shù)據(jù)量比以前大了很多倍,但價值密度確實低了很多。
大數(shù)據(jù)特點數(shù)據(jù)真實可靠(Veracity)5大數(shù)據(jù)中的內(nèi)容是與真實世界中所發(fā)生的活動息息相關(guān)。準(zhǔn)確性高可信賴度高大數(shù)據(jù)思維總體性思維數(shù)據(jù)獲取從抽樣變?yōu)槿媸占季S方式也應(yīng)該從樣本思維轉(zhuǎn)向總體思維容錯性思維擁有海量數(shù)據(jù)后,絕對精準(zhǔn)不再是追求的主要目標(biāo),適當(dāng)忽略微觀層面上的精確度,反而可以在宏觀層面擁有更好的洞察力關(guān)聯(lián)性思維大數(shù)據(jù)能分析出事物之間隱蔽的相關(guān)關(guān)系,獲得更多的認(rèn)知與見解思維方式已經(jīng)從因果思維,轉(zhuǎn)變?yōu)殛P(guān)聯(lián)性思維智能化思維大數(shù)據(jù)思維最關(guān)鍵的就是要從自然思維轉(zhuǎn)向智能化思維,使數(shù)據(jù)富有生命力“智能”和“智慧”已成為大數(shù)據(jù)時代的顯著特征
目錄頁CONTENTSPAGE6.3.2大數(shù)據(jù)分析的基本流程模塊六:整理、分析調(diào)查數(shù)據(jù)6.3大數(shù)據(jù)分析應(yīng)用學(xué)習(xí)目標(biāo)了解大數(shù)據(jù)的特點和商業(yè)應(yīng)用方向;掌握大數(shù)據(jù)分析流程;能根據(jù)業(yè)務(wù)問題,做出科學(xué)的大數(shù)據(jù)分析規(guī)劃,并利用可視化工具進行數(shù)據(jù)分析與展示。學(xué)習(xí)重點利用可視化工具進行數(shù)據(jù)分析與展示大數(shù)據(jù)分析流程確定目標(biāo)確定目標(biāo)是大數(shù)據(jù)分析的第一步是數(shù)據(jù)采集。明確分析定位確定分析思路確保數(shù)據(jù)分析過程有效進行確保分析框架的體系化,使分析更具有說服力確定目標(biāo)某電商企業(yè)要分析其線上交易用戶行為,以優(yōu)化運營方案。對于這一分析目標(biāo),我們需要進行框架式分解。用戶進入APP的主要目的就是消費,其行為可以分為逛和買。因此,可以從瀏覽和購買兩個行為進行分析,其中瀏覽行為主要關(guān)注訪問時間、訪問頻次、訪問深度、訪問入口、收藏/加購頻次、停留時長、品類偏好等;購買行為主要分析消費金額、消費頻次、消費偏好等。在此基礎(chǔ)上確定數(shù)據(jù)采集和分析方案。數(shù)據(jù)采集數(shù)據(jù)采集也即數(shù)據(jù)收集或數(shù)據(jù)獲取,是按照已經(jīng)確定的數(shù)據(jù)分析框架,收集相關(guān)數(shù)據(jù)的過程,它是大數(shù)據(jù)分析的前提,也是大數(shù)據(jù)價值挖掘的重要環(huán)節(jié)。第一手?jǐn)?shù)據(jù):可直接獲取的數(shù)據(jù)第二手?jǐn)?shù)據(jù):經(jīng)過加工整理后得到的數(shù)據(jù)數(shù)據(jù)采集數(shù)據(jù)采集途徑基于物聯(lián)網(wǎng)的數(shù)據(jù)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)庫互聯(lián)網(wǎng)數(shù)據(jù)采集基于物聯(lián)網(wǎng)的數(shù)據(jù)1指把所有物品通過信息傳感設(shè)備、射頻識別技術(shù)、全球定位系統(tǒng)等與互聯(lián)網(wǎng)連接起來,進行信息交換,實時采集各種需要的信息。在自動駕駛中,數(shù)據(jù)的采集主要包括基于GPS(全球定位系統(tǒng))的定位信息、車載視覺攝像頭數(shù)據(jù)、車載雷達數(shù)據(jù)等。例數(shù)據(jù)采集業(yè)務(wù)系統(tǒng)的數(shù)據(jù)庫2一些企業(yè)建設(shè)有自己的業(yè)務(wù)處理系統(tǒng),系統(tǒng)會用利用MySQL和Oracle等傳統(tǒng)數(shù)據(jù)庫來存儲相關(guān)業(yè)務(wù)數(shù)據(jù),企業(yè)所產(chǎn)生的業(yè)務(wù)數(shù)據(jù),都被實施地寫入數(shù)據(jù)庫。數(shù)據(jù)采集
互聯(lián)網(wǎng)3直接獲取結(jié)構(gòu)化數(shù)據(jù)利用數(shù)據(jù)爬取技術(shù)采集非結(jié)構(gòu)化數(shù)據(jù)要分析某地二手房銷售市場行情,就可以使用進入二手房交易平臺,利用數(shù)據(jù)采集工具對數(shù)據(jù)進行自動采集數(shù)據(jù)處理數(shù)據(jù)處理數(shù)據(jù)清洗數(shù)據(jù)集成數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)歸約對已采集到的數(shù)據(jù)進行加工整理,將原始數(shù)據(jù)轉(zhuǎn)化為可以進行數(shù)據(jù)分析的格式,是數(shù)據(jù)分析的基礎(chǔ)。基本目的:從大量、雜亂、難以理解的數(shù)據(jù)中,抽取并推導(dǎo)出對解決問題有價值、有意義的數(shù)據(jù),保證數(shù)據(jù)的一致性和有效性。數(shù)據(jù)處理
數(shù)據(jù)清洗1對缺失數(shù)據(jù)、重復(fù)信息、異常數(shù)據(jù)進行必要的處理,以保證數(shù)據(jù)的一致性(1)缺失值清洗
缺失值主要包含兩種:一是單元缺失,及觀測對象的全部信息均缺失;二是屬性缺失,即觀測對象的部分信息記錄不全。常見的處理方法有:①直接刪除②填充缺失值數(shù)據(jù)處理
數(shù)據(jù)清洗1(2)重復(fù)值清洗數(shù)據(jù)庫中屬性值相同的記錄被認(rèn)為是重復(fù)記錄,通過判斷記錄間的屬性值是否相等來檢測記錄是否相等,相等的記錄合并為一條記錄(即合并/清除)。
合并/清除是消重的基本方法。數(shù)據(jù)處理
數(shù)據(jù)清洗1(3)異常值清洗異常值是指那些在數(shù)據(jù)集中存在的不合理的值,可能是因為傳感器故障、人工錄入錯誤或異常事件導(dǎo)致看,如果忽視這些異常值,在某些建模場景下就會導(dǎo)致結(jié)論的錯誤。數(shù)據(jù)處理
數(shù)據(jù)清洗1(3)異常值清洗
①分箱:將需要處理的數(shù)據(jù)根據(jù)一定的規(guī)則放進箱子里,然后根據(jù)數(shù)據(jù)中各個箱子的實際情況對異常數(shù)據(jù)進行平滑處理。我們可以對原始數(shù)據(jù)先進行一個排序,然后分到3個不同的箱中,按照每個箱的平均值進行箱內(nèi)平滑。數(shù)據(jù)處理
數(shù)據(jù)清洗1(3)異常值清洗
②回歸:構(gòu)建回歸模型,使用回歸函數(shù)去擬合數(shù)據(jù)代替異常數(shù)據(jù)。對數(shù)據(jù)繪制散點圖后,右上角有一個數(shù)據(jù)明顯異常,此時,可以對正常數(shù)據(jù)繪制單線性趨勢,將異常數(shù)據(jù)平滑到線性趨勢線上即可。數(shù)據(jù)處理
數(shù)據(jù)清洗1(3)異常值清洗③聚類:就是把數(shù)據(jù)劃分為若干聚類,每個類內(nèi)的對象都是十分相似,而類與類之間存在明顯的差距。將某科目成績(百分制)按照規(guī)不合格、合格、優(yōu)秀三個等次聚類后,形成散點圖后,還有3個點是分散于類別外的,就是異常數(shù)據(jù),可以直接刪除。數(shù)據(jù)處理
數(shù)據(jù)清洗1(3)異常值清洗④其他:對于部分明顯的邏輯錯誤值,可以利用人工和計算機配合處理。年齡200歲,要么刪掉,要么就按缺失值處理;身份證號是1101031980XXXXXXXX,但是年齡卻是18歲,這明顯信息不對稱,需要調(diào)整統(tǒng)一。例數(shù)據(jù)處理
數(shù)據(jù)集成2將不同數(shù)據(jù)源的原始數(shù)據(jù)進行轉(zhuǎn)化、合并處理,從而形成集中、統(tǒng)一的數(shù)據(jù)庫、數(shù)據(jù)立方體等,有利于提高大數(shù)據(jù)的完整性、一致性、安全性和可用性等。京東關(guān)鍵詞數(shù)據(jù)淘寶關(guān)鍵詞數(shù)據(jù)某電商企業(yè)淘寶店和京東店某商品關(guān)鍵詞推廣效果數(shù)據(jù)處理
數(shù)據(jù)集成2
數(shù)據(jù)集成常用的方法:
(1)數(shù)據(jù)倉庫:又稱為ETL,由3個步驟構(gòu)成:提取、變換和裝載。提取就是連接源系統(tǒng)并選擇和收集必要的數(shù)據(jù)用于隨后的分析處理。變換就是通過一系列的規(guī)則將提取的數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)格式。裝載就是將提取并變換后的數(shù)據(jù)導(dǎo)入目標(biāo)存儲基礎(chǔ)設(shè)施。
(2)數(shù)據(jù)聯(lián)合:創(chuàng)建一個虛擬的數(shù)據(jù)庫,從分離的數(shù)據(jù)源查詢并合并數(shù)據(jù)。虛擬數(shù)據(jù)庫并不包含數(shù)據(jù)本身,而是存儲了真實數(shù)據(jù)及其存儲位置的信息或元數(shù)據(jù)。數(shù)據(jù)處理
數(shù)據(jù)轉(zhuǎn)換3數(shù)據(jù)轉(zhuǎn)換是將數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的、適用于數(shù)據(jù)分析的數(shù)據(jù)形式,消除它們在時間、空間、屬性及精度等特征表現(xiàn)方面的差異,便于分析比較。原始二手房出售信息轉(zhuǎn)換后的二手房出售信息利用采集工具采集到的二手房銷售平臺數(shù)據(jù)中,“房屋信息”這個屬性中包含有房型、面積、朝向等信息,不利于分析,就需要進行數(shù)據(jù)轉(zhuǎn)換,將其分割為多個屬性。數(shù)據(jù)處理
數(shù)據(jù)歸約4在盡量保持?jǐn)?shù)據(jù)原貌前提下,最大限度地精簡數(shù)據(jù)量,以降低無效、錯誤數(shù)據(jù)對數(shù)據(jù)建模的影響,提高建模準(zhǔn)確性,減少數(shù)據(jù)挖掘時間,減低存儲成本。(1)樣本規(guī)約:就是刪除行。(2)特征規(guī)約:就是刪除列。(3)特征值規(guī)約:減少列中值的數(shù)量。數(shù)據(jù)分析
數(shù)據(jù)分析是指使用適當(dāng)?shù)姆治龇椒肮ぞ撸瑢μ幚磉^的數(shù)據(jù)進行分析,提取有數(shù)據(jù)中隱含的價值信息,形成有效結(jié)論的過程,數(shù)據(jù)分析大多是通過軟件來完成。
數(shù)據(jù)挖掘是一種高級的數(shù)據(jù)分析方法,通過算法從大量的數(shù)據(jù)中搜索隱藏的有用信息。數(shù)據(jù)挖掘的算法有兩類:有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)數(shù)據(jù)分析1.有監(jiān)督學(xué)習(xí)有監(jiān)督學(xué)習(xí)是指存在目標(biāo)變量,探索特征變量和目標(biāo)變量之間的關(guān)系,在目標(biāo)變量的監(jiān)督下學(xué)習(xí)和優(yōu)化算法。分類構(gòu)造分類模型,然后使用該模型對未知樣本進行類別判定。分類算法常應(yīng)用于客戶分類、客戶屬性和特征分析、客戶滿意度分析。預(yù)測分析數(shù)據(jù)并建立變量之間的依賴關(guān)系,從而發(fā)現(xiàn)數(shù)據(jù)內(nèi)在規(guī)律,解決相關(guān)問題。主要研究數(shù)據(jù)序列的趨勢特征、數(shù)據(jù)變量間的相關(guān)性等,通常應(yīng)用于客戶關(guān)系維系、產(chǎn)品生命周期分析、銷售趨勢預(yù)測及有針對性的營銷活動等。數(shù)據(jù)分析2.無監(jiān)督學(xué)習(xí)無監(jiān)督學(xué)習(xí)是指不存在目標(biāo)變量,基于數(shù)據(jù)本身去識別變量內(nèi)在的模式和特征,是沒有目標(biāo)變量監(jiān)督下的模式識別和分析。聚類基于數(shù)據(jù)本身,根據(jù)數(shù)據(jù)的相似性和差異性,將一組數(shù)據(jù)分為幾個類別。經(jīng)過聚類后,屬于同一類別的數(shù)據(jù)間的相似性很大,但不同類別之間數(shù)據(jù)的相似性很小,跨類的數(shù)據(jù)關(guān)聯(lián)性很低。關(guān)聯(lián)是通過分析兩個或多個事物之間存在的關(guān)聯(lián),挖掘隱藏在數(shù)據(jù)間的相互關(guān)系,從而根據(jù)一個數(shù)據(jù)項的出現(xiàn)推導(dǎo)出其他數(shù)據(jù)項的出現(xiàn)。數(shù)據(jù)分析數(shù)據(jù)挖掘過程.數(shù)據(jù)呈現(xiàn)也即數(shù)據(jù)可視化,是將大型數(shù)據(jù)分析結(jié)果以圖形、圖表的形式呈現(xiàn),并利用數(shù)據(jù)分析和開發(fā)工具發(fā)現(xiàn)其中未知信息,對數(shù)據(jù)加以可視化解釋。.數(shù)據(jù)呈現(xiàn)數(shù)據(jù)可視化的探索過程.數(shù)據(jù)呈現(xiàn)圖表類型類別比較型圖表的數(shù)據(jù)一般包含數(shù)值型和類別型兩種數(shù)據(jù)類型,比如在柱形圖、條形圖、雷達圖、坡度圖、詞云圖等。類別比較.數(shù)據(jù)呈現(xiàn)圖表類型數(shù)據(jù)關(guān)系型圖表分為數(shù)值關(guān)系型、層次關(guān)系型和網(wǎng)絡(luò)關(guān)系型三種圖表類型。包括散點圖、氣泡圖、節(jié)點鏈接圖、樹狀圖、?;鶊D、和弦圖、蜂箱圖等。類別比較數(shù)據(jù)關(guān)系.數(shù)據(jù)呈現(xiàn)圖表類型數(shù)據(jù)分布型圖表主要顯示數(shù)據(jù)集中的數(shù)值及其出現(xiàn)的頻率或者分布規(guī)律,包括統(tǒng)計直方圖、核密度曲線圖、箱形圖等。類別比較數(shù)據(jù)關(guān)系數(shù)據(jù)分布.數(shù)據(jù)呈現(xiàn)圖表類型時間序列型圖
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 空地養(yǎng)殖合同范例
- 企業(yè)門衛(wèi)聘用合同范例
- 電梯售后合同范例
- 個體雇工合同范例
- 賣油漆合同范例
- 沒有房產(chǎn)證轉(zhuǎn)賣合同范例
- 汽車維修用工合同范例
- 書店店面轉(zhuǎn)租合同范例
- 律師擬定欠款合同范例
- 真石漆分別合同范例
- 2021離婚協(xié)議書電子版免費
- 《班主任工作常規(guī)》課件
- 初中英語期末考試方法與技巧課件
- 四年級上冊綜合實踐試題-第一學(xué)期實踐考查卷 粵教版 含答案
- 油煙管道清洗服務(wù)承諾書
- 卷積神經(jīng)網(wǎng)絡(luò)講義課件
- 山東師范大學(xué)《英語語言學(xué)》期末復(fù)習(xí)題
- 考研快題系列一(城市濱水廣場綠地設(shè)計)
- HTML5CSS3 教案及教學(xué)設(shè)計合并
- 青島版六三二年級上冊數(shù)學(xué)乘加乘減解決問題1課件
- 汽車機械基礎(chǔ)課件第五單元機械傳動任務(wù)二 鏈傳動
評論
0/150
提交評論