統(tǒng)計數(shù)據(jù)的收集整理_第1頁
統(tǒng)計數(shù)據(jù)的收集整理_第2頁
統(tǒng)計數(shù)據(jù)的收集整理_第3頁
統(tǒng)計數(shù)據(jù)的收集整理_第4頁
統(tǒng)計數(shù)據(jù)的收集整理_第5頁
已閱讀5頁,還剩141頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計數(shù)據(jù)的收集整理第1頁,課件共146頁,創(chuàng)作于2023年2月學(xué)習(xí)目標(biāo)數(shù)據(jù)的來源數(shù)據(jù)的調(diào)查方法調(diào)查方案的結(jié)構(gòu)和設(shè)計調(diào)查問卷設(shè)計數(shù)據(jù)的誤差數(shù)據(jù)的質(zhì)量要求了解數(shù)據(jù)預(yù)處理的內(nèi)容和目的掌握分類和順序數(shù)據(jù)的整理與顯示方法掌握數(shù)值型數(shù)據(jù)的整理與顯示方法用Excel作頻數(shù)分布表和形圖合理使用統(tǒng)計表第2頁,課件共146頁,創(chuàng)作于2023年2月主要內(nèi)容第一節(jié)統(tǒng)計數(shù)據(jù)的收集第二節(jié)統(tǒng)計數(shù)據(jù)的整理與顯示第三節(jié)Excel在統(tǒng)計整理與統(tǒng)計圖表中的應(yīng)用第3頁,課件共146頁,創(chuàng)作于2023年2月第一節(jié)數(shù)據(jù)收集1.1數(shù)據(jù)來源1.2調(diào)查設(shè)計1.3數(shù)據(jù)質(zhì)量第4頁,課件共146頁,創(chuàng)作于2023年2月1.1數(shù)據(jù)來源1.1.1數(shù)據(jù)的間接來源1.1.2數(shù)據(jù)的直接來源第5頁,課件共146頁,創(chuàng)作于2023年2月1.1.1數(shù)據(jù)的間接來源第6頁,課件共146頁,創(chuàng)作于2023年2月二手?jǐn)?shù)據(jù)的來源Internethttp//WWW.中國統(tǒng)計年鑒2001中國人口統(tǒng)計年鑒中國市場統(tǒng)計年鑒世界發(fā)展報告世界經(jīng)濟(jì)年檢工業(yè)普查數(shù)據(jù)中國統(tǒng)計出版社統(tǒng)計部門和政府部門公布的有關(guān)資料,如各類統(tǒng)計年鑒各類經(jīng)濟(jì)信息中心、信息咨詢機(jī)構(gòu)、專業(yè)調(diào)查機(jī)構(gòu)等提供的數(shù)據(jù)各類專業(yè)期刊、報紙、書籍所提供的資料各種會議,如博覽會、展銷會、交易會及專業(yè)性、學(xué)術(shù)性研討會上交流的有關(guān)資料從互聯(lián)網(wǎng)或圖書館查閱到的相關(guān)資料第7頁,課件共146頁,創(chuàng)作于2023年2月二手?jǐn)?shù)據(jù)的特點收集容易,采集成本低作用廣泛分析所要研究的問題提供研究問題的背景幫助研究者更好地定義問題檢驗和回答某些疑問和假設(shè)尋找研究問題的思路和途徑收集二手資料在研究中應(yīng)優(yōu)先考慮第8頁,課件共146頁,創(chuàng)作于2023年2月二手?jǐn)?shù)據(jù)的評估數(shù)據(jù)是誰收集的?可信度評估為什么目的而收集的?數(shù)據(jù)是怎樣收集的?什么時候收集的?第9頁,課件共146頁,創(chuàng)作于2023年2月1.1.2數(shù)據(jù)的直接來源第10頁,課件共146頁,創(chuàng)作于2023年2月數(shù)據(jù)的直接來源

(原始數(shù)據(jù))調(diào)查數(shù)據(jù)通過調(diào)查方法獲得的數(shù)據(jù)通常是對社會現(xiàn)象而言通常取自有限總體實驗數(shù)據(jù)通過實驗方法得到的數(shù)據(jù)通常是對自然現(xiàn)象而言

也被廣泛運(yùn)用到社會科學(xué)中如心理學(xué)、教育學(xué)、社會學(xué)、經(jīng)濟(jì)學(xué)、管理學(xué)等

第11頁,課件共146頁,創(chuàng)作于2023年2月統(tǒng)計調(diào)查方式第12頁,課件共146頁,創(chuàng)作于2023年2月統(tǒng)計調(diào)查方式統(tǒng)計調(diào)查方式普查抽樣調(diào)查統(tǒng)計報表第13頁,課件共146頁,創(chuàng)作于2023年2月抽樣調(diào)查

(samplingsurvey)

1. 從總體中隨機(jī)抽取一部分單位作為樣本進(jìn)行調(diào)查,并根據(jù)樣本調(diào)查結(jié)果來推斷總體特征的數(shù)據(jù)收集方法總體隨機(jī)樣本2.具有經(jīng)濟(jì)性、時效性強(qiáng)、適應(yīng)面廣、準(zhǔn)確性高等特點第14頁,課件共146頁,創(chuàng)作于2023年2月普查

(census)

為特定目的專門組織的非經(jīng)常性全面調(diào)查2. 通常是一次性或周期性的3. 一般需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)調(diào)查時間4. 數(shù)據(jù)的規(guī)范化程度較高5. 應(yīng)用范圍比較狹窄總體第15頁,課件共146頁,創(chuàng)作于2023年2月統(tǒng)計報表

(statisticalreportforms)

1. 統(tǒng)計調(diào)查方式之一2. 過去曾經(jīng)是我國主要的數(shù)據(jù)收集方式3. 按照國家有關(guān)法規(guī)的規(guī)定、自上而下地統(tǒng)一布置、自下而上地逐級提供基本統(tǒng)計數(shù)據(jù)4. 有各種各樣的類型第16頁,課件共146頁,創(chuàng)作于2023年2月數(shù)據(jù)的收集方法第17頁,課件共146頁,創(chuàng)作于2023年2月數(shù)據(jù)的收集方法數(shù)據(jù)的收集方法詢問調(diào)查訪問調(diào)查觀察實驗電話調(diào)查郵寄調(diào)查觀察電腦輔助座談會個別深訪實驗第18頁,課件共146頁,創(chuàng)作于2023年2月訪問調(diào)查

(personalinterview)1. 調(diào)查者與被調(diào)查者通過面對面地交談而獲得資料2. 有標(biāo)準(zhǔn)式訪問和非標(biāo)準(zhǔn)式訪問標(biāo)準(zhǔn)式訪問通常按事先設(shè)計好的問卷進(jìn)行非標(biāo)準(zhǔn)式訪問事先一般不制作問卷對不起,打擾了!第19頁,課件共146頁,創(chuàng)作于2023年2月郵寄調(diào)查

(mailsurvey)也稱郵寄問卷調(diào)查是一種標(biāo)準(zhǔn)化調(diào)查調(diào)查者與被調(diào)查者沒有直接的語言交流,信息的傳遞依賴于問卷通過某種方式將調(diào)查表或問卷送至某調(diào)查者手中,由被調(diào)查者填寫,然后將問卷寄回指定收集點問卷或表格的發(fā)放方式有郵寄、宣傳媒介傳送、專門場所分發(fā)三種 第20頁,課件共146頁,創(chuàng)作于2023年2月電話調(diào)查

(telephonesurvey)調(diào)查者利用電話與被調(diào)查者進(jìn)行語言交流以獲得信息時效快、成本低問題的數(shù)量不宜過多

您好!我是××調(diào)查公司的調(diào)查員…第21頁,課件共146頁,創(chuàng)作于2023年2月電腦輔助調(diào)查

(computer—assistedtelephoneinterviewing)又稱電腦輔助電話調(diào)查電腦與電話相結(jié)合完成調(diào)查的全過程一般需借助專門的軟件進(jìn)行硬件設(shè)備要求較高 問卷第22頁,課件共146頁,創(chuàng)作于2023年2月座談會

(colloquia)1. 也稱集體訪談2. 將一組被調(diào)查者集中在調(diào)查現(xiàn)場,讓他們對調(diào)查的主題發(fā)表意見以獲得資料3. 參加座談會的人數(shù)不宜過多,一般為6~10人4. 側(cè)重于定性研究第23頁,課件共146頁,創(chuàng)作于2023年2月個別深度訪問

(personalInterviewing)一次只有一名受訪者參加、針對特殊問題的調(diào)查適合于較隱秘的問題,如個人隱私問題;或較敏感的問題,如政治方面的問題側(cè)重于定性研究第24頁,課件共146頁,創(chuàng)作于2023年2月觀察法

(observationalmethod)1. 就調(diào)查對象的行動和意識,調(diào)查人員邊觀察邊記錄以收集所需信息2. 調(diào)查人員不是強(qiáng)行介入3. 能夠在被調(diào)查者不察覺的情況下獲得資料第25頁,課件共146頁,創(chuàng)作于2023年2月實驗法

(experimentalmethod)1. 在設(shè)定的特殊實驗場所、特殊狀態(tài)下,對調(diào)查對象進(jìn)行實驗以獲得所需資料2. 有室內(nèi)實驗法和市場實驗法第26頁,課件共146頁,創(chuàng)作于2023年2月1.2調(diào)查設(shè)計1.2.1調(diào)查方案的結(jié)構(gòu)1.2.2調(diào)查問卷設(shè)計第27頁,課件共146頁,創(chuàng)作于2023年2月1.2.1調(diào)查方案的結(jié)構(gòu)第28頁,課件共146頁,創(chuàng)作于2023年2月調(diào)查方案的結(jié)構(gòu)

(surveyplan)調(diào)查方案的內(nèi)容調(diào)查任務(wù)與目的調(diào)查對象、調(diào)查單位與報告單位調(diào)查項目其他第29頁,課件共146頁,創(chuàng)作于2023年2月調(diào)查目的

(objectiveofsurvey)1. 調(diào)查要達(dá)到的具體目標(biāo)回答“為什么調(diào)查?”調(diào)查之前必須明確第30頁,課件共146頁,創(chuàng)作于2023年2月調(diào)查對象和調(diào)查單位

(RespondentandSurveyunit)調(diào)查對象:調(diào)查研究的總體或調(diào)查范圍調(diào)查單位:需要對之進(jìn)行調(diào)查的單位??梢允钦{(diào)查對象的全部單位(全面調(diào)查),也可以是調(diào)查對象中的一部分單位(非全面調(diào)查)回答“向誰調(diào)查?”調(diào)查對象調(diào)查單位?第31頁,課件共146頁,創(chuàng)作于2023年2月調(diào)查項目

(Surveyitems)調(diào)查的具體內(nèi)容通常表現(xiàn)為表格或問卷回答“調(diào)查什么?”Q1…………Q2…………Q3…………Q4…………第32頁,課件共146頁,創(chuàng)作于2023年2月方案設(shè)計中的其他問題1. 明確調(diào)查所采用的方法2. 確定調(diào)查資料的所屬時間和調(diào)查工作的期限3.調(diào)查的組織與實施細(xì)則第33頁,課件共146頁,創(chuàng)作于2023年2月1.2.2調(diào)查問卷設(shè)計第34頁,課件共146頁,創(chuàng)作于2023年2月什么是問卷?

(questionnaires)用來搜集調(diào)查數(shù)據(jù)的一種工具調(diào)查者根據(jù)調(diào)查目的和要求所設(shè)計的,由一系列問題、備選答案、說明以及碼表組成的一種調(diào)查形式不同的調(diào)查問卷在具體結(jié)構(gòu)、題型、措詞、版式等設(shè)計上會有所不同,但在結(jié)構(gòu)上一般都由開頭部分、甄別部分、主體部分和背景部分組成第35頁,課件共146頁,創(chuàng)作于2023年2月問卷的基本結(jié)構(gòu)問卷的基本結(jié)構(gòu)開頭部分甄別部分主體部分背景部分問候語填寫說明問卷編號第36頁,課件共146頁,創(chuàng)作于2023年2月開頭部分

(問候語)××女士/小姐/先生您好!我是××市場調(diào)查公司訪問員,我們正在進(jìn)行一項有關(guān)公眾醫(yī)療保險意識方面的調(diào)查,目的是想了解人們對醫(yī)療保險的看法和意見,以便更好地促進(jìn)醫(yī)療保險事業(yè)的發(fā)展。您的回答無所謂對錯,只要真實地反映了您的情況和看法,就達(dá)到了這次調(diào)查的目的。希望您能積極參與,我們對您的回答完全是保密的。調(diào)查要耽擱您一些時間,請您諒解。謝謝您的支持與合作!第37頁,課件共146頁,創(chuàng)作于2023年2月開頭部分

(填寫說明)填寫要求:請您在所選擇答案的題號上畫圈對只許選擇一個答案的問題只能畫一個圈;對可選多個答案的問題,請在你認(rèn)為合適的答案上畫圈需填寫數(shù)字的題目在留出的橫線上填寫對于表格中選擇答案的題目,在所選的欄目內(nèi)畫勾對注明要求您自己填寫的內(nèi)容,請在規(guī)定的地方填上您的意見

第38頁,課件共146頁,創(chuàng)作于2023年2月開頭部分

(問卷的編號)用于識別問卷、調(diào)查者、被調(diào)查者姓名和地址等便于校對檢查、更正錯誤問卷編號001第39頁,課件共146頁,創(chuàng)作于2023年2月甄別部分甄別也稱為過濾,它是先對被調(diào)查者進(jìn)行過濾,篩選掉不需要的部分,然后針對特定的被調(diào)查者進(jìn)行調(diào)查通過甄別,可以篩選掉與調(diào)查事項有直接關(guān)系的人,以達(dá)到避嫌的目的可以確定哪些人是合格的被調(diào)查者,哪些人不是甄別的目的是確保被調(diào)查者合格,能夠作為該市場調(diào)查項目的代表,從而符合調(diào)查研究的需要第40頁,課件共146頁,創(chuàng)作于2023年2月甄別部分S1.請問您或您的家庭有沒有在下列行業(yè)工作的呢?

1.廣告、公關(guān)機(jī)構(gòu)…………………2.市場研究、咨詢、調(diào)查機(jī)構(gòu)……3.電視,廣播,報紙等媒介機(jī)構(gòu)…終止訪問

4.轎車制造…………5.轎車批發(fā)、零售…………………6.以上皆無…………繼續(xù)訪問S2.請問您的年齡是:

1.20歲以下………終止訪問

2.20歲~30歲

3.30歲~40歲

4.40歲~50歲

5.50歲以上………終止訪問第41頁,課件共146頁,創(chuàng)作于2023年2月主體部分是調(diào)查問卷的核心內(nèi)容包括所要調(diào)查的全部問題,主要由問題和答案所組成

Q1.您在購買汽車時主要考慮哪些因素?Q2.您認(rèn)為這款汽車的加速性能怎么樣?第42頁,課件共146頁,創(chuàng)作于2023年2月背景部分通常放在問卷的最后,主要是有關(guān)被調(diào)查者的一些背景資料該部分所包含的各項問題,可使研究者根據(jù)背景資料對被調(diào)查者進(jìn)行分類比較分析1.您具體做什么工作?2.您的受教育程度?第43頁,課件共146頁,創(chuàng)作于2023年2月背景部分

A.[出示卡片]請問您的教育程度?

(901)

沒受過正式教育………

……

…………1

小學(xué),初中…………

……

…………2

高中,職高,中專,技?!?/p>

……

……3

大專,大學(xué)或以上…

……

……

…4

B.[出示卡片]請問您的職業(yè)和職位是什么?(902)

普通職員,工人……1

部門經(jīng)理負(fù)責(zé)人//高級管理人員……

…2

公司老板,廠長,總經(jīng)理…………

……………3

專業(yè)人員……………

……

…………4

個體戶,自營職業(yè)………………

………

………5

失業(yè),待業(yè)………………

……

……6

學(xué)生……………………7

離退休人員…………8

其他(請注明)………9第44頁,課件共146頁,創(chuàng)作于2023年2月提問項目的設(shè)計第45頁,課件共146頁,創(chuàng)作于2023年2月提問項目的設(shè)計提問的內(nèi)容盡可能短用詞要確切、通俗可按6W準(zhǔn)則加以推敲。6W即Who(誰),Where(何處),When(何時),Why(為什么),What(什么事),How(如何)一項提問只包含一項內(nèi)容避免誘導(dǎo)性提問避免否定形式的提問避免敏感性問題第46頁,課件共146頁,創(chuàng)作于2023年2月用詞要確切、通俗請問您使用什么牌子的洗發(fā)水?請問您最近三個月使用什么牌子的洗發(fā)水?您最近一段時間使用什么品牌的化妝品?您最近一個月使用什么品牌的化妝品?您覺得這種電視機(jī)的畫面質(zhì)量怎么樣?您認(rèn)為這種電視機(jī)的畫面是否清晰?第47頁,課件共146頁,創(chuàng)作于2023年2月一項提問只包含一項內(nèi)容您覺得這種新款轎車的加速性能和制動性能怎么樣?您覺得這種新款轎車的加速性能怎么樣?您覺得這種新款轎車的制動性能怎么樣?第48頁,課件共146頁,創(chuàng)作于2023年2月避免誘導(dǎo)性提問人們認(rèn)為長虹牌彩電質(zhì)量不錯,你覺得怎么樣?您覺得長虹牌彩電的質(zhì)量怎么樣?第49頁,課件共146頁,創(chuàng)作于2023年2月避免否定形式的提問您覺得這種產(chǎn)品的新包裝不美觀嗎?您覺得這種產(chǎn)品的新包裝美觀嗎?第50頁,課件共146頁,創(chuàng)作于2023年2月回答項目(答案)的設(shè)計第51頁,課件共146頁,創(chuàng)作于2023年2月回答的類型與方法回答的類型與方法開放性問題(自由回答型)封閉性問題(選擇回答型)兩項選擇法多項選擇法順序選擇法評定尺度法雙向列聯(lián)法限制選擇型多項選擇型單項選擇型第52頁,課件共146頁,創(chuàng)作于2023年2月開放性問題對問題的回答未提供任何具體的答案,由被調(diào)查者根據(jù)自己的想法自由作出回答屬于自由回答型優(yōu)點:比較靈活,適合于搜集更深層次的信息,特別適合于那些尚未弄清各種可能答案或潛在答案類型較多的問題。而且可以使被調(diào)查者充分表達(dá)自己的意見和想法,有利于被調(diào)查者發(fā)揮自己的創(chuàng)造缺點:由于會出現(xiàn)各種各樣的答案,給調(diào)查后的資料整理帶來一定困難第53頁,課件共146頁,創(chuàng)作于2023年2月開放性問題

您認(rèn)為我國目前的廣告宣傳中,存在的主要問題是什么?

您對這種捷達(dá)新款車有何更具體的看法?

第54頁,課件共146頁,創(chuàng)作于2023年2月封閉性問題對問題事先設(shè)計出了各種可能的答案,由被調(diào)查者從中選擇問題的答案是標(biāo)準(zhǔn)化的,有利于被調(diào)查者對問題的理解和回答,也有利于調(diào)查后的資料整理對答案的要求較高,對一些比較復(fù)雜的問題,有時很難把答案設(shè)計周全問題的答案是選擇回答型,所以設(shè)計出的答案一定要窮盡和互斥回答方法有:兩項選擇法、多項選擇法、順序選擇法、評定尺度法、雙向列聯(lián)法五種第55頁,課件共146頁,創(chuàng)作于2023年2月封閉性問題

(兩項選擇法)答案只有兩項,要求被調(diào)查者選擇其中之一來回答優(yōu)點:被調(diào)查者只需在二者之中選擇一項,回答比較容易;調(diào)查后的數(shù)據(jù)處理也很方便缺點:得到的信息量較少;當(dāng)被調(diào)查者對兩項答案均不滿意時,很難作出回答您有手機(jī)嗎?

1.有2.沒有

第56頁,課件共146頁,創(chuàng)作于2023年2月封閉性問題

(多項選擇法)在設(shè)計問卷時,對一個問題給出三個或三個以上的答案,讓被調(diào)查者從中選擇進(jìn)行回答根據(jù)要求選擇的答案多少不同,有以下類型單項選擇型:要求被調(diào)查者對所給出的問題答案選擇其中的一項

多項選擇型:要求被調(diào)查者對所給出的問題答案中,選出自己認(rèn)為合適的答案,數(shù)量不受限制限制選擇型:要求被調(diào)查者在所給出的問題答案中,選出自己認(rèn)為合適的答案,但數(shù)量要受一定限制

第57頁,課件共146頁,創(chuàng)作于2023年2月封閉性問題

(單項選擇法實例)單項選擇型

您覺得哪種類型的廣告宣傳效果最好?

(選一項)1.電視廣告

2.廣播廣告

3.雜志廣告

4.報紙廣告

5.路牌廣告第58頁,課件共146頁,創(chuàng)作于2023年2月封閉性問題

(多項選擇法實例)多項選擇型

請問您在購買小轎車時,主要考慮哪些因素?

(選出您認(rèn)為合適的答案)1.價格6.維修費用

2.款式7.乘坐舒適

3.品牌8.行使平穩(wěn)

4.耗油量9.加速性能

5.售后服務(wù)10.制動性能第59頁,課件共146頁,創(chuàng)作于2023年2月封閉性問題

(順序選擇法)問題答案有多個,要求被調(diào)查者在回答時,對所選的答案按要求的順序或重要程度加以排列。其中,對所選的的答案數(shù)量可以進(jìn)行一定的限制,也可以不進(jìn)行限制問題答案不僅可以反映所要調(diào)查的內(nèi)容,而且可以反映出被調(diào)查者對問題的看法,從而增加了信息量

您在購買這種牌子的電視機(jī)時,主要是考慮哪些因素?

1.產(chǎn)品的品牌

2.價格合理

3.售后服務(wù)

4.外形美觀

5.維修方便(按重要程度進(jìn)行排序)第60頁,課件共146頁,創(chuàng)作于2023年2月封閉性問題

(評定尺度法)問題答案,由表示不同等級的形容詞組成,并按照一定的程度排序,由被調(diào)查者依次選擇

您對這種新款轎車是否感到滿意?

1.非常滿意;2.比較滿意;3.一般

4.不太滿意;5.不滿意。

第61頁,課件共146頁,創(chuàng)作于2023年2月封閉性問題

(雙向列聯(lián)法)將兩類不同問題綜合到一起,通常用表格來表現(xiàn)表的橫向是一類問題,縱向是另一類問題這種問題結(jié)構(gòu)可以反映兩方面因素的綜合作用,提供單一類型問題無法提供的信息可以節(jié)省問卷的篇幅第62頁,課件共146頁,創(chuàng)作于2023年2月封閉性問題

(雙向列聯(lián)法實例)神龍富康捷

達(dá)桑塔納1.

耗油量低2.

外觀大方3.

乘坐舒適4.

整車價格合理5.

駕駛?cè)菀?.

制動性好7.

維修方便8.

零配件齊全9.

故障率低10.

售后服務(wù)周到請在您贊同項目的空格內(nèi)劃“√”第63頁,課件共146頁,創(chuàng)作于2023年2月1.3數(shù)據(jù)質(zhì)量1.3.1數(shù)據(jù)的誤差1.3.2數(shù)據(jù)的質(zhì)量要求第64頁,課件共146頁,創(chuàng)作于2023年2月數(shù)據(jù)的誤差第65頁,課件共146頁,創(chuàng)作于2023年2月抽樣誤差

(samplingerror)由于抽樣的隨機(jī)性所帶來的誤差所有樣本可能的結(jié)果與總體真值之間的平均性差異影響抽樣誤差的大小的因素樣本量的大小總體的變異性第66頁,課件共146頁,創(chuàng)作于2023年2月非抽樣誤差

(non-samplingerror)相對抽樣誤差而言除抽樣誤差之外的,由于其他原因造成的樣本觀察結(jié)果與總體真值之間的差異存在于所有的調(diào)查之中概率抽樣,非概率抽樣,全面性調(diào)查有抽樣框誤差、回答誤差、無回答誤差、調(diào)查員誤差、測量誤差第67頁,課件共146頁,創(chuàng)作于2023年2月誤差的控制抽樣誤差可計算和控制非抽樣誤差的控制調(diào)查員的挑選調(diào)查員的培訓(xùn)督導(dǎo)員的調(diào)查專業(yè)水平調(diào)查過程控制調(diào)查結(jié)果進(jìn)行檢驗、評估現(xiàn)場調(diào)查人員進(jìn)行獎懲的制度第68頁,課件共146頁,創(chuàng)作于2023年2月統(tǒng)計數(shù)據(jù)的質(zhì)量要求1.精

度:最低的抽樣誤差或隨機(jī)誤差2.準(zhǔn)確性:最小的非抽樣誤差或偏差3.關(guān)聯(lián)性:滿足用戶決策、管理和研究的需要4.及時性:在最短的時間里取得并公布數(shù)據(jù)5.一致性:保持時間序列的可比性6.最低成本:以最經(jīng)濟(jì)的方式取得數(shù)據(jù)第69頁,課件共146頁,創(chuàng)作于2023年2月第二節(jié)數(shù)據(jù)整理與展示2.1

數(shù)據(jù)的預(yù)處理2.2分類和順序數(shù)據(jù)的整理與顯示2.3數(shù)值型數(shù)據(jù)的整理與顯示2.4統(tǒng)計表第70頁,課件共146頁,創(chuàng)作于2023年2月2.1

數(shù)據(jù)的預(yù)處理2.1.1數(shù)據(jù)審核2.1.2數(shù)據(jù)篩選2.1.3數(shù)據(jù)排序第71頁,課件共146頁,創(chuàng)作于2023年2月數(shù)據(jù)的預(yù)處理數(shù)據(jù)審核檢查數(shù)據(jù)中的錯誤數(shù)據(jù)篩選找出符合條件的數(shù)據(jù)數(shù)據(jù)排序升序和降序?qū)ふ覕?shù)據(jù)的基本特征第72頁,課件共146頁,創(chuàng)作于2023年2月數(shù)據(jù)審核第73頁,課件共146頁,創(chuàng)作于2023年2月數(shù)據(jù)審核—原始數(shù)據(jù)

(rawdata)審核的內(nèi)容完整性審核檢查應(yīng)調(diào)查的單位或個體是否有遺漏所有的調(diào)查項目或指標(biāo)是否填寫齊全準(zhǔn)確性審核檢查數(shù)據(jù)是否真實反映客觀實際情況,內(nèi)容是否符合實際檢查數(shù)據(jù)是否有錯誤,計算是否正確等第74頁,課件共146頁,創(chuàng)作于2023年2月數(shù)據(jù)的審核—二手?jǐn)?shù)據(jù)

(secondhanddata)適用性審核弄清楚數(shù)據(jù)的來源、數(shù)據(jù)的口徑以及有關(guān)的背景材料確定數(shù)據(jù)是否符合自己分析研究的需要時效性審核盡可能使用最新的數(shù)據(jù)確認(rèn)是否有必要做進(jìn)一步的加工整理第75頁,課件共146頁,創(chuàng)作于2023年2月數(shù)據(jù)篩選與排序第76頁,課件共146頁,創(chuàng)作于2023年2月數(shù)據(jù)篩選

(datafilter)當(dāng)數(shù)據(jù)中的錯誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無法彌補(bǔ)時,需要對數(shù)據(jù)進(jìn)行篩選數(shù)據(jù)篩選的內(nèi)容將某些不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù)予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來,而不符合特定條件的數(shù)據(jù)予以剔除第77頁,課件共146頁,創(chuàng)作于2023年2月用Excel進(jìn)行數(shù)據(jù)篩選

8名學(xué)生的考試成績數(shù)據(jù)

數(shù)據(jù)篩選

(datafilter)第78頁,課件共146頁,創(chuàng)作于2023年2月數(shù)據(jù)排序

(datarank)按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索排序有助于對數(shù)據(jù)檢查糾錯,以及為重新歸類或分組等提供依據(jù)在某些場合,排序本身就是分析的目的之一排序可借助于計算機(jī)完成第79頁,課件共146頁,創(chuàng)作于2023年2月數(shù)據(jù)排序

(方法)分類數(shù)據(jù)的排序字母型數(shù)據(jù),排序有升序降序之分,但習(xí)慣上用升序漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分?jǐn)?shù)值型數(shù)據(jù)的排序遞增排序:設(shè)一組數(shù)據(jù)為x1,x2,…,xn,遞增排序后可表示為:x(1)<x(2)<…<x(n)遞減排序:可表示為:x(1)>x(2)>…>x(n)第80頁,課件共146頁,創(chuàng)作于2023年2月2.2分類和順序數(shù)據(jù)的整理與顯示2.2.1分類數(shù)據(jù)的整理與圖示2.2.2順序數(shù)據(jù)的整理與圖示第81頁,課件共146頁,創(chuàng)作于2023年2月數(shù)據(jù)的整理與顯示

(基本問題)要弄清所面對的數(shù)據(jù)類型,因為不同類型的數(shù)據(jù),所采取的處理方式和方法是不同的對分類數(shù)據(jù)和順序數(shù)據(jù)主要是作分類整理對數(shù)值型數(shù)據(jù)則主要是作分組整理適合于低層次數(shù)據(jù)的整理和顯示方法也適合于高層次的數(shù)據(jù);但適合于高層次數(shù)據(jù)的整理和顯示方法并不適合于低層次的數(shù)據(jù)第82頁,課件共146頁,創(chuàng)作于2023年2月分類數(shù)據(jù)的整理與圖示第83頁,課件共146頁,創(chuàng)作于2023年2月分類數(shù)據(jù)的整理

(基本過程)1. 列出各類別2.計算各類別的頻數(shù)3.制作頻數(shù)分布表4.用圖形顯示數(shù)據(jù)分類頻數(shù)比例百分比比率ABCDE第84頁,課件共146頁,創(chuàng)作于2023年2月分類數(shù)據(jù)的整理

(可計算的統(tǒng)計量)頻數(shù)(frequency)

:落在各類別中的數(shù)據(jù)個數(shù)比例(proportion)

:某一類別數(shù)據(jù)占全部數(shù)據(jù)的比值百分比(percentage)

:將對比的基數(shù)作為100而計算的比值比率(ratio)

:不同類別數(shù)值的比值第85頁,課件共146頁,創(chuàng)作于2023年2月分類數(shù)據(jù)整理—頻數(shù)分布表

(例題分析)【例】一家市場調(diào)查公司為研究不同品牌飲料的市場占有率,對隨機(jī)抽取的一家超市進(jìn)行了調(diào)查。調(diào)查員在某天對50名顧客購買飲料的品牌進(jìn)行了記錄,如果一個顧客購買某一品牌的飲料,就將這一飲料的品牌名字記錄一次。右邊就是記錄的原始數(shù)據(jù)綠色健康飲品第86頁,課件共146頁,創(chuàng)作于2023年2月分類數(shù)據(jù)的圖示—條形圖

(barChart)用寬度相同的條形的高度或長短來表示各類別數(shù)據(jù)的圖形有單式條形圖、復(fù)式條形圖等形式主要用于反映分類數(shù)據(jù)的頻數(shù)分布繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖第87頁,課件共146頁,創(chuàng)作于2023年2月分類數(shù)據(jù)的圖示—條形圖

(例題分析)第88頁,課件共146頁,創(chuàng)作于2023年2月分類數(shù)據(jù)的圖示—餅圖

(pieChart)也稱圓形圖,是用圓形及圓內(nèi)扇形的面積來表示數(shù)值大小的圖形主要用于表示總體或樣本中各組成部分所占的比例,對于研究結(jié)構(gòu)性問題十分有用繪制圓形圖時,總體中各部分所占的百分比用圓內(nèi)的各個扇形面積表示,這些扇形的中心角度,是按各部分?jǐn)?shù)據(jù)百分比占3600的相應(yīng)比例確定的第89頁,課件共146頁,創(chuàng)作于2023年2月分類數(shù)據(jù)的圖示—餅圖

(例題分析)第90頁,課件共146頁,創(chuàng)作于2023年2月順序數(shù)據(jù)的整理與圖示第91頁,課件共146頁,創(chuàng)作于2023年2月順序數(shù)據(jù)的整理

(可計算的統(tǒng)計量)1.累積頻數(shù)(cumulativefrequencies):各類別頻數(shù)的逐級累加2.累積頻率(cumulativepercentages):各類別頻率(百分比)的逐級累加第92頁,課件共146頁,創(chuàng)作于2023年2月順序數(shù)據(jù)的頻數(shù)分布表

(例題分析)【例】在一項城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣調(diào)查300戶,其中的一個問題是:“您對您家庭目前的住房狀況是否滿意?

1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合計300100.0————第93頁,課件共146頁,創(chuàng)作于2023年2月順序數(shù)據(jù)的頻數(shù)分布表

(例題分析)乙城市家庭對住房狀況評價的頻數(shù)分布回答類別乙城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合計300100.0————第94頁,課件共146頁,創(chuàng)作于2023年2月順序數(shù)據(jù)的圖示—累計頻數(shù)分布圖

(例題分析)243001322252700100200300400

非常不滿意

不滿意

一般

滿意

非常滿意累積戶數(shù)(戶)(a)向下累積27616830300750100200300400

非常不滿意

不滿意

一般

滿意

非常滿意累積戶數(shù)(戶)(b)向上累積甲城市家庭對住房狀況評價的累積頻數(shù)分布第95頁,課件共146頁,創(chuàng)作于2023年2月環(huán)形圖

(annularchart)環(huán)形圖中間有一個“空洞”,總體中的每一部分?jǐn)?shù)據(jù)用環(huán)中的一段表示環(huán)形圖與圓形圖類似,但又有區(qū)別圓形圖只能顯示一個總體各部分所占的比例環(huán)形圖則可以同時繪制多個總體的數(shù)據(jù)系列,每一個總體的數(shù)據(jù)系列為一個環(huán)環(huán)形圖可用于結(jié)構(gòu)比較研究環(huán)形圖主要用于展示分類和順序數(shù)據(jù)第96頁,課件共146頁,創(chuàng)作于2023年2月環(huán)形圖

(例題分析)8%36%31%15%7%33%26%21%13%10%

非常不滿意

不滿意

一般

滿意

非常滿意

甲乙兩城市家庭對住房狀況的評價第97頁,課件共146頁,創(chuàng)作于2023年2月3.3數(shù)值型數(shù)據(jù)的整理與顯示3.3.1數(shù)據(jù)分組3.3.2數(shù)值型數(shù)據(jù)的圖示第98頁,課件共146頁,創(chuàng)作于2023年2月數(shù)據(jù)分組第99頁,課件共146頁,創(chuàng)作于2023年2月分組方法分組方法等距分組異距分組單變量值分組組距分組第100頁,課件共146頁,創(chuàng)作于2023年2月單變量值分組

(要點)1.將一個變量值作為一組2.適合于離散變量3.適合于變量值較少的情況第101頁,課件共146頁,創(chuàng)作于2023年2月組距分組

(要點)將變量值的一個區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況需要遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組~~~~~第102頁,課件共146頁,創(chuàng)作于2023年2月組距分組

(步驟)確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實際分組時,可以按Sturges

提出的經(jīng)驗公式來確定組數(shù)K確定組距:組距(ClassWidth)是一個組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即

組距=(最大值-最小值)÷組數(shù)

統(tǒng)計出各組的頻數(shù)并整理成頻數(shù)分布表第103頁,課件共146頁,創(chuàng)作于2023年2月組距分組

(幾個概念)1.下限(lowlimit)

:一個組的最小值2.上限(upperlimit)

:一個組的最大值3.組距(classwidth)

:上限與下限之差4.組中值(classmidpoint)

:下限與上限之間的中點值下限值+上限值2組中值=第104頁,課件共146頁,創(chuàng)作于2023年2月頻數(shù)分布表的編制

(例題分析)【例】某電腦公司2002年前四個月各天的銷售量數(shù)據(jù)(單位:臺)。試對數(shù)據(jù)進(jìn)行分組。

第105頁,課件共146頁,創(chuàng)作于2023年2月頻數(shù)分布表的編制

(步驟)確定組數(shù):根據(jù)Sturges提出的經(jīng)驗公式得組數(shù)K為:確定各組的組距:

組距=(237-141)÷10=9.6103.用Excel制作頻數(shù)分布表

第106頁,課件共146頁,創(chuàng)作于2023年2月等距分組表

(上下組限重疊)第107頁,課件共146頁,創(chuàng)作于2023年2月等距分組表

(上下組限間斷)第108頁,課件共146頁,創(chuàng)作于2023年2月等距分組表

(使用開口組)第109頁,課件共146頁,創(chuàng)作于2023年2月組距分組與不等距分組

(在表現(xiàn)頻數(shù)分布上的差異)等距分組各組頻數(shù)的分布不受組距大小的影響可直接根據(jù)絕對頻數(shù)來觀察頻數(shù)分布的特征不等距分組各組頻數(shù)的分布受組距大小不同的影響各組絕對頻數(shù)的多少不能反映頻數(shù)分布的實際狀況需要用頻數(shù)密度(頻數(shù)密度=頻數(shù)/組距)反映頻數(shù)分布的實際狀況第110頁,課件共146頁,創(chuàng)作于2023年2月數(shù)值型數(shù)據(jù)的圖示Excel分組數(shù)據(jù)—直方圖和折線圖第111頁,課件共146頁,創(chuàng)作于2023年2月分組數(shù)據(jù)—直方圖

(histogram)用矩形的寬度和高度來表示頻數(shù)分布的圖形,實際上是用矩形的面積來表示各組的頻數(shù)分布在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個矩形,即直方圖直方圖下的總面積等于1第112頁,課件共146頁,創(chuàng)作于2023年2月分組數(shù)據(jù)的圖示

(直方圖的繪制)140150210直方圖下的面積之和等于1某電腦公司銷售量分布的直方圖我一眼就看出來了,銷售量在170~180之間的天數(shù)最多!190200180160170頻數(shù)(天)25201510530220230240第113頁,課件共146頁,創(chuàng)作于2023年2月分組數(shù)據(jù)—直方圖

(直方圖與條形圖的區(qū)別)條形圖是用條形的長度(橫置時)表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù)第114頁,課件共146頁,創(chuàng)作于2023年2月分組數(shù)據(jù)—折線圖

(frequencypolygon)折線圖也稱頻數(shù)多邊形圖是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個終點要與橫軸相交,具體的做法是第一個矩形的頂部中點通過豎邊中點(即該組頻數(shù)一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的第115頁,課件共146頁,創(chuàng)作于2023年2月分組數(shù)據(jù)的圖示

(折線圖的繪制)折線圖與直方圖下的面積相等!140150210某電腦公司銷售量分布的折線圖190200180160170220230240頻數(shù)(天)25201510530第116頁,課件共146頁,創(chuàng)作于2023年2月數(shù)值型數(shù)據(jù)的圖示STATISTICA未分組數(shù)據(jù)—莖葉圖和箱線圖第117頁,課件共146頁,創(chuàng)作于2023年2月未分組數(shù)據(jù)—莖葉圖

(stem-and-leafdisplay)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留一位數(shù)字對于n(20n300)個數(shù)據(jù),莖葉圖最大行數(shù)不超過

L=[10×lgn]

6.莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息第118頁,課件共146頁,創(chuàng)作于2023年2月未分組數(shù)據(jù)—莖葉圖

(例題分析)第119頁,課件共146頁,創(chuàng)作于2023年2月未分組數(shù)據(jù)—莖葉圖

(擴(kuò)展的莖葉圖)第120頁,課件共146頁,創(chuàng)作于2023年2月未分組數(shù)據(jù)—箱線圖

(boxplot)用于顯示未分組的原始數(shù)據(jù)的分布箱線圖由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成其繪制方法是:首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me

和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個四分(位)數(shù)畫出箱子,再將兩個極值點與箱子相連接第121頁,課件共146頁,創(chuàng)作于2023年2月未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖

(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值簡單箱線圖第122頁,課件共146頁,創(chuàng)作于2023年2月未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖

(例題分析)最小值141最大值237中位數(shù)182下四分位數(shù)170.25上四分位數(shù)197140150160170180190200210220230240某電腦公司銷售量數(shù)據(jù)的箱線圖第123頁,課件共146頁,創(chuàng)作于2023年2月分布的形狀與箱線圖

對稱分布QL中位數(shù)

QU左偏分布QL中位數(shù)

QU右偏分布QL

中位數(shù)

QU不同分布的箱線圖第124頁,課件共146頁,創(chuàng)作于2023年2月未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖

(例題分析)【例】

從某大學(xué)經(jīng)濟(jì)管理專業(yè)二年級學(xué)生中隨機(jī)抽取11人,對8門主要課程的考試成績進(jìn)行調(diào)查,所得結(jié)果如表。試?yán)L制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征11名學(xué)生各科的考試成績數(shù)據(jù)課程名稱學(xué)生編號1234567891011英語經(jīng)濟(jì)數(shù)學(xué)西方經(jīng)濟(jì)學(xué)市場營銷學(xué)財務(wù)管理基礎(chǔ)會計學(xué)統(tǒng)計學(xué)計算機(jī)應(yīng)用基礎(chǔ)76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177第125頁,課件共146頁,創(chuàng)作于2023年2月未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖

(例題分析)8門課程考試成績的箱線圖第126頁,課件共146頁,創(chuàng)作于2023年2月11名學(xué)生8門課程考試成績的箱線圖min-max25%-75%medianvalue455565758595105學(xué)生1學(xué)生2學(xué)生3學(xué)生4學(xué)生5學(xué)生6學(xué)生7學(xué)生8學(xué)生9學(xué)生10學(xué)生11未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖

(例題分析)第127頁,課件共146頁,創(chuàng)作于2023年2月數(shù)值型數(shù)據(jù)的圖示時間序列數(shù)據(jù)—線圖Excel第128頁,課件共146頁,創(chuàng)作于2023年2月時間序列數(shù)據(jù)—線圖

(lineplot)繪制線圖時應(yīng)注意以下幾點時間一般繪在橫軸,指標(biāo)數(shù)據(jù)繪在縱軸圖形的長寬比例要適當(dāng),其長寬比例大致為10:7一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開始,以便于比較。數(shù)據(jù)與“0”之間的間距過大時,可以采取折斷的符號將縱軸折斷第129頁,課件共146頁,創(chuàng)作于2023年2月時間序列數(shù)據(jù)—線圖

(例題分析)【例】已知1991—2000年我國城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如表。試?yán)L制線圖¥

1991~2000年城鄉(xiāng)居民家庭人均收入年份城鎮(zhèn)居民農(nóng)村居民19911992199319941995199619971998199920001700.62026.62577.43496.24283.04838.95160.35425.15854.06280.0708.6784.0921.61221.01577.71926.12091.12162.02210.32254.4第130頁,課件共146頁,創(chuàng)作于2023年2月時間序列數(shù)據(jù)—線圖

(例題分析)第131頁,課件共146頁,創(chuàng)作于2023年2月數(shù)值型數(shù)據(jù)的圖示多變量數(shù)據(jù)—雷達(dá)圖Excel第132頁,課件共146頁,創(chuàng)作于2023年2月顯示多個變量的圖示方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論