




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1
第七章資料的整理與分析§7.1調(diào)查資料的整理§7.2調(diào)查資料的分析§7.3統(tǒng)計圖表2§7.1調(diào)查資料的整理
一、資料整理的含義和步驟二、資料整理的基本方法——統(tǒng)計分組3
根據(jù)研究目的,運用科學的方法,對調(diào)查資料進行審核、分類或分組、匯總,使之系統(tǒng)化和條理化,并以集中、簡明的方式反映調(diào)查對象總體情況的工作過程。
作用:是市場調(diào)查的繼續(xù),統(tǒng)計分析的前提和基礎(承上啟下)。資料整理含義與作用44資料審核分組處理統(tǒng)計匯總計算機匯總手工匯總數(shù)據(jù)陳示程序設計數(shù)據(jù)編碼數(shù)據(jù)錄入邏輯檢查匯總制表齊備性完整性準確性時效性真?zhèn)涡再Y料整理的步驟5實地資料的審核資料的審核1、不完整答卷2、有明顯錯誤答卷3、乏興回答問卷4、開放式問題打亂順序問卷次級資料的審核1、著述性文獻2、統(tǒng)計資料6
根據(jù)社會調(diào)查的目的和要求,按照一定標志,將所研究的事物或現(xiàn)象區(qū)分為不同的類型或組的一種整理資料的方法。
統(tǒng)計分組作用:(1)可以找出總體內(nèi)部各個部分之間的差異。(2)可以深入了解現(xiàn)象總體的內(nèi)部結(jié)構(gòu)。(3)可以顯示社會現(xiàn)象之間的依存關系。
總體經(jīng)過分組,能夠突出組與組之間的差異而抽象掉組內(nèi)各單位之間的差異,使數(shù)據(jù)變得條理化,便于進一步分析研究。7
我國三次產(chǎn)業(yè)分類的從業(yè)人員構(gòu)成情況
單位(%)
年份產(chǎn)業(yè)19931994199519961997第一56.451.352.250.049.9第二22.422.723.023.523.7第三21.223.0024.826.026.4合計100.0100.0100.0100.0100.0
某地區(qū)糧食單位面積產(chǎn)量和施肥量的關系每公頃化肥施用量(千克)糧食單位面積產(chǎn)量(千克/公頃)116.25133.50145.50153.75163.502827.53124.53396.03608.33484.08a.分組的類型1、根據(jù)分組標志的性質(zhì)
簡單分組復合分組品質(zhì)分組數(shù)量分組2、根據(jù)分組標志的數(shù)量99消費者高收入男女中收入低收入本科以上本科、專科高中及以下本科以上本科、??聘咧屑耙韵卤究埔陨媳究?、??聘咧屑耙韵履信信信信信信信信畯秃戏纸M1010例
為了了解某地區(qū)銀行存款的構(gòu)成,可以選用存款性質(zhì)、期限兩個標志分別進行分組按存款性質(zhì)分組
企業(yè)存款儲蓄存款財政性存款按存款期限分組
活期存款定期存款簡單分組存款同時按其性質(zhì)及期限分組
企業(yè)存款活期定期儲蓄存款活期定期財政性存款活期定期復合分組品質(zhì)分組11例2:企業(yè)職工按工齡分組
5年以下
5~10年
10~15年
15~20年
20年以上數(shù)量標志分組12b.分組界限(1)確定分組形式(2)確定組距(3)確定組限“上限不在內(nèi)”
等距分組I=R/k
不等距分組I=R/(1+3.322lgn)13
案例:電腦用戶情況調(diào)查編碼對照表
1、您的年齡是
18歲以下18-30歲31-50歲50歲以上
2、選購電腦時經(jīng)銷商的介紹對您的影響程度是
0102030405060708090100(%)
3、您選購電腦時,可能會考慮各種因素,請您按先后順序進行排序
價格品牌功能售后服務
4、其他條件不變時,如果電腦系列產(chǎn)品平均降低售價10%,您的態(tài)度是
馬上購買會來購買比較后再看
沒有吸引力不會來購買肯定不購買
3.編碼
就是給每一個問題的每一個可能的答案分配一個代碼,通常用數(shù)字表示。14
案例:電腦用戶情況調(diào)查編碼對照表
問題1編號答案類別
118歲以下
218-30歲
331-50歲
450歲以上
問題3A編號答案類別價格問題3B編號答案類別品牌問題3C編號答案類別功能問題3D編號答案類別售后服務問題2編號答案類別
10—10210—20320—30430—40540—50650—60760—70870—80980—901090—100
問題4編號答案類別
1馬上購買
2會來購買
3比較后再看
4沒有吸引力
5不會來購買
6肯定不購買15
案例:調(diào)查答案綜合表
回答者序列號問題順序1233334001253124200237213430033723141________________________________100482413116171819202122§7.2調(diào)查資料的分析一、交叉列表分析二、集中趨勢分析
算術(shù)平均數(shù)
中位數(shù)
眾數(shù)三、離中趨勢分析
全距(極差)
標準差23
交叉列表技術(shù)是同時將兩個或兩個以上具有有限類數(shù)目的確定值的變量,按照一定的順序?qū)帕性谝粡埍碇校瑥姆治鲎兞恐g的相關關系得出科學的結(jié)論。交叉列表分析技術(shù)24擁有情況家庭收入水平行總計高收入中收入低收入有沒有25215615624096300504696列總計4083963961200轎車的擁有情況與家庭收入之間的關系
例:某項對家庭轎車擁有情況的調(diào)查,通過交叉列表分析,可以看出轎車的擁有情況和家庭收入水平有很大的關系。25(一)交叉列表分析中變量的選擇和確定在運用交叉列表分析時,對變量的選擇和確定是否正確,是關系到分析結(jié)果是否正確的關鍵因素之一。示例:某項關于交通事故的調(diào)查
轎車駕駛者的事故比率百分比從未在駕駛中出過事故62在駕駛中至少出過一次事故38列總計100被調(diào)查總?cè)藬?shù)1403026男性(%)女性(%)從未在駕駛中出過事故5668在駕駛中至少出過一次事故4432列總計100100被調(diào)查總?cè)藬?shù)70806950交通事故與性別關系表男性駕駛公里數(shù)女性駕駛公里數(shù)大于15000小于15000大于15000小于15000至少出過一次事故52%25%52%25%被調(diào)查總?cè)藬?shù)5010207019155035事故發(fā)生率與駕駛里程數(shù)關系表27(二)雙變量交叉列表分析方法雙變量交叉列表分析法是一種最基本的交叉列表分析方法。通常,把雙變量交叉列表分析中的各項絕對值轉(zhuǎn)化為百分數(shù),能清楚地顯示相互關系。計算百分數(shù)可以按列進行,也可以按行進行。值得注意的是,并非兩種計算所得到的結(jié)果都有現(xiàn)實意義,基本原則是以自變量為基準來計算百分數(shù)。
28業(yè)務增長經(jīng)營年限行總計小于6年6-12年12年以上增長慢增長快455234535527134132列總計978782266經(jīng)營年限與業(yè)務增長之間的關系表
例:某項對企業(yè)業(yè)務增長和經(jīng)營年限長短之間的相關聯(lián)系進行的研究,被調(diào)查的企業(yè),按經(jīng)營年限的長短分為三個檔次;對企業(yè)業(yè)務增長情況分為快和慢兩類。交叉列表分析如下:29業(yè)務增長經(jīng)營年限小于6年6-12年12年以上增長慢增長快46.4%53.6%39.1%60.9%67.1%32.9%列總計100%100%100%業(yè)務增長經(jīng)營年限行總計小于6年6-12年12年以上增長慢增長快33.6%39.4%25.4%40.1%41.0%20.5%100%100%按經(jīng)營年限計算的經(jīng)營業(yè)務增長速度按經(jīng)營業(yè)務增長速度計算的經(jīng)營年限示例30(三)三變量交叉列表分析方法3131(三)三變量交叉列表分析方法1、更精確的顯示原有聯(lián)系時裝購買狀況婚姻狀況已婚未婚高低31%69%52%48%列總計100%100%被調(diào)查人數(shù)700300婚姻狀況與時裝購買狀況的關系32時裝購買狀況性別男性女性婚姻現(xiàn)狀婚姻現(xiàn)狀已婚未婚已婚未婚高低35%65%40%60%25%75%60%40%列總計100%100%100%100%被調(diào)查人數(shù)400120300180婚姻狀況、性別與時裝購買狀況的關系33(三)三變量交叉列表分析方法2、顯示原有聯(lián)系是虛假的3、顯示出原先被隱含的聯(lián)系
出國旅游愿望年齡小于45歲45歲或以上有否50%50%50%50%列總計100%100%被調(diào)查人數(shù)500500
年齡與出國旅游愿望的關系34出國旅游愿望性別男性女性年齡年齡<45≥45<45≥45有否60%40%40%60%35%65%65%35%列總計100%100%100%100%被調(diào)查人數(shù)300300200200
年齡、性別與出國旅游愿望的關系35經(jīng)常外出吃快餐家庭規(guī)模小大是否65%35%65%35%列總計100%100%被調(diào)查人數(shù)500500
家庭規(guī)模與經(jīng)常外出吃快餐的關系(三)三變量交叉列表分析方法4、不改變原先反映出的聯(lián)系
36經(jīng)常外出吃快餐收入水平低收入高收入家庭規(guī)模家庭規(guī)模小大小大是否65%35%65%35%65%35%65%35%列總計100%100%100%100%被調(diào)查人數(shù)250250250250
家庭規(guī)模、收入與經(jīng)常外出吃快餐的關系37SPSS演示38SPSS演示39SPSS演示40SPSS演示41SPSS演示42SPSS演示43SPSS演示44SPSS演示45指總體中各單位的次數(shù)分布從兩邊向中間集中的趨勢,用平均指標來反映。集中趨勢可以反映現(xiàn)象總體的客觀規(guī)律性反映總體各單位變量分布的集中趨勢可以對比同類現(xiàn)象在不同的時間、地點和條件下的一般水平可以分析現(xiàn)象之間的依存關系計算平均指標的作用指同質(zhì)總體中各單位某一數(shù)量標志的一般水平,是對總體單位間數(shù)量差異的抽象化46平均指標的種類平均數(shù)、眾數(shù)和中位數(shù)。平均數(shù)是根據(jù)總體所有標志值計算的,稱為數(shù)值平均數(shù),眾數(shù)和中位數(shù)是根據(jù)標志值所處的位置確定的,稱為位置平均數(shù)47將總體各單位標志值按大小順序排列后,指處于數(shù)列中間位置的標志值,用表示中位數(shù)(Median)不受極端數(shù)值的影響,在總體標志值差異很大時,具有較強的代表性。中位數(shù)的作用:48
如果統(tǒng)計資料中含有異常的或極端的數(shù)據(jù),就有可能得到非典型的甚至可能產(chǎn)生誤導的平均數(shù),這時使用中位數(shù)來度量集中趨勢比較合適。比如有5筆月手機消費:
30元,35元,40元,40元,155元平均手機消費為300/5=60元。很明顯,這并不是一個好的代表值,而中位數(shù)40元是一個更好的代表值。49中位數(shù)的位次為:即第3個單位的標志值就是中位數(shù)【例】某售貨小組5個人,某天的銷售額按從小到大的順序排列為440元、480元、520元、600元、750元,則中位數(shù)的確定----奇數(shù)50中位數(shù)的位次為:中位數(shù)應為第3和第4個單位標志值的算術(shù)平均數(shù),即【例】若上述售貨小組為6個人,某天的銷售額按從小到大的順序排列為440元、480元、520元、600元、750元、760元,則中位數(shù)的確定---偶數(shù)51指總體中出現(xiàn)次數(shù)最多的變量值,用表示,它不受極端數(shù)值的影響,用來說明總體中大多數(shù)單位所達到的一般水平。眾數(shù)(Mode)52有時眾數(shù)是一個合適的代表值
比如在服裝行業(yè)中,生產(chǎn)商、批發(fā)商和零售商在做有關生產(chǎn)或存貨的決策時,更感興趣的是最普遍的尺寸而不是平均尺寸。
53月均食堂消費(元)學生人數(shù)(人)100-500500-10001000-15001500-20002000元以上70100380150100合計800【例】已知某高校學生的的月均食堂消費資料:眾數(shù)的確定54指總體中各單位標志值背離分布中心的規(guī)?;虺潭?,用標志變異指標來反映。離中趨勢反映統(tǒng)計數(shù)據(jù)差異程度的綜合指標,也稱為標志變動度變異指標值越大,平均指標的代表性越??;反之,平均指標的代表性越大555657585960測定標志變異度的絕對量指標測定標志變異度的相對量指標全距標準差全距系數(shù)標準差系數(shù)標志變異指標的種類61指所研究的數(shù)據(jù)中,最大值與最小值之差,又稱極差。全距【例】某售貨小組5人某天的銷售額分別為440元、480元、520元、600元、750元,則62優(yōu)點:計算方法簡單、易懂;缺點:易受極端數(shù)值的影響,不能全面反映所有標志值差異大小及分布狀況,準確程度差
全距的特點63是各個數(shù)據(jù)與其算術(shù)平均數(shù)的離差平方的算術(shù)平均數(shù)的開平方根,用來表示;標準差的平方又叫作方差,用來表示。標準差計算公式:總體單位總數(shù)第個單位的變量值總體算術(shù)平均數(shù)64【例】某售貨小組5個人,某天的銷售額分別為440元、480元、520元、600元、750元,求該售貨小組銷售額的標準差。解:即該售貨小組銷售額的標準差為109.62元。65標準差的特點不易受極端數(shù)值的影響,能綜合反映全部單位標志值的實際差異程度;用平方的方法消除各標志值與算術(shù)平均數(shù)離差的正負值問題,可方便地用于數(shù)學處理和統(tǒng)計分析運算.66標準差系數(shù)變異系數(shù)指標用來對比不同水平的同類現(xiàn)象,特別是不同類現(xiàn)象總體平均數(shù)代表性的大小:——標準差系數(shù)小的總體,其平均數(shù)的代表性大;反之,亦然。應用:67§7.3統(tǒng)計圖表一、統(tǒng)計圖二、統(tǒng)計表★68統(tǒng)計圖以點、線條、面積等方法描述、顯示統(tǒng)計數(shù)據(jù)的形式組成:坐標系圖形圖例作用:可以揭示現(xiàn)象的內(nèi)部結(jié)構(gòu)和依存關系,顯示現(xiàn)象的發(fā)展趨勢和分布狀況,有利于統(tǒng)計分析與研究。形象、生動、具體、直觀69常用統(tǒng)計圖條形圖(Bar)用于顯示離散型變量的次數(shù)分布70條形圖(Bar)用于顯示離散型變量的次數(shù)分布71圓形圖(餅圖
Pie
)主要用于顯示定類變量的次數(shù)分布727374趨勢圖主要用來探索兩個數(shù)值變量之間的關系。通常用于顯示時間序列75散點圖(Scatter)主要用來觀察變量間的相關關系,也可顯示數(shù)量隨時間的變化情況7620%40%60%80%100%
知名度滿意度
雅虎網(wǎng)易新浪搜狐77雷達圖主要用來顯示多個變量78§7.3統(tǒng)計圖表一、統(tǒng)計圖二、統(tǒng)計表★79具有容量大、方便計算等特點統(tǒng)計表的常用結(jié)構(gòu):統(tǒng)計表以縱橫交叉的線條所形成的表格來表現(xiàn)統(tǒng)計資料的形式總標題賓詞欄主詞欄數(shù)據(jù)欄80
可以從兩個角度考察:1.從形式上,統(tǒng)計表由
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 初級統(tǒng)計師統(tǒng)計專業(yè)知識2025年統(tǒng)計調(diào)查項目管理與執(zhí)行試題
- 教聯(lián)體助力鄉(xiāng)村教育振興的路徑探析
- 基于大數(shù)據(jù)的健美操發(fā)展趨勢分析
- 2025私營企業(yè)雇主與員工勞動合同
- 應急救護培訓在特殊學生群體中的實施效果
- 《幼兒歌曲彈唱》課件-第四單元
- 農(nóng)村數(shù)字化轉(zhuǎn)型對資源盤活的促進作用
- 研究生涯探秘
- 黑色素瘤診療指南2022年版
- 高一英語學習指南
- 2024年生物制造產(chǎn)業(yè)藍皮書-華谷研究院
- 9 天上有顆南仁東星 課件-課堂無憂新課標同步核心素養(yǎng)課堂
- 車輛日常安全檢查課件
- 新型傳感技術(shù)及應用 課件 第五部分:典型傳感器-諧振式傳感器
- 2025-2030全球美容機構(gòu)行業(yè)消費需求與未來經(jīng)營規(guī)模預測研究報告
- 廣西《淡水水產(chǎn)養(yǎng)殖尾水排放標準》編制說明
- 認知能力評估體系-全面剖析
- 診所應急知識培訓課件
- 姬石鎮(zhèn)衛(wèi)生院三合理一規(guī)范專項實施方案
- 針灸理療科績效工資二次考核分配方案
- 2024年1月國家開放大學漢語言文學本科《中國當代文學專題》期末紙質(zhì)考試試題及答案
評論
0/150
提交評論