統(tǒng)計與統(tǒng)計學(xué) 統(tǒng)計學(xué)的產(chǎn)生與發(fā)展課件_第1頁
統(tǒng)計與統(tǒng)計學(xué) 統(tǒng)計學(xué)的產(chǎn)生與發(fā)展課件_第2頁
統(tǒng)計與統(tǒng)計學(xué) 統(tǒng)計學(xué)的產(chǎn)生與發(fā)展課件_第3頁
統(tǒng)計與統(tǒng)計學(xué) 統(tǒng)計學(xué)的產(chǎn)生與發(fā)展課件_第4頁
統(tǒng)計與統(tǒng)計學(xué) 統(tǒng)計學(xué)的產(chǎn)生與發(fā)展課件_第5頁
已閱讀5頁,還剩468頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第一章 緒論第一節(jié) 統(tǒng)計與統(tǒng)計學(xué)第二節(jié) 統(tǒng)計學(xué)的分科第三節(jié) 統(tǒng)計學(xué)與其他學(xué)科的關(guān)系*第四節(jié) 統(tǒng)計學(xué)的產(chǎn)生與發(fā)展學(xué)習(xí)目標1. 理解統(tǒng)計與統(tǒng)計學(xué)的含義2.理解統(tǒng)計數(shù)據(jù)與統(tǒng)計學(xué)的關(guān)系3.區(qū)分描述統(tǒng)計與推斷統(tǒng)計4.了解統(tǒng)計學(xué)與其他學(xué)科的關(guān)系*5. 了解統(tǒng)計學(xué)的產(chǎn)生與發(fā)展過程 第一節(jié) 統(tǒng)計與統(tǒng)計學(xué)統(tǒng)計與統(tǒng)計學(xué)的含義統(tǒng)計數(shù)據(jù)的規(guī)律與統(tǒng)計方法一. 統(tǒng)計與統(tǒng)計學(xué)的含義1.什么是統(tǒng)計2.什么是統(tǒng)計學(xué)3.統(tǒng)計學(xué)英文定義2.什么是統(tǒng)計學(xué)?數(shù)據(jù)搜集:例如,調(diào)查與試驗數(shù)據(jù)整理:例如,分組 數(shù)據(jù)展示:例如, 圖和表數(shù)據(jù)分析:例如,回歸分析 統(tǒng)計學(xué)是一門收集、整理和分析數(shù)據(jù)的方法科學(xué),其目的是探索數(shù)據(jù)的內(nèi)在數(shù)量規(guī)律性,以達

2、到對客觀事物的科學(xué)認識。具體包括以下幾個方面:三、統(tǒng)計學(xué)的應(yīng)用領(lǐng)域統(tǒng)計學(xué)經(jīng)濟學(xué)管理學(xué)醫(yī)學(xué)工程學(xué)社會學(xué)一、統(tǒng)計學(xué)的分科框架描述統(tǒng)計推斷統(tǒng)計統(tǒng)計學(xué)的分科理論統(tǒng)計應(yīng)用統(tǒng)計二. 描述統(tǒng)計學(xué)和推斷統(tǒng)計學(xué)統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計參數(shù)估計假設(shè)檢驗1.描述統(tǒng)計(1)內(nèi)容搜集數(shù)據(jù)整理數(shù)據(jù)展示數(shù)據(jù)(2) 目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律02550Q1Q2Q3Q4¥x = 30 s2 = 1052.推斷統(tǒng)計(1)內(nèi)容參數(shù)估計假設(shè)檢驗(2)目的對總體特征作出推斷樣本總體3.描述統(tǒng)計與推斷統(tǒng)計的關(guān)系反映客觀現(xiàn)象的數(shù)據(jù)總體內(nèi)在的數(shù)量規(guī)律性推斷統(tǒng)計(利用樣本信息和概率論對總體的數(shù)量特征進行估計和檢驗等)概率論(包括分布理

3、論、大數(shù)定律和中心極限定理等)描述統(tǒng)計(統(tǒng)計數(shù)據(jù)的搜集、整理、顯示和分析等)總體數(shù)據(jù)樣本數(shù)據(jù)統(tǒng)計學(xué)探索現(xiàn)象數(shù)量規(guī)律性的過程三、理論統(tǒng)計與應(yīng)用統(tǒng)計理論統(tǒng)計研究統(tǒng)計學(xué)的一般理論研究統(tǒng)計方法的數(shù)學(xué)原理應(yīng)用統(tǒng)計研究統(tǒng)計學(xué)在各領(lǐng)域的具體應(yīng)用一、統(tǒng)計學(xué)與數(shù)學(xué)的關(guān)系1.聯(lián)系(1)統(tǒng)計學(xué)運用到大量的數(shù)學(xué)知識(2)數(shù)學(xué)為統(tǒng)計理論和統(tǒng)計方法的發(fā)展提供基礎(chǔ)(3)不能將統(tǒng)計學(xué)等同于數(shù)學(xué)2.區(qū)別(1)數(shù)學(xué)研究的是抽象的數(shù)量規(guī)律,統(tǒng)計學(xué)則是研究具體的、實際現(xiàn)象的數(shù)量規(guī)律(2)數(shù)學(xué)研究的是沒有量綱或單位的抽象的數(shù),統(tǒng)計學(xué)研究的是有具體實物或計量單位的數(shù)據(jù)(3)統(tǒng)計學(xué)與數(shù)學(xué)研究中所使用的邏輯方法不同數(shù)學(xué)研究所使用的主要是的演

4、繹統(tǒng)計學(xué)則是演繹與歸納相結(jié)合,占主導(dǎo)地位的是歸納*第四節(jié) 統(tǒng)計學(xué)的產(chǎn)生與發(fā)展政治算術(shù)社會經(jīng)濟統(tǒng)計概率論數(shù)理統(tǒng)計一、統(tǒng)計學(xué)家介紹1.統(tǒng)計學(xué)家是科學(xué)家二、統(tǒng)計學(xué)發(fā)展的歷史線索1. 一般認為,統(tǒng)計學(xué)產(chǎn)生于17世紀中葉2. 統(tǒng)計學(xué)的發(fā)展過程基本上沿著兩條主線展開以“政治算術(shù)學(xué)派”為開端形成和發(fā)展起來的、以社會經(jīng)濟問題為主要研究對象的社會經(jīng)濟統(tǒng)計以概率論的研究為開端、并以概率論為基礎(chǔ)形成和發(fā)展起來的、以方法和應(yīng)用研究為主的數(shù)理統(tǒng)計3. 今天,社會經(jīng)濟統(tǒng)計和數(shù)理統(tǒng)計仍然在以各自不同的方式發(fā)展著三、政治算術(shù)社會經(jīng)濟統(tǒng)計1. 政治算術(shù)學(xué)派產(chǎn)生于17世紀中葉的英國,代表人物主要是威廉配第(William Pat

5、ty,16231687)和約翰格朗特(John Graunt,16201674)2. 17世紀中葉的政治算術(shù)學(xué)派可看作是統(tǒng)計學(xué)的開端3. 19世紀,沿著約翰格朗特所開創(chuàng)的人口統(tǒng)計以及沿著威廉配第所開創(chuàng)的經(jīng)濟統(tǒng)計有了進一步的發(fā)展4. 威廉配第為以后經(jīng)濟統(tǒng)計的發(fā)展開拓了道路;約翰格朗特為人口統(tǒng)計的發(fā)展開拓了道路5. 政治算術(shù)學(xué)派則為后來的社會經(jīng)濟統(tǒng)計的發(fā)展奠定了基礎(chǔ)四、概率論數(shù)理統(tǒng)計1. 概率淪研究起源于意大利文藝復(fù)興時代2. 概率論的真正歷史是從17世紀中葉開始的3. 古典統(tǒng)計時期的概率論基本上是獨立發(fā)展的,它與統(tǒng)計學(xué)(主要是指政治算術(shù))沒有太多的聯(lián)系4. 從19世紀中葉到20世紀中葉,概率論的

6、進一步發(fā)展為數(shù)理統(tǒng)計學(xué)的形成和發(fā)展奠定了基礎(chǔ) 5. 本世紀50年代以后,統(tǒng)計理論、方法和應(yīng)用進入了一個全面發(fā)展的階段第五節(jié) 統(tǒng)計學(xué)中的幾個主要術(shù)語總體(Population)樣本(Sample)參數(shù)(Parameter)統(tǒng)計量(Statistic)二、樣本1. 樣本:總體的一部分2. 樣本的特性3. 樣本的作用三、參數(shù)1. 參數(shù):總體的數(shù)字特征表述2. 參數(shù)的特性3. 參數(shù)的作用第六節(jié) 幾種常用的統(tǒng)計軟件 (Software)典型的統(tǒng)計軟件SASSPSSMINITABSTATISTICAExcelMINITABSTATISTICAExcelSASSPSS第二章 統(tǒng)計數(shù)據(jù)的搜集第一節(jié) 數(shù)據(jù)的計量

7、與類型 第二節(jié) 統(tǒng)計數(shù)據(jù)的搜集第三節(jié) 統(tǒng)計數(shù)據(jù)的整理第四節(jié) 統(tǒng)計圖與統(tǒng)計表第一節(jié) 數(shù)據(jù)的計量與類型數(shù)據(jù)的計量尺度數(shù)據(jù)的類型和分析方法變量及其類型統(tǒng)計指標及其類型一、數(shù)據(jù)的計量尺度四種計量尺度四種計量尺度的比較(一)四種計量尺度數(shù)據(jù)的計量尺度定類尺度定序尺度定距尺度定比尺度1.定類尺度(1)計量層次最低(2)對事物進行平行的分類(3)各類別可以指定數(shù)字代碼表示(4)使用時必須符合類別窮盡和互斥的要求(5)數(shù)據(jù)表現(xiàn)為“類別”(6)具有=或的數(shù)學(xué)特性2.定序尺度(1)對事物分類的同時給出各類別的順序(2)比定類尺度精確(3)未測量出類別之間的準確差值(4)數(shù)據(jù)表現(xiàn)為“類別”,但有序(5)具有或的數(shù)學(xué)

8、特性3.定距尺度(1)對事物的準確測度(2)比定序尺度精確(3)數(shù)據(jù)表現(xiàn)為“數(shù)值”(4)沒有絕對零點(5)具有 + 或 - 的數(shù)學(xué)特性4.定比尺度(1)對事物的準確測度(2)與定距尺度處于同一層次(3)數(shù)據(jù)表現(xiàn)為“數(shù)值”(4)有絕對零點(5)具有 或 的數(shù)學(xué)特性(二)四種計量尺度的比較計量尺度數(shù)學(xué)特性“”表示該尺度所具有的特性二、數(shù)據(jù)類型與統(tǒng)計方法數(shù)據(jù)類型與統(tǒng)計方法定類數(shù)據(jù)定序數(shù)據(jù)品質(zhì)數(shù)據(jù)數(shù)量數(shù)據(jù)定距數(shù)據(jù)定比數(shù)據(jù)參數(shù)方法非參數(shù)方法三、變量及其類型變 量定序變量離散變量連續(xù)變量定類變量數(shù)字變量四、統(tǒng)計指標及其類型時期指標時點指標統(tǒng)計指標相對指標總量指標平均指標比例比率第二節(jié) 統(tǒng)計數(shù)據(jù)的搜集統(tǒng)計數(shù)

9、據(jù)的直接來源統(tǒng)計數(shù)據(jù)的間接來源一、統(tǒng)計數(shù)據(jù)的直接來源統(tǒng)計數(shù)據(jù)調(diào)查的方式統(tǒng)計數(shù)據(jù)調(diào)查的方法(搜集方法)(一)統(tǒng)計調(diào)查方式統(tǒng)計調(diào)查方式普查抽樣調(diào)查統(tǒng)計報表重點調(diào)查典型調(diào)查1.普查(1)為特定目的專門組織的非經(jīng)常性全面調(diào)查(2)通常是一次性或周期性的(3)一般需要規(guī)定統(tǒng)一的標準調(diào)查時間(4)數(shù)據(jù)的規(guī)范化程度較高(5)應(yīng)用范圍比較狹窄總體2.抽樣調(diào)查(1)從總體中隨機抽取一部分單位(樣本)進行調(diào)查總體隨機樣本(4)具有經(jīng)濟性、時效性強、適應(yīng)面廣、準確性高等特點(2)目的是推斷總體的未知數(shù)字特征(3)最常用的調(diào)查方式3.統(tǒng)計報表(1)統(tǒng)計調(diào)查方式之一(2)過去曾經(jīng)是我國主要的數(shù)據(jù)收集方式(3)按照國家有

10、關(guān)法規(guī)的規(guī)定、自上而下地統(tǒng)一布置、自下而上地逐級提供基本統(tǒng)計數(shù)據(jù)(4)有各種各樣的類型4.重點調(diào)查和典型調(diào)查 (2)典型調(diào)查從調(diào)查對象的全部單位中選擇少數(shù)典型單位進行調(diào)查目的是描述和揭示事物的本質(zhì)特征和規(guī)律調(diào)查結(jié)果不能用于推斷總體(1)重點調(diào)查從調(diào)查對象的全部單位中選擇少數(shù)重點單位進行調(diào)查調(diào)查結(jié)果不能用于推斷總體(二)數(shù)據(jù)的搜集方法數(shù)據(jù)的搜集方法詢問調(diào)查訪問調(diào)查觀察實驗電話調(diào)查郵寄調(diào)查觀察電腦輔助座談會個別深訪實驗1.訪問調(diào)查(1)調(diào)查者與被調(diào)查者通過面對面地交談而獲得資料(2)有標準式訪問和非標準式訪問標準式訪問通常按事先設(shè)計好的問卷進行非標準式訪問事先一般不制作問卷對不起,打擾了!2.郵寄

11、調(diào)查(1)也稱郵寄問卷調(diào)查(2)是一種標準化調(diào)查(3)調(diào)查者與被調(diào)查者沒有直接的語言交流,信息的傳遞依賴于問卷(4)通過某種方式將調(diào)查表或問卷送至某調(diào)查者手中,由被調(diào)查者填寫,然后將問卷寄回指定收集點(5)問卷或表格的發(fā)放方式有郵寄、宣傳媒介傳送、專門場所分發(fā)三種3.電話調(diào)查(1)調(diào)查者利用電話與被調(diào)查者進行語言交流以獲得信息(2)時效快、成本低(3)問題的數(shù)量不宜過多 您好!我是調(diào)查公司的調(diào)查員4.電腦輔助調(diào)查(1)又稱電腦輔助電話調(diào)查(2)電腦與電話相結(jié)合完成調(diào)查的全過程(3)一般需借助專門的軟件進行(4)硬件設(shè)備要求較高5.座談會(1)也稱集體訪談(2)將一組被調(diào)查者集中在調(diào)查現(xiàn)場,讓他

12、們對調(diào)查的主題發(fā)表意見以獲得資料(3)參加座談會的人數(shù)不宜過多,一般為610人(4)側(cè)重于定性研究6.個別深度訪問(1)一次只有一名受訪者參加、針對特殊問題的調(diào)查(2)適合于較隱秘的問題,如個人隱私問題;或較敏感的問題,如政治方面的問題(3)側(cè)重于定性研究7.觀察法(1)就調(diào)查對象的行動和意識,調(diào)查人員邊觀察邊記錄以收集所需信息(2)調(diào)查人員不是強行介入(3)能夠在被調(diào)查者不察覺的情況下獲得資料8.實驗法(1)在設(shè)定的特殊實驗場所、特殊狀態(tài)下,對調(diào)查對象進行實驗以獲得所需資料(2)有室內(nèi)實驗法和市場實驗法二、統(tǒng)計數(shù)據(jù)的間接來源1. 公開出版物: 中國統(tǒng)計年鑒、中國統(tǒng)計摘要、中國社會統(tǒng)計年鑒、中

13、國工業(yè)經(jīng)濟統(tǒng)計年鑒、中國農(nóng)村統(tǒng)計年鑒、中國人口統(tǒng)計年鑒、中國市場統(tǒng)計年鑒、世界經(jīng)濟年鑒、國外經(jīng)濟統(tǒng)計資料、世界發(fā)展報告Internet 2. 網(wǎng)絡(luò)中國統(tǒng)計年鑒2001中國人口統(tǒng)計年鑒中國市場統(tǒng)計年鑒世界發(fā)展報告世界經(jīng)濟年檢工業(yè)普查數(shù)據(jù)中國統(tǒng)計出版社三、調(diào)查方案設(shè)計確定調(diào)查目的確定調(diào)查對象和調(diào)查單位設(shè)計調(diào)查項目和調(diào)查表方案設(shè)計中的其他內(nèi)容調(diào)查方案設(shè)計的框架調(diào)查方案的內(nèi)容調(diào)查目的調(diào)查對象調(diào)查單位調(diào)查項目和調(diào)查表其他1.調(diào)查目的(1)調(diào)查要達到的具體目標(2)回答“為什么調(diào)查?”(3)調(diào)查之前必須明確2.調(diào)查對象和調(diào)查單位(1)調(diào)查對象:調(diào)查研究的總體或調(diào)查范圍(2)調(diào)查單位:需要對之進行調(diào)查的單位

14、。可以是調(diào)查對象的全部單位(全面調(diào)查),也可以是調(diào)查對象中的一部分單位(非全面調(diào)查)(3)回答“向誰調(diào)查?”調(diào)查對象調(diào)查單位?3.調(diào)查項目和調(diào)查表(1)調(diào)查項目:調(diào)查的具體內(nèi)容(2)調(diào)查表:表現(xiàn)調(diào)查項目的表格或問卷(3)回答“調(diào)查什么?”Q1 Q2 Q3 Q4 4.方案設(shè)計中的其他問題(1)明確調(diào)查所采用的方法(2)確定調(diào)查資料的所屬時間和調(diào)查工作的期限(3)調(diào)查的組織與實施細則*四、統(tǒng)計數(shù)據(jù)的質(zhì)量統(tǒng)計數(shù)據(jù)的誤差統(tǒng)計數(shù)據(jù)的質(zhì)量要求誤差來源登記性誤差1.數(shù)據(jù)誤差的來源代表性誤差2.統(tǒng)計數(shù)據(jù)的誤差(1)統(tǒng)計數(shù)據(jù)與客觀現(xiàn)實之間的差距(2)有登記性誤差和代表性誤差兩類 登記性誤差:由于調(diào)查者或被調(diào)查者

15、的人為因素所造成的誤差,理論上講可以消除。 代表性誤差:用樣本數(shù)據(jù)進行推斷時所產(chǎn)生的誤差。通常無法消除,但事先可以進行控制和計算。3.統(tǒng)計數(shù)據(jù)的質(zhì)量要求精 度:最低的抽樣誤差或隨機誤差準 確 性:最小的非抽樣誤差或偏差關(guān) 聯(lián) 性:滿足用戶決策、管理和研究的需要及 時 性:在最短的時間里取得并公布數(shù)據(jù)一 致 性:保持時間序列的可比性最低成本:以最經(jīng)濟的方式取得數(shù)據(jù)第三節(jié) 統(tǒng)計數(shù)據(jù)的整理數(shù)據(jù)的預(yù)處理品質(zhì)數(shù)據(jù)的整理與顯示數(shù)值型數(shù)據(jù)的整理與顯示一、數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理概述數(shù)據(jù)的審核數(shù)據(jù)的篩選數(shù)據(jù)的排序(一)概述:數(shù)據(jù)的審核、篩選與排序數(shù)據(jù)的審核發(fā)現(xiàn)數(shù)據(jù)中的錯誤數(shù)據(jù)的篩選找出符合條件的數(shù)據(jù)數(shù)據(jù)排序發(fā)

16、現(xiàn)數(shù)據(jù)的基本特征升序和降序(二)數(shù)據(jù)的審核原始數(shù)據(jù)審核的內(nèi)容原始數(shù)據(jù)審核的方法二手數(shù)據(jù)的審核1.原始數(shù)據(jù)的審核內(nèi)容(1)完整性審核檢查應(yīng)調(diào)查的單位或個體是否有遺漏所有的調(diào)查項目或指標是否填寫齊全(2) 準確性審核檢查數(shù)據(jù)是否真實反映客觀實際情況,內(nèi)容是否符合實際檢查數(shù)據(jù)是否有錯誤,計算是否正確等2.原始數(shù)據(jù)的審核方法(1)邏輯檢查從定性角度,審核數(shù)據(jù)是否符合邏輯,內(nèi)容是否合理,各項目或數(shù)字之間有無相互矛盾的現(xiàn)象主要用于對定類數(shù)據(jù)和定序數(shù)據(jù)的審核(2)計算檢查檢查調(diào)查表中的各項數(shù)據(jù)在計算結(jié)果和計算方法上有無錯誤主要用于對定距和定比數(shù)據(jù)的審核3.二手數(shù)據(jù)的審核(1)適用性審核弄清楚數(shù)據(jù)的來源、數(shù)據(jù)

17、的口徑以及有關(guān)的背景材料確定這些數(shù)據(jù)是否符合自己分析研究的需要(2)時效性審核應(yīng)盡可能使用最新的統(tǒng)計數(shù)據(jù)(3)確認是否必要做進一步的加工整理(三)數(shù)據(jù)的篩選對審核過程中發(fā)現(xiàn)的錯誤應(yīng)盡可能予以糾正當(dāng)發(fā)現(xiàn)數(shù)據(jù)中的錯誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無法彌補時,需要對數(shù)據(jù)進行篩選數(shù)據(jù)篩選的內(nèi)容包括:將某些不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù)予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來,而不符合特定條件的數(shù)據(jù)予以剔出(四)數(shù)據(jù)的排序(1)內(nèi)容按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索排序有助于對數(shù)據(jù)檢查糾錯,以及為重新歸類或分組等提供依據(jù)在某些場合,排序本身就是分析的

18、目的之一排序可借助于計算機完成(四)數(shù)據(jù)的排序(2)方法定類數(shù)據(jù)的排序字母型數(shù)據(jù),排序有升序降序之分,但習(xí)慣上用升序漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分2. 定距和定比數(shù)據(jù)的排序遞增排序:設(shè)一組數(shù)據(jù)為X1,X2,XN,遞增排序后可表示為:X(1)X(2)X(2)X(N)二、品質(zhì)數(shù)據(jù)的整理與顯示定類數(shù)據(jù)的整理與顯示定序數(shù)據(jù)的整理與顯示(一)數(shù)據(jù)整理的基本問題要弄清所面對的數(shù)據(jù)類型,因為不同類型的數(shù)據(jù),所采取的處理方式和方法是不同的對定類數(shù)據(jù)和定序數(shù)據(jù)主要是做分類整理對定距數(shù)據(jù)和定比數(shù)據(jù)則主要是做分組整理適合于低層次數(shù)據(jù)的整理和顯示方法也適合于高層

19、次的數(shù)據(jù);但適合于高層次數(shù)據(jù)的整理和顯示方法并不適合于低層次的數(shù)據(jù)(二)定類數(shù)據(jù)的整理基本過程可計算指標頻率分布表(二)定類數(shù)據(jù)的整理(1)基本過程1. 列出各類別2. 計算各類別的頻數(shù)3. 制作頻數(shù)分布表4. 用圖形顯示數(shù)據(jù)(二)定類數(shù)據(jù)的整理 (2)可計算的指標1. 頻 數(shù):落在各類別中的數(shù)據(jù)個數(shù)2. 比 例:某一類別數(shù)據(jù)占全部數(shù)據(jù)的比值3. 百分比:將對比的基數(shù)作為100而計算的比值4. 比 率:不同類別數(shù)值的比值(二)定類數(shù)據(jù)整理(3)頻數(shù)分布表(實例)【例1】為研究廣告市場的狀況,一家廣告公司在某城市隨機抽取200人就廣告問題做了郵寄問卷調(diào)查,其中的一個問題是“您比較關(guān)心下列哪一類廣

20、告?” 1商品廣告;2服務(wù)廣告;3金融廣告;4房地產(chǎn)廣告;5招生招聘廣告;6其他廣告。(三)定類數(shù)據(jù)的顯示條形圖園形圖環(huán)形圖(三)定類數(shù)據(jù)的圖示(1)條形圖條形圖是用寬度相同的條形的高度或長短來表示數(shù)據(jù)變動的圖形條形圖有單式、復(fù)式等形式在表示定類數(shù)據(jù)的分布時,是用條形圖的高度來表示各類別數(shù)據(jù)的頻數(shù)或頻率繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖(三)定類數(shù)據(jù)條形圖的一個例子(由 Excel 繪制的條形圖)人數(shù)(人)5191610211204080120 商品廣告 服務(wù)廣告 金融廣告 房地產(chǎn)廣告 招生招聘廣告 其他廣告廣告類型 圖1 某城市居民關(guān)注不同類型廣告的人數(shù)分布(

21、三)定類數(shù)據(jù)的圖示(2)圓形圖也稱餅圖,是用圓形及園內(nèi)扇形的面積來表示數(shù)值大小的圖形主要用于表示總體中各組成部分所占的比例,對于研究結(jié)構(gòu)性問題十分有用在繪制圓形圖時,總體中各部分所占的百分比用園內(nèi)的各個扇形面積表示,這些扇形的中心角度,是按各部分百分比占3600的相應(yīng)比例確定的例如,關(guān)注服務(wù)廣告的人數(shù)占總?cè)藬?shù)的百分比為25.5%,那么其扇形的中心角度就應(yīng)為360025.5%91.80,其余類推(三)定類數(shù)據(jù)圓形圖的一個例子(由 Excel 繪制的圓形圖) 其他廣告1.0% 房地產(chǎn)廣告8.0% 商品廣告56.0% 金融廣告4.5% 服務(wù)廣告25.5% 招生招聘廣告5.8%圖2 某城市居民關(guān)注不同

22、類型廣告的人數(shù)構(gòu)成(三)定類數(shù)據(jù)的圖示(3)環(huán)形圖環(huán)形圖中間有一個“空洞”,總體中的每一部分數(shù)據(jù)用環(huán)中的一段表示環(huán)形圖與圓形圖類似,但又有區(qū)別圓形圖只能顯示一個總體各部分所占的比例環(huán)形圖則可以同時繪制多個總體的數(shù)據(jù)系列,每一個總體的數(shù)據(jù)系列為一個環(huán)環(huán)形圖可用于進行比較研究 環(huán)形圖可用于展示定類和定序的數(shù)據(jù)(四)定序數(shù)據(jù)的整理與顯示整理顯示(四)定序數(shù)據(jù)的整理可計算的指標1. 累計頻數(shù):將各類別的頻數(shù)逐級累加2. 累計頻率:將各類別的頻率(百分比)逐級累加注:定類數(shù)據(jù)一般不可以計算累計(四)定序數(shù)據(jù)頻數(shù)分布表(例1 )【例2】在一項城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣調(diào)查300戶,

23、其中的一個問題是:“您對您家庭目前的住房狀況是否滿意? 1非常不滿意;2不滿意;3一般;4滿意;5非常滿意。 (四)定序數(shù)據(jù)頻數(shù)分布表(例2 )(四)定序數(shù)據(jù)的圖示累計頻數(shù)分布圖(由 Excel 繪制的累計頻數(shù)分布圖)243001322252700100200300400 非常不滿意 不滿意 一般 滿意 非常滿意累積戶數(shù)(戶)(a)向下累積27616830300750100200300400 非常不滿意 不滿意 一般 滿意 非常滿意累積戶數(shù)(戶)(b)向上累積圖3 甲城市家庭對住房狀況評價的累積頻數(shù)分布(四)品質(zhì)數(shù)據(jù)的圖示環(huán)形圖(由 Excel 繪制的環(huán)形圖)8%36%31%15%7%33%2

24、6%21%13%10% 非常不滿意 不滿意 一般 滿意 非常滿意 圖4 甲乙兩城市家庭對住房狀況的評價三、數(shù)值型數(shù)據(jù)的整理與顯示數(shù)據(jù)的分組數(shù)值型數(shù)據(jù)的圖示頻數(shù)分布的類型(一)數(shù)值型數(shù)據(jù)整理的步驟確定組數(shù)整理的步驟確定組距計算頻數(shù)編制表格(一)需整理的一個實例117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128

25、 124 115 139 128 124 121【例3】某生產(chǎn)車間50名工人日加工零件數(shù)如下(單位:個)。試采用單變量值對數(shù)據(jù)進行分組。 (二)數(shù)據(jù)分組分組的目的及作用分組的方法單變量分組組距分組(1)分組方法分組方法等距分組異距分組單變量值分組組距分組(2)單變量值分組1. 將一個變量值作為一組2. 適合于離散變量3. 適合于變量值較少的情況(3)單變量值分組的一個實例(4)組距分組將變量值的一個區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況必須遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組 (5)組距分組的步驟確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實際分

26、組時,可以按 Sturges 提出的經(jīng)驗公式來確定組數(shù)K確定各組的組距:組距(Class Width)是一個組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即 組距( 最大值 - 最小值) 組數(shù) 根據(jù)分組整理成頻數(shù)分布表 (6)分組幾個概念1. 下 限:一個組的最小值2. 上 限:一個組的最大值3. 組 距:上限與下限之差4. 組中值:下限與上限之間的中點值下限值+上限值2組中值(7)等距分組表上下組限重疊(8)等距分組表上下組限間斷(9)等距分組表使用開口組(10)等距分組與不等距分組在表現(xiàn)頻數(shù)分布上的差異等距分組各組頻數(shù)的分布不受組距大小的影響可直接根據(jù)絕對頻數(shù)來觀察

27、頻數(shù)分布的特征和規(guī)律不等距分組各組頻數(shù)的分布受組距大小不同的影響各組絕對頻數(shù)的多少不能反映頻數(shù)分布的實際狀況需要用頻數(shù)密度(頻數(shù)密度頻數(shù)/組距)反映頻數(shù)分布的實際狀況(三)數(shù)值型數(shù)據(jù)的圖示用Excel作圖直方圖折線圖莖葉圖箱線圖線圖雷達圖以下圖形均可由計算機繪制!ExcelSTATISTICA1.1直方圖的制作用矩形的寬度和高度來表示頻數(shù)分布的圖形,實際上是用矩形的面積來表示各組的頻數(shù)分布在直角坐標中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個矩形,即直方圖(Histogram)直方圖下的總面積等于11.2直方圖的繪制頻數(shù)(人)15129631051101151201

28、25130135140日加工零件數(shù)(個)直方圖下的面積之和等于1圖5 某車間工人日加工零件數(shù)的直方圖我一眼就看出來了,大多數(shù)人的日加工零件數(shù)在120125之間!1.3直方圖與條形圖的區(qū)別條形圖是用條形的長度(橫置時)表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列2.1折線圖的制作折線圖也稱頻數(shù)多邊形圖(Frequency polygon)是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個

29、終點要與橫軸相交,具體的做法是第一個矩形的頂部中點通過豎邊中點(即該組頻數(shù)一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的1512963105110115120125130135140日加工零件數(shù)(個)頻數(shù)(人)折線圖下的面積與直方圖的面積相等!2.2折線圖的繪制圖6 某車間工人日加工零件數(shù)的折線圖3.1未分組數(shù)據(jù)莖葉圖的制作用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉對于n(20n300)個數(shù)據(jù),莖葉圖最大行數(shù)不超過 L = 10

30、log 10 n 5. 莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可大體上看出一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息樹莖樹葉7880223477788890012222333344466777889013344579910111213數(shù)據(jù)個數(shù)3132410莖葉圖類似橫置的直方圖3.2莖葉圖的一個例子圖7 某車間工人日加工零件數(shù)的莖葉圖3.3擴展的莖葉圖樹莖樹葉10s10.11*11t11f11s11.12*12t12f12s12.13*12t13f13s13.78 802 2 34 57 7 78 8 8 90 0 1

31、2 2 2 2 3 3 3 34 4 4 5 56 6 7 7 78 8 90 13 34 4 579 9樹莖樹葉10*10.11*11.12*12.13*13.7 8 80 2 2 3 45 7 7 7 8 8 8 90 0 1 2 2 2 2 3 3 3 3 4 4 45 5 6 6 7 7 7 8 8 90 1 3 3 4 4 5 7 9 9圖8 圖3.7擴展后的莖葉圖4.1未分組數(shù)據(jù)箱線圖的制作用于顯示未分組的原始數(shù)據(jù)或分組數(shù)據(jù)的分布箱線圖由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成其繪制方法是:首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me 和兩個四分位數(shù)(

32、下四分位數(shù)QL和上四分位數(shù)QU)連接兩個四分(位)數(shù)畫出箱子,再將兩個極值點與箱子相連接 4.2單批數(shù)據(jù)箱線圖中位數(shù)4681012QUQLX最大值X最小值圖9 簡單箱線圖4.3單批數(shù)據(jù)箱線圖實例最小值107最大值139中位數(shù)123下四分位數(shù)117.75上四分位數(shù)128105 110 115 120 125 130 135 140圖10 50名工人日加工零件數(shù)的箱線圖4.4分布的形狀與箱線圖 對稱分布QL中位數(shù) QU左偏分布QL中位數(shù) QU右偏分布QL 中位數(shù) QU圖11 不同分布的箱線圖4.5多批數(shù)據(jù)箱線圖實例【例4】 從某大學(xué)經(jīng)濟管理專業(yè)二年級學(xué)生中隨機抽取11人,對8門主要課程的考試成績進

33、行調(diào)查,所得結(jié)果如表3-8。試繪制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征4.6多批數(shù)據(jù)箱線圖例子課程分數(shù)圖12 8門課程考試成績的箱線圖圖13 11名學(xué)生8門課程考試成績的箱線圖Min-Max25%-75%Median value455565758595105學(xué)生1學(xué)生2學(xué)生3學(xué)生4學(xué)生5學(xué)生6學(xué)生7學(xué)生8學(xué)生9學(xué)生10學(xué)生114.7多批數(shù)據(jù)箱線圖例子學(xué)生成績5.1 時間序列數(shù)據(jù)線圖的制作1. 時間一般繪在橫軸,指標數(shù)據(jù)繪在縱軸2. 圖形的長寬比例要適當(dāng),其長寬比例大致為10:73. 一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開始,以便于比較。數(shù)據(jù)與“0”之間的間距過大時,可以采取折

34、斷的符號將縱軸折斷5.2線圖一個實例【例5】已知19911998年我國城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如表3-11。試繪制線圖¥ 5.3實例的線圖圖形020004000600019911992199319941995199619971998城鎮(zhèn)居民農(nóng)村居民收入 (元) 圖14 城鄉(xiāng)居民家庭人均收入雷達圖(Radar Chart)是顯示多個變量的常用圖示方法在顯示或?qū)Ρ雀髯兞康臄?shù)值總和時十分有用假定各變量的取值具有相同的正負號,總的絕對值與圖形所圍成的區(qū)域成正比可用于研究多個樣本之間的相似程度6.1多變量數(shù)據(jù)雷達圖 設(shè)有n組樣本S1,S2,Sn,每個樣本測得P個變量X1,X2,Xp,要繪制這P個變量的

35、雷達圖,其具體做法是6.2雷達圖的制作 先做一個圓,然后將圓P等分,得到P個點,令這P個點分別對應(yīng)P個變量,在將這P個點與圓心連線,得到P個幅射狀的半徑,這P個半徑分別作為P個變量的坐標軸,每個變量值的大小由半徑上的點到圓心的距離表示 再將同一樣本的值在P個坐標上的點連線。這樣,n個樣本形成的n個多邊形就是一個雷達圖6.3雷達圖的一個實例1【例6】1997年我國城鄉(xiāng)居民家庭平均每人各項生活消費支出數(shù)據(jù)如表3-12。試繪制雷達圖。今天的主食是面包0500100015002000 食品 衣著 家庭設(shè)備用 品及服務(wù) 醫(yī)療保健 交通通訊 娛樂教育 文化服務(wù) 居住 雜項商品 與服務(wù)城鎮(zhèn)居民農(nóng)村居民 圖1

36、5 1997年城鎮(zhèn)居民家庭消費支出 (元)6.4由 Excel 繪制例1的雷達圖6.5多變量數(shù)據(jù)雷達圖例子2【例7】為研究某條河流的污染程度,環(huán)保局分別在上游、中游和下游設(shè)立取樣點,每個取樣點化驗水中的五項污染指標,所得數(shù)據(jù)如表3-13。將各指標用雷達圖表示出來,并分析該河流的主要污染源。 6.6由 Excel 繪制的對數(shù)坐標雷達圖0.11101001000指標1指標2指標3指標4指標5上游中游下游圖16 河流污染指標雷達圖 7.1數(shù)據(jù)類型及圖示總結(jié)數(shù)據(jù)類型與顯示數(shù)值型數(shù)據(jù)品質(zhì)數(shù)據(jù)分組數(shù)據(jù)總計表莖葉圖條形圖圓形圖環(huán)形圖直方圖箱線圖折線圖原始數(shù)據(jù)時序數(shù)據(jù)線圖雷達圖多元數(shù)據(jù)7.2頻數(shù)分布的類型總結(jié)

37、對稱分布右偏分布左偏分布正J型分布反J型分布U型分布圖17 幾種常見的頻數(shù)分布第四節(jié) 統(tǒng)計表統(tǒng)計表的構(gòu)成統(tǒng)計表的設(shè)計一、統(tǒng)計表的結(jié)構(gòu)行標題表頭列標題數(shù)字資料附加要合理安排統(tǒng)計表的結(jié)構(gòu)總標題內(nèi)容應(yīng)滿足3W要求數(shù)據(jù)計量單位相同時,可放在表的右上角標明,不同時應(yīng)放在每個指標后或單列出一列標明表中的上下兩條橫線一般用粗線,其他線用細線通常情況下,統(tǒng)計表的左右兩邊不封口表中的數(shù)據(jù)一般是右對齊,有小數(shù)點時應(yīng)以小數(shù)點對齊,而且小數(shù)點的位數(shù)應(yīng)統(tǒng)一對于沒有數(shù)字的表格單元,一般用“”表示必要時可在表的下方加上注釋二、統(tǒng)計表設(shè)計的一般要求 第三章 數(shù)據(jù)分布特征的描述第一節(jié) 分布集中趨勢的測度 第二節(jié) 分布離散程度的

38、測度第三節(jié) 分布偏態(tài)與峰度的測度第一節(jié) 數(shù)據(jù)分布特征概述一、圖示1.集中趨勢 (位置)2.離中趨勢 (分散程度)3.偏態(tài)和峰度(形狀)二、數(shù)據(jù)分布特征的測度數(shù)據(jù)的特征和測度分布的形狀集中趨勢離散程度眾 數(shù)中位數(shù)均 值離散系數(shù)方差和標準差峰 度四分位差異眾比率偏 態(tài) 第二節(jié) 集中趨勢的測度定類數(shù)據(jù):眾數(shù)定序數(shù)據(jù):中位數(shù)和分位數(shù)定距和定比數(shù)據(jù):均值眾數(shù)、中位數(shù)和均值的比較一、 集中趨勢概述(Central tendency)一組數(shù)據(jù)向其中心值靠攏的傾向和程度測度集中趨勢就是尋找數(shù)據(jù)一般水平的代表值或中心值不同類型的數(shù)據(jù)用不同的集中趨勢測度值低層次數(shù)據(jù)的集中趨勢測度值適用于高層次的測量數(shù)據(jù),反過來,

39、高層次數(shù)據(jù)的集中趨勢測度值并不適用于低層次的測量數(shù)據(jù)選用哪一個測度值來反映數(shù)據(jù)的集中趨勢,要根據(jù)所掌握的數(shù)據(jù)的類型來確定 二、眾數(shù)眾數(shù)的概念眾數(shù)的特性定類數(shù)據(jù)眾數(shù)的計算定序數(shù)據(jù)眾數(shù)的計算數(shù)值型分組數(shù)據(jù)眾數(shù)的計算(一)眾數(shù)的概念1. 集中趨勢的測度值之一2. 出現(xiàn)次數(shù)最多的變量值3. 不受極端值的影響4. 可能沒有眾數(shù)或有幾個眾數(shù)5. 主要用于定類數(shù)據(jù),也可用于定序數(shù)據(jù)和數(shù)值型數(shù)據(jù)(二) 眾數(shù)的特性無眾數(shù)情形原始數(shù)據(jù): 10 5 9 12 6 8單眾數(shù)情形原始數(shù)據(jù): 6 5 9 8 5 5多眾數(shù)情形原始數(shù)據(jù): 25 28 28 36 42 42(三)定類數(shù)據(jù)的眾數(shù)一個例子【例1】根據(jù)下表1中的數(shù)

40、據(jù),計算眾數(shù)解:這里的變量為“廣告類型”,這是個定類變量,不同類型的廣告就是變量值。我們看到,在所調(diào)查的200人當(dāng)中,關(guān)注商品廣告的人數(shù)最多,為112人,占總被調(diào)查人數(shù)的56%,因此眾數(shù)為“商品廣告”這一類別,即 Mo商品廣告(四)定序數(shù)據(jù)的眾數(shù)一個例子【例2】根據(jù)表2中的數(shù)據(jù),計算眾數(shù)解:這里的數(shù)據(jù)為定序數(shù)據(jù)。變量為“回答類別”。甲城市中對住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即 Mo不滿意(五)數(shù)值型分組數(shù)據(jù)的眾數(shù)的計算1. 眾數(shù)的值與相鄰兩組頻數(shù)的分布有關(guān)4. 該公式假定眾數(shù)組的頻數(shù)在眾數(shù)組內(nèi)均勻分布2. 相鄰兩組的頻數(shù)相等時,眾數(shù)組的組中值即為眾數(shù)Mo3.

41、 相鄰兩組的頻數(shù)不相等時,眾數(shù)采用下列近似公式計算MoMo(六)數(shù)值型數(shù)據(jù)眾數(shù)計算的例子【例3】根據(jù)表3中的數(shù)據(jù),計算50名工人日加工零件數(shù)的眾數(shù)三、中位數(shù)中位數(shù)的概念中位數(shù)位置的確定(一)中位數(shù)的概念1. 集中趨勢的測度值之一2. 排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于定序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)各變量值與中位數(shù)的離差絕對值之和最小,即(二)中位數(shù)位置的確定未分組數(shù)據(jù):組距分組數(shù)據(jù):(三)未分組數(shù)據(jù)中位數(shù)計算公式(四)中位數(shù)計算的例子1.定序數(shù)據(jù)【例4】根據(jù)表4中的數(shù)據(jù),計算甲城市家庭對住房滿意狀況評價的中位數(shù)解:中位數(shù)的位置為: 300/2150

42、從累計頻數(shù)看,中位數(shù)的在“一般”這一組別中。因此 Me一般2.未分組數(shù)據(jù)(奇數(shù)個數(shù)據(jù))原始數(shù)據(jù): 24 22 21 26 20排 序: 20 21 22 24 26位 置: 1 2 3 4 5中位數(shù) 223.未分組數(shù)據(jù)(偶數(shù)個數(shù)據(jù))原始數(shù)據(jù): 10 5 9 12 6 8排 序: 5 6 8 9 10 12位 置: 1 2 3 4 5 6位置N+126+123.5中位數(shù)8 + 928.5根據(jù)位置公式確定中位數(shù)所在的組采用下列近似公式計算:3. 該公式假定中位數(shù)組的頻數(shù)在該組內(nèi)均勻分布(五)數(shù)值型分組數(shù)據(jù)中位數(shù)計算公式(六)數(shù)值型分組數(shù)據(jù)中位數(shù)的例子【例5】根據(jù)表5中的數(shù)據(jù),計算50 名工人日加工

43、零件數(shù)的中位數(shù)四、分位數(shù)(一)概念1. 集中趨勢的測度值之一2. 排序后處于25%和75%位置上的值3. 不受極端值的影響4. 主要用于定序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)QLQMQU25%25%25%25%(二)四分位數(shù)位置的確定未分組數(shù)據(jù):組距分組數(shù)據(jù):下四分位數(shù)(QL)位置 =N+14上四分位數(shù)(QU)位置 =3(N+1)4下四分位數(shù)(QL)位置 =N4上四分位數(shù)(QL)位置 =3N4(三)四分位數(shù)的計算1.定序數(shù)據(jù)【例6】根據(jù)表6中的數(shù)據(jù),計算甲城市家庭對住房滿意狀況評價的四分位數(shù)解:下四分位數(shù)(QL)的位置為: QL位置(300)/475 上四分位數(shù)(QL)的位置為: Q

44、U位置(3300)/4225從累計頻數(shù)看, QL在“不滿意”這一組別中; QU在“一般”這一組別中。因此 QL 不滿意 QU 一般2.未分組數(shù)據(jù)(奇數(shù)個數(shù)據(jù))原始數(shù)據(jù): 23 21 30 32 28 25 26排 序: 21 23 25 26 28 30 32位 置: 1 2 3 4 5 6 7 N+1QL= 237+1QL位置 =4=4= 2QU位置 =3(N+1)43(7+1)4 = 6QU = 303.未分組數(shù)據(jù)(偶數(shù)個數(shù)據(jù)) 原始數(shù)據(jù): 23 21 30 28 25 26排 序: 21 23 25 26 28 30位 置: 1 2 3 4 5 6QL= 21+0.75(23-21) =

45、 22. 5QL位置 =N+14=6+14= 1.75QU位置 =3(N+1)43(6+1)4= 5.25QU = 28+0.25(30-28) = 28.54.數(shù)值型分組數(shù)據(jù)的計算公式上四分位數(shù): 下四分位數(shù): 5.數(shù)值型分組數(shù)據(jù)計算示例QL位置50/412.5QU位置350/437.5【例7】根據(jù)表7中的數(shù)據(jù),計算50 名工人日加工零件數(shù)的四分位數(shù)五、均值算術(shù)平均數(shù)均值的概念均值的計算均值的性質(zhì)(一)均值的概念1. 集中趨勢的測度值之一2. 最常用的測度值3. 一組數(shù)據(jù)的均衡點所在4. 易受極端值的影響5. 用于數(shù)值型數(shù)據(jù),不能用于定類數(shù)據(jù)和定序數(shù)據(jù)(二)均值的計算公式設(shè)一組數(shù)據(jù)為:X1

46、,X2 , ,XN 簡單均值的計算公式為設(shè)分組后的數(shù)據(jù)為:X1 ,X2 , ,XK 相應(yīng)的頻數(shù)為: F1 , F2, ,F(xiàn)K加權(quán)均值的計算公式為1.簡單均值的例子原始數(shù)據(jù):105913682.加權(quán)均值的例子【例8】根據(jù)表8中的數(shù)據(jù),計算50 名工人日加工零件數(shù)的均值3.權(quán)數(shù)對均值的影響一個例子 例9甲乙兩組各有10名學(xué)生,他們的考試成績及其分布數(shù)據(jù)如下甲組: 考試成績(X ): 0 20 100 人數(shù)分布(F ):1 1 8乙組: 考試成績(X ): 0 20 100 人數(shù)分布(F ):8 1 1X甲01+201+1008n10i=1Xi 82(分)X乙08+201+1001n10i=1Xi

47、12(分)(三)均值的數(shù)學(xué)性質(zhì)1.各變量值與均值的離差之和等于零 2. 各變量值與均值的離差平方和最小六、調(diào)和平均數(shù)(一)概念及計算公式1. 集中趨勢的測度值之一2. 均值的另一種表現(xiàn)形式3. 易受極端值的影響4. 用于定比數(shù)據(jù)5. 不能用于定類數(shù)據(jù)和定序數(shù)據(jù)6. 計算公式為原來只是計算時使用了不同的數(shù)據(jù)?。ǘ┱{(diào)和平均數(shù)的一個例子【例10】某蔬菜批發(fā)市場三種蔬菜的日成交數(shù)據(jù)如表9,計算三種蔬菜該日的平均批發(fā)價格七、幾何平均數(shù)(一)概念及計算公式1. 集中趨勢的測度值之一2. N 個變量值乘積的 N 次方根3. 適用于特殊的數(shù)據(jù)4. 主要用于計算平均發(fā)展速度5. 計算公式為6. 可看作是均值的

48、一種變形(二)幾何平均數(shù)的一個例子【例11】一位投資者持有一種股票,1996年、1997年、1998年和1999年收益率分別為4.5%、2.0%、3.5%、5.4%。計算該投資者在這四年內(nèi)的平均收益率。平均收益率103.84%-1=3.84%八、眾數(shù)、中位數(shù)和均值的比較(一)關(guān)系對稱分布 均值= 中位數(shù)= 眾數(shù)左偏分布均值 中位數(shù) 眾數(shù)右偏分布眾數(shù) 中位數(shù) 均值(二)眾數(shù)、中位數(shù)和均值的適用場合第三節(jié) 離散程度的測度定類數(shù)據(jù):異眾比率定序數(shù)據(jù):四分位差定距和定比數(shù)據(jù):方差及標準差等相對離散程度:離散系數(shù)一、離中趨勢概述數(shù)據(jù)分布的另一個重要特征離中趨勢的各測度值是對數(shù)據(jù)離散程度所作的描述反映各變

49、量值遠離其中心值的程度,因此也稱為離中趨勢從另一個側(cè)面說明了集中趨勢測度值的代表程度不同類型的數(shù)據(jù)有不同的離散程度測度值二、異眾比率(一)概念及計算公式1. 離散程度的測度值之一2. 非眾數(shù)組的頻數(shù)占總頻數(shù)的比率3. 計算公式為4. 用于衡量眾數(shù)的代表性(二)異眾比率的一個例子【例12】根據(jù)表10中數(shù)據(jù),計算異眾比率解: 在所調(diào)查的200人當(dāng)中,關(guān)注非商品廣告的人數(shù)占44%,異眾比率還是比較大。因此,用“商品廣告”來反映城市居民對廣告關(guān)注的一般趨勢,其代表性不是很好 Vr = 200 - 112200 = 1 - 112 200 = 0.44 = 44%三、四分位差(一)概念及計算公式1. 離

50、散程度的測度值之一2. 也稱為內(nèi)距或四分間距3. 上四分位數(shù)與下四分位數(shù)之差 QD = QU - QL4. 反映了中間50%數(shù)據(jù)的離散程度5. 不受極端值的影響6. 用于衡量中位數(shù)的代表性(二)四分位差的一個例子【例13】根據(jù)表11中的數(shù)據(jù),計算甲城市家庭對住房滿意狀況評價的四分位差解:設(shè)非常不滿意為1,不滿意為2, 一般為3, 滿意為 4, 非常滿意為5 已知 QL = 不滿意 = 2, QU = 一般 = 3四分位差: QD = QU = QL = 3 2 = 1四、極差1. 一組數(shù)據(jù)的最大值與最小值之差2. 離散程度的最簡單測度值3. 易受極端值影響4. 未考慮數(shù)據(jù)的分布78910789

51、10未分組數(shù)據(jù) R = max(Xi) - min(Xi).=組距分組數(shù)據(jù) R 最高組上限 - 最低組下限 5. 計算公式為五、平均差(一)概念及計算公式1. 離散程度的測度值之一2. 各變量值與其均值離差絕對值的平均數(shù)3. 能全面反映一組數(shù)據(jù)的離散程度4. 數(shù)學(xué)性質(zhì)較差,實際中應(yīng)用較少 5. 計算公式為未分組數(shù)據(jù)組距分組數(shù)據(jù)(二)平均差的一個例子【例14】根據(jù)表12中的數(shù)據(jù),計算工人日加工零件數(shù)的平均差六、方差和標準差(一)概念1. 離散程度的測度值之一2. 最常用的測度值3. 反映了數(shù)據(jù)的分布 反映了各變量值與均值的平均差異 根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標準差;根據(jù)樣本數(shù)據(jù)計算的,稱

52、為樣本方差或標準差(樣本方差在第五章中講授)4 6 8 10 12X = 8.3(二)總體方差和標準差的計算公式未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計算公式標準差的計算公式(三)總體標準差計算的一個例子【例15】根據(jù)表13中的數(shù)據(jù),計算工人日加工零件數(shù)的標準差(四)方差數(shù)學(xué)性質(zhì)各變量值對均值的方差小于對任意值的方差,具體表述為:設(shè)X0為不等于X 的任意數(shù),D2為對X0的方差,則(五)標準化值1. 也稱標準分數(shù)2. 給出某一個值在一組數(shù)據(jù)中的相對位置3. 用于對變量的標準化處理4. 計算公式為七、離散系數(shù)(一)概念和計算公式1. 標準差與其相應(yīng)的均值之比2. 消除了數(shù)據(jù)水平

53、高低和計量單位的影響3. 測度了數(shù)據(jù)的相對離散程度4. 用于對不同組別數(shù)據(jù)離散程度的比較5. 計算公式為(二)離散系數(shù)計算的一個例子【例16】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表14。試比較產(chǎn)品銷售額與銷售利潤的離散程度S1=309.19(萬元)X1=536.25(萬元)X2=32.5215(萬元)S2=23.09(萬元)結(jié)論: 計算結(jié)果表明,V1 0為右偏分布4. 偏態(tài)系數(shù) 0為左偏分布5. 計算公式為三、峰度的概念與測度1. 數(shù)據(jù)分布扁平程度的測度2. 峰度系數(shù)=3扁平程度適中3. 峰度系數(shù)3為尖峰分布5. 計算公式為四、偏態(tài)與峰度計算實例【例17】已知1997年我國農(nóng)村居民家

54、庭按純收入分組的有關(guān)數(shù)據(jù)如表15。試計算偏態(tài)與峰度系數(shù)戶數(shù)比重(%)252015105農(nóng)村居民家庭村收入數(shù)據(jù)的直方圖1.從直方圖上觀察偏態(tài)與峰度按純收入分組(元)100050015002000250030003500400045005000結(jié)論:1. 為右偏分布 2. 峰度適中2.偏態(tài)與峰度系數(shù)的計算過程3.偏態(tài)系數(shù)計算結(jié)果根據(jù)數(shù)據(jù)計算得將計算結(jié)果代入偏態(tài)系數(shù)公式,得結(jié)論:偏態(tài)系數(shù)為正值,而且數(shù)值較大,說明農(nóng)村居民家庭純收入的分布為右偏分布,即收入較少的家庭占據(jù)多數(shù),而收入較高的家庭則占少數(shù),而且偏斜的程度較大 4.峰度系數(shù)的計算結(jié)果將計算結(jié)果代入峰度系數(shù)公式, 得 結(jié)論:由于=3.43,說明

55、我國農(nóng)村居民家庭純收入的分布為尖峰分布,說明低收入家庭占有較大的比重 5.由Excel輸出的描述統(tǒng)計量第四章 概率與概率分布第一節(jié) 概率基礎(chǔ)第二節(jié) 隨機變量及其分布第一節(jié) 概率基礎(chǔ)隨機事件及其概率概率的性質(zhì)與運算法則一、隨機事件的幾個基本概念(一)試 驗在相同條件下,對事物或現(xiàn)象所進行的觀察例如:擲一枚骰子,觀察其出現(xiàn)的點數(shù)試驗具有以下特點可以在相同的條件下重復(fù)進行每次試驗的可能結(jié)果可能不止一個,但試驗的所有可能結(jié)果在試驗之前是確切知道的在試驗結(jié)束之前,不能確定該次試驗的確切結(jié)果(二)事件的概念事件:隨機試驗的每一個可能結(jié)果(任何樣本點集合)例如:擲一枚骰子出現(xiàn)的點數(shù)為3隨機事件:每次試驗可能

56、出現(xiàn)也可能不出現(xiàn)的事件例如:擲一枚骰子可能出現(xiàn)的點數(shù)必然事件:每次試驗一定出現(xiàn)的事件,用表示例如:擲一枚骰子出現(xiàn)的點數(shù)小于7不可能事件:每次試驗一定不出現(xiàn)的事件,用表示例如:擲一枚骰子出現(xiàn)的點數(shù)大于6(三)事件與樣本空間基本事件一個不可能再分的隨機事件例如:擲一枚骰子出現(xiàn)的點數(shù)樣本空間一個試驗中所有基本事件的集合,用表示例如:在擲枚骰子的試驗中,1,2,3,4,5,6在投擲硬幣的試驗中,正面,反面(四)事件的關(guān)系和運算1.事件的包含ABB A 若事件A發(fā)生必然導(dǎo)致事件B發(fā)生, 則稱事件B包含事件A,或事件A包含于事件B,記作或 A B或 B A2.事件的并或和 事件A和事件B中至少有一個發(fā)生的

57、事件稱為事件A與事件B 的并。它是由屬于事件A或事件B的所有的樣本點組成的集合,記為AB或A+BBAAB3.事件的交或積ABAB 事件A與事件B同時發(fā)生的事件稱為事件A與事件B的交,它是由屬于事件A也屬于事件B的所有公共樣本點所組成的集合,記為BA 或AB4.互斥事件(不相容事件)ABA 與 B互不相容事件A與事件B中,若有一個發(fā)生,另一個必定不發(fā)生, 則稱事件A與事件B是互斥的,否則稱兩個事件是相容的。顯然,事件A與事件B互斥的充分必要條件是事件A與事件B沒有公共的樣本點5.事件的逆(互補)A A一個事件B與事件A互斥,且它與事件A的并是整個樣本空間,則稱事件B是事件A的逆事件。它是由樣本空

58、間中所有不屬于事件A的樣本點所組成的集合,記為A6.事件的差(減法)A - BAB事件A發(fā)生但事件B不發(fā)生的事件稱為事件A與事件B的差,它是由屬于事件A而不屬于事件B的那些樣本點構(gòu)成的集合,記為A-B 7.事件的性質(zhì) 設(shè)A、B、C為三個事件,則有交換律:AB=BA AB=BA2. 結(jié)合律:A(BC)=(AB)C A(BC) =(AB) C3. 分配律:A(BC)=(AB)(AC) A(BC)=(AB)(AC)二、事件的概率(一)事件概率概述事件A的概率是對事件A在試驗中出現(xiàn)的可能性大小的一種度量表示事件A出現(xiàn)可能性大小的數(shù)值事件A的概率表示為P(A)概率的定義有:古典定義、統(tǒng)計定義和主觀概率定

59、義(二)概率的古典定義如果某一隨機試驗的結(jié)果有限,而且各個結(jié)果在每次試驗中出現(xiàn)的可能性相同,則事件A發(fā)生的概率為該事件所包含的基本事件個數(shù) m 與樣本空間中所包含的基本事件個數(shù) n 的比值,記為(三)概率的統(tǒng)計定義在相同條件下進行n次隨機試驗,事件A出現(xiàn) m 次,則比值 m/n 稱為事件A發(fā)生的頻率。隨著n的增大,該頻率圍繞某一常數(shù)P上下擺動,且波動的幅度逐漸減小,取向于穩(wěn)定,這個頻率的穩(wěn)定值即為事件A的概率,記為1.一個例子例如,投擲一枚硬幣,出現(xiàn)正面和反面的頻率,隨著投擲次數(shù) n 的增大,出現(xiàn)正面和反面的頻率,穩(wěn)定在1/2左右試驗的次數(shù)正面 /試驗次數(shù)1.000.000.250.500.7

60、50255075100125(四)主觀概率定義對一些無法重復(fù)的試驗,確定其結(jié)果的概率只能根據(jù)以往的經(jīng)驗人為確定概率是一個決策者對某事件是否發(fā)生,根據(jù)個人掌握的信息對該事件發(fā)生可能性的判斷三、概率的性質(zhì)與運算法則(一)概率的性質(zhì)(公理)非負性對任意事件A,有 0 P 1規(guī)范性必然事件的概率為1;不可能事件的概率為0。即P ( ) = 1; P ( ) = 0可加性若A與B互斥,則P ( AB ) = P ( A ) + P ( B )推廣到多個兩兩互斥事件A1,A2,An,有 P ( A1A2 An) = P ( A1 ) + P (A2 ) + + P (An )(二)概率的加法法則1.不相容

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論