統(tǒng)計學教學課件_第1頁
統(tǒng)計學教學課件_第2頁
統(tǒng)計學教學課件_第3頁
統(tǒng)計學教學課件_第4頁
統(tǒng)計學教學課件_第5頁
已閱讀5頁,還剩115頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第2章統(tǒng)計數(shù)據的描述統(tǒng)計學第一節(jié)數(shù)據的計量尺度統(tǒng)計數(shù)據是對客觀現(xiàn)象計量的結果。按照對事物計量的精確程度,可將所采用的計量尺度由低級到高級分為四個層次:一、列名尺度二、順序尺度三、間隔尺度四、比率尺度統(tǒng)計學四種計量尺度定類尺度定序尺度定距尺度定比尺度數(shù)據的計量尺度統(tǒng)計學例1:人口的性別(男、女);企業(yè)的所有制性質(國有、集體、私營等)?!裉攸c:

1、定類尺度只測度了事物之間的類別差,而對各類之間的其他差別卻無法從中得知,因此各類地位相同,順序可以任意改變;

2、對定類尺度的計量結果,可以且只能計算每一類別中各元素個體出現(xiàn)的頻數(shù)(frequency)。▼注意:對事物進行分類時,必須符合窮盡(exhaustive)和互斥(mutuallyexclusive)要求。

(一)定類尺度(列名尺度):按照事物的某種屬性對其進行平行的分類或分組。統(tǒng)計學

例2:產品等級(一等品、二等品…)考試成績(優(yōu)、良、中、差)

●特點:

1、不僅可以測度類別差(分類),還可以測度次序差(比較優(yōu)劣或排序);

2、無法測出類別之間的準確差值,因此該尺度的計量結果只能排序,不能進行算術運算。

(二)定序尺度(順序尺度):是對事物之間等級或順序差別的一種測度。統(tǒng)計學

例3:100分制考試成績,分值之間的間隔是相等的;攝氏溫度對不同地區(qū)溫度的測量,每一度的溫差都是相同的。

●特點:1、不僅能將事物區(qū)分為不同類型并進行排序,而且可準確指出類別之間的差距是多少;2、定距尺度通常以自然或物理單位為計量尺度,因此測量結果往往表現(xiàn)為數(shù)值;3、計量結果可以進行加減運算(加減運算有意義);4、“0”是測量尺度上的一個測量點,并不代表“沒有”。

(三)定距尺度(間隔尺度):是對事物類別或次序之間間距的測度。統(tǒng)計學

例4:職工月收入;企業(yè)產值;公制的距離等。

●特點:

1、與定距尺度屬于同一層次,計量結果也表現(xiàn)為數(shù)值;

2、除了具有其他三種計量尺度的全部特點外,還具有可計算兩個測度值之間比值的特點;

3、“0”表示“沒有”,即它有一固定的絕對“零點”,因此它可進行加、減、乘、除運算(而定距尺度只可進行加減運算)。

(四)定比尺度(比率尺度):是能夠測算兩個測度值之間比值的一種計量尺度。統(tǒng)計學▼注意:

定距尺度中的“0”并不表示“沒有”,不是一個絕對的“零點”;而定比尺度中的“0”表示“沒有”,是一個絕對的“零點”。例如,某個學生統(tǒng)計學的考試成績?yōu)椤?”分,這個“0”分是他的統(tǒng)計學的客觀成績,并不表示他沒有考試成績或沒有任何統(tǒng)計學知識;一個地區(qū)的溫度為0°C,這表示一種溫度的水平,并不是說沒有溫度。而定比尺度中絕對零點的“0”,表示“沒有”或“不存在”。例如,一個人的身高為“0”米,表示這個人不存在;一個人的收入為“0”,表示這個人沒有收入;一個產品的產量為“0”,表示沒有這種產品;等等。

統(tǒng)計學

1、高層次的計量尺度可以計量低層次計量尺度能夠計量的事物,但反之不行;

2、可將高層次計量尺度的計量結果轉換為低層次計量尺度的計量結果,但不能反過來。

Exercises:

指出下面變量的測量尺度:學生住址距學校的距離;學生某門課的一次測驗成績(5分制);學生的出生地;按年級分類的高校學生;每周學生學習的小時數(shù)。

四種計量尺度的區(qū)別與聯(lián)系統(tǒng)計學四種計量尺度的比較四種計量尺度的比較定類尺度定序尺度定距尺度定比尺度

分類(=,≠)

排序(<,>)

間距(+,-)

比值(×,÷)

√√√√√√√√√√計量尺度數(shù)學特性“√”表示該尺度所具有的特性統(tǒng)計學第二節(jié)統(tǒng)計數(shù)據的來源

一、間接取得的數(shù)據Internethttp//WWW.中國統(tǒng)計年鑒2001中國人口統(tǒng)計年鑒中國市場統(tǒng)計年鑒世界發(fā)展報告世界經濟年檢工業(yè)普查數(shù)據中國統(tǒng)計出版社

1.統(tǒng)計部門和政府部門公布的有關資料,如各類統(tǒng)計年鑒。

2.各類經濟信息中心、信息咨詢機構、專業(yè)調查機構等提供的數(shù)據。

3.各類專業(yè)期刊、報紙、書籍所提供的資料。

4.各種會議,如博覽會、展銷會、交易會及專業(yè)性、學術性研討會上交流的有關資料。

5.從互聯(lián)網或圖書館查閱到的相關資料。統(tǒng)計學提供統(tǒng)計數(shù)據的部分政府網站中國政府及相關機構

網址數(shù)據內容國家統(tǒng)計局統(tǒng)計年鑒、統(tǒng)計月報等國務院發(fā)展研究中心信息網宏觀經濟、財經、貨幣金融等中國經濟信息網經濟信息及各類網站華通數(shù)據中心國家統(tǒng)計局授權的數(shù)據中心中國決策信息網決策知識及案例三農數(shù)據網三農信息、論壇及相關網站統(tǒng)計學提供統(tǒng)計數(shù)據的部分政府網站美國政府機構

網址數(shù)據內容人口普查局人口和家庭等聯(lián)邦儲備局http://www.bog.frb.fed.us貨幣供應、信譽、匯率等預算編制辦公室/omb財政收入、支出、債券等商務部商業(yè)、工業(yè)等統(tǒng)計學

二、直接取得數(shù)據(一)普查(census)

1.為特定目的專門組織的非經常性全面調查,如人口普查、工業(yè)普查等2.通常是一次性或周期性的3.一般需要規(guī)定統(tǒng)一的標準調查時間4.數(shù)據的規(guī)范化程度較高5.應用范圍比較狹窄,只能調查一些最基本、最一般的現(xiàn)象??傮w統(tǒng)計學(二)抽樣調查

(samplingsurvey)

1. 從總體中隨機抽取一部分單位作為樣本進行調查,并根據樣本調查結果來推斷總體特征的數(shù)據收集方法??傮w

隨機樣本

2.具有經濟性、時效性強、適應面廣、準確性高等特點。統(tǒng)計學(三)重點調查重點調查:是指在調查對象中,只選擇一部分重點單位進行的非全面調查。重點單位:著眼于現(xiàn)象量的方面而言,盡管這些單位在全部單位中只是一部分,但它們在所研究現(xiàn)象的標志總量中卻占有絕大的比重,在總體中具有舉足輕重的作用。統(tǒng)計學(四)典型調查

典型調查是一種專門組織的非全面調查。根據調查的目的,在對所研究的對象進行初步分析的基礎上,有意識地選取若干具有代表性的單位進行調查和研究,借以認識事物發(fā)展變化的規(guī)律。有人也認為它是“目的抽樣”,以若干具有代表性的單位為樣本。▼注意:

重點調查、典型調查與抽樣調查的不同處在于:

1、抽樣調查是隨機抽取調查單位,不存在對調查對象選擇的主觀性,因此可以根據抽樣結果推斷總體的數(shù)量特征;

2、重點調查和典型調查不是隨機取樣,具有一定的主觀性,因此調查結果不能推斷總體。統(tǒng)計學

統(tǒng)計的整個過程就是對數(shù)據的加工過程,從原始數(shù)據的收集開始,經過整理、顯示、樣本信息的提取到總體數(shù)量規(guī)律性的科學推斷,都有一個減少誤差、提高數(shù)據質量的問題。也就是說,統(tǒng)計數(shù)據的質量控制問題是貫穿于統(tǒng)計研究全過程的重要問題。但在不同的統(tǒng)計工作階段,統(tǒng)計數(shù)據誤差的原因是不同的,嚴重程度也不同。第三節(jié)統(tǒng)計數(shù)據的質量統(tǒng)計學一、數(shù)據的誤差統(tǒng)計學二、抽樣誤差

(samplingerror)1.由于抽樣的隨機性所帶來的誤差2.所有樣本可能的結果與總體真值之間的平均性差異3.影響抽樣誤差大小的因素樣本量的大小總體的變異性統(tǒng)計學三、非抽樣誤差

(non-samplingerror)1.相對于抽樣誤差而言2.除抽樣誤差之外的,由于其他原因造成的樣本觀察結果與總體真值之間的差異3.存在于所有的調查之中概率抽樣,非概率抽樣,全面性調查4.有抽樣框誤差、回答誤差、無回答誤差、調查員誤差統(tǒng)計學四、誤差的控制1.抽樣誤差可計算和控制2.非抽樣誤差的控制調查員的挑選調查員的培訓督導員的調查專業(yè)水平調查過程控制調查結果進行檢驗、評估現(xiàn)場調查人員進行獎懲的制度統(tǒng)計學

統(tǒng)計數(shù)據的整理(summarizingdata)是指對所搜集的數(shù)據進行加工整理、使之系統(tǒng)化、條理化,以符合分析的需要。第四節(jié)統(tǒng)計數(shù)據的整理統(tǒng)計學一、

統(tǒng)計分組

(一)統(tǒng)計分組的概念統(tǒng)計分組是根據統(tǒng)計研究的任務和目的,將總體按照一個或幾個標志劃分為若干個性質不同又有聯(lián)系的部分。例1:某班學生(20人)總體按性別標志分組情況按性別分組分組前分組后女生8人占40%男生12人占60%統(tǒng)計學例2:某班學生基本情況調查表統(tǒng)計學

漢族12人,占60%回族5人,占25%滿族3人,占15%1.按民族分組20歲5人,占25%21歲5人,占25%22歲2人,占10%2.按年齡分組中共黨員8人,占40%團員12人,占60%3.按政治面貌分組23歲8人,占40%則:統(tǒng)計學(二)統(tǒng)計分組具有兩個方面的含義:對總體而言,是“分”,即將同質總體區(qū)分為性質有別的不同組成部分;對總體單位而言,它是“組”,即將性質相同或相近的不同總體單位組合在一起,構成一個組。例如,要了解我國人口狀況,只知道總人口數(shù)量是不夠的,而應將人口總體按照年齡、性別、民族、城鄉(xiāng)、文化程度……等分組,才能進一步地深入地了解我國人口總體的年齡結構、性別比例、民族構成等。統(tǒng)計學(三)統(tǒng)計分組的作用1.區(qū)分現(xiàn)象的不同類型2.研究總體的內部結構3.分析現(xiàn)象間的依存關系統(tǒng)計學(四)統(tǒng)計分組的種類

統(tǒng)計分組可以按照不同的標準進行分類,一般有以下幾種分類:

1.按分組標志的性質劃分:統(tǒng)計分組分為品質分組和數(shù)量分組。品質分組是按品質標志進行的分組。變量分組是按數(shù)量標志的分組。

[例2續(xù)]漢族12人,占60%回族5人,占25%滿族3人,占15%1.按民族分組品質分組22歲2人,占10%20歲5人,占25%21歲5人,占25%2.按年齡分組23歲8人,占40%數(shù)量分組漢族12人,占60%回族5人,占25%滿族3人,占15%1.按民族分組品質分組22歲2人,占10%20歲5人,占25%21歲5人,占25%2.按年齡分組23歲8人,占40%數(shù)量分組統(tǒng)計學

2.按分組標志的多少劃分:統(tǒng)計分組分為簡單分組和復合分組。簡單分組是對研究的總體僅按一個標志進行的分組;復合分組是對研究的同一總體選擇兩個或兩個以上標志層疊起來進行的分組。

[例2續(xù)]男12人,占60%女8人,占40%按性別分組簡單分組:復合分組:男12人女8人按性別分組按政治面貌分組團員4人中共黨員4人團員8人中共黨員4人按政治面貌分組統(tǒng)計學

1.概念:統(tǒng)計分組體系是指在統(tǒng)計整理中,為研究現(xiàn)象總體的情況而運用多個分組標志對總體進行分組,從而形成一系列相互聯(lián)系、相互補充的分組體系。

2.分類:平行分組體系和復合分組體系。

★平行分組體系就是對同一總體選擇兩個或兩個以上的標志分別進行簡單分組,排列起來?!锶绻鄠€復合分組組成的體系就形成了復合分組體系。例如,為了認識我國高等院校在校學生的基本狀況,可以同時選擇學科、本科或???、性別三個標志進行復合分組。(五)分組體系統(tǒng)計學高等學校學生總體文科學生組本科學生組??茖W生組理科學生組本科學生組專科學生組男生組女生組男生組女生組男生組女生組男生組女生組統(tǒng)計學二、次數(shù)分布

(一)次數(shù)分布及次數(shù)的概念

1.次數(shù)分布是在統(tǒng)計分組的基礎上,將總體的所有單位,按組歸并排列,從而形成總體中的各個單位在各組間的分布。又稱為分配數(shù)列。

2.分布在各組的個體單位數(shù)叫次數(shù)。次數(shù)可以用絕對數(shù)表示,即頻數(shù);也可以用結構相對數(shù)表示,即頻率或比率或比重。統(tǒng)計學(二)次數(shù)分配表的編制(例題分析)例3某車間30名工人每周加工某種零件件數(shù)如右表試對數(shù)據進行分組。

統(tǒng)計學次數(shù)分配表統(tǒng)計學三、累計次數(shù)分布1.向上累計:是將各組次數(shù)和比率由變量值低的組向變量值高的組逐組累計。

2.向下累計:是將各組次數(shù)和比率由變量值高的組向變量值低的組逐組累計。統(tǒng)計學

例4某班學生身高情況表按身高分組(米)人數(shù)(人)比重(%)1.4-1.51.5-1.61.6-1.71.7-1.81.8-1.8204416610104146418222010020208030505020703020901010100合計20100向下累計向上累計向上累計向下累計統(tǒng)計學(一)直方圖(histogram)用矩形的寬度和高度來表示頻數(shù)分布的圖形,實際上是用矩形的面積來表示各組的頻數(shù)分布在直角坐標中,用橫軸表示數(shù)據分組,縱軸表示頻數(shù)或頻率,各組與相應的頻數(shù)就形成了一個矩形,即直方圖直方圖下的總面積等于1四、次數(shù)分配直方圖統(tǒng)計學(二)分組數(shù)據的圖示(直方圖的繪制)

某車間工人周加工零件直方圖

我一眼就看出來了,周加工零件在100~110之間的人數(shù)最多!統(tǒng)計學(三)折線圖(frequencypolygon)

折線圖也稱頻數(shù)多邊形圖是在直方圖的基礎上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個終點要與橫軸相交,具體的做法是第一個矩形的頂部中點通過豎邊中點(即該組頻數(shù)一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的統(tǒng)計學1512963105110115120125130135140日加工零件數(shù)(個)頻數(shù)(人)折線圖下的面積與直方圖的面積相等!圖3-6某車間工人日加工零件數(shù)的折線圖(四)分組數(shù)據的圖示(折線圖的繪制)

統(tǒng)計學(五)次數(shù)分配的類型對稱分布右偏分布左偏分布正J型分布反J型分布U型分布幾種常見的頻數(shù)分布統(tǒng)計學(一)組距分組(要點)1.將變量值的一個區(qū)間作為一組2.適合于連續(xù)變量3.適合于變量值較多的情況4.需要遵循“不重不漏”的原則5.可采用等距分組,也可采用不等距分組五、組距分組統(tǒng)計學(二)組距分組(步驟)

1.確定組數(shù):組數(shù)的確定應以能夠顯示數(shù)據的分布特征和規(guī)律為目的

2.確定組距:組距(classwidth)是一個組的上限與下限之差,可根據全部數(shù)據的最大值和最小值及所分的組數(shù)來確定,即組距=(最大值-最小值)÷組數(shù)

3.統(tǒng)計出各組的頻數(shù)并整理成頻數(shù)分布表統(tǒng)計學(三)組距分組(幾個概念)1.下限(lowlimit)

:一個組的最小值2.上限(upperlimit)

:一個組的最大值3.組距(classwidth)

:上限與下限之差/組數(shù)4.組中值(classmidpoint)

:下限與上限之間的中點值統(tǒng)計學六、洛倫茨曲線1.20世紀初美國經濟學家、統(tǒng)計學家洛倫茨(M.E.Lorentz)根據意大利經濟學家巴雷特(V.Pareto)提出的收入分配公式繪制而成2.描述收入和財富分配性質的曲線分析該國家或地區(qū)分配的平均程度

AB累積的人口百分比累積的收入百分比絕對公平線統(tǒng)計學洛倫茨曲線累計頻數(shù)(頻率)分布曲線,可用于分析社會財富、土地和工資收入等的分配是否公平的問題。該曲線圖是由美國洛倫茨博士提出,故稱為洛倫茨曲線。洛倫茨曲線

某國家收入所得的分配情況按收入所得水平分組人口收入累計收入的(%)人口數(shù)(萬人)結構%累計%月收入額(億美元)結構%實際累計%絕對平等絕對不平等最低中下等中等較高最高128.5348.0466.945.611.012.8534.8046.694.561.112.8547.6594.3498.91001.574.0816.337.541.8851352246518709410012.8547.6594.3498.91000000100合計1000.0100.0__31.40100______統(tǒng)計學20406080100806040200100絕對平等線實際收入分配線絕對不平等線絕對不平等線人口(%)收入(%)洛倫茨曲線AB統(tǒng)計學基尼系數(shù)

1.20世紀初意大利經濟學家基尼(G.Gini)根據洛倫茨曲線給出了衡收入分配平均程度的指標2.A表示實際收入曲線與絕對平均線之間的面積3.B表示實際收入曲線與絕對不平均線之間的面積4.如果A=0,則基尼系數(shù)=0,表示收入絕對平均5.如果B=0,則基尼系數(shù)=1,表示收入絕對不平均6.基尼系數(shù)在0和1之間取值7.一般認為,基尼系數(shù)若小于0.2,表明分配平均;基尼系數(shù)在0.2至0.4之間是比較適當?shù)?,即一個社會既有效率又沒有造成極大的分配不公;基尼系數(shù)在0.4被認為是收入分配不公平的警戒線,超過了0.4應該采取措施縮小這一差距。

AB基尼系數(shù)統(tǒng)計學一、眾數(shù)二、中位數(shù)三、四分位數(shù)四、均值五、幾何均值六、切尾均值七、眾數(shù)、中位數(shù)和均值的比較第五節(jié)分布集中趨勢的測度統(tǒng)計學集中趨勢

(Centraltendency)一組數(shù)據向其中心值靠攏的傾向和程度測度集中趨勢就是尋找數(shù)據一般水平的代表值或中心值不同類型的數(shù)據用不同的集中趨勢測度值低層次數(shù)據的集中趨勢測度值適用于高層次的測量數(shù)據,反過來,高層次數(shù)據的集中趨勢測度值并不適用于低層次的測量數(shù)據選用哪一個測度值來反映數(shù)據的集中趨勢,要根據所掌握的數(shù)據的類型來確定統(tǒng)計學一、眾數(shù)(mode)一組數(shù)據中出現(xiàn)次數(shù)最多的變量值適合于數(shù)據量較多時使用不受極端值的影響一組數(shù)據可能沒有眾數(shù)或有幾個眾數(shù)主要用于定類數(shù)據,也可用于定序數(shù)據和數(shù)值型數(shù)據統(tǒng)計學眾數(shù)(不惟一性)

無眾數(shù)

原始數(shù)據:10591268一個眾數(shù)

原始數(shù)據:65

9855多于一個眾數(shù)

原始數(shù)據:252828364242統(tǒng)計學定類數(shù)據的眾數(shù)

(算例)表1某城市居民關注廣告類型的頻數(shù)分布廣告類型人數(shù)(人)比例頻率(%)

商品廣告服務廣告金融廣告房地產廣告招生招聘廣告其他廣告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合計2001100【例】根據表1中的數(shù)據,計算眾數(shù)解:這里的變量為“廣告類型”,這是個定類變量,不同類型的廣告就是變量值。我們看到,在所調查的200人當中,關注商品廣告的人數(shù)最多,為112人,占總被調查人數(shù)的56%,因此眾數(shù)為“商品廣告”這一類別,即

Mo=商品廣告統(tǒng)計學定序數(shù)據的眾數(shù)

(算例)【例】根據表2中的數(shù)據,計算眾數(shù)解:這里的數(shù)據為定序數(shù)據。變量為“回答類別”。甲城市中對住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即

Mo=不滿意表2甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意24108934530836311510合計300100.0統(tǒng)計學數(shù)值型分組數(shù)據的眾數(shù)

(要點及計算公式)1.眾數(shù)的值與相鄰兩組頻數(shù)的分布有關4.

該公式假定眾數(shù)組的頻數(shù)在眾數(shù)組內均勻分布2.相鄰兩組的頻數(shù)相等時,眾數(shù)組的組中值即為眾數(shù)Mo3.相鄰兩組的頻數(shù)不相等時,眾數(shù)采用下列近似公式計算MoMo統(tǒng)計學數(shù)值型分組數(shù)據的眾數(shù)

(算例)表3某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計50—【例】根據3中的數(shù)據,計算50名工人日加工零件數(shù)的眾數(shù)統(tǒng)計學二、中位數(shù)(median)

排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于定序數(shù)據,也可用數(shù)值型數(shù)據,但不能用于定類數(shù)據各變量值與中位數(shù)的離差絕對值之和最小,即統(tǒng)計學中位數(shù)

(位置的確定)未分組數(shù)據:組距分組數(shù)據:統(tǒng)計學未分組數(shù)據的中位數(shù)

(計算公式)統(tǒng)計學定序數(shù)據的中位數(shù)

(算例)【例】根據表4中的數(shù)據,計算甲城市家庭對住房滿意狀況評價的中位數(shù)解:中位數(shù)的位置為:

300/2=150從累計頻數(shù)看,中位數(shù)在“一般”這一組別中。因此

Me=一般表4甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計300—統(tǒng)計學數(shù)值型未分組數(shù)據的中位數(shù)

(5個數(shù)據的算例)原始數(shù)據: 2422212620排序: 2021222426位置: 123 45中位數(shù)

22

統(tǒng)計學數(shù)值型未分組數(shù)據的中位數(shù)

(6個數(shù)據的算例)原始數(shù)據:105 91268排序: 56891012位置: 123

456位置

N+126+123.5中位數(shù)

8+928.5

統(tǒng)計學根據位置公式確定中位數(shù)所在的組采用下列近似公式計算:3.

該公式假定中位數(shù)組的頻數(shù)在該組內均勻分布數(shù)值型分組數(shù)據的中位數(shù)

(要點及計算公式)統(tǒng)計學數(shù)值型分組數(shù)據的中位數(shù)

(算例)表5某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計50—【例】根據表5中的數(shù)據,計算50名工人日加工零件數(shù)的中位數(shù)統(tǒng)計學三、四分位數(shù)(quartile)

排序后處于25%和75%位置上的值不受極端值的影響主要用于定序數(shù)據,也可用于數(shù)值型數(shù)據,但不能用于定類數(shù)據QLQMQU25%25%25%25%統(tǒng)計學四分位數(shù)

(位置的確定)未分組數(shù)據:組距分組數(shù)據:下四分位數(shù)(QL)位置=N+14上四分位數(shù)(QU)位置=3(N+1)4下四分位數(shù)(QL)位置=N4上四分位數(shù)(QL)位置=3N4統(tǒng)計學定序數(shù)據的四分位數(shù)

(算例)【例】根據表4中的數(shù)據,計算甲城市家庭對住房滿意狀況評價的四分位數(shù)解:下四分位數(shù)(QL)的位置為:

QL位置=(300)/4=75

上四分位數(shù)(QL)的位置為:

QU位置=(3×300)/4=225從累計頻數(shù)看,QL在“不滿意”這一組別中;QU在“一般”這一組別中。因此

QL

=不滿意

QU

=一般表4甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計300—統(tǒng)計學數(shù)值型未分組數(shù)據的四分位數(shù)

(7個數(shù)據的算例)原始數(shù)據:2321 3032 282526排序:21232526283032位置:1 234567N+1QL=237+1QL位置=4=4=2QU位置=3(N+1)43(7+1)4==6QU=30

統(tǒng)計學數(shù)值型未分組數(shù)據的四分位數(shù)

(6個數(shù)據的算例)原始數(shù)據:232130 282526排序:212325262830位置:12 3 4 56QL=21+0.75(23-21)=22.5QL位置=N+14=6+14=1.75QU位置=3(N+1)43(6+1)4==5.25QU=28+0.25(30-28)

=28.5

統(tǒng)計學數(shù)值型分組數(shù)據的四分位數(shù)

(計算公式)上四分位數(shù):

下四分位數(shù):

統(tǒng)計學數(shù)值型分組數(shù)據的四分位數(shù)

(計算示例)QL位置=50/4=12.5QU位置=3×50/4=37.5表5某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計50—【例】根據第三章表5中的數(shù)據,計算50名工人日加工零件數(shù)的四分位數(shù)統(tǒng)計學四、均值(mean)

集中趨勢的最常用測度值一組數(shù)據的均衡點所在體現(xiàn)了數(shù)據的必然性特征易受極端值的影響用于數(shù)值型數(shù)據,不能用于定類數(shù)據和定序數(shù)據統(tǒng)計學均值

(計算公式)設一組數(shù)據為:X1,X2,…,XN簡單均值的計算公式為設分組后的數(shù)據為:X1,X2,…,XK

相應的頻數(shù)為:F1,F(xiàn)2,…,F(xiàn)K加權均值的計算公式為統(tǒng)計學簡單均值(simplemean)

(算例)

原始數(shù)據: 10 5 9 13 6 8統(tǒng)計學加權均值(weightedmean)

(算例)表5某車間50名工人日加工零件均值計算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)XiFi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合計—506160.0【例】根據表5中的數(shù)據,計算50名工人日加工零件數(shù)的均值統(tǒng)計學加權均值

(權數(shù)對均值的影響)

甲乙兩組各有10名學生,他們的考試成績及其分布數(shù)據如下甲組:考試成績(X): 020100

人數(shù)分布(F):118

乙組:考試成績(X): 020100

人數(shù)分布(F):811X甲0×1+20×1+100×8

10

82(分)X乙0×8+20×1+100×1

10

12(分)統(tǒng)計學均值

(數(shù)學性質)1. 各變量值與均值的離差之和等于零

2.各變量值與均值的離差平方和最小統(tǒng)計學幾何均值

(geometricmean)

n個變量值乘積的

n次方根適用于對比率數(shù)據的平均主要用于計算平均增長率計算公式為5.

可看作是均值的一種變形統(tǒng)計學幾何均值

(例題分析)

【例】一位投資者購持有一種股票,在2000年、2001年、2002年和2003年收益率分別為4.5%、2.1%、25.5%、1.9%。計算該投資者在這四年內的平均收益率算術平均:

幾何平均:統(tǒng)計學切尾均值

(trimmedMean)

去掉大小兩端的若干數(shù)值后計算中間數(shù)據的均值在電視大獎賽、體育比賽及需要人們進行綜合評價的比賽項目中已得到廣泛應用計算公式為n

表示觀察值的個數(shù);α表示切尾系數(shù),

統(tǒng)計學切尾均值(例題分析)

【例】謀次比賽共有11名評委,對某位歌手的給分分別是:

經整理得到順序統(tǒng)計量值為去掉一個最高分和一個最低分,取1/11

統(tǒng)計學眾數(shù)、中位數(shù)和均值的比較左偏分布均值

中位數(shù)

眾數(shù)對稱分布

均值=中位數(shù)=

眾數(shù)右偏分布眾數(shù)

中位數(shù)均值1.眾數(shù)、中位數(shù)和均值的關系統(tǒng)計學2.眾數(shù)、中位數(shù)、均值的特點和應用眾數(shù)不受極端值影響具有不惟一性數(shù)據分布偏斜程度較大時應用中位數(shù)不受極端值影響數(shù)據分布偏斜程度較大時應用均值易受極端值影響數(shù)學性質優(yōu)良數(shù)據對稱分布或接近對稱分布時應用統(tǒng)計學一、極差二、內距三、方差和標準差四、離散系數(shù)第六節(jié)分布離散程度的測度統(tǒng)計學一、極差(range)一組數(shù)據的最大值與最小值之差離散程度的最簡單測度值易受極端值影響未考慮數(shù)據的分布7891078910未分組數(shù)據

R

=max(xi)-min(xi)計算公式為.=組距分組數(shù)據

R

最高組上限-最低組下限統(tǒng)計學二、內距(Inter-QuartileRange,IQR)也稱四分位差上四分位數(shù)與下四分位數(shù)之差

內距QD

=QU-QL反映了中間50%數(shù)據的離散程度不受極端值的影響可用于衡量中位數(shù)的代表性統(tǒng)計學四分位差

(定序數(shù)據的算例)【例4.12】根據表3-2中的數(shù)據,計算甲城市家庭對住房滿意狀況評價的四分位差解:設非常不滿意為1,不滿意為2,一般為3,滿意為4,非常滿意為5已知QL=不滿意=2,

QU=

一般=

3四分位差:

QD

=QU

-

QL

=3–2

=1表3-2甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計300—統(tǒng)計學三、方差和標準差

(VarianceandStandarddeviation)1.離散程度的測度值之一2.最常用的測度值3.反映了數(shù)據的分布4.反映了各變量值與均值的平均差異5.根據總體數(shù)據計算的,稱為總體方差或標準差;根據樣本數(shù)據計算的,稱為樣本方差或標準差4681012

x=8.3統(tǒng)計學總體方差和標準差(計算公式)

(PopulationvarianceandStandarddeviation)

未分組數(shù)據:組距分組數(shù)據:未分組數(shù)據:組距分組數(shù)據:方差的計算公式標準差的計算公式統(tǒng)計學總體標準差

(計算過程及結果)表5某車間50名工人日加工零件標準差計算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)(Xi-X)2(Xi-X)2Fi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合計—50—3100.5【例】根據表5中的數(shù)據,計算工人日加工零件數(shù)的標準差統(tǒng)計學樣本方差和標準差

(samplevarianceandstandarddeviation)未分組數(shù)據:組距分組數(shù)據:未分組數(shù)據:組距分組數(shù)據:方差的計算公式標準差的計算公式注意:樣本方差用自由度n-1去除!統(tǒng)計學樣本方差

自由度(degreeoffreedom)一組數(shù)據中可以自由取值的數(shù)據的個數(shù)當樣本數(shù)據的個數(shù)為

n

時,若樣本均值

x確定后,只有n-1個數(shù)據可以自由取值,其中必有一個數(shù)據則不能自由取值例如,樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則

x=5。當

x

=5

確定后,x1,x2和x3有兩個數(shù)據可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值樣本方差用自由度去除,其原因可從多方面解釋,從實際應用角度看,在抽樣估計中,當用樣本方差去估計總體方差σ2時,它是σ2的無偏估計量統(tǒng)計學四、離散系數(shù)

(coefficientofvariation)1. 標準差與其相應的均值之比對數(shù)據相對離散程度的測度消除了數(shù)據水平高低和計量單位的影響4. 用于對不同組別數(shù)據離散程度的比較5.計算公式為統(tǒng)計學離散系數(shù)(例題分析)某管理局所屬8家企業(yè)的產品銷售數(shù)據企業(yè)編號產品銷售額(萬元)x1銷售利潤(萬元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業(yè),其產品銷售數(shù)據如表。試比較產品銷售額與銷售利潤的離散程度統(tǒng)計學離散系數(shù)(例題分析)結論:計算結果表明,v1<v2,說明產品銷售額的離散程度小于銷售利潤的離散程度v1=536.25309.19=0.577v2=32.521523.09=0.710統(tǒng)計學第七節(jié)分布偏態(tài)與峰度的測度一、偏態(tài)及其測度

二、峰度及其測度統(tǒng)計學偏態(tài)與峰度分布的形狀扁平分布尖峰分布偏態(tài)峰度左偏分布右偏分布與標準正態(tài)分布比較!統(tǒng)計學偏態(tài)

(概念要點)1.數(shù)據分布偏斜程度的測度2.偏態(tài)系數(shù)=0為對稱分布3.偏態(tài)系數(shù)>0為右偏分布4.偏態(tài)系數(shù)<0為左偏分布5.計算公式為統(tǒng)計學偏態(tài)

(實例)【例】已知1997年我國農村居民家庭按純收入分組的有關數(shù)據如表8。試計算偏態(tài)系數(shù)表81997年農村居民家庭純收入數(shù)據按純收入分組(元)戶數(shù)比重(%)500以下500~10001000~15001500~20002000~25002500~30003000~35003500~40004000~45004500~50005000以上2.2812.4520.3519.5214.9310.356.564.132.681.814.94統(tǒng)計學戶數(shù)比重(%)252015105農村居民家庭村收入數(shù)據的直方圖偏態(tài)與峰度

(從直方圖上觀察)按純收入分組(元)1000500←15002000250030003500400045005000→結論:1.為右偏分布

2.峰度適中統(tǒng)計學偏態(tài)系數(shù)

(計算過程)表9農村居民家庭純收入數(shù)據偏態(tài)及峰度計算表按純收入分組(百元)組中值Xi戶數(shù)比重(%)Fi(Xi-X)3Fi(Xi-X)4Fi5以下5—1010—1515—2020—2525—3030—3535—4040—4545—5050以上2.57.512.517.522.527.532.537.542.547.552.52.2812.4520.3519.5214.9310.356.564.132.681.814.94-154.64-336.46-144.87-11.840.1823.1689.02171.43250.72320.741481.812927.154686.511293.5346.520.20140.60985.492755.005282.948361.9846041.33合計—1001689.2572521.25統(tǒng)計學偏態(tài)系數(shù)

(計算結果)根據上表數(shù)據計算得將計算結果代入公式得結論:偏態(tài)系數(shù)為正值,而且數(shù)值較大,說明農村居民家庭純收入的分布為右偏分布,即收入較少的家庭占據多數(shù),而收入較高的家庭則占少數(shù),而且偏斜的程度較大

統(tǒng)計學峰度

(概念要點)1.數(shù)據分布扁平程度的測度2.峰度系數(shù)=3扁平程度適中3.偏態(tài)系數(shù)<3為扁平分布4.偏態(tài)系數(shù)>3為尖峰分布5.計算公式為統(tǒng)計學峰度系數(shù)

(實例計算結果)代入公式得

【例】根據表9中的計算結果,計算農村居民家庭純收入分布的峰度系數(shù)

結論:由于=3.4>3,說明我國農村居民家庭純收入的分布為尖峰分布,說明低收入家庭占有較大的比重

統(tǒng)計學一、莖葉圖二、箱線圖第八節(jié)莖葉圖與箱線圖統(tǒng)計學未分組數(shù)據—莖葉圖(stem-and-leafdisplay)

(莖葉圖的制作)用于顯示未分組的原始數(shù)據的分布由“莖”和“葉”兩部分構成,其圖形是由數(shù)字組成的以該組數(shù)據的高位數(shù)值作樹莖,低位數(shù)字作樹葉對于n(20≤n≤300)個數(shù)據,莖葉圖最大行數(shù)不超過

L=[10×log10n

]5.莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可大體上看出一組數(shù)據的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據的信息統(tǒng)計學樹莖樹葉78889444556677788910111213數(shù)據個數(shù)3132410莖葉圖類似橫置的直方圖未分組數(shù)據—莖葉圖

(莖葉圖的制作)圖3-7某車間工人日加工零件數(shù)的莖葉圖統(tǒng)計學未分組數(shù)據—莖葉圖

(擴展的莖葉圖)樹莖樹葉10s10.11*11t11f11s11.12*12t12f12s12.13*13t13f13s13.78802234577788890012222333344455667778890133445799樹莖樹葉10*10.11*11.12*12.13*13.78802234577788890012222333344455667778890133445799圖3-8圖3.7擴展后的莖葉圖統(tǒng)計學箱線圖

(boxplot)用于顯示未分組的原始數(shù)據的分布箱線圖由一組數(shù)據的5個特征值繪制而成,它由一個箱子和兩條線段組成箱線圖的繪制方法首先找出一組數(shù)據的5個特征值,即最大值、最小值、中位數(shù)Me和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個四分(位)數(shù)畫出箱子,再將兩個極值點與箱子相連接

統(tǒng)計學

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論