變量分布特征的描述續(xù)+抽樣分布9_第1頁
變量分布特征的描述續(xù)+抽樣分布9_第2頁
變量分布特征的描述續(xù)+抽樣分布9_第3頁
變量分布特征的描述續(xù)+抽樣分布9_第4頁
變量分布特征的描述續(xù)+抽樣分布9_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

本科課程陳宜治系列課件統(tǒng)計學課件制作:陳宜治作業(yè)訂正3、1)平均每個企業(yè)利潤額=203.70(萬元);(2)全公司平均資金利潤率=13.08%。4、(1)全廠總合格率、平均合格率和平均廢品率分別是92.17%、97.32%和2.68%;(采用幾何平均法)(2)全廠總合格率、平均合格率和平均廢品率分別是97.31%、97.31%和2.69%;(采用調和平均法)(3)全廠總合格率、平均合格率和平均廢品率分別是97.38%、97.38%和2.62%。(采用算術平均法)3.方差、標準差的性質(1)常數的方差為0(2)若為常數,則(3)標準差是計算標準化值的依據

標準得分,標準統(tǒng)計值反應靈敏,隨任何一個數據的變化而變化;一組數據的方差和標準差有確定的值;適合代數計算,不僅求方差和標準差的過程中可以進行代數運算,而且可以將幾個方差和標準差綜合成一個總的方差和標準差;用樣本數據推斷總體差異量時,方差和標準差是最好的估計量。4.方差、標準差的特點優(yōu)點受數據量綱的約束,當數據間量綱不統(tǒng)一時,無法直接比較;受數據自身水平的影響較大,當數據水平存在差異時,無法直接比較;缺點(六)離散系數(CoefficientofVariation)

1.定義:離散系數也稱為標準差系數,它是一組數據的標準差與其相應的均值之比,是測度數據離散程度的相對指標。

2.計算公式Vσ和Vs分別表示總體離散系數和樣本離散系數。離散系數用于對不同組別數據的離散程度進行比較時,離散系數大的說明該組數據的離散程度也就大,離散系數小的說明該組數據的離散程度也就小。相對標準差城市人均年收入(元)收入標準差(元)標準差系數甲城市60001502.5乙城市120001801.5例3.25:甲乙兩個城市的居民年收入情況如表所示,試比較兩城市居民收入分配的均衡性。從表中前三欄數據來看,乙城市不僅人均年收入兩倍于甲城市,而且收入的差距也似乎顯著于甲城市。但通過計算標準差系數,乙城市的實際收入差距相對于它的平均收入來說,比甲城市要低的多?;蛘哒f,以居民對收入收入差距所承受的壓力而言,甲城市要比乙城市高得多。根據例3.24數據,算得姚明、戴維斯、保羅的離散系數分別為:因此,姚明的發(fā)揮更穩(wěn)定,如果你是理智的教練,應該選擇姚明!第三節(jié)分布形狀的描述偏度系數峰度系數一、分布形狀和形狀指標變量分布的偏斜程度和尖陡程度

分布形狀形狀指標反映變量分布具體形狀,即左右是否對稱、偏斜程度與陡峭程度的指標對稱性陡峭性(一)利用算術平均數與眾數或中位數的離差求偏度系數二、偏度系數

1.偏度系數的變動范圍為(-3,3)2.當﹥0時,為正值,變量分布屬于正偏當﹤0時,為負值,變量分布屬于負偏當=0時,變量分布屬于對稱分布3.的絕對值越接近于3,表明變量分布的偏斜程度越嚴重;的絕對值越接近于0,表明變量分布的偏斜程度越輕微(二)利用四分位數求偏度系數

2.的絕對值越接近于1,表明變量分布的偏斜程度越嚴重;的絕對值越接近于0,表明變量分布的偏斜程度越輕微1.的變動范圍為(-1,1)

(三)利用動差法求偏度系數t階動差=

t階動差=

動差法偏度系數是以變量數列的三階中心動差()作為度量偏度的基本依據。

1.原理2.動差當a=0時,t階動差稱為t階原點動差,用Mi表示當a=時,t階動差稱為階中心動差,用mi表示

3.計算公式若>0,表示變量分布正偏;若<0,表示變量分布負偏;若=0,表示變量分布兩邊對稱,無偏。的絕對值越接近0,變量分布的偏度越輕微;的絕對值越大于0,變量分布的偏度越嚴重;三、峰度系數標準正態(tài)峰度尖頂峰度平頂峰度1.概念由統(tǒng)計學家皮爾遜于1905年提出,是對變量分布扁平性或尖陡性的測度,通常是指鐘型分布的頂峰與標準正態(tài)分布相比偏扁平或偏尖陡的程度。2.分類3.計算方法峰度系數的計算主要采用動差法,是4階中心動差與標準差4次方相比的結果(1)當k=3時,變量分布的峰度為標準正態(tài)峰度(2)當k<3時,變量分布的峰度為平頂峰度(3)當k>3時,變量分布的峰度為尖頂峰度(4)當k接近于1.8時,變量分布曲線就趨向于一條水平線(5)當k小于1.8時,則變量分布曲線為“U”型曲線例3.26:某企業(yè)職工月收入情況如表所示,求職工月收入分布的動差法偏度系數和峰度系數。職工月收入(元)職工人數(人)900以下900~10001000~11001100~12001200~13001300~14001400~15001500以上2448601052721123合計300職工月收入(元)900以下900~10001000~11001100~12001200~13001300~14001400~15001500以上85095010501150125013501450155024486010527211232040045600630001207503375028350174004650-263-163-63+37+137+237+337+43769169265693969136918769561691135691909691660056127531223814014374550676311795491362828572907-436594728-207875856-15002820531856569426531279553113459273036250360359合計3003339006939300404458200=(元)

該企業(yè)職工月收入的分布為正偏分布,但偏度不大。該企業(yè)職工月收入分布的峰度為輕微的尖頂峰度。

統(tǒng)計的基本任務:由部分來推斷總體,或者由過去來推斷未來.這樣就涉及到兩個問題:1)如何選取部分?2)如何利用部分?第四章抽樣估計由于抽取的部分具有一定的隨機性,因此據此得出的推論多多少少的總含有一定程度的不確定性.因此,我們必須對試驗所提供的信息進行“合理”的加工和處理,以使做出錯誤推斷的概率盡可能的小.一般地,在數理統(tǒng)計中所做出的許多推斷我們都用一定的概率來表明推斷的可靠或可信程度.這種伴隨著一定概率的推斷就稱為統(tǒng)計推斷.第一節(jié)抽樣分布(一)總體分布及其特征

總體分布:是指總體中所有個體關于某個變量(標志)的取值所形成的分布。

總體參數:反映總體分布特征的指標一、抽樣分布的基本問題三個概念:總體分布,樣本分布,抽樣分布指樣本單位的抽取不受主觀因素及其他系統(tǒng)性因素的影響,每個總體單位都有均等的被抽中機會抽樣估計按照隨機原則

從調查對象中抽取一部分單位進行調查,并以調查結果對總體數量特征作出具有一定可靠程度的估計與推斷,從而認識總體的一種統(tǒng)計方法統(tǒng)計推斷全及總體指標:參數(未知量)樣本總體指標:統(tǒng)計量(已知量)抽樣估計不可能進行全面調查時

例如對破壞性的產品質量檢查

不必要進行全面調查時產品質量的檢查與控制

來不及進行全面調查時

教育部本科教學工作水平評估

對全面調查資料進行補充修正時抽樣估計的應用設計抽樣方案抽取樣本單位收集樣本數據計算樣本統(tǒng)計量推斷總體參數抽樣估計的一般步驟也稱母體,就是客觀存在的,具有某種共同性質的許多單位所組成的整體??傮w也叫樣本或子樣,是從全及總體中隨機抽取出來,代表全及總體的那部分單位的集合體抽樣總體通??傮w的單位數用“N”通常樣本的單位數(樣本容量)用“n”常用的總體參數有兩個:總體均值(包括是非變量的均值);總體方差或標準差(包括是非變量的方差或標準差)。鏈接:我調查了500個樣本來研究大學生的婚戀觀。設有限總體容量為N,各單位某項標志的值分別為;若為是非標志則設具有某種屬性的有個單位,不具有某種屬性的有個單位,則⒈總體均值(總體平均數):2、總體方差:3、總體成數(總體比例)5、總體是非標志的方差4、總體是非標志的均值(二)樣本分布及其特征樣本分布:樣本中所有個體關于某個變量(標志)的取值所形成的分布。當樣本容量很大,或者是當逐漸增大時,樣本分布會接近總體分布。如果樣本容量很小,樣本分布就有可能與總體分布相差很大,抽樣估計的結果就會很差。樣本統(tǒng)計量:反映樣本分特征的指標,

T樣本統(tǒng)計量是隨機變量,它的取值隨樣本的不同而發(fā)生變化。樣本統(tǒng)計值:是樣本統(tǒng)計量的值,由樣本單位的標志值計算而來,用來估計總體參數。樣本的函數且不含任何未知參數,統(tǒng)計量是例:我們選擇奧運板塊的個股作為樣本。則樣本分布為該板塊60只股票在4月23日的漲跌情況樣本統(tǒng)計量xii=1……60樣本是隨機產生的,為了提高樣本的代表性,可以選擇合適的抽樣組織方式來產生樣本抽樣估計就是以可知但非唯一的樣本統(tǒng)計量的值來估計未知但唯一的總體參數的值?!锱c總體參數相對應,常用的樣本統(tǒng)計量有

樣本均值(或樣本成數)、樣本方差(或樣本標準差)。⒈樣本均值:設樣本中n個樣本單位某項標志的標志值分別為,若為是非標志則設具有和不具有某種屬性的樣本單位數目分別為和個,則2.樣本方差:3.樣本成數(樣本比例):4.樣本是非標志的均值:5.樣本是非標志的方差:(三)抽樣分布及其特征1、抽樣分布的概念抽樣分布,是樣本統(tǒng)計量的概率分布,由樣本統(tǒng)計量的所有可能取值和與之相應的概率組成。假設從容量為N的總體中抽取容量為n的樣本最多可抽取m套不同的樣本,則m個樣本統(tǒng)計值的頻率分布,即為抽樣分布。實際的抽樣分布形成取決于以下五個因素:總體分布(越集中,抽樣分布越集中)樣本容量(最關鍵因素,容量越大抽樣分布越集中)抽樣方法(采用重復或不重復方法,抽樣分布不同)抽樣組織形式(不同形式下的樣本個數及結構不同,抽樣分布也不同)估計量構造(樣本估計量不同,抽樣分布不同)大樣本小樣本乘法公式:設完成一件事需分兩步,第一步有n1種方法,第二步有n2種方法,則完成這件事共有n1n2種方法加法公式:設完成一件事可有兩種途徑,第一種途徑有n1種方法,第二種途徑有n2種方法,則完成這件事共有n1+n2種方法。有重復排列:從含有N個元素的集合中隨機抽取n次,每次取一個,記錄其結果后放回,將記錄結果排成一列,NnNN共有Nn種排列方式.無重復排列:從含有N個元素的集合中隨機抽取n次,每次取一個,取后不放回,將所取元素排成一列,共有PNn=N(N-1)…(N-n+1)種排列方式.NN-1N-2N-N+1組合(無重復):從含有N個元素的集合中隨機抽取n個,共有種取法.組合(有重復):從含有n個元素的集合中隨機抽取k個,共有最基本的抽樣分布:樣本均值的抽樣分布,樣本成數的抽樣分布2、抽樣分布形式設從容量為N的有限總體中抽取容量為n的樣本,最多可抽取m套不同樣本,計算得m個樣本統(tǒng)計值設m個樣本統(tǒng)計值經單項式分組可分為k組,則抽樣分布的表現(xiàn)形式為:樣本均值的抽樣分布形式樣本成數的抽樣分布形式例:某車間班組5個工人日工資為34,38,42,46,50元,則總體日平均工資總體日工資方差不同抽樣方法下樣本平均數的抽樣分布(1)用重復抽樣方法(考慮順序)從5個工人(日工資為34,38,42,46,50元)中隨機抽取2人構成樣本,共52=25個樣本所有可能樣本及其平均數:樣本變量3438424650343842465034363840423638404244384042444640424446484244464850第一單位第二單位樣本均值整理出樣本平均數的頻率分布如下:頻率343638404244464850合計4%8%12%16%20%16%12%8%4%100%樣本均值的抽樣分布樣本均值的抽樣分布圖(2)用不重復抽樣方法從5個工人(日工資為34,38,42,46,50元)中隨機抽取2人構成樣本(考慮順序),共5×4=20個樣本。所有可能樣本及其平均數:樣本變量3438424650343842465034363840423638404244384042444640424446484244464850第一單位第二單位樣本均值整理出樣本平均數的頻率分布如下:頻率36384042444648合計10%10%20%20%20%10%10%100%樣本均值的抽樣分布圖樣本均值的抽樣分布設某總體由10個球組成,其中紅球6個,現(xiàn)從總體中隨機抽取4個球,那么在重復抽樣和不重復抽樣下紅球比重(樣本成數)的抽樣分布分別如何?重復抽樣下紅球比重的抽樣分布00.250.50.7510.02560.15360.34560.34560.1296總體成數為總體方差為在重復抽樣下,樣本中紅球的比重服從二項分布

00.250.50.751不重復抽樣下紅球比重的抽樣分布3、抽樣分布特征指樣本統(tǒng)計量的數學期望和方差。樣本統(tǒng)計量的數學期望:即所有樣本統(tǒng)計值的平均數樣本統(tǒng)計量的方差:即所有樣本統(tǒng)計值關于數學期望的方差在前面的例題中,重復抽樣的抽樣分布如下:頻率343638404244464850合計4%8%12%16%20%16%12%8%4%100%樣本平均數的期望與方差:不重復抽樣的抽樣分布如下:頻率36384042444648

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論