多媒體課件_統(tǒng)計學_本_第八周_第1頁
多媒體課件_統(tǒng)計學_本_第八周_第2頁
多媒體課件_統(tǒng)計學_本_第八周_第3頁
多媒體課件_統(tǒng)計學_本_第八周_第4頁
多媒體課件_統(tǒng)計學_本_第八周_第5頁
已閱讀5頁,還剩118頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、了解統(tǒng)計量及其分布的幾個概念了解統(tǒng)計量及其分布的幾個概念了解由正態(tài)分布導出的幾個重要分布了解由正態(tài)分布導出的幾個重要分布 理解樣本均值的分布與中心極限定理理解樣本均值的分布與中心極限定理掌握單樣本比例和樣本方差的抽樣分布掌握單樣本比例和樣本方差的抽樣分布能夠借助軟件計算相關的分位數(shù)能夠借助軟件計算相關的分位數(shù)設X1,X2,Xn是從總體X中抽取的容量為n的一個樣本,如果由此樣本構造一個函數(shù)T(X1,X2,Xn),不依賴于任何未知參數(shù),則稱函數(shù)T(X1,X2,Xn)是一個統(tǒng)計量n樣本均值、樣本比例、樣本方差等都是統(tǒng)計量統(tǒng)計量是樣本的一個函數(shù)統(tǒng)計量是統(tǒng)計推斷的基礎一組樣本觀測值X1,X2,Xn由小到

2、大的排序 X(1)X(2) X(i) X(n) 后,稱X(1),X(2),X(n)為次序統(tǒng)計量 中位數(shù)、分位數(shù)、四分位數(shù)等都是次序統(tǒng)計量樣本統(tǒng)計量的概率分布,是一種理論分布n在重復選取容量為n的樣本時,由該統(tǒng)計量的所有可能取值形成的相對頻數(shù)分布 隨機變量是 樣本統(tǒng)計量樣本統(tǒng)計量n樣本均值, 樣本比例,樣本方差等結果來自容量相同容量相同的所有所有可能樣本提供了樣本統(tǒng)計量長遠而穩(wěn)定的信息,是進行推斷的理論基礎,也是抽樣推斷科學性的重要依據(jù) 由阿貝(Abbe) 于1863年首先給出,后來由海爾墨特(Hermert)和卡皮爾遜(KPearson) 分別于1875年和1900年推導出來設 ,則令 ,則

3、Y 服從自由度為1的2分布,即 當總體 ,從中抽取容量為n的樣本,則2( ,)XN (0,1)XzN2Yz2(1)Y2( ,)XN 2212()(1)niixxn分布的變量值始終為正 分布的形狀取決于其自由度n的大小,通常為不對稱的正偏分布,但隨著自由度的增大逐漸趨于對稱 期望為:E(2)=n,方差為:D(2)=2n(n為自由度) 可加性:若U和V為兩個獨立的2分布隨機變量,U2(n1),V2(n2),則U+V這一隨機變量服從自由度為n1+n2的2分布 由統(tǒng)計學家費希爾(R.A.Fisher) 提出的,以其姓氏的第一個字母來命名設若U為服從自由度為n1的2分布,即U2(n1),V為服從自由度為

4、n2的2分布,即V2(n2),且U和V相互獨立,則稱F為服從自由度n1和n2的F分布,記為12U nFV n12( ,)FF n n/2/2/2(0, 1),2|UNP UzzP Uzz設設統(tǒng)統(tǒng)計計量量對對給給定定的的常常數(shù)數(shù)(0 0 )=,則則(2)若若P(X)=,則則21( )n2( )n2( ) n2 分布的分位數(shù)分布的分位數(shù)【函數(shù)調用函數(shù)調用】CHINV(Probability,Degrees_freedom)計算給定單尾概率時的計算給定單尾概率時的 分布分布 反函數(shù)值反函數(shù)值,也就是所也就是所謂的臨界值,其中謂的臨界值,其中Probability為為 分布的單尾概率分布的單尾概率,D

5、egrees_freedom為自由度。為自由度。2 2 t分布的雙側分位數(shù)分布的雙側分位數(shù) 設設Xt(n),對于給定對于給定(0)=,則稱則稱為為t(n)分布的分布的水平雙側分位數(shù)水平雙側分位數(shù), 記為記為:/2( )tn2/ 2()tn/ 2()tn2注:注:當自由度當自由度n充分大時,充分大時,t分布近似于標準分布近似于標準正態(tài)分布,正態(tài)分布,/2/2( ),( ).tnztnz一般當一般當45 n時,時,t分布分布的分位數(shù)可用正態(tài)近似的分位數(shù)可用正態(tài)近似.為為 設設/2( )tn)(nt的雙側的雙側分位數(shù),則分位數(shù),則/2( )1/2,P Ttn /2( )/2,P Ttn 【函數(shù)調用函

6、數(shù)調用】TINV(Probability,Degrees_freedom)計算給概率和自由度時的計算給概率和自由度時的 t分布分布 的的t值值,也就是所謂的也就是所謂的臨界值,其中臨界值,其中Probability為為 對應于雙尾對應于雙尾t分布的單尾分布的單尾概率,概率,Degrees_freedom為自由度。為自由度。F F分布的上側分位數(shù)分布的上側分位數(shù)Xf(x)設設X , 對于給定對于給定(0)=,則稱則稱為為F分布的分布的水平水平上側分位數(shù)上側分位數(shù),記為記為:12( ,)F n n12( ,)F n n12( ,)F n n若若P(F)=(比較大比較大),則則P(1/F1/)=1-

7、,1211(,)Fn n故故1211(,)Fnn【函數(shù)調用函數(shù)調用】FINV(Probability,Degrees_freedom1,Degrees_freedom2)計算給定單尾概率為計算給定單尾概率為 時的時的 F分布分布 的反函數(shù)值的反函數(shù)值,也就是也就是所謂的臨界值,其中,所謂的臨界值,其中,Degrees_freedom1為分子自為分子自由度,由度,Degrees_freedom2為分母自由度。為分母自由度。在重復選取容量為n的樣本時,由樣本均值的所有可能取值形成的相對頻數(shù)分布一種理論概率分布推斷總體均值的理論基礎x5x50 x2.5xxn從均值為從均值為 ,方差為,方差為 2的一

8、個任意總體中抽取容量為的一個任意總體中抽取容量為n的樣本,當?shù)臉颖?,當n充分大時,樣本均值的抽樣分布近似服從充分大時,樣本均值的抽樣分布近似服從均值為均值為、方差為、方差為2/n的正態(tài)分布的正態(tài)分布x總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比n不同性別的人與全部人數(shù)之比n合格品(或不合格品) 與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為011NNNN或011nnppnn或在重復選取容量為n的樣本時,由樣本比例的所有可能取值形成的相對頻數(shù)分布一種理論概率分布當樣本容量很大時,樣本比例的抽樣分布可用正態(tài)分布近似 推斷總體比例的理論基礎樣本比例的數(shù)學期望樣本比例的方差n重復抽樣n不重

9、復抽樣( )E p2(1)pn2(1)1pNnnN兩個總體都為正態(tài)分布,即 , 兩個樣本均值之差 的抽樣分布服從正態(tài)分布,其分布的數(shù)學期望為兩個總體均值之差 方差為各自的方差之和 2111(,)XN 2222(,)XN 12xx1212()E xx122221212xxnn222(1)(1)nsn22(1)ns211222(1,1)sF nns估計量與估計值的概念估計量與估計值的概念點估計與區(qū)間估計的區(qū)別點估計與區(qū)間估計的區(qū)別評價估計量優(yōu)良性的標準評價估計量優(yōu)良性的標準一個總體參數(shù)的區(qū)間估計方法一個總體參數(shù)的區(qū)間估計方法兩個總體參數(shù)的區(qū)間估計方法兩個總體參數(shù)的區(qū)間估計方法樣本量的確定方法樣本量

10、的確定方法估計量:用于估計總體參數(shù)的隨機變量n如樣本均值,樣本比例, 樣本方差等n例如: 樣本均值就是總體均值 的一個估計量參數(shù)用 表示,估計量用 表示估計值:估計參數(shù)時計算出來的統(tǒng)計量的具體值n如果樣本均值 x =80,則80就是的估計值用樣本的估計量的某個取值直接作為總體參數(shù)的估計值例如:用樣本均值直接作為總體均值的估計;用兩個樣本均值之差直接作為總體均值之差的估計無法給出估計值接近總體參數(shù)程度的信息n雖然在重復抽樣條件下,點估計的均值可望等于總體真值,但由于樣本是隨機的,抽出一個具體的樣本得到的估計值很可能不同于總體真值n一個點估計量的可靠性是由它的抽樣標準誤差來衡量的,這表明一個具體的

11、點估計值無法給出估計的可靠性的度量 在點估計的基礎上,給出總體參數(shù)估計的一個區(qū)間范圍,該區(qū)間由樣本統(tǒng)計量加減估計誤差而得到根據(jù)樣本統(tǒng)計量的抽樣分布能夠對樣本統(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量n比如,某班級平均分數(shù)在7585之間,置信水平是95% xxzx2將構造置信區(qū)間的步驟重復很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平 表示為 (1 - n 為是總體參數(shù)未在區(qū)間內(nèi)的比例 常用的置信水平值有 99%, 95%, 90%n相應的相應的 為0.01,0.05,0.10由樣本統(tǒng)計量所構造的總體參數(shù)的估計區(qū)間稱為置信區(qū)間統(tǒng)計學家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所

12、以給它取名為置信區(qū)間 用一個具體的樣本所構造的區(qū)間是一個特定的區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值n我們只能是希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個n總體參數(shù)以一定的概率落在這一區(qū)間的表述是錯誤的無偏性:無偏性:估計量抽樣分布的數(shù)學期望等于被 估計的總體參數(shù)12一致性:一致性:隨著樣本量的增大,估計量的 值越來越接近被估計的總體參數(shù)2xp2s1.假定條件n總體服從正態(tài)分布,且方差() 已知n如果不是正態(tài)分布,可由正態(tài)分布來近似 (n 30)2.使用正態(tài)分布統(tǒng)計量 z(0,1)xzNn22()sxzxznn或未知

13、【 例例 】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對食品一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對食品質量進行監(jiān)測,企業(yè)質檢部門經(jīng)常要進行抽檢,以分析每袋質量進行監(jiān)測,企業(yè)質檢部門經(jīng)常要進行抽檢,以分析每袋重量是否符合要求?,F(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了重量是否符合要求。現(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標準差為正態(tài)分布,且總體標準差為10g。試估計該批產(chǎn)品平均重量。試估計該批產(chǎn)品平均重量的置信區(qū)間,置信水平為的置信區(qū)間,置信水平為95%112.5101.0103.0102

14、.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3已知N(,102),n=25, 1- = 95%,z/2=1.96。根據(jù)樣本數(shù)據(jù)計算得: 。由于是正態(tài)總體,且方差已知??傮w均值在1-置信水平下的置信區(qū)間為210105.361.9625105.363.92101.44,109.28xzn該食品平均重量的置信區(qū)間為該食品平均重量的置信區(qū)間為101.44g109.28g105.36x 23353927364436424643313342

15、534554472434283936444039493834485034394548453227.7739.51.6453639.52.1337.37,41.63sxzn39.5x 7.77s 1. 假定條件n總體服從正態(tài)分布,但方差() 未知n小樣本 (n 30)2. 使用 t 分布統(tǒng)計量 (1)xtt nsn2sxtn1510152014801500145014801510152014801490153015101460146014701470224.771490221476.8,1503.2sxtn1490 x 24.77s 1.假定條件n總體服從二項分布n可以

16、由正態(tài)分布來近似2.使用正態(tài)分布統(tǒng)計量 z(0,1)(1)pzNn2(1- )pppzn【例】某城市想要估計下崗職工中女性所占的比例,隨機地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區(qū)間2(1)65%(165%)65%1.9610065%9.35%55.65%,74.35%pppzn該城市下崗職工中女性比例的置信該城市下崗職工中女性比例的置信區(qū)間為區(qū)間為55.65%74.35% 1.估計一個總體的方差或標準差2.假設總體服從正態(tài)分布3.總體方差 2 的點估計量為s2,且22211nsn222222121111nsnsnn【例例】一家食品

17、生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,現(xiàn)從某一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,現(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了天生產(chǎn)的一批食品中隨機抽取了25袋,測得每袋重量如袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布。以下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布。以95%的置信水平建立該種食品重量方差的置信區(qū)間的置信水平建立該種食品重量方差的置信區(qū)間 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3解

18、:已知n25,1-95% ,根據(jù)樣本數(shù)據(jù)計算得 s2 =93.21 2置信度為95%的置信區(qū)間為 22210.975(1)(24)12.4011n2220.025(1)(24)39.3641n2225193.2125193.2139.364112.401156.83180.39該企業(yè)生產(chǎn)的食品總體重量標準差的的置信區(qū)該企業(yè)生產(chǎn)的食品總體重量標準差的的置信區(qū)間為間為7.54g13.43g均值均值比例比例方差方差大樣本大樣本小樣本小樣本大樣本大樣本 2 2分布分布 2 2已知已知 2 2已知已知Z Z分布分布 2 2未知未知Z Z分布分布Z Z分布分布Z Z分布分布 2 2未知未知t t分布分布了

19、解假設檢驗的基本思想了解假設檢驗的基本思想 掌握假設檢驗的步驟掌握假設檢驗的步驟對實際問題作假設檢驗對實際問題作假設檢驗利用置信區(qū)間進行假設檢驗利用置信區(qū)間進行假設檢驗利用利用P - 值進行假設檢驗值進行假設檢驗 對總體參數(shù)的的數(shù)值所作的一種陳述總體參數(shù)包括總體均值總體均值、比例比例、方差方差等分析之前之前必需陳述事先對總體參數(shù)或分布形式作出某種假設,然后利用樣本信息來判斷原假設是否成立有參數(shù)假設檢驗和非參數(shù)假設檢驗采用邏輯上的反證法,依據(jù)統(tǒng)計上的小概率原理 什么是原假設?什么是原假設?(null hypothesis)待檢驗的假設,又稱“0假設”研究者想收集證據(jù)予以反對的假設3. 總是有等號

20、 , 或 4. 表示為 H0nH0: 某一數(shù)值 n指定為 = 號,即 或 1.例如, H0: 3190(克) 什么是備擇假設?什么是備擇假設?(alternative hypothesis)與原假設對立的假設,也稱“研究假設”研究者想收集證據(jù)予以支持的假設總是有不等號: , 或 表示為 H1nH1: 某一數(shù)值,或 某一數(shù)值1.例如, H1: 3910(克),或 3910克1.第一類錯誤(棄真錯誤)第一類錯誤(棄真錯誤)n原假設為真時拒絕原假設n會產(chǎn)生一系列后果n第一類錯誤的概率為l被稱為顯著性水平2.第二類錯誤(取偽錯誤)第二類錯誤(取偽錯誤)n原假設為假時接受原假設n第二類錯誤的概率為 (B

21、eta)假設檢驗的流程假設檢驗的流程提出假設提出假設確定適當?shù)臋z驗統(tǒng)計量確定適當?shù)臋z驗統(tǒng)計量規(guī)定顯著性水平規(guī)定顯著性水平 計算檢驗統(tǒng)計量的值計算檢驗統(tǒng)計量的值作出統(tǒng)計決策作出統(tǒng)計決策 什么是檢驗統(tǒng)計量?什么是檢驗統(tǒng)計量?1. 用于假設檢驗決策的統(tǒng)計量2. 選擇統(tǒng)計量的方法與參數(shù)估計相同,需考慮n是大樣本還是小樣本n總體方差已知還是未知3. 檢驗統(tǒng)計量的基本形式為0XZn 什么是顯著性水平?什么是顯著性水平?1. 是一個概率值2. 原假設為真時,拒絕原假設的概率n被稱為抽樣分布的拒絕域3. 表示為 (alpha)n常用的 值有0.01, 0.05, 0.104. 由研究者事先確定計算檢驗的統(tǒng)計量

22、根據(jù)給定的顯著性水平,查表得出相應的臨界值z或z/2, t或t/2將檢驗統(tǒng)計量的值與 水平的臨界值進行比較得出拒絕或不拒絕原假設的結論是一個概率值如果原假設為真,P-值是抽樣分布中大于或小于樣本統(tǒng)計量的概率n左側檢驗時,P-值為曲線上方小于等于小于等于檢驗統(tǒng)計量部分的面積n右側檢驗時,P-值為曲線上方大于等于大于等于檢驗統(tǒng)計量部分的面積被稱為觀察到的(或實測的)顯著性水平nH0 能被拒絕的最小值單側檢驗n若p-值 ,不拒絕 H0n若p-值 , 拒絕 H0 雙側檢驗n若p-值 /2, 不拒絕 H0n若p-值 1020 = 0.05n = 16臨界值臨界值(s):01080 10202.41001

23、6xzn【例例】某電子元件批量生產(chǎn)的質量標準為平均使用壽命1200小時。某廠宣稱他們采用一種新工藝生產(chǎn)的元件質量大大超過規(guī)定標準。為了進行驗證,隨機抽取了100件作為樣本,測得平均使用壽命1245小時,標準差300小時。能否說該廠生產(chǎn)的電子元件質量顯著地高于規(guī)定標準? (0.05)H0: 1200H1: 1200 = 0.05n = 100臨界值臨界值(s):01245 12001.5300100 xzn1. 假定條件n總體為正態(tài)分布n2未知,且小樣本2. 使用t 統(tǒng)計量0 (1)Xtt nSn【例例】某機器制造出的肥皂厚度為5cm,今欲了解機器性能是否良好,隨機抽取10塊肥皂為樣本,測得平均厚度為5.3cm,標準差為0.3cm,試以0.05的顯著性水平檢驗機器性能良好的假設。 H0: = 5H1: 5 = 0.05df = 10 - 1 = 9臨界值臨界值(s):16. 3103 . 053 . 50nsxt 【例例】一個汽車輪胎制造商聲稱,某一等級的輪胎的平均壽命在一定的汽車重量和正常行駛條件下大于40000公里,對一個由20個輪胎組成的隨機樣本作了試驗,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論