多媒體課件_統(tǒng)計學_本_第八周

上傳人：2*** IP屬地：湖北上傳時間：2022-03-07 格式：PPT 頁數(shù)：123 大小：1.61MB 積分：30 舉報 版權(quán)申訴

已閱讀5頁，還剩118頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、了解統(tǒng)計量及其分布的幾個概念了解統(tǒng)計量及其分布的幾個概念了解由正態(tài)分布導出的幾個重要分布了解由正態(tài)分布導出的幾個重要分布理解樣本均值的分布與中心極限定理理解樣本均值的分布與中心極限定理掌握單樣本比例和樣本方差的抽樣分布掌握單樣本比例和樣本方差的抽樣分布能夠借助軟件計算相關(guān)的分位數(shù)能夠借助軟件計算相關(guān)的分位數(shù)設(shè)X1,X2,Xn是從總體X中抽取的容量為n的一個樣本，如果由此樣本構(gòu)造一個函數(shù)T(X1,X2,Xn)，不依賴于任何未知參數(shù)，則稱函數(shù)T(X1,X2,Xn)是一個統(tǒng)計量n樣本均值、樣本比例、樣本方差等都是統(tǒng)計量統(tǒng)計量是樣本的一個函數(shù)統(tǒng)計量是統(tǒng)計推斷的基礎(chǔ)一組樣本觀測值X1,X2,Xn由小到

2、大的排序 X（1）X（2） X（i） X（n）后，稱X（1），X（2），X（n）為次序統(tǒng)計量中位數(shù)、分位數(shù)、四分位數(shù)等都是次序統(tǒng)計量樣本統(tǒng)計量的概率分布，是一種理論分布n在重復選取容量為n的樣本時，由該統(tǒng)計量的所有可能取值形成的相對頻數(shù)分布隨機變量是樣本統(tǒng)計量樣本統(tǒng)計量n樣本均值, 樣本比例，樣本方差等結(jié)果來自容量相同容量相同的所有所有可能樣本提供了樣本統(tǒng)計量長遠而穩(wěn)定的信息，是進行推斷的理論基礎(chǔ)，也是抽樣推斷科學性的重要依據(jù) 由阿貝(Abbe) 于1863年首先給出，后來由海爾墨特(Hermert)和卡皮爾遜(KPearson) 分別于1875年和1900年推導出來設(shè) ，則令，則

3、Y 服從自由度為1的2分布，即當總體，從中抽取容量為n的樣本，則2( ,)XN (0,1)XzN2Yz2(1)Y2( ,)XN 2212()(1)niixxn分布的變量值始終為正分布的形狀取決于其自由度n的大小，通常為不對稱的正偏分布，但隨著自由度的增大逐漸趨于對稱期望為：E(2)=n，方差為：D(2)=2n(n為自由度) 可加性：若U和V為兩個獨立的2分布隨機變量，U2(n1)，V2(n2),則U+V這一隨機變量服從自由度為n1+n2的2分布由統(tǒng)計學家費希爾(R.A.Fisher) 提出的，以其姓氏的第一個字母來命名設(shè)若U為服從自由度為n1的2分布，即U2(n1)，V為服從自由度為

4、n2的2分布，即V2(n2),且U和V相互獨立，則稱F為服從自由度n1和n2的F分布，記為12U nFV n12( ,)FF n n/2/2/2(0, 1),2|UNP UzzP Uzz設(shè)設(shè)統(tǒng)統(tǒng)計計量量對對給給定定的的常常數(shù)數(shù)（0 0 )=,則則(2)若若P(X)=,則則21( )n2( )n2( ) n2 分布的分位數(shù)分布的分位數(shù)【函數(shù)調(diào)用函數(shù)調(diào)用】CHINV(Probability,Degrees_freedom)計算給定單尾概率時的計算給定單尾概率時的分布分布反函數(shù)值反函數(shù)值,也就是所也就是所謂的臨界值，其中謂的臨界值，其中Probability為為分布的單尾概率分布的單尾概率，D

5、egrees_freedom為自由度。為自由度。2 2 t分布的雙側(cè)分位數(shù)分布的雙側(cè)分位數(shù) 設(shè)設(shè)Xt(n),對于給定對于給定(0)=,則稱則稱為為t(n)分布的分布的水平雙側(cè)分位數(shù)水平雙側(cè)分位數(shù), 記為記為:/2( )tn2/ 2()tn/ 2()tn2注：注：當自由度當自由度n充分大時，充分大時，t分布近似于標準分布近似于標準正態(tài)分布，正態(tài)分布，/2/2( ),( ).tnztnz一般當一般當45 n時，時，t分布分布的分位數(shù)可用正態(tài)近似的分位數(shù)可用正態(tài)近似.為為設(shè)設(shè)/2( )tn)(nt的雙側(cè)的雙側(cè)分位數(shù)，則分位數(shù)，則/2( )1/2,P Ttn /2( )/2,P Ttn 【函數(shù)調(diào)用函

6、數(shù)調(diào)用】TINV(Probability,Degrees_freedom)計算給概率和自由度時的計算給概率和自由度時的 t分布分布的的t值值,也就是所謂的也就是所謂的臨界值，其中臨界值，其中Probability為為對應(yīng)于雙尾對應(yīng)于雙尾t分布的單尾分布的單尾概率，概率，Degrees_freedom為自由度。為自由度。F F分布的上側(cè)分位數(shù)分布的上側(cè)分位數(shù)Xf(x)設(shè)設(shè)X , 對于給定對于給定(0)=,則稱則稱為為F分布的分布的水平水平上側(cè)分位數(shù)上側(cè)分位數(shù),記為記為:12( ,)F n n12( ,)F n n12( ,)F n n若若P(F)=(比較大比較大),則則P(1/F1/)=1-

7、,1211(,)Fn n故故1211(,)Fnn【函數(shù)調(diào)用函數(shù)調(diào)用】FINV(Probability,Degrees_freedom1,Degrees_freedom2)計算給定單尾概率為計算給定單尾概率為時的時的 F分布分布的反函數(shù)值的反函數(shù)值,也就是也就是所謂的臨界值，其中，所謂的臨界值，其中，Degrees_freedom1為分子自為分子自由度，由度，Degrees_freedom2為分母自由度。為分母自由度。在重復選取容量為n的樣本時，由樣本均值的所有可能取值形成的相對頻數(shù)分布一種理論概率分布推斷總體均值的理論基礎(chǔ)x5x50 x2.5xxn從均值為從均值為，方差為，方差為 2的一

8、個任意總體中抽取容量為的一個任意總體中抽取容量為n的樣本，當?shù)臉颖?，當n充分大時，樣本均值的抽樣分布近似服從充分大時，樣本均值的抽樣分布近似服從均值為均值為、方差為、方差為2/n的正態(tài)分布的正態(tài)分布x總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比n不同性別的人與全部人數(shù)之比n合格品(或不合格品) 與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為011NNNN或011nnppnn或在重復選取容量為n的樣本時，由樣本比例的所有可能取值形成的相對頻數(shù)分布一種理論概率分布當樣本容量很大時，樣本比例的抽樣分布可用正態(tài)分布近似推斷總體比例的理論基礎(chǔ)樣本比例的數(shù)學期望樣本比例的方差n重復抽樣n不重

9、復抽樣( )E p2(1)pn2(1)1pNnnN兩個總體都為正態(tài)分布，即，兩個樣本均值之差的抽樣分布服從正態(tài)分布，其分布的數(shù)學期望為兩個總體均值之差方差為各自的方差之和 2111(,)XN 2222(,)XN 12xx1212()E xx122221212xxnn222(1)(1)nsn22(1)ns211222(1,1)sF nns估計量與估計值的概念估計量與估計值的概念點估計與區(qū)間估計的區(qū)別點估計與區(qū)間估計的區(qū)別評價估計量優(yōu)良性的標準評價估計量優(yōu)良性的標準一個總體參數(shù)的區(qū)間估計方法一個總體參數(shù)的區(qū)間估計方法兩個總體參數(shù)的區(qū)間估計方法兩個總體參數(shù)的區(qū)間估計方法樣本量的確定方法樣本量

10、的確定方法估計量：用于估計總體參數(shù)的隨機變量n如樣本均值，樣本比例, 樣本方差等n例如: 樣本均值就是總體均值的一個估計量參數(shù)用表示，估計量用表示估計值：估計參數(shù)時計算出來的統(tǒng)計量的具體值n如果樣本均值 x =80，則80就是的估計值用樣本的估計量的某個取值直接作為總體參數(shù)的估計值例如：用樣本均值直接作為總體均值的估計；用兩個樣本均值之差直接作為總體均值之差的估計無法給出估計值接近總體參數(shù)程度的信息n雖然在重復抽樣條件下，點估計的均值可望等于總體真值，但由于樣本是隨機的，抽出一個具體的樣本得到的估計值很可能不同于總體真值n一個點估計量的可靠性是由它的抽樣標準誤差來衡量的，這表明一個具體的

11、點估計值無法給出估計的可靠性的度量在點估計的基礎(chǔ)上，給出總體參數(shù)估計的一個區(qū)間范圍，該區(qū)間由樣本統(tǒng)計量加減估計誤差而得到根據(jù)樣本統(tǒng)計量的抽樣分布能夠?qū)颖窘y(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量n比如，某班級平均分數(shù)在7585之間，置信水平是95% xxzx2將構(gòu)造置信區(qū)間的步驟重復很多次，置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平表示為 (1 - n 為是總體參數(shù)未在區(qū)間內(nèi)的比例常用的置信水平值有 99%, 95%, 90%n相應(yīng)的相應(yīng)的為0.01，0.05，0.10由樣本統(tǒng)計量所構(gòu)造的總體參數(shù)的估計區(qū)間稱為置信區(qū)間統(tǒng)計學家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù)，所

12、以給它取名為置信區(qū)間用一個具體的樣本所構(gòu)造的區(qū)間是一個特定的區(qū)間，我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值n我們只能是希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個，但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個n總體參數(shù)以一定的概率落在這一區(qū)間的表述是錯誤的無偏性：無偏性：估計量抽樣分布的數(shù)學期望等于被估計的總體參數(shù)12一致性：一致性：隨著樣本量的增大，估計量的值越來越接近被估計的總體參數(shù)2xp2s1.假定條件n總體服從正態(tài)分布,且方差() 已知n如果不是正態(tài)分布，可由正態(tài)分布來近似 (n 30)2.使用正態(tài)分布統(tǒng)計量 z(0,1)xzNn22()sxzxznn或未知

13、【例例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主，為對食品一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主，為對食品質(zhì)量進行監(jiān)測，企業(yè)質(zhì)檢部門經(jīng)常要進行抽檢，以分析每袋質(zhì)量進行監(jiān)測，企業(yè)質(zhì)檢部門經(jīng)常要進行抽檢，以分析每袋重量是否符合要求?，F(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了重量是否符合要求?，F(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了25袋，測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從袋，測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布，且總體標準差為正態(tài)分布，且總體標準差為10g。試估計該批產(chǎn)品平均重量。試估計該批產(chǎn)品平均重量的置信區(qū)間，置信水平為的置信區(qū)間，置信水平為95%112.5101.0103.0102

14、.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3已知N(，102)，n=25, 1- = 95%，z/2=1.96。根據(jù)樣本數(shù)據(jù)計算得：。由于是正態(tài)總體，且方差已知?？傮w均值在1-置信水平下的置信區(qū)間為210105.361.9625105.363.92101.44,109.28xzn該食品平均重量的置信區(qū)間為該食品平均重量的置信區(qū)間為101.44g109.28g105.36x 23353927364436424643313342

15、534554472434283936444039493834485034394548453227.7739.51.6453639.52.1337.37,41.63sxzn39.5x 7.77s 1. 假定條件n總體服從正態(tài)分布,但方差() 未知n小樣本 (n 30)2. 使用 t 分布統(tǒng)計量 (1)xtt nsn2sxtn1510152014801500145014801510152014801490153015101460146014701470224.771490221476.8,1503.2sxtn1490 x 24.77s 1.假定條件n總體服從二項分布n可以

16、由正態(tài)分布來近似2.使用正態(tài)分布統(tǒng)計量 z(0,1)(1)pzNn2(1- )pppzn【例】某城市想要估計下崗職工中女性所占的比例，隨機地抽取了100名下崗職工，其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區(qū)間2(1)65%(165%)65%1.9610065%9.35%55.65%,74.35%pppzn該城市下崗職工中女性比例的置信該城市下崗職工中女性比例的置信區(qū)間為區(qū)間為55.65%74.35% 1.估計一個總體的方差或標準差2.假設(shè)總體服從正態(tài)分布3.總體方差 2 的點估計量為s2,且22211nsn222222121111nsnsnn【例例】一家食品

17、生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主，現(xiàn)從某一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主，現(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了天生產(chǎn)的一批食品中隨機抽取了25袋，測得每袋重量如袋，測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布。以下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布。以95%的置信水平建立該種食品重量方差的置信區(qū)間的置信水平建立該種食品重量方差的置信區(qū)間 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3解

18、:已知n25，1-95% ,根據(jù)樣本數(shù)據(jù)計算得 s2 =93.21 2置信度為95%的置信區(qū)間為 22210.975(1)(24)12.4011n2220.025(1)(24)39.3641n2225193.2125193.2139.364112.401156.83180.39該企業(yè)生產(chǎn)的食品總體重量標準差的的置信區(qū)該企業(yè)生產(chǎn)的食品總體重量標準差的的置信區(qū)間為間為7.54g13.43g均值均值比例比例方差方差大樣本大樣本小樣本小樣本大樣本大樣本 2 2分布分布 2 2已知已知 2 2已知已知Z Z分布分布 2 2未知未知Z Z分布分布Z Z分布分布Z Z分布分布 2 2未知未知t t分布分布了

19、解假設(shè)檢驗的基本思想了解假設(shè)檢驗的基本思想掌握假設(shè)檢驗的步驟掌握假設(shè)檢驗的步驟對實際問題作假設(shè)檢驗對實際問題作假設(shè)檢驗利用置信區(qū)間進行假設(shè)檢驗利用置信區(qū)間進行假設(shè)檢驗利用利用P - 值進行假設(shè)檢驗值進行假設(shè)檢驗對總體參數(shù)的的數(shù)值所作的一種陳述總體參數(shù)包括總體均值總體均值、比例比例、方差方差等分析之前之前必需陳述事先對總體參數(shù)或分布形式作出某種假設(shè)，然后利用樣本信息來判斷原假設(shè)是否成立有參數(shù)假設(shè)檢驗和非參數(shù)假設(shè)檢驗采用邏輯上的反證法，依據(jù)統(tǒng)計上的小概率原理什么是原假設(shè)？什么是原假設(shè)？(null hypothesis)待檢驗的假設(shè)，又稱“0假設(shè)”研究者想收集證據(jù)予以反對的假設(shè)3. 總是有等號

20、 , 或 4. 表示為 H0nH0：某一數(shù)值 n指定為 = 號，即或 1.例如, H0： 3190（克）什么是備擇假設(shè)？什么是備擇假設(shè)？(alternative hypothesis)與原假設(shè)對立的假設(shè)，也稱“研究假設(shè)”研究者想收集證據(jù)予以支持的假設(shè)總是有不等號: , 或表示為 H1nH1：某一數(shù)值，或某一數(shù)值1.例如, H1： 3910(克)，或 3910克1.第一類錯誤（棄真錯誤）第一類錯誤（棄真錯誤）n原假設(shè)為真時拒絕原假設(shè)n會產(chǎn)生一系列后果n第一類錯誤的概率為l被稱為顯著性水平2.第二類錯誤（取偽錯誤）第二類錯誤（取偽錯誤）n原假設(shè)為假時接受原假設(shè)n第二類錯誤的概率為 (B

21、eta)假設(shè)檢驗的流程假設(shè)檢驗的流程提出假設(shè)提出假設(shè)確定適當?shù)臋z驗統(tǒng)計量確定適當?shù)臋z驗統(tǒng)計量規(guī)定顯著性水平規(guī)定顯著性水平計算檢驗統(tǒng)計量的值計算檢驗統(tǒng)計量的值作出統(tǒng)計決策作出統(tǒng)計決策什么是檢驗統(tǒng)計量？什么是檢驗統(tǒng)計量？1. 用于假設(shè)檢驗決策的統(tǒng)計量2. 選擇統(tǒng)計量的方法與參數(shù)估計相同，需考慮n是大樣本還是小樣本n總體方差已知還是未知3. 檢驗統(tǒng)計量的基本形式為0XZn 什么是顯著性水平？什么是顯著性水平？1. 是一個概率值2. 原假設(shè)為真時，拒絕原假設(shè)的概率n被稱為抽樣分布的拒絕域3. 表示為 (alpha)n常用的值有0.01, 0.05, 0.104. 由研究者事先確定計算檢驗的統(tǒng)計量

22、根據(jù)給定的顯著性水平，查表得出相應(yīng)的臨界值z或z/2， t或t/2將檢驗統(tǒng)計量的值與水平的臨界值進行比較得出拒絕或不拒絕原假設(shè)的結(jié)論是一個概率值如果原假設(shè)為真，P-值是抽樣分布中大于或小于樣本統(tǒng)計量的概率n左側(cè)檢驗時，P-值為曲線上方小于等于小于等于檢驗統(tǒng)計量部分的面積n右側(cè)檢驗時，P-值為曲線上方大于等于大于等于檢驗統(tǒng)計量部分的面積被稱為觀察到的(或?qū)崪y的)顯著性水平nH0 能被拒絕的最小值單側(cè)檢驗n若p-值 ,不拒絕 H0n若p-值 , 拒絕 H0 雙側(cè)檢驗n若p-值 /2, 不拒絕 H0n若p-值 1020 = 0.05n = 16臨界值臨界值(s):01080 10202.41001

23、6xzn【例例】某電子元件批量生產(chǎn)的質(zhì)量標準為平均使用壽命1200小時。某廠宣稱他們采用一種新工藝生產(chǎn)的元件質(zhì)量大大超過規(guī)定標準。為了進行驗證，隨機抽取了100件作為樣本，測得平均使用壽命1245小時，標準差300小時。能否說該廠生產(chǎn)的電子元件質(zhì)量顯著地高于規(guī)定標準？ (0.05)H0: 1200H1: 1200 = 0.05n = 100臨界值臨界值(s):01245 12001.5300100 xzn1. 假定條件n總體為正態(tài)分布n2未知，且小樣本2. 使用t 統(tǒng)計量0 (1)Xtt nSn【例例】某機器制造出的肥皂厚度為5cm，今欲了解機器性能是否良好，隨機抽取10塊肥皂為樣本，測得平均厚度為5.3cm，標準差為0.3cm，試以0.05的顯著性水平檢驗機器性能良好的假設(shè)。 H0: = 5H1: 5 = 0.05df = 10 - 1 = 9臨界值臨界值(s):16. 3103 . 053 . 50nsxt 【例例】一個汽車輪胎制造商聲稱，某一等級的輪胎的平均壽命在一定的汽車重量和正常行駛條件下大于40000公里，對一個由20個輪胎組成的隨機樣本作了試驗，

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

多媒體課件_統(tǒng)計學_本_第八周

文檔簡介

溫馨提示

最新文檔

評論

多媒體課件_統(tǒng)計學_本_第八周

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔