




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、第六章 統(tǒng)計量及其抽樣分布統(tǒng)計學(xué)2021年8月6.1 統(tǒng)計量6.1.1 統(tǒng)計量的概念6.1.2 常用統(tǒng)計量6.1.3 次序統(tǒng)計量6.1.4 充分統(tǒng)計量參數(shù)和統(tǒng)計量參數(shù)(parameter)描畫總體特征的概括性數(shù)字度量,是研討者想要了解的總體的某種特征值一個總體的參數(shù):總體均值()、規(guī)范差()、總體比例();兩個總體參數(shù):(1 -2)、(1-2)、(1/2)總體參數(shù)通常用希臘字母表示 統(tǒng)計量(statistic)用來描畫樣本特征的概括性數(shù)字度量,它是根據(jù)樣本數(shù)據(jù)計算出來的一些量,是樣本的函數(shù)一個總體參數(shù)推斷時的統(tǒng)計量:樣本均值(x)、樣本規(guī)范差(s)、樣本比例(p)等兩個總體參數(shù)推斷時的統(tǒng)計量:
2、 (x1-x2)、(p1-p2)、(s1/s2)樣本統(tǒng)計量通常用小寫英文字母來表示 2021年8月常用統(tǒng)計量樣本均值樣本方差樣本規(guī)范差2021年8月常用統(tǒng)計量樣本變異系數(shù)K階距K階中心距2021年8月次序統(tǒng)計量哪些是次序統(tǒng)計量:中位數(shù)、分位數(shù)、四分位數(shù)、極差和均值充分統(tǒng)計量 統(tǒng)計計量加工過程中一點信息都不損失的統(tǒng)計量通常稱為充分統(tǒng)計量。6.2 關(guān)于分布的幾個概念 6.2.1 抽樣分布6.2.2 漸近分布6.2.3 隨機模擬獲得的近似分布樣本統(tǒng)計量的概率分布,是一種實際分布在反復(fù)選取容量為n的樣本時,由該統(tǒng)計量的一切能夠取值構(gòu)成的相對頻數(shù)分布 隨機變量是 樣本統(tǒng)計量樣本均值, 樣本比例,樣本方差
3、等結(jié)果來自容量一樣的一切能夠樣本提供了樣本統(tǒng)計量長久而穩(wěn)定的信息,是進展推斷的實際根底,也是抽樣推斷科學(xué)性的重要根據(jù) 抽樣分布 (sampling distribution)2021年8月抽樣分布的構(gòu)成過程 (sampling distribution)總體計算樣本統(tǒng)計量如:樣本均值、比例、方差樣本漸近分布 當(dāng)n較大時,就用極限分布作為抽樣分布的一種近似,這種極限分布稱為漸近分布。2 分布由阿貝(Abbe) 于1863年首先給出,后來由海爾墨特(Hermert)和卡皮爾遜(KPearson) 分別于1875年和1900年推導(dǎo)出來設(shè) ,那么令 ,那么 y 服從自在度為1的2分布,即對于n個正態(tài)隨
4、機變量y1 ,y2 ,yn,那么隨機變量 稱為具有n個自在度的2分布,記為c2-分布(2-distribution)2021年8月不同自在度的c2-分布c 2n=1n=4n=10n=202021年8月分布的變量值一直為正 分布的外形取決于其自在度n的大小,通常為不對稱的正偏分布,但隨著自在度的增大逐漸趨于對稱 期望為:E(2)=n,方差為:D(2)=2n(n為自在度) 可加性:假設(shè)U和V為兩個獨立的2分布隨機變量,U2(n1),V2(n2),那么U+V這一隨機變量服從自在度為n1+n2的2分布 c2-分布(性質(zhì)和特點)2021年8月c2-分布(用Excel計算c2分布的概率)利用Excel提供
5、的【CHIDIST】統(tǒng)計函數(shù),計算c2分布右單尾的概率值語法:CHIDIST(x,degrees_freedom) ,其中df為自在度,x,是隨機變量的取值利用【CHIINV】函數(shù)那么可以計算給定右尾概率和自在度時相應(yīng)的反函數(shù)值 語法:CHIINV(probability,degrees_freedom) 用Excel計算c2 分布的概率2021年8月2021年8月t 分布t-分布 (t-distribution)提出者是William Gosset,也被稱為學(xué)生分布(students t) t 分布是類似正態(tài)分布的一種對稱分布,通常要比正態(tài)分布平坦和分散。一個特定的分布依賴于稱之為自在度的參
6、數(shù)。隨著自在度的增大,分布也逐漸趨于正態(tài)分布 xt 分布與規(guī)范正態(tài)分布的比較t 分布規(guī)范正態(tài)分布t不同自在度的t分布規(guī)范正態(tài)分布t (df = 13)t (df = 5)z2021年8月t分布臨界值t分布的上分位點t (n)t(n)n45, t (n) zZ為規(guī)范正態(tài)分布上分位點t1-=-t 2021年8月結(jié)論1:設(shè)總體X服從正態(tài)分布N,2, 2未知.(x1,x2,xn)為來自該總體的樣本,那么統(tǒng)計量兩個重要結(jié)論2021年8月結(jié)論2:設(shè)總體X服從正態(tài)分布N1,2總體Y服從正態(tài)分布N2,2( 2 未知),X與Y獨立,且X1,X2,Xn1和Y1,Y2,Yn2分別是來自總體X和Y的樣本,那么統(tǒng)計量
7、兩個重要結(jié)論2021年8月2021年8月t-分布(用Excel計算t分布的概率和臨界值)利用Excel中的【TDIST】統(tǒng)計函數(shù),可以計算給定值和自在度時分布的概率值語法:TDIST(x,degrees_freedom,tails) 利用【TINV】函數(shù)那么可以計算給定概率和自在度時的相應(yīng) 語法:TINV(probability,degrees_freedom) 用Excel計算t分布的臨界值2021年8月F分布2021年8月為留念統(tǒng)計學(xué)家費希爾(R.A.Fisher) 以其姓氏的第一個字母來命名那么設(shè)假設(shè)U為服從自在度為n1的2分布,即U2(n1),V為服從自在度為n2的2分布,即V2(n2
8、),且U和V相互獨立,那么 稱F為服從自在度n1和n2的F分布,記為F-分布(F distribution)2021年8月不同自在度的F分布F(1,10)(5,10)(10,10)2021年8月F分布的上分位點F (n1,n2)F(n1,n2)2021年8月 Fn11,n21 其中s12 和s22 分別是總體X和Y的樣本方差。 F分布在假設(shè)檢驗、區(qū)間估計、方差分析、回歸分析及實驗設(shè)計等領(lǐng)域有重要的運用 設(shè)總體XN1, 12 ,YN2,22 ,X與Y獨立,且X1,X2, X n l與Y1,Y2,Yn2分別是來自總體X和Y的樣本,那么統(tǒng)計量F=一個重要結(jié)論2021年8月F-分布(用Excel計算F
9、分布的概率和臨街值)利用Excel提供的【FDIST】統(tǒng)計函數(shù),計算分布右單尾的概率值語法:FDIST(x,degrees_freedom1,degrees_freedom2)利用【FINV】函數(shù)那么可以計算給定單尾概率和自在度時的相應(yīng) 語法: FINV(probability,degrees_freedom1,degrees_freedom2) 用Excel計算F分布的概率2021年8月2021年8月樣本均值的分布與中心極限定理在反復(fù)選取容量為n的樣本時,由樣本均值的一切能夠取值構(gòu)成的相對頻數(shù)分布一種實際概率分布推斷總體均值的實際根底樣本均值的分布2021年8月樣本均值的分布(例題分析)【例
10、】設(shè)一個總體,含有4個元素(個體) ,即總體單位數(shù)N=4。4 個個體分別為x1=1,x2=2,x3=3,x4=4 ??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差2021年8月樣本均值的分布 (例題分析) 現(xiàn)從總體中抽取n2的簡單隨機樣本,在反復(fù)抽樣條件下,共有42=16個樣本。一切樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個察看值第一個察看值一切能夠的n = 2 的樣本共16個2021年8月樣本均值的分布 (例題分析) 計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.
11、52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個察看值第一個察看值16個樣本的均值xx樣本均值的抽樣分布1.000.10.20.3P ( x )1.53.04.03.52.02.52021年8月樣本均值的分布與總體分布的比較 (例題分析) = 2.5 2 =1.25總體分布樣本均值分布比較及結(jié)論:1. 樣本均值的均值數(shù)學(xué)期望等于總體均值 2. 樣本均值的方差等于總體方差的1/n2021年8月樣本均值的分布與中心極限定理 = 50 =10X總體分布n = 4抽樣分布xn =16當(dāng)總體服從正態(tài)分布N(,2)時,來自該總體的一切容量為n的樣本的均
12、值x也服從正態(tài)分布,x 的期望值為,方差為2/n。即xN(,2/n)2021年8月中心極限定理(central limit theorem)當(dāng)樣本容量足夠大時(n 30) ,樣本均值的抽樣分布逐漸趨于正態(tài)分布從均值為,方差為 2的一個恣意總體中抽取容量為n的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為、方差為2/n的正態(tài)分布一個恣意分布的總體x2021年8月中心極限定理 (central limit theorem)x 的分布趨于正態(tài)分布的過程2021年8月抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本樣本均值正態(tài)分布樣本均值正態(tài)分布樣本均值非正態(tài)分布2021年8月樣本
13、均值的分布實例解:根據(jù)中心極限定理,不論總體的分布是什么外形,在假定總體分布不是很偏的情形下,當(dāng)從總體中隨機選取n=36的 樣本時,樣本均值x的分布近似服從均值x= =10、標(biāo) 準(zhǔn)差 的正態(tài)分布,即 N(10,0.12) 【例6.4】設(shè)從一個均值=10、規(guī)范差 =0.6的總體中隨機選取容量為n=36的樣本。假定該總體不是很偏的,要求:(1)計算樣本均值x 小于9.9近似概率。(2)計算樣本均值 x 超越9.9近似概率。(3)計算樣本均值 x 在總體均值=10附近0.1范圍內(nèi)的近似概率。 2021年8月樣本均值的分布實例2021年8月樣本均值的分布實例2021年8月樣 本 比 例 的 分 布總體
14、(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品) 與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為樣本比例的分布(proportion)2021年8月在反復(fù)選取容量為n的樣本時,由樣本比例的一切能夠取值構(gòu)成的相對頻數(shù)分布一種實際概率分布當(dāng)樣本容量很大時,樣本比例的抽樣分布可用正態(tài)分布近似,即 樣本比例的分布2021年8月樣本比例的抽樣分布實例解:(1)雖然我們對電瓶的壽命分布外形不甚了解,但根據(jù)中心極限定理可以推出50個電瓶的平均壽命的分布近似服從正態(tài)分布,其均值【例6.5】某汽車電瓶商聲稱其消費的電瓶具有均值為60個月、規(guī)范差為6個月的壽命分布
15、?,F(xiàn)假設(shè)質(zhì)檢部門決議檢驗該廠的說法能否正確,為此隨機抽取了50個該廠消費的電瓶進展壽命檢驗。(1假定廠商聲稱是正確的,試描畫50個電瓶的平均壽命的抽樣分布。(2)假定廠商聲稱正確,那么50個樣品組成的樣本的平均壽命不超越57個月的概率是多少?2021年8月樣本比例的抽樣分布實例(2)假設(shè)廠方聲稱是正確的,那么察看到50個電池的平均壽命不超越57個月的概率為:假設(shè)廠方聲稱是正確的,那么察看到50個電池的平均壽命不超越57個月的概率為0.0002。一個不能夠時間。根據(jù)小概率事件原理,察看到的50個電瓶的平均壽命低于57個月的事件是不能夠的;反之假設(shè)真的察看到50個電瓶的壽命低于57個月,那么有理由
16、疑心廠方說法的正確性,即以為廠方的說法是不正確的。2021年8月樣本比例抽樣分布實例解:知N(9,22),根據(jù)上述性質(zhì)10X也服從正態(tài)分布,由于所以【例6.6】設(shè)N(9,22),試描畫10的分布。2021年8月樣本比例的分布實例解:設(shè)600份報表中至少有一處錯誤的報表所占的比例為由題意可知: 【例6.7】假定某統(tǒng)計人員在其填寫的報表中有2%至少會有一處錯誤,假設(shè)我們檢查了一個由600份報表組成的隨機樣本,其中至少有一處錯誤的報表所占的比重在0.0250.070之間的概率為多大?2021年8月樣本比例的分布實例 由于2021年8月樣本比例的分布實例即該統(tǒng)計人員所填寫的報告中至少有一處錯誤的報表所
17、占的比例在0.0250.070之間的概率為19.02%。2021年8月解:由于兩個總體均為正態(tài)分布,所以8個新生的平均成果x1 ,x2 分別為正態(tài)分布, x1 -x2 也為正態(tài)分布,且兩個總體比例之差分布 實例【例6.8】設(shè)有甲、乙兩所著名高校在某年錄取新生時,甲校的平均分為655分,且服從正態(tài)分布,規(guī)范差為20分;乙校的平均分為625分,也是正態(tài)分布,規(guī)范差為25分。先從甲、乙兩校各隨機抽取8名新生計算其平均分?jǐn)?shù),出現(xiàn)甲校比乙校的平均分低的能夠性有多大?2021年8月兩個總體比例之差的估計實例【例6.9】一項抽樣調(diào)查闡明甲城市的消費者中有15%的人喝過商標(biāo)為“圣潔牌的礦泉水,而城市的消費者中
18、只需8%的人喝過該種礦泉水。假設(shè)這些數(shù)據(jù)是真實的,那么當(dāng)我們分別從甲城市抽取120人,乙城市抽取140人組成兩個獨立隨機樣本時,樣本比例差不低于0.08的概率有多大?解:根據(jù)題意2021年8月樣 本 方 差 的 分 布樣本方差的分布在反復(fù)選取容量為n的樣本時,由樣本方差的一切能夠取值構(gòu)成的相對頻數(shù)分布對于來自正態(tài)總體的簡單隨機樣本,那么比值 的抽樣分布服從自在度為 (n -1) 的2分布,即2021年8月統(tǒng)計量的規(guī)范誤差統(tǒng)計量的規(guī)范誤差 (standard error)樣本統(tǒng)計量抽樣分布的規(guī)范差,稱為統(tǒng)計量的規(guī)范誤差衡量統(tǒng)計量的離散程度,測度了用樣本統(tǒng)計量估計總體參數(shù)的準(zhǔn)確程度樣本均值和樣本比例的規(guī)范誤差分別為2021年8月估計的規(guī)范誤差 (standard error of estimation)當(dāng)計算規(guī)范誤時涉及的總體參數(shù)未知時,用樣本統(tǒng)計量替代計算的規(guī)范誤差,稱為估計的規(guī)范誤差以樣本均值為例:當(dāng)總體規(guī)范差未知時,可用樣本規(guī)范差s替代,那么在反復(fù)抽樣條件下,樣本均值的估計規(guī)范誤為2021年8月Excel中的統(tǒng)計函數(shù)BINOMDIST計算二項分布的概率POISSON計算泊松分布的概率HYPGEOMDIST計算超幾何分布的概率NORMDIST計算正態(tài)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 修水渠勞務(wù)合同范例
- 農(nóng)場樂園采購合同范本
- 農(nóng)業(yè)股東協(xié)議合同范例
- 個人苗木購銷合同范本
- 公司訂購電梯合同范例
- 抗條銹病小麥-四倍體長穗偃麥草6E易位系的創(chuàng)制與鑒定
- 空芯光纖構(gòu)成的高靈敏度多參量傳感器
- 中天購房合同范例
- 主播勞動合同范例
- 公司監(jiān)控合同范例
- 石膏板吊頂合同
- 《CT檢查技術(shù)》課件-CT圖像后處理
- 水產(chǎn)生物遺傳育種學(xué)課件
- 婦產(chǎn)科醫(yī)患溝通護理課件
- 第3課《萬物共存》課件
- 精致的八寶飯
- GB/T 43602-2023物理氣相沉積多層硬質(zhì)涂層的成分、結(jié)構(gòu)及性能評價
- 醫(yī)院預(yù)算執(zhí)行情況分析報告
- 生活老師培訓(xùn)資料課件
- 年終存貨盤點管理制度
- 智能化弱電工程維保方案全套
評論
0/150
提交評論