




已閱讀5頁,還剩85頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
數(shù)理統(tǒng)計,講授:,河海大學(xué)數(shù)學(xué)系列基礎(chǔ)課程CAI,第六章 樣本及抽樣分布,隨機(jī)樣本 抽樣分布,從本章開始,我們將學(xué)習(xí)數(shù)理統(tǒng)計部分,前面五章的 內(nèi)容屬于概率論范疇。數(shù)理統(tǒng)計實際上是概率論的具體應(yīng) 用。它的研究范圍分成兩個方面,一個是統(tǒng)計推斷,另一 個是抽樣理論與試驗設(shè)計。本課程僅研究第一個方面的內(nèi) 容。統(tǒng)計推斷主要研究抽樣分布、參數(shù)估計、假設(shè)檢驗等 本章的主要內(nèi)容如下:,6.1 隨機(jī)樣本 一、總體與樣本,1、總體:研究對象的全體。通常指研究對象的某項 數(shù)量指標(biāo),可記為X、Y、Z、等,它是隨機(jī)變量。 2、個體:組成總體的單元。通常也指與總體對應(yīng)的 某項數(shù)量指標(biāo),可用X1,X2, 等表示,它們也是隨機(jī)變量。 3、樣本:來自總體的部分個體X1, ,Xn 。n稱為樣本容量。若是按隨機(jī)抽樣原則得到的,則稱其是“簡單隨機(jī)樣本”或簡稱為“隨機(jī)樣本”或“樣本”。,按隨機(jī)抽樣原則得到的樣本滿足以下兩個條件: (1)獨立性: X1, ,Xn 相互獨立; (2)同分布性: X1, ,Xn與總體同分布。 來自總體X的隨機(jī)樣本X1, ,Xn可記為,其中f(x)是X的概率函數(shù)。 樣本觀測值:對樣本X1, ,Xn進(jìn)行觀測,即 可得一組觀測值x1, ,xn,二、經(jīng)驗分布函數(shù),1、構(gòu)造 將樣本觀測值: x1, ,xn從小到大排列得,為總體X的一個經(jīng)驗分布函數(shù)。,其中N(A)表示A中元素個數(shù)。,2、經(jīng)驗分布函數(shù)的性質(zhì) (1)經(jīng)驗分布函數(shù)是分布函數(shù); (2)K.Glivenko(格涅汶科)證明:,其中F(x)=PXx為總體X的分布函數(shù)。,三、統(tǒng)計量,樣本X1, ,Xn的函數(shù)g(X1, ,Xn)稱為是總體X的 一個統(tǒng)計量,若g(X1, ,Xn)與任何未知參數(shù)無關(guān)。,4、極大、極小統(tǒng)計量 極大統(tǒng)計量:X(n)=maxX1, ,Xn, 其觀測值: x(n)=maxx1, ,xn 極小統(tǒng)計量:X(1)=minX1, ,Xn, 其觀測值: x(1)=minx1, ,xn,6.2 抽樣分布,一、 2分布,統(tǒng)計量的分布稱為抽樣分布。數(shù)理統(tǒng)計中主要研究 如下四個分布: U分布、 2分布、 t 分布和F分布。,其密度為,1.構(gòu)造,f(y) 2(n),2.再生性 若1 2(n1),2 2(n2 ), 1, 2獨立,則 1 + 2 2(n1+n2 )。 3.期望與方差 若 2(n),則E= n,D=2n。 4.分位點 設(shè) 2(n),若對于:01, 存在,費歇爾(R.A.Fisher)曾經(jīng)證明:當(dāng)n充分大時,近似 地有,其中 2(n),從而當(dāng)n充分大時(一般地45),近似地有,其中z為N(0,1)的上側(cè)分位點。,二、t分布,1.構(gòu)造 若N(0, 1), 2(n), 與獨立,則,t(n)稱為自由度為n的t分布。 其密度函數(shù)為,密度函數(shù)f(t)的圖形與N(0, 1)的密度函數(shù)的圖形 很象,只是 t(n)的圖形兩端尾巴厚一些,腰瘦一些。,2.基本性質(zhì): (1) f(t)關(guān)于t=0(縱軸)對稱。事實上,f(-t)=f(t)。 (2) f(t)的極限為N(0,1)的密度函數(shù),即,3.分位點 設(shè)Tt(n),若對:00, 滿足 PTt(n)=,則稱t(n)為t(n)的上側(cè)分位點;存在 t/2(n)0, 滿足 P|T|t/2(n)=,則稱t/2(n)為t(n) 的雙側(cè)分位點.,三、F分布,1.構(gòu)造 若1 2(n1), 22(n2),1, 2獨立,則,F(n1, n2)稱為第一自由度為n1 ,第二自由度為n2的 F分布。其密度為,2. F分布的分位點 對于:00,滿足 PTf(n1, n2)=, 則稱f(n1, n2)為F(n1, n2)的上側(cè) 分位點;類似地,稱f1- (n1, n2)為F(n1, n2)的下側(cè)分 位點。 可以證明:,四、正態(tài)總體的抽樣分布,這里分布N(0, 1)也稱為U分布。,例,例,例,本章小結(jié) 1、總體與樣本 2、經(jīng)驗分布函數(shù) 3、統(tǒng)計量概念與幾個常用的統(tǒng)計量 4、數(shù)理統(tǒng)計中的幾個常用分布(關(guān)鍵是構(gòu)造) 5、正態(tài)總體的抽樣分布定理,第七章 參數(shù)估計,點估計 點估計的評價標(biāo)準(zhǔn) 區(qū)間估計 正態(tài)總體參數(shù)的區(qū)間估計 區(qū)間估計的大樣本法,7.1 點估計 一、參數(shù)估計的概念,定義 設(shè)X1, , Xn是總體X的一個樣本,其概率函 數(shù)為f(x; ), 。其中為未知參數(shù), 為參數(shù)空間, f(x;)可表示分布律或密度函數(shù). 若統(tǒng)計量g(X1, , Xn)可 作為的一個估計,則稱其為的一個估計量,記為,若x1, , xn是樣本的一個觀測值。,由于g(x1, , xn) 是實數(shù)域上的一個點,現(xiàn)用它 來估計, 故稱這種估計為點估計。 點估計的經(jīng)典方法是矩估計法與極大似然估計法。,二、矩估計法(簡稱“矩法”),定義 用樣本矩作為總體同階矩的估計,從而解出未 知參數(shù)的方法稱為矩估計法或矩法。 的矩估計可記為,應(yīng)滿足方程:,k的取值取決于f(x; )中未知參數(shù)的維數(shù)。若維數(shù)為1,即 僅有一個參數(shù),則可在第一個方程中讓k取1;若維數(shù)為2, 則可讓k取1和2,解聯(lián)立方程即可得,或,余類推。,矩估計,三、極大似然估計法,1、極大似然思想 你從河海大學(xué)去火車站趕火車,25分鐘后列車就要開 了,你是坐公共汽車去還是坐出租車去?答案是坐出租車 去。這是因為坐出租車在25分鐘內(nèi)趕到火車站的把握大 。 一般說,事件A與參數(shù)有關(guān),取值不同,則P(A) 也不同。若A發(fā)生了,則認(rèn)為此時的值就是的估計值。 這就是極大似然思想。,例5 設(shè)袋中裝有許多黑、白球,不同顏色球的數(shù)量比 為3:1,試設(shè)計一種方法,估計任取一球為黑球的概率p。 解 易知p的值無非是1/4或3/4?,F(xiàn)從袋中有放回地任取 3只球,用X表示其中的黑球數(shù),則Xb(3, p),要估計p 的值。 對P的不同取值,X取k=0, 1, 2, 3的概率可列表如下:,X 0 1 2 3 (p=1/4) 27/64 27/64 9/64 1/64 (p=3/4) 1/64 9/64 27/64 27/64,故根據(jù)極大似然思想即知,2、似然函數(shù)與極大似然估計,為該總體的似然函數(shù)。,它實際上代表樣本,取其觀測值,時的概率。,定義,3、極大似然估計的推求,(1) 解似然方程法,稱為未知參數(shù)的似然方程。若該方程有解,則其解就是,(2) 直接法 由似然方程解不出的似然估計時,可由定義通過分 析直接推求。,注解:若概率函數(shù)中含有多個未知參數(shù),比如,則可解方程組,若碰到某些個參數(shù)用似然方程解不出,則可用直 接法推求。,例 設(shè)總體X的分布函數(shù)為,例,7.2 估計量的評選標(biāo)準(zhǔn) 一、無偏性,易知,樣本均值和樣本方差分別是總體均值和總體 方差的無偏估計。事實上,,二、有效性,易知,樣本X1, , Xn的加權(quán)平均值,都是EX的無偏估計。但當(dāng)i=1/n時,其方差最小。,事實上,由柯西不等式可知,的無偏估計類中有一個下界,這由如下的羅克 拉美(Rao-Cramer)不等式給出:,三、一致性,7.3 區(qū)間估計 一、概念,i=1,2,為兩個統(tǒng)計量,給定:01,若有 p12 =1, 則稱1 為置信度,(1,2)為的置信區(qū)間,1 為置信下 限,2為置信上限。(1,2)也稱為的區(qū)間估計。,i=i(X1, , Xn),二、置信區(qū)間,100組觀測值對應(yīng)100個置信區(qū)間,每一個置信區(qū)間 可能包含 的真值,也可能不包含 的真值。若給定 =0.05,則表示100個這樣的區(qū)間里,大約有95個包含 的真值。,對樣本X1, , Xn的每一組觀測值,比如說,我們均可由給定的置信度1,求得一個置信區(qū)間,用置信度為1的置信區(qū)間(1, 2)去估計未知參數(shù) ,顯然1是越大越好,它反映區(qū)間估計的可靠性,而 21, 則是越小越好,它反映區(qū)間估計的精度。 本課程主要討論正態(tài)總體參數(shù)的區(qū)間估計,即置信 區(qū)間問題。,7.4 正態(tài)總體參數(shù)的區(qū)間估計,一、單正態(tài)總體均值的置信區(qū)間,1、2已知,注:在推求的置性區(qū)間的過程中,我們發(fā)現(xiàn)的置性區(qū)間是不唯一的,事實上,由,(1-),1-,查表計算即得的置信度為1的置信區(qū)間,也可解得 的置信區(qū)間。(置信度為1),是的長度最短的置性區(qū)間。以后,在各種情況下, 推求置性區(qū)間的思路與這里類似。,其中01。由于標(biāo)準(zhǔn)正態(tài)分布N(0,1)的密度是 單峰偶函數(shù)。,2、2未知,二、單正態(tài)總體方差的置信區(qū)間,1、未知,查表計算,即得2的置信度為1- 的置信區(qū)間,同時,也可得到的置信度為1- 的置信區(qū)間,注:這樣求得的置信區(qū)間不一定是最佳的,但其 長度與最佳的置信區(qū)間的長度相差不大,使用較為方 便,故實際應(yīng)用時,都是用這種方法求2(或)的置信 區(qū)間。,則可類似地解得2與的置信度為1的置信區(qū)間為,2、已知,推求正態(tài)總體參數(shù)置信區(qū)間的解題步驟: (1)根據(jù)實際問題構(gòu)造隨機(jī)變量,要求僅含待估參數(shù)且分布已知; (2)令該隨機(jī)變量落在由分位點確定的區(qū)間里的概率為給定的置信度1,要求區(qū)間按幾何對稱或概率對稱; (3)解不等式得隨機(jī)的置信區(qū)間; (4)由觀測值及值查表計算得所求置信區(qū)間。,三、雙正態(tài)總體均值差的置信區(qū)間,可得1- 2的置信區(qū)間,可解得1- 2 的置信區(qū)間,四、雙正態(tài)總體方差比的置信區(qū)間,1、1,2未知,2、 1,2 已知,五、正態(tài)分布參數(shù)的單側(cè)置信限,在實際工作中,求解單側(cè)置信限的問題經(jīng)常碰到,且 具有實際意義?,F(xiàn)把單正態(tài)總體參數(shù)的單側(cè)置信限列表如 下:(雙正態(tài)總體均值差、方差比的單側(cè)置信限可類似求出,這里不再寫出)。,7.5 區(qū)間估計的大樣本法,一、雙正態(tài)總體均值差的置信區(qū)間,二、(0,1)分布總體參數(shù)的置信區(qū)間,說明:對于其它非正態(tài)分布總體,也可利用中心極限 定理在大樣本情形下,求出未知參數(shù)的近似置信區(qū)間 (指數(shù)分布總體除外)。,第八章 假設(shè)檢驗,假設(shè)檢驗的基本思想和概念 正態(tài)總體均值的假設(shè)檢驗 正態(tài)總體方差的假設(shè)檢驗,8.1假設(shè)檢驗的基本概念和思想 一、基本概念,(一) 兩類問題 1、參數(shù)假設(shè)檢驗,總體分布已知,參數(shù)未知, 由觀測值x1,xn檢驗假設(shè)H0:=0;H1:0,2、非參數(shù)假設(shè)檢驗,總體分布未知,由觀測值x1,xn 檢驗假設(shè)H0:F(x)=F0(x;); H1: F(x)F0(x;),本課程主要討論參數(shù)假設(shè)檢驗; 說明: (1)假設(shè)也稱為統(tǒng)計假設(shè); (2)H0稱為原假設(shè);H1稱為備擇假設(shè); (3)做假設(shè)檢驗的最終目的是作出推斷:是接受 原假設(shè),還是拒絕原假設(shè)而接受備擇假設(shè)。 (二)簡單假設(shè)與復(fù)合假設(shè) 如果一個統(tǒng)計假設(shè)完全確定總體的分布,則稱該 假設(shè)為簡單假設(shè),否則就稱為復(fù)合假設(shè)。,(三) 檢驗法則與拒絕域 以樣本(X1,Xn)出發(fā)制定一個法則,一旦觀 測值(x1,xn)確定后,我們由這個法則就可作出 判斷:是拒絕H0還是接受H0. 這種法則稱為H0對H1的 一個檢驗法則,簡稱檢驗法。 樣本觀測值的全體組成樣本空間S,把S分成兩 個互不相交的子集C和C*,即S=CC*,CC*=, 假設(shè)當(dāng)(x1,xn) C時,我們就拒絕H0;當(dāng) (x1,xn) C*時,我們就接受H0。子集C S就 稱為檢驗的拒絕域(或臨界域 )。,(四) 檢驗的兩類錯誤 我們給出了H0對H1的某個檢驗法則,即給出了S 的兩個劃分C與C*,由于樣本的隨機(jī)性,在進(jìn)行判斷 時,還可能犯錯誤。 拒絕H0| H0真=(x1,xn) C | H0真 第一類錯誤或“棄真” 接受H0| H0假=(x1,xn) C*| H0假 第二類錯誤或“取偽” 這兩個事件都是小概率事件,常記p拒絕H0| H0真=, p 接受H0| H0假= , ,在01之間,通常不超過0.1。,(五) 顯著性檢驗 對于給定的一對H0和H1,總可找出許多臨界域, 人們自然希望找到這種臨界域C,使得犯兩類錯誤的 概率和都很小。但在樣本容量n一定時,這又是做 不到的,除非容量 n無限增大。 奈曼皮爾遜 (NeymanPearson)提出了一個 原則:在控制犯第一類錯誤的概率的條件下,盡量 使犯第二類錯誤 小,這是最優(yōu)檢驗 (MPT) ,但是有 時MPT法則很難找到,甚至不存在。在這種情況下, 我們不得不降低要求,另提一些原則。應(yīng)用上常采納 的原則是“只對加以限制,而不考慮 的大小”。,二、顯著性檢驗法則的構(gòu)造,構(gòu)造統(tǒng)計量t =t(X1,Xn), x1,xn為樣本觀測值, 令 T=t =t (x1,xn)滿足某條件: (x1,xn) C 于是 pt T|H0真 =p(x1,xn) C| H0真 = ; t T通常用一個不等式來表示,這樣就得到了一個檢驗法 則。現(xiàn)在,我們已經(jīng)把S的劃分轉(zhuǎn)化為統(tǒng)計量 t 的值域空間的 劃分,這是一個把n維的問題轉(zhuǎn)化為一維的問題。,按這種法則做出的檢驗稱為“顯著性檢驗”,此時稱為顯著性水平或檢驗水平。,例:設(shè)某廠生產(chǎn)一種燈管,其壽命X N(,40000), 由以往經(jīng)驗知平均壽命 =1500小時,現(xiàn)采用新工藝 后,在所生產(chǎn)的燈管中抽取25只,測得平均壽命1675 小時,問采用新工藝后,燈管壽命是否有顯著提高。,故觀測值(x1,xn) C,可作出結(jié)論拒絕 H0 而接受 H1: 1500,即認(rèn)為采用新工藝后,燈管壽命有了顯著提高。,顯著性檢驗的思想和步驟: (1)根據(jù)實際問題作出假設(shè)H0與H1; (2)構(gòu)造統(tǒng)計量,在H0真時其分布已知; (3)給定水平的值(一般為0.05,0.025,0.01,0.005等), 求出H0對H1的拒絕域C; (4)查表、計算得分位點和統(tǒng)計量的值; (5)比較統(tǒng)計量與分位點值的大小,得出結(jié)論,依據(jù)是 小概率原理。,8.2 單正態(tài)總體參數(shù)的假設(shè)檢驗,一、單總體均值的假設(shè)檢驗,1、2已知的情形,對于假設(shè)H0:=0;H1:0,構(gòu)造,查表,計算,比較大小,即得結(jié)論:,說明:(1) H0:=0;H1:u0稱為雙邊HT問題;而 H0:=0;H1: 0(或0 或H0:0;H1:0 也稱為單邊HT問題,不過這是一個完備的HT問題。 (3)完
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 殯儀服務(wù)與社區(qū)公益項目合同
- 車輛抵押權(quán)登記及抵押物抵押合同
- 鋼管混凝土拱橋泵送壓力專題研究
- 地磚施工工藝流程
- 【課件】+彈力+-2024-2025學(xué)年人教版(2024)物理八年級下冊+
- 智慧園林云平臺整體解決方案智慧公園整體解決方案
- 2024年電力負(fù)荷控制員(技師)職業(yè)鑒定考試題庫(含答案)
- 非金屬礦業(yè)數(shù)字化轉(zhuǎn)型
- 2024年高考語文備考之教考結(jié)合:新高考現(xiàn)代文閱讀Ⅱ題型
- 華為企業(yè)培訓(xùn)管理
- 發(fā)行企業(yè)債法律盡職調(diào)查之訪談問題清單模版
- QData數(shù)據(jù)庫一體機(jī)方案介紹
- 化工倉儲管理系統(tǒng)方案
- 2021-2022學(xué)年貴州省黔東南州高一下學(xué)期期末文化水平測試數(shù)學(xué)試題【含答案】
- 北師大版小學(xué)數(shù)學(xué)四年級下冊《優(yōu)化》同步練習(xí)附答案
- (精心整理)初三數(shù)學(xué)幾何的動點問題專題練習(xí)及答案
- 高血壓腦出血外科治療臨床路徑
- 核電工程施工隱患排查專項培訓(xùn)課件
- Q_SLB0402-2005 產(chǎn)品鋼印及標(biāo)記移植
- 勞動者個人職業(yè)健康監(jiān)護(hù)檔案(樣板)
- 小學(xué)數(shù)學(xué)教師業(yè)務(wù)能力測試試題
評論
0/150
提交評論