




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、 Ch1 數(shù)理統(tǒng)計的基本概念1.1數(shù)理統(tǒng)計的基本問題1.1.1數(shù)理統(tǒng)計的任務(wù)例1 實驗:隨機在一大批產(chǎn)品中抽取產(chǎn)品進行檢驗。(1)一旦查出廢品即停止試驗,認為該批產(chǎn)品不合格;(2)若到第件還未查出廢品也停止試驗,認為該批產(chǎn)品合格。設(shè)為檢查件數(shù),則z的概率分布為若p已知,可解決概率問題: (2)若未知,則需解決統(tǒng)計問題: 有實驗結(jié)果推斷出:()估計;()檢驗pp0;()設(shè)計n0=?數(shù)理統(tǒng)計的基本思想:從全體研究對數(shù)中抽取一部分實驗,由實驗結(jié)果推斷全體的數(shù)理規(guī)律。1.1.2總體與樣本總體研究對象(數(shù)量指標)的全體(統(tǒng)計規(guī)律)。z或其分布F(x)樣本獨立同分布的個隨機變量X1, X2, Xn,記X1
2、, X2, Xn F(x)樣本觀察值x1,xn樣本的一次實現(xiàn)(n個實數(shù))1.1.3經(jīng)驗分布與直方圖(非高數(shù)統(tǒng)計)經(jīng)驗分布函數(shù)Fn(x)=其中 x1,xn,-=x(1)x(n)<x(n+1)= 格列文科定理, 直方圖 a=a0<a1<.<am=b 頻率fj=nj/nx1,.,xn中溶入aj-1,aj的比例aaj-1ajb作(aj-aj-1)*fj/(aj-aj-1)的矩形大數(shù)定律 ,其中pj=P(aj-1<zaj)1.1.4 統(tǒng)計量統(tǒng)計量T=g(X1, X2, Xn)樣本的(可測)函數(shù),與總體未知函數(shù)無關(guān) 如是統(tǒng)計量,但不是樣本均值 樣本方差 樣本階原點矩 樣本階中
3、心矩 次序統(tǒng)計量 z(1)z(2)z(n)中位數(shù) 極差 R=X(n)-X(1)1.2 抽樣分布1.2.1 幾個重要的統(tǒng)計分布(1)正態(tài)分布,X (2)分布其中X1, X2, , Xn N(0,1)數(shù)字特征:,可加性:Y1 c 2(n1)與Y2 c 2(n2) 相互獨立 Y1+ Y2 c 2(n1+n2) 上側(cè)分位點: (3)分布 其中X 與 Y 獨立 對稱性: 漸進正態(tài)性: 上側(cè)分位點: () (4)F分布 其中Y1 c 2(n1)與Y2 c 2(n2)獨立 上側(cè)分位點: 例2 證明:證明:由分布定義知若,則 1-1- 即 故1.2.2 抽樣定理定理 設(shè)X1, X2, , Xn ,則(1);(
4、2);(3) 與獨立證明:(1)由正態(tài)分布的線性性質(zhì) ,(2)= ,而且=0 故自由度為n-1(3)由于中心化過慮了m 的信息,而則集中了m 的信息推論1 , , 與獨立推論2 設(shè)X1, X2, , Xn ,Y1, Y2, , Yn 則推論3設(shè)X1, X2, , Xn ,Y1, Y2, , Yn 則Ch2 參數(shù)估計2.1 基本概念2.1.1 問題的提法引例.已知(由機制或經(jīng)驗)某交通路口等待通行的車輛數(shù),為計算“堵車”的概率。現(xiàn)要由觀察數(shù)據(jù)估計的值。一般已知總體,為未知參數(shù),用樣本對進行估計。此統(tǒng)計問題為參數(shù)統(tǒng)計問題(可視為待估參數(shù))估計量用來估計的統(tǒng)計量。估計值估計量的觀察值。兩類估計1.總
5、估計:用估計(可以為向量)。2區(qū)間估計:用和估計。使很大。估計量的優(yōu)良性:盡量小。2.2 點估計2.2.1 矩估計原則:由大數(shù)定律,用估計。步驟:例2-1 設(shè)總體的期望和方差均存在,試由樣本估計和。解:由解得于是其中步驟:(1);(2)注1:例1結(jié)論與總體分布類型無關(guān),即對任何具有和的總體都有。注2:矩估計通常不唯一,比如總體,注1說明和都是的矩估計。例2.2 設(shè)U(a,b),試求和的矩估計。解:由得故2.1.2 極大似然估計原理:已發(fā)生的事件,其概率應(yīng)該最大方法:(1)構(gòu)造似然函數(shù)(2)求使例2.3 設(shè)P(l),求l 的極大似然估計解:令例2.4.設(shè)X1、X2.Xn是取自正態(tài)總體N(,2)的
6、樣本,求未知參數(shù) ,2的極大似然估計。解: 例2.5.設(shè)X1、X2.Xn是取自U(a,b)中的樣本,求未知數(shù)a,b的極大似然估計。解: 顯然有a增大,b減小時,L(a,b)增大,故 2.2 估計量的優(yōu)良性 的均方差 2.2.1 無偏性的無偏估計 例2.6 證明是的無偏估計。證明 例2.7 ?估計的無偏性解: 即不是的無偏估計,從而 是的無偏估計。的漸進無偏估計 ,2.2.2 有效性比有效,則 且 ,例2.8,在的線性無偏估計類 中求出最有效的估計解: (cauchy-schwarz不等式)即是U中的最小方差無偏估計。的一階最小方差無偏估計 。且 例2.8 設(shè)屬于,試求未知參數(shù)的矩估計和極大似然
7、估計,并比較兩者的無偏性。解:由知,且(例2.6)即為的無偏估計類似例2.4可得極大似然估計,其分布密度為即是的有偏估計,但是的漸近無偏估計為的無偏估計例2.9比較例2.8中和的有效性解:當n>1時有,故比有效定理(Rao-Cramer不等式)設(shè)總體密度函數(shù)可得(1)(2)求知參數(shù)有無偏估計滿足則 C.R下界特別時,有*證:由設(shè),得例2.11 設(shè)屬于,試求和的無偏估計的方差下界解:即的無偏估計有說明是的UMVUE即對s2/n0無偏值計有優(yōu)數(shù)值計,漸近優(yōu)數(shù)值計,例2.11說明對正態(tài)總體N(m,s2),是m 的優(yōu)數(shù)值計即即S2是s 2 的漸近優(yōu)數(shù)值計(可以證明S2是s 2 的UMVUE)例2
8、.12設(shè)Z1,Z2,Zn,及N(m,s2),試確定a使時達到最小解: 顯然時,,說明優(yōu)于。2.2.3相合性和漸近正態(tài)性(大樣本性質(zhì))q的相合估計 例2.13樣本均值是總體期望E(z)的相合估計由大數(shù)定理即得例2.14對正態(tài)總體S2是s2的相合估計由,知ES2=s2,再由切比雪夫不等式即得例2.15設(shè)Z1,Z2,Zn 為取自U(0,q)的樣本,證明q的極大似然估計是q的相合估計。q的漸近正態(tài)估計一般對極大似然估計有 2.3 區(qū)間估計問題 估計量本身能否表明估計的優(yōu)良(精度)性?方案 由樣本構(gòu)造置信上限(X1,Xn) 和置信下限(X1,Xn) 使 P() = 1- a 稱,為未知參數(shù)的置信度(水平
9、)為1-a 的置信區(qū)間 = - 或 = + 時稱為單側(cè)置信區(qū)間,否則稱雙側(cè)置信區(qū)間含義:,包含的概率1-a精度 :(1) 1-a 大 (2) - 小2.3.1 單總體 N(,)參數(shù)的置信區(qū)間(1) 已知時,的置信區(qū)間 N(0,1)P() = 1-aP() = 1-a例2.16 ( P560,例1) 鐵水含碳量(%)X N ( ,0.122),X爐鐵水:4.28,4.40,4.42,4.36 .求的0.95置信區(qū)間.解: = 4.365 , =0.12 , n=4 , a=0.05 , =1.96() = (4.3650.1176) = (4.2474 , 4.4826)注:區(qū)間長度L = 2(
10、a) 與成反比(b) 與a成正比(c) 1-a a L (2) 未知時,的置信區(qū)間 T = t(n-1)由P()=1-a得得P () = 1-a例2.17(續(xù)前例)若未知,S2 =3.833, = 3.1824得 注:此例中L2 = 0.098 < L1=0.118說明了什么?(3) 已知時,的置信區(qū)間 P()=1-aP() = 1- a(4) 未知時,的置信區(qū)間 P()= 1-a例 2.18(P567 ,例4 )飛機的最大飛行速度X N (,) ,試驗n = 15次,=424.99 , S2 = 71.859 , 的95%置信下限 = 421.135的90%單側(cè)置信上限為2.3.2 雙
11、總體N(),N()參數(shù)比較的置信區(qū)間(1) 的置信區(qū)間 由抽樣定理推論2 時 設(shè) =>若已知,和有什么變化?(2) 的置信區(qū)間由抽樣定理推論3 =>例2.19(P572例6)甲燈泡壽命 n=5, 乙燈泡壽命 n=7, , 求和的置信區(qū)間 95%解(10)若 (2) =>2.3.3 大樣本下得置信區(qū)間【結(jié)論】設(shè)總體z的樣本均值和樣本方差為和,期望 則當n時的極限分布為N(0.1),從而有即例2.20(p573例8)100件產(chǎn)品有4件不合格品,求不合格品p的95%單側(cè)置信上限的近似值。解當n充分大時故 取n=100,=0.04,=1.645 得構(gòu)造置信區(qū)間的一般方法(歸納)(1)
12、 求的一個優(yōu)良估計量,通常取的極大似然估計。(2) 以為核心,構(gòu)造樞軸量T(),使其有確定分布。(3) 對給定的置信水平1-,確定a,b使,且b-a盡量小(4) 由解出。CH3 檢驗假設(shè)3.1基本概念3.1.1問題的提出1°早稻畝產(chǎn)量310kg,320,H0: µ310,H1:µ3102°產(chǎn)品的次品率中是否達標?4/50,H0:p0.05,H1:p0.053°兩種電鉆噪音的比較,H0:µ1µ2,H1:µ1µ24°一周的空氣質(zhì)量是否均勻?H0:Z1.Z7同分布5°睡眠時間Z與考試成績 有
13、關(guān)嗎?H0:EZEZE假設(shè)檢驗用樣本檢驗對總體的“斷言”(假設(shè))參數(shù)假設(shè)檢驗已知總體分布類型F(x;),對未知參數(shù)做假設(shè)檢驗。如1°3°非參數(shù)假設(shè)檢驗未知總體分布類型,對總體的統(tǒng)計特性進行假設(shè)檢驗。如4°5°3.1.2基本原理小概率原則小概率事件在一次試驗中不該發(fā)生例3.1 自動包裝機包裝一帶葡萄糖的重量Z,N(µ,0.0152),抽驗9袋:0.497,0.506,0.518.0.515,0.512。=0.509問題:這天包裝機是否工作正常?解:提出假設(shè),H0:µ0.5(正常)H1:µ0.5(不正常)若H0為真,則P(|-&
14、#181;|k)應(yīng)該很小故如果|-µ|k 發(fā)生,則應(yīng)拒絕H03.1.3實施步驟1°根據(jù)實際問題,提出統(tǒng)計假設(shè):原(零)假設(shè)H0,被擇假設(shè)H12°建立檢驗統(tǒng)計量T(Z1,.Zn),(通常以被檢驗參數(shù)的優(yōu)良估計為基礎(chǔ)構(gòu)造T),僅當H0為真時,T有確定的分布3°對給定的顯著水平(小概率),構(gòu)造H0的拒絕域W,使P(Z1,.Zn)W)通常W=(Z1,.Zn);|T|或T4°若(Z1,.Zn)W,則拒絕H0,否則不拒絕H0,即認為“實際”和“假設(shè)”差異不顯著3.1.4兩類錯誤第一類(棄真)錯誤H0為真,但(Z1,.Zn)WH0被拒絕P(Z1,.Zn)W|
15、 H0)第類風險第一類(棄真)錯誤H0為真,但(Z1,.Zn)WH0被拒絕P(Z1,.Zn)W| H0)第類風險最優(yōu)水平的檢測在0下,使min3.2 正態(tài)總體參數(shù)的假設(shè)檢驗3.2.1單總體N(,2)下檢驗H0:=0 H1:0若2=02已知,則在H0下,故H0的拒絕域若2未知,則在H0下, 故H0的拒絕域例3.2(續(xù)例3.1)一袋葡萄糖重量ZN(,2),n=9,=0.519,在水平a=0.05下檢驗 H0:=0.5,H1:0.5(1)若2=0.0152, ,故不拒絕H0,即認為包裝機工作正常。(2)若2未知,計算S2= 0.0108972,由故拒絕H0,即認為包裝機工作不正常。3.2.2單總體N
16、(,2)下檢驗2H0:2=02 H1:202若=0已知,則在H0下, 故H0的拒絕域若未知,則在H0下, 故H0的拒絕域例3.3維尼綸纖度ZN(,2),生產(chǎn)穩(wěn)定時2=0.0482,檢測n=5件:1.32,1.55,1.36,1.40,1.44。試在顯著水平a=0.10下檢驗有無顯著變化。解:H0;2=0.0482 H1:20.0482 故拒絕H0,即認為有顯著變化。3.2.3單側(cè)檢驗問題例3.4(P587例2)設(shè)燈泡壽命ZN(,2),抽取n=70做壽命試驗,得=1960(小時),s=200(小時)。在顯著水平a=0.05下,能否認為這批燈泡的平均壽命達到國家標準2000小時?解:H0:2000
17、 H1:<2000這時H0的拒絕域故不拒絕H0,即可認為這批燈泡達到標準。問題,本題檢驗H0:2000 H1:>2000,如何建立統(tǒng)計假設(shè)的兩原則。3.2.4 雙總體的均值比較檢驗X1,X2 iid N(m1, s12 ) , S12Y1,Y2 iid N(m2, s22 ) , S22 H0:m1 - m2 = d , H1:m1 - m2 d (通常 d = 0)若s12, s22已知,則在H0下 故H0的拒絕域W=(X1,Xn):|U| > ua/2 若s12 = s22 =s2未知,則在H0下 其中 故H0的拒絕域W=(X1,Xn):|T| > ta/2(n1+
18、n2-2) 例3.5(P626習題5)兩機床加工的零件外徑 X甲 N(m1, s2 ) Y乙 N(m2, s2 )甲機床加工零件的外徑20.5 19.8 19.7 20.4 20.1 20.0 19.0 19.5乙機床加工零件的外徑19.7 20.8 20.5 19.8 19.4 20.6 19.2 問在顯著水平a = 0.05下,兩機床加工零件的外徑有無顯著差異? 解: n1 = 8 = 19.925 S12 = 0.2164 N2 = 7 = 19.925 S12 = 0.2164 Sw = 0.54737 H0 : m1 = m2 H1 : m1 m2 故不拒絕H0,即認為兩外徑無顯著差
19、異3.2.5 兩總體方差的比較檢驗H0:s12 = s22, H1:s12 s22在H0下 F = S12/S22 F( n1-1, n2-1 )故H0的拒絕域W=(X1,Xn):F <F1-a/2 ( n1-1, n2-1 )或 F >Fa/2 ( n1-1, n2-1 ) 思考:若已知m1 , m2能否提高檢驗的績效?例3.6(P592 例4)改進工藝本爐煉鋼的得率提高?a = 0.05 標準工藝下的 X N(m1, s12 ):78.1,72.4,77.3 = 76.23 S12 = 3.325改進工藝下的 Y N(m2, s22 ):79.1,81.0,82.1 = 79.
20、43 S22 = 2.225 解:(1)H10:s12 = s22, H11:s12 s22 F = 3.325/2.225 = 1.494 < 4.03 = F0.025 (9,9) 故不拒絕H0,即可以認為s12 = s22 (2)H20:m1 m2 (未提高), H21:m1 < m2 (提高) Sw = ( 9*3.325+9*2.225) / (10+10-2) = 1.66582 故拒絕H0,即改進工藝后得率有顯著提高。問題:當H0:s12 = s22 被拒絕怎么辦?3.3 非正態(tài)總體參數(shù)的假設(shè)檢驗3.3.1 小樣本情形例3.7 (p596例2) 規(guī)定次品率不超過1%,
21、方可出廠?,F(xiàn)抽檢20件產(chǎn)品,發(fā)現(xiàn)有一件次品,問按顯著水平a=0.05,可否認為該批產(chǎn)品合格?解:設(shè),i=1,2,20則z1,z2,z20 B(1, p),其中p 為次品率,本題要檢驗:H0:p0.1, H1:p0.1由B(1, p)的可加性知: B(1, p),故H0的拒絕域:N=(z1,z2,z20):其中k滿足:p0.01,p(20>k)a=0.05取p0=0.01,本題,故不拒絕H0,即可以出廠。3.3.2 大樣本情形由中心極限定理,z1,z2,znF(x,q)則H0,Ez=u0的拒絕域例3.8 在前例中檢查發(fā)現(xiàn)3件次品,是否可以出廠(a=0.05)?解: H0:p0.01 H1:
22、p0.01 (zB(1,p),Ez=p),故不拒絕H0,即可以出廠。注:對zi B(1, p),對兩個非正態(tài)總體,檢驗:H0:Ez=ED H1:EzED在H0下有:故H0的拒絕域:例3.9 (p598例4) 除蟲劑的效果檢驗,p為長勢良好率,未用除蟲劑:用除蟲劑:在a=0.01下,檢驗:H0:p1p2 H1:p1<p2故拒絕H0,即用除蟲劑的植物長勢顯著好于未用除蟲劑的植物,效果是顯著的。3.5 非參數(shù)假設(shè)檢驗(3.4略)3.5.1 c2擬合優(yōu)度檢驗例3.10(P100例4.1)某試卷400道選擇題中,正確答案為(A)的120道;為(B)的85道;為(C)的105道;為(D)的90道。問
23、能否認為四種答案是等可能出現(xiàn)的?分析:統(tǒng)計假設(shè)H0:X服從四點均勻分布:P(X=k) = 1/4, i=1,2,3,4.樣本X1,X400 iidX,觀察值n1 = 120, n2 = 85, n3 = 105, n4 = 90若為H0真(n1/n-1/4)2 + (n2/n-1/4)2 + (n3/n-1/4)2 + (n4/n-1/4)2 不應(yīng)過大修飾 => 實際頻數(shù)與理論頻數(shù)的相對相異定理(K.Pearson)設(shè)總體X的分布為P(X=xi) = pi, i=1,2,k. X1,Xn iidX, Ni為X1,Xn中取值為的個數(shù)(頻數(shù)),則統(tǒng)計量于是可得H0:P(X=xi) = pi,
24、 i=1,2,k的a水平拒絕域為 W = (x1,xn):c2 > c2a(k-1) 在例3.10中,故不拒絕H0注1:由于定理結(jié)論是n的極限分布,即為大樣本問題,一般要求n50.當n=2時由中心極限定理知W在n服從標準正態(tài)分布,從而W2在n服從 c2(1)注2:定理的(Fisher)推廣:若H0中總體有r個未知參數(shù)q1,qr,由樣本得其極大似然估計1,r從而求出, i=1,2,k.,則H0為其時 注3:當X的取值過多時應(yīng)分組,使理論頻數(shù)npi相對均勻;npi太小 => 加權(quán)1/(npi) => H0易被否定 并組 一般要求npi>5npi太大 => 區(qū)域太粗 =
25、> 未真正擬合 拆分 例3.11(P613例3)電話總機在午夜0-1時電話接錯的次數(shù)X,抽取200天記錄:接錯次數(shù)012345頻數(shù)(天)1086522401問在顯著水平a = 0.10下,能否認為X服從poisson分布?解:H0 : XP(l) (l未知) 首先求01234>50.53260.33550.10570.02220.00350.0005106.51867.10721.1394.4390.6995.2370.0980.02060.06610.03570.0107若不并組 擬合優(yōu)度檢驗:F(X)=(X)的一般步驟 對總體Z的值域進行劃分(分組)(,(,).(,)一般取5k
26、16,先等分再調(diào)整使n均分;計算理論頻數(shù)n,其中n為樣本容量=p(<z)=()-()若(x,)含未知參數(shù),則用其極大似然估計,計算=(,)-(,); 統(tǒng)計樣本觀察值,.。落入(,)中的頻數(shù),i=1,2,3,. ,k;計算的統(tǒng)計量=的觀察值;對顯著水平a確定的拒絕域w=(,.,):>(k-1),其中為(x)中未知參數(shù)的個數(shù)。例3.12(例4)維尼綸纖度Z是否服從正態(tài)分布?(a=0.05)X的組別頻數(shù)nn(-,1.29511.0620.4292( 1.32543.576( 1.35579.856 1.3852218.6550.5999 1.4152324.2590.0653 1.445
27、 2521.6760.5097 1.4751013.3070.8220 1.50565.6520.0202 1.53511.625 +)10.371100100=2.4463<7.815=1.406=0.002322=:ZN(1.406,)=()- () (i=1,.10 ) =- =+故不拒絕,即可認為Z (,) K-S (Kolmogrff-Smirnov)擬合檢驗理論依據(jù) Glivenko 定理 Dn = 0科爾莫格洛夫檢驗法(單總體) H0 F(x)= F0(x) 定理 在H0 為真時,若F0(x)連續(xù),則 有確定分布,P707表列出了部分分位點。 故H0 的拒絕域 W = (,
28、x2, , xn): Dn > Dn,a 例3.1-2 續(xù) 用纖度數(shù)據(jù)做K 檢驗 H0 Z N (1.406,0.0482)X(i)X(i)F0-00.00431.400.570.45030.1103,0.11971.280.010.00430.0043, 0.00571.430.820.69150.1215,0.12851.310.050.02280.0128, 0.02731.460.920.86970.0497,0.05031.340.120.08460.0346, 0.03541.490.980.95990.0399,0.02011.370.340.22660.1066, 0.1
29、1341.520.990.99120.0112,0.00121.5510.99870.0087,0.0014Dn = 0.1285 < 0.136 = = D100,0.05故不拒絕H0, 即可認為 Z N (1.406,0.0482)注:與X2 檢驗比較,K檢驗的優(yōu)點是無需大樣本,缺點是:(1) F0(x) 需連續(xù);(2) F0(x) 不能有未知參數(shù)。斯米爾洛夫檢驗(雙總體) H0 F1(x) = F2(x) Dn1, n2= 定理 在H0 為真時,若F1(x)連續(xù),則Dn1, n2有確定的分布。P708 表六(n1 = n2 = n ) 和 P709 表七列出了部分分位點故H0 的拒
30、絕域 W = (x1 , , xn1), (y1 , , yn2): Dn1, n2 > Dn1, n2,a3.5.3 正態(tài)性檢驗:H0:ZN(m,s2)(1)正態(tài)概率紙QQ圖表在H0數(shù)據(jù)點(X(i),Fn(x(i))在正態(tài)坐標系下“呈直線”(2)W檢驗對次序統(tǒng)計量Z(1)Z(2)Z(3)Z(n-1)Z(n)構(gòu)造 L=,其中ak有表,l=W= 0W1當H0為真時,W有確定分布且1,故H0的拒絕域3.5.4 獨立性檢驗(1)相關(guān)系數(shù)檢驗(Z,Y)N(m1, m2,s12,s22,r) H0:r=0 H1:r0r的矩估計 于是H0的拒絕域W= (r10,表八給出c的直) 例3.13(p624
31、 例8)在a=0.01下檢驗降雨量Z與河流量Y的相關(guān)性降雨量xi11018414512216514378 12962 130168徑流量yi2581363370542044144175解:若(Z、Y)N(m1, m2,s12,s22,r) ,則本題欲檢驗H0:r=0 H1:r0故拒絕H0,既Z與Y相關(guān)顯著。(2)列聯(lián)表檢驗H0:Z與Y相互獨立 H1:Z與Y不獨立理論分布:ZY1 spi1rp11 p1spr1 prsp1prp.jp.1p.s1觀測頻數(shù)(列聯(lián)表)ZY1 sni=1rn11 n1snr1 nrsn1nrn.jn.1 n.s1H0:Z與Y相互獨立本項大似然估計:自由度 由Pears
32、on定理,故H0拒絕域例3.14(p256例9)在下檢驗吸煙與患慢性氣管炎是否獨立XY患病數(shù)未患病合計吸煙數(shù)43162205不吸煙13121134合計56283339故拒絕H0:即吸煙與患病明顯不獨立。3.5.5 符合檢驗設(shè)X1, ,Xm, F1(x), y1, ,yn, F2(x) H0:F1(x)=F2(x), H1:F1(x) F2(x)若F1(x)=F2(x)=F(x)連續(xù),則P(x<y)= P(x>y)=1/2(兩樣本獨立)記 zi= 則H0成為zi B(1,1/2) i=1,2, ,n 獨立 N+= zi B(m,1/2),N_=n-N+ b/2=maxb:P(N+b)
33、=Cmk()m 即在H0下P(N+ba/2或N+n-ba/2)a于是H0的拒絕域:w=(xi,yi):n+ba/2 or n+ > n-ba/2 =(xi,yi): n+ ba/2 or n- ba/2 =(xi,yi): S =min(n+,n-) ba/2當n 90時,可通過試算定出臨界值,也有表可查,當n >90 時,由中心極限定理:U= N(0,1) 可得H0的拒絕域w=(xi,yi), >Ua/2 例 3.15 在 a =0.05下,檢驗甲,乙兩人分析CO2 含量是否有顯著差異。甲147 15.0 15.2 15.0 14.7 15.4 15.3乙14.6 15.1
34、 15.4 15.0 14.9 15.2 15.0符號 + - - 0 - + + S=min(12,7)=7>4=b0.025 H0:F甲(x)=F乙(x)故不拒絕H0,即甲,乙兩人分析結(jié)果無顯著差異。356 秩和檢驗 x1, ,xn1 F1(x), y1, yn2 F2(x) n1 n2 H0: F1(x) =F2(x) H1: F1(x)F2(x)排序 x3 y1 x1 y4 y3 x2 y2 若 (3+4)! 種記 y1 y2 y3 y4 y5 y6 y7xi的秩si xi=siX的秩和T= siH0的拒絕域w=(xi,yi):T<T1,T>T2其中在下有P(T<
35、;T1)= P(T>T2)=(可查表獲得T1,T2)例3.16 在a=0.05 下檢驗兩種材料制造的燈泡,壽命的差異材料 1610 1650 1680 1700 1720 1750 1800 N2=7材料 1580 1600 1630 1640 1700 N1=5秩1 2 3 4 5 6 7 8.5 10 11 12解 H0,F(x)= F(x) H1: F(x)= F(x)T=1+2+4+5+8.5=20.5又a=0.05, n1=5,n2=7 查得T1=22,T2=43 T0<T1 拒絕H0, 即兩種燈泡壽命有顯著差異。Ch4 線性統(tǒng)計模型4.1 線性模型的建立引例:用y=f(
36、x1,x2, ,xn)+ 表示煉鋼過程其中y表示含碳量,xi表示投入的礦石,溫度,時間等輸入量,為隨機因素,可用如下框圖表示:試驗 y 輸入x4.1.1 線性回歸模型y=0+1x1+2x2+kxk+其中,x:可控制(至少可觀察)的非隨機量 y:可觀察的隨機變量 :不可觀察的隨機變量,可要求E=0,D=2 i,:待估參數(shù)試驗n次,解y的n個觀察值線性回歸模型k=1時,為一元線性回歸模型 yx加上正態(tài)分布條件,相互獨立或相互獨立 統(tǒng)計推斷目標(1)估計參數(shù)0, 1,2以確定x與y的相關(guān)關(guān)系;(2)對模型的顯著性進行檢驗(如H0,0=0);(3)對輸入量x0預(yù)測輸出量y0;(4)對希望的y控制x。4
37、.2最小二乘估計及其性質(zhì)4.2.1 最小二乘估計差平方和求0, 1使Q=min,令解正規(guī)方程由知方程組有唯一解:以上就是最小二乘估計經(jīng)驗回歸函數(shù):4.2.2 中心化算法記 則 例4.1(P641例1)由硝酸鉀的溶解度y與濕度x的相關(guān)數(shù)據(jù):x0410152129365168y66.771.076.380.685.792.999.4113.6125.1求y的經(jīng)驗回歸正數(shù)解:,故經(jīng)驗回歸正數(shù)4.2.3 極大似然估計若采用模型 獨立則似然正數(shù) 顯然 即最小二乘估計 為 的極大似然估計,再由得 的極大似然估計 4.2.4 估計量分布注意到 由 獨立得(1) 其中 (2)(3)且與獨立 獨立?標準差為1?
38、 故與獨立,從而與獨立定理:正態(tài)線性0模型,i=1,n相互獨立則 (1) (2) (3)與Q獨立(1)(2)說明,分別是,的無偏估計。且沒有正態(tài)假設(shè)時該結(jié)論也成立。4.3.1 F-檢驗 回歸平方和殘差平方和 反映由x造成的偏差 反映非x造成的偏差若 :模型不真 y與x無顯著相關(guān) =0則 不應(yīng)太大,否則應(yīng)拒絕與獨立故的拒絕域r-檢驗?zāi)P筒徽?rXY=0r 的矩估計 (表八p710)例4.2檢驗例4.1的回歸模型4.3.3 t檢驗(對回歸系數(shù)的檢驗):=, :, i=0, 2在下(不含i=1),N(,)=>(-)/N(0,1)Q/(n-2)且與獨立=>T=(-) t(n-2)故的拒絕域
39、w=(,):T>(n-2)對:=0 t檢驗 óF檢驗,事實上=F4.4 置信區(qū)間與預(yù)測4.4.1 回歸系數(shù)的區(qū)間估計由T=(-)得P(T(n-2)=1-即的1-a 置信區(qū)間為(n-2)同理,的1-置信區(qū)間為(n-2)例4.1中有(67.5082.84*=(67.5081.43618)(0.870642.84*=(0.870.04278)4.4.2 預(yù)測對E/估計N(+,),E=+,則【結(jié)論一】=+是E的無偏估計-N(0,1+)由=+N(+,,())得E的1-置信區(qū)間為E=+()其中()=(n-2)如例4.1中若溫度=30,則可預(yù)測:=67.508+0.87*30=93.627則置信水平0.95有E(93.6272.8783)4.5幾點推廣4.5.1 多元線性回歸=+.+ + ,i=1ny=Z+,y=(. ) ,Z=()則最小二乘估計=Z y為的無偏估計4.5.1 非線性回歸(1)y=+x+.+ +, 多項式回歸(2)取=lny,則
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 重慶能源職業(yè)學院《概率論與統(tǒng)計》2023-2024學年第二學期期末試卷
- 海南大學《自然地理學方法之土壤生物》2023-2024學年第二學期期末試卷
- 楚雄彝族自治州永仁縣2025屆數(shù)學三下期末監(jiān)測模擬試題含解析
- 浙江省舟山市2024-2025學年高二上學期期末檢測英語試題(含聽力)
- 2025年高考歷史風標訓練卷3(含解析)
- 巖棉彩鋼板施工方案
- 儲罐焊縫返修施工方案
- 商丘醫(yī)用吊橋施工方案
- 2025年西醫(yī)護理學試題及答案
- 消防常識考試試題及答案
- 部編版四年級語文下冊第3單元大單元整體教學設(shè)計課件(教案配套)
- q gw2sjss.65金風風力發(fā)電機組防腐技術(shù)rna部分歸檔版
- 廉政建設(shè)監(jiān)理實施細則
- 健康證體檢表
- LY/T 3263-2021澳洲堅果栽培技術(shù)規(guī)程
- GB/T 26030-2010鎳鎳合金鍛件
- GB/T 19228.2-2011不銹鋼卡壓式管件組件第2部分:連接用薄壁不銹鋼管
- GB/T 14986-2008高飽和、磁溫度補償、耐蝕、鐵鋁、恒磁導率軟磁合金
- GB/T 14478-2012大中型水輪機進水閥門基本技術(shù)條件
- GB/T 13008-2010混流泵、軸流泵技術(shù)條件
- 2023年南充市煙草系統(tǒng)事業(yè)單位招聘筆試題庫及答案解析
評論
0/150
提交評論