版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第一節(jié) 事件與概率(一)概率的定義 研究隨機試驗,需了解各種隨機事件發(fā)生的可能性大小,以揭示這些事件的內(nèi)在的統(tǒng)計規(guī)律性。 能夠刻畫事件發(fā)生可能性大小的數(shù)量指標稱之為概率(probability)。事件A的概率記為P(A)。1概率的古典定義 (先驗概率) 隨機試驗具有以下特征,稱為古典概型。1.試驗的所有可能結果只有有限個,即樣本空間中的基本事件只有有限個;2.各試驗的結果出現(xiàn)的可能性相等,即所有基本事件的發(fā)生是等可能的;3.試驗的所有可能結果兩兩互不相容。對于古典概型,概率的定義:設樣本空間由 n 個等可能的基本事件所構成,其中事件A包含有m個基本事件,則事件A的概率為m/n,即P(A)=m/
2、n這樣定義的概率稱為古典概率2概率的統(tǒng)計定義(經(jīng)驗概率) 在相同條件下進行n次重復試驗,如果隨機事件A發(fā)生的次數(shù)為m,那么m/n稱為隨機事件A的頻率;當試驗重復數(shù)n逐漸增大時,隨機事件A的頻率越來越穩(wěn)定地接近某一數(shù)值p,那么就把 p稱為隨機事件A的概率(probability)。2概率的運算法則 加法法則:互斥事件A和B的和事件的概率等于事件A和事件B的概率之和。即P(A+B)=P(A)+P(B)。 加法定理對于多個兩兩互斥的事件也成立。P(A+B+N)=P(A)+P(B)+P(N) P(A+B)=P(A)+P(B)-P(AB)乘法法則: 如果A事件和 B事件為獨立事件,則事件A與B事件同時發(fā)
3、生的概率等于兩獨立事件概率的乘積,即:P(AB)=P(A) P(B) 乘法定理對于n個相互獨立的事件也成立,即P(A1A2 An)=P(A1) P(A2) P (An)書上例題第二節(jié) 常用離散變量的理論分布一、二項分布(一)貝努里試驗及其概率函數(shù):指只有兩種可能結果的隨機試驗,我們將其中比較關注的結果稱為“成功”,另一個結果稱為“失敗”。將某隨機試驗重復進行n次,若各次試驗結果互不影響,即每次試驗結果出現(xiàn)的概率都不依賴于其它各次試驗的結果,則稱n次試驗是獨立的對于n次獨立的試驗如果每次試驗結果出現(xiàn)且只出現(xiàn)對立事件A與 之一, 在每次試驗中出現(xiàn)A的概率是常數(shù)p(0<p<1), 因而出
4、現(xiàn)對立事件 的概率是1-p=q,則稱這一串重復的獨立試驗為n重貝努里試驗,簡稱貝努里試驗在n重貝努里試驗中,事件 A 可能發(fā)生0,1,2,n次,來求事件 A 恰好發(fā)生k(0kn)次的概率Pn(k)。例:拋擲4次硬幣,正面朝上(A)出現(xiàn)2次的概率。先取n=4,k=2。在4次試驗中,事件A發(fā)生2次的方式有以下C42種:一般,在n重貝努里試驗中,事件A恰好發(fā)生k(0kn)次的概率為kn-k C nk p k=0,1,2,n P (k) =qn(二)二項分布的定義及性質(zhì)1、二項分布的定義:設隨機變量 x 所有可能取的值為零和正整數(shù):0,1,2,,n,且有:P n ( k ) = C nk p k q
5、n - k k=0,1,2,n其中p0,q0,p+q=1,則稱隨機變量x服從參數(shù)為n和p的二項分布 ,記為:B(x;n,p)。二項分布是一種離散型隨機變量的概率分布。參數(shù)n稱為正整數(shù)離散參數(shù);p 是連續(xù)參數(shù),它能取0與1之間的任何數(shù)值(q=1p)。2、二項分布的性質(zhì):容易驗證,二項分布具有概率分布的一切性質(zhì),即:(1)P(x=k)= Pn(k) (k=0,1,,n)(2)二項分布的概率之和等于1,即(3)(4)nCnpk=0kkqn-k=(q+p)n=1kmP(xm)=Pn(km)=nCnk=0knpqkn-kP(xm)=Pn(km)=Ck=mpqm2kn-k(5) P(m1xm2)=pn(m
6、1km2)=(m1<m2)3、二項分布的圖形特征:二項分布的圖形由n和p兩個參數(shù)決定: Cnpk=m1kkqn-k(1)當p值較小且n不大時,分布是偏斜的。但隨著n增大 ,分布逐漸趨于對稱;(2)當p值趨于0.5時,分布趨于對稱;(3)對于固定n及p,當k增加時 ,概率P(X=k) 先是隨之增加直至 達到最大值, 隨后單調(diào)減少。此外,在n較大,np、nq較接近時 ,二項分布接近于正態(tài)分布;當n時,二項分布的極限分布是正態(tài)分布。(n30,np5,nq5時,近似正態(tài)分布。)(三)二項分布概率計算及應用條件二項分布的應用條件有三:1.各觀察單位只具有互相對立 的一種結果,屬于二項分類資料;2.
7、已知發(fā)生某一結果的概率為p,其對立結果的概率則為1p=q ,要求p是從大量觀察中獲得的穩(wěn)定數(shù)值;3.n個觀察單位的觀察結果互相獨立,即每個觀察單位的結果不會影響到其它觀察單位的觀察結果(四)二項分布的平均數(shù)與標準差統(tǒng)計學證明,服從二項分布B(n,p)的隨機變量之平均數(shù)、標準差與參數(shù)n、p有如下關系:當試驗結果以事件A發(fā)生次數(shù)k表示時= np=三.幾何分布(Geometry distribution)在貝努里試驗中,每次試驗成功的概率為p,失敗的概率為q=1-p,設試驗進行到第 次才出現(xiàn)成功。 (xi)的分布列為P ( k -1 k=1.2 = k ) = pq-1 (k=1.2)是幾何級數(shù)的
8、pq k 一般項。因此稱它為幾何分布記為 g(k;p)。四、超幾何分布 npq對于抽樣調(diào)查,只有在大群體(即總體比樣本相對大很多)的情況下,二項分布的獨立試驗要求才能夠近似得到滿足(重復抽樣)。但如果研究對象是小群體,這時總體單位不多,一般只有幾十個。假定總體只有兩類,其中K個成功類,(N-K)個為失敗類,這時如果從總體中抽取一容量為n的樣本,那么成功的概率將不再恒定,也就是二相分布所要求的獨立試驗的條件不再被滿足,而超幾何分布將適合于這種小群體的研究。形式:P(X=k)=K=0,1,超幾何概型,例:產(chǎn)品檢驗。有N個產(chǎn)品(其中有K個合格品)從N個產(chǎn)品中取n個檢驗,求n中有X個合格品的概率。(即
9、X合格品個數(shù)) 不回置抽樣!期望:E(X)=nK/N=np方差:D(X)=npq(N-n)/(N-1)當研究對象是小群體,并且采用不回置抽樣時,成功的概率將不再恒定,也就是二項分布所要求的獨立試驗的條件不再被滿足,而超幾何分布將適合于這種情況的研究。當群體規(guī)模逐漸增大,以致不回置抽樣可以作為回置抽樣來處理,可用二項分布來近似超幾何分布。一般當n/N0.1時,這種近似就是可以采用的。五、泊松分布泊松分布是一種描述和分析稀有事件的概率分布。要觀察到這類事件,樣本含量 n必須很大 。例:盒子中裝有999個黑棋子,一個白棋子,在一次抽樣中,抽中白棋子的概率1/1000(一)泊松分布的定義與特征1、定義
10、:若隨機變量x(x=k)只取零和正整數(shù)值0,1,2,且其概率分布為x!x=0,1,(稀有事件出現(xiàn)的次數(shù))其中0;e 是自然對數(shù)的底數(shù)(e=2.71828) ,則稱 x 服從參數(shù)為的泊松分布P(x=k)=xe-(Poissons distribution),記為P(x;)2、泊松分布重要的特征平均數(shù)和方差相等,都等于常數(shù),即=2=np3、泊松分布的圖形特征:是泊松分布所依賴的唯一參數(shù)。 值愈小分布愈偏倚,隨著的增大,分布趨于對稱。 當= 20時分布接近于正態(tài)分布;當=50時,可以認為波松分布呈正態(tài)分布。 在實際工作中,當20時就可以用正態(tài)分布來近似地處理泊松分布的問題(二)泊松分布的概率計算泊松
11、分布的概率計算依賴于參數(shù),只要參數(shù)確定了,把k=0,1,2,代入公式即可求得各項的概率。但是在大多數(shù)服從泊松分布的實例中,分布參數(shù)往往是未知的,只能從所觀察的隨機樣本中計算出相應的樣本平均數(shù)作為的估計值,將其代替公式中的,計算出k = 0,1,2,時的各項概率。例:一個合訂本共100頁,假定每頁上印刷錯誤的,數(shù)目X服從泊松分布(=1),計算該合訂本中各頁的印刷錯誤都不超過4個的概率。解:由題目P(x;1).P(X4)=P(X=0)+ P(X=1)+ P(X=2)+ P(X=3)+ P(X=4).查表求值 =?+?+?+?+?所求概率為 (?)100=0.0045?!纠繛楸O(jiān)測飲用水的污染情況,
12、現(xiàn)檢驗某社區(qū)每毫升飲用水中細菌數(shù),共得400個記錄如下經(jīng)計算得每毫升水中平均細菌數(shù) =0.500,方差S2=0.496。兩者很接近, 故可認為細菌數(shù)/ml(水) 服從泊松分布。以 =0.500代替公式中的,得k (k=0,1,2) 0.5-0.5P(x=k)=e k!計算結果如下表。細菌數(shù)的泊松分布可見細菌數(shù)的頻率分布與=0.5的波松分布是相當吻合的,進一步說明用波松分布描述單位容積(或面積)中細菌數(shù)的分布是適宜的。注意:泊松分布的應用條件與二項分布相似(三)泊松分布與二項分布泊松定理:設隨機變量B(x;n,p)。當 n很大時,p 很小。有以下近似式:其中=np 實際計算中,n10,p0.1,
13、近似效果就較好,而n 100, np 10 時近似效果就很好。由泊松定理,n重貝努里試驗中稀有事件出現(xiàn)的次數(shù)近似地服從泊松分布。例見:P133,例8.2.3(四)泊松分布與正態(tài)分布的關系當較小時, Piosson分布呈偏態(tài)分布,隨著增大,迅速接近正態(tài)分布,當 20時,可以認為近似正態(tài)分布。第三節(jié) 常用連續(xù)型隨機變量的理論分布一、正態(tài)分布正態(tài)分布是最重要的概率分布。因為:第一,許多自然現(xiàn)象與社會現(xiàn)象,都可用正態(tài)分布加以敘述;第二,許多概率分布以正態(tài)分布為其極限;第三,許多統(tǒng)計量的抽樣分布呈現(xiàn)正態(tài)分布。因此,許多統(tǒng)計分析方法都是以正態(tài)分布為基礎的(一)正態(tài)分布的概率函數(shù)若連續(xù)型隨機變量x的概率分布
14、密度函數(shù)為f(x)=1-(x-)2222e其中為平均數(shù),2為方差,則稱隨機變量x服從正態(tài)分布(normal distribztion),記為xN(,2)。相應的概率分布函數(shù)為 1F(x)= 2標準正態(tài)分布的三個常用概率 x-(x-)222-edx(二) 正態(tài)分布的特征1. 正態(tài)分布密度曲線是單峰、對稱的懸鐘形曲線,對稱軸為x =;2. f(x) 在x=處達到極大,極大值 ;3. f(x)是非負函數(shù),以x軸為漸近線,分布從-至+; 4. 曲線在x=±處各有一個拐點,即曲線在(-,-)和(+,+) 區(qū)間上是下凸的,在-,+區(qū)間內(nèi)是上凸的;5. 正態(tài)分布有平均數(shù)和標準差兩個參數(shù)。是位置參數(shù)
15、,是變異度參數(shù)。6. 分布密度曲線與橫軸所夾面積為1,即:2(x-)-+ 12P(-<x<+)=(三)標準正態(tài)分布 -22dx=1正態(tài)分布是依賴于參數(shù)和的一簇分布。將一般的N(,2)轉(zhuǎn)換為= 0,2=1的正態(tài)分布,應用就方便了。稱=0,2=1的正態(tài)分布為標準正態(tài)分布標準正態(tài)分布的概率密度函數(shù)及分布函數(shù)分別記作(z)和(z),得: ( z ) =e 2 - 2 2 ( z ) =2 -ez2 - z 2dz隨機變量z服從標準正態(tài)分布,記作zN(0,1)。對于任何一個服從正態(tài)分布N(,2)的隨機變量x,都可以通過標準化變換: z=(x-)將其變換為服從標準正態(tài)分布的隨機變量z。z稱為標
16、準正態(tài)變量或標準正態(tài)離差 (四)正態(tài)分布的概率計算 標準正態(tài)分布的概率計算設z服從標準正態(tài)分布,則z在z1,z2 )何內(nèi)取值的概率為:(z2)(z1)而(z1)與(z2)可由附表查得 【例】 已知z-N(0,1),試求: (1) P(z-1.64)? (2) P (z2.58)=?(3) P (z2.56)=? (4) P(0.34z1.53) =?關于標準正態(tài)分布,以下幾種概率應當熟記: P(-1z1)=0.6826 P(-2z2)=0.9546 P(-3z3)=0.9974 P(-1.96z1.96)=0.95P (-2.58z2.58)=0.99 z在上述區(qū)間以外取值的概率分別為:P(z
17、1)=2(-1)=1- P(-1z1) =1-0.6826=0.3174 P(z2)=2(-2)=1- P(-2z2)=1-0.9545=0.0455 P(z3)=1-0.9973=0.0027 P(z1.96)=1-0.95=0.05 P(z2.58)=1-0.99=0.01 一般正態(tài)分布的概率計算正態(tài)分布密度曲線和橫軸圍成的區(qū)域,其面積為1,是一個必然事件。若隨機變量x服從正態(tài)分布N(,2),則x的取值落在任意區(qū)間x1, x2)的概率,記作P(x1 xx2),等于這部分曲邊梯形面積。即:(x-)222P(x1x<x2)=12xx21-edx對上式作變換z=(x-),得dx=dz,故有
18、P(x1x<x2)=12x2-(x-)222x1edu=12(x2-)/(x1-)/e12-2du= 1 2 z 2 z1 e 1 2 z - 2 d= ( z 2) ( z 1) -其中,z1=(x1-),z2=(x2-))這表明服從正態(tài)分布N(,2)的隨機變量x在x1,x2)內(nèi)取值的概率,等于服從標準正態(tài)分布的隨機變量z在(x1-), (x2-))內(nèi)取值的概率。因此,計算一般正態(tài)分布的概率時,只要將區(qū)間的上下限作適當變換(標準化),就可用查標準正態(tài)分布的概率表的方法求得概率了?!纠吭Ox服從=30.26,2=5.102的正態(tài)分布,試求P(21.64x32.98)。令則z服從標準正態(tài)分
19、布,故=P(-1.69z0.53)=(0.53)-(-1.69)=0.7019-0.04551=0.6564關于一般正態(tài)分布,以下幾個概率是經(jīng)常用到的。P(-x+)=0.6826P(-2x+2) =0.9546P (-3x+3) =0.9974P (-1.96x+1.96)=0.95P (-2.58x+2.58)=0.993、正態(tài)分布分位點計算正態(tài)分布的分位點的定義標準正態(tài)分布 密度函數(shù)圖形為圖中的點 x 稱為標準正態(tài)分布的 ( 1 )% 的分位點,相當于已知 - (x)=p(Xx)=1- 求其中的 x4、單側(cè)概率與雙側(cè)概率統(tǒng)計學中,把隨機變量 x 落在區(qū)間(-k,+k)之外的概率稱為雙側(cè)(兩
20、尾)概率,記作。對應于雙側(cè)概率可以求得隨機變量x小于k或大于+k的概率,稱為單側(cè)概率,記作2。如,x落在(-1.96,+1.96)之外的雙側(cè)概率為0.05,而單側(cè)概率為0.025。即 P(x-1.96)=P(x+1.96)=0.025x落在(-2.58,+2.58)之外的雙側(cè)概率為0.01,而單側(cè)概率P(x-2.58)=P(x +2.58)=0.005(五)二項分布及泊松分布與正態(tài)分布的關系對于二項分布,在n,p0,且np=(較小常數(shù))情況下,二項分布趨于泊松分布。在這種場合,泊松分布中的參數(shù) 用二項分布的np代之;在n,p0.5時,二項分布趨于正態(tài)分布。在這種場合,正態(tài)分布中的 、2用二項分
21、布的np、npq代之。在實際計算中,當p0.1且n很大時 , 二項分布可由泊松分布近似;當p0.1且n很大時 ,二項分布可由正態(tài)分布近似。對于泊松分布,當時,泊松分布以正態(tài)分布為極限。在實際計算中,當20時,用泊松分布中的代替正態(tài)分布中的及2,即可由后者對前者進行近似計算。二、抽樣分布與中心極限定理研究總體與從中抽取的樣本之間的關系是統(tǒng)計學的中心內(nèi)容。對這種關系的研究可從兩方面著手:一是從總體到樣本,這就是研究抽樣分布(sampling distribution)的問題;二是從樣本到總體,這就是統(tǒng)計推斷(statistical inference)問題(一)抽樣分布的含義與無偏估計量1、抽樣分
22、布的含義:統(tǒng)計推斷是以總體分布和樣本抽樣分布的理論關系為基礎的。由總體中隨機地抽取若干個體組成樣本,即使每次抽取的樣本含量相等,其統(tǒng)計量也將隨樣本的不同而有所不同。因而樣本統(tǒng)計量也是隨機變量,也有其概率分布,我們把統(tǒng)計量的概率分布稱為抽樣分布。2、無偏估計在統(tǒng)計學上,如果所有可能樣本的某一統(tǒng)計數(shù)的平均數(shù)等于總體的相應參數(shù),則稱該統(tǒng)計數(shù)為總體相應參數(shù)的無偏估計值。設有一N=3的總體,具有變量3,4,5;求得=4,2=0.6667, =0.8165現(xiàn)以n=2作獨立的回置抽樣,總共得Nn=32=9個樣本。抽樣結果列入下表:N=3 n=2時抽樣的平均數(shù) 方差 標準差:樣本平均數(shù)的平均數(shù)x=4樣本方差的
23、平均數(shù)S2=0.6667=2樣本標準差的平均數(shù)S=0.62850.8165= 所以,惟有樣本標準差s的平均數(shù)不是總體標準差的無偏差估計值。其余兩個參數(shù)為無偏差估計值。(二)樣本平均數(shù)的抽樣分布1、樣本平均數(shù)抽樣分布的含義及其參數(shù) 設有一個總體 ,總體平均數(shù)為,方差為2,總體中各變數(shù)為xi,將 此總體稱為原總體。現(xiàn)從這個總體中隨機抽取含量為n的樣本,樣本平均數(shù)記為 。可以設想,從原總體中可抽出很多甚至無窮多個含量為n的樣本。如果從容量為N的有限總體抽樣,若每次抽取容量為n的樣本,那么一共可以得到 個樣本(所有可能的樣本個數(shù))。抽樣所得到的每一個樣本可以計算一個平均數(shù),全部可能的樣本都被抽取后可以
24、得到許多平均數(shù)。如果將抽樣所得到的所有可能的樣本平均數(shù)集合起來便構成一個新的總體,平均數(shù)就成為這個新總體的變量。由平均數(shù)構成的新總體的分布,稱為平均數(shù)的抽樣分布。隨機樣本的任何一種統(tǒng)計數(shù)都可以是一個變量,這種變量的分布稱為統(tǒng)計數(shù)的抽樣分布。由這些樣本算得的平均數(shù)與原總體平均數(shù)相比往往表現(xiàn)出不同程度的差異。這種差異是由隨機抽樣造成的,稱為抽樣誤差(sampling error)。由樣本平均數(shù)構成的總體稱為樣本平均數(shù)的抽樣總體,其平均數(shù)和標準差分別記為 和 。是樣本平均數(shù)抽樣總體的標準差,簡稱標準誤(standard error),它表示平均數(shù)抽樣誤差的大小。統(tǒng)計學上已證明總體的兩個參數(shù)與x 總體
25、的兩個參數(shù)有如下關系:=n2、中心極限定理設有一個N=4的有限總體,變數(shù)為2,3,3,4。根據(jù)=xN和2=(x-)2N求得該總體的、2、為: =3,2=12,=1/21/2=0.707從有限總體作回置隨機抽樣,所有可能的樣本數(shù)為Nn其中n為樣本含量 。以上述總體而論,如果從中抽取n=2的樣本,共可得 42=16 個樣本;如果樣本含量n為4,則一共可抽得44=256個樣本。分別求這些樣本的平均數(shù) ,其次數(shù)分布如下表所示。在n=2的試驗中,樣本平均數(shù)抽樣總體的平均數(shù)、方差與標準差分別為=2f/Nn=48.0/16=3=2=f(-)N2n=f-(f)/NNn22n148-48/16 =16=4/16
26、=1/4=(1/2)/2= 2/n2=/4=2/2=n表 N=4, n=2和n=4時的次數(shù)分布同理,可得n=4時:=768/256=3=32/256=1/8=(1/2)/4=22驗證了 = , = / n 的正確性。 /n也可以將表中兩個樣本平均數(shù)的抽樣總體作次數(shù)分布圖。由以上模擬抽樣試驗可以看出,雖然原總體并非正態(tài)分布,但從中隨機抽取樣本,即使樣本含量很小,樣本平均數(shù)的分布卻趨向于正態(tài)分布形式。隨著樣本含量 n 的增大,樣本平均數(shù)的分布愈來愈從不連續(xù)趨向于連續(xù)的正態(tài)分布。當n30時, 的分布就近似正態(tài)分布了。X變量與 變量概率分布間的關系可由下列兩個定理說明:(1) 若隨機變量x服從正態(tài)分布
27、N(,2);x1、x2、xn,是由x 總體得來的隨機樣本,則統(tǒng)計量 =xn的概率分布也是正態(tài)分布,且有 ,即服從正態(tài)分布N(,2n)。(2) 若隨機變量x服從平均數(shù)是,方差是2的分布(不是正態(tài)分布); x1、x2、xn,是由此總體得來的隨機樣本,則統(tǒng)計量 =xn的概率分布,當n相當大時逼近正態(tài)分布N(,2n)。這就是中心極限定理。 中心極限定理告訴我們:不論x變量是連續(xù)型還是離散型,也無論x服從何種分布,一般只要n30,就可認為 的分布是正態(tài)分布。若x的分布不很偏斜,在n20時 , 的分布就近似于正態(tài)分布了由中心極限定理知,只要樣本容量適當大,不論總體分布形狀如何,其 的分布都可看 和方差 2
28、 。在實際應用上,如n>30就可以應用這作為正態(tài)分布,且具平均數(shù)一定理。平均數(shù)的標準化分布是將上述平均數(shù) x轉(zhuǎn)換為z變數(shù)。n( x - ) ( x - ) = z = n x、標準誤標準誤(平均數(shù)抽樣總體的標準差) 的大小反映樣本平均數(shù) 的抽樣誤差的大小,即精確性的高低。標準誤大,說明各樣本平均數(shù) 間差異程度大,樣本平均數(shù)的精確性低。反之, 小,樣本平均數(shù)的精確性高。 的大小與原總體的標準差成正比,與樣本含量n的平方根成反比。從某特定總體抽樣,因為是一常數(shù),所以只有增大樣本含量才能降低樣本平均數(shù) 的抽樣誤差。在實際工作中,總體標準差往往是未知的,因而無法求得 。此時,可用樣本標準差S估計
29、。于是,以 估計 。記 為 , 稱作樣本標準誤或均數(shù)標準誤。樣本標準誤 是平均數(shù)抽樣誤差的估計值。若樣本中各觀測值為 x1、x2、xn,則= S=n(n-1)n(n-1)n注意:樣本標準差與樣本標準誤是既有聯(lián)系又有區(qū)別的兩個統(tǒng)計量。二者的區(qū)別是樣本標準差S是反映樣本中各觀測值的變異程度,它的大小說明了 對該樣本代表性的強弱。樣本標準誤是樣本平均數(shù) 的標準差,它是抽樣誤差的估計值,其大小說明了樣本間變異程度的大小及精確性的高低。(二) 兩個獨立樣本平均數(shù)差數(shù)的分布假定有兩個正態(tài)總體各具有平均數(shù)和標準差為 1, 1 和 2 , 2,從第一個總體隨機抽取n1個觀察值,同時獨立地從第二個總體隨時機抽取
30、n2個觀察值。這樣計算出樣本平均數(shù)和標準差 ,s1和 ,s2。 12 S(x-)2x2-(x)/n2從統(tǒng)計理論可以推導出其樣本平均數(shù)的差數(shù)( )的抽樣分布,具有以下特性12(1) 如果兩個總體各作正態(tài)分布,則其樣本平均數(shù)差數(shù)( 1 - 2 )準確地遵循正態(tài)分布律,無論樣本容量大或小,都有N( 2 )。 , - 1-21-21-2=1-2(2) 兩個樣本平均數(shù)差數(shù)分布的平均數(shù)必等于兩個總體平均數(shù)的差數(shù),即(3) 兩個獨立的樣本平均數(shù)差數(shù)分布的方差等于兩個總體的樣本平均數(shù)的方差總和,即 2 21-2=其差數(shù)標準差為:-= 12221+2222=1n1+2n212+n1n2這個分布也可標準化,獲得z
31、值z = ( y 1 - y 2 ) - ( - ) 1 22 2 1 2n1態(tài)分布具:+ n 2 =1+1 小結: 若兩個樣本抽自于同一正態(tài)總體,則其平均數(shù)差數(shù)的抽樣分布不論容量大小亦作正1-2=0,11-2nn2 若兩個樣本抽自于同一總體,但并非正態(tài)總體,則其平均數(shù)差數(shù)的抽樣分布按中心極限定理在n1和n2相當大時(大于30)才逐漸接近于正態(tài)分布。 2 若兩個樣本抽自于兩個非正態(tài)總體,當n1和n2相當大、而 1 2與 2 相差不太遠時,也可近似地應用正態(tài)接近方法估計平均數(shù)差數(shù)出現(xiàn)的概率,當然這種估計的可靠性得依兩總體偏離正態(tài)的程度和相差大小而轉(zhuǎn)移。(三)二項總體的抽樣分布、 二項總體的分布參
32、數(shù)(成數(shù)) = p 平均數(shù):方差: 2 = p (1 - p pq ) =標準差: = p(1-p) = pq、 樣本平均數(shù)(成數(shù))的抽樣分布從二項總體進行抽樣得到樣本,樣本平均數(shù)(成數(shù))抽樣分布的參數(shù)為:平均數(shù): = p2=pqn方差:標準誤: = pq = p ( 1 - p ) nn(四)不重復抽樣的修正系數(shù) 前所講的抽樣分布和抽樣平均誤差的計算公式,都是就重復抽樣而言的。可以證明,采用不重復抽樣時,平均數(shù)和比例的抽樣平均誤差應為:( )=N-n2n(N-nN-1)n2(1 -nN)nN(P)=P(1-P)N-n()nN-1p(1-p)n(1-)可見,不重復抽樣的抽樣平均誤差公式比重復抽
33、樣的相應公式多一個系數(shù)N-1NN-1 n這個系數(shù)稱為不重復抽樣修正系數(shù)。當N很大時, N - n - (其中:n/N為抽樣比例)。 實際中,當抽樣比例很小時,(一般認為小于5%),不重復抽樣的抽樣誤差常采用重復抽樣的公式計算。三、t 分布1、t 分布的定義:若xN(, 2), 則 N(, 2/n)。 將隨機變量 標準化得: ,則zN(0,1)。 當總體標準差未知時, 以樣本標準差S代替所得到的統(tǒng)計量 記為t。在計算 時,由于采用S來代替,使得t 變量不再服從標準正態(tài)分布,而是服從t分布(tdistribztion)。它的概率分布密度函數(shù)如下:f(t)=1(df+1)/2(1+t2(df/2)d
34、f式中,t的取值范圍是(-,+);df=n-1為自由度。- 函 數(shù) +df)-df+12-函數(shù)的定義:(r)= -函數(shù)的定義域:(-,+)自由度df(degree of freedom )的含義 xr-1edx-xdf=k=n-1T 分布密度曲線2、t 分布的圖形特征t分布是類似正態(tài)分布的一種對稱分布,它通常要比正態(tài)分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布。(1)t 分布受自由度的制約,每一個自由度都有一條t分布密度曲線。(2)t分布密度曲線以縱軸為對稱軸,左右對稱,且在t0時,分布密度函數(shù)取得最大值。(3)與標準正態(tài)分布曲線相比,t分布曲線頂部略低,兩尾部稍高而平。df越小這種趨勢越明顯。df越大,t分布越趨近于標準正態(tài)分布。3、 t ( n ) 分布分位點計算n ) 分布求它的分位點而不是求其概率。其分位點的定義 在統(tǒng)計中經(jīng)常對給定的 t (與標準正態(tài)分布相同。pt
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鮮花烤奶課程設計
- 自來水收費系統(tǒng)課程設計
- 補牙系統(tǒng)課程設計
- 2025年度藝術品代購代發(fā)市場推廣協(xié)議4篇
- 鐵路線路課程設計
- 年度數(shù)字視頻切換臺市場分析及競爭策略分析報告
- 年度工藝禮品加工設備市場分析及競爭策略分析報告
- 2024年央行金融政策和法律法規(guī)測試題及答案匯編
- 二零二五年駕校場地租賃與師資力量引進協(xié)議3篇
- 重卡汽配配件課程設計
- 微信小程序運營方案課件
- 抖音品牌視覺識別手冊
- 陳皮水溶性總生物堿的升血壓作用量-效關系及藥動學研究
- 安全施工專項方案報審表
- 學習解讀2022年新制定的《市場主體登記管理條例實施細則》PPT匯報演示
- 好氧廢水系統(tǒng)調(diào)試、驗收、運行、維護手冊
- 中石化ERP系統(tǒng)操作手冊
- 五年級上冊口算+脫式計算+豎式計算+方程
- 氣體管道安全管理規(guī)程
- 《眼科學》題庫
- 交通燈控制系統(tǒng)設計論文
評論
0/150
提交評論