版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第二章數(shù)理統(tǒng)計(jì)的基本概念作出精確而可靠的結(jié)論.數(shù)理統(tǒng)計(jì)可以分為兩大類:一類是如何合理地安排試驗(yàn),-------描述統(tǒng)計(jì)學(xué)如:試驗(yàn)設(shè)計(jì)、抽樣方法。另一類是研究如何分析所獲得的隨機(jī)數(shù)據(jù),對所研究的問題進(jìn)行科學(xué)的、合理的估計(jì)和推斷,盡可能地為采取一定的決策提供依據(jù),-------推斷統(tǒng)計(jì)學(xué),如:參數(shù)估計(jì)、假設(shè)檢驗(yàn)等。以獲取有效的隨機(jī)數(shù)據(jù)。數(shù)理統(tǒng)計(jì)100個樣品進(jìn)行強(qiáng)度測試,于是面臨下列幾個問題:例如
某廠生產(chǎn)一型號的合金材料,用隨機(jī)的方法選取1、估計(jì)這批合金材料的強(qiáng)度均值是多少?(參數(shù)的點(diǎn)估計(jì)問題)2、強(qiáng)度均值在什么范圍內(nèi)?(參數(shù)的區(qū)間估計(jì)問題)3、若規(guī)定強(qiáng)度均值不小于某個定值為合格,那么這批材料是否合格?(參數(shù)的假設(shè)檢驗(yàn)問題)4、這批合金的強(qiáng)度是否服從正態(tài)分布?5、若這批材料是由兩種不同工藝生產(chǎn)的,那么不同的工藝對合金強(qiáng)度有否影響?若有影響,那一種工藝生產(chǎn)的強(qiáng)度較好?(分布檢驗(yàn)問題)(方差分析問題)6、若這批合金由幾種原料用不同的比例合成,那么如何表達(dá)這批合金的強(qiáng)度與原料比例之間的關(guān)系?(回歸分析問題)我們依次討論參數(shù)的點(diǎn)估計(jì)、區(qū)間估計(jì)、假設(shè)檢驗(yàn)、方差分析、回歸分析下面引入一些數(shù)理統(tǒng)計(jì)中的術(shù)語。二、統(tǒng)計(jì)量一、總體與樣本抽樣和抽樣分布三、幾個常用的分布四、正態(tài)總體統(tǒng)計(jì)量的分布1.總體研究對象的某項(xiàng)數(shù)量指標(biāo)值全體稱為總體(母體)個體——總體中每個成員(元素)研究某批燈泡的質(zhì)量總體…考察國產(chǎn)轎車的質(zhì)量總體一總體和樣本破壞性的試驗(yàn)更是不允許對整個總體進(jìn)行考察.考察某工廠生產(chǎn)的燈泡壽命考察某型號手機(jī)的質(zhì)量考察吸煙和患肺癌的關(guān)系在實(shí)際問題中,要考察整個總體往往是不可能的,因?yàn)樗枰馁M(fèi)太多的資源和太多的時間.有些2.樣本樣本中所包含的個體數(shù)目稱為樣本容量.從國產(chǎn)轎車中抽5輛進(jìn)行耗油量試驗(yàn)。樣本容量為5。為了推斷總體分布及各種特征,一個可行的辦法是從該總體中按一定的規(guī)則抽取若干個個體進(jìn)行觀察和試驗(yàn),以獲得有關(guān)總體的信息.這一抽取過程稱為“抽樣”,所抽取的部分個體稱為樣本.方法.由于抽樣的目的是為了對總體進(jìn)行統(tǒng)計(jì)推斷,為了使抽取的樣本能很好地反映總體,必須考慮抽樣統(tǒng)計(jì)中,采用的抽樣方法是隨機(jī)抽樣法,即子樣中每個個體是從母體中隨意地取出來的。(1)
重復(fù)(返回)抽樣分量Xk與所考察的總體有相同的分布.從總體中抽取個體檢查后放回,母體成分不變(分布不變)相互獨(dú)立的隨機(jī)變量.對無限母體而言做無返回抽取,并不改變母體的成分獨(dú)立且同分布于母體(2)非重復(fù)(無返回)抽樣取出樣本后改變了母體的成分,所以對有限母體,不相互獨(dú)立,(2)獨(dú)立同分布性它要求抽取的樣本滿足下面兩點(diǎn):(1)代表性(隨機(jī)性):最常用的一種抽樣方法叫作“簡單隨機(jī)抽樣”。其中每一個分量Xk與所考察的總體有相同的分布.每一個個體被抽到的可能性相同。從總體中抽取樣本的每一個分量Xk
是隨機(jī)的,是相互獨(dú)立的隨機(jī)變量.若不特別說明,就指簡單隨機(jī)樣本.簡單隨機(jī)樣本是應(yīng)用中最常見的情形,今后當(dāng)說到“X1,X2,…,Xn是取自某總體的樣本”時,簡單隨機(jī)樣本可以用與總體獨(dú)立同分布的n個相互獨(dú)立的隨機(jī)變量若總體X的分布函數(shù)為聯(lián)合分布函數(shù)為若總體X的分布密度函數(shù)為表示.則其簡單隨機(jī)樣本的則其簡單隨機(jī)樣本的聯(lián)合密度函數(shù)為離散總體則樣本的分布列樣本的聯(lián)合概率密度為(2)總體X的概率密度為例1
對下列總體分別求出樣本的聯(lián)合分布我們只能觀察到隨機(jī)變量取的值,而見不到隨機(jī)變量.3.總體、樣本、樣本值的關(guān)系
事實(shí)上我們抽樣后得到的資料都是具體的、確定的值.它們是樣本取到的值而不是樣本.因而可以由樣本值去推斷總體.總體分布決定了樣本取值的概率規(guī)律,也就是樣本取到樣本值的規(guī)律,去推斷總體的情況--總體分布F(x)的性質(zhì).樣本是聯(lián)系二者的橋梁統(tǒng)計(jì)是從手中已有的資料--樣本值,4.樣本的分布1)樣本的頻數(shù)分布將n個樣本值按從小到大排列,把相同的數(shù)合并,并指出其頻數(shù)(樣本中各數(shù)出現(xiàn)的次數(shù))x頻數(shù)頻率1)樣本的經(jīng)驗(yàn)分布函數(shù)樣本值
樣本值小于或等于x的個數(shù),作---樣本的經(jīng)驗(yàn)分布函數(shù)給出了在n次獨(dú)立重復(fù)試驗(yàn)中,事件出現(xiàn)的頻率,具有分布函數(shù)的一切性質(zhì)。如:非降,右連續(xù);由頻數(shù)分布知若樣本為n維r.v,那么對于每一樣本值就可作一個經(jīng)驗(yàn)分布函數(shù),故是隨機(jī)變量---n次獨(dú)立重復(fù)試驗(yàn)中,事件發(fā)生的頻率。由伯努利大數(shù)定律,格列汶科進(jìn)一步證明了:當(dāng)n→∞時,F(xiàn)n(x)以概率1關(guān)于x一致收斂于F(x),即這就是著名的格列汶科定理.格列汶科定理的優(yōu)缺點(diǎn)1、當(dāng)樣本容量n足夠大時,對所有的x,
Fn(x)與F(x)之差的絕對值都很小,且這件事發(fā)生的概率為1.2、Fn(x)是一統(tǒng)計(jì)量,則也是一統(tǒng)計(jì)量,用來表示Fn(x)與F(x)的最大差異,且概率為1的收斂于零。3、定理沒有給出的分布或極限分布這就是我們可以由樣本推斷總體的基本理論依據(jù)定理:樣本均值以概率收斂于EX,樣本方差以概率收斂于總體方差DX,樣本矩以概率收斂于總體矩五、直方圖(1)離散情況(2)連續(xù)情況其中為未知。如何估計(jì)?ip設(shè)總體X為連續(xù)型隨機(jī)變量,如何估計(jì)未知的密度函數(shù)f(x)?定義1
設(shè)是來自總體X的一個樣本,為一實(shí)值連續(xù)函數(shù),其不包含任何未知參數(shù),則稱為一個統(tǒng)計(jì)量。為的觀測值。注:是隨機(jī)變量的函數(shù)仍為隨機(jī)變量。便是一個數(shù)。注:統(tǒng)計(jì)量是隨機(jī)變量。二統(tǒng)計(jì)量1.統(tǒng)計(jì)量例1為來自總體的樣本
未知,
已知,判斷下列函數(shù)哪些是統(tǒng)計(jì)量。
2.幾個常見的統(tǒng)計(jì)量樣本均值樣本方差它反映了總體均值的信息是來自總體X的一個樣本,它反映了總體方差的信息樣本標(biāo)準(zhǔn)差證左邊=重要公式樣本k
階原點(diǎn)矩樣本k階中心矩
它反映了總體k階矩的信息
它反映了總體k階中心矩的信息常見統(tǒng)計(jì)量的性質(zhì)是來自總體例2設(shè)的一樣本,總體的階矩存在,證明(1)(2)證
獨(dú)立且與同分布獨(dú)立且與同分布由辛欽大數(shù)定律,知充分統(tǒng)計(jì)量與完備統(tǒng)計(jì)量充分統(tǒng)計(jì)量定義:設(shè)是來自總體X具有分布函數(shù)
當(dāng)給定時,若樣本的條件分布與參數(shù)無關(guān),則稱是的
充分統(tǒng)計(jì)量
充分統(tǒng)計(jì)量含義
樣本中包含關(guān)于總體分布中未知參數(shù)的信息,是因?yàn)闃颖镜穆?lián)合分布與參數(shù)有關(guān)。對統(tǒng)計(jì)量T,如果已經(jīng)知道它的值以后,樣本的條件分布就與參數(shù)無關(guān)。即在統(tǒng)計(jì)量T中包含了參數(shù)的全部信息。
用定義證明T是充分統(tǒng)計(jì)量例1設(shè)總體服從兩點(diǎn)分布,即是來自總體
的一個樣本,證明樣本均值是參數(shù)的充分統(tǒng)計(jì)量證明:由于當(dāng)已知時,樣本的條件概率
例2設(shè)是來自泊松分布的一個樣本,證明樣本均值是的充分統(tǒng)計(jì)量
證明:由泊松分布性質(zhì)知
在給定后,對任意有樣本的條件概率為:例3設(shè)是來自正態(tài)總體的
樣本,證明是充分統(tǒng)計(jì)量證明:由條件知
在給定后,對任意有,樣本的條件概率密度為:因子分解定理定理(費(fèi)希爾—奈曼準(zhǔn)則)設(shè)是來自總體X具有分布函數(shù)
則為的充分統(tǒng)計(jì)量的充要條件是:樣本的聯(lián)合分布密度函數(shù)可以分解為
用因子分解定理證明充分統(tǒng)計(jì)量例1設(shè)總體服從兩點(diǎn)分布,即是來自總體
的一個樣本,證明樣本均值是參數(shù)的充分統(tǒng)計(jì)量證明:由于例2設(shè)是來自泊松分布的一個樣本,證明樣本均值是的充分統(tǒng)計(jì)量
證明:樣本的聯(lián)合分布律為例3設(shè)是來自正態(tài)總體的
樣本,證明是的充分統(tǒng)計(jì)量證明:樣本的聯(lián)合分布密度為:例4設(shè)是來自正態(tài)總體的一個
樣本,證明是的充分統(tǒng)計(jì)量證明:樣本的聯(lián)合分布密度為:例5
設(shè)x1,x2,…,xn是取自總體U(0,)的樣本,即總體的密度函數(shù)為p(x;)=1/,0x0,其他于是樣本的聯(lián)合密度函數(shù)為取T=x(n),并令g(t
;)=(1/)nIt,h(x)=1,由因子分解定理知T=x(n)
是的充分統(tǒng)計(jì)量。p(x1;)…p(xn;)=0,其它
(1/)n,0minximaxxi由于諸xi0,所以我們可將上式改寫為p(x1;)…p(xn;)=(1/)nIx(n)定理:設(shè)是單值可逆函數(shù),則也是的充分統(tǒng)計(jì)量結(jié)論:1統(tǒng)計(jì)量用來推測參數(shù)的值;2充分統(tǒng)計(jì)量把可能丟失信息的統(tǒng)計(jì)量篩選;3最優(yōu)統(tǒng)計(jì)量在充分統(tǒng)計(jì)量之中;4一個參數(shù)的充分統(tǒng)計(jì)量不唯一.問題:在什么情況下,它是唯一的?充分性原則:
在統(tǒng)計(jì)學(xué)中有一個基本原則--
在充分統(tǒng)計(jì)量存在的場合,任何統(tǒng)計(jì)推斷都可以基于充分統(tǒng)計(jì)量進(jìn)行,這可以簡化統(tǒng)計(jì)推斷的程序。完備統(tǒng)計(jì)量定義設(shè)總體的分布函數(shù)族為若對任意一個滿足的隨機(jī)變量,總有則稱為完備的分布函數(shù)族若一統(tǒng)計(jì)量T的分布函數(shù)族是完備的,則該統(tǒng)計(jì)量為完備統(tǒng)計(jì)量性質(zhì)例設(shè)是來自總體服從兩點(diǎn)分布的樣本,樣本均值是參數(shù)的充分統(tǒng)計(jì)量,驗(yàn)證也是完備統(tǒng)計(jì)量證明:由于如果一個統(tǒng)計(jì)量既是充分統(tǒng)計(jì)量,又是完備統(tǒng)計(jì)量,則稱為充分完備統(tǒng)計(jì)量。定理:設(shè)來自總體的一個樣本,的充分完備統(tǒng)計(jì)量如果無偏估計(jì)存在,則是唯一的最優(yōu)無偏估計(jì)量指數(shù)型分布族定義:設(shè)是來自正態(tài)總體X的一個樣本,其分布密度為,如果樣本的聯(lián)合分布密度具有形式其中只與參數(shù)有關(guān),只與樣本有關(guān),則稱為指數(shù)型分布族定理:設(shè)總體的分布密度為指數(shù)型分布族,則是參數(shù)的充分完備統(tǒng)計(jì)量例1設(shè)是來自泊松分布的樣本,則樣本的聯(lián)合分布律為例2設(shè)是來自正態(tài)總體的樣本,它的聯(lián)合分布密度為:是的充分完備統(tǒng)計(jì)量統(tǒng)計(jì)量既然是依賴于樣本的,而樣本是隨機(jī)變量,故統(tǒng)計(jì)量也是隨機(jī)變量,因而就有一定的分布,這個分布叫做統(tǒng)計(jì)量的“抽樣分布”
.常用的有
三.抽樣分布分布,正態(tài)分布,t分布,F(xiàn)分布(1)標(biāo)準(zhǔn)正態(tài)分布X的上α
(0<α<1)分位點(diǎn)記為設(shè)相互獨(dú)立,都服從正態(tài)分布N(0,1),
則稱隨機(jī)變量:所服從的分布為自由度為n的分布.分布的密度函數(shù)為其中伽瑪函數(shù)相互獨(dú)立,都服從正態(tài)分布則且X1,X2相這個性質(zhì)叫分布的可加性.(1)
設(shè)(2)設(shè)互獨(dú)立,則性質(zhì)應(yīng)用中心極限定理可得,若則當(dāng)n充分大時,的分布近似正態(tài)分布N(0,1).(4)(標(biāo)準(zhǔn)化)(3)
對于給定的正數(shù)稱滿足條件為分位點(diǎn).分布的上的點(diǎn)
分布的分位點(diǎn)上分位點(diǎn)。雙側(cè)分位點(diǎn)。當(dāng)時雙側(cè)分位點(diǎn)一般的分布表只列到n=45,n>45時,由記為T~t(n).服從自由度為n的t分布.(3)t分布設(shè)X~N(0,1),Y~則稱變量,且X與Y相互獨(dú)立,當(dāng)n充分大時,其圖形類似于標(biāo)準(zhǔn)正態(tài)分布密度函數(shù)的圖形。
t分布的密度函數(shù)關(guān)于x=0對稱性質(zhì)(1)具有自由度為n的t分布的隨機(jī)變量T的當(dāng)n充分大時,其圖形類似于標(biāo)準(zhǔn)正態(tài)分布密度(2)t分布的密度函數(shù)關(guān)于x=0對稱,且2.性質(zhì)數(shù)學(xué)期望和方差為:E(T)=0;D(T)=n/(n-2),對n>2函數(shù)的圖形.很大.不難看到,當(dāng)n充分大時,t分布近似N
(0,1)分布.但對于較小的n,t分布與N(0,1)分布相差3、t分布的分位點(diǎn)
對于給定的正數(shù)稱滿足條件的點(diǎn)為分位點(diǎn)”。分布的“上例查t分布表,附表3取當(dāng)時
分布上側(cè)α分位點(diǎn)
分布下側(cè)α分位點(diǎn)
分布雙側(cè)α分位點(diǎn)t的分布的雙側(cè)α分位點(diǎn)為滿足(4)F
分布的F分布,n1稱為第一自由度,設(shè)X與Y相互獨(dú)立,則稱統(tǒng)計(jì)量服從自由度為稱為第二自由度,記作由定義可得性質(zhì)F
分布的分位點(diǎn)對于給定的正數(shù)稱滿足條件為分布的的點(diǎn)上分位點(diǎn)即它的數(shù)學(xué)期望并不依賴于第一自由度n1.(2)X的數(shù)學(xué)期望為:若n2>2(1)由定義可見,~F(n2,n1)2.性質(zhì)(3)F分布的分位點(diǎn)
對于給定的正數(shù)稱滿足條件的點(diǎn)為分位點(diǎn)分布的上F分布的性質(zhì)表中所給的都是很小的數(shù),如0.01,0.05等當(dāng)表中查不出,由性質(zhì)(2)較大時,如0.95,例1設(shè)隨機(jī)變量求的分布。解
隨機(jī)變量與獨(dú)立因而由于由定理3得由題可知四.正態(tài)總體抽樣分布定理的樣本,則有
定理1(樣本均值的分布)設(shè)X1,X2,…,Xn
是來自正態(tài)總體定理2(樣本方差的分布)設(shè)X1,X2,…,Xn
是取自正態(tài)總體樣本,分別為樣本均值和樣本方差.則有的和相互獨(dú)立。
分別是這兩個樣本的均值,且X與Y獨(dú)立,是取自X的樣本,樣本,分別是這兩個樣本的樣本方差,則有是取自Y的定理3(兩總體樣本均值差的分布)例2一個樣本,求設(shè)是來自正態(tài)總體的(1)(2)由定理2知解
例2一個樣本,求設(shè)是來自正態(tài)總體的(1)(2)查表可得思考與練習(xí)是來自正態(tài)總體的樣1.設(shè)本,則有(A);;(B);(C);(D)一些非正態(tài)總體樣本均值得分布定理:設(shè)總體的分布是任意的,但具有有限方差,為來自總體的樣本,則當(dāng)時樣本均值有即當(dāng)充分大時,近似服從正態(tài)分布定理:設(shè)總體的分布是任意的,其均值為方差為且四階中心矩有限,為來自總體的樣本,則當(dāng)時,樣本方差有即當(dāng)充分大時,近似服從正態(tài)分布定理:設(shè)總體的分布是任意的,其均值為且具有有限方差,為來自總體的樣本,則當(dāng)時有即當(dāng)充分大時,近似服從正態(tài)分布前面三個定理是研究大樣本統(tǒng)計(jì)問題的理論依據(jù)次序統(tǒng)計(jì)量及其分布
一、次序統(tǒng)計(jì)量。一、定義
設(shè)x1,x2,…,xn
是取自總體X的樣本,
x(i)稱為該樣本的第i個次序統(tǒng)計(jì)量,它的取值是將樣本觀測值由小到大排列后得到的第i個觀測值。其中x(1)=minx1,x2,…,xn稱為該樣本的最小次序統(tǒng)計(jì)量,稱x(n)=maxx1,x2,…,xn為該樣本的最大次序統(tǒng)計(jì)量。例
設(shè)總體X的分布為僅取0,1,2的離散均勻分布,分布列為0
1
2
1/3
1/3
1/3在一個樣本中,x1,x2,…,xn
是獨(dú)立同分布的,而次序統(tǒng)計(jì)量x(1),x(2),…,x(n)則既不獨(dú)立,分布也不相同,看下例?,F(xiàn)從中抽取容量為3的樣本,其一切可能取值有33=27種,下表列出了這些值,由此一二三一二三一二三000100200001101201002102202010110210011111211012
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《棉及化纖純紡、混紡紗線退漿試驗(yàn)方法》
- 05 C反沖現(xiàn)象 火箭 提升版2025新課改-高中物理-選修第1冊(21講)
- 橋接車輛相關(guān)項(xiàng)目投資計(jì)劃書
- 銀行業(yè)務(wù)宣講培訓(xùn)
- 護(hù)理管理學(xué)健康教育
- 我國環(huán)保法庭訴訟規(guī)則研究畢業(yè)論文
- 第六章 電子商務(wù)基礎(chǔ)技術(shù)4、5課件
- 智慧醫(yī)院綜合管理解決方案(醫(yī)院報警管理)
- 流行病學(xué)因果聯(lián)系
- 2024年大班畢業(yè)家長的發(fā)言稿例文(2篇)
- 第13課《不求甚解》 統(tǒng)編版語文九年級下冊
- 光電信息科學(xué)與工程專業(yè)大學(xué)生職業(yè)生涯規(guī)劃書
- 2023-2024學(xué)年廣東省深圳市48校聯(lián)考九年級(上)期中語文試卷
- 聯(lián)想醫(yī)療桌面云平臺解決方案@20180727
- 醫(yī)院布草洗滌服務(wù)方案(技術(shù)方案)
- 林業(yè)遙感技術(shù)及典型應(yīng)用
- 中等職業(yè)學(xué)校英語教學(xué)大綱詞匯表本表共收詞2200個左右含
- 《強(qiáng)化學(xué)習(xí)理論與應(yīng)用》基于AC框架的深度強(qiáng)化學(xué)習(xí)方法
- 第15課 權(quán)力與理性-17、18世紀(jì)西方美術(shù) 課件-2023-2024學(xué)年高中美術(shù)人教版(2019)美術(shù)鑒賞
- 參加思政課教師培訓(xùn)心得體會2023
- 人教版一年級數(shù)學(xué)上冊《解決問題之間有幾人》課件
評論
0/150
提交評論