統(tǒng)計(jì)學(xué)基礎(chǔ)知識課件_第1頁
統(tǒng)計(jì)學(xué)基礎(chǔ)知識課件_第2頁
統(tǒng)計(jì)學(xué)基礎(chǔ)知識課件_第3頁
統(tǒng)計(jì)學(xué)基礎(chǔ)知識課件_第4頁
統(tǒng)計(jì)學(xué)基礎(chǔ)知識課件_第5頁
已閱讀5頁,還剩130頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識回顧1第二章統(tǒng)計(jì)學(xué)基礎(chǔ)知識回顧1主要內(nèi)容第一節(jié)總體、樣本和隨機(jī)函數(shù)第二節(jié)對總體的描述——隨機(jī)變量的數(shù)字特征第三節(jié)對樣本的描述——樣本分布的數(shù)字特征第四節(jié)隨機(jī)變量的分布——總體和樣本的連接點(diǎn)第五節(jié)通過樣本,估計(jì)總體(一)——估計(jì)量的特征第六節(jié)通過樣本,估計(jì)總體(二)——估計(jì)方法第七節(jié)通過樣本,估計(jì)總體(三)——假設(shè)檢驗(yàn)

2主要內(nèi)容2四個基本定義與統(tǒng)計(jì)學(xué)的邏輯結(jié)構(gòu)總體和個體樣本和樣本容量隨機(jī)變量統(tǒng)計(jì)量統(tǒng)計(jì)學(xué)的邏輯結(jié)構(gòu)3四個基本定義與統(tǒng)計(jì)學(xué)的邏輯結(jié)構(gòu)總體和個體3總體(集合)和個體(構(gòu)成集合的元素)研究對象的全體稱為總體或母體,組成總體的每個基本單位稱為個體。(1)按組成總體個體的多寡分為:有限總體和無限總體;(2)總體具有同質(zhì)性:每個個體具有共同的觀察特征,而與其它總體相區(qū)別;(3)度量同一對象得到的數(shù)據(jù)也構(gòu)成總體,數(shù)據(jù)之間的差異是絕對的,因?yàn)榇嬖诓豢上碾S機(jī)測量誤差;(4)個體表現(xiàn)為某個數(shù)值是隨機(jī)的,但是,它們?nèi)〉媚硞€數(shù)值的機(jī)會是不同的,即它們按一定的規(guī)律取值,即它們的取值與確定的概率相對應(yīng)。4總體(集合)和個體(構(gòu)成集合的元素)研究對象的全體稱為總體或樣本和樣本容量總體中抽出若干個個體組成的集體稱為樣本。樣本中包含的個體的個數(shù)稱為樣本的容量,又稱為樣本的大小。抽樣是按隨機(jī)原則選取的,即總體中每個個體有同樣的機(jī)會被選入樣本。5樣本和樣本容量總體中抽出若干個個體組成的集體稱為樣本。樣本中隨機(jī)變量根據(jù)概率不同而取不同數(shù)值的變量稱為隨機(jī)變量(RandomVariable)。注意:(1)一個隨機(jī)變量具有下列特性:RV可以取許多不同的數(shù)值,取這些數(shù)值的概率為p,p滿足:0<=p<=1。(2)隨機(jī)變量以一定的概率取到各種可能值,按其取值情況隨機(jī)變量可分為兩類:離散型隨機(jī)變量和連續(xù)型隨機(jī)變量。離散型隨機(jī)變量的取值最多可列多個;連續(xù)型隨機(jī)變量的取值充滿整個數(shù)軸或者某個區(qū)間。6隨機(jī)變量根據(jù)概率不同而取不同數(shù)值的變量稱為隨機(jī)變量(Rand離散型隨機(jī)變量與連續(xù)型隨機(jī)變量10203040501.0概率概率xx1.0離散型隨機(jī)變量連續(xù)型隨機(jī)變量7離散型隨機(jī)變量與連續(xù)型隨機(jī)變量102030總體與隨機(jī)變量的關(guān)系表示總體狀況的數(shù)量特征,在總體中是參差不齊的,往往以一定的概率取不同的數(shù)值,顯然對于這樣的數(shù)值我們采用一般的變量是無法加以描述的。但是??梢圆捎靡环N特殊的變量來表示它們。這個特殊變量就是隨機(jī)變量。因?yàn)?,根?jù)隨機(jī)變量的定義,隨機(jī)變量以一定的概率取許多不同的值,而且概率p滿足:0<=p<=1。由于我們主要研究總體的數(shù)量特征,可以直接用隨機(jī)變量來表示所研究的總體。8總體與隨機(jī)變量的關(guān)系表示總體狀況的數(shù)量特征,在總體中是參差不總體、隨機(jī)變量、樣本間的聯(lián)系總體就是一個隨機(jī)變量,所謂樣本就是n個(樣本容量n)相互獨(dú)立且與總體有相同分布的隨機(jī)變量X1,……,Xn。每一次具體抽樣所得的數(shù)據(jù),就是n元隨機(jī)變量的一個觀察值,記為(X1,……,Xn)。通過總體的分布可以把總體和樣本連接起來。9總體、隨機(jī)變量、樣本間的聯(lián)系總體就是一個隨機(jī)變量,所謂樣本就總體分布是總體和樣本的連接點(diǎn)所謂分布,它是從全局而言的。通俗地說,分布就是某個對象在什么地方,堆積了多少。任何一個隨機(jī)變量都有自己的分布,這個什么地方就是在數(shù)軸上取什么值,堆積多少就是在那里占有的比例是多少或者概率有多大??傮w可以表示為隨機(jī)變量,并具有自身的分布。樣本則是相互獨(dú)立與總體具有相同分布的n元隨機(jī)變量。因此,總體分布是總體和樣本的連接點(diǎn)。從而,可以通過對樣本特征的研究達(dá)到對總體進(jìn)行研究的目的。因?yàn)樗鼈兙哂邢嗤姆植肌?0總體分布是總體和樣本的連接點(diǎn)所謂分布,它是從全局而言的。通俗統(tǒng)計(jì)量設(shè)(x1,x2,……,xn)為一組樣本觀察值,函數(shù)f(x1,x2,……,xn)若不含有未知參數(shù),則稱為統(tǒng)計(jì)量。統(tǒng)計(jì)量一般是連續(xù)函數(shù)。由于樣本是隨機(jī)變量,因而它的函數(shù)也是隨機(jī)變量,所以,統(tǒng)計(jì)量也是隨機(jī)變量。統(tǒng)計(jì)量一般用它來提取或壓榨由樣本帶來的總體信息。11統(tǒng)計(jì)量設(shè)(x1,x2,……,xn)為一組樣本觀察值,函數(shù)f(樣本與總體之間的關(guān)系樣本是總體的一部分,是對總體隨機(jī)抽樣后得到的集合。對觀察者而言,總體是不了解的,了解的只是樣本的具體情況。我們所要做的就是通過對這些具體樣本的情況的研究,來推知整個總體的情況?!璛n+1Xn…X1樣本總體12樣本與總體之間的關(guān)系樣本是總體的一部分,是對……Xn+1Xn統(tǒng)計(jì)學(xué)的邏輯結(jié)構(gòu)(1)總體和樣本引入一個隨機(jī)變量來描述總體(2)對總體的描述:隨機(jī)變量的數(shù)字特征(3)對樣本的描述:樣本分布的數(shù)字特征(4)總體與樣本的連接點(diǎn):隨機(jī)變量的分布(5)如何用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征及數(shù)據(jù)生成過程中的各種參數(shù)a估計(jì)量的優(yōu)良性b估計(jì)方法c對估計(jì)量的檢驗(yàn)——假設(shè)檢驗(yàn)13統(tǒng)計(jì)學(xué)的邏輯結(jié)構(gòu)(1)總體和樣本13a估計(jì)量的優(yōu)良性1、無偏性2、有效性3、均方誤最小4、一致性14a估計(jì)量的優(yōu)良性1、無偏性14b估計(jì)方法

矩法最大似然法最小二乘法總體分布未知正態(tài)總體一般總體(大樣)已知方差方差未知一般總體(大樣)正態(tài)總體估計(jì)期望單個總體兩個總體估計(jì)方差(常用小樣本下,正態(tài)總體估計(jì)其它參數(shù))點(diǎn)估計(jì)區(qū)間估計(jì)15b估計(jì)方法矩法最c對估計(jì)量的檢驗(yàn)——假設(shè)檢驗(yàn)1.對總體分布特征的假設(shè)檢驗(yàn)(1)一個正態(tài)總體的假設(shè)檢驗(yàn)a檢驗(yàn)均值:已知方差和未知方差b檢驗(yàn)方差:未知均值(雙尾和單尾)(2)兩個正態(tài)總體的假設(shè)檢驗(yàn)a檢驗(yàn)均值:未知方差但可假設(shè)其相等b檢驗(yàn)方差:未知均值(雙尾和單尾)(3)總體分布的假設(shè)檢驗(yàn)a總體為離散型分布b總體為連續(xù)型分布2.對各種系數(shù)、參數(shù)估計(jì)值的假設(shè)檢驗(yàn)16c對估計(jì)量的檢驗(yàn)——假設(shè)檢驗(yàn)1.對總體分布特征的假設(shè)檢一、隨機(jī)變量的分布17一、隨機(jī)變量的分布17(一)離散型隨機(jī)變量的分布定義:如果隨機(jī)變量

只取有限個或可列多個可能值,而且

以確定的概率取這些值,則稱

為離散型隨機(jī)變量。通常用分布列表示離散型隨機(jī)變量:

的概率分布也可用一系列等式表示:P(

=xi)=pi(i=1,2,……)稱為的概率函數(shù)。顯然滿足概率的定義:離散型隨機(jī)變量的分布就是指它的分布列或概率函數(shù)。18(一)離散型隨機(jī)變量的分布定義:如果隨機(jī)變量只取有限個或可離散型隨機(jī)變量舉例1例1一批產(chǎn)品的廢品率為5%,從中任取一個進(jìn)行檢驗(yàn),以隨機(jī)變量來描述這一試驗(yàn)并寫出的分布。以X=0表示“產(chǎn)品為合格產(chǎn)品”,X=1表示“產(chǎn)品為廢品”,那么分布列如下:其概率函數(shù)p(X=0)=0.95,p(X=1)=0.05,或p(X=i)=(0.05)i(0.95)1-i(i=0,1)19離散型隨機(jī)變量舉例1例1一批產(chǎn)品的廢品率為5%,從中任取一離散型隨機(jī)變量舉例2用隨機(jī)變量X描述擲一顆骰子的試驗(yàn)。分布的概率函數(shù)為:P(X=i)=1/6(i=1,2,3,4,5,6)20離散型隨機(jī)變量舉例2用隨機(jī)變量X描述擲一顆骰子的試驗(yàn)。20(二)隨機(jī)變量的分布函數(shù)定義:若X是一個隨機(jī)變量(可以是離散的,也可以是非離散的),對任何實(shí)數(shù)x,令F(x)=P(X<=x),稱F(x)為隨機(jī)變量X的分布函數(shù)。F(x),即事件“X<=x”的概率,是一個實(shí)函數(shù)。對任意實(shí)數(shù)x1<x2,有P(x1<X<x2)=P(X<=x2)-P(X<=x1)=F(x2)-F(x1)x2x2F(x)F(x)Xx1x121(二)隨機(jī)變量的分布函數(shù)定義:若X是一個隨機(jī)變量(可以是離散分布函數(shù)F(x)的性質(zhì)22分布函數(shù)F(x)的性質(zhì)22分布函數(shù)舉例例3求例1中的分布函數(shù)例4求例2中的分布函數(shù)01F(x)x23分布函數(shù)舉例例3求例1中的分布函數(shù)01F(x)x23(三)連續(xù)型隨機(jī)變量的分布定義:對于任何實(shí)數(shù)x,如果隨機(jī)變量X的分布函數(shù)F(x)可以寫成概率分布密度函數(shù)的性質(zhì):24(三)連續(xù)型隨機(jī)變量的分布定義:對于任何實(shí)數(shù)x,如果隨機(jī)變量連續(xù)型隨機(jī)變量分布函數(shù)舉例axbaxb

F(x)(x)25連續(xù)型隨機(jī)變量分布函數(shù)舉例axba二、二元隨機(jī)變量n元隨機(jī)變量的定義:每次試驗(yàn)同時處理n個隨機(jī)變量(X1,X2,……,Xn),它們的取值隨試驗(yàn)的進(jìn)行而變化。如果對任何一組實(shí)數(shù)(x1,x2,……,xn),事件“X1x1,X2x2,……,Xnxn”有著確定的概率,則稱n個隨機(jī)變量(X1,X2,……,Xn)總體為一個n元隨機(jī)變量。n元隨機(jī)變量分布函數(shù)的定義:n元函數(shù)F(x1,x2,……,xn)=P(X1x1,X2x2,……,Xnxn)(x1,x2,……,xn)屬Rn,為n元隨機(jī)變量分布函數(shù)。離散二元隨機(jī)變量的定義:如果二元隨機(jī)變量(X,Y)所有可能取值為有限或可列多個,并且以確定的概率取各個不同數(shù)值,則稱(X,Y)為二元隨機(jī)變量。26二、二元隨機(jī)變量n元隨機(jī)變量的定義:每次試驗(yàn)同時處理n個隨機(jī)(X,Y)的聯(lián)合分布表和聯(lián)合分布函數(shù)(X,Y)為離散型的二元隨機(jī)變量,通常用聯(lián)合分布函數(shù)與聯(lián)合分布表表示。27(X,Y)的聯(lián)合分布表和聯(lián)合分布函數(shù)(X,Y)為離散型的二元離散二元分布函數(shù)的示例例6同一品種的5個產(chǎn)品中,有2個正品,3個次品,每次從中抽取一個進(jìn)行質(zhì)量檢查,不放回的抽取,連續(xù)兩次。令“Xi=0”表示第i次抽取到正品,而“Xi=1”表示第i次抽取到次品,寫出(X1,X2)的分布。解p(X1=0,X2=0)=p(X1=0)P(X2=0)=(2/5)(1/4)=1/10p(X1=0,X2=1)=p(X1=0)P(X2=1)=(2/5)(3/4)=3/10p(X1=1,X2=0)=p(X1=1)P(X2=0)=(3/5)(2/4)=3/10p(X1=1,X2=1)=p(X1=1)P(X2=1)=(3/5)(2/4)=3/1028離散二元分布函數(shù)的示例例6同一品種的5個產(chǎn)品中,有2個連續(xù)二元隨機(jī)變量的定義29連續(xù)二元隨機(jī)變量的定義29三、獨(dú)立性(一)事件的獨(dú)立性(二)隨機(jī)變量的獨(dú)立性30三、獨(dú)立性(一)事件的獨(dú)立性30(一)事件的獨(dú)立性

定義1.12事件的獨(dú)立性的定義如果事件A發(fā)生的可能性不受事件B發(fā)生與否的的影響,即P(A│B)=P(A),則稱事件A對于事件B獨(dú)立。顯然,若事件A對于事件B獨(dú)立,事件B對于事件A也一定獨(dú)立,我們稱事件A與事件B相互獨(dú)立。A與B獨(dú)立的充分必要條件是:P(AB)=P(A)P(B)31(一)事件的獨(dú)立性

定義1.12事件的獨(dú)立性的定義31(二)隨機(jī)變量的獨(dú)立性定義1.13邊際分布的定義離散型二元隨機(jī)變量(X,Y)中,分量X(或Y)的概率分布稱為(X,Y)的關(guān)于X(或Y)的邊際分布,邊際分布又稱邊緣分布。定義1.14隨機(jī)變量相互獨(dú)立的定義對于任何實(shí)數(shù)x,y,如果二元隨機(jī)變量(X,Y)的聯(lián)合分布函數(shù)F(x,y)等于X和Y的邊際分布的乘積,即F(x,y)=FX(x).FY(y)則稱X與Y相互獨(dú)立。。32(二)隨機(jī)變量的獨(dú)立性定義1.13邊際分布的定義32四、隨機(jī)變量函數(shù)的概念和分布定義1.15隨機(jī)變量函數(shù)的定義設(shè)f(x)是定義在隨機(jī)變量X的一切可能取值集合上的函數(shù)。如果對于X的每一個可能值x,都有另一個隨機(jī)變量Y的取值y=f(x)與之相對應(yīng),則稱Y為X的函數(shù),記作Y=f(X)。我們常常遇到一些隨機(jī)變量,它們的分布往往難于直接得到(例如滾珠體積的測量值等),但與它們有關(guān)系的另一個隨機(jī)變量的分布卻是容易知道的(如滾珠直徑的測量值)。因此,就要研究兩個隨機(jī)變量之間的關(guān)系,然后通過它們之間的關(guān)系,由已知隨機(jī)變量的分布求出與之有關(guān)的其它隨機(jī)變量的分布。其間的關(guān)系通常用函數(shù)關(guān)系表示。33四、隨機(jī)變量函數(shù)的概念和分布定義1.15隨機(jī)變量函數(shù)的定第二節(jié)對總體的描述——隨機(jī)變量的數(shù)字特征一、數(shù)學(xué)期望二、方差三、數(shù)學(xué)期望與方差的圖示34第二節(jié)對總體的描述——隨機(jī)變量的數(shù)字特征一、數(shù)學(xué)期望34一、數(shù)學(xué)期望

研究數(shù)字特征的必要性兩個最重要的數(shù)字特征(1)數(shù)學(xué)期望(2)方差35一、數(shù)學(xué)期望

研究數(shù)字特征的必要性35研究數(shù)字特征的必要性總體就是一個隨機(jī)變量。對總體的描述就是對隨機(jī)變量的描述。隨機(jī)變量的分布就是對隨機(jī)變量最完整的描述。但是,(1)求出總體的分布往往不是一件容易的事情;(2)而且,在很多情況下,我們并不需要全面考察隨機(jī)變量的變化情況,只需要了解總體的一些綜合指標(biāo)。一般說來,常常需要了解總體的一般水平和它的離散程度;(3)如果了解總體的一般水平和離散程度,就已經(jīng)對總體有了粗略的了解了;(4)在很多情況下,了解這兩個數(shù)字特征還是深入求出總體分布的基礎(chǔ)和關(guān)鍵。36研究數(shù)字特征的必要性總體就是一個隨機(jī)變量。對總體的描述就是對數(shù)學(xué)期望的定義定義2.1離散型隨機(jī)變量數(shù)學(xué)期望的定義假定有一個離散型隨機(jī)變量X有n個不同的可能取值x1,x2,……,xn,而p1,p2,……,pn是X取這些值相應(yīng)的概率,則這個隨機(jī)變量X的數(shù)學(xué)期望定義如下:數(shù)學(xué)期望描述的是隨機(jī)變量(總體)的一般水平。定義2.2連續(xù)型隨機(jī)變量數(shù)學(xué)期望的定義37數(shù)學(xué)期望的定義定義2.1離散型隨機(jī)變量數(shù)學(xué)期望的定義37女兒期待父親釣多少魚回家?數(shù)學(xué)期望是最容易發(fā)生的,因而是可以期待的。它反映數(shù)據(jù)集中的趨勢。38女兒期待父親釣多少魚回家?數(shù)學(xué)期望是最容易發(fā)生的,因而是可以數(shù)學(xué)期望的性質(zhì)(1)如果a、b為常數(shù),則E(aX+b)=aE(X)+b(2)如果X、Y為兩個隨機(jī)變量,則E(X+Y)=E(X)+E(Y)(3)如果g(x)和f(x)分別為X的兩個函數(shù),則E[g(X)+f(X)]=E[g(X)]+E[f(X)](4)如果X、Y是兩個獨(dú)立的隨機(jī)變量,則E(X.Y)=E(X).E(Y)39數(shù)學(xué)期望的性質(zhì)(1)如果a、b為常數(shù),則39求離散型隨機(jī)變量數(shù)學(xué)期望舉例例1甲、乙兩射手在一次射擊中的得分(分別用X、Y表示)的分布率如下:試比較兩射手的射擊技術(shù)水平,并計(jì)算如果二人各發(fā)一彈,他們得分和的估計(jì)值。解EX=10.4+20.1+30.5=2.1EY=10.1+20.6+30.3=2.2E(X+Y)=2.1+2.2=4.3EX<EY乙射手射擊水平比較高二人各發(fā)一彈,得分總和最可能在4.3分左右(即4分或5分)40求離散型隨機(jī)變量數(shù)學(xué)期望舉例例1甲、乙兩射手在一次射擊中的二、方差

定義2.3離均差的定義如果隨機(jī)變量X的數(shù)學(xué)期望E(X)存在,稱[X-E(X)]為隨機(jī)變量X的離均差。顯然,隨機(jī)變量離均差的數(shù)學(xué)期望是0,即E[X-E(X)]=0定義2.4連續(xù)型隨機(jī)變量的方差定義2.5隨機(jī)變量離均差平方的數(shù)學(xué)期望,叫隨機(jī)變量的方差,記作Var(x),或D(x)。方差的算術(shù)平方根叫標(biāo)準(zhǔn)差。41二、方差

定義2.3離均差的定義41方差的意義(1)離均差和方差都是用來描述離散程度的,即描述X對于它的期望的偏離程度,這種偏差越大,表明變量的取值越分散。(2)一般情況下,我們采用方差來描述離散程度。因?yàn)殡x均差的和為0,無法體現(xiàn)隨機(jī)變量的總離散程度。事實(shí)上正偏差大亦或負(fù)偏差大,同樣是離散程度大。方差中由于有平方,從而消除了正負(fù)號的影響,并易于加總,也易于強(qiáng)調(diào)大的偏離程度的突出作用。42方差的意義(1)離均差和方差都是用來描述離散程度的,即描述X方差的性質(zhì)(1)Var(c)=0(2)Var(c+x)=Var(x)(3)Var(cx)=c2Var(x)(4)x,y為相互獨(dú)立的隨機(jī)變量,則Var(x+y)=Var(x)+Var(y)=Var(x-y)(5)Var(a+bx)=b2Var(x)(6)a,b為常數(shù),x,y為兩個相互獨(dú)立的隨機(jī)變量,則Var(ax+by)=a2Var(x)+b2Var(y)(7)Var(x)=E(x2)-(E(x))243方差的性質(zhì)(1)Var(c)=043例2計(jì)算本節(jié)例1中甲射手的方差例1甲、乙兩射手在一次射擊中的得分(分別用X、Y表示)的分布率如下:

E(X)=2.1Var(X)=(-1.1)

2

0.4+(-0.1)2

0.1+0.92

0.5=0.8944例2計(jì)算本節(jié)例1中甲射手的方差例1甲、乙兩射手在一次射三、數(shù)學(xué)期望與方差的圖示數(shù)學(xué)期望描述隨機(jī)變量的集中程度,方差描述隨機(jī)變量的分散程度。1方差同、期望變大2期望同、方差變小5105545三、數(shù)學(xué)期望與方差的圖示數(shù)學(xué)期望描述隨機(jī)變量的集中程度,方差第三節(jié)對樣本的描述——樣本分布的數(shù)字特征一、樣本分布函數(shù)二、樣本平均數(shù)三、樣本方差46第三節(jié)對樣本的描述——樣本分布的數(shù)字特征一、樣本分布函數(shù)一、樣本分布函數(shù)47一、樣本分布函數(shù)47樣本分布函數(shù)舉例48樣本分布函數(shù)舉例48二、樣本平均數(shù)總體的數(shù)字特征——是一個固定不變的數(shù),稱為參數(shù);樣本的數(shù)字特征——是隨抽樣而變化的數(shù),是一個隨機(jī)變量,稱為統(tǒng)計(jì)量。定義3.1樣本平均數(shù)的定義樣本平均數(shù)用來描述樣本的平均水平(一般Common)水平。49二、樣本平均數(shù)總體的數(shù)字特征——是一個固定不變的數(shù),稱為參數(shù)三、樣本方差和標(biāo)準(zhǔn)差定義3.2樣本方差和標(biāo)準(zhǔn)差的定義50三、樣本方差和標(biāo)準(zhǔn)差定義3.2樣本方差和標(biāo)準(zhǔn)差的定義50第四節(jié)隨機(jī)變量的分布——總體和樣本的連接點(diǎn)一、幾種重要的分布二、各種分布之間的聯(lián)系三、分布是總體和樣本之間的連接點(diǎn)51第四節(jié)隨機(jī)變量的分布——總體和樣本的連接點(diǎn)一、幾種重要的一、幾種重要的分布如果一個隨機(jī)變量的分布已經(jīng)確定,那么這個隨機(jī)變量的一切性質(zhì)對于我們便都是已知的。因?yàn)殡S機(jī)變量的分布是對隨機(jī)變量最完整的描述。例如X是廣西十萬大山中樹木的高度,它的分布函數(shù)為F(x)=P(X<=x)。此時,你對任意給定的高度x,都確知不超過這個高度的樹木在整個十萬大山中所占的比例,你還會說整個十萬大山樹木高度的情況不清楚嗎?再如,已知X服從數(shù)學(xué)期望和方差已知的正態(tài)分布,那么你便了解這個X自身的一切性質(zhì)??梢酝ㄟ^查正態(tài)分布表確定研究中所需的一切數(shù)據(jù)。分布的數(shù)學(xué)形式和圖形屬“技術(shù)問題”,精力應(yīng)集中于X究竟屬于何種分布上。52一、幾種重要的分布如果一個隨機(jī)變量的分布已經(jīng)確定,那么這個隨1.

分布(1)

分布的定義(2)定理4.1

分布的數(shù)學(xué)期望和方差531.分布(1)分布的定義532.指數(shù)分布(1)指數(shù)分布的定義(2)定理4.2指數(shù)分布的數(shù)學(xué)期望和方差542.指數(shù)分布(1)指數(shù)分布的定義543.

2分布(1)定義4.3

2分布的定義(2)定理4.3分布的和仍然服從分布553.2分布(1)定義4.32分布的定義55定理4.3推論:

2分布的和仍然服從

2分布若X1,X2,……,Xn相互獨(dú)立,且Xi服從具有ni(i=1,2,……,n)個自由度的

2分布,則它們的和X1+X2+……+Xn服從具有

ni

個自由度的

2分布。56定理4.3推論:2分布的和仍然服從2分布

2分布的圖象N=7N=11概率xN為自由度572分布的圖象N=7N=11概率xN為自由度574.正態(tài)分布定義4.4正態(tài)分布的定義定理4.4正態(tài)分布的數(shù)學(xué)期望和方差定義4.5標(biāo)準(zhǔn)正態(tài)分布584.正態(tài)分布定義4.4正態(tài)分布的定義58正態(tài)分布的標(biāo)準(zhǔn)化定理4.5正態(tài)分布標(biāo)準(zhǔn)化59正態(tài)分布的標(biāo)準(zhǔn)化定理4.5正態(tài)分布標(biāo)準(zhǔn)化595.t分布定義4.6t分布的定義605.t分布定義4.6t分布的定義60t分布與t分布函數(shù)

樣本統(tǒng)計(jì)量的抽樣分布,并不完全服從正態(tài)分布,而是服從與正態(tài)分布相似的t分布。當(dāng)樣本容量不大于30,而且總體標(biāo)準(zhǔn)差未知時,可以使用t分布。t分布為對稱分布。對于不同的樣本容量都有一個不同的t分布,隨著樣本容量增加,t分布的形狀由平坦逐漸變得接近正態(tài)分布。當(dāng)樣本容量大于30時,t分布就非常接近于正態(tài)分布。61t分布與t分布函數(shù)樣本統(tǒng)計(jì)量的抽樣分布,并不完全服從正態(tài)分t分布和正態(tài)分布概率密度x標(biāo)準(zhǔn)正態(tài)分布t-分布062t分布和正態(tài)分布概率密度x標(biāo)準(zhǔn)正態(tài)分布t-分布0626.F分布定義4.7F分布的定義636.F分布定義4.7F分布的定義63F分布的圖象x概率密度64F分布的圖象x概率密度64二、各種分布之間的聯(lián)系1.一般正態(tài)分布與標(biāo)準(zhǔn)正態(tài)分布的關(guān)系定理4.6如果X~N(,2),則(X-)/~N(0,1)2.標(biāo)準(zhǔn)正態(tài)分布與X2分布之間的關(guān)系定理4.7如果X~N(0,1),則X2~X2(1),即服從具有1個自由度的分布。3.標(biāo)準(zhǔn)正態(tài)分布與t分布之間的關(guān)系其密度函數(shù)見定義4.6。65二、各種分布之間的聯(lián)系1.一般正態(tài)分布與標(biāo)準(zhǔn)正態(tài)分布的關(guān)系二、各種分布之間的聯(lián)系4.標(biāo)準(zhǔn)正態(tài)分布(分布)與F分布之間的關(guān)系5.關(guān)于正態(tài)分布的和66二、各種分布之間的聯(lián)系4.標(biāo)準(zhǔn)正態(tài)分布(分布)與F分布之間二、各種分布之間的聯(lián)系6.關(guān)于X2分布67二、各種分布之間的聯(lián)系6.關(guān)于X2分布676868總體與樣本間的聯(lián)系在于具有相同的分布總體就是一個隨機(jī)變量,所謂樣本就是n個相互獨(dú)立的與總體具有相同分布的隨機(jī)變量x1,……,xn,即n元隨機(jī)變量。以上的定理就是將總體與樣本間的這種聯(lián)系具體化,從而為達(dá)到通過樣本的特征估計(jì)和代替總體的特征鋪平道路。例如,已知一個研究對象

的數(shù)量特征服從N(,2),那么依據(jù)定理4.6,首先將其標(biāo)準(zhǔn)化,然后查標(biāo)準(zhǔn)正態(tài)分布表,就可以獲得所需的信息。如果,對研究對象了解的信息并不完備,只知其屬于正態(tài)分布均值為,但未知方差,則可利用定理4.15通過s2代替

2,用t分布來估計(jì)未知總體的數(shù)字特征。在區(qū)間估計(jì)和假設(shè)檢驗(yàn)中將會廣泛地利用這些定理,通過樣本估計(jì)總體和檢驗(yàn)對總體的假設(shè)。69總體與樣本間的聯(lián)系在于具有相同的分布總體就是一個隨機(jī)變量,所第五節(jié)通過樣本,估計(jì)總體(一)——估計(jì)量的特征對總體的數(shù)量特征可以提出若干估計(jì)量。所謂估計(jì)量的特性指的是衡量一個統(tǒng)計(jì)量用以估計(jì)總體參數(shù)的好壞標(biāo)準(zhǔn)。我們構(gòu)造一個統(tǒng)計(jì)量時,它們就應(yīng)當(dāng)具有這些優(yōu)良性,否則就不采用他來估計(jì)總體參數(shù)。估計(jì)量的優(yōu)良性可從四個方面進(jìn)行衡量:一、無偏性二、有效性三、均方誤最小性四、一致性70第五節(jié)通過樣本,估計(jì)總體(一)——估計(jì)量的特征對總體的數(shù)一、無偏性無偏性的直觀意義:根據(jù)樣本推得的估計(jì)值和真值可能不同,然而如果有一系列抽樣依據(jù)同一估計(jì)方法就可以得到一系列估計(jì)值,很自然會要求這些估計(jì)的期望值與未知參數(shù)的真值相等。這就是無偏性的概念,無偏性的直觀意義是:樣本估計(jì)量的數(shù)值在真值周圍擺動,即無系統(tǒng)誤差。71一、無偏性無偏性的直觀意義:71定義5.1無偏性的定義的真值的真值有偏無偏72定義5.1無偏性的定義的真值的真值有偏無偏72無偏性是對估計(jì)量最重要的要求之一,它只能保證估計(jì)量的期望等于真值。對于總體某個待定參數(shù),其無偏估計(jì)量不只一個。73無偏性是對估計(jì)量最重要的要求之一,它只能保證估計(jì)量的期望等于二、有效性總體某個參數(shù)

的無偏估計(jì)量往往不只一個,而且無偏性僅僅表明

^的所有可能的取值按概率平均等于,它的可能取值可能大部分與相差很大。為保證^的取值能集中于附近,必須要求^的方差越小越好。所以,提出有效性標(biāo)準(zhǔn)。74二、有效性總體某個參數(shù)的無偏估計(jì)量往往不只一個,而且無偏性有效性的定義的真值的真值^的概率^的概率75有效性的定義的真值的真值^的概率^的概率75無偏有效估計(jì)量的意義(1)一個無偏有效估計(jì)量的取值在可能范圍內(nèi)最密集于附近。換言之,它以最大的概率保證估計(jì)量的取值在真值附近擺動。(2)可以證明,樣本均值是總體數(shù)學(xué)期望的有效估計(jì)量。76無偏有效估計(jì)量的意義(1)一個無偏有效估計(jì)量的取值在可能范圍三、均方誤(MeanSquareError)

最小性在很多情況下,我們被迫在偏差的大小與方差的大?。礋o偏與有效性)之間作出抉擇。有時,一個方差極小的有偏估計(jì)比一個方差極大的無偏估計(jì)可能更為我們所追求。此時,估計(jì)量的均方誤為我們在兩者之間的權(quán)衡提供了一個有效的尺度。77三、均方誤(MeanSquareError)

均方誤和均方誤最小性的定義78均方誤和均方誤最小性的定義78均方誤最小的意義(1)MSE(均方誤差)分解為精確度與準(zhǔn)確度之和。MSE最小就是使估計(jì)量方差與估計(jì)量偏誤之和最小,給出了進(jìn)行權(quán)衡的方法(見下圖)(2)如果估計(jì)量為無偏估計(jì)量Bias=0,那么MSE(

^)=Var(

^)即誤差由精確度確定。此時,一個具有最小MSE的估計(jì)量一定具有無偏性和有效性,即MinMSE(

^)=MinVar(

^)。79均方誤最小的意義(1)MSE(均方誤差)分解為精確度與準(zhǔn)確度運(yùn)用MSE權(quán)衡偏差與方差

有偏,方差極小無偏,方差極大^^的概率80運(yùn)用MSE權(quán)衡偏差與方差有偏,方差極小無偏,方差極大^四、一致性(1)“依概率收斂”的定義(2)一致性(3)一致性的意義81四、一致性(1)“依概率收斂”的定義81(1)“依概率收斂”的定義82(1)“依概率收斂”的定義82(2)一致性一致性既是從概率又是從極限性質(zhì)來定義的,因此只有樣本容量較大時才起作用。一致性作為評價(jià)估計(jì)量好壞的一個標(biāo)準(zhǔn),計(jì)量經(jīng)濟(jì)學(xué)家在無偏性和一致性之間更偏重選擇一致性。雖然一個一致估計(jì)量可能在平均意義上與真值不同,但是當(dāng)樣本容量加大時,它會變得與真值十分接近,即有偏的一致估計(jì)量具有大樣本下的無偏性。同時,根據(jù)大數(shù)定律,當(dāng)n增大時,方差會變得很小,所以一致估計(jì)量具有大樣本下的“無偏性”和“有效性”。83(2)一致性83(3)一致性的意義顯然,一個一致估計(jì)量比一個方差很大的無偏估計(jì)量優(yōu)越得多。由于MSE(

^)=Var(

^)+Bias(

^)2,所以估計(jì)量的一致性,實(shí)際上等價(jià)于當(dāng)n=>時,MSE(

^)=>0,亦即Var(

^)=>0和Bias(

^)2=>0,也就是隨著樣本加大,

^的方差變??;

^的偏差接近于0,這就是一致性描述的情況。事實(shí)上一致性和MSE(

^)=>0(當(dāng)n=>)這兩條標(biāo)準(zhǔn)在計(jì)量經(jīng)濟(jì)學(xué)中往往是通用的。84(3)一致性的意義顯然,一個一致估計(jì)量比一個方差很大的無偏估第六節(jié)通過樣本,估計(jì)總體(二)——估計(jì)方法一、點(diǎn)估計(jì)(1)矩法(2)最大似然法(3)最小二乘法二、區(qū)間估計(jì)(一)對總體期望值的估計(jì)(二)對總體方差的估計(jì)(三)關(guān)于區(qū)間估計(jì)的幾點(diǎn)說明85第六節(jié)通過樣本,估計(jì)總體(二)——估計(jì)方法一、點(diǎn)估計(jì)85一、點(diǎn)估計(jì)所謂點(diǎn)估計(jì)就是給出被估計(jì)參數(shù)的一個特定的估計(jì)值。常用的點(diǎn)估計(jì)方法有三種:矩法、最大似然法、最小二乘法。這三種方法分別建立在不同的原則上。對同一樣本根據(jù)三種方法估計(jì)同一參數(shù),所獲得的估計(jì)結(jié)果可能互不相同。然而由于各種建立原則的合理性,所以三種方法在研究中都經(jīng)常使用。86一、點(diǎn)估計(jì)所謂點(diǎn)估計(jì)就是給出被估計(jì)參數(shù)的一個特定的估計(jì)值。8(1)矩法矩法是求估計(jì)量最古老的方法。具體作法是:一樣本矩作為相應(yīng)總體矩的估計(jì)量;以樣本矩的函數(shù)作為相應(yīng)的總體矩同樣函數(shù)的估計(jì)量。這種方法最常見的應(yīng)用是用樣本平均數(shù)估計(jì)總體數(shù)學(xué)期望。矩法比較直觀,求估計(jì)量時有時也比較直接,但它求出的估計(jì)量往往不夠理想。87(1)矩法矩法是求估計(jì)量最古老的方法。具體作法是:一樣本矩作矩法點(diǎn)估計(jì)的例題例1某燈泡廠某天生產(chǎn)了一大批燈泡,從中抽取了10個進(jìn)行壽命試驗(yàn),獲得數(shù)據(jù)如下(單位:小時),問該天生產(chǎn)的燈泡的平均壽命是多少?88矩法點(diǎn)估計(jì)的例題例1某燈泡廠某天生產(chǎn)了一大批燈泡,從中抽取了(2)最大似然法

(MaximumLikelihoodEstimation)1、一個重要的事實(shí)2、最大似然法的概念3、似然法函數(shù)4、最大似然法的定義5、最大似然法的示例89(2)最大似然法

(MaximumLikelihood不同的總體會產(chǎn)生不同的樣本,對于某一特定的樣本,在不了解產(chǎn)生它的母體究竟為何物的觀察者眼中,它來自一些母體的可能性要比來自另一些母體的可能性大,即一些母體更容易產(chǎn)生出我們所觀察到的樣本。舉例說,假定我們抽取到(x1,x2,……,x8)我們知道它來自正態(tài)總體,且總體的方差是了解的,但是總體的均值未知。如下圖所示。x1x2x3x4x5x6x7x8分布B分布A概率x假定樣本不是來自B就是來自A。如果樣本來自B,觀察到它的可能性非常小;真正的母體若是A,得到樣本的可能性很大。顯然我們寧愿承認(rèn)樣本來自A。是樣本“替”我們“選擇”了A。90不同的總體會產(chǎn)生不同的樣本,對于某一特定的樣本,在不了解產(chǎn)生2、最大似然法的概念上述事實(shí)誘導(dǎo)我們寧愿作出這樣的抉擇:將樣本最容易來自的總體當(dāng)作產(chǎn)生樣本的總體?,F(xiàn)在要根據(jù)從總體

中抽取得到的樣本(x1,……,xn)對總體中的未知數(shù)

進(jìn)行估計(jì)。最大似然法是選擇這樣的估計(jì)量

^作為的估計(jì)值,以便使觀察結(jié)果(x1,……,xn)出現(xiàn)的可能性(概率)最大。對于離散型變量,就是要選擇

^使p(x1)p(x2)…p(xn)最大。(連乘——表示一次獨(dú)立地抽取各個樣本觀察值)對于連續(xù)型變量,就是要選擇^使(x1)(x2)...(xn)最大。注意(xi)是隨機(jī)變量在xi附近取值的概率,相當(dāng)于離散型的p(xi)。912、最大似然法的概念上述事實(shí)誘導(dǎo)我們寧愿作出這樣的抉擇:將樣3、似然法函數(shù)923、似然法函數(shù)924、最大似然法的定義934、最大似然法的定義935、最大似然法的估計(jì)方法為了取得的最大似然估計(jì),必須使似然函數(shù)L達(dá)到最大值,并且把此時的^作為的估計(jì)量。由于對數(shù)函數(shù)是單增的,L達(dá)到最大亦即LnL達(dá)到最大。這樣使LnL達(dá)到最大來估計(jì)為計(jì)算帶來了許多方便。根據(jù)微分中的拉格朗日定理,對未知參數(shù)求條件極值,令LnL對的一階導(dǎo)數(shù)等于0,即dLnL/d=0==>得到似然方程,我們所求的^就是似然方程中的解。945、最大似然法的估計(jì)方法為了取得的最大似然估計(jì),必須使似然5、最大似然法示例之一955、最大似然法示例之一95(3)最小二乘法(LeastSquareEstimationMethod)最小二乘法是計(jì)量經(jīng)濟(jì)學(xué)中應(yīng)用最廣泛的一種估計(jì)方法。96(3)最小二乘法(LeastSquareEstimati二、區(qū)間估計(jì)(一)對總體期望值的估計(jì)1、已知方差,對數(shù)學(xué)期望E進(jìn)行區(qū)間估計(jì)(1)方差已知,估計(jì)總體數(shù)學(xué)期望(2)正態(tài)總體(3)一般總體大樣本下數(shù)學(xué)期望的區(qū)間估計(jì)2、方差未知,對數(shù)學(xué)期望E進(jìn)行區(qū)間估計(jì)(二)對總體方差的估計(jì)(三)關(guān)于區(qū)間估計(jì)的幾點(diǎn)說明97二、區(qū)間估計(jì)(一)對總體期望值的估計(jì)97區(qū)間估計(jì)的概念所謂區(qū)間估計(jì)就是以一定的可靠性給出被估計(jì)參數(shù)的一個可能的取值范圍。用點(diǎn)估計(jì)估計(jì)參數(shù),即使是無偏有效的估計(jì)量,也會由于樣本的隨機(jī)性,使得由樣本計(jì)算出的估計(jì)值并不恰恰是真值。而且即使等于真值,由于真值未知,我們也不能肯定這種相等。那么,究竟相差多少?于是問題等價(jià)為:在給定可靠程度下,指出被估計(jì)參數(shù)所在的可能值的范圍,就是參數(shù)的區(qū)間估計(jì)問題。具體作法是找出兩個統(tǒng)計(jì)量

1(x1,…,xn)與2(x1,…,xn),使P(1<<2)=1-(1,2)稱為置信區(qū)間,1-稱為置信系數(shù)(置信水平),稱為顯著性水平,一般等于5%或1%。98區(qū)間估計(jì)的概念所謂區(qū)間估計(jì)就是以一定的可靠性給出被估計(jì)參數(shù)的對區(qū)間估計(jì)的形象比喻我們經(jīng)常說某甲的成績“大概80分左右”,可以看成一個區(qū)間估計(jì)問題。(某甲的成績?yōu)楸还烙?jì)的參數(shù))

P(1<<2)=大概的準(zhǔn)確程度(1-)

如:P(75<<85)=95%=1-5%“大概80分左右”冒險(xiǎn)率(假設(shè)檢驗(yàn)中叫顯著水平)下限上限99對區(qū)間估計(jì)的形象比喻我們經(jīng)常說某甲的成績“大概80分左右”,(一)對總體期望值的估計(jì)1、已知方差,對總體數(shù)學(xué)期望E=進(jìn)行區(qū)間估計(jì)100(一)對總體期望值的估計(jì)1、已知方差,對總體數(shù)學(xué)期望E=(1)方差已知分布未知,估計(jì)總體數(shù)學(xué)期望對這種情況的處理,需要用到切比雪夫不等式。下限上限101(1)方差已知分布未知,估計(jì)總體數(shù)學(xué)期望對這種情況的處理,需電子管壽命的置信區(qū)間例6在本節(jié)例1中,如果已知當(dāng)天生產(chǎn)的電子管壽命的方差為8,試找出電子管壽命的置信區(qū)間(=5%)。102電子管壽命的置信區(qū)間例6在本節(jié)例1中,如果已知當(dāng)天生產(chǎn)(2)正態(tài)總體103(2)正態(tài)總體103/2/21-

104/2/21-104假設(shè)總體服從正態(tài)分布N(

,8)

求的置信區(qū)間例7本節(jié)例1中再假設(shè)總體服從正態(tài)分布,求電子管壽命的置信區(qū)間(=5%)。105假設(shè)總體服從正態(tài)分布N(,8)

(3)一般總體大樣本下數(shù)學(xué)期望E

的區(qū)間估計(jì)中心極限定理指出,在很寬的條件下,無能是否為正態(tài)總體(,2),當(dāng)樣本容量相當(dāng)大時,也有樣本平均數(shù)漸近地服從正態(tài)分布。一般說來,在n>=30時,就可以把樣本平均數(shù)近似地看作服從正態(tài)分布N(,2/n)。所以,對于大樣本仍可以按正態(tài)總體進(jìn)行均值的區(qū)間估計(jì)。106(3)一般總體大樣本下數(shù)學(xué)期望E的區(qū)間估計(jì)中心極限定理指出2、方差未知,對數(shù)學(xué)期望E進(jìn)行區(qū)間估計(jì)(1)大樣本下根據(jù)中心極限定理,V可以用s2代替,所以仍按已知方差正態(tài)分布的方法進(jìn)行的置信區(qū)間估計(jì)。(2)小樣本下1072、方差未知,對數(shù)學(xué)期望E進(jìn)行區(qū)間估計(jì)(1)大樣本下107例8新生兒體重的置信區(qū)間假設(shè)新生兒(男)的體重服從正態(tài)分布。隨機(jī)抽取12名新生兒,測得體重如下表,試以95%的置信度估計(jì)新生兒(男)的平均體重。108例8新生兒體重的置信區(qū)間假設(shè)新生兒(男)的體重服從正態(tài)分(二)對總體方差的估計(jì)(只介紹小樣本下的)109(二)對總體方差的估計(jì)(只介紹小樣本下的)109總體方差區(qū)間估計(jì)的例題例9在本節(jié)例8中,請對新生兒體重的方差進(jìn)行區(qū)間估計(jì)(=0.05)。=0.05n-1=11,查X2分布臨界值表,得a=3.82b=21.9,a、b滿足:p(Z>=a)=0.975p(Z>=b)=0.025有上例知,s2=140900,所以(n-1)s2=1549000,則2的置信區(qū)間為:1549000/21.9<2<1549000/3.82即70700<2<405000110總體方差區(qū)間估計(jì)的例題例9在本節(jié)例8中,請對新生兒體重的(三)關(guān)于區(qū)間估計(jì)的幾點(diǎn)說明(1)區(qū)間估計(jì)在方法上是定理4.13~4.17的應(yīng)用。(2)在進(jìn)行區(qū)間估計(jì)時,應(yīng)針對不同的情況,采用不同的方法。例如分清分布的形式是已知或是未知;是大樣本或是小樣本;小樣本(估計(jì)總體數(shù)學(xué)期望時)又分清是已知方差或是未知方差等。充分利用分布信息可以得到較精確的估計(jì)。(3)一般地,越大置信度越低,置信區(qū)間越小;反之,則反。111(三)關(guān)于區(qū)間估計(jì)的幾點(diǎn)說明(1)區(qū)間估計(jì)在方法上是定理4.第七節(jié)通過樣本,估計(jì)總體(三)——假設(shè)檢驗(yàn)一、假設(shè)檢驗(yàn)的概念二、兩類錯誤三、假設(shè)檢驗(yàn)與區(qū)間估計(jì)間的關(guān)系:置信區(qū)間法四、假設(shè)檢驗(yàn)的應(yīng)用(一)正態(tài)總體的假設(shè)檢驗(yàn)(二)兩個正態(tài)總體的假設(shè)檢驗(yàn)(三)總體分布的假設(shè)檢驗(yàn)五、“小概率原理”在假設(shè)檢驗(yàn)中的應(yīng)用112第七節(jié)通過樣本,估計(jì)總體(三)——假設(shè)檢驗(yàn)一、假設(shè)檢驗(yàn)的一、假設(shè)檢驗(yàn)的概念定義:稱對任何一個隨機(jī)變量未知分布的假設(shè)為統(tǒng)計(jì)假設(shè),簡稱假設(shè)。一個僅涉及到隨機(jī)變量分布中未知參數(shù)的假設(shè)稱為參數(shù)假設(shè)。一個僅涉及到隨機(jī)變量分布的形式而不涉及到未知參數(shù)的假設(shè)稱為非參數(shù)假設(shè)。提出一個統(tǒng)計(jì)假設(shè)的關(guān)鍵是將一個實(shí)際的研究問題用數(shù)學(xué)語言轉(zhuǎn)換為統(tǒng)計(jì)假設(shè)。113一、假設(shè)檢驗(yàn)的概念定義:稱對任何一個隨機(jī)變量未知分布的假設(shè)為例1.檢驗(yàn)一個硬幣是否均勻拋擲一個硬幣100次,“正面”出現(xiàn)60次,問此硬幣是否均勻?分析:若用X描述拋擲硬幣的試驗(yàn),“X=1”和“X=0”分別表示“出現(xiàn)正面”和“出現(xiàn)反面”。上述問題就是檢驗(yàn)X是否可以被認(rèn)為服從p=0.5的0-1分布。問題是分布形式已知,檢驗(yàn)參數(shù)p=0.5的假設(shè)檢驗(yàn)。記作,H0:p=0.5HA:p≠0.5114例1.檢驗(yàn)一個硬幣是否均勻拋擲一個硬幣100次,“正面”出現(xiàn)零假設(shè)與備擇假設(shè)在統(tǒng)計(jì)假設(shè)——H0:p=0.5HA:p≠0.5中,H0稱為零假設(shè)或原假設(shè),是我們進(jìn)行統(tǒng)計(jì)假設(shè)檢驗(yàn)欲確定其是否成立的假設(shè)——體現(xiàn)我們進(jìn)行假設(shè)檢驗(yàn)的目的,而且往往是希望否定這個假設(shè),否定其成立所冒的風(fēng)險(xiǎn)為。HA稱為備擇假設(shè),統(tǒng)計(jì)假設(shè)檢驗(yàn)是二擇一的判斷,當(dāng)不成立時,不得不接受它。115零假設(shè)與備擇假設(shè)在統(tǒng)計(jì)假設(shè)——H0:p=0.5HA:例2.檢驗(yàn)1999年新生女嬰體重是否等于某個既定值從1999年出生的女嬰中隨機(jī)地抽取20名,測得平均體重=3160克,標(biāo)準(zhǔn)差=300克,根據(jù)已有的統(tǒng)計(jì)資料新生女嬰的體重=3140克,問現(xiàn)在與過去新生女嬰的體重是否有變化?分析:把1999年出生的女嬰視為一個總體,用X描述,問題就是判斷:H0:EX=3140HA:EX≠3140因?yàn)橥ǔ?梢约俣ń?jīng)過量測得到的資料是服從正態(tài)分布的,無須檢驗(yàn)總體的分布形式,顯然這是一個關(guān)于參數(shù)的假設(shè)檢驗(yàn)問題。116例2.檢驗(yàn)1999年新生女嬰體重是否等于某個既定值從1999二、兩類錯誤(1)兩類錯誤的概念(2)顯著性水平117二、兩類錯誤(1)兩類錯誤的概念117(1)兩類錯誤的概念由于我們作出判斷的依據(jù)是一組樣本,結(jié)論卻是對于總體的,即由局部→全面,由特殊→一般,由個別→整體,因而假設(shè)檢驗(yàn)的結(jié)果不可能絕對正確,它有可能是錯誤的。而且出現(xiàn)錯誤可能性的大小,也是以統(tǒng)計(jì)規(guī)律(小概率原理)為依據(jù)的。所可能犯的錯誤有兩類:第一類—棄真,原假設(shè)符合實(shí)際情況,而檢驗(yàn)結(jié)果把它否定了。設(shè)犯這類錯誤的概率為

,那么

=p(否定H0/H0實(shí)際上為真)。稱為顯著性水平第二類—納偽,原假設(shè)不符合實(shí)際情況,而檢驗(yàn)結(jié)果卻把它肯定下來。設(shè)犯這類錯誤的概率為

,那么

=p(接受H0/H0實(shí)際上為不正確)。1-

稱為檢驗(yàn)?zāi)芰Α?18(1)兩類錯誤的概念由于我們作出判斷的依據(jù)是一組樣本,結(jié)論卻(2)顯著性水平顯著水平指的是犯“第一類錯誤”的可能性,即“冒險(xiǎn)率”<==>冒H0是真而我們拋棄了H0所犯錯誤的概率<==>反之,而不接受H0,乃是因?yàn)榭陀^事實(shí)與H0假設(shè)存在差異,且這種差異的程度已經(jīng)太大了,在給定的小概率

下,零假設(shè)幾乎是不可能發(fā)生的,從而認(rèn)為零假設(shè)H0是錯的,必須拋棄它。所以,我們把犯棄真錯誤的概率也稱為差異達(dá)到和超過了顯著(太大)的水平,以至于達(dá)到顯著水平后,我們不能接受H0,而不得不拋棄H0。同時,即使拋棄零假設(shè)H0,這時也只需冒

的風(fēng)險(xiǎn),<==>拋棄H0的可靠性則為1-

。如果假設(shè)事關(guān)重大,譬如人命關(guān)載人的宇宙飛船升空或藥品試驗(yàn),則必須提高差異顯著水平即減小

,使我們不能輕易地拒絕H0。否則,則可以降低顯著水平。119(2)顯著性水平顯著水平指的是犯“第一類錯誤”的可能性,即“三、假設(shè)檢驗(yàn)與區(qū)間估計(jì)間的關(guān)系:置信區(qū)間法(一)問題的提出(二)假設(shè)檢驗(yàn)的置信區(qū)間法(三)假設(shè)檢驗(yàn)與區(qū)間估計(jì)的聯(lián)系與區(qū)別120三、假設(shè)檢驗(yàn)與區(qū)間估計(jì)間的關(guān)系:置信區(qū)間法(一)問題的提出1(一)問題的提出曾經(jīng)提到“某甲成績大概是80分左右”可以看成一個區(qū)間估計(jì)問題?!按蟾?0分左右”<==>p(1<<2)=大概的準(zhǔn)確程度<==>如:p(75<<85)=95%<==>(75,85)是某甲成績的估計(jì)區(qū)間,某甲成績落在此區(qū)間的概率在95%以上。類似地,對這個問題,也可舉出一個假設(shè)檢驗(yàn)的問題<==>在允許你犯5%以下的錯誤,即以95%的正確性來回答:“某甲的成績是80,對嗎?”<==>假設(shè)檢驗(yàn)同樣的問題又是一個假設(shè)檢驗(yàn)的問題。121(一)問題的提出曾經(jīng)提到“某甲成績大概是80分左右”可以看(二)假設(shè)檢驗(yàn)的置信區(qū)間法的定義對比區(qū)間估計(jì)和假設(shè)檢驗(yàn)兩種情況,我們發(fā)現(xiàn)區(qū)間估計(jì)實(shí)際上給出了一種進(jìn)行假設(shè)檢驗(yàn)的方法。比如,當(dāng)涉及“某甲成績?yōu)?0分”(=5%)后,,首先對問題進(jìn)行區(qū)間估計(jì),得到成績在75~85之間的概率為95%。若原假設(shè)H0落在(75,85)內(nèi),顯然應(yīng)當(dāng)接受H0,否則,則拒絕H0。這種利用區(qū)間估計(jì)法來進(jìn)行假設(shè)檢驗(yàn)的方法稱為區(qū)間估計(jì)法。122(二)假設(shè)檢驗(yàn)的置信區(qū)間法的定義對比區(qū)間估計(jì)和假設(shè)檢驗(yàn)兩種情通過求置信區(qū)間進(jìn)行假設(shè)檢驗(yàn)的例子例3根據(jù)長期經(jīng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論