數(shù)理統(tǒng)計(jì)基本概念_第1頁(yè)
數(shù)理統(tǒng)計(jì)基本概念_第2頁(yè)
數(shù)理統(tǒng)計(jì)基本概念_第3頁(yè)
數(shù)理統(tǒng)計(jì)基本概念_第4頁(yè)
數(shù)理統(tǒng)計(jì)基本概念_第5頁(yè)
已閱讀5頁(yè),還剩59頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

作出精確而可信的結(jié)論。數(shù)理統(tǒng)計(jì)可以分為兩大類:一類是如何科學(xué)地安排試驗(yàn),-------描述統(tǒng)計(jì)學(xué),如:試驗(yàn)設(shè)計(jì)、抽樣方法。另一類是研究如何分析所獲得的隨機(jī)數(shù)據(jù),對(duì)所研究的問(wèn)題進(jìn)行科學(xué)的、合理的估計(jì)和推斷,盡可能的為采取一定的決策提供依據(jù),-------推斷統(tǒng)計(jì)學(xué),如:參數(shù)估計(jì)、假設(shè)檢驗(yàn)等。以獲取有效的隨機(jī)數(shù)據(jù)。第二章數(shù)理統(tǒng)計(jì)的基本概念100個(gè)樣品進(jìn)行強(qiáng)度測(cè)試,于是面臨下列幾個(gè)問(wèn)題:例:某廠生產(chǎn)一型號(hào)的合金材料,用隨機(jī)的方法選取1、估計(jì)這批合金材料的強(qiáng)度均值是多少?(參數(shù)的點(diǎn)估計(jì)問(wèn)題)2、強(qiáng)度均值在什么范圍內(nèi)?(參數(shù)的區(qū)間估計(jì)問(wèn)題)3、若規(guī)定強(qiáng)度均值不小于某個(gè)定值為合格,那么這批材料是否合格?(參數(shù)的假設(shè)檢驗(yàn)問(wèn)題)4、這批合金的強(qiáng)度是否服從正態(tài)分布?5、若這批材料是由兩種不同工藝生產(chǎn)的,那么不同的工藝對(duì)合金強(qiáng)度有否影響?若有影響,哪一種工藝生產(chǎn)的強(qiáng)度較好?(分布檢驗(yàn)問(wèn)題)(方差分析問(wèn)題)6、若這批合金由幾種原料用不同的比例合成,那么如何表達(dá)這批合金的強(qiáng)度與原料比例之間的關(guān)系?(回歸分析問(wèn)題)我們依次討論參數(shù)的點(diǎn)估計(jì)、區(qū)間估計(jì)、假設(shè)檢驗(yàn)、方差分析、回歸分析。下面引入一些數(shù)理統(tǒng)計(jì)中的術(shù)語(yǔ)。二、統(tǒng)計(jì)量一、總體與樣本抽樣和抽樣分布三、幾個(gè)常用的分布四、正態(tài)總體統(tǒng)計(jì)量的分布1.總體研究對(duì)象的某項(xiàng)數(shù)量指標(biāo)值全體稱為總體(母體)。個(gè)體——總體中每個(gè)成員(元素)。2.樣本一、總體和樣本對(duì)總體做n次重復(fù)獨(dú)立觀測(cè),稱為簡(jiǎn)單隨機(jī)抽樣。抽樣得到的個(gè)體稱為樣本。(2)獨(dú)立同分布性要求抽取的樣本滿足下面兩點(diǎn):(1)代表性:簡(jiǎn)單隨機(jī)抽樣每一個(gè)分量Xk與所考察的總體有相同的分布。個(gè)體被抽到的可能性相同。從總體中抽取樣本的每一個(gè)分量Xk

是隨機(jī)的,是相互獨(dú)立的隨機(jī)變量。(若不特別說(shuō)明,均指簡(jiǎn)單隨機(jī)樣本)簡(jiǎn)單隨機(jī)樣本可以用與總體獨(dú)立同分布的n個(gè)相互獨(dú)立的隨機(jī)變量若總體X的分布函數(shù)為聯(lián)合分布函數(shù)為若總體X的分布密度函數(shù)為表示。則其簡(jiǎn)單隨機(jī)樣本的則其簡(jiǎn)單隨機(jī)樣本的聯(lián)合密度函數(shù)為離散總體則樣本的分布律我們只能觀察到隨機(jī)變量取的值,而見(jiàn)不到隨機(jī)變量.3.總體、樣本、樣本值的關(guān)系

事實(shí)上我們抽樣后得到的資料都是具體的、確定的值.如我們從某班學(xué)生中抽取10人測(cè)量身高,得到10個(gè)數(shù),它們是樣本取到的值而不是樣本.因而可以由樣本值去推斷總體.總體分布決定了樣本取值的概率規(guī)律,也就是樣本取到樣本值的規(guī)律,去推斷總體的情況--總體分布F(x)的性質(zhì).樣本是聯(lián)系二者的橋梁。統(tǒng)計(jì)是從手中已有的資料--樣本值,4.樣本的分布1)樣本的頻數(shù)分布將n個(gè)樣本值按從小到大排列,把相同的數(shù)合并,并指出其頻數(shù)(樣本中各數(shù)出現(xiàn)的次數(shù))x頻數(shù)頻率2)樣本的經(jīng)驗(yàn)分布函數(shù)樣本值:樣本值小于或等于x的個(gè)數(shù),作---樣本的經(jīng)驗(yàn)分布函數(shù)給出了在n次獨(dú)立重復(fù)試驗(yàn)中,事件出現(xiàn)的頻率,具有分布函數(shù)的一切性質(zhì)。如:非降,右連續(xù);由頻數(shù)分布知---n次獨(dú)立重復(fù)試驗(yàn)中,事件發(fā)生的頻率。根據(jù)伯努利大數(shù)定律,這就是我們可以由樣本推斷總體的基本理論依據(jù).格列汶科進(jìn)一步證明了:當(dāng)n→∞時(shí),F(xiàn)n(x)以概率1關(guān)于x一致收斂于F(x),即(格列汶科定理)定理告訴我們,當(dāng)樣本容量n足夠大時(shí),對(duì)所有的x,

Fn(x)與F(x)之差的絕對(duì)值都很小,這件事發(fā)生的概率為1.定義:設(shè)是來(lái)自總體X的一個(gè)樣本,為一實(shí)值連續(xù)函數(shù),其不包含任何未知參數(shù),則稱為一個(gè)統(tǒng)計(jì)量。為的觀測(cè)值。注:是變量的函數(shù),仍為隨機(jī)變量。是一個(gè)數(shù)。二、統(tǒng)計(jì)量1.統(tǒng)計(jì)量

2.幾個(gè)常見(jiàn)的統(tǒng)計(jì)量樣本均值樣本方差是來(lái)自總體X的一個(gè)樣本,樣本標(biāo)準(zhǔn)差證明:左邊=樣本k

階原點(diǎn)矩樣本k階中心矩常見(jiàn)統(tǒng)計(jì)量的性質(zhì)統(tǒng)計(jì)量既然是依賴于樣本的,而后者又是隨機(jī)變量,故統(tǒng)計(jì)量也是隨機(jī)變量,因而就有一定的分布,這個(gè)分布叫做統(tǒng)計(jì)量的“抽樣分布”

.

三、抽樣分布(1)標(biāo)準(zhǔn)正態(tài)分布X的上α

(0<α<1)分位點(diǎn)記為設(shè)相互獨(dú)立,都服從正態(tài)分布N(0,1),

則稱隨機(jī)變量:所服從的分布為自由度為n的分布.

對(duì)于給定的正數(shù)稱滿足條件為分位點(diǎn).分布的上的點(diǎn)

分布的分位點(diǎn)上分位點(diǎn)雙側(cè)分位點(diǎn)一般的分布表只列到n=45,n>45時(shí),由記為T~t(n).服從自由度為n的t分布,(3)t分布設(shè)X~N(0,1),Y~則稱變量,且X與Y相互獨(dú)立,當(dāng)n充分大時(shí),其圖形類似于標(biāo)準(zhǔn)正態(tài)分布密度函數(shù)的圖形。

t分布的密度函數(shù)關(guān)于x=0對(duì)稱性質(zhì)

t分布的分位點(diǎn)

對(duì)于給定的正數(shù)稱滿足條件的點(diǎn)為分位點(diǎn)”。分布的“上(4)F

分布的F分布,n1稱為第一自由度,設(shè)X與Y相互獨(dú)立,則稱統(tǒng)計(jì)量服從自由度為稱為第二自由度,記作由定義可得性質(zhì)F

分布的分位點(diǎn)對(duì)于給定的正數(shù)稱滿足條件為分布的的點(diǎn)上分位點(diǎn)表中所給的都是很小的數(shù),如0.01,0.05等當(dāng)表中查不出,由性質(zhì)(2)較大時(shí),如0.95,四.正態(tài)總體抽樣分布定理的樣本,則有

定理1(樣本均值的分布)設(shè)X1,X2,…,Xn

是來(lái)自正態(tài)總體定理2(樣本方差的分布)設(shè)X1,X2,…,Xn

是取自正態(tài)總體樣本,分別為樣本均值和樣本方差.則有的和相互獨(dú)立。

分別是這兩個(gè)樣本的均值,且X與Y獨(dú)立,是取自X的樣本,樣本,分別是這兩個(gè)樣本的樣本方差,則有是取自Y的定理3(兩總體樣本均值差的分布)二、估計(jì)量的評(píng)選標(biāo)準(zhǔn)一、點(diǎn)估計(jì)第三章參數(shù)估計(jì)三、區(qū)間估計(jì)四、正態(tài)總體均值與方差的區(qū)間估計(jì)

參數(shù)估計(jì)是統(tǒng)計(jì)推斷的基本問(wèn)題之一,問(wèn)題中,并不一定要求密度函數(shù),而只要知道參數(shù)在許多實(shí)際取值就可以了??疾鞜襞輳S生產(chǎn)的燈泡質(zhì)量,由于種種隨機(jī)易知燈泡使用壽命是隨機(jī)變量,記為且

問(wèn)題:如何估計(jì)和?引例:因素的影響,知道了參數(shù)μ,σ2的值,那么壽命X的分布就完全確定了.參數(shù)估計(jì)要解決問(wèn)題:總體分布函數(shù)的形式為已知,需要確定未知參數(shù)。但其中參數(shù)未知時(shí),這類問(wèn)題稱為參數(shù)估計(jì)問(wèn)題。對(duì)于未知參數(shù),如何應(yīng)用樣本所提供的信息去對(duì)其一個(gè)或多個(gè)未知參數(shù)進(jìn)行估計(jì)。對(duì)未知參數(shù)估計(jì)的兩種方法:通過(guò)樣本1、點(diǎn)估計(jì)2、區(qū)間估計(jì)一、點(diǎn)估計(jì)點(diǎn)估計(jì)問(wèn)題:故可用樣本矩來(lái)估計(jì)總體矩。這個(gè)估計(jì)方法是英國(guó)統(tǒng)計(jì)學(xué)家K.皮爾遜最早提出的。基本原理:總體矩是反映總體分布的最簡(jiǎn)單的數(shù)字特征,當(dāng)總體含有待估計(jì)參數(shù)時(shí),總體矩是待估計(jì)參數(shù)的函數(shù)。樣本取自總體,即樣本矩在一定程度上可以逼近總體矩,(一)矩估計(jì)法其中是待估參數(shù)為來(lái)自的樣本,存在.設(shè)總體的k階矩則樣本的k階矩(大數(shù)定律)令從中解得k個(gè)方程組即為矩估計(jì)量。矩估計(jì)量的觀察值稱為矩估計(jì)值。設(shè)總體X的分布函數(shù)為矩估計(jì)的步驟:連續(xù)型離散型例1

設(shè)某炸藥廠一天中發(fā)生著火現(xiàn)象的次數(shù)X服從

例2設(shè)總體在上服從均勻分布,解:由矩法,解得在總體類型已知條件下使用的一種參數(shù)估計(jì)方法.(二)極大似然法

選擇一個(gè)參數(shù)使得試驗(yàn)結(jié)果具有最大概率—極大似然法的基本思想.基本思想:若事件發(fā)生了,則認(rèn)為事件中出現(xiàn)的概率最大。最大似然估計(jì)就是在一次抽樣中,若得到觀測(cè)值則選取若一試驗(yàn)有n個(gè)可能結(jié)果現(xiàn)做一試驗(yàn),在這n個(gè)可能結(jié)果作為的估計(jì)值,使得當(dāng)時(shí),樣本出現(xiàn)的概率最大。最大似然估計(jì)法:是的一個(gè)樣本值(離散型)(1)設(shè)事件發(fā)生的概率為

的函數(shù),形式已知,X的分布律為:

樣本的似然函數(shù)即取使得:與有關(guān),記為稱為參數(shù)的最大似然估計(jì)值。稱為參數(shù)的最大似然估計(jì)量.達(dá)到最大的參數(shù)作為的估計(jì)值,現(xiàn)從中挑選使概率樣本的似然函數(shù)說(shuō)明:用上述求導(dǎo)方法求參數(shù)的MLE有時(shí)行不通,這時(shí)要用極大似然原則來(lái)求.使似然函數(shù)達(dá)到最大的即的MLE。

(4)在最大值點(diǎn)的表達(dá)式中,用樣本值代入就得參數(shù)的極大似然估計(jì)值.(1)由總體分布導(dǎo)出樣本的聯(lián)合分布律

(或聯(lián)合密度);(2)把樣本聯(lián)合分布律(或聯(lián)合密度)中自變量看成已知常數(shù),而把參數(shù)看作自變量,

得到似然函數(shù)L();(3)求似然函數(shù)L()的最大值點(diǎn)(常常轉(zhuǎn)化為求ln

L()的最大值點(diǎn)),即

的MLE;求極大似然估計(jì)(MLE)的一般步驟是:似然函數(shù)為:

設(shè)X1,X2,…Xn是取自總體X的一個(gè)樣本其中>0,求的極大似然估計(jì).例3對(duì)數(shù)似然函數(shù)為解:似然函數(shù)為i=1,2,…,n求導(dǎo)方法無(wú)法求參數(shù)的MLE.是對(duì)故使達(dá)到最大的即的MLE,

取其它值時(shí),是的增函數(shù)由于這時(shí)要用極大似然原則來(lái)求.由于估計(jì)量作為樣本的函數(shù)是一個(gè)隨機(jī)變量,對(duì)于不同的樣本值,估計(jì)值也不同,因此評(píng)價(jià)一個(gè)估計(jì)量的優(yōu)劣就不能僅由一個(gè)觀測(cè)值來(lái)確定,而要根據(jù)估計(jì)量的統(tǒng)計(jì)性質(zhì)來(lái)評(píng)價(jià).通常一個(gè)好的估計(jì)量其觀測(cè)值應(yīng)在待估計(jì)參數(shù)的真值附近波動(dòng),且波動(dòng)的幅度越小越好,即要使估計(jì)量與待估計(jì)參數(shù)在某種統(tǒng)計(jì)意義下非?!敖咏?

常用的幾條標(biāo)準(zhǔn)1.無(wú)偏性2.有效性3.相合性二、估計(jì)量的評(píng)選標(biāo)準(zhǔn)而它的期望值等于未知參數(shù)的真值.則稱為的無(wú)偏估計(jì).設(shè)是未知參數(shù)的估計(jì)量,若1.無(wú)偏性

估計(jì)量是隨機(jī)變量,對(duì)于不同的樣本值會(huì)得到不同的估計(jì)值.我們希望估計(jì)值在未知參數(shù)真值附近擺動(dòng),定義:無(wú)偏性的意義是:用來(lái)估計(jì)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論