續(xù)概率與理論分布_第1頁(yè)
續(xù)概率與理論分布_第2頁(yè)
續(xù)概率與理論分布_第3頁(yè)
續(xù)概率與理論分布_第4頁(yè)
續(xù)概率與理論分布_第5頁(yè)
已閱讀5頁(yè),還剩48頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、續(xù)概率與理論分布 續(xù)前 (概率與理論分布) 續(xù)概率與理論分布 第三節(jié)第三節(jié) 抽樣分布抽樣分布 續(xù)概率與理論分布 統(tǒng)計(jì)學(xué)中一個(gè)很重要的內(nèi)容是研究總體和樣本的關(guān)統(tǒng)計(jì)學(xué)中一個(gè)很重要的內(nèi)容是研究總體和樣本的關(guān) 系,這種關(guān)系可以從兩個(gè)方面來進(jìn)行研究:系,這種關(guān)系可以從兩個(gè)方面來進(jìn)行研究: 一個(gè)方向:從樣本到總體,即從特殊到一般,從局一個(gè)方向:從樣本到總體,即從特殊到一般,從局 部到全體(歸納),這是統(tǒng)計(jì)推斷的過程部到全體(歸納),這是統(tǒng)計(jì)推斷的過程 一個(gè)方向:從總體到樣本,即從一般到特殊,從全一個(gè)方向:從總體到樣本,即從一般到特殊,從全 體到局部(演繹),這就是抽樣分布研究體到局部(演繹),這就是抽樣分

2、布研究 續(xù)概率與理論分布 抽樣分布(演繹的過程)抽樣分布(演繹的過程) 總體總體 樣本樣本 統(tǒng)計(jì)推斷(歸納的過程)統(tǒng)計(jì)推斷(歸納的過程) 而抽樣分布的研究,又是統(tǒng)計(jì)推斷的基礎(chǔ):而抽樣分布的研究,又是統(tǒng)計(jì)推斷的基礎(chǔ): 抽樣分布抽樣分布 統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷 研究抽樣分布,其實(shí)質(zhì)就是研究統(tǒng)計(jì)量的研究抽樣分布,其實(shí)質(zhì)就是研究統(tǒng)計(jì)量的分布分布,其,其 目的就是為了更好地進(jìn)行統(tǒng)計(jì)目的就是為了更好地進(jìn)行統(tǒng)計(jì)推斷推斷;因?yàn)樵诮y(tǒng)計(jì);因?yàn)樵诮y(tǒng)計(jì) 推斷的過程中需要知道統(tǒng)計(jì)量的推斷的過程中需要知道統(tǒng)計(jì)量的分布規(guī)律分布規(guī)律 續(xù)概率與理論分布 一、抽樣的概念一、抽樣的概念 總體往往是無限的、未知的、抽象的,只能通過樣總體往

3、往是無限的、未知的、抽象的,只能通過樣 本來進(jìn)行估計(jì)和推斷,因此必須研究抽樣分布本來進(jìn)行估計(jì)和推斷,因此必須研究抽樣分布 和和2 2是描述總體特征的兩個(gè)參數(shù),而是描述總體特征的兩個(gè)參數(shù),而 和和s2 2 是 是 樣本的兩個(gè)統(tǒng)計(jì)量;因此研究總體和樣本的關(guān)系,樣本的兩個(gè)統(tǒng)計(jì)量;因此研究總體和樣本的關(guān)系, 其實(shí)質(zhì)就是研究其實(shí)質(zhì)就是研究與與 、2 2 與 與 s2 的關(guān)系的關(guān)系 對(duì)于總體來講,對(duì)于總體來講,和和2 2是常量,而總體中的樣本不是常量,而總體中的樣本不 止一個(gè),且每一樣本的止一個(gè),且每一樣本的 不會(huì)相等,也不會(huì)剛好不會(huì)相等,也不會(huì)剛好 等于等于,因此,因此 也也是隨機(jī)變量是隨機(jī)變量 x x

4、 x x 續(xù)概率與理論分布 同樣,每一樣本的同樣,每一樣本的 s2 也不會(huì)相等,且不等于也不會(huì)相等,且不等于2 2, 因此,因此,s2 2 也是隨機(jī)變量 也是隨機(jī)變量 續(xù)概率與理論分布 抽樣分布示意圖抽樣分布示意圖 X1 X2 Xk 原總體原總體 樣本樣本1 樣本樣本2 樣本樣本k 新總體新總體 續(xù)概率與理論分布 而而 與與間的差異稱為間的差異稱為隨機(jī)抽樣誤差隨機(jī)抽樣誤差(簡(jiǎn)稱抽樣誤(簡(jiǎn)稱抽樣誤 差差 random sampling error ) 從一個(gè)總體中按一定的樣本容量從一個(gè)總體中按一定的樣本容量n 隨機(jī)地抽出所有隨機(jī)地抽出所有 可能的樣本,得到一系列的可能的樣本,得到一系列的 ,由這

5、些,由這些 所形成的所形成的 分布就稱為樣本平均數(shù)分布就稱為樣本平均數(shù) 的隨機(jī)抽樣分布,簡(jiǎn)稱的隨機(jī)抽樣分布,簡(jiǎn)稱 為平均數(shù)的抽樣分布為平均數(shù)的抽樣分布(sampling distribution) 抽樣分復(fù)置(放回)抽樣和不復(fù)置(不放回)抽樣抽樣分復(fù)置(放回)抽樣和不復(fù)置(不放回)抽樣 兩種兩種 復(fù)置(放回)抽樣復(fù)置(放回)抽樣 不復(fù)置(不放回)抽樣不復(fù)置(不放回)抽樣 x xx x 續(xù)概率與理論分布 當(dāng)樣本容量當(dāng)樣本容量 n 與總體容量與總體容量N 相比很?。ㄈ缦啾群苄。ㄈ?,因此當(dāng)自由度,因此當(dāng)自由度不是很大不是很大 時(shí),時(shí),t 分布曲線較之標(biāo)準(zhǔn)正態(tài)分布曲線為分布曲線較之標(biāo)準(zhǔn)正態(tài)分布曲線為

6、離散離散,t 分分 布曲線的頂峰恒布曲線的頂峰恒低于低于標(biāo)準(zhǔn)正態(tài)分布曲線,而兩尾則標(biāo)準(zhǔn)正態(tài)分布曲線,而兩尾則 恒恒略高略高 當(dāng)當(dāng) 大時(shí),大時(shí), ,t 分布曲線就分布曲線就趨向于趨向于標(biāo)準(zhǔn)正態(tài)標(biāo)準(zhǔn)正態(tài) 分布曲線分布曲線 當(dāng)樣本容量當(dāng)樣本容量 , ,t 分布的方差為分布的方差為 1,t 分分 布曲線即布曲線即重合于重合于標(biāo)準(zhǔn)正態(tài)分布曲線標(biāo)準(zhǔn)正態(tài)分布曲線 2 1 2 n 2 續(xù)概率與理論分布 續(xù)概率與理論分布 u-分布與分布與t-分布的區(qū)別:分布的區(qū)別: 當(dāng)總體方差為已知:當(dāng)總體方差為已知: 當(dāng)總體方差雖未知,但樣本很大時(shí):當(dāng)總體方差雖未知,但樣本很大時(shí): 當(dāng)總體方差未知,且樣本又不大時(shí):當(dāng)總體方差

7、未知,且樣本又不大時(shí): 這里,要注意兩個(gè)這里,要注意兩個(gè) 的區(qū)別的區(qū)別 x x u x x u s x x t s x s 續(xù)概率與理論分布 六、六、 分布(分布(chi-square distribution) 從一個(gè)已知平均值為從一個(gè)已知平均值為,方差為,方差為2 2的總體中進(jìn)行獨(dú)的總體中進(jìn)行獨(dú) 立的抽樣,得隨機(jī)變量立的抽樣,得隨機(jī)變量 x,其標(biāo)準(zhǔn)離差為,其標(biāo)準(zhǔn)離差為 連續(xù)連續(xù) n 次獨(dú)立抽樣,可得次獨(dú)立抽樣,可得 n 個(gè)相互獨(dú)個(gè)相互獨(dú) 立的隨機(jī)變量立的隨機(jī)變量 x,即可得,即可得 n 個(gè)個(gè) ui, 這這 n 個(gè)獨(dú)立的標(biāo)準(zhǔn)正態(tài)離差個(gè)獨(dú)立的標(biāo)準(zhǔn)正態(tài)離差 ui ,求其平方之和,即,求其平方之和

8、,即 可得到一個(gè)新的統(tǒng)計(jì)量可得到一個(gè)新的統(tǒng)計(jì)量 2 0,1 x uN 2 22222 12 2 . i ni x uuuu 2 續(xù)概率與理論分布 用樣本來計(jì)算時(shí),可由用樣本來計(jì)算時(shí),可由 來估計(jì)來估計(jì) 而由于而由于 可得可得 , 即即 即即 由此可知,由此可知, 是是 n-1個(gè)獨(dú)立的標(biāo)準(zhǔn)正態(tài)離差,具有自個(gè)獨(dú)立的標(biāo)準(zhǔn)正態(tài)離差,具有自 由度由度 n-1 2 xx 2 x 2 2 1 xx s n 2 2 1xxns 2 2 2 22 1xxns 2 2 12 1 n ns 2 續(xù)概率與理論分布 在一個(gè)正態(tài)總體中按一定的樣本量在一個(gè)正態(tài)總體中按一定的樣本量 n 進(jìn)行抽樣,每一進(jìn)行抽樣,每一 樣本均有

9、樣本均有 n 個(gè)個(gè) xi,即可得,即可得 n個(gè)個(gè) ui,因此每一樣本都,因此每一樣本都 有一個(gè)有一個(gè) 值,將所有可能的樣本(容量為值,將所有可能的樣本(容量為 n)均抽出)均抽出 來,所得到的來,所得到的 值就組成了一個(gè)分布,這一分布就值就組成了一個(gè)分布,這一分布就 稱為自由度為稱為自由度為 n-1 的的 分布,其概率密度函數(shù)分布,其概率密度函數(shù) 為:為: 分布是由標(biāo)準(zhǔn)正態(tài)分布產(chǎn)生的,是連續(xù)型隨機(jī)變量分布是由標(biāo)準(zhǔn)正態(tài)分布產(chǎn)生的,是連續(xù)型隨機(jī)變量 的一個(gè)分布形式,且具有概率密度函數(shù)的一個(gè)分布形式,且具有概率密度函數(shù) 2 2 f 2 1 2 2 2 2 2 2 2 fe 2 2 2 續(xù)概率與理論分

10、布 分布具有以下特點(diǎn):分布具有以下特點(diǎn): 1、 分布的取值范圍為分布的取值范圍為 0,+),無負(fù)值),無負(fù)值 2、 分布的平均值為分布的平均值為 ,方差為,方差為 3、 分布的形狀決定于自由度分布的形狀決定于自由度(df),當(dāng)),當(dāng)1 1 時(shí),曲線呈反時(shí),曲線呈反 J 型,型,1 時(shí),曲線嚴(yán)重左偏;隨時(shí),曲線嚴(yán)重左偏;隨 著著 的增大,曲線漸趨對(duì)稱,當(dāng)?shù)脑龃?,曲線漸趨對(duì)稱,當(dāng)30, 分布分布 向正態(tài)分布漸近向正態(tài)分布漸近 2 2 2 2 2 2 2 2 2 續(xù)概率與理論分布 分布還可定義為觀察次數(shù)與理論次數(shù)間的符合程分布還可定義為觀察次數(shù)與理論次數(shù)間的符合程 度度 即即 因此,因此, 分布可以

11、用來進(jìn)行次數(shù)資料的假設(shè)性檢驗(yàn),分布可以用來進(jìn)行次數(shù)資料的假設(shè)性檢驗(yàn), 這在遺傳學(xué)研究和規(guī)范化研究中用處很大這在遺傳學(xué)研究和規(guī)范化研究中用處很大 2 2 2 2ii i OE E 2 2 1 ii n i OE E 續(xù)概率與理論分布 續(xù)概率與理論分布 七、七、F分布(分布(Fdistribution) 對(duì)于一個(gè)平均值為對(duì)于一個(gè)平均值為,方差為,方差為2 2 的正態(tài)總體,獨(dú)立 的正態(tài)總體,獨(dú)立 地抽取自由度分別為地抽取自由度分別為1 = n1-1 、2 = n2-1 的兩個(gè)樣的兩個(gè)樣 本本 這兩個(gè)樣本的平均值和方差分別為這兩個(gè)樣本的平均值和方差分別為 、 和和 、 則有則有 、 這兩個(gè)這兩個(gè)2 2

12、 變量除以各自的自由度后的比值,被定義變量除以各自的自由度后的比值,被定義 為為F統(tǒng)計(jì)量:統(tǒng)計(jì)量: 1 x 2 x 2 1 s 2 2 s 2 112 1 2 1ns 2 222 2 2 1ns 2 2 11 1 2 2 1 11 222 2222 2 2 2 1 11 1 11 ns nns F nss nn 續(xù)概率與理論分布 即即F值是值是方差同質(zhì)總體中所抽自由度為方差同質(zhì)總體中所抽自由度為1 1和和2 2的兩的兩 個(gè)樣本均方個(gè)樣本均方 和和 的比值的比值 在一個(gè)正態(tài)總體中獨(dú)立地抽出所有可能的具有自由在一個(gè)正態(tài)總體中獨(dú)立地抽出所有可能的具有自由 度為度為1 1和和2 2的樣本,并計(jì)算的樣本

13、,并計(jì)算F(1 1, ,2 2)值,由)值,由 這一系列這一系列F值所構(gòu)成的分布稱為值所構(gòu)成的分布稱為F分布分布 2 1 s 2 2 s 續(xù)概率與理論分布 F分布的概率密度函數(shù)是兩個(gè)獨(dú)立的分布的概率密度函數(shù)是兩個(gè)獨(dú)立的 2 2 變量的聯(lián)合變量的聯(lián)合 密度函數(shù):密度函數(shù): F分布是隨兩個(gè)自由度分布是隨兩個(gè)自由度1 1、2 2 的不同而異的一簇曲 的不同而異的一簇曲 線線 F值的取值范圍為值的取值范圍為 00,+ +) 1 12 12 1 122 22 12 12 2 12 2 22 F f F F 續(xù)概率與理論分布 由于構(gòu)成由于構(gòu)成 F 值的值的 和和 都是正態(tài)總體中都是正態(tài)總體中 的無偏估的無

14、偏估 計(jì)量,因此計(jì)量,因此 F 分布的平均值為分布的平均值為 方差為方差為 F 分布的每一條曲線都有兩個(gè)自由度,且這兩個(gè)自分布的每一條曲線都有兩個(gè)自由度,且這兩個(gè)自 由度其位次不能任意掉換由度其位次不能任意掉換 F 值分子上的自由度為第一自由度值分子上的自由度為第一自由度df1 F 值分母上的自由度為第二自由度值分母上的自由度為第二自由度df2 在一個(gè)正態(tài)總體中抽取兩個(gè)樣本均方,比較其顯著在一個(gè)正態(tài)總體中抽取兩個(gè)樣本均方,比較其顯著 性時(shí),總是將較大的均方作為分子,這個(gè)均方所性時(shí),總是將較大的均方作為分子,這個(gè)均方所 具有的自由度作為第一自由度具有的自由度作為第一自由度 2 1 s 2 2 s 2 1 F 2 2122 2 122 22 24 續(xù)概率與理論分布 較小的較小的均方作為分母,其所具有的自由度作為第二均方作為分母,其所具有的自由度作為第二 自由度自由度 在方差分析中,總是將在方差分析中,總是將組間均方組間均方作為分子,因?yàn)橐蛔鳛榉肿?,因?yàn)橐?般來說,組間均方總是般來說,組間均方總是被比較的對(duì)象被比較的對(duì)象,且也總是,且也總是 大均方,因此組間均方的自由度就是第一自由度大均方,因此組間均方的自由度就是第一自由度 df1 而

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論