第三章 隨機變量及分布.ppt_第1頁
第三章 隨機變量及分布.ppt_第2頁
第三章 隨機變量及分布.ppt_第3頁
第三章 隨機變量及分布.ppt_第4頁
第三章 隨機變量及分布.ppt_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第三章隨機變量與概率分布 第一節(jié)事件與概率一 事件 一 必然現(xiàn)象與隨機現(xiàn)象必然現(xiàn)象 在保持條件不變的情況下 重復(fù)進行試驗 其結(jié)果總是確定的 必然發(fā)生 或必然不發(fā)生 這類現(xiàn)象稱為必然想象 例如 在標(biāo)準(zhǔn)大氣壓下 水加熱到100 必然沸騰 隨機現(xiàn)象 在保持條件不變的情況下 重復(fù)進行試驗 其結(jié)果未必相同 這類在個別試驗中其結(jié)果呈現(xiàn)偶然性 不確定性現(xiàn)象 稱為隨機現(xiàn)象 例如 擲一枚質(zhì)地均勻?qū)ΨQ的硬幣 其結(jié)果可能出現(xiàn)正面 也可能出現(xiàn)反面 隨機現(xiàn)象或不確定性現(xiàn)象 有如下特點 1 在一定的條件實現(xiàn)時 有多種可能的結(jié)果發(fā)生 事前人們不能預(yù)言將出現(xiàn)哪種結(jié)果 對一次或少數(shù)幾次觀察或試驗而言 其結(jié)果呈現(xiàn)偶然性 不確定性 2 但在相同條件下進行大量重復(fù)試驗時 其試驗結(jié)果卻呈現(xiàn)出某種固有的特定的規(guī)律性 頻率的穩(wěn)定性 通常稱之為隨機現(xiàn)象的統(tǒng)計規(guī)律性 二 隨機試驗與隨機事件1 隨機試驗 通常我們把根據(jù)某一研究目的 在一定條件下對自然現(xiàn)象所進行的觀察或試驗統(tǒng)稱為試驗 如果滿足下述三個特性的試驗稱其為隨機試驗 1 試驗可以在相同條件下多次重復(fù)進行 2 每次試驗的可能結(jié)果不止一個 并且事先知道會有哪些可能的結(jié)果 3 每次試驗總是恰好出現(xiàn)這些可能結(jié)果中的一個 但在一次試驗之前卻不能肯定這次試驗會出現(xiàn)哪一個結(jié)果 例如 在一定孵化條件下 孵化6枚種蛋 觀察其出雛情況 又如觀察兩頭臨產(chǎn)妊娠母牛所產(chǎn)犢牛的性別情況 它們都具有隨機試驗的三個特征 因此都是隨機試驗 2 隨機事件隨機試驗的每一種可能結(jié)果 在一定條件下可能發(fā)生 也可能不發(fā)生 稱為隨機事件 簡稱事件 通常用A B C等來表示 1 基本事件 不能再分的事件稱為基本事件 也稱為樣點 例如 在編號為1 2 3 10的十頭豬中隨機抽取1頭 有10種不同的可能結(jié)果 取得一個編號是1 取得一個編號是2 取得一個編號是10 這10個事件都是不可能再分的事件 它們都是基本事件 由若干個基本事件組合而成的事件稱為復(fù)合事件 如 取得一個編號是2的倍數(shù) 是一個復(fù)合事件 它由 取得一個編號是2 是4 是6 是8 是10 5個基本事件組合而成 2 必然事件 在一定條件下必然發(fā)生的事件稱為必然事件例如 1個標(biāo)準(zhǔn)大氣壓下水加熱到100 會沸騰 3 不可能事件 在一定條件下不可能發(fā)生的事件稱為不可能事件 例如 在滿足一定孵化條件下 從石頭孵化出雛雞 就是一個不可能事件 必然事件與不可能事件實際上是確定性現(xiàn)象 即它們不是隨機事件 但是為了方便起見 把它們看作為兩個特殊的隨機事件 二 概率 一 概率的統(tǒng)計定義 在相同的條件下進行n次重復(fù)試驗 如果隨機事件A發(fā)生的次數(shù)為m 那么m n稱為隨機事件A的頻率 當(dāng)試驗重復(fù)數(shù)逐漸增大時 隨機事件A的頻率越來越穩(wěn)定地接近于某一數(shù)值P 那么就把P稱為隨機事件A的概率 這樣定義的概率稱為統(tǒng)計概率 或者稱后驗概率 例如 擲一枚硬幣隨試驗次數(shù)的增多 正面朝上這個事件發(fā)生的頻率越來越穩(wěn)定地接近0 5 把0 5作為這個事件的概率 公式如下 n充分大 例如為了確定拋擲一枚硬幣發(fā)生正面朝上這個事件的概率 歷史上有人作過成千上萬次拋擲硬幣的試驗 在表1中列出了他們的試驗記錄 表1拋擲一枚硬幣發(fā)生正面朝上的試驗記錄 二 概率的古典定義對于某些隨機事件 用不著進行多次重復(fù)試驗來確定其概率 而是根據(jù)隨機事件本身的特性直接計算其概率 有很多隨機試驗具有以下特征 1 試驗的所有可能結(jié)果只有有限個 即樣本空間中的基本事件只有有限個 2 各個試驗的可能結(jié)果出現(xiàn)的可能性相等 即所有基本事件的發(fā)生是等可能的 3 試驗的所有可能結(jié)果兩兩互不相容 具有上述特征的隨機試驗 稱為古典概型 對于古典概型 概率的定義如下 設(shè)樣本空間由n個等可能的基本事件所構(gòu)成 其中事件A包含有m個基本事件 則事件A的概率為m n 即 這樣定義的概率稱為古典概率 或先驗概率 例 在N頭奶牛中 有M頭曾有流產(chǎn)史 從這群奶牛中任意抽出n頭奶牛 試求 1 其中恰有m頭有流產(chǎn)史奶牛的概率是多少 2 若N 30 M 8 n 10 m 2 其概率是多少 我們把從有M頭奶牛曾有流產(chǎn)史的N頭奶牛中任意抽出n頭奶牛 其中恰有m頭有流產(chǎn)史這一事件記為A 因為從N頭奶牛中任意抽出n頭奶牛的基本事件總數(shù)為 事件A所包含的基本事件數(shù)為 因此所求事件A的概率為 將N 30 M 8 n 10 m 2代入上式 得即在30頭奶牛中有8頭曾有流產(chǎn)史 從這群奶牛隨機抽出10頭奶牛其中有2頭曾有流產(chǎn)史的概率為6 95 三 概率的性質(zhì)1 對于任何事件A 有0 P A 1 2 必然事件的概率為1 即P 1 3 不可能事件的概率為0 即P 0 三 小概率事件實際不可能性原理隨機事件的概率表示了隨機事件在一次試驗中出現(xiàn)的可能性大小 一 小概率事件 若隨機事件的概率很小 例如小于0 05 0 01 0 001 稱為小概率事件 二 小概率事件實際不可能性原理在統(tǒng)計學(xué)上 把小概率事件在一次試驗中看成是實際不可能發(fā)生的事件 稱為小概率事件實際不可能性原理 亦稱為小概率原理 小概率原理是統(tǒng)計學(xué)上進行假設(shè)檢驗 顯著性檢驗 的基本依據(jù) 要認(rèn)真理解掌握 第二節(jié)概率分布事件的概率表示了一次試驗?zāi)骋粋€結(jié)果發(fā)生的可能性大小 若要全面了解試驗 則必須知道試驗的全部可能結(jié)果及各種可能結(jié)果發(fā)生的概率 即必須知道隨機試驗的概率分布 一 隨機變量的概念及分類作一次試驗 其結(jié)果有多種可能 每一種可能結(jié)果都可用一個數(shù)來表示 把這些數(shù)作為變量x的取值范圍 則試驗結(jié)果可用變量x來表示 例 對100頭病畜用某種藥物進行治療 其可能結(jié)果是 0頭治愈 1頭治愈 2頭治愈 100頭治愈 若用x表示治愈頭數(shù) 則x的取值為0 1 2 100 例 孵化一枚種蛋可能結(jié)果只有兩種 即 孵出小雞 與 未孵出小雞 若用變量x表示試驗的兩種結(jié)果 則可令x 0表示 未孵出小雞 x 1表示 孵出小雞 例 測定某品種豬初生重 表示測定結(jié)果的變量x所取的值為一個特定范圍 a b 如0 5 1 5kg x值可以是這個范圍內(nèi)的任何實數(shù) 1 離散型隨機變量 如果表示試驗結(jié)果的變量x 其可能取值至多為可列個 且以各種確定的概率取這些不同的值 則稱x為離散型隨機變量 2 連續(xù)型隨機變量 如果表示試驗結(jié)果的變量x 其可能取值為某范圍內(nèi)的任何數(shù)值 且x在其取值范圍內(nèi)的任一區(qū)間中取值時 其概率是確定的 則稱x為連續(xù)型隨機變量 二 離散型隨機變量的概率分布 一 概率函數(shù)要了解離散型隨機變量x的統(tǒng)計規(guī)律 就必須知道它的一切可能值xi及取每種可能值的概率pi 如果我們將離散型隨機變量X的一切可能取值xi i 1 2 n 及其對應(yīng)的概率pi 記作 則稱上式f xi 為離散型隨機變量X的概率函數(shù) 即描述離散性隨機變量取各個可能值的概率的函數(shù) 常用分布列來表示離散型隨機變量 例如 投擲一次勻質(zhì)的馓子所得點數(shù)的概率分布 二 概率分布函數(shù)定義 描述隨機變量取值小于等于某值的概率的函數(shù) 也稱為累計分布函數(shù) 離散性隨機變量X的概率分布函數(shù)為 對于上例有 三 連續(xù)型隨機變量的概率分布 一 概率函數(shù)連續(xù)型隨機變量 如體長 體重 蛋重 的概率分布不能用分布列來表示 因為其可能取的值是不可數(shù)的 我們改用隨機變量x在某個區(qū)間內(nèi)取值的概率P a x b 來表示 滿足以下條件的函數(shù)f x 稱為連續(xù)性隨機變量X的概率密度函數(shù) 二 概率分布函數(shù)下面通過頻率分布密度曲線予以說明 由表2作200頭奶牛血液鎂離子含量資料的頻率分布直方圖 見圖1 圖中縱座標(biāo)取頻率與組距的比值 可以設(shè)想 如果樣本取得越來越大 n 組分得越來越細(xì) i 0 某一范圍內(nèi)的頻率將趨近于一個穩(wěn)定值 概率 這時 頻率分布直方圖各個直方上端中點的聯(lián)線 頻率分布折線將逐漸趨向于一條曲線 換句話說 當(dāng)n i 0時 頻率分布折線的極限是一條穩(wěn)定的函數(shù)曲線 對于樣本是取自連續(xù)型隨機變量的情況 這條函數(shù)曲線將是光滑的 這條曲線排除了抽樣和測量的誤差 完全反映了基礎(chǔ)奶牛血液鎂離子含量的變動規(guī)律 這條曲線叫連續(xù)性隨機變量的概率分布密度曲線 相應(yīng)的函數(shù)叫連續(xù)性隨機變量的概率分布密度函數(shù) 若記鎂離子含量概率分布密度函數(shù)為f x 則x取值于區(qū)間 a b 的概率為圖中陰影部分的面積 即上式為連續(xù)型隨機變量x在區(qū)間 a b 上取值概率的表達式 可見 連續(xù)型隨機變量的概率由概率分布密度函數(shù)確定 四 連續(xù)型隨機變量概率分布的性質(zhì) 1 分布密度函數(shù)總是大于或等于0 即f x 0 2 當(dāng)隨機變量x取某一特定值時 其概率等于0 即 c為任意實數(shù) 因而 對于連續(xù)型隨機變量 僅研究其在某一個區(qū)間內(nèi)取值的概率 而不去討論取某一個值的概率 3 在一次試驗中隨機變量x之取值必在 x 范圍內(nèi) 為一必然事件 所以上式表示分布密度曲線下 橫軸上的全部面積為1 第三節(jié)正態(tài)分布 正態(tài)分布是一種很重要的連續(xù)型隨機變量的概率分布 生物現(xiàn)象中有許多變量是服從或近似服從正態(tài)分布的 如 家禽的體長 體重 產(chǎn)奶量 產(chǎn)毛量 血糖含量等 許多統(tǒng)計分析方法都是以正態(tài)分布為基礎(chǔ)的 此外 還有不少隨機變量的概率分布在一定條件下以正態(tài)分布為其極限分布 因此在統(tǒng)計學(xué)中 正態(tài)分布無論在理論研究上還是實際應(yīng)用中 均占有重要的地位 一 正態(tài)分布的定義及其特征 一 正態(tài)分布的定義 若連續(xù)型隨機變量x的概率分布密度函數(shù)為 其中 為平均數(shù) 2為方差 則稱隨機變量x服從正態(tài)分布 記為x N 2 相應(yīng)的概率分布函數(shù)為 分布密度曲線 圖1 分布函數(shù)曲線 圖2 二 正態(tài)分布的特征1 正態(tài)分布密度曲線是單峰 對稱的懸鐘形曲線 對稱軸為x 2 f x 在x 處達到極大 極大值 3 f x 是非負(fù)函數(shù) 以x軸為漸近線 分布從 至 4 曲線在x 處各有一個拐點 即曲線在 和 區(qū)間上是下凸的 在 區(qū)間內(nèi)是上凸的 5 正態(tài)分布有兩個參數(shù) 即平均數(shù) 和標(biāo)準(zhǔn)差 是位置參數(shù) 如圖3所示 當(dāng) 恒定時 愈大 則曲線沿x軸愈向右移動 反之 愈小 曲線沿x軸愈向左移動 是變異度參數(shù) 如圖4所示 當(dāng) 恒定時 愈大 表示x的取值愈分散 曲線愈 胖 愈小 x的取值愈集中在 附近 曲線愈 瘦 6 分布密度曲線與橫軸所夾的面積為1 即 圖3不同總體平均數(shù)的正態(tài)分布圖4不同標(biāo)準(zhǔn)差的正態(tài)分布 二 標(biāo)準(zhǔn)正態(tài)分布我們稱 0 2 1的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布 標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)及分布函數(shù)分別為 隨機變量u服從標(biāo)準(zhǔn)正態(tài)分布 記作U N 0 1 分布密度曲線如圖5所示 圖5標(biāo)準(zhǔn)正態(tài)分布的分布曲線圖6標(biāo)準(zhǔn)正態(tài)分布隨機變量在區(qū)間 u 內(nèi)取值的概率 對于任何一個服從正態(tài)分布N 2 的隨機變量x 都可以通過標(biāo)準(zhǔn)化變換 將其變換為服從標(biāo)準(zhǔn)正態(tài)分布的隨機變量u u稱為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差 從幾何意義上說 此變換實質(zhì)上是作了一個坐標(biāo)軸的平移和尺度變換 三 正態(tài)分布的概率計算 一 標(biāo)準(zhǔn)正態(tài)分布的概率計算設(shè)u服從標(biāo)準(zhǔn)正態(tài)分布 則u在 u1 u2 內(nèi)取值的概率為 而 u1 與 u2 可由附表1查得 例 已知 試求 1 2 3 4 解 查附表得 1 2 3 4 例 設(shè) 求 1 2 解 查附表得 1 2 由正態(tài)分布的概率計算公式及正態(tài)分布的對稱性可推出下列關(guān)系式 再借助附表1 便能很方便地計算有關(guān)概率 關(guān)于標(biāo)準(zhǔn)正態(tài)分布 以下幾種概率應(yīng)當(dāng)熟記 u變量在上述區(qū)間以外取值的概率分別為 二 一般正態(tài)分布的概率計算若隨機變量x服從正態(tài)分布N 2 則x的取值落在任意區(qū)間 x1 x2 的概率 記作P x1 X x2 即 對上式作變換u x 得dx du 故有 其中 這表明服從正態(tài)分布N 2 的隨機變量x在 x1 x2 內(nèi)取值的概率 等于服從標(biāo)準(zhǔn)正態(tài)分布的隨機變量u在 x1 x2 內(nèi)取值的概率 因此 計算一般正態(tài)分布的概率時 只要將區(qū)間的上下限作適當(dāng)變換 標(biāo)準(zhǔn)化 就可用查標(biāo)準(zhǔn)正態(tài)分布的概率表的方法求得概率了 例 設(shè)x服從 的正態(tài)分布 求解 令 則U服從標(biāo)準(zhǔn)正態(tài)分布 故 例 測定75頭金華后備母豬6月齡體重 得 問 1 體重在40 1 56 6kg間的母豬比率是多少 2 若選擇 55 1kg的母豬留種的比率是多少 3 若淘汰 45kg的母豬比率是多少 4 若留種比率為20 則留種母豬體重至少應(yīng)定為多少 解 1 2 3 4 關(guān)于一般正態(tài)分布 以下幾個概率 即隨機變量x落在 加減不同倍數(shù) 區(qū)間的概率 是經(jīng)常用到的 三 標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)分位數(shù)表生物統(tǒng)計中 我們不僅注意隨機變量x落在平均數(shù)加減不同倍數(shù)標(biāo)準(zhǔn)差區(qū)間 k k 之內(nèi)的概率而且也很關(guān)心x落在此區(qū)間之外的概率 我們把隨機變量x落在平均數(shù) 加減不同倍數(shù)標(biāo)準(zhǔn)差 區(qū)間之外的概率稱為雙側(cè)概率 兩尾概率 記作 對應(yīng)于雙側(cè)概率可以求得隨機變量x小于 k 或大于 k 的概率 稱為單側(cè)概率 一尾概率 記作 2 圖7標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)分位數(shù) 例如 x落在 1 96 1 96 之外的雙側(cè)概率為0 05 而單側(cè)概率為0 025 即 P x 1 96 P x 1 96 0 025x落在 2 58 2 58 之外的雙側(cè)概率為0 01 而單側(cè)概率P x 2 58 P x 2 58 0 005附表2給出了滿足P u 的雙側(cè)分位的數(shù)值 因此 只要已知雙側(cè)概率 的值 由附表2就可直接查出對應(yīng)的雙側(cè)分位數(shù) 查法與附表1相同 對于x N 2 只要將其轉(zhuǎn)換為u N 0 1 即可求得相應(yīng)的雙側(cè)分位數(shù) 第四節(jié)樣本平均數(shù)的抽樣分布 一 抽樣分布的概念研究總體與從中抽取的樣本之間的關(guān)系是統(tǒng)計學(xué)的中心內(nèi)容 對這種關(guān)系的研究可從兩方面著手 一是從總體到樣本 這就是研究抽樣分布的問題 二是從樣本到總體 這就是統(tǒng)計推斷問題 為了能正確地利用樣本去推斷總體 并能正確地理解統(tǒng)計推斷的結(jié)論 須對樣本的抽樣分布有所了解 我們知道 由總體中隨機地抽取若干個個體組成樣本 即使每次抽取的樣本含量相等 其統(tǒng)計量也將隨樣本的不同而有所不同 因而樣本統(tǒng)計量也是隨機變量 也有其概率分布 我們把統(tǒng)計量的概率分布稱為抽樣分布 下面就樣本平均數(shù)的抽樣分布加以討論 二 正態(tài)總體樣本平均數(shù)的抽樣分布設(shè)有一個總體 總體平均數(shù)為 方差為 2 總體中各變數(shù)為x 將此總體稱為原總體 現(xiàn)從這個總體中隨機抽取含量為n的樣本 樣本平均數(shù)記為 可以設(shè)想 從原總體中可抽出很多甚至無窮多個含量為n的樣本 由這些樣本算得的平均數(shù)有大有小 不盡相同 與原總體平均數(shù) 相比往往表現(xiàn)出不同程度的差異 這種差異是由隨機抽樣造成的 稱為抽樣誤差 顯然 樣本平均數(shù)也是一個隨機變量 其概率分布叫做樣本平均數(shù)的抽樣分布 由樣本平均數(shù)構(gòu)成的總體稱為樣本平均數(shù)的抽樣總體 其平均數(shù)和標(biāo)準(zhǔn)差分別記為和 圖8樣本平均數(shù)的抽樣分布示意圖 是樣本平均數(shù)抽樣總體的標(biāo)準(zhǔn)差 簡稱標(biāo)準(zhǔn)誤 它表示平均數(shù)抽樣誤差的大小 顯然 樣本容量n越大 樣本平均數(shù)的抽樣誤差就越小 即試驗的精確性越高 樣本的代表性也就越強 統(tǒng)計學(xué)上已證明總體的兩個參數(shù)與x總體的兩個參數(shù)有如下關(guān)系 P48 我們可以用一個實例來進行驗證 顯然 由這9個樣本平均數(shù)組成的抽樣總體容量為 Nn 32 9 原總體容量為N 三 樣本平均數(shù)抽樣分布的兩個結(jié)論1 2 中心極限定理告訴我們 不論x變量是連續(xù)型還是離散型 也無論x服從何種分布 一般只要n 30 就可認(rèn)為的分布是正態(tài)的 若x的分布不很偏倚 在n 20時 的分布就

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論