




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第五章第五章 概率論與數(shù)理統(tǒng)計實驗概率論與數(shù)理統(tǒng)計實驗 本章介紹本章介紹MatLab中常用分布的有關函數(shù)中常用分布的有關函數(shù), 大數(shù)定理大數(shù)定理與中心極限定理中的問題與中心極限定理中的問題, 數(shù)據(jù)的描述與直方圖數(shù)據(jù)的描述與直方圖, 參數(shù)參數(shù)估計中的計算估計中的計算, 假設檢驗中的計算假設檢驗中的計算, 回歸中的計算及隨回歸中的計算及隨機模擬等機模擬等. 問題的提出問題的提出 經(jīng)濟的發(fā)展會影響居民的生活經(jīng)濟的發(fā)展會影響居民的生活. 在某個地區(qū)中學生收在某個地區(qū)中學生收收集了收集了 個個 歲學生的身高數(shù)據(jù)歲學生的身高數(shù)據(jù):50170.1 179.0 171.5 173.1 174.1 177.2
2、170.3 176.2163.7 175.4 163.3 179.0 176.5 178.4 165.1 179.4176.3 179.0 173.9 173.7 173.2 172.3 169.3 172.8176.4 163.7 177.0 165.9 166.6 167.4 174.0 174.3184.5 171.9 181.4 164.6 176.4 172.4 180.3 160.5166.2 173.5 171.7167.9 168.7 175.6 179.6 171.617168.1 172.2. 查到查到 年前該學校同齡學生的平均身高為為年前該學校同齡學生的平均身高為為201
3、68cm,近期還調(diào)查了附近近期還調(diào)查了附近 農(nóng)村同齡男生的身高農(nóng)村同齡男生的身高, 計算處均計算處均100值和方差分別為值和方差分別為 和和168.95.4cm, 如何判定當前男生的身高是否發(fā)生明顯變化如何判定當前男生的身高是否發(fā)生明顯變化?一、一、MatLab中常用分布的有關函數(shù)中常用分布的有關函數(shù)常見分布常見分布 二項分布二項分布 泊松分布泊松分布 均勻分布均勻分布 指數(shù)分布指數(shù)分布命令字符命令字符binoPoissunifexp常見分布常見分布 正態(tài)分布正態(tài)分布 分布分布 分布分布 分布分布命令字符命令字符normchi2tF2tF幾種常見分布及其相應函數(shù)表達幾種常見分布及其相應函數(shù)表達
4、函數(shù)函數(shù)概率密度函數(shù)概率密度函數(shù) 分布函數(shù)分布函數(shù)分位數(shù)分位數(shù)均值與方差均值與方差隨機生成數(shù)隨機生成數(shù)字符字符pdfcdfinvstatrnd每種分布提供的五類函數(shù)及其相應函數(shù)表達每種分布提供的五類函數(shù)及其相應函數(shù)表達 1.概率密度函數(shù)(分布律)及調(diào)用格式概率密度函數(shù)(分布律)及調(diào)用格式 MatLab自帶了一些常見分布的概率密度函數(shù)(分布自帶了一些常見分布的概率密度函數(shù)(分布律)律). 函數(shù)名稱及調(diào)用格式見下表函數(shù)名稱及調(diào)用格式見下表:函數(shù)名稱及調(diào)用格式函數(shù)名稱及調(diào)用格式常見分布常見分布二項分布二項分布泊松分布泊松分布均勻分布均勻分布指數(shù)分布指數(shù)分布正態(tài)分布正態(tài)分布 分布分布分布分布分布分布b
5、inopdf x,n,p2tFpoisspdf x,lambdaunipdf x,a,bexppdf x,thetanormpdf x,mu,signachi2pdf x,ntpdf x,nfpdf x,n,m例例 設設200,0.025 ,XB畫出該分布的圖形畫出該分布的圖形.輸入語句輸入語句圖形為圖形為 的分布律圖形的分布律圖形200,0.025B 我們知道我們知道, 當當 較大而較大而 適中時適中時, 二項分布可用二項分布可用nnp泊松分布來近似計算泊松分布來近似計算, 即有公式即有公式e.!kP Xkk我們對上例進行對比我們對上例進行對比.例例 設設 ,XE當當 時時, 畫出指數(shù)函數(shù)畫
6、出指數(shù)函數(shù)1,1,22的密度函數(shù)圖形的密度函數(shù)圖形.程序如下程序如下: 相應的圖形為相應的圖形為例例 設設 220,0.5,0,1 ,0,2XNXNXN畫出相應的的密度函數(shù)圖形畫出相應的的密度函數(shù)圖形.程序如下程序如下: 相應的圖形為相應的圖形為 2.分布函數(shù)的調(diào)用格式分布函數(shù)的調(diào)用格式 我們知道我們知道, 若隨機變量若隨機變量 的分布函數(shù)為的分布函數(shù)為 即即X ,F x .P aXbF bF a ,F xP Xx則則由此由此, 當分布函數(shù)已知時當分布函數(shù)已知時, 可以求出所需的概率可以求出所需的概率.例例 設設0,1 ,XN求求22.5 .PX 標準正態(tài)分布的分布函數(shù)的調(diào)用函數(shù)為標準正態(tài)分布
7、的分布函數(shù)的調(diào)用函數(shù)為normcdf. 輸入語句輸入語句 返回值返回值注注 一般調(diào)用格式一般調(diào)用格式normcdf x,mu,sigma .例例 設設 求求1,4 ,XN04 .PX 因隨機變量并不服從標準正態(tài)分布因隨機變量并不服從標準正態(tài)分布, 由轉換公式由轉換公式P aXb.ba 此時此時 由計算公式由計算公式, 得得1,2,3104,22PX 再輸入命令再輸入命令返回值返回值 例例 設打一次電話所用的時間(單位設打一次電話所用的時間(單位min)服從參數(shù)為)服從參數(shù)為解解 令令 表示電話間那人打電話所占用的時間表示電話間那人打電話所占用的時間, 則由題則由題X 0.20.2e 0, 0
8、0.xxf xx0.2的指數(shù)分布的指數(shù)分布, 如果有人剛好在你前面走進公用電話如果有人剛好在你前面走進公用電話間(假定電話間只有一部電話可供使用)間(假定電話間只有一部電話可供使用), 試求你將等試求你將等待超過待超過5分鐘的概率分鐘的概率; 5分鐘到分鐘到10分鐘之間的概率分鐘之間的概率.0.2XE意知意知: 因此相應的密度函數(shù)為因此相應的密度函數(shù)為因而因而0.25p50.2ed ,xP Xxp510 ,PX 輸入命令輸入命令 返回值返回值 輸入命令輸入命令 返回值返回值 指數(shù)分布函數(shù)的一般調(diào)用格式指數(shù)分布函數(shù)的一般調(diào)用格式1mu1ped .muxmuxpexpcdf(x,mu)即即 輸入語
9、句輸入語句結果為結果為即即:1e d0.6321.xx例例 某人向空中拋一枚質(zhì)地均勻的硬幣某人向空中拋一枚質(zhì)地均勻的硬幣 次次, 求這求這100100次中正面向上的次數(shù)恰好為次中正面向上的次數(shù)恰好為 與小于與小于 次的概率次的概率.4040解解 記記 為為 次中正面向上的次數(shù)次中正面向上的次數(shù), 則則X100100,0.5 .XB所求概率為所求概率為:p40 .P X輸入語句輸入語句概率為概率為再執(zhí)行命令再執(zhí)行命令p40 .P X概率為概率為若還要計算介于若還要計算介于 到到 之間的概率之間的概率, 即計算即計算4020p2040 ,PX再執(zhí)行命令再執(zhí)行命令概率為概率為 以上數(shù)據(jù)你是否發(fā)現(xiàn)問題
10、以上數(shù)據(jù)你是否發(fā)現(xiàn)問題? 如何解釋該問題如何解釋該問題?例例 設設0,1 ,XN求求 33 ;PX 作出其分布函數(shù)的圖形作出其分布函數(shù)的圖形.解解 輸入命令輸入命令概率為概率為該概率即為正態(tài)分布中的該概率即為正態(tài)分布中的 準則準則!3輸入命令輸入命令圖形為圖形為從這個圖形中你能感覺到什么從這個圖形中你能感覺到什么? 3.分位數(shù)的調(diào)用分位數(shù)的調(diào)用 在統(tǒng)計學中在統(tǒng)計學中, 分位數(shù)是個極其重要的概念分位數(shù)是個極其重要的概念.分位數(shù)定義分位數(shù)定義:設設 是隨機變量是隨機變量,X01,滿足滿足 1P Xp 的的 稱為該隨機變量的稱為該隨機變量的上上 分位數(shù)分位數(shù); 滿足滿足p1P Xp 的的 稱為該隨機
11、變量的稱為該隨機變量的下下 分位數(shù)分位數(shù); 滿足滿足p1P Xp 的的 稱為該隨機變量的稱為該隨機變量的雙側雙側 分位數(shù)分位數(shù).p分布名稱分布名稱上上 分位數(shù)調(diào)用格式分位數(shù)調(diào)用格式上上 分位數(shù)分位數(shù)正態(tài)分布正態(tài)分布 分布分布 分布分布 分布分布2tFnorminv(1 alpha)zchi2inv(1 alpha,n) 2n tn,Fn mtinv(1 alpha,n)finv(1 alpha,n,m)幾種常見分布的上幾種常見分布的上 分位數(shù)調(diào)用格式分位數(shù)調(diào)用格式例例 0,1 ,N就就 0.025,0.05,0.10求對應的上求對應的上 分位數(shù)分位數(shù); 求求 并給出該點的具體位置并給出該點的具
12、體位置. 20.16 ,程序為程序為結果為結果為 輸入語句輸入語句結果為結果為程序如下程序如下此時此時 20.1610.6446,圖形為圖形為分位數(shù)點分位數(shù)點 4.隨機數(shù)生成函數(shù)的調(diào)用格式隨機數(shù)生成函數(shù)的調(diào)用格式 泊松分布隨機數(shù)泊松分布隨機數(shù) 格式格式poissrnd lambda,m n 其中其中 為分布中的未知參數(shù)為分布中的未知參數(shù), 即即lambdae,!kP xkk 為矩陣的階數(shù)為矩陣的階數(shù).,m n例例 產(chǎn)生一個產(chǎn)生一個 的矩陣的矩陣, 其列向量是參數(shù)為其列向量是參數(shù)為10000 34的泊松隨機數(shù)的泊松隨機數(shù).輸入命令輸入命令返回值返回值 正態(tài)分布隨機數(shù)正態(tài)分布隨機數(shù) 格式格式nor
13、mrnd mu,sigma,m n例例 生成一個生成一個 的矩陣的矩陣, 其列向量服從其列向量服從10000 30,1 .N輸入命令輸入命令結果為結果為例例 生成一個生成一個 的矩陣的矩陣, 其列向量服從其列向量服從10000 32,1 .N輸入命令輸入命令結果為結果為再計算方差再計算方差返回值返回值 標準正態(tài)分布隨機數(shù)的另一個函數(shù)為標準正態(tài)分布隨機數(shù)的另一個函數(shù)為randn. 在前例中在前例中, 若輸入命令若輸入命令 結果為結果為 均勻分布隨機數(shù)均勻分布隨機數(shù) 格式格式unifrnd, ,a b m n例例 生成一個生成一個 的矩陣的矩陣, 其列向量服從其列向量服從10000 30,1 .U
14、輸入命令輸入命令結果為結果為例例 生成一個生成一個 的矩陣的矩陣, 其列向量服從其列向量服從10000 31,4 .U輸入命令輸入命令結果為結果為 注注 生成服從生成服從 上均勻分布隨機數(shù)還可用函數(shù)上均勻分布隨機數(shù)還可用函數(shù)0,1 rand得到得到.在前例中在前例中, 輸入命令輸入命令返回值返回值結果大致相同結果大致相同.二、大數(shù)定理及中心極限定理中的問題二、大數(shù)定理及中心極限定理中的問題 1.大數(shù)定律大數(shù)定律 設隨機試驗設隨機試驗 事件事件 在在 次試驗中出現(xiàn)次數(shù)為次試驗中出現(xiàn)次數(shù)為,EAn,An若若lim,Annpn則事件則事件 在一次試驗中發(fā)生的概率為在一次試驗中發(fā)生的概率為A .P A
15、p例例 (拋硬幣問題試驗)(拋硬幣問題試驗) 假設拋均勻硬幣出現(xiàn)正面的假設拋均勻硬幣出現(xiàn)正面的概率為概率為 分三種情況驗證硬幣正面出現(xiàn)的頻率與概分三種情況驗證硬幣正面出現(xiàn)的頻率與概0.5,率的關系。率的關系。 三種情況下均進行三種情況下均進行1000組實驗組實驗, 每組實驗每組實驗的次數(shù)分別為的次數(shù)分別為 次次.100,1000,10000程序如下程序如下:疊加后的效果疊加后的效果:結論結論 隨著實驗次數(shù)的增加隨著實驗次數(shù)的增加, 頻率將逐漸趨于穩(wěn)定頻率將逐漸趨于穩(wěn)定. 利用大數(shù)定律利用大數(shù)定律, 還可以以解決下面的問題還可以以解決下面的問題.例例 求圓周率求圓周率. 問題描述問題描述 在矩形
16、在矩形 中任取一個點中任取一個點, 則該點可能落在圓內(nèi)則該點可能落在圓內(nèi), 0,10,1,.DPx yDS其中其中 為為 的面積的面積.DDDD也有可能落在圓外也有可能落在圓外. 由幾何概率知道由幾何概率知道: 落在區(qū)域落在區(qū)域 內(nèi)的內(nèi)的概率為概率為為估計概率為估計概率, 今產(chǎn)生隨機數(shù)今產(chǎn)生隨機數(shù):, 1,2,iix yin其中其中: 且隨機變量且隨機變量 均服從區(qū)間均服從區(qū)間01,01,iixy,X Y22,1.iiiix yDxy由此得到問題的解法由此得到問題的解法.0,1上的均勻分布上的均勻分布. 則則 下面這段程序給下面這段程序給記錄有多少個點在圓內(nèi)記錄有多少個點在圓內(nèi).出了問題的求解
17、方法出了問題的求解方法. 計算結果為計算結果為例例 用大數(shù)定律估計定積分用大數(shù)定律估計定積分120d .xx1201d0.33.3xx 相應程序為相應程序為:積分值積分值 2.中心極限定理及應用中心極限定理及應用 中心極限定理中心極限定理 設設 是一個獨立同分布的隨機變量序列是一個獨立同分布的隨機變量序列,12,nXXX且且2,01,2, ,iiE XD Xi則對則對 任意一個任意一個 , x有有 1lim.niinXnPxxn 中心極限定理的幾何描述中心極限定理的幾何描述 當當 較大時較大時, 近似服從正態(tài)分布近似服從正態(tài)分布.n1niiX程序如下程序如下 相應的圖形為相應的圖形為下圖是下圖
18、是 時泊松分布的圖形時泊松分布的圖形.100n 例例 產(chǎn)生服從二項分布產(chǎn)生服從二項分布 的的 個隨機數(shù)個隨機數(shù), 這里取這里取,B N pn10,0.2,Np計算計算 個隨機數(shù)的和個隨機數(shù)的和nnY以及以及,1nYNnpNnpp并把這個過程重復并把這個過程重復 次次, 用這用這 個個100010001nYNnpNnpp繪制頻率直方圖繪制頻率直方圖, 并討論并討論 與標準正態(tài)分與標準正態(tài)分1nYNnpNnpp布的關系布的關系.程序如下程序如下 例例 (高爾頓釘板實驗)(高爾頓釘板實驗) 高爾頓設計了一個釘板實驗高爾頓設計了一個釘板實驗,圖中每個每個黑點表示釘在板上的一個釘子圖中每個每個黑點表示釘
19、在板上的一個釘子, 它們彼此它們彼此的距離相等的距離相等, 上一層的每一個釘子的水平位置恰好位于上一層的每一個釘子的水平位置恰好位于下一層的兩個釘子的正中間下一層的兩個釘子的正中間. 從入口處放進一個直徑略從入口處放進一個直徑略小于兩個釘子之間的距離的小球小于兩個釘子之間的距離的小球. 在在小球向下降落過程中小球向下降落過程中, 碰到釘子后均碰到釘子后均以以 的概率向左或向右滾下的概率向左或向右滾下, 于是于是0.5又碰到下一層釘子又碰到下一層釘子. 如此進行下去如此進行下去, 直直到滾到底板的一個格子里為止到滾到底板的一個格子里為止. 把許把許多同樣大小的小球不斷從入口處放下多同樣大小的小球
20、不斷從入口處放下, 只要球的數(shù)目相只要球的數(shù)目相當大當大, 它們在底板將堆成近似正態(tài)分布它們在底板將堆成近似正態(tài)分布 的密的密20,N度函數(shù)圖形度函數(shù)圖形.Ox-8 -7 -6 -5 -4 -3 -2 -1 1 2 3 4 5 6 7 81, 1,kX(1,2,16)k kk程序如下程序如下 輸出圖形輸出圖形 例例 擲骰子實驗擲骰子實驗. 擲擲 次同一個均勻的骰子次同一個均勻的骰子, 觀察每個點數(shù)出現(xiàn)的頻率觀察每個點數(shù)出現(xiàn)的頻率.n程序如下程序如下結果為結果為三、數(shù)據(jù)的描述與直方圖三、數(shù)據(jù)的描述與直方圖 1.數(shù)據(jù)描寫的常用命令為數(shù)據(jù)描寫的常用命令為 hist. 功能功能 生成已知數(shù)據(jù)的直方圖生
21、成已知數(shù)據(jù)的直方圖. 格式格式 hist,.x k例例 對服從正態(tài)分布的數(shù)據(jù)生成相應的直方圖對服從正態(tài)分布的數(shù)據(jù)生成相應的直方圖.輸入命令輸入命令圖形為圖形為 mean. 功能功能 對已知數(shù)據(jù)計算相應的均值對已知數(shù)據(jù)計算相應的均值. 格式格式 mean.x例例 生成一個生成一個 的服從均勻分布的矩陣的服從均勻分布的矩陣, 并求相并求相1000 3應的均值應的均值.輸入命令輸入命令結果為結果為 std. 功能功能 對已知數(shù)據(jù)計算相應的標準差對已知數(shù)據(jù)計算相應的標準差. 格式格式 std.x例例 生成生成 個服從個服從 的隨機矩陣的隨機矩陣, 并計算并計算10000 60,1N相應的均值和方差相應
22、的均值和方差.程序如下程序如下 例例 生成生成 個服從個服從 的隨機矩陣的隨機矩陣, 并計算并計算10000 60,1U相應的均值和方差相應的均值和方差.程序如下程序如下 var. 功能功能 對已知數(shù)據(jù)計算相應的標準差對已知數(shù)據(jù)計算相應的標準差. 格式格式 var.x例例 生成生成 個服從個服從 的隨機矩陣的隨機矩陣, 并計算并計算10000 60,1U相應的均值和方差相應的均值和方差.程序如下程序如下 range. 功能功能 計算數(shù)據(jù)列中的最大數(shù)與最小數(shù)的差計算數(shù)據(jù)列中的最大數(shù)與最小數(shù)的差. 格式格式 range.x例例 生成生成 個服從個服從 的數(shù)據(jù)的數(shù)據(jù), 計算相應的均值計算相應的均值,
23、10001,4N方差和極差方差和極差.程序為程序為結果為結果為 hist 功能功能 由已知數(shù)據(jù)作出相應的直方圖由已知數(shù)據(jù)作出相應的直方圖. 格式格式 hist.x例例 生成生成 個服從個服從 的數(shù)據(jù)的數(shù)據(jù), 作出相應的直方作出相應的直方10001,4N圖圖.輸入語句輸入語句圖形為圖形為四、參數(shù)估計中的計算四、參數(shù)估計中的計算 1.點估計的意義點估計的意義參數(shù)參數(shù), 設設 為總體為總體, 為總體的分布為總體的分布, 其中其中 為未知為未知X,f x12,nXXX為來自總體的樣本為來自總體的樣本, 12,nx xx為相應的觀察值為相應的觀察值, 則則12,ng x xx就稱為參數(shù)就稱為參數(shù) 的點估
24、計的點估計. 通常的點估計為通常的點估計為: 均值均值 的點估計的點估計:11.niixxn2211.niixxn2*211.1niixxn及及 方差方差 的點估計的點估計:2無偏估計無偏估計漸進無偏估計漸進無偏估計 2.區(qū)間估計的意義區(qū)間估計的意義參數(shù)參數(shù), 設設 為總體為總體, 為總體的分布為總體的分布, 其中其中 為未知為未知X,f x12,nXXX為來自總體的樣本為來自總體的樣本, 12,nx xx為相應的觀察值為相應的觀察值, 12, 為統(tǒng)計量為統(tǒng)計量, 使得使得121.P 則稱區(qū)間為則稱區(qū)間為 的雙側的雙側 置信區(qū)間置信區(qū)間, 稱為稱為置信水平置信水平.1 常用的區(qū)間估計常用的區(qū)間
25、估計 正態(tài)總體中正態(tài)總體中 已知時已知時 的區(qū)間估計的區(qū)間估計:1/21/2,;xuxunn這里這里 是標準正態(tài)分布的上是標準正態(tài)分布的上 分位數(shù)分位數(shù).1u*1/21/21,1;ssxtnxtnnn 正態(tài)總體中正態(tài)總體中 未知時未知時 的區(qū)間估計的區(qū)間估計: 2211221/ 2/ 2,nnnn這里這里22111niixn為為 的點估計的點估計.2 正態(tài)總體中正態(tài)總體中 已知時已知時 的區(qū)間估計的區(qū)間估計:2 正態(tài)總體中正態(tài)總體中 未知時未知時 的區(qū)間估計的區(qū)間估計:22221/ 2/ 2,.11nSnSnn這里這里2211niiSxxn為為 的點估計的點估計.2 正態(tài)總體中正態(tài)總體中 已知
26、時均值差已知時均值差 的區(qū)間估計的區(qū)間估計:12222212121/21/2,.xyuxyumnmn 正態(tài)總體中正態(tài)總體中 未知時均值差未知時均值差 的區(qū)間估計的區(qū)間估計:121111,wwxykSxykSmnmn這里這里222111.2nnwiiiiSxxyymn 將生成概率密度函數(shù)的調(diào)用函數(shù)中的將生成概率密度函數(shù)的調(diào)用函數(shù)中的 改成改成pdffit即可得到相應的點估計和區(qū)間估計即可得到相應的點估計和區(qū)間估計. 基本格式基本格式mu,sigma,muci,sigmacitypefit, x 2.區(qū)間估計方法區(qū)間估計方法例例 設設8,21,9,95,10,23,11,67,13.56,x 7.
27、99,12.22,15.89是取自某正態(tài)總體的樣本觀察值是取自某正態(tài)總體的樣本觀察值, 求其均值求其均值 和方差和方差的點估計和區(qū)間估計的點估計和區(qū)間估計.輸入命令輸入命令結果為結果為 五、假設檢驗五、假設檢驗 1.假設檢驗的意義假設檢驗的意義 問題問題 甲方生產(chǎn)一種產(chǎn)品的尺寸服從均值甲方生產(chǎn)一種產(chǎn)品的尺寸服從均值 、50標準差標準差 的正態(tài)分布的正態(tài)分布, 按批向乙方供貨(每批的數(shù)按批向乙方供貨(每批的數(shù)1量很大)量很大), 雙方商定每批抽取雙方商定每批抽取 件(樣本)測量其尺寸件(樣本)測量其尺寸,25根據(jù)樣本均值決定乙方是否接受這批產(chǎn)品根據(jù)樣本均值決定乙方是否接受這批產(chǎn)品. 取取 若樣本
28、均值與若樣本均值與 差的絕對值差的絕對值 不超過不超過,x,即即 x時時, 則拒絕該產(chǎn)品則拒絕該產(chǎn)品. 由隨機性由隨機性, 存在這樣的可能存在這樣的可能, 該批產(chǎn)品合格但仍被拒該批產(chǎn)品合格但仍被拒絕絕. 商定水平商定水平 使合格品被錯誤地拒絕的概率不超過使合格品被錯誤地拒絕的概率不超過,. 記樣本的均值記樣本的均值2511,25kkxx則則0,1 ./xNn取取0.05,并使得并使得20.95,/xPn故可取故可取12/20.4,5n即當即當0.4x時(時( ), 則接受該產(chǎn)品則接受該產(chǎn)品, 否則拒絕否則拒絕.49.650.4x 總體均值假設檢驗的一般作法總體均值假設檢驗的一般作法 設抽取一容
29、量為設抽取一容量為 的樣本的樣本, 均值及標準差分別為均值及標準差分別為n, ,x記記 010:;:,HH分別稱為分別稱為原假設原假設和和被選被選假設假設,檢驗的結果為檢驗的結果為: 接受接受 或拒絕或拒絕0H0.H 再設顯著性水平為再設顯著性水平為,當總體方差當總體方差 已知時已知時, 記記2,/xzn則有則有1/21,P zu 從而得到從而得到1/2.zu 這樣的檢驗又稱這樣的檢驗又稱 檢驗檢驗.z 2.MatLab中的檢驗方法中的檢驗方法 格式格式h,sig,ci,zztest,sigma,tiilx mu 說明說明 時表示在顯著性水平為時表示在顯著性水平為 時接受假設時接受假設,h0而
30、當而當 拒絕假設拒絕假設;h1 表示表示 的均值等于的均值等于till0 x;mu 已知時均值已知時均值 的檢驗(的檢驗( 檢驗法)檢驗法)2z 表示表示 的均值大于的均值大于till1x;mu 表示表示 的均值小于的均值小于till1 x.mu 是在假設成立時的概率是在假設成立時的概率;sig 是均值的置信水平為是均值的置信水平為 的置信區(qū)間的置信區(qū)間.ci1 未知時均值未知時均值 的檢驗(的檢驗( 檢驗法)檢驗法)2t 格式格式h,sig,cittest,sigma,tiilx m 注注 檢驗的意義與檢驗的意義與 檢驗法相同檢驗法相同, 此時統(tǒng)計量為此時統(tǒng)計量為z./xmtsn例例 生成正
31、態(tài)總體生成正態(tài)總體 的的 個隨機樣本個隨機樣本, 分別在分別在0,1N1002已知和已知和 未知的兩種情況下未知的兩種情況下, 檢驗檢驗 和和255.25(取(取 ).0.05.程序如下程序如下:相應的結果為相應的結果為:接受檢驗接受檢驗相應的概率相應的概率置信區(qū)間置信區(qū)間相應的相應的 值值z注意到注意到0.9751.96.u對于檢驗對于檢驗 相應的結果為相應的結果為:2,拒絕檢驗拒絕檢驗相應的概率相應的概率置信區(qū)間置信區(qū)間相應的相應的 值值z 未知時的檢驗結果與上平行未知時的檢驗結果與上平行.2 兩個正態(tài)總體均值差的假設檢驗兩個正態(tài)總體均值差的假設檢驗 兩個正態(tài)總體兩個正態(tài)總體 和和 的均值
32、的均值211,N 222,N 1與與 比較的檢驗比較的檢驗, 命令格式為命令格式為2h,sig,cittest, ,sigma,alpha,tiilx y例例 分別生成服從分別生成服從25,1 ,5.15,0.8NN各各 個個100隨機數(shù)隨機數(shù), 檢驗兩個總體均值檢驗兩個總體均值12.程序如下程序如下運行結果表明結果的不穩(wěn)定性運行結果表明結果的不穩(wěn)定性.在上面的問題中在上面的問題中, 若將樣本容量取到若將樣本容量取到1000,n 則檢驗則檢驗結果比較穩(wěn)定結果比較穩(wěn)定. (拒絕的概率較大)(拒絕的概率較大) 正態(tài)總體分布的檢驗正態(tài)總體分布的檢驗 意義意義 檢查已知數(shù)據(jù)是否來自一個正態(tài)總體檢查已知
33、數(shù)據(jù)是否來自一個正態(tài)總體. 格式格式hmormplot( )x 結果分析結果分析 若數(shù)據(jù)來自一個正態(tài)總體若數(shù)據(jù)來自一個正態(tài)總體, 則圖形以直線則圖形以直線形式顯示形式顯示.例例 對問題中的對問題中的 個數(shù)據(jù)個數(shù)據(jù), 作以下判定作以下判定:50該該 個數(shù)據(jù)是否來自一個正態(tài)總體個數(shù)據(jù)是否來自一個正態(tài)總體?50檢驗學生平均身高是否較檢驗學生平均身高是否較 有明顯提高有明顯提高?168cm解解 分別執(zhí)行分別執(zhí)行結果結果通過正態(tài)性檢驗通過正態(tài)性檢驗正態(tài)性檢驗結果正態(tài)性檢驗結果 兩種情況都說明該數(shù)據(jù)來自正態(tài)總體兩種情況都說明該數(shù)據(jù)來自正態(tài)總體. 再輸入再輸入 結果為結果為拒絕假設拒絕假設相應的置信區(qū)間為相
34、應的置信區(qū)間為由此得到結論由此得到結論: 20年后年后, 該地區(qū)同一年齡的學生的平均該地區(qū)同一年齡的學生的平均身高有顯著提高身高有顯著提高.六、回歸分析六、回歸分析 回歸分析是數(shù)據(jù)分析中的一個重要方面回歸分析是數(shù)據(jù)分析中的一個重要方面, 它在控制理它在控制理論論, 風險預測等方面都有很重要的應用風險預測等方面都有很重要的應用. 1.問題的提出問題的提出例例 為了研究彈簧懸掛不同重量為了研究彈簧懸掛不同重量 時長度時長度 的關系的關系, 通通xy過實驗得到下面過實驗得到下面 組數(shù)據(jù)組數(shù)據(jù),6510152025307.258.128.959.9010.9011.80 xy相應的散點圖為相應的散點圖
35、為: 圖形讓我們有理由相信這兩者之間的關系是個線性關圖形讓我們有理由相信這兩者之間的關系是個線性關系系, 由此產(chǎn)生如下問題由此產(chǎn)生如下問題:線性關系的系數(shù)是多少線性關系的系數(shù)是多少? 即要知道即要知道yaxb中的常數(shù)中的常數(shù), ;a b由此得到的常數(shù)的可信度是多少由此得到的常數(shù)的可信度是多少? 2.一元回歸分析一元回歸分析 設有數(shù)據(jù)設有數(shù)據(jù), ,x y關系式關系式 01,Yb xb0,1N稱為稱為一元線性回歸模型一元線性回歸模型, ib稱為稱為回歸系數(shù)回歸系數(shù). 在在MatLab下的回歸實現(xiàn)下的回歸實現(xiàn). 命令格式命令格式b,bint,r,rint,statsregress( , ,alpha
36、)Y x 符號說明符號說明:回歸系數(shù)的點估計回歸系數(shù)的點估計bbint回歸系數(shù)的區(qū)間估計回歸系數(shù)的區(qū)間估計r,rint殘差與殘差的置信區(qū)間殘差與殘差的置信區(qū)間用于回歸分析中的相關數(shù)據(jù)用于回歸分析中的相關數(shù)據(jù)stats states 1相關系數(shù)相關系數(shù)2R states 2F值值, 若若 , 則拒絕則拒絕1,2FFn states 3對應的概率對應的概率, 當概率小于當概率小于 時時, 回歸?;貧w模0,HF越大回歸方程越顯著越大回歸方程越顯著型成功型成功 在原問題中在原問題中, 再輸入再輸入可得到如下結果可得到如下結果:點估計點估計區(qū)間估計區(qū)間估計相關系數(shù)相關系數(shù) 說明回歸方程顯著說明回歸方程顯
37、著21R 說明回歸方程顯著說明回歸方程顯著0.954454.91,47.71.FF00.05p 最后畫出殘差圖最后畫出殘差圖, 輸入輸入圖形為圖形為 應用應用葡萄酒與心臟病問題分析葡萄酒與心臟病問題分析 適量飲用葡萄酒可以預防心臟病適量飲用葡萄酒可以預防心臟病, 下表是下表是 個發(fā)達國個發(fā)達國19家一年的葡萄酒消耗量(每人從所喝的葡萄酒所攝取的家一年的葡萄酒消耗量(每人從所喝的葡萄酒所攝取的酒精升數(shù))以及一年中因心臟病死亡的人數(shù)(每酒精升數(shù))以及一年中因心臟病死亡的人數(shù)(每 萬萬10人數(shù))人數(shù)).國家國家酒精數(shù)酒精數(shù)死亡人數(shù)死亡人數(shù)國家國家酒精數(shù)酒精數(shù)死亡人數(shù)死亡人數(shù)澳大利亞澳大利亞2.521
38、1荷蘭荷蘭1.8167奧地利奧地利3.9167新西蘭新西蘭1.9266比利時比利時2.9131挪威挪威0.8277加拿大加拿大2.4191西班牙西班牙6.586丹麥丹麥2.9220瑞典瑞典0.8207芬蘭芬蘭0.8297瑞士瑞士5.8115法國法國9.171英國英國1.3285冰島冰島0.8211美國美國1.2199愛爾蘭愛爾蘭0.7300德國德國2.7172意大利意大利7.9107要求要求: 由上表做散點圖由上表做散點圖;求回歸系數(shù)的點估計和區(qū)間估計求回歸系數(shù)的點估計和區(qū)間估計;畫出殘差圖畫出殘差圖, 并做殘差分析并做殘差分析;已知某個國家成年人每年平均從葡萄酒中攝取已知某個國家成年人每年平
39、均從葡萄酒中攝取 的的8L酒精酒精, 請預測該國家心臟病的死亡率并作圖請預測該國家心臟病的死亡率并作圖. 散點圖為散點圖為 程序運行后的結果為程序運行后的結果為相關系數(shù)相關系數(shù) 說明回歸方程顯著說明回歸方程顯著21R 說明回歸方程顯著說明回歸方程顯著0.95441,174.45.FF00.05p殘差的置信區(qū)間都包含零點殘差的置信區(qū)間都包含零點, 說明回歸模型較為理想說明回歸模型較為理想.線性函數(shù)曲線圖形與散點圖線性函數(shù)曲線圖形與散點圖 預測預測:由線性函數(shù)由線性函數(shù) 266.1631 23.9506 ,yx得得 874.5615.y例例 合金強度與碳含量關系分析合金強度與碳含量關系分析 研究表
40、明研究表明 合金的強度合金的強度 與含碳量與含碳量 存在某種關系存在某種關系.yx現(xiàn)有一批數(shù)據(jù)現(xiàn)有一批數(shù)據(jù), 試研究這兩者之間的關系試研究這兩者之間的關系.0.100.110.120.130.140.1541.042.545.045.545.047.50.160.170.180.200.220.2449.051.050.055.557.559.5xxyy 首先進行曲線擬合首先進行曲線擬合, 觀察數(shù)據(jù)點的特征觀察數(shù)據(jù)點的特征.輸入語句輸入語句 進行回歸分析進行回歸分析, 輸入語句輸入語句 結果為結果為回歸比較理想回歸比較理想.殘差圖為殘差圖為在殘差圖中在殘差圖中, 第四個數(shù)據(jù)異常第四個數(shù)據(jù)異常,
41、 剔除該數(shù)據(jù)后剔除該數(shù)據(jù)后, 繼續(xù)檢驗繼續(xù)檢驗此時再剔除第五個數(shù)據(jù)后有此時再剔除第五個數(shù)據(jù)后有 相應的數(shù)據(jù)值為相應的數(shù)據(jù)值為:殘差的置信區(qū)間都包含零點殘差的置信區(qū)間都包含零點, 說明回歸模型較為理想說明回歸模型較為理想. 3.可線性化的一元非線性回歸可線性化的一元非線性回歸 某些變量間的關系并非一定是線性關系某些變量間的關系并非一定是線性關系, 所以要考慮所以要考慮將這類關系轉化為線性關系將這類關系轉化為線性關系. 這類關系中比較典型的是這類關系中比較典型的是指數(shù)關系指數(shù)關系.采用的方法是通過取對數(shù)的方法將其轉化采用的方法是通過取對數(shù)的方法將其轉化為線性關系為線性關系.例例 煉鋼過程中需要鋼包
42、來盛鋼水煉鋼過程中需要鋼包來盛鋼水, 由于受到鋼水的侵由于受到鋼水的侵作用作用, 鋼包的容積會不斷擴大鋼包的容積會不斷擴大, 下表給出使用次數(shù)和容下表給出使用次數(shù)和容積增大的數(shù)據(jù)積增大的數(shù)據(jù):次數(shù)次數(shù)23457810容積容積106.42108.20109.58109.50110.00109.93110.49次數(shù)次數(shù)111415161819容積容積110.59110.60110.90110.76111.00111.20鋼包使用次數(shù)和增大容積的數(shù)據(jù)鋼包使用次數(shù)和增大容積的數(shù)據(jù)圖形中可以看出圖形中可以看出, 該曲線具有函數(shù)該曲線具有函數(shù)/eb xya的特征的特征.兩邊取對數(shù)后有兩邊取對數(shù)后有1lnl
43、n/ln.yab xabx以此數(shù)據(jù)作為回歸數(shù)據(jù)以此數(shù)據(jù)作為回歸數(shù)據(jù), 則有則有 殘差圖為殘差圖為 4.多元回歸分析多元回歸分析 所謂多元回歸指的是所謂多元回歸指的是: 設設 12,mxx xx若若變量變量 具有關系具有關系y01 1,mmybb xb x20,N上式即稱為多元回歸模型上式即稱為多元回歸模型. 多元回歸的意義多元回歸的意義 設有設有 個獨立觀察值個獨立觀察值n12,1,2,iiiimy xxxin由上式得由上式得2011,0,iimimiiybb xb xN記記111111212111111,1mmnnmnmnxxybxxybXYbxxyb 則上式可簡寫成則上式可簡寫成2,0,Y
44、XbN再記再記 21,nTiQ bYXbYXb則則 的最小二乘估計為的最小二乘估計為b1.TTbX XX Y221nAiiSyy稱其為觀察值稱其為觀察值 12,ny yy的離差平方和的離差平方和; 上式可以上式可以分解成分解成12222,AAASSS其中其中1221,nAiiSyy2221,nAiiSyy分別稱為分別稱為回歸平方和回歸平方和及及殘差平方和殘差平方和. 模型的有效性檢驗模型的有效性檢驗:012:0,mHbbb可以證明可以證明, 當當 成立時成立時, 有以下結論有以下結論:0H 1222;ASm 與與 相互獨立相互獨立;12AS22AS1222/,1 ./1AASmFF m nmS
45、nm 多元回歸方法多元回歸方法 與一元回歸方法相仿與一元回歸方法相仿, 在在MatLab中中, 進行回歸的命令進行回歸的命令是是:b,bint,r,rint,statsregress( ,alpha)Y X其中數(shù)值的意義與一元回歸數(shù)值相仿其中數(shù)值的意義與一元回歸數(shù)值相仿.例例 血壓、年齡、體質(zhì)指數(shù)與吸煙關系的數(shù)據(jù)分析血壓、年齡、體質(zhì)指數(shù)與吸煙關系的數(shù)據(jù)分析 體質(zhì)指數(shù)體質(zhì)指數(shù)2kg.mWH 下表給出下表給出 個人的血壓和體質(zhì)指數(shù)個人的血壓和體質(zhì)指數(shù), 試建立相應的試建立相應的30如果還有吸煙的習慣如果還有吸煙的習慣, 怎樣在模型中加以考慮怎樣在模型中加以考慮.模型模型;序號序號血壓血壓/mmHg
46、年齡年齡體質(zhì)指數(shù)體質(zhì)指數(shù)吸煙習慣吸煙習慣11443924.2022154731.1131384522.6041454724.0151626525.9161424625.1071706729.5181244219.7091586727.21101545619.30序號序號血壓血壓/mmHg年齡年齡體質(zhì)指數(shù)體質(zhì)指數(shù)吸煙習慣吸煙習慣111626428.01121505625.80131405927.30141103420.10151284221.70161304822.21171354527.40181141818.80191162022.60201241921.50序號序號血壓血壓/mmHg年齡年
47、齡體質(zhì)指數(shù)體質(zhì)指數(shù)吸煙習慣吸煙習慣211363625.00221425026.21231203923.50241202120.30251604427.11261585328.61271446328.30281302922.01291252525.30301756927.41 記血壓為記血壓為 年齡為年齡為 體質(zhì)指數(shù)為體質(zhì)指數(shù)為 吸煙習慣為吸煙習慣為, y1,x2,x3,x則模型為則模型為01 12233.ybb xb xb x 回歸分析后的結果為回歸分析后的結果為模型還是比較理想模型還是比較理想, 殘差圖為殘差圖為說明數(shù)據(jù)中有說明數(shù)據(jù)中有2個異點個異點, 剔除后模型更加完善剔除后模型更加完善.
48、結果為結果為 由此得到回歸方程由此得到回歸方程:12358.5101 0.43032.344910.3065,yxxx上式說明上式說明, 在相同情況下在相同情況下, 吸煙者比不吸引者血壓將升吸煙者比不吸引者血壓將升高高 10.3065(mmHg).七、隨機模擬七、隨機模擬 1.隨機模擬的意義隨機模擬的意義 隨機模擬是一種隨機實驗的方法隨機模擬是一種隨機實驗的方法, 又稱為蒙特卡洛方又稱為蒙特卡洛方法法. 該方法起源于美國第二次世界大戰(zhàn)期間研制原子彈該方法起源于美國第二次世界大戰(zhàn)期間研制原子彈的的“曼哈頓曼哈頓”計劃計劃. 該項目的主持人之一該項目的主持人之一馮馮諾依曼用馳名世界的賭諾依曼用馳名
49、世界的賭城城摩納哥的蒙特卡洛來命名這種方法摩納哥的蒙特卡洛來命名這種方法. 基本思想基本思想 設計某一個隨機實驗設計某一個隨機實驗, 使得某個事件的概率與一個未使得某個事件的概率與一個未知數(shù)有關知數(shù)有關. 對該問題做重復試驗對該問題做重復試驗, 以頻率取代該問題的以頻率取代該問題的概率概率. 從而求得該問題的近似解從而求得該問題的近似解. 2. 的模擬計算的模擬計算例例 設計一個計算方法以得到設計一個計算方法以得到 的近似計算值的近似計算值.方法方法 以普豐投針法進行求解以普豐投針法進行求解.dx 在平面上作出兩條距離為在平面上作出兩條距離為 的平行線的平行線.d取一根長度取一根長度 為為 的
50、針的針, 將針投向該區(qū)域?qū)⑨樛断蛟搮^(qū)域, 以以 表示針的中表示針的中l(wèi) ldx點與最近一條平行線的距離點與最近一條平行線的距離, 表示針與直線的交角表示針與直線的交角, 則有則有:針與直線相交針與直線相交.sin2xl即即sin .2lx由幾何概率知由幾何概率知: 針與平行線相交的概率針與平行線相交的概率 2.m AlPmdOsin .2lx22dx 在在MatLab下下, 建立相應的求解程序建立相應的求解程序.程序如下程序如下 的另一種估算方法的另一種估算方法 問題描述問題描述 在矩形在矩形 中任取一個點中任取一個點, 則該點可能落在圓內(nèi)則該點可能落在圓內(nèi), 0,10,1,.DPx yDS其
51、中其中 為為 的面積的面積.DDDD也有可能落在圓外也有可能落在圓外. 由幾何概率知道由幾何概率知道: 落在區(qū)域落在區(qū)域 內(nèi)的內(nèi)的概率為概率為為估計概率為估計概率, 今產(chǎn)生隨機數(shù)今產(chǎn)生隨機數(shù):, 1,2,iix yin其中其中: 且隨機變量且隨機變量 均服從區(qū)間均服從區(qū)間01,01,iixy,X Y22,1.iiiix yDxy由此得到問題的解法由此得到問題的解法.0,1上的均勻分布上的均勻分布. 則則例例 用用Monte Carlo方法估計定積分方法估計定積分120d .xx120d0.33.xx 相應程序為相應程序為:程序如下程序如下: 問題問題 如何計算積分如何計算積分 ?220dxx程序如下程序如下:例例 用用Monte Carlo方法估計定積分方法估計定積分10sind .xxx相應程序如下相應程序如下:在在MatLab下進行數(shù)值積下進行數(shù)值
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 筆譯服務合同(翻譯中心)-服務合同7篇
- 2025年龍巖貨運資格證考試真題
- 學校燈光改造工程合同
- 勞務派遣合同模本
- 工程分包合同總公司與分公司
- 英語基礎題試卷小學
- 小學課外英語試卷
- 配電控制設備市場分析及競爭策略分析報告
- 簡單的競標合同范本
- 分包木工材料合同范本
- 公對公打款合同
- 抗生素種類歸納分類
- 01-BUFR格式應用指南(試用版)
- 體育測量與評價04心肺功能的測量與評價
- 提高意識風險防范化解能力體會發(fā)言
- 2023年度危險作業(yè)安全監(jiān)護手冊
- 馬克思主義哲學十講
- 催化材料智慧樹知到答案章節(jié)測試2023年南開大學
- 中國故事英文版哪吒英文二篇
- GB/T 9846.1-2004膠合板第1部分:分類
- GB/T 32685-2016工業(yè)用精對苯二甲酸(PTA)
評論
0/150
提交評論