對比試驗的重點培訓資料_第1頁
對比試驗的重點培訓資料_第2頁
對比試驗的重點培訓資料_第3頁
對比試驗的重點培訓資料_第4頁
對比試驗的重點培訓資料_第5頁
已閱讀5頁,還剩63頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、對比試驗的重點培訓資料 1. 統(tǒng)計基礎(chǔ)知識 2. 參數(shù)估計 3. 假設(shè)檢驗 4. 對比實驗報告編寫和練習 課程進程 為什么要學習對比實驗 許多的問題需要就某些參數(shù)作出接受 或拒絕的決定,這說明是一個假設(shè)。 它代表把一個實務(wù)的問題演繹成統(tǒng)計 學上的問題。而這個決策過程便稱為: Hypothesis Testing 我們把實現(xiàn)假設(shè)檢驗的過程成為對比 實驗。 統(tǒng)計學上的測試能為我們就問題作出 客觀解說,相比較以前,我們只能作 出主觀的解說。這是后續(xù)學習內(nèi)容的 基礎(chǔ)。 第一單元 總體(Population):在統(tǒng)計問題中,我們把研究對象的全 體成為總體 個體:構(gòu)成總體的每個成員稱為個體 樣本(Samp

2、le):從總體中抽取部分個體所組成的集合稱 為樣本 樣品:樣本中的個體稱為樣品 樣本容量:樣品的個數(shù)稱為樣本容量,常用n表示 1.1總體和樣本 樣本 隨機樣本(Random sample):能夠被推廣應(yīng)用于更大的 總體的樣本??傮w的每個個體有一個已知的(有時 是相等的)機會被包含在該樣本中。 簡單隨機樣本(Simple random sample): 1、同一性:樣本與總體有同樣的分布 2、獨立性: 如果給定第一個事件,無論它的結(jié)果是什么,第二個 事件的機會都一樣。 1.2統(tǒng)計量和抽樣分 布 統(tǒng)計量:不含未知參數(shù)的樣本函數(shù)稱為統(tǒng)計量。 抽樣分布:統(tǒng)計量的分布稱為抽樣分布。 有序樣本: 是從總體

3、X中隨機抽取的容量為n的樣本,將它們的 觀測值從小到大排序,這便是有序樣本。 n xxxx,., 321 統(tǒng)計推斷過程 統(tǒng)計學的主要任務(wù): 1、研究總體是什么分布? 2、這個總體(即分布)的均值、方差是多少? 樣本統(tǒng)計量 例如:樣本均值 、方差 總體均值、方差總體均值、方差 抽樣 1.2常用統(tǒng)計量 描述中心位置的統(tǒng)計量: 1、眾數(shù)(mode):一個變量的眾數(shù)是指出現(xiàn)次數(shù)最 多的值,不過它不一定唯一。 2、中位數(shù): 3、均值(mean): n i i xx 1 n 1 為偶數(shù) 為奇數(shù) nxxx nxx nn n )1 2 () 2 ( ) 2 1 ( 2 1 1.2常用統(tǒng) 計量 描述數(shù)據(jù)分散程度

4、的統(tǒng)計量: 1、極差(range): 2、方差(variance) 3、標準差(standard deviation): 4、標準誤差(standard error ):是很多不同樣本的 均值的標準差。 5、變異系數(shù): )1()( xxR n 2 1 2 1 1 n i i xx n s 2 ss x s Cv 1.3正態(tài)分 布 正態(tài)分布: xexp x , 2 1 )( 2 2 2 -3-2-10123 ),( 2 N 1.3正態(tài)分 布 標準正態(tài)分布: 它是特殊的正態(tài)分布,服從標準的正態(tài)分布的 隨機變量記為z,概率密度函數(shù)記為(z) 1)(2)( )()()( )(1)( )(1)( aaz

5、P abbzaP aa aazP -3-2-10123 2 2 2 1 )(_) 1 , 0( z ezN 1.3正態(tài)分 布 標準正態(tài)分布的變換: -3-2-10123 x z -3 -2 -1 0 1 2 3 -3-2-10123 1.3正態(tài)分 布 標準正態(tài)分布的分位數(shù): 0.975是隨機變量z不超過1.96的概率 1.96是標準正態(tài)分布N(0,1)的0.975的分位數(shù), 記為z0.975 975. 0)96. 1(zP -3-2-10123 0.975 0.025 1.4常用的抽樣分 布 正態(tài)樣本均值的分布: n NX n X n i i 2 1 , 1 X X 5 x 5 . 2 x 5

6、0 X 50 X 總體分布總體分布 抽樣分布抽樣分布 1.4常用的抽樣分布 t分布: t t 分布與正態(tài)分布的比較分布與正態(tài)分布的比較 不同自由度的不同自由度的t t分布分布 標準正態(tài)分布標準正態(tài)分布 1 nt n s X 1.4常用的抽 樣分布 F分布:設(shè)X1,X2,Xn是來自正態(tài)總體N(1,12 ) 的一個樣本, Y1,Y2,Yn是來自正態(tài)總體 N(2,22 )的一個樣本,且相互獨立,則: 將F(n-1 , m-1 )稱為第一自由度為(n-1),第二自 由度為(m-1)的F分布 1, 1 2 1 2 2 2 2 2 1 2 2 2 1 2 2 2 1 mnF s s s s 1.4常用的抽

7、 樣分布 F分布: 第二單元 2.1點估計 點估計的概念(point estimation): 用樣本均值估計總體均值 用樣本方差估計總體方差 用樣本標準差估計總體標準差 ),.,( 321n xxxx X 22 s s 2.2區(qū)間估計 區(qū)間估計的概念(interval estimate): 置信區(qū)間(confidence interval): ,則稱這種置信區(qū)間為 等尾置信區(qū)間。 ),.,( ),.,( 321 321 nUU nLL xxxx xxxx 1)( UL P 2 )()( UL PP 2.2區(qū)間估計 置信區(qū)間下限值 1 /2/2 x 置信區(qū)間上限值 點估計與區(qū)間估計的區(qū)別: 我

8、是意見是這個值是我是意見是這個值是10, 但誤差在但誤差在1之間。之間。 2.2區(qū)間估計 2.2區(qū)間估計 置信水平的概念: 是的置信水平為1-的置信區(qū)間。它的 含義是能蓋住未知參數(shù)的概率為1-。 置信區(qū)間量化了數(shù)據(jù)的不定性。 , UL 2.2區(qū)間估計 總體均值置信區(qū)間的計算: 已知: 未知: n zx n zx n zx 2 1 2 1 2 1 n s tx n s tx n s tx n nn )1( 2 1 )1( 2 1)1( 2 1 2.2區(qū)間估計 2分布: 方差置信區(qū)間的計算: 1 1 2 2 2 1 2 2 n XX sn n i i 2 1 2 2 2 1 2 1 2 1 , 1

9、 nn snsn 2.2區(qū)間估計 置信區(qū)間的長度: 1、大的樣本產(chǎn)生較短的區(qū)間,小的樣本產(chǎn)生較長的 區(qū)間。 2、低的置信水平產(chǎn)生較短的區(qū)間,高的置信水平產(chǎn) 生較長的區(qū)間。 N=100 N=200 N=300 N=400 N=500 Exercise X= X n Distribution of Sampling Averages X X n 研究草莓醬的重量是多少?研究草莓醬的重量是多少? n 答案:答案: = = 9595的置信區(qū)間的置信區(qū)間 第三單元 3.1假設(shè)檢驗問題 例:草莓醬的凈重服從正態(tài)分布N(,2), 6月 份從產(chǎn)品中隨機抽取50瓶稱重的平均重量為180.5克, 5月份從產(chǎn)品中隨

10、機抽取50瓶稱重的平均重量為179.6 克, ,問從總體上是否重量比原來少了? 1、這不是一個參數(shù)估計問題 2、要求對6-5=0作出回答:是與否 3、這類問題被稱為統(tǒng)計假設(shè)檢驗問題 估計的主要任務(wù)是找參數(shù)值等于幾; 假設(shè)檢驗的興趣主要是看參數(shù)的值是否等于某個特 別感興趣的值 3.2定義假設(shè)H0和Ha H0 要判斷0.9克這個值是否超出了樣本變換所能造成的差 異的范圍,我們先要問一問在總體均值相等的情況下, 樣本均值會發(fā)生什么情況,即是否兩個均值的差等于 0,在統(tǒng)計學上被稱為零假設(shè)(null hypothesis) 之所以用零來修飾假設(shè),其原因是假設(shè)的內(nèi)容總是沒 有差異或沒有改變 0: 560

11、H 3.2定義假設(shè)H0和Ha HA 零假設(shè)其邏輯上的反面假設(shè)是“兩個參數(shù)有區(qū)別”。 這種反面假設(shè)稱為備擇假設(shè)(alternative hypothesis)。 當零假設(shè)所提問的問題被否定時,備擇假設(shè)的答案就 是正確的。如果樣本數(shù)據(jù)能證明對于零假設(shè)提出的問 題應(yīng)該否定,那么我們就拒絕(reject)零假設(shè)而傾 向于備擇假設(shè)。 0: 56 A H 3.3怎樣回答零假設(shè)所提 出的問題 概率:p-值 p-值是當零假設(shè)正確時,得到所觀測的數(shù)據(jù)或更極端 的數(shù)據(jù)的概率,這個概率稱為p-值(p-value)。 當p-值小到以至于幾乎不可能在零假設(shè)正確時出現(xiàn)目 前的觀測數(shù)據(jù)時,我們就拒絕零假設(shè)。 p-值越小,拒

12、 絕零假設(shè)的理由就越充分。 注意: 有時錯誤以為p-值與零假設(shè)對錯的概率有關(guān), 但這是不可能的. p-值指的是關(guān)于數(shù)據(jù)的概率。 p-值告 訴我們在某總體的許多樣本中,某一類數(shù)據(jù)出現(xiàn)的經(jīng) 常程度。 3.3怎樣回答零假設(shè)所提 出的問題 假設(shè)檢驗機制: 為了求p-值,統(tǒng)計理論指出要把觀測到的0.9這個樣本 均值之差變換成標準得分。 標準得分: 0.0 H0 0.0 0.510.9 觀測到的差觀測到的差 樣本均值的差樣本均值的差 標準得分標準得分 2.142 p-值0.0347 3.3怎樣回答零假設(shè)所提 出的問題 假設(shè)檢驗機制: t值等于2.142的概率是0.0347,因此兩個樣本均值之差 等于0.9

13、的概率也是0.0347 ,換句話說就是如果兩總體 均值相等的話,從均值相等的總體中抽取200個樣本 兩兩相減所得之差只有3.47個樣本的樣本均值相差在 0.9,是小概率(0.05)事件,我們拒絕零假設(shè)。 H0 0.0 0.510.9 觀測到的差觀測到的差 樣本均值的差樣本均值的差 標準得分標準得分 2.142 p-值0.0347 3.4顯著水平 顯著水平:我們不是在數(shù)據(jù)收集完畢之后計算p-值, 而是在收集數(shù)據(jù)以前就已經(jīng)確定好的小概率來構(gòu)造一 個區(qū)間。當樣本數(shù)據(jù)落入這個區(qū)間時就拒絕零假設(shè)。 這個小概率 稱為檢驗的顯著水平(significant level), 通常選0.05. 一個檢驗的顯著水

14、平是抽樣所得的數(shù)據(jù)拒絕了本來 是正確的零假設(shè)的概率。 拒絕域:當樣本數(shù)據(jù)落入這個區(qū)間時就拒絕零假設(shè), 那么這個區(qū)間就稱為拒絕域。 臨界值(critical values):拒絕域的邊界所對應(yīng)的標 準得分的值。對于雙邊檢驗,樣本統(tǒng)計量的臨界值是 兩個值。 3.4顯著水平 /2 3.5風險(和) True State H0 TrueH0 False Accept H0Correct Decision Type II Error () Decision Reject H0Type I Error () Correct Decision X= X n Distribution of Sampling

15、Averages X X 3.5和的關(guān) 系 X= X n Distribution of Sampling Averages X X 你不能同時減你不能同時減 少兩類錯誤少兩類錯誤! ! 3.6假設(shè)檢驗的步驟 1、建立假設(shè) 2、數(shù)據(jù)獨立性檢查 3、數(shù)據(jù)正態(tài)性檢查 4、如為One to One問題進行方差的F檢驗 5、計算檢驗統(tǒng)計量 6、給出顯著性水平 ,通常 =0.05 7、定出臨界值,寫出拒絕域 8、判斷 案例1 例:草莓醬的凈重服從正態(tài)分布N (180,22), 5月份隨機抽取50罐稱 重的平均重量為179.6克,問是否符 合標準? 平均凈重: 179.6g 3.7One to Stand

16、ard 的問題 是假設(shè)檢驗的特例: 其中一個 已知 0180: 0180: 5 50 A H H 3.7One to Standard的問題 計算標準得分: 已知時,使用z統(tǒng)計量計算 未知時,使用t統(tǒng)計量計算 雙側(cè)問題 n s x t n x z n 1 /2 3.7One to Standard 的問題 單側(cè)左檢驗 表格值表格值 (臨界值臨界值) 拒絕范圍拒絕范圍 無法拒絕無法拒絕HO Ha: (大于大于) 3.7One to Standard 的問題 單側(cè)右檢驗 拒絕范圍拒絕范圍 無法拒絕無法拒絕HO 表格值表格值 (臨界值臨界值) Ha: (小于小于) 3.7One to Standar

17、d的問題 JMP中的操作 172 174 176 178 180 182 184 186 .01.05.10.25.50.75.90.95.99 -3-2-10123 Normal QuantileTest for Normality Shapiro-Wilk W Test W 0.987388 Prob |z| Prob z Prob |t| Prob t Prob t t Test -1.2213 0.2278 0.8861 0.1139 案例2 例:草莓醬的凈重服從正態(tài)分布N(, 2), 6月份從產(chǎn)品中隨機抽取50瓶稱重 的平均重量為180.5克, 5月份從產(chǎn)品中隨 機抽取50瓶稱重的平

18、均重量為179.6克, , 問從總體上是否重量比原來少了? 假設(shè)檢驗的步驟 1、建立假設(shè) 2、數(shù)據(jù)獨立性檢查 3、數(shù)據(jù)正態(tài)性檢查 4、如為One to One問題進行方差的F檢驗 5、計算檢驗統(tǒng)計量 6、給出顯著性水平 ,通常 =0.05 7、定出臨界值,寫出拒絕域 8、判斷 3.8One to One的問題 建立假設(shè): 0: 0: 65 650 A H H 假設(shè)檢驗的步驟 1、建立假設(shè) 2、數(shù)據(jù)獨立性檢查 3、數(shù)據(jù)正態(tài)性檢查 4、如為One to One問題進行方差的F檢驗 5、計算檢驗統(tǒng)計量 6、給出顯著性水平 ,通常 =0.05 7、定出臨界值,寫出拒絕域 8、判斷 假設(shè)檢驗的步驟 1、

19、建立假設(shè) 2、數(shù)據(jù)獨立性檢查 3、數(shù)據(jù)正態(tài)性檢查 4、如為One to One問題進行方差的F檢驗 5、計算檢驗統(tǒng)計量 6、給出顯著性水平 ,通常 =0.05 7、定出臨界值,寫出拒絕域 8、判斷 3.8One to One的問題 Fcrit F檢驗:檢驗: 1, 1 2 1 2 2 2 2 2 1 2 2 2 1 2 2 2 1 mnF s s s s 假設(shè)檢驗的步驟 1、建立假設(shè) 2、數(shù)據(jù)獨立性檢查 3、數(shù)據(jù)正態(tài)性檢查 4、如為One to One問題進行方差的F檢驗 5、計算檢驗統(tǒng)計量 6、給出顯著性水平 ,通常 =0.05 7、定出臨界值,寫出拒絕域 8、判斷 3.8One to On

20、e的問題 相等時t的計算:Sp為s1 ,s2的加權(quán)平 均,稱為兩個樣本的聯(lián)合方差。 2 11 11 21 2 22 2 11 21 21 2 21 nn snsn s nn s xx t p p nn 3.8One to One的問題 不等時t的計算: 1 2 2 2 2 2 1 1 2 1 2 1 2 2 2 2 1 2 1 2 2 2 1 2 1 21 n ns n ns n s n s f n s n s xx t f 3.8One to One的問 題 假設(shè)檢驗的步驟 1、建立假設(shè) 2、數(shù)據(jù)獨立性檢查 3、數(shù)據(jù)正態(tài)性檢查 4、如為One to One問題進行方差的F檢驗 5、計算檢驗統(tǒng)計量 6、給出顯著性水平 ,通常 =0.05 7、定出臨界值,寫出拒絕域 8、判斷 3.8One to One的問題 /2 假設(shè)檢驗的步驟 1、建立假設(shè) 2、數(shù)據(jù)獨立性檢查 3、數(shù)據(jù)正態(tài)性檢查 4、如為One to One問題進行方差的F檢驗 5、計算檢驗統(tǒng)計量 6、給出顯著性水平 ,通常 =0.05 7、定出臨界值,寫出拒絕域 8、判斷 3.8One to One的問題 因為因為Prob0.0347|t| 0.0347 Assuming equal variances

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論