




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、對比實驗 聯(lián)想集團有限公司,歡迎光臨6sigma世界,統(tǒng)計基礎(chǔ)知識 參數(shù)估計 假設(shè)檢驗 對比實驗報告編寫和練習(xí),課程進程,為什么要學(xué)習(xí)對比實驗,許多的問題需要就某些參數(shù)作出接受或拒絕的決定,這說明是一個假設(shè)。它代表把一個實務(wù)的問題演繹成統(tǒng)計學(xué)上的問題。而這個決策過程便稱為:Hypothesis Testing 我們把實現(xiàn)假設(shè)檢驗的過程成為對比實驗。 統(tǒng)計學(xué)上的測試能為我們就問題作出客觀解說,相比較以前,我們只能作出主觀的解說。這是后續(xù)學(xué)習(xí)內(nèi)容的基礎(chǔ)。,統(tǒng)計基礎(chǔ)知識,第一單元,總體(Population):在統(tǒng)計問題中,我們把研究對象的全體成為總體 個體:構(gòu)成總體的每個成員稱為個體 樣本(Sam
2、ple):從總體中抽取部分個體所組成的集合稱為樣本 樣品:樣本中的個體稱為樣品 樣本容量:樣品的個數(shù)稱為樣本容量,常用n表示,1.1總體和樣本,樣本,隨機樣本(Random sample):能夠被推廣應(yīng)用于更大的總體的樣本??傮w的每個個體有一個已知的(有時是相等的)機會被包含在該樣本中。 簡單隨機樣本(Simple random sample): 1、同一性:樣本與總體有同樣的分布 2、獨立性: 如果給定第一個事件,無論它的結(jié)果是什么,第二個事件的機會都一樣。,1.2統(tǒng)計量和抽樣分布,統(tǒng)計量:不含未知參數(shù)的樣本函數(shù)稱為統(tǒng)計量。 抽樣分布:統(tǒng)計量的分布稱為抽樣分布。 有序樣本: 是從總體X中隨機
3、抽取的容量為n的樣本,將它們的觀測值從小到大排序,這便是有序樣本。,統(tǒng)計推斷過程,統(tǒng)計學(xué)的主要任務(wù): 1、研究總體是什么分布? 2、這個總體(即分布)的均值、方差是多少?,樣本統(tǒng)計量 例如:樣本均值、方差,總體均值、方差,抽樣,1.2常用統(tǒng)計量,描述中心位置的統(tǒng)計量: 1、眾數(shù)(mode):一個變量的眾數(shù)是指出現(xiàn)次數(shù)最多的值,不過它不一定唯一。 2、中位數(shù): 3、均值(mean):,1.2常用統(tǒng)計量,描述數(shù)據(jù)分散程度的統(tǒng)計量: 1、極差(range): 2、方差(variance) 3、標(biāo)準(zhǔn)差(standard deviation): 4、標(biāo)準(zhǔn)誤差(standard error ):是很多不同
4、樣本的均值的標(biāo)準(zhǔn)差。 5、變異系數(shù):,1.3正態(tài)分布,正態(tài)分布:,1.3正態(tài)分布,標(biāo)準(zhǔn)正態(tài)分布: 它是特殊的正態(tài)分布,服從標(biāo)準(zhǔn)的正態(tài)分布的隨機變量記為z,概率密度函數(shù)記為(z),1.3正態(tài)分布,標(biāo)準(zhǔn)正態(tài)分布的變換:,1.3正態(tài)分布,標(biāo)準(zhǔn)正態(tài)分布的分位數(shù): 0.975是隨機變量z不超過1.96的概率 1.96是標(biāo)準(zhǔn)正態(tài)分布N(0,1)的0.975的分位數(shù),記為z0.975,0.975,0.025,1.4常用的抽樣分布,正態(tài)樣本均值的分布:, =10,X,n = 4,n =16,總體分布,抽樣分布,1.4常用的抽樣分布,t分布:,1.4常用的抽樣分布,F分布:設(shè)X1,X2,Xn是來自正態(tài)總體N(1
5、,12 )的一個樣本, Y1,Y2,Yn是來自正態(tài)總體N(2,22 )的一個樣本,且相互獨立,則: 將F(n-1 , m-1 )稱為第一自由度為(n-1),第二自由度為(m-1)的F分布,1.4常用的抽樣分布,F分布:,F,(1,10),(5,10),(10,10),參數(shù)估計,第二單元,2.1點估計,點估計的概念(point estimation): 用樣本均值估計總體均值 用樣本方差估計總體方差 用樣本標(biāo)準(zhǔn)差估計總體標(biāo)準(zhǔn)差,2.2區(qū)間估計,區(qū)間估計的概念(interval estimate): 置信區(qū)間(confidence interval): ,則稱這種置信區(qū)間為等尾置信區(qū)間。,2.2區(qū)
6、間估計,點估計與區(qū)間估計的區(qū)別:,我是意見是這個值是10, 但誤差在1之間。,2.2區(qū)間估計,2.2區(qū)間估計,置信水平的概念: 是的置信水平為1-的置信區(qū)間。它的含義是能蓋住未知參數(shù)的概率為1-。 置信區(qū)間量化了數(shù)據(jù)的不定性。,2.2區(qū)間估計,總體均值置信區(qū)間的計算: 已知: 未知:,2.2區(qū)間估計,2分布: 方差置信區(qū)間的計算:,2.2區(qū)間估計,置信區(qū)間的長度: 1、大的樣本產(chǎn)生較短的區(qū)間,小的樣本產(chǎn)生較長的區(qū)間。 2、低的置信水平產(chǎn)生較短的區(qū)間,高的置信水平產(chǎn)生較長的區(qū)間。,N=100,N=200,N=300,N=400,N=500,Exercise,研究草莓醬的重量是多少? 答案: =
7、95的置信區(qū)間,假設(shè)檢驗,第三單元,3.1假設(shè)檢驗問題,例:草莓醬的凈重服從正態(tài)分布N(,2), 6月份從產(chǎn)品中隨機抽取50瓶稱重的平均重量為180.5克, 5月份從產(chǎn)品中隨機抽取50瓶稱重的平均重量為179.6克, ,問從總體上是否重量比原來少了? 1、這不是一個參數(shù)估計問題 2、要求對6-5=0作出回答:是與否 3、這類問題被稱為統(tǒng)計假設(shè)檢驗問題 估計的主要任務(wù)是找參數(shù)值等于幾; 假設(shè)檢驗的興趣主要是看參數(shù)的值是否等于某個特別感興趣的值,3.2定義假設(shè)H0和Ha,H0 要判斷0.9克這個值是否超出了樣本變換所能造成的差異的范圍,我們先要問一問在總體均值相等的情況下,樣本均值會發(fā)生什么情況,
8、即是否兩個均值的差等于0,在統(tǒng)計學(xué)上被稱為零假設(shè)(null hypothesis) 之所以用零來修飾假設(shè),其原因是假設(shè)的內(nèi)容總是沒有差異或沒有改變,3.2定義假設(shè)H0和Ha,HA 零假設(shè)其邏輯上的反面假設(shè)是“兩個參數(shù)有區(qū)別”。這種反面假設(shè)稱為備擇假設(shè)(alternative hypothesis)。 當(dāng)零假設(shè)所提問的問題被否定時,備擇假設(shè)的答案就是正確的。如果樣本數(shù)據(jù)能證明對于零假設(shè)提出的問題應(yīng)該否定,那么我們就拒絕(reject)零假設(shè)而傾向于備擇假設(shè)。,3.3怎樣回答零假設(shè)所提出的問題,概率:p-值 p-值是當(dāng)零假設(shè)正確時,得到所觀測的數(shù)據(jù)或更極端的數(shù)據(jù)的概率,這個概率稱為p-值(p-va
9、lue)。 當(dāng)p-值小到以至于幾乎不可能在零假設(shè)正確時出現(xiàn)目前的觀測數(shù)據(jù)時,我們就拒絕零假設(shè)。 p-值越小,拒絕零假設(shè)的理由就越充分。 注意: 有時錯誤以為p-值與零假設(shè)對錯的概率有關(guān),但這是不可能的. p-值指的是關(guān)于數(shù)據(jù)的概率。 p-值告訴我們在某總體的許多樣本中,某一類數(shù)據(jù)出現(xiàn)的經(jīng)常程度。,3.3怎樣回答零假設(shè)所提出的問題,假設(shè)檢驗機制: 為了求p-值,統(tǒng)計理論指出要把觀測到的0.9這個樣本均值之差變換成標(biāo)準(zhǔn)得分。 標(biāo)準(zhǔn)得分:,0.0,2.142 p-值0.0347,3.3怎樣回答零假設(shè)所提出的問題,假設(shè)檢驗機制: t值等于2.142的概率是0.0347,因此兩個樣本均值之差等于0.9的
10、概率也是0.0347 ,換句話說就是如果兩總體均值相等的話,從均值相等的總體中抽取200個樣本兩兩相減所得之差只有3.47個樣本的樣本均值相差在0.9,是小概率(0.05)事件,我們拒絕零假設(shè)。,2.142 p-值0.0347,3.4顯著水平,顯著水平:我們不是在數(shù)據(jù)收集完畢之后計算p-值,而是在收集數(shù)據(jù)以前就已經(jīng)確定好的小概率來構(gòu)造一個區(qū)間。當(dāng)樣本數(shù)據(jù)落入這個區(qū)間時就拒絕零假設(shè)。這個小概率 稱為檢驗的顯著水平(significant level),通常選0.05. 一個檢驗的顯著水平是抽樣所得的數(shù)據(jù)拒絕了本來是正確的零假設(shè)的概率。 拒絕域:當(dāng)樣本數(shù)據(jù)落入這個區(qū)間時就拒絕零假設(shè),那么這個區(qū)間就
11、稱為拒絕域。 臨界值(critical values):拒絕域的邊界所對應(yīng)的標(biāo)準(zhǔn)得分的值。對于雙邊檢驗,樣本統(tǒng)計量的臨界值是兩個值。,3.4顯著水平,3.5風(fēng)險(和),3.5和的關(guān)系,你不能同時減少兩類錯誤!,3.6假設(shè)檢驗的步驟,1、建立假設(shè) 2、數(shù)據(jù)獨立性檢查 3、數(shù)據(jù)正態(tài)性檢查 4、如為One to One問題進行方差的F檢驗 5、計算檢驗統(tǒng)計量 6、給出顯著性水平 ,通常 =0.05 7、定出臨界值,寫出拒絕域 8、判斷,案例1,例:草莓醬的凈重服從正態(tài)分布N(180,22), 5月份隨機抽取50罐稱重的平均重量為179.6克,問是否符合標(biāo)準(zhǔn)?,平均凈重:179.6g,3.7One t
12、o Standard的問題,是假設(shè)檢驗的特例: 其中一個 已知,3.7One to Standard的問題,計算標(biāo)準(zhǔn)得分: 已知時,使用z統(tǒng)計量計算 未知時,使用t統(tǒng)計量計算 雙側(cè)問題,Ho值,臨界值,臨界值,a/2,a/2,樣本統(tǒng)計量,拒絕域,拒絕域,接受域,抽樣分布,1 - ,置信水平,3.7One to Standard的問題,單側(cè)左檢驗,3.7One to Standard的問題,單側(cè)右檢驗,3.7One to Standard的問題,JMP中的操作,3.7One to Standard的問題,JMP中的操作,3.7One to Standard的問題,JMP中的操作,案例2,例:草莓
13、醬的凈重服從正態(tài)分布N(,2), 6月份從產(chǎn)品中隨機抽取50瓶稱重的平均重量為180.5克, 5月份從產(chǎn)品中隨機抽取50瓶稱重的平均重量為179.6克, ,問從總體上是否重量比原來少了?,假設(shè)檢驗的步驟,1、建立假設(shè) 2、數(shù)據(jù)獨立性檢查 3、數(shù)據(jù)正態(tài)性檢查 4、如為One to One問題進行方差的F檢驗 5、計算檢驗統(tǒng)計量 6、給出顯著性水平 ,通常 =0.05 7、定出臨界值,寫出拒絕域 8、判斷,3.8One to One的問題,建立假設(shè):,假設(shè)檢驗的步驟,1、建立假設(shè) 2、數(shù)據(jù)獨立性檢查 3、數(shù)據(jù)正態(tài)性檢查 4、如為One to One問題進行方差的F檢驗 5、計算檢驗統(tǒng)計量 6、給出
14、顯著性水平 ,通常 =0.05 7、定出臨界值,寫出拒絕域 8、判斷,假設(shè)檢驗的步驟,1、建立假設(shè) 2、數(shù)據(jù)獨立性檢查 3、數(shù)據(jù)正態(tài)性檢查 4、如為One to One問題進行方差的F檢驗 5、計算檢驗統(tǒng)計量 6、給出顯著性水平 ,通常 =0.05 7、定出臨界值,寫出拒絕域 8、判斷,3.8One to One的問題,F檢驗:,假設(shè)檢驗的步驟,1、建立假設(shè) 2、數(shù)據(jù)獨立性檢查 3、數(shù)據(jù)正態(tài)性檢查 4、如為One to One問題進行方差的F檢驗 5、計算檢驗統(tǒng)計量 6、給出顯著性水平 ,通常 =0.05 7、定出臨界值,寫出拒絕域 8、判斷,3.8One to One的問題,相等時t的計算:
15、Sp為s1 ,s2的加權(quán)平均,稱為兩個樣本的聯(lián)合方差。,3.8One to One的問題,不等時t的計算:,3.8One to One的問題,假設(shè)檢驗的步驟,1、建立假設(shè) 2、數(shù)據(jù)獨立性檢查 3、數(shù)據(jù)正態(tài)性檢查 4、如為One to One問題進行方差的F檢驗 5、計算檢驗統(tǒng)計量 6、給出顯著性水平 ,通常 =0.05 7、定出臨界值,寫出拒絕域 8、判斷,3.8One to One的問題,假設(shè)檢驗的步驟,1、建立假設(shè) 2、數(shù)據(jù)獨立性檢查 3、數(shù)據(jù)正態(tài)性檢查 4、如為One to One問題進行方差的F檢驗 5、計算檢驗統(tǒng)計量 6、給出顯著性水平 ,通常 =0.05 7、定出臨界值,寫出拒絕域 8、判斷,3.8One to One的問題,因為Prob0.03470.05,所以我們拒絕零假設(shè),接受備擇假設(shè)!,3.8One to One的問題,不等,實驗和報告編寫,第四單元,練習(xí)(30分鐘),例:兩家供應(yīng)商的硬盤性能指標(biāo)數(shù)據(jù),問是否這兩個供應(yīng)商有顯著差異?,謝謝大家!,課程開發(fā)人員:孟繁一、高武,附錄,假設(shè)檢驗術(shù)語,零假設(shè) (Ho) -不存在變化或差異的命題。如果沒有充分的證據(jù)拒絕它,就假設(shè)這一命題是真的。 備擇假設(shè)(Ha) - 存在變化或差異的命題。如果拒絕Ho,則認為這一命題是真的。 一類錯誤 - 當(dāng)Ho 實際上為真
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 專家聘用合同范例
- 書刊設(shè)計合同范例
- 人員解除合同范例
- 農(nóng)村房子贈予合同范例
- 公告類合同范例
- 東軟股合同范例
- 業(yè)主家用車出租合同范例
- 公路工程咨詢合同范例
- 農(nóng)家別墅買賣合同范本
- DSE和木霉降解木質(zhì)纖維素殘渣及其發(fā)酵產(chǎn)物對菘藍促生抗旱研究
- 電子商務(wù)法律法規(guī)高職PPT完整全套教學(xué)課件
- HydroPro操作手冊說明書
- 四年級數(shù)學(xué)下冊-小數(shù)加減法的簡便運算課件
- 7S目視化管理標(biāo)準(zhǔn)
- keba教程科控編程手冊
- 附件4:項目成本管控要素集成庫20200713
- 設(shè)備維修作業(yè)安全操作規(guī)程匯總
- 海南碼頭防波堤工程施工組織設(shè)計圖文并茂
- 《企業(yè)內(nèi)部審計現(xiàn)狀及完善建議-以公牛集團為例【開題報告+正文】》14000字
- 小學(xué)“新時代好少年”推薦表
- GB 7101-2022食品安全國家標(biāo)準(zhǔn)飲料
評論
0/150
提交評論