版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、Chapter 8 Tests of Hypotheses for Means and Proportions8.1 Testing Hypotheses About Population Parameters P.2741. 某零件供應(yīng)商將大批的零件賣給某裝配廠,如果每一批貨品當(dāng)中有瑕疵之比例少於8%,則予以接受。但由於,如果每批均逐一檢查,則成本花費相當(dāng)大,故實務(wù)乃採抽樣檢驗(sampling inspection)方式。如果抽樣檢驗的結(jié)果符合前述之條件,則決定購買該批零件。2. 某一新出品的洗衣肥皂,其廣告宣稱去污力超過舊式之洗衣肥皂。在此個案中,我們欲檢定此廣告是否誇大,於是由一堆髒衣
2、物一半以舊式肥皂洗滌,另一半以新式肥皂洗滌,檢查是否新式肥皂之去污力比舊式肥皂強。3. 檢定一項統(tǒng)計假設(shè)是近似於法庭審判的程序。在審理一位竊盜犯時,法官必須判斷出清白或者無罪。當(dāng)審判開始時,被告是假設(shè)為清白的。檢察官蒐集與提出所有有利的證據(jù)以企圖推翻無罪的假設(shè)及因而獲得定罪。結(jié)論:假如有足夠證據(jù)推翻清白,法庭將拒絕清白的假設(shè),並宣告有罪。假如檢察官無足夠的證據(jù)證明罪行,法庭將判其為無罪,非其無罪為真。這些觀念被用來檢定第七章所討論的四種母體參數(shù): P.276a) b) c) d) 8.2 A Statistical Test of Hypothesis統(tǒng)計檢定1. 假設(shè)檢定(hypothesi
3、s testing)是指先對母體特性作一適當(dāng)?shù)拿枋?,然後利用抽出來的隨機(jī)樣本推論(檢定)此描述是否正確,此過程或統(tǒng)計方法便稱為假設(shè)檢定。2. 統(tǒng)計假設(shè)(statistical hypothesis)係指有關(guān)母體特性之述句(假設(shè))。而此述句為真(true)或偽(false)則可由此母體抽樣所得之訊息予以評斷。3. 統(tǒng)計研究者總是從假設(shè)虛無假設(shè)是對的開始,再利用抽樣資料去判斷證據(jù)是否偏向於對立假設(shè),並下這二種結(jié)論中的一個:a) 拒絕H0,並接受Ha是對的。b) 接受H0是對的。4. 欲否定者,稱為虛無假設(shè)(null hypothesis);符號H0表示。P.2755. 欲接受者,稱為對立假設(shè)(al
4、ternative hypothesis),符號H1表示。P.2756. 設(shè)立假設(shè)的準(zhǔn)則:準(zhǔn)則1:若錯誤地拒絕H0,其後果較嚴(yán)重者;此時便表示我們所建立的是合適的。準(zhǔn)則2:以某人(單位、機(jī)構(gòu)、企業(yè)等)的宣稱(或他人的主張)作為H0。即假定他人的主張是真實的。與公司立場不同準(zhǔn)則3:當(dāng)目標(biāo)在於以樣本觀察值支持我們的主張時,作為H1。與公司立場相同準(zhǔn)則4:問題中若出現(xiàn)是否顯著地時,則作為H1。¨ 統(tǒng)計檢定由五個部分組成: P.2761) A null hypothesis(虛無假設(shè)), denoted by the symbol H02) An alternative hypothesis
5、(對立假設(shè)), denoted by the symbol Ha3) A test statistic檢定統(tǒng)計量4) A rejection region拒絕域5) Conclusion結(jié)論Example 8.1 P.276希望證明加州建築工人的每小時平均工資與全國平均值$14有差異。即想要拒絕虛無假設(shè)加州建築工人的每小時平均工資為$14。-準(zhǔn)則_Example 8.2 P.277在機(jī)器上做簡單調(diào)整,將降低該研磨製程所產(chǎn)生的不良率。-準(zhǔn)則_¨ 母體(population)是指所研究的項目或事物之總體。¨ 樣本(sample)是指抽取自母體用來做為分析的部分。¨ 參
6、數(shù)(parameter)是指用來說明母體的特徵,它可由母體資料計算而得。¨ 統(tǒng)計量(statistic)是指用來說明取自母體的樣本之特徵,它可由樣本資料計算而得。¨ 檢定統(tǒng)計量的機(jī)率分配之圖形將被分割成二個區(qū)域:一為拒絕域(region of rejection)或稱為棄卻域(critical region),另一為非拒絕域或接受域(acceptance region)。也就是說,為了判斷H0是否為真,我們必須先決定有關(guān)的母體分配之臨界值(critical value),此臨界值區(qū)隔拒絕域和非拒絕域。拒絕域拒絕域臨界值x的假設(shè)值臨界值非拒絕域two-tailed test
7、of hypothesis 雙尾假設(shè)檢定 (如上圖)one-tailed test of hypothesis 單尾假設(shè)檢定拒絕或接受虛無假設(shè)的決策是基於由有關(guān)母體抽出樣本中所包含的資訊來判斷。test statistic 檢定統(tǒng)計量8.3 A Test of Hypothesis for a Population Mean消費者基金會關(guān)心某公司生產(chǎn)麥片裝填重量不足的情況。因此,想知道是否有證據(jù)顯示平均每盒裝填重量低於368克?H0:表示所獲得的結(jié)論是生產(chǎn)過程適當(dāng)(即x = 368克)H1:表示所獲得的結(jié)論是平均裝填量偏離368克假設(shè)樣本平均數(shù)為367.5克,因為該值接近假設(shè)值368克,我們將
8、傾向於推論母體平均數(shù)沒有改變(即x = 368克)。如果樣本平均數(shù)是320克,因為樣本平均數(shù)320克遠(yuǎn)離假設(shè)值368克,則直覺認(rèn)為母體平均數(shù)不為368克(即x 368克)。不幸地,決策過程並非都是這麼明確。如何才算是靠近或遠(yuǎn)離母體平均數(shù),常因人而異。因此,統(tǒng)計假設(shè)檢定採用定量的決策過程,可解決上述問題,而不因人而異了。欲達(dá)到此目的,先須決定樣本統(tǒng)計量(即樣本平均數(shù))的抽樣分配,然後計算適當(dāng)?shù)臋z定統(tǒng)計量(test statistic)之值。此檢定統(tǒng)計量可用來量測樣本值接近假設(shè)值的程度,並且其機(jī)率分配常常是眾所皆知的分配(譬如常態(tài)、t分配等)。1. Consider a random sample
9、 of n measurements drawn from a population that has mean and standard deviation . We would like to test a hypothesis of the form,為之假設(shè)值。其對立假設(shè)為 P. 2802. provides a value of the parameter to be tested , that is, equals . P. 2803. gives a range of possible values for . P. 2804. The sample mean is the be
10、st estimate of the actual value of , which is presently in question. P. 2805. Those values of that are extremely small / large would imply意味著 that is larger than hypothesized. Hence, we will reject if is “too small / large.” P. 280.The Large-Sample Test P.280When the sample size n is large, the samp
11、ling distribution of is approximately normal:The mean is:The standard deviation is:If the alternative hypothesis is , the probability of rejecting the null hypothesis , when it is true, is equal to the area under the normal curve lying above the rejection region. Thus, if we want , we would reject w
12、hen is more than 1.645 standard deviations to the right of . P.280雙尾檢定1) 臨界值檢定拒絕域拒絕域接受域z1-Z/20C1C20Z/20z1P-值ZP-值Z2) Z-檢定3) P-值檢定4) 信賴區(qū)間檢定The interval for is . If does not fall in the interval, we would be inclined傾向 to reject .Example 8.4Definition: Power of a statistical test統(tǒng)計檢定力 P.283真正母體平均數(shù)與假設(shè)平均
13、數(shù)之間的差距愈大,則該檢定的檢定力亦愈大。A graph of , the probability of rejecting when, in fact, is false, as a function of the true value of the parameter of interest is called the power curve for the statistical test. 統(tǒng)計檢定力曲線 p. 283We would like to be small and the power to be large.Example 8.5 Figure 8.4 Table 8.3
14、p. 284Figure 8.5 Note that the power of the test increases as the distance between and increases.真實值愈接近假設(shè)值,則偵測出差異的檢定力就愈低。實驗者必須決定和的值,以衡量所願意容忍的可能犯錯誤之風(fēng)險,再參考檢定力曲線來選擇樣本大小。The Small-Sample Test: When the sample size is small and the population standard deviation is unknown.1. vs. 2. 檢定統(tǒng)計量3. 檢定規(guī)則4. 計算5. 結(jié)論
15、雙尾檢定1) 臨界值檢定拒絕域拒絕域接受域t1-t/20C1C20t/20t1P-值tP-值t2) Z-檢定3) P-值檢定4) 信賴區(qū)間檢定The interval for is . If does not fall in the interval, we would be inclined傾向 to reject .Example 8.6Example 8.78.4 Another Way to Report the Results of Statistical Tests: p-Values顯著機(jī)率值(又稱P值; P value):由樣本所計算的檢定統(tǒng)計量值,並由統(tǒng)計量的機(jī)率分配查出能觀
16、察到該值或比該值更極端的所有可能值的機(jī)率Definition:一統(tǒng)計檢定的p-值或觀察顯著水準(zhǔn)observed significance level是被拒絕的值中最小的。在統(tǒng)計檢定的觀察值下若被拒絕, 則實際風(fēng)險為犯了型I錯誤。P-值為測量反對的證據(jù)強度。是檢定統(tǒng)計量之值所計算出的右邊實際面積。一個很小的p-值指出檢定統(tǒng)計量的觀測值遠(yuǎn)離著假設(shè)的值。這對是錯的且被拒絕(reject ),提供了強大的證據(jù)。一個大的p-值指出檢定統(tǒng)計量的觀測值落在假設(shè)的值不遠(yuǎn)處,且不支持拒絕的假設(shè)(do not reject )。Definition:若p-值比已給的顯著水準(zhǔn)更小時,則可被拒絕,其結(jié)果在顯著水準(zhǔn)下有
17、統(tǒng)計顯著性。雙尾p-值是計算出的檢定統(tǒng)計量之值所對應(yīng)出實際的兩倍尾端面積。Example 8.8 P. 294Figure 8.8Example 8.9 P. 295Figure 8.98.5 Tests Concerning the Difference Between Two Population Means1. Large-Sample Statistical Test for 2. The small-sample test for a difference between population means is based on the assumption that both po
18、pulations are normally distributed and, in addition, that they possess equal variances8.6 A Paired-Difference Test for 8.7 A Large-Sample Test of Hypothesis for a Binomial Proportion8.8 A Large-Sample Test of Hypothesis for the Difference Between Two Binomial Proportions8.9 Inferences Concerning Pop
19、ulation Variances8.10 Some Comments on the Theory of Tests of Hypotheses實驗者可以藉由使用適當(dāng)?shù)?值控制拒絕 之錯誤的風(fēng)險,另一方面, 值受樣本大小和在對實驗者實質(zhì)重要的檢定下之參數(shù)值影響。當(dāng)這訊息無法獲得時,實驗者必須決定選一充足的樣本大小,以期望此樣本能包含充分訊息足以拒絕虛無假設(shè)。若樣本沒有提供充分證據(jù)去拒絕 ,實驗者因未知 值而可能希望陳述結(jié)論以“資料不支持拒絕 ;do not reject ”而不說接受;accept 。一些實驗者寧願使用觀測的p-值去計算作為拒絕決策之樣本訊息強度,這些值通常是用電腦產(chǎn)生且時常使用在統(tǒng)計結(jié)果的報告上。例如:報表結(jié)果意義p-值 > 0.05表示以 = 5%,結(jié)果為不顯著。p-值 < 0.05表示0.01 < p-值 < 0.05,以 = 5%,結(jié)果為顯著。p-值 < 0.01表示0.001 < p
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024版二手房獨家授權(quán)銷售合同3篇
- 2025年度出租車充電樁建設(shè)與維護(hù)合同3篇
- 二零二五年酒店宴會部經(jīng)理招聘與服務(wù)質(zhì)量提升合同3篇
- 二零二五版房產(chǎn)中介傭金結(jié)算及售后服務(wù)合同范本3篇
- 2024年船舶制造與維修合同
- 2025年新型紗窗產(chǎn)品研發(fā)與知識產(chǎn)權(quán)保護(hù)協(xié)議2篇
- 2025年散裝糧食海運協(xié)議6篇
- 專業(yè)質(zhì)量檢測服務(wù)工程協(xié)議樣本版
- 二零二五版合同部合同管理流程再造與效率提升合同3篇
- 二零二五年度消防設(shè)施安全檢測與維護(hù)服務(wù)協(xié)議
- 2024年高標(biāo)準(zhǔn)農(nóng)田建設(shè)土地承包服務(wù)協(xié)議3篇
- 閱讀理解(專項訓(xùn)練)-2024-2025學(xué)年湘少版英語六年級上冊
- 2024年全國統(tǒng)一高考英語試卷(新課標(biāo)Ⅰ卷)含答案
- 2024年認(rèn)證行業(yè)法律法規(guī)及認(rèn)證基礎(chǔ)知識 CCAA年度確認(rèn) 試題與答案
- 小品《天宮賀歲》臺詞劇本手稿
- 醫(yī)院患者傷口換藥操作課件
- 欠薪強制執(zhí)行申請書
- 礦山年中期開采重點規(guī)劃
- 資源庫建設(shè)項目技術(shù)規(guī)范匯編0716印刷版
- GC2級壓力管道安裝質(zhì)量保證體系文件編寫提綱
- 預(yù)應(yīng)力混凝土簡支小箱梁大作業(yè)計算書
評論
0/150
提交評論