第四講估計與檢驗_第1頁
第四講估計與檢驗_第2頁
第四講估計與檢驗_第3頁
第四講估計與檢驗_第4頁
第四講估計與檢驗_第5頁
已閱讀5頁,還剩36頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第四講估計與檢驗第1頁,共41頁,2023年,2月20日,星期三一、區(qū)間估計第2頁,共41頁,2023年,2月20日,星期三總體均值區(qū)間估計總體均值置信水平為100(1-α)%的置信區(qū)間為:注意:1、估計成立的條件是:樣本必須是隨機、獨立的;2、使用t分布表時,要求總體必須是近似正態(tài)的,需對樣本作正態(tài)性檢驗;3、置信水平不是概率(置信區(qū)間是確定的而不是隨機的),可以認為以置信水平(如95%)相信總體均值在執(zhí)行區(qū)間內;或是說,置信水平這一計算方法可以使得置信區(qū)間以95%的概率覆蓋總體均值。大樣本下:方差未知:或小樣本下第3頁,共41頁,2023年,2月20日,星期三例1某小組隨機抽樣調查了250戶家庭的年收入,樣本均值為9.8萬,樣本標準差為4.8萬。小組給出一個置信區(qū)間(9.2,10.4),但未給出置信水平。1、問該區(qū)間的置信水平?(試比較兩種分布的情形)2、小組給出解釋:該地區(qū)家庭平均年收入為9.2~10.4的概率為95%,這種說法對嗎?3、若同時有10個小組在進行相同的獨立調查,問9個或以上小組得出的95%置信區(qū)間都覆蓋總體均值的概率是多少?提示:可以將每一個區(qū)間是否覆蓋總體均值作為一次Bernoulli試驗。令Y為覆蓋總體均值的全金屬區(qū)間數(shù),顯然Y~Bin(10,0.95)第4頁,共41頁,2023年,2月20日,星期三單側置信區(qū)間總體均值100(1-α)%的置信區(qū)間:下限為:上限為:第5頁,共41頁,2023年,2月20日,星期三例21、同例1,問總體均值95%置信區(qū)間的下限?當置信水平提高時,估計的可靠性將(提高or降低)?精確性將(提高or降低)?第6頁,共41頁,2023年,2月20日,星期三比例置信區(qū)間若X~Bin(n,p),由中心極限定理傳統(tǒng)方法是以樣本p代替總體p進行區(qū)間估計,最近的研究表明,Agresti–Coull區(qū)間有改進,置信水平為100(1-α)%的置信區(qū)間計算公式如下:若下限小于0則用0代替,上限大于1則用1代替。第7頁,共41頁,2023年,2月20日,星期三例3:某企業(yè)從所購買的元件中隨機抽檢了150份,有5份不合格,估計不合格品率95%置信區(qū)間。(試用傳統(tǒng)方法和Agresti–Coull方法分別計算比較)第8頁,共41頁,2023年,2月20日,星期三根據(jù)指定精度確定所需樣本數(shù)為獲得總體平均100(1-α)%的置信區(qū)間,且要求區(qū)間寬度不超過D時,則需從這個總體中抽取隨機樣本數(shù)為:總體方差未知的兩階段法:階段1:從總體中抽取n1個先期樣本(如n1=30),計算這個樣本的方差S2;階段2:以S2替代總體未知方差計算所需樣本數(shù)n,若n>n1,再補抽n–n1

份樣本。另:請同學們自行計算確定總體比例所需樣本數(shù)。第9頁,共41頁,2023年,2月20日,星期三例4例1中,若要求所獲得總體均值99%置信區(qū)間的偏差為(+-)0.5萬元,問至少要調查多少樣本?例3中,若要求所獲得總體不合格品率99%置信區(qū)間的偏差為(+-)0.5%萬元,問至少要抽取多少樣本?第10頁,共41頁,2023年,2月20日,星期三兩個總體均值之差的置信區(qū)間根據(jù)第三講的知識,請同學們自行給出大樣本情形下的計算公式。小樣本不能使用中心極限定理,可以使用t分布,計算公式:第11頁,共41頁,2023年,2月20日,星期三例5欲比較A、B兩醫(yī)院住院病人的住院天數(shù)。隨機抽取A醫(yī)院64個住院病歷,計算平均住院天數(shù)為6.54天,標準差為1.2;隨機抽取B醫(yī)院81個住院病歷,計算平均住院天數(shù)為6.24天,標準差為0.96。則兩個醫(yī)院住院病人平均住院天數(shù)差的95%置信區(qū)間是多少?有人認為兩個醫(yī)院病人的住院時間沒有差異,與上述數(shù)據(jù)矛盾嗎?為什么?第12頁,共41頁,2023年,2月20日,星期三例6隨機抽取A、B兩地空氣污染指數(shù)PSI,如下表所示A150146132164126128B9510411299109假設兩地空氣污染指數(shù)都服從正態(tài)分布,試估計兩地PSI平均差95%置信區(qū)間。第13頁,共41頁,2023年,2月20日,星期三例7有文獻給出一項對睡眠習慣的研究結果。在一個由87個成年人組成的樣本中,每天躺在床上的平均時間為7.70小時(不管處于清醒狀態(tài)還是睡眠狀態(tài)),標準差為1.02小時,其中處于睡眠狀態(tài)的平均時間為7.06小時,標準差為1.11小時。所以躺在床上的平均清醒時間為7.70-7.06=0.64小時。有可能建立平均清醒時間95%的置信區(qū)間嗎?如果行,是多少?如不行,為什么?第14頁,共41頁,2023年,2月20日,星期三例8:數(shù)據(jù)對的置信區(qū)間某輪胎制造商希望比較新、舊材料制成的輪胎的磨損情況。從每種輪胎中各選一個隨機安裝在10輛前驅汽車左、右前輪上。4萬公里后測量磨損情況如下(單位:mm):12345678910新材料4.355.004.215.035.714.614.706.033.804.70舊材料4.194.624.044.725.524.264.276.243.464.50差值0.160.380.170.310.190.350.43-0.210.340.2問新、舊材料輪胎磨損差值95%的置信區(qū)間。第15頁,共41頁,2023年,2月20日,星期三兩個總體比例之差的置信區(qū)間若X~Bin(nx,px),Y~Bin(ny,py),則px-py

置信水平為100(1-α)%的置信區(qū)間的計算方法為:傳統(tǒng)方法:改進方法:第16頁,共41頁,2023年,2月20日,星期三例9重復交易次數(shù)是顧客滿意度的一個很好的度量。某企業(yè)隨機抽取了今年的120個交易賬戶,有56個訂購次數(shù)在2次以上。從去年抽取80個樣本,有30個訂購次數(shù)在2次以上。試計算這兩年中訂購次數(shù)在2次以上顧客的比例之差的置信水平為95%的置信區(qū)間。第17頁,共41頁,2023年,2月20日,星期三二、假設檢驗第18頁,共41頁,2023年,2月20日,星期三問題1某校新入學學生被隨機分配進入高一兩個班,人數(shù)都是70人,化學課分別由2個老師任教。期末考試的平均分分別是70.5和72.4分,標準差都為5.4分。其中第一個班有一個學生想找第2個班的老師補課,他的選擇有道理嗎?第19頁,共41頁,2023年,2月20日,星期三分析每一次考試都包含很多隨機因素;老師1可以認為自己的教學水平(以學生考試平均分來測量)為72.4分;老師1可以認為老師2的教學水平其實和自己是一樣的,這次考試的結果是因為自己班級發(fā)揮不好而對方班級發(fā)揮的好。對于這種具有隨機性的結果的證明只能尋求統(tǒng)計意義上的檢驗。第20頁,共41頁,2023年,2月20日,星期三統(tǒng)計檢驗檢驗1:老師1的教學水平達不到72.4。零假設(nullhypothesis,也稱原假設)H0:1≥72.4,備擇假設(alternatehypothesis)

H1:1<72.4。檢驗2:老師1與老師2的教學水平有差異。零假設H0:1

-2=0,備擇假設H1:1–2

≠0。第21頁,共41頁,2023年,2月20日,星期三假設檢驗的概念假設:對總體參數(shù)包括總體均值、比例、方差等的一種看法。假設檢驗:事先對總體參數(shù)或分布形式作出某種假設,然后利用樣本信息來判斷原假設是否成立。通常依據(jù)統(tǒng)計上的小概率不顯著原理而對0假設作反證。0假設:待檢驗的假設,表示為H0備擇假設:與0假設對立的假設表示為H1第22頁,共41頁,2023年,2月20日,星期三假設檢驗思想示例圖因此我們拒絕假設

=50樣本均值抽樣分布這個值不像我們應該得到的樣本均值20H0如果這是總體的真實均值

μ=50第23頁,共41頁,2023年,2月20日,星期三P-值(P-Value)首先我們假設0假設成立,P-值是觀測到的隨機樣本與0假設不一致的強度的度量。計算步驟(以均值檢驗為例):在0假設H0為真的條件下,求樣本均值的分布,這個分布稱為的0分布;在0假設為真的條件下,計算觀察值與H0不一致(大于、小于或不等于)的概率即為P-值。當P-值充分?。ㄈ?/p>

),我們就放棄H0,而認為H1成立。判斷閾值稱為顯著水平(significantlevel),當P<,此時我們稱在顯著水平下拒絕原假設。第24頁,共41頁,2023年,2月20日,星期三總體均值統(tǒng)計檢驗對總體和樣本的假設同前。對形如H0:≤

0,或H0:≥0,或H0:=0的0假設進行檢驗,檢驗統(tǒng)計量為:P-值就是對應分布密度曲線下某一區(qū)域的面積,分別對應的是單尾檢驗(右側面積),單尾檢驗(左側面積),雙尾檢驗(雙側面積)。大樣本下:方差未知:或小樣本下第25頁,共41頁,2023年,2月20日,星期三總體比例的統(tǒng)計檢驗對總體和樣本的假設同前。對形如H0:p

p0,或H0:p

≥p0

,或H0:p

=p0

的0假設進行檢驗,若np0和n(1-p0)都大于10,則有檢驗統(tǒng)計量為:P-值計算同上。第26頁,共41頁,2023年,2月20日,星期三例10某有線電視服務商在免費提供了一個月的某付費頻道后進行了調查。他們隨機抽取了400個家庭組成樣本,其中25個家庭愿意付費續(xù)訂該頻道。該公司能夠得出結論認為該地區(qū)有超過5%的家庭愿意付費觀看該頻道嗎?第27頁,共41頁,2023年,2月20日,星期三兩個總體均值差的檢驗對總體和樣本的假設同前。對形如H0:X-Y

≤D0

,或H0:X-Y≥D0

,或

H0:X-Y=D0

的0假設進行檢驗,檢驗統(tǒng)計量為:大樣本下:方差未知:或小樣本下或當兩總體方差近似相等時,可以采用合并樣本方差的方法:第28頁,共41頁,2023年,2月20日,星期三續(xù)P-值計算同上。第29頁,共41頁,2023年,2月20日,星期三兩個總體比例差的檢驗設X~Bin(nx,px)和Y~Bin(ny,py)相互獨立且nx和ny都很大。對形如H0:pX-pY

≤0,或H0:pX-pY≥0,或

H0:pX-pY=0

的0假設進行檢驗,檢驗統(tǒng)計量為:P-值計算同上。第30頁,共41頁,2023年,2月20日,星期三例11為確定某燃油添加劑是否具有節(jié)油的功能,某司機記錄了自己的油耗。6箱油的平均油耗為7.4升/百公里,標準差為0.63;使用添加劑后的4箱油平均油耗為7.0升/百公里,標準差為0.75。添加劑價格為200元,問是否有必要使用該添加劑?此外,該實驗是否存在瑕疵?第31頁,共41頁,2023年,2月20日,星期三例12某課題組調查企業(yè)項目風險管理的方法。45個建筑企業(yè)樣本中有17家企業(yè)采用了風險轉移的方法,38個IT類企業(yè)中有16家企業(yè)采用了風險轉移的方法。你能認為IT企業(yè)風險轉移比例高于建筑企業(yè)嗎?第32頁,共41頁,2023年,2月20日,星期三關于P-值P-值不能證明0假設的真實性;(科學方法本質上是否定虛假)例:某建筑工程師要為橋墩混凝土選定水泥,其抗壓強度必須大于0

,在對某一品牌水泥進行多次試驗后測度平均值和方差,然后進行假設檢驗。若他采用的假設檢驗為:H0:≥0,H1:<0

,計算得到P-值為0.168,他能否采用這一品牌水泥?P-值顯著也不一定有現(xiàn)實的意義。例:調查2X200個某一學校兩個專業(yè)學生畢業(yè)一年后平均月工資分別為1587元和1590元,方差都為100,這兩個專業(yè)的畢業(yè)生工資差異顯著嗎?這種差異有實際意義嗎?第33頁,共41頁,2023年,2月20日,星期三關于顯著性水平a的值在固定的a水平下所作判斷可能導致兩類錯誤:第I類錯誤H0為真時拒絕了H0第II類錯誤H0為假時接受了H0犯第I類錯誤的概率不會大于a。通常我們選取a足夠小,但我們也希望確定第II類錯誤是可控的,于是定義功效(Power)如下:功效=1-P(第II類錯誤)功效需在采樣之前確定。第34頁,共41頁,2023年,2月20日,星期三多項分布與c2檢驗頻數(shù)分析以下資料是從某工廠搜集而來的缺勤數(shù)。在0.05的顯著水平之下,試判定一周內每天的缺勤率是否有差異。星期次數(shù)期望星期一12089星期二

4589星期三

6089星期四

9089星期五13089合計445445第35頁,共41頁,2023年,2月20日,星期三檢驗H0:p1=p2=……p5=1/5,當各單元格的期望次數(shù)﹙或理論次數(shù)﹚不小于5時,在0假設下有統(tǒng)計量其中:Oi為觀察值,Ei為期望值第36頁,共41頁,2023年,2月20日,星期三列聯(lián)表(contingencytab

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論