區(qū)間估計和假設(shè)檢驗_第1頁
區(qū)間估計和假設(shè)檢驗_第2頁
區(qū)間估計和假設(shè)檢驗_第3頁
區(qū)間估計和假設(shè)檢驗_第4頁
區(qū)間估計和假設(shè)檢驗_第5頁
已閱讀5頁,還剩39頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

區(qū)間估計和假設(shè)檢驗第1頁/共44頁2內(nèi)容假設(shè)檢驗2可信區(qū)間與假設(shè)檢驗的關(guān)系3STATA命令4區(qū)間估計1第2頁/共44頁3統(tǒng)計推斷點值估計參數(shù)估計區(qū)間估計統(tǒng)計推斷假設(shè)檢驗:均數(shù)間的比較比例、率的比較

……第3頁/共44頁4點估計和區(qū)間估計參數(shù)估計可以分為點估計和區(qū)間估計點估計就是估計某個參數(shù)為某個數(shù)值(如樣本均數(shù),樣本率等)由于隨機抽樣存在抽樣誤差,由于點估計無法評價抽樣誤差的大小,而區(qū)間估計可以在95%可信度的尺度上估計參數(shù)的范圍,范圍越小,說明參數(shù)估計的抽樣誤差就越小。第4頁/共44頁5總體均數(shù)的95%可信區(qū)間(復(fù)習)假定資料近似服從正態(tài)分布。對于隨機抽樣而言,統(tǒng)計量由和由此得到95%可信區(qū)間第5頁/共44頁6總體均數(shù)的95%可信區(qū)間舉例例如:在某地區(qū)7歲男孩的人群中隨機抽樣,抽取200人,測量其身高,得到樣本均數(shù)為121cm,樣本標準差為5.4cm,估計該地區(qū)7歲男孩人群的平均身高在什么范圍內(nèi)。第6頁/共44頁7(1-)100%可信區(qū)間及其意義更一般而言,可以計算(1-)100%可信區(qū)間,稱(1-)為可信度。可信度的意義:在同一正態(tài)總體中隨機抽100個樣本,每個樣本可以計算一個95%可信區(qū)間,平均有95個可信區(qū)間包含該總體的總體均數(shù)。第7頁/共44頁8(1-)100%可信區(qū)間及其意義可信度1-越大,計算可信區(qū)間包含總體均數(shù)的正確率就越高,但可信區(qū)間的寬度就越大,也就是估計總體均數(shù)的精度就越差。一般而言,95%可信區(qū)間是兼顧了正確性和估計精度,對于特殊情況,可以計算90%可信區(qū)間或99%可信區(qū)間。對于隨機抽樣前而言,隨機抽取一個樣本量為n的樣本,計算95%可信區(qū)間,則該區(qū)間將包含總體均數(shù)的概率為95%,不包含其總體均數(shù)的概率為0.05,這是一個小概率事件,對于一次隨機抽樣而言,一般是不會發(fā)生的,所以95%可信區(qū)間一般被認為就是總體均數(shù)的范圍。第8頁/共44頁9假設(shè)檢驗(hypothesistesting)樣本均數(shù)與總體均數(shù)不等或兩樣本均數(shù)不等,有兩種可能:

由抽樣誤差所致兩者來自不同的總體

假設(shè)檢驗是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計推斷方法第9頁/共44頁10總體μ隨機抽樣不是抽樣誤差?即:0?樣本總體μ0=0?即:抽樣誤差?假設(shè)檢驗問題總體總體總體總體μ0總體不是抽樣誤差?即:0?總體μ0總體=0?即:抽樣誤差?不是抽樣誤差?即:0?總體μ0總體第10頁/共44頁11總體22樣本2隨機抽樣樣本均數(shù)不等的原因統(tǒng)計推斷抽樣誤差即:1=2?樣本1假設(shè)檢驗問題總體11不是抽樣誤差即:12?第11頁/共44頁12假設(shè)檢驗一般思想小概率思想是指小概率事件(P<0.01或P<0.05)在一次試驗中基本上不會發(fā)生。假設(shè)檢驗的反證法思想:先根據(jù)檢驗假設(shè)H0,建立適當?shù)慕y(tǒng)計量,確定假設(shè)H0成立情況下服從某個概率分布,定一個范圍。H0成立時,統(tǒng)計量進入這個范圍,是一個小概率事件(P0.05或更小),H0不成立時,統(tǒng)計量進入這個范圍的概率較大。如果實際的抽樣樣本統(tǒng)計量進入這個范圍,對H0成立情況下是一個小概率事件,一般不會發(fā)生,由此推斷假設(shè)H0不成立。這就是小概率反證法思想。第12頁/共44頁13例如:拋硬幣,通常假設(shè):原假設(shè)H0:正反面出現(xiàn)的機會均等備擇假設(shè)H1:正反面出現(xiàn)機會不均等。如果拋20次只有1次是正面的,你就有理由懷疑原來假設(shè)“正反面出現(xiàn)的機會均等”是錯的(因為H0為真時出現(xiàn)這種情況的概率太小了,而H1為真時,出現(xiàn)這種情況的概率較大)。假設(shè)檢驗基本思想第13頁/共44頁14假設(shè)檢驗的基本步驟第一步:提出檢驗假設(shè)(又稱無效假設(shè)(原假設(shè))nullhypothesis,H0)和備擇假設(shè)(alternativehypothesis,H1)。預(yù)先設(shè)定的檢驗水準(sizeoftest)α為0.05。選擇單雙側(cè)檢驗

H0:假設(shè)兩總體均數(shù)相等,即樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的。H1:假設(shè)兩總體均數(shù)不相等,即兩樣本與總體或樣本與樣本間存在本質(zhì)差異。第14頁/共44頁15第二步:選定統(tǒng)計方法,計算出統(tǒng)計量的大小。根據(jù)資料的類型和特點,可選用t檢驗,則計算t值或其他檢驗方法:秩和檢驗和卡方檢驗等。假設(shè)檢驗的基本步驟第15頁/共44頁16第三步:根據(jù)和統(tǒng)計量在原假設(shè)成立的分布情況把統(tǒng)計量可能的取值范圍分為拒絕范圍和不拒絕范圍根據(jù)統(tǒng)計量計算值位于拒絕范圍內(nèi)還是非拒絕范圍內(nèi)進行統(tǒng)計推斷,也可以根據(jù)統(tǒng)計量取值的大小及其分布確定檢驗假設(shè)成立的可能性P的大小并判斷結(jié)果。假設(shè)檢驗的基本步驟p值指:在由H0所規(guī)定的總體中做隨機抽樣時,獲得等于及大于(或等于及小于)現(xiàn)有統(tǒng)計量的概率第16頁/共44頁17t檢驗對資料的要求t檢驗的應(yīng)用條件:樣本來自正態(tài)總體兩樣本均數(shù)比較時還要求兩個總體方差相等第17頁/共44頁18樣本均數(shù)與總體均數(shù)比較樣本均數(shù)與總體均數(shù)比較的t檢驗實際上是推斷該樣本來自的總體均數(shù)μ與已知的某一總體均數(shù)μ0(常為理論值或標準值)

有無差別。在未知總體中進行抽樣,用樣本均數(shù)與已知總體均數(shù)比較中,需要建立一個檢驗統(tǒng)計量,根據(jù)樣本是否屬于已知總體,該檢驗統(tǒng)計量的分布也不同,由此作出相應(yīng)的統(tǒng)計推斷。第18頁/共44頁19樣本均數(shù)與總體均數(shù)比較舉例說明例:研究目的:山區(qū)健康男性的脈搏均數(shù)是否大于城市成年男性。根據(jù)大量調(diào)查,已知城市健康成年男性的脈搏均數(shù)為72次/分,某醫(yī)生在一山區(qū)隨即抽查了25名健康男性,求得其脈搏均數(shù)為76.2次/分,標準差為6.0次/分,問:是否能據(jù)此認為該山區(qū)成年男性的脈搏均數(shù)高于一般成年男性?第19頁/共44頁20樣本均數(shù)與總體均數(shù)比較第20頁/共44頁21樣本均數(shù)與總體均數(shù)比較

上述樣本均數(shù)與總體均數(shù)不等既可能是抽樣誤差所致,也有可能真是環(huán)境差異的影響,做假設(shè)檢驗。因為σ未知,根據(jù)研究目的:山區(qū)健康男性的脈搏均數(shù)是否大于城市男性,可用t檢驗的單側(cè)檢驗,檢驗過程如下:

1.建立假設(shè)

H0:μ=μ0(本例μ0=72次/分),H1:μ≠μ02.設(shè)置檢驗水準α為0.05。第21頁/共44頁22檢驗統(tǒng)計量2.

設(shè)樣本所在總體為

樣本為

第22頁/共44頁檢驗統(tǒng)計量分布情況和假設(shè)檢驗基本思想23陰影面積為檢驗統(tǒng)計量超出界值的概率H0為真時,t檢驗統(tǒng)計量服從自由度為n-1的t分布,檢驗統(tǒng)計量|t|大于界值t/2的概率為H1為真時,t檢驗統(tǒng)計量|t|大于界值t/2的概率為1-(較大或很大)第23頁/共44頁24樣本均數(shù)與總體均數(shù)比較2.

計算統(tǒng)計量進行樣本均數(shù)與總體均數(shù)比較的t檢驗,計算t值

第24頁/共44頁25樣本均數(shù)與總體均數(shù)比較3.確定臨界值,判斷是否應(yīng)該拒絕當H0:μ=μ0=72次/分為真時,在大多數(shù)情況下,應(yīng)該在72附近,因此應(yīng)該在0附近隨機擺動。

當H1:μ>μ0=72為真,在大多數(shù)情況下,應(yīng)該遠離72,應(yīng)該比較大。注意:X的總體均數(shù)不一定為72,只有H0為真時,X的總體均數(shù)為72,

第25頁/共44頁26樣本均數(shù)與總體均數(shù)比較可以證明:當H0為真時,檢驗統(tǒng)計量服從自由度為24的t分布(即:df=24),查t分布表,臨界值t0.025=2.064,檢驗統(tǒng)計量t=3.5>2.064是小概率事件,對于一次隨機抽樣而言,一般是不會發(fā)生的,因此拒絕H0,并且可以認為該山區(qū)成年男性的脈搏均數(shù)高于一般成年男性。第26頁/共44頁27定義P值和應(yīng)用以下以單側(cè)檢驗為例:即:在H0為真的情況下,檢驗統(tǒng)計量大于樣本計算的統(tǒng)計量數(shù)值的概率。也就是P值=樣本統(tǒng)計量數(shù)值開始的尾部面積(示意見圖)。意義:如果t檢驗統(tǒng)計量樣本值t=t0.05,則P=t0.05尾部的面積,故P=0.05。P值=P(檢驗統(tǒng)計量>檢驗統(tǒng)計量樣本值|H0)第27頁/共44頁28定義P值和應(yīng)用如果檢驗統(tǒng)計量樣本值t>t0.05(u值比U0.05

更右側(cè)),則P=t尾部的面積<t0.05尾部的面積,則P<0.05。如果檢驗統(tǒng)計量樣本值t<t0.05(t值比t0.05

更左側(cè))

,則P=t尾部的面積>t0.05尾部的面積,則P>0.05。

綜合上述,P>檢驗統(tǒng)計量值<臨界值,不拒絕H0

。P<檢驗統(tǒng)計量值>臨界值,拒絕H0。第28頁/共44頁29P值示意圖在實際研究中,只需計算P值并判斷是否P<決定是否拒絕H0。第29頁/共44頁30假設(shè)檢驗的基本步驟若P值小于預(yù)先設(shè)定的檢驗水準α,則H0成立的可能性小,即拒絕H0。若P值不小于預(yù)先設(shè)定的檢驗水準α,則H0成立的可能性還不小,還不能拒絕H0。P值的大小一般可通過查閱相應(yīng)的界值表得到。第30頁/共44頁31定義P值和應(yīng)用

確定概率P,作出判斷以自由度v=n-1查t界值表,0.025<P<0.05拒絕H0,接受H1,可認為該山區(qū)成年健康男性的脈搏均數(shù)高于城市成年健康男性。

第31頁/共44頁32單側(cè)t檢驗H0:=0

H1:>1

=0.05計算t檢驗統(tǒng)計量查t檢驗的單側(cè)界值,如果檢驗統(tǒng)計量則拒絕H0,反之不能拒絕H0。單側(cè)的P值=t分布中大于t的右側(cè)尾部面積第32頁/共44頁33兩類錯誤第33頁/共44頁34兩類錯誤示意圖第34頁/共44頁35檢驗效能H1是真的,實際拒絕H0的概率=1-

稱為Power,又稱為檢驗效能第35頁/共44頁36進行假設(shè)檢驗應(yīng)注意的問題做假設(shè)檢驗之前,應(yīng)注意資料本身是否有可比性。當差別有統(tǒng)計學意義時應(yīng)注意這樣的差別在實際應(yīng)用中有無意義。根據(jù)資料類型和特點選用正確的假設(shè)檢驗方法。根據(jù)專業(yè)及經(jīng)驗確定是選用單側(cè)檢驗還是雙側(cè)檢驗。第36頁/共44頁37進行假設(shè)檢驗應(yīng)注意的問題當檢驗結(jié)果為拒絕無效假設(shè)時,應(yīng)注意有發(fā)生I類錯誤的可能性,即錯誤地拒絕了本身成立的H0,發(fā)生這種錯誤的概率預(yù)先是知道的,即檢驗水準那么大;當檢驗結(jié)果為不拒絕無效假設(shè)時,應(yīng)注意有發(fā)生II類錯誤的可能性,即仍有可能錯誤地接受了本身就不成立的H0,發(fā)生這種錯誤的可能性預(yù)先是不知道的,但與樣本含量和I類錯誤的大小有關(guān)系。當?shù)谝活愬e誤增大時,第二類錯誤減小。第37頁/共44頁38進行假設(shè)檢驗應(yīng)注意的問題判斷結(jié)論時不能絕對化,應(yīng)注意無論接受或拒絕檢驗假設(shè),都有判斷錯誤的可能性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論