版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第五章 參數(shù)估計基礎(chǔ),第五章,由抽樣造成的樣本均數(shù)與總體均數(shù)及樣本均數(shù)之間的差別稱為均數(shù)的抽樣誤差。,第一節(jié) 均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤,一、均數(shù)的抽樣誤差,抽樣誤差:,抽樣研究中,樣本統(tǒng)計量與總體參數(shù)間的差別及統(tǒng)計量與統(tǒng)計量間的差別稱為抽樣誤差。,均數(shù)的抽樣誤差:,二、標(biāo)準(zhǔn)誤的計算 【例5-1】假設(shè)已知100名(總體)正常成年男性紅細(xì)胞數(shù)的均值為5.001012/L,標(biāo)準(zhǔn)差為0.431012/L,現(xiàn)從該總體中進(jìn)行隨機抽樣,每次抽取10名正常成年男子,并測得他們的紅細(xì)胞數(shù),最終共抽取100份樣本,并計算出每份樣本的均數(shù)。,將一百個樣本均數(shù)看成一批資料或為一個新樣本,我們可以計算其均數(shù)與標(biāo)準(zhǔn)差,均數(shù)
2、值為4.9097,標(biāo)準(zhǔn)差為0.1350。將樣本均數(shù)的“標(biāo)準(zhǔn)差”定名為均數(shù)的標(biāo)準(zhǔn)誤,簡稱標(biāo)準(zhǔn)誤,以區(qū)別于通常所說的標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)差表示個體值的變異程度,而標(biāo)準(zhǔn)誤則說明樣本均數(shù)的變異程度,兩者不能混淆。,將第1號樣本的標(biāo)準(zhǔn)差及例數(shù)代入式(5-2),得,(5-2),(5-1),100個樣本均數(shù)的頻數(shù)分布圖,標(biāo)準(zhǔn)誤,統(tǒng)計量的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤(如均數(shù)標(biāo)準(zhǔn)誤、率的標(biāo)準(zhǔn)誤);均數(shù)的標(biāo)準(zhǔn)誤是描述均數(shù)抽樣誤差大小的統(tǒng)計指標(biāo)。,標(biāo)準(zhǔn)誤的用途:,1.衡量樣本均數(shù)的可靠性。 2.結(jié)合樣本均數(shù)和正態(tài)分布曲線下的面積 分布規(guī)律,估計總體均數(shù)的置信區(qū)間。 3.用于均數(shù)的假設(shè)檢驗。,思考題:標(biāo)準(zhǔn)誤和標(biāo)準(zhǔn)差的區(qū)別?,則 zN(0
3、,1),第二節(jié) t 分布,則 zN(0,1);,(, ),作 z 轉(zhuǎn)換,xN(,),作 轉(zhuǎn)換,,一、 t 分布 的概念,t 變量為用以推斷總體均數(shù)的樣本檢驗統(tǒng)計量。t 分布只有1個參數(shù)自由度n1。,1.當(dāng) 已知時,可作 z 轉(zhuǎn)換,推斷總體均數(shù)的樣本檢驗統(tǒng)計量為z。,2.當(dāng) 未知時,可作正態(tài)變量 的 t 轉(zhuǎn)換,,二、t 分布的特征與t界值表,圖5-1 不同自由度t分布的概率密度曲線,3.當(dāng) 時,t 分布逼近z 分布;,特征:,1. 單峰分布,以0為中心,左右對稱;,2. 越小,t 值越分散,t 分布的峰部越矮而尾部翹得越高;,4.t 分布曲線下的面積有一定規(guī)律。,雙側(cè):,單側(cè):,圖5-2 = 9
4、時單側(cè)(a)與雙側(cè)(b)分布曲線下尾部面積,第三節(jié) 總體均數(shù)的估計,【例5-2】 隨機抽取某地100名16歲男孩,測得其體重均數(shù)為48.65kg,標(biāo)準(zhǔn)差為15.23kg,試估計該地16歲男孩體重的總體均數(shù)。,一、點估計(point estimation) 用樣本統(tǒng)計量作為總體參數(shù)的點值估計,二、區(qū)間估計(interval estimation),結(jié)合樣本統(tǒng)計量和抽樣誤差在一定的可信度100(1-)%下估計總體參數(shù)所在的范圍,稱為總體參數(shù)的置信區(qū)間(confidence interval ,CI)。,置信區(qū)間的概念,1.Z分布法,正態(tài)分布原理計算總體均數(shù)的1-可信區(qū)間為:,-z/2,z/2,(1
5、)已知(小樣本要求資料服從正態(tài)),均數(shù)置信區(qū)間的計算,(2) 未知,但樣本例數(shù)n足夠大時(50),注意:若總體不服從正態(tài)分布時,一般是很難確定其總體中的未知參數(shù),但當(dāng)樣本量n很大時,我們可利用中心極限定理按上式對其總計均數(shù)作出近似的區(qū)間估計。,2. t分布法(未知),根據(jù)t分布原理, P(-t/2,t t/2,)=1-,-t/2,t/2,總體均數(shù)(1-)可信區(qū)間計算公式如下:,對于例5-2,因為總體標(biāo)準(zhǔn)差未知,所以采用公式(5-6)計算總體均數(shù)的95%置信區(qū)間為:,48.651.9841.523=48.653.02 =(45.63,51.67)kg,95可信區(qū)間 可以認(rèn)為是每抽100個由樣本含
6、量相等的樣本算得的置信區(qū)間,平均有95個置信區(qū)間會包括總體均數(shù),只有5個置信區(qū)間不會包括總體均數(shù)。,置信區(qū)間的涵義,(1)置信區(qū)間 包括總體均數(shù)的可能性為95; (2)總體均數(shù)落在置信區(qū)間 范圍內(nèi)的可能性為95; (3)通過樣本資料計算出的95置信區(qū)間19.623.2kg包括總體均數(shù)的可能性為95。,判斷:,置信區(qū)間的兩個要素:,1.準(zhǔn)確度,2.精密度,反映在可信度1-的大小上,從準(zhǔn)確度的角度,愈接近1越好,如99%可信區(qū)間比95%的好;,它反映在區(qū)間的寬度上,即區(qū)間越窄越好,均數(shù)可信區(qū)間與參考值范圍的區(qū)別,1.含義: 均數(shù)可信區(qū)間用于估計總體參數(shù),而參考值范圍用于估計變量值的分布范圍。,2.
7、計算公式: 均數(shù)可信區(qū)間的計算公式是基于統(tǒng)計量的抽樣分布,而參考值范圍的計算基于變量值的分布。,Bernoulli試驗,以A表示所感興趣的事件,A事件發(fā)生稱為“成功”,不發(fā)生稱為“失敗”。相應(yīng)的這類試驗稱作為“成敗型”試驗或Bernoulli試驗。,一、 二項分布,第四節(jié) 二項分布和Poisson分布,必須滿足下列三條件: (1)每次試驗結(jié)果只能是兩個互斥結(jié)果之 一(A或非A)。 (2)每次試驗的條件不變,每次試驗結(jié)果 A事件發(fā)生的概率為常數(shù)。 (3)各次試驗獨立,即每次試驗出現(xiàn)事件 A的概率與前面各次試驗出現(xiàn)的結(jié)果無關(guān)。,概率的運算法則,乘法法則:幾個相互獨立事件的乘積(同時發(fā)生)的概率等于
8、各獨立事件概率之積: P(A1A2An) = P(A1)P(A2) P(An ) 可加性:互不相容事件 A1、A2、An(任一次試驗至多一個出現(xiàn))的和(至少一個發(fā)生)的概率等于各事件發(fā)生的概率之和: P(A1+A2 +An ) = P(A1)+P(A2)+ +P(An ),二項分布成功次數(shù)的概率分布,某實驗中小白鼠染毒后死亡概率:為0.7,則生存概率為: 1- =0.3, 故對一只小白鼠進(jìn)行實驗的結(jié)果為:,死(概率為 )或 生(概率為1- );,對二只小白鼠(甲乙)進(jìn)行實驗的結(jié)果為:,甲乙均死概率為2,甲死乙生概率為(1- ),乙死甲生概率為(1- ) ,甲乙均生概率為(1- )2,概率相加得
9、: 2+ (1- )+(1- ) +(1- )2 = +(1- )2,對三只小白鼠(甲乙丙)進(jìn)行實驗的結(jié)果為:,表 3只白鼠各種實驗結(jié)果及其發(fā)生概率,概率相加得: +(1- )3,對n只小白鼠進(jìn)行實驗,所有可能結(jié)果的概率相加得:,n+Cn1 (1- )n-1+Cnx x(1- )n-x+(1- )n = +(1- )n,n次試驗中事件A出現(xiàn)的次數(shù)為x的概率是:,,k=0,1,2, n,記為 x B(n, ),表5-3 接種3 人可能出現(xiàn)不適反應(yīng)的人數(shù)及其概率,二項分布的性質(zhì):,(1) 二項分布的概率之和等于1,即,(2)單側(cè)累積概率,至少有m例陽性的概率(上側(cè)累積概率),至多有m例陽性的概率(
10、下側(cè)累積概率),(3) 二項分布的均數(shù)和標(biāo)準(zhǔn)差 若xB(n,),則 x 的總體均數(shù) = n, x的總體方差 2 n (1 ) x的標(biāo)準(zhǔn)差,(4) 二項分布的正態(tài)近似性,二項分布圖形的形狀取決于 和n 的大??;,二項分布的圖形有如下特征:,當(dāng)=0.5時,無論n的大小,均為對稱分布;,當(dāng) 0.5 , n較小時為偏態(tài)分布, n較大時逼近正態(tài)分布。,n=5 =0.3,n=10 =0.3,n=20 =0.3,當(dāng)不接近于0或1,n不是很小,n5且n(1) 5時,二項分布近似正態(tài)分布,有,因此,二項分布的正態(tài)近似拓寬了二項分布的 應(yīng)用范圍,應(yīng)用十分方便。,樣本率p的總體均數(shù):,當(dāng)樣本含量較大,總體陽性率不接
11、近與0,也不接近于1時,樣本中的陽性數(shù)近似正態(tài)分布N(n, ),樣本陽性率也近似正態(tài)分布N(,p),故有,樣本率p的標(biāo)準(zhǔn)差:,樣本率的分布和正態(tài)近似,例補1:根據(jù)以往經(jīng)驗,新生兒染色體異常率一般為1,某醫(yī)院觀察了當(dāng)?shù)?00名新生兒,只有l(wèi)例染色體異常,問該地新生兒染色體異常率是否低于一般? H0:=0.01 H1:0.05,按=0.05水準(zhǔn)尚不能拒絕H0,尚不能認(rèn)為該地新生兒染色體異常率低于一般。,Poisson分布更多地專用于研究單位時間、單位面積、單位空間,單位人群內(nèi)某罕見事件發(fā)生次數(shù)的分布。 如某種細(xì)菌在單位容積空氣或水中出現(xiàn)的情況,某段時間特定人群中某種惡性腫瘤患者的分布或出生缺陷的發(fā)
12、病情況,放射性物質(zhì)在單位時間內(nèi)的放射次數(shù),單位空間某種昆蟲數(shù)的分布等等。,二、泊松分布,用于描述事件出現(xiàn)概率很小而樣本含量或試驗次數(shù)很大的隨機變量的概率分布。理論上可以證明二項分布當(dāng)n很大而很小時的極限分布是泊松分布。由二項分布的概率公式可推導(dǎo)出泊松分布的概率計算公式為:,泊松分布的概率函數(shù)為:,記作,k=0,1,2,,例5-4 某地新生兒先天性心臟病的發(fā)病率為9,該地100名新生兒中有3人患先天性心臟病的人數(shù)概率有多大?,將n=100, =9 代入公式得 :,=0.9,=0.049,即該地100名新生兒中有3人患先天性心臟病的人數(shù)概率為49。,(程序),泊松分布的性質(zhì),1.泊松分布的均數(shù)和方
13、差,=2,2.泊松分布的可加性,隨機變量x1,x2,xk相互獨立,分別服從參數(shù)(均數(shù))為1,2,k的泊松分布,則,也服從泊松分布,參數(shù) = 1+ 2+ k,3.泊松分布的正態(tài)近似,若已知參數(shù),可計算不同x取值的概率,以x為橫坐標(biāo),可能取值的概率P為縱坐標(biāo),可繪制泊松分布的圖形。,當(dāng)足夠大時,泊松分布趨向于正態(tài)分布。一般 20,即可認(rèn)為泊松分布近似于正態(tài)分布。,=3,=5,=10,=20,例補2: 據(jù)以往大量觀察得某溶液中平均每毫升有細(xì)菌3個。某研究者想了解該溶液放在5冰箱中3天,溶液中細(xì)菌是否會增長。他采取已放在5冰箱中3天的該溶液1毫升,測得細(xì)菌5個,請作統(tǒng)計推斷。,P(X5),故不拒絕H0
14、,即不能認(rèn)為該溶液在5冰箱中放置3天,會引起溶液中的細(xì)菌數(shù)增長。,第五節(jié) 總體率的估計,【例5-5】某市疾控中心對該市郊區(qū)200名小學(xué)生進(jìn)行貧血的檢測,結(jié)果發(fā)現(xiàn)有80名小學(xué)生貧血,檢出率為40.0%,則認(rèn)為該市郊區(qū)小學(xué)生貧血率為40.0%。,【問題】,(1)這是什么資料? (2)該研究屬于何種設(shè)計方案? (3)以此次抽樣得到小學(xué)生貧血率40.0%來代表該市郊區(qū)小學(xué)生貧血率是否合適? (4)怎樣估計該市郊區(qū)小學(xué)生貧血率?,一、率的抽樣誤差與標(biāo)準(zhǔn)誤,由于抽樣而引起的樣本率與總體率及樣本率間的差異稱為率的抽樣誤差,與均數(shù)的抽樣誤差可以用均數(shù)的標(biāo)準(zhǔn)誤度量一樣,率的抽樣誤差的大小亦可以用率的標(biāo)準(zhǔn)誤來度量
15、。,率的標(biāo)準(zhǔn)誤由下式計算,例6-6,n200,p=0.40,代入公式得sp=0.035。,二、總體率的估計,當(dāng)樣本例數(shù)較?。╪50),特別是p接近于0或1時,根據(jù)二項分布的原理確定總體率的可信區(qū)間。1970年,Miettinen根據(jù)二項分布和F分布的關(guān)系,導(dǎo)出了總體率的可信區(qū)間算法。,精確概率法或查表法,【例5-6】 2003年46月某醫(yī)院重癥監(jiān)護病房收治重癥SARS患者38人,其中死亡12人,求SARS病死概率的置信區(qū)間。,查附表3 ,n=38,x=12,在x與n的縱橫交叉處,得到SARS病死概率的95%置信區(qū)間為18%49% 。,正態(tài)近似法,當(dāng)樣本例數(shù)n較大,p和1p均不太小,如np和n(
16、1p)均大于5??傮w率的1的可信區(qū)間為(pz/2 Sp,pz/2Sp),即該鄉(xiāng)鎮(zhèn)小學(xué)生貧血率的95置信區(qū)間為(33.2,46.8)。,例5-5,n=200比較大,p=0.4, np=80, n(1-p)=120,均大于5,,最佳選擇題 1. 描述均數(shù)抽樣誤差大小的統(tǒng)計指標(biāo)是( )。 A.標(biāo)準(zhǔn)差 B.方差 C.均數(shù)的標(biāo)準(zhǔn)誤 D.變異系數(shù) E.離均差平方和 2. 減少均數(shù)的抽樣誤差的可行方法之一是( ): A. 嚴(yán)格執(zhí)行隨機抽樣 B. 增大樣本含量 C. 設(shè)立對照 D. 選一些處于中間狀態(tài)的個體 E. 選一些處于極端狀態(tài)的個體,3. 在標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的關(guān)系中,說法正確的是( ): A.樣本例數(shù)增大
17、時,標(biāo)準(zhǔn)差減小,標(biāo)準(zhǔn)誤不變 B.可信區(qū)間大小與標(biāo)準(zhǔn)差有關(guān),而正常值范圍與 標(biāo)準(zhǔn)誤有關(guān) C.樣本例數(shù)增大時,標(biāo)準(zhǔn)差增大,標(biāo)準(zhǔn)誤也增大 D.樣本的例數(shù)增大時,標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤均減小 E.總體標(biāo)準(zhǔn)差一定時,增大樣本例數(shù)會減小標(biāo)準(zhǔn)誤 4.關(guān)于t分布的圖形,下述哪項是錯誤的( )。 A. 當(dāng)自由度 趨于無窮大 時,t分布趨于標(biāo)準(zhǔn)正態(tài)分布 B. 無論自由度為多少,t分布曲線下的面積都為1 C.自由度越小,則t分布的尾部越高 D. t分布是一條以 為中心左右對稱的曲線 E. t分布是一簇曲線,故臨界值因自由度的不同而不同,5.用正態(tài)近似法進(jìn)行總體率的區(qū)間估計時,應(yīng)滿足( )。 A. n足夠大 B. p或1-p不太小 C. np或n(1-p)均大于5 D. 以上均要求 E. 以上均不要求 6.總體率95%可信區(qū)間的意義是( ) A. 95%的正常值在此范圍內(nèi) B. 95%的樣本率在此范圍內(nèi) C. 95%的總體率在此范圍內(nèi) D.總體率在此范圍內(nèi)的可能性為95% E.樣本率在此范圍內(nèi)的可能性為95%,7( )的均數(shù)等于方差。 A. 正態(tài)分布 B. 二項分布 C. 對稱分布 D. Poisson分布 E. 以上均不對 8.某地成年男子紅細(xì)胞數(shù)普查結(jié)果為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024物業(yè)服務(wù)合同中智慧物業(yè)建設(shè)要求
- 二零二五版人才引進(jìn)分房優(yōu)惠政策協(xié)議3篇
- 二零二五版工業(yè)用地承包經(jīng)營合同范本2篇
- 專屬保安服務(wù)協(xié)議規(guī)范2024年版版A版
- 二零二五年度可再生能源項目融資合同范本4篇
- 二零二五年度金融服務(wù)平臺合伙人股東投資協(xié)議3篇
- 2025年產(chǎn)權(quán)式商鋪租賃及商業(yè)地產(chǎn)風(fēng)險評估合作協(xié)議3篇
- 2025年度文化創(chuàng)意產(chǎn)品設(shè)計與制造合同范本3篇
- 2025年生態(tài)農(nóng)業(yè)園綠化種植與推廣合同3篇
- 2025年度跨境電商商品銷售及回購合作協(xié)議范本3篇
- 割接方案的要點、難點及采取的相應(yīng)措施
- 2025年副護士長競聘演講稿(3篇)
- 2025至2031年中國臺式燃?xì)庠钚袠I(yè)投資前景及策略咨詢研究報告
- 原發(fā)性腎病綜合征護理
- 第三章第一節(jié)《多變的天氣》說課稿2023-2024學(xué)年人教版地理七年級上冊
- 2025年中國電科集團春季招聘高頻重點提升(共500題)附帶答案詳解
- 2025年度建筑施工現(xiàn)場安全管理合同2篇
- 建筑垃圾回收利用標(biāo)準(zhǔn)方案
- 2024年考研英語一閱讀理解80篇解析
- 樣板間合作協(xié)議
- 福建省廈門市2023-2024學(xué)年高二上學(xué)期期末考試語文試題(解析版)
評論
0/150
提交評論