第二篇習(xí)題答案_第1頁
第二篇習(xí)題答案_第2頁
第二篇習(xí)題答案_第3頁
第二篇習(xí)題答案_第4頁
第二篇習(xí)題答案_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第二篇 概率與推斷基礎(chǔ)一、討論題1. 簡述隨機(jī)變量的均數(shù)與樣本均數(shù)的區(qū)別。答:由隨機(jī)實(shí)驗(yàn)中產(chǎn)生的結(jié)果用數(shù)值表示的變量叫隨機(jī)變量。隨機(jī)變量的均數(shù)是指隨機(jī)變量所有可能值的平均,但它不是一般意義下的平均,而是要把每個取值都按照它的概率來加權(quán)之后的平均,每個可能取值的權(quán)重就是取這個值的概率。通常用而不是簡單的來表示隨機(jī)變量的均數(shù),這樣有利于我們理解描述的到底是哪一個隨機(jī)變量。樣本均數(shù)是指某樣本所有觀測值的平均值,是描述樣本數(shù)據(jù)特征的一個統(tǒng)計量,通常用表示。對于一個特定總體而言,樣本觀測值會隨抽取的樣本不同而變化,相應(yīng)的樣本均數(shù)也會因樣本的不同而變化。但是隨機(jī)變量的均數(shù)是一個描述總體特征的參數(shù),它是隨機(jī)

2、變量所有可能取值的平均值。2. 簡要回答二項(xiàng)分布、Poisson分布及正態(tài)分布的區(qū)別與聯(lián)系。答:(1)三者的區(qū)別表4-1 三種分布的比較二項(xiàng)分布Poisson分布正態(tài)分布概率函數(shù)概率函數(shù)意義說明n個觀察數(shù)中恰好發(fā)生X個某事件的概率說明一定觀察單位內(nèi)發(fā)生某事件數(shù)為X的概率X對應(yīng)的曲線上的點(diǎn)代表概率密度,一個范圍如X1X2內(nèi)的面積才代表概率決定參數(shù)n ,均數(shù)與方差關(guān)系一般(Z分布除外)適用條件互斥性,獨(dú)立性,穩(wěn)定性(用大量重復(fù)實(shí)驗(yàn)得到的樣本率來估計參數(shù))同前,尚需n很大(趨向于無窮大),很小連續(xù)分布,服從正態(tài)性類型離散型隨機(jī)變量的概率分布離散型隨機(jī)變量的概率分布連續(xù)型隨機(jī)變量的概率分布可加性無有有

3、(2)三者的聯(lián)系Poisson分布是二項(xiàng)分布的特殊情況,服從Poisson分布的資料也肯定服從二項(xiàng)分布。因此,能用Poisson分布法處理的資料原則上也能用二項(xiàng)分布來處理(但需知道總觀察數(shù)和陽性數(shù)),只不過此時計算較繁而已。反之則不然,服從二項(xiàng)分布者不一定都能用Poisson分布法來處理,需滿足Poisson分布的近似條件才可。不論二項(xiàng)分布還是Poisson分布,只有滿足正態(tài)近似條件時才可用正態(tài)近似法。當(dāng)然此時也可用兩種分布相應(yīng)的方法,但正態(tài)近似法較為簡便。3. 指出下述陳述的錯誤并給出解釋。(1)中心極限定理指出對于大樣本而言,總體均數(shù)近似服從正態(tài)分布。答:此描述的錯誤主要在后半句“總體均數(shù)

4、近似服從正態(tài)分布”,中心極限定理是針對樣本均數(shù)而言的。中心極限定理是指從任意均數(shù)等于,方差等于的一個總體中抽取樣本量為的簡單隨機(jī)樣本。當(dāng)樣本量很大時,無論總體分布形態(tài)如何,樣本均數(shù)的抽樣分布近似正態(tài)分布。(2)對于大樣本而言,觀察值近似服從正態(tài)分布。答:當(dāng)樣本量很大時,無論總體分布形態(tài)如何,樣本均數(shù)的抽樣分布近似正態(tài)分布。即中心極限定理是針對樣本均數(shù)而言。(3)從總體進(jìn)行簡單隨機(jī)抽樣,抽取的樣本量越大,樣本均數(shù)的標(biāo)準(zhǔn)差越大。答:,均數(shù)的標(biāo)準(zhǔn)差與樣本量的平方根成反比,即抽取的樣本量越大,樣本均數(shù)的標(biāo)準(zhǔn)差越小。4. 如何理解“樣本率的抽樣分布同樣遵循中心極限定理”?答:二項(xiàng)分布可看成多次伯努利試驗(yàn)

5、的和:用時表示結(jié)果第次實(shí)驗(yàn)“成功”,時表示第次實(shí)驗(yàn)結(jié)果“失敗”,可以將各個相加得到總的“成功”次數(shù)(即),而“成功”率為,可將其看做一個均數(shù),即樣本量為的樣本率可以用取值為0和1變量的樣本均數(shù)來表示,因此其同樣也遵循中心極限定理。5. 使用置信區(qū)間的常見注意事項(xiàng)。答:公式不適用于所有抽樣方法,不同的抽樣方法需采用不同的均數(shù)估計公式;數(shù)據(jù)須來自相應(yīng)總體的簡單隨機(jī)抽樣,個體間相互獨(dú)立是使用上述估計公式的前提;對于來自隨意收集且偏倚較大的數(shù)據(jù),沒有恰當(dāng)?shù)姆椒ㄟM(jìn)行統(tǒng)計推斷,統(tǒng)計分析無法拯救糟糕的數(shù)據(jù);在計算置信區(qū)間之前往往需先對數(shù)據(jù)進(jìn)行探索性分析,例如找出異常值,檢驗(yàn)數(shù)據(jù)是否服從正態(tài)分布;公式是事先假

6、定總體標(biāo)準(zhǔn)差已知,實(shí)際研究中很可能無法得到總體標(biāo)準(zhǔn)差。當(dāng)樣本量較大時,可選用樣本標(biāo)準(zhǔn)差s估計,對應(yīng)置信區(qū)間可用公式近似估計;實(shí)際操作中的問題(如無應(yīng)答與失訪)會給抽樣研究帶來額外的誤差,這些誤差可能比隨機(jī)抽樣誤差大得多,并且研究結(jié)果中這些誤差并不能被誤差范圍所反映;統(tǒng)計推斷的概率是指該方法重復(fù)進(jìn)行的正確頻率,即在100次抽樣中,平均而言95%置信區(qū)間有95次包含了總體均數(shù),但并不知道某一次結(jié)果的正確性。6. 解釋零假設(shè)與備擇假設(shè)的含義。答:零假設(shè)又稱無效假設(shè),記為,是在我們沒有證明某現(xiàn)象之前做出的保守推測,是被用來檢驗(yàn)的假設(shè),通常表述為“沒有差異”,表示差異是由抽樣誤差引起的;備擇假設(shè)又稱對立

7、假設(shè),記為,表示其差異是因?yàn)楸容^的對象之間存在本質(zhì)不同。在現(xiàn)實(shí)研究中,描述的往往是我們希望看到的結(jié)果。7. 假設(shè)檢驗(yàn)的思想、步驟及其與置信區(qū)間的區(qū)別與聯(lián)系。答:假設(shè)檢驗(yàn)的思想:我們對總體特征(如參數(shù)、分布)進(jìn)行某種推測,進(jìn)而用概率來判斷樣本數(shù)據(jù)所提供的信息和我們對總體特征猜想的一致性,根據(jù)小概率反證法思想,結(jié)合專業(yè)知識判斷這一猜想的正確性。假設(shè)檢驗(yàn)的步驟:(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn);(2)計算檢驗(yàn)統(tǒng)計量;(3)確定P值,做出統(tǒng)計推斷。假設(shè)檢驗(yàn)與置信區(qū)間的區(qū)別與聯(lián)系:(1)聯(lián)系:對于同一資料其統(tǒng)計推斷結(jié)論是等價的,可信區(qū)間也可回答假設(shè)檢驗(yàn)的問題。如已知的總體均數(shù)在樣本均數(shù)所估計的可信區(qū)間之

8、內(nèi)時,可認(rèn)為兩個總體均數(shù)相同,反之則可認(rèn)為不同。(2)區(qū)別:置信區(qū)間估計用于推斷總體參數(shù)所在的范圍,而假設(shè)檢驗(yàn)用于推斷總體參數(shù)之間是否不同。置信區(qū)間在回答差別有無統(tǒng)計學(xué)意義的同時,還能提供一些假設(shè)檢驗(yàn)不能提供的信息,并可以提示差別是否具有實(shí)際意義。因此,置信區(qū)間與假設(shè)檢驗(yàn)的作用是相輔相成的,將兩者結(jié)合起來,可以提供更為全面的統(tǒng)計推斷信息。8.解釋第I類錯誤、第II類錯誤和檢驗(yàn)效能以及它們之間的關(guān)系。答:第類錯誤:當(dāng)為真,拒絕(接受),此時的錯誤稱為第類錯誤,其發(fā)生的概率記為。第類錯誤:當(dāng)為真,接受(拒絕),此時的錯誤稱為第類錯誤,其發(fā)生的概率記為。檢驗(yàn)效能:檢驗(yàn)水準(zhǔn)為,當(dāng)為真時,假設(shè)檢驗(yàn)?zāi)軌蚓?/p>

9、絕的概率稱為能發(fā)現(xiàn)該的檢驗(yàn)效能。三者的關(guān)系為:固定檢驗(yàn)水準(zhǔn)下的檢驗(yàn)效能就是1減第類錯誤去犯第類錯誤的概率,即檢驗(yàn)效能為1;當(dāng)樣本量固定時,與成反比,與()成正比;如果把設(shè)置得很小,勢必增大犯II型錯誤的概率,從而降低檢驗(yàn)效能;反之,如果重點(diǎn)在于減少,勢必增加犯I型錯誤的概率,從而降低了置信度。要同時減小和,只有通過增加樣本含量來實(shí)現(xiàn)。二、綜合分析題1. 經(jīng)長期臨床觀察,胃潰瘍患者發(fā)生胃出血的率為20%,某醫(yī)院隨機(jī)觀察了20例65歲以上老年胃潰瘍患者。(1)求其中沒有1例發(fā)生胃出血癥狀的概率。(2)求最多有8例發(fā)生胃出血癥狀的概率。答:(1)需要計算的沒有1例發(fā)生胃出血癥狀的概率,即,可以采用公

10、式來計算,也可以采用軟件進(jìn)行計算,例如應(yīng)用R軟件輸入語句:P1 = dbinom(0,20,0.2)。運(yùn)行后得到P10.012。(2)需要計算下側(cè)累計概率,即,手工計算會比較復(fù)雜,可采用統(tǒng)計軟件進(jìn)行計算。例如應(yīng)用R軟件輸入語句:P2 = pbinom(8,20,0.2)0.992某鄉(xiāng)鎮(zhèn)有人口10000人。該地疾病預(yù)防控制中心擬在該鄉(xiāng)進(jìn)行一次血吸蟲感染率普查,方法是先將每10人的糞便作為一個混合樣本,若為陰性,則10人均為陰性;若為陽性,再對該混合樣本的10人糞便逐人檢查。問此法比一般的逐人糞便檢查法減少多大工作量(假設(shè)血吸蟲感染率為5%)?。答:這是一個二項(xiàng)分布問題,0.05,n10。按10人

11、一個混合樣品,應(yīng)有1000個混合樣品。這1000個混合樣品都必須做一次檢查,陽性者還要分別檢查,因此總的預(yù)期檢查次數(shù)為:N混合樣品數(shù)+混合樣品陽性率×混合樣品數(shù)×10可見,關(guān)鍵為求混合樣品的陽性率。已知每份樣品的陽性率為5%,陰性率即為1-0.050.95,10份樣品均為陰性的概率按二項(xiàng)分布為P(0)0.95100.5987,于是混合樣品為陽性的概率為10.9510。N1000+(10.5987)×1000×105013。節(jié)約的工作量即為1000050134987次(約50%)。3. 某地18歲女青年收縮壓(mm-Hg)服從。在該地隨機(jī)選一名18歲女青年

12、,測量她的收縮壓為X(mm-Hg)。(1)求,;(2)確定最小的x,使。答:(1)通過將標(biāo)準(zhǔn)化為標(biāo)準(zhǔn)正態(tài)變量后再來求概率。,要求,查標(biāo)準(zhǔn)正態(tài)分布表得:于是 =0.3372, (2)先對x進(jìn)行標(biāo)準(zhǔn)化,則,使的最小的x,即,則,解不等式得到:x=129.68。4. 假設(shè)已知高校學(xué)生每晚睡眠時間近似服從均數(shù)為6.78小時,標(biāo)準(zhǔn)差為1.24小時的正態(tài)分布?,F(xiàn)計劃采用簡單隨機(jī)抽樣方法抽取150例高校學(xué)生,計算每晚平均睡眠時間。(1)該樣本平均睡眠時間的標(biāo)準(zhǔn)差是多少?(2)使用“68-95-97.5法則”描述該樣本均數(shù)的變異。(3)計算平均睡眠時間低于6.9小時的概率。答:(1)由題干知,高校學(xué)生每晚睡眠

13、時間近似服從正態(tài)分布, 小時,小時,此時n=150,根據(jù)中心極限定理,樣本均數(shù)的均數(shù)為,樣本均數(shù)的標(biāo)準(zhǔn)差為,所以:(2)根據(jù)“68-95-97.5法則”,約68%的樣本均數(shù)在(6.68,6.88)內(nèi);約95%的樣本均數(shù)在(6.58,6.98)內(nèi);約99.7%的樣本均數(shù)在(6.48,7.08)內(nèi)。(3)要求的累計概率是5已知某地近5年兒童蟯蟲感染率平均為35%(設(shè)為總體率),該地疾病預(yù)防控制中心為了解今年該地兒童蟯蟲病感染情況,隨機(jī)抽樣調(diào)查了100名兒童。(1)請問此樣本率的均數(shù)和標(biāo)準(zhǔn)差分別為多少?(2)如果希望樣本率的標(biāo)準(zhǔn)差小于0.02,則隨機(jī)抽樣的樣本量需要達(dá)到多少?答:(1)此時及均大于5

14、,樣本率p的抽樣分布近似服從正態(tài)分布,可用公式和來分別計算樣本率 p的均數(shù)和標(biāo)準(zhǔn)差,即:(2)由,得,樣本率的標(biāo)準(zhǔn)差越小則需要的樣本量越大,當(dāng)樣本率的標(biāo)準(zhǔn)差為0.02時,n569。因此,如果希望樣本率的標(biāo)準(zhǔn)差小于0.02,則隨機(jī)抽樣的樣本量至少需要569人。6.在某市隨機(jī)抽取90名19歲健康男性大學(xué)生,測量他們的身高,得樣本均數(shù)為172.2cm,標(biāo)準(zhǔn)差為4.5cm。(1)請估計該市19歲健康男性大學(xué)生平均身高的95%置信區(qū)間。(2)如果希望95%的誤差范圍是1cm,則需要調(diào)查該市多少名19歲健康男性大學(xué)生?答:(1),=1.96,可得均數(shù)的95%置信區(qū)間的誤差范圍為:則:因此,該市19歲健康男

15、性大學(xué)生平均身高的95%置信區(qū)間為(171.27,173.13)cm。(2)若95%的誤差范圍是1cm,則7某醫(yī)院呼吸內(nèi)科用相同方法測定隨機(jī)抽樣得到的兩組患者的動脈血二氧化碳分壓,肺心病患者240例,為10.48±6.20 (kPa);慢性支氣管炎合并肺氣腫患者200例,為6.12±1.51 (kPa)。(1)請計算兩組患者的血液二氧化碳分壓的95%置信區(qū)間,并比較兩組95%置信區(qū)間的誤差范圍。(2)若正常人動脈血二氧化碳分壓平均為5.15 (kPa),請問慢性支氣管炎合并肺氣腫患者與正常人的動脈血二氧化碳分壓是否有差異?答:(1)因?yàn)閮山M樣本量均比較大,可以用樣本標(biāo)準(zhǔn)差作為總體標(biāo)準(zhǔn)差的估計值,即,=1.96,可得均數(shù)的95%置信區(qū)間為:因此,肺心病患者動脈血二氧化碳分壓95%置信區(qū)間的誤差范圍是0.78,其95%置信區(qū)間為(9.7,11.26) kPa;慢性支氣管炎合并肺氣腫患者動脈血二氧化碳分壓95%置信區(qū)間的誤差范圍是0.21,其95%置信區(qū)間為為(5.91,6.33) kPa。(2):慢性支氣管炎合并肺氣腫患者與正常人的動脈血二氧化碳分壓均值無差異,即;:慢性支氣管炎合并肺氣腫患者與正常人的動脈血二氧化碳分壓均值有差異,即;,拒絕,差異有統(tǒng)計學(xué)意義,可認(rèn)為慢性支氣管炎

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論