下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、習題答案第一章一、是非題1. 家庭中子女數(shù)是離散型的定量變量。答:對。2. 同質(zhì)個體之間的變異稱為個體變異。答:對。3. 學校對某個課程進行 1 次考試,可以理解為對學生掌握該課程知識的一次隨機抽樣。答:對。4. 某醫(yī)生用某個新藥治療了 100 名牛皮癬患者,其中55 個人有效,則該藥的有效率為55%。答:錯。只能說該樣本有效率為55或稱用此藥總體有效率的樣本估計值為55%。5.已知在某個人群中,糖尿病的患病率為8%,則可以認為在該人群中,隨機抽一個對象,其患糖尿病的概率為8%。答:對,人群的患病率稱為總體患病率。在該人群中隨機抽取一個對象,每個對象均有相同的機會被抽中,抽到是糖尿病患者的概率
2、為8。二、選擇題1. 下列屬于連續(xù)型變量的是 A 。A 血壓 B 職業(yè) C 性別 D 民族2. 某高校欲了解大學新生心理健康狀況,隨機選取了1000 例大學新生調(diào)查,這1000 例大學生新生調(diào)查問卷是 A 。A 一份隨機樣本 B 研究總體 C 目標總體 D 個體3. 某研究用 X 表示兒童在一年中患感冒的次數(shù),共收集了1000 人,請問:兒童在一年中患感冒次數(shù)的資料屬于 C 。A 連續(xù)型資料 B 有序分類資料 C 不具有分類的離散型資料 D 以上均不對4. 下列描述中,不正確的是 D 。A 總體中的個體具有同質(zhì)性B 總體中的個體大同小異C 總體中的個體在同質(zhì)的基礎(chǔ)上有變異D 如果個體間有變異那
3、它們肯定不是來自同一總體5用某個降糖藥物對糖尿病患者進行治療,根據(jù)某個大規(guī)模隨機抽樣調(diào)查的研究結(jié)果得到該藥的降糖有效率為85%的結(jié)論,請問降糖有效率是指 D 。A 每治療100 個糖尿病患者,正好有85 個人降糖有效,15 個人降糖無效B 每個接受該藥物治療的糖尿病患者,降糖有效的機會為85%C 接受該藥物治療的糖尿病人群中,降糖有效的比例為85%D 根據(jù)該研究的入選標準所規(guī)定的糖尿病患者人群中,估計該藥降糖有效的比例為85%三、簡答題1. 某醫(yī)生收治 200 名患者,隨機分成2 組,每組100 人。一組用A 藥,另一組用B 藥。經(jīng)過2 個月的治療,A 藥組治愈了90 人,B 組治愈了85 名
4、患者,請根據(jù)現(xiàn)有結(jié)果評議下列說法是否正確,為什么a)A 藥組的療效高于B 藥組。b)A 藥的療效高于B 藥。答:a)正確,因為就兩組樣本而言,的確A 組療效高于B 組。b) 不正確,因為樣本的結(jié)果存在抽樣誤差,因此有可能人群的A 藥療效高于B 藥,也可能人群的兩藥的療效相同甚至人群B 藥的療效高于A 藥,2. 某校同一年級的 A 班和B 班用同一試卷進行一次數(shù)學測驗。經(jīng)過盲態(tài)改卷后,公布成績:A 班的平均成績?yōu)?0 分,B 班的平均成績?yōu)?1 分,請評議下列說法是否正確,為什么a)可以稱A 班的這次考試的平均成績低于B 班,不存在抽樣誤差。b)可以稱A 班的數(shù)學平均水平低于B 班。答:a) 正
5、確,因為此處將A 班和B 班作為研究總體,故不存在抽樣誤差。b)不正確,因為這一次數(shù)學平均成績只是兩班數(shù)學成績總體中的兩個樣本,樣本的差異可能僅僅由抽樣誤差造成。3. 在某個治療兒童哮喘的激素噴霧劑新藥的臨床試驗中,研究者收集了300 名哮喘兒童患者,隨機分為試驗組和對照組,試驗組在哮喘緩解期內(nèi)采用激素噴霧劑,在哮喘發(fā)作期內(nèi)采用激素噴霧劑擴展氣管藥;對照組在哮喘緩解期不使用任何藥物,在哮喘發(fā)作期內(nèi)采用擴展氣管藥物。通過治療3 個月,以肺功能檢查中的第1 秒用力呼吸率(FEV/FRC)作為主要有效性評價指標,評價兩種治療方案的有效性和安全性。請闡述這個研究中的總體和總體均數(shù)是什么答:試驗組的研究
6、總體是接受試驗組治療方案的全體哮喘兒童患者在治療3 個月時的FEV1/FRC1 值的全體。對照組的研究總體是接受對照組治療方案的全體哮喘兒童患者在治療3 個月時的FEV1/FRC1 值的全體。試驗組對應(yīng)的總體均數(shù)是接受試驗組治療方案的全體哮喘兒童患者在治療3 個月時的FEV1/FRC1 的平均值;對照組對應(yīng)的總體均數(shù)是接受對照組治療方案的全體哮喘兒童患者在治療3 個月時的FEV1/FRC1 的平均值。4. 請簡述什么是小概率事件對于一次隨機抽樣,能否認為小概率事件是不可能發(fā)生的答:在統(tǒng)計學中,如果隨機事件發(fā)生的概率小于或等于,則通??梢哉J為是一個小概率事件,表示該事件在大多數(shù)情況下不會發(fā)生,并
7、且一般可以認為小概率事件在一次隨機抽樣中不會發(fā)生,這就是小概率事件原理。小概率事件原理是統(tǒng)計學檢驗的基礎(chǔ)。5. 變量的類型有哪幾種請舉例說明,各有什么特點答:(1) 連續(xù)型變量,可以一個區(qū)間中任意取值的變量,即在忽略測量精度的情況下,連續(xù)型變量在理論上可以取到區(qū)間中的任意一個值,并且通常含有測量單位。觀察連續(xù)型變量所得到的數(shù)據(jù)資料稱為計量資料(measurement data)。如例1-1 中的身高變量就是連續(xù)型變量,身高資料為計量資料。.(2) 離散型變量, 變量的取值范圍是有限個值或者為一個數(shù)列。離散型變量的取值情況可以分為具有分類性質(zhì)的資料和不具有分類性質(zhì)的資料,表示分類情況的離散型變量
8、亦稱分類變量(categorical variable)。觀察分類變量所得到的資料稱為分類資料(categorical data)。分類資料可以分為二分類資料和多分類資料,而多分類資料又分成無序分類資料和有序分類資料,二分類資料如癥狀指標分為感染或未感染,無序多分類資料(nominal data) 如血型可以分為A、B、AB 和O 型,有序多分類資料(ordinal data) 如病情指標分為無癥狀、輕度、中度和重度。第二章一、是非題1不論數(shù)據(jù)呈何種分布,都可以用算術(shù)均數(shù)和中位數(shù)表示其平均水平。答:錯。只有資料滿足正態(tài)或近似正態(tài)分布時計算算術(shù)均數(shù)是比較有統(tǒng)計學意義的。2在一組變量值中少數(shù)幾個變
9、量值比大多數(shù)變量值大幾百倍,一般不宜用算術(shù)均數(shù)表示其平均水平。答:對,可以采用中位數(shù)表示。3只要單位相同,用s 和用CV 來表示兩組資料的離散程度,結(jié)論是完全一樣的。答:錯,標準差S 是絕對誤差的一種度量,變異系數(shù)CV 是相對誤差的一種度量,對于兩組資料離散程度的比較,即使兩組資料的度量單位相同,也完全有可能出現(xiàn)兩個指標的結(jié)論是不同的。在實際應(yīng)用時,選擇離散程度的指標時,考慮其結(jié)果是否有研究背景意義。例如:一組資料為成人的身高觀察值,另一組資料為2 歲幼兒的身高觀察值,雖然可以用標準差S比較兩組的離散程度,也不能認為這是錯誤的,但根本沒有研究背景意義,相反選擇變異系數(shù)CV 比較兩組資料的相對變
10、異程度,這就有一定的研究背景意義。4描述200 人血壓的分布,應(yīng)繪制頻數(shù)圖。答:對。5. 算術(shù)均數(shù)與中位數(shù)均不容易受極值的影響。答:錯。算術(shù)均數(shù)比中位數(shù)容易受到極值的影響。二、選擇題1中位數(shù)是表示變量值 A 的指標。A 平均水平B 變化范圍C 頻數(shù)分布D 相互間差別大小2對于最小組段無確定下限值和(或)最大組段無確定上限值的頻數(shù)分布表資料,宜用下列哪些指標進行統(tǒng)計描述 C _A 中位數(shù),極差 B 中位數(shù),四分位數(shù)間距C 中位數(shù),四分位數(shù)范圍 D 中位數(shù),標準差3描述年齡(分8 組)與療效(有效率)的關(guān)系,應(yīng)繪制 A 。A線圖 B. 圓圖 C. 直方圖 D. 百分條圖4、為了描述資料分布概況,繪
11、制直方圖時,直方圖的縱軸可以為 D 。A 頻數(shù) B 頻率 C 頻率密度(頻率/組距) D 都可以三、簡答與分析題1 100 名健康成年女子血清總蛋白含量(g/L)如表2-14,試描述之。表2-12 100 名成年健康女子血清總蛋白含量(g/L) 答:制作頻數(shù)表如下:_組段 頻數(shù) 百分比 累積頻數(shù) 累積百分比_64 3 3 66 5 8 68 8 16 70 11 27 72 25 52 74 24 76 76 10 86 78 7 93 80 6 99 84 1 100 變量 例數(shù) 均數(shù) 標準差 最小值最大值中位數(shù)25 百分位數(shù)75 百分位數(shù)x 100 2某醫(yī)師測得300 名正常人尿汞值(ng
12、/L)如表2-15,試描述資料。表2-13 300 名正常人尿汞值(ng/L)尿 汞 例 數(shù) 累計例數(shù) 累計百分數(shù)(%)0 49 49 4 27 76 8 58 134 12 50 184 16 45 229 20 22 251 24 16 267 28 10 277 32 7 284 36 5 289 40 5 294 44 0 294 48 3 297 52 0 297 56 2 299 60 1 300 合計 300 答:根據(jù)資料給出統(tǒng)計描述的指標如下:例數(shù) 均數(shù) 標準差 最小值 最大值16 2 62對于同一的非負樣本資料,其算數(shù)均數(shù)一定大于等于幾何均數(shù)。答:根據(jù)初等數(shù)學中的不等式a a
13、 a a a an+ + + ,可以得到算數(shù)均數(shù)一定大于等于幾何均數(shù)。常用的描述集中趨勢的指標有哪些,并簡述其適用條件。答:(1)算術(shù)均數(shù):適用對稱分布,特別是正態(tài)或近似正態(tài)分布的數(shù)值變量資料。(2)幾何均數(shù):適用于頻數(shù)分布呈正偏態(tài)的資料,或者經(jīng)對數(shù)變換后服從正態(tài)分布(對數(shù)正態(tài)分布)的資料,以及等比數(shù)列資料。(3)中位數(shù):適用各種類型的資料,尤其以下情況:A 資料分布呈明顯偏態(tài);B 資料一端或兩端存在不確定數(shù)值(開口資 料或無界資料);C資料分布不明。第三章一、 是非題1. 二項分布越接近 Poisson 分布時,也越接近正態(tài)分布。答:錯。當二項分布的
14、 不太接近 0或者 1,隨著的增大,n 和n(1 )均較大時,二項分布的X 的逐漸近似正態(tài)分布; n 較大, 較小,二項分布的X 近似總體均數(shù)為 = n 的 Poisson 分布,只有n較大、 較小并且n 較大時,二項分布的 X 既近似Poisson 分布又近似正態(tài)分布,其本質(zhì)是當n 較大、 較小時二項分布的X 所近似的Poisson 分布在其總體均數(shù) = n 較大時逼近正態(tài)分布。2. 從同一新生兒總體(無限總體)中隨機抽樣 200 人,其中新生兒窒息人數(shù)服從二項分布。答:對。因為可以假定每個新生發(fā)生窒息的概率 是相同的并且相互獨立,對于隨機抽取 200 人,新生兒窒息人數(shù) X 服從二項分布B
15、(n, )。3. 在 n 趨向無窮大、總體比例趨向于0,且n 保持常數(shù)時的二項分布的極限分布是Poisson 分布。答:對。這是二項分布的性質(zhì)。4. 某一放射物體,以一分鐘為單位的放射性計數(shù)為 50,40,30,30,10,如果以5 分鐘為時間單位,其標準差為 1605 。答:錯。設(shè)X 服從總體均數(shù)為 的 Poisson 分布,i = 1,2,3,4,5,并且相互獨立。根據(jù)Poisson 分布的可加性, X + X + X + X + X 服從總體均數(shù)為5 ,_其總體方差為5 ,本題 5 分鐘的總體方差5 的估計值為50 + 40 + 30 + 30 +10 = 160,所以其標準差為160
16、。5. 一個放射性物體一分鐘脈沖數(shù)為 20 次,另一個放射性物體一分鐘脈沖數(shù)為50 次。假定兩種放射性物體的脈沖性質(zhì)相同,并且兩種放射性物體發(fā)生脈沖是相互獨立的,則這兩種物體混合后,其一分鐘脈沖數(shù)的總體均數(shù)估計值為70 次。答:對。根據(jù)Poisson 分布的可加性,這兩種物體混合后的發(fā)生的脈沖數(shù)為X + X ,混合后一分鐘脈沖數(shù)的總體均數(shù)估計值為20+5070 次。6. 一個放射性物體平均每分鐘脈沖數(shù)為 5 次(可以認為服從Poisson 分布),用X 表示連續(xù)觀察20 分鐘的脈沖數(shù),則X 也服從Poisson 分布。答:對,這是Poisson 分布的可加性。7. 一個放射性物體平均每分鐘脈沖
17、數(shù)為 5 次(可以認為服從Poisson 分布),用X 表示連續(xù)觀察20 分鐘的脈沖數(shù),則X 的總體均數(shù)和總體方差均為100 次。答:對。Poisson 分布的可加性原理。8. 用 X 表示某個放射性物體的每分鐘脈沖數(shù),其平均每分鐘脈沖數(shù)為5 次(可以認為服從Poisson 分布),用Y 表示連續(xù)觀察20 分鐘的脈沖數(shù),則可以認為Y 近似服從正態(tài)分布,但不能認為X 近似服從正態(tài)分布。答:對。因為Y 的總體均數(shù)為100,當比較小的時候,Poisson 分布是一個偏態(tài)的分布,但是當增大時,Poisson 分布會逐漸趨于對稱。二、 選擇題1. 理論上,二項分布是一種 B。A 連續(xù)性分布 B 離散分布
18、C 均勻分布 D 標準正態(tài)分布2. 在樣本例數(shù)不變的情況下,下列何種情況時,二項分布越接近對稱分布。 CA 總體率越大 B 樣本率P 越大C 總體率越接近 D 總體率越小3. 醫(yī)學上認為人的尿氟濃度以偏高為不正常,若正常人的尿氟濃度X 呈對數(shù)正態(tài)分布,Y = lgX , G 為X 的幾何均數(shù),尿氟濃度的95%參考值范圍的界值計算公式是 A 。A lg ( ) Y + S B + G S C + G S D lg ( ) Y + S4. 設(shè)X , X ,, X 均 服 從 B(4, , 并 且 X , X ,, X 相 互 獨 立 。 令Y = X + X
19、 ++ X ,則 DA Y 近似服從二項分布 B Y 近似服從Poisson 分布C Y 近似服從正態(tài)分布 D Y B(40,5. 設(shè)X , X ,, X 均服從 Poisson ,并且 X , X ,, X 相互獨立。令Y = (X + X ++ X ) /10,則 CA Y 近似服從B(10, B Y 服從Poisson(22)分布C Y 近似服從正態(tài)分布 D Y 服從Poisson分布三、 簡答題1. 如果X 的總體均數(shù)為,總體標準差為,令Y a+bX,則可以證明:Y 的總體均數(shù)為a+b,標準差為b。如果X
20、服從40 的Poisson 分布,請問:Y = X /2 的總體均數(shù)和標準差是多少答:總體均數(shù)=20,總體標準差= 40 / 2。2. 設(shè)X 服從40 的Poisson 分布,請問:Y = X /2 是否服從Poisson 分布為什么答:不是的。因為Y = X /2 的總體均數(shù)=20,不等于總體方差10。3. 設(shè)X 服從40 的Poisson 分布,可以認為X 近似服從正態(tài)分布。令Y = X /10,試問:是否可以認為Y 也近似服從正態(tài)分布答:正態(tài)分布的隨機變量乘以一個非0 常數(shù)仍服從正態(tài)分布,所以可以認為Y 也近似服從正態(tài)分布。4. 設(shè)X 服從均數(shù)為的 Poisson 分布。請利用兩個概率之
21、比:P(X +1) / P(X ),證明:當x < 1 時,概率P(X )隨著X 增大而增加;當 X > 時,概率P(X )隨著X 增大而減小。答:( 1)/( ) ( )/ /( 1)( 1)! !P X x P X x e e xx x = + = = = +, 顯然, 當x < 1 時,對應(yīng)x +1 < ,由此得到 1x 1>+,所以P(X = x +1) / P(X = x) > 1,說 明 概 率 P(X ) 隨 著 X 增 大 而 增 加 ; 當 X > 時 , 則( 1)/( ) 11P X x P X xx x = + = = <
22、 <+,說明當X>時,概率P(X )隨著X 增大而減小。5. 已知某飲用水的合格標準是每升水的大腸桿菌數(shù)2 個,如果隨機抽取1 升飲用水,檢測出大腸桿菌數(shù)的95參考值范圍是多少(提示考慮合格標準的總體均數(shù)最大值為2 個/L,求95參考值范圍)。答:由于合格標準的總體均數(shù)最大值為2 個/L,對于正常而言,大腸桿菌數(shù)越少越好,所以這是單側(cè)參考值范圍。即求滿足累計概率的不等式( | 2) 2 !P k ek = = 的最大X 的解。X 0 1 2 3 4 5 6P(X ) ( )P k 根據(jù)上述計算得到 X 的95參考值范圍是 X < 5個/L。第四章一、是非題1、設(shè) X 的總體均
23、數(shù)為,則樣本均數(shù)X 的總體均數(shù)也為。答:對。經(jīng)隨機抽樣得到的樣本均數(shù)X 的總體均數(shù)也為。2、設(shè) X 的總體方差為,則樣本均數(shù)X 的總體方差也為。答:錯。經(jīng)隨機抽樣后得到的樣本均數(shù)X 的總體方差為/n。3、設(shè) 隨 機 變 量, , X X 均服從 B(1, ) ,n 很大時,則1 X Xn = 近似服從N( , (1 ) / n)答:對。4、某研究者做了一個兒童血鉛濃度的流行病學調(diào)查,共調(diào)查了 1000 人,檢測了每個人血鉛濃度。雖然血鉛檢濃度一般呈非正態(tài)分布,但由于該研究樣本量很大,可以認為這些血鉛濃度近似服從正態(tài)分布。答:錯。血鉛濃度的分布與樣本量是否很大無關(guān),如果樣本量充分大時,血鉛濃度的
24、樣本均數(shù)的分布近似正態(tài)分布。5、某研究者做了一個兒童血鉛濃度的流行病學調(diào)查,共調(diào)查了 1000 人,檢測了每個人血鉛濃度,計算這1000 人的血鉛平均濃度。對于現(xiàn)有的1000 人的血鉛濃度資料,可以認為該資料的樣本均數(shù)近似服從正態(tài)分布。答: 錯。樣本均數(shù)的概率分布是指隨機抽樣前將要隨機抽取的樣本,其樣本均數(shù)近似服從某個概率分布,樣本量很大時,樣本均數(shù)逼近正態(tài)分布。對于這個資料而言,這是已經(jīng)完成隨機抽樣的資料,這個資料的樣本均數(shù)只是一個數(shù),不存在服從哪種分布的問題。6、某研究者做了一個兒童血鉛濃度的流行病學調(diào)查,已知血鉛測量值非正態(tài)分布,計劃調(diào)查1000 人,并將計算1000 人的血鉛濃度的樣本
25、均數(shù),由于該研究樣本量很大,可以認為隨機抽樣所獲得血鉛濃度的樣本均數(shù)將近似服從正態(tài)分布。答:對。如果從某個均數(shù)為,標準差為的非正態(tài)分布的總體中抽樣,只要樣本量足夠大,則樣本均數(shù) X 的分布也將近似于正態(tài)分布N(, / n)。二、選擇題1、以下方法中唯一可行的減小抽樣誤差的方法是_B_。A、減少個體變異 B、增加樣本量C、設(shè)立對照 D、嚴格貫徹隨機抽樣的原則2、S 表示_C_。A、總體均數(shù)的離散程度 B、總體標準差的離散程度C、樣本均數(shù)的離散程度 D、樣本標準差的離散程度3、設(shè)連續(xù)性隨機變量X的總體均數(shù)為,從X總體中反復隨機抽樣,隨樣本量n 增大,XS將趨于_D_。A、X 的原始分布 B、正態(tài)分
26、布C、均數(shù)的抽樣分布 D、標準正態(tài)分布4、在均數(shù)為 ,標準差為 的正態(tài)總體中隨機抽樣,理論上| X | _B_的可能性為5%。A、 B C、 t S D S5、下面關(guān)于標準誤的四種說法中,哪一種是不正確_C_。A、標準誤是樣本統(tǒng)計量的標準差B、標準誤反映了樣本統(tǒng)計量的變異C、標準誤反映了總體參數(shù)的變異D、標準誤反映了抽樣誤差的大小6、變量 X 偏離正態(tài)分布,只要樣本量足夠大,樣本均數(shù)_C_。A、偏離正態(tài)分布 B、服從F 分布C、近似正態(tài)分布 D、服從t 分布三、簡答題1、樣本均數(shù)的抽樣誤差定義是什么答:樣本均數(shù)的抽樣誤差是指樣本均數(shù)和總體均數(shù)間的差異,但同時可以表現(xiàn)為從同一總體中多次隨機抽樣所
27、得的樣本均數(shù)間的差異,通常用樣本均數(shù)的標準誤度量平均的抽樣誤差大小。2、估計樣本均數(shù)的平均抽樣誤差的統(tǒng)計量是什么答:是樣本均數(shù)的標準差,即樣本均數(shù)的標準誤。3、簡述樣本均數(shù)的抽樣誤差的規(guī)律。答:樣本均數(shù)的標準誤的理論值為n = ,而其估計值為S Sn= ;4、簡述 t 分布、F 分布,分布曲線的特征與自由度的關(guān)系。答:t 分布是一簇以0 為中心,左右對稱的單峰曲線,隨著自由度的增加,t 分布曲線將越來越接近于標準正態(tài)分布曲線,當自由度為無窮大時,t 分布就是標準正態(tài)分布。t 分布的曲線下兩側(cè)尾部的面積可以通過查對應(yīng)自由度下的t 分布界值表得到。分布的圖形為一簇單峰正偏態(tài)分布曲線,且隨著自由度的
28、增加,正偏的程度越來越小。分布的曲線下右側(cè)尾部的面積可通過查界值表得到。F 分布的特征有:(1)F 分布有兩個自由度,F(xiàn) 的取值范圍為0。(2)F 分布為一簇單峰正偏態(tài)分布曲線,與兩個自由度有關(guān)。(3)每一對自由度下的F 分布曲線下面積,見方差分析用F 界值表(附表4),橫標目為第一自由度,縱標目為第二自由度,表中分別給出了概率為 和 時的F 界值,記為F 。t 分布,分布和F 分布是三種沒有未知參數(shù),只有自由度的概率分布,常用于抽樣研究中,故稱為三種常見的抽樣分布。5、簡述正態(tài)分布、t 分布、F 分布、分布之間的關(guān)系。答:(1)若隨機變量 X 服從于正態(tài)分布N (, ),那么從總體中隨機抽取
29、的樣本,其樣本均數(shù) X 將服從于正態(tài)分布 ( , ) N 。令Z 為對X 進行標準化變換的結(jié)果,Z 將服從于標準正態(tài)分布,即/Z X Xn = = 服從標準正態(tài)分布。(2)自由度為1 的分布可以通過將服從標準正態(tài)分布的變量平方得到。(3)若隨機變量X和X分別為服從自由度為v和v的分布,并且相互獨立,則比值 /F XX = = /服從自由度為(v,v)的F 分布(F-distribution)。6、目前一般的統(tǒng)計軟件(如 SAS,SPSS 和Stata)均能隨機模擬產(chǎn)生服從均勻分布、正態(tài)分布、二項分布的隨機數(shù)。利用這些程序,可以生成指定參數(shù)下的隨機數(shù)據(jù),這種產(chǎn)生隨機數(shù)的方法稱為“蒙特卡洛方法”(
30、Monte-Carlo Method)。請參考光盤中隨機模擬操作,借助統(tǒng)計軟件隨機模擬產(chǎn)生隨機數(shù)據(jù),重現(xiàn)本章中關(guān)于均數(shù)和率的抽樣分布規(guī)律。答:以Stata 為例正態(tài)分布資料的樣本均數(shù)的分布模擬。用記事本寫入下來語句clearset memory 100mdi "輸入 樣本量 總體均數(shù) 總體標準差"scalar m=1'scalar mm=2'scalar oo=3'set obs 10000local j=1gen xx=0gen ss=0while j'<=mgen xj'=invnorm(uniform()*oo+mmrep
31、lace xx=xx+xj'replace ss=ss+xj'*xj'local j=j'+1gen ssd=sqrt(ss-xx*xx/m)/(m-1)replace xx=xx/mdi "mean=" xxdi "sd=" ssd用文件名""保存在Stata 窗口中打入do 路徑simumean 樣本量 總體均數(shù) 總體標準差對于Stata ,輸入下列命令顯示樣本均數(shù)的頻數(shù)圖graph xx,bin(50) xlabel對于 Stata ,輸入下列命令顯示樣本均數(shù)的頻數(shù)圖graph7 xx,bin(5
32、0) xlabel非正態(tài)分布的樣本均數(shù)的分布模擬。用記事本寫入下來語句clearset memory 100mdi "輸入 樣本量 "scalar m=1'set obs 10000local j=1gen xx=0gen ss=0while j'<=mgen xj'=invnorm(uniform()2replace xx=xx+xj'replace ss=ss+xj'*xj'local j=j'+1gen ssd=sqrt(ss-xx*xx/m)/(m-1)replace xx=xx/mdi "me
33、an=" xxdi "sd=" ssd用文件名""保存在Stata 窗口中打入do 路徑simumean1 樣本量 總體均數(shù) 總體標準差對于Stata ,輸入下列命令顯示樣本均數(shù)的頻數(shù)圖graph xx,bin(50) xlabel顯示原始資料的頻數(shù)分布圖graph x1,bin(50) xlabel對于 Stata ,輸入下列命令顯示樣本均數(shù)的頻數(shù)圖graph7 xx,bin(50) xlabel顯示原始資料的頻數(shù)分布圖graph7 x1,bin(50) xlabel樣本率的分布模擬。用記事本寫入下來語句clearset memory 100
34、mdi "輸入 樣本量 總體率 "scalar m=1'scalar pp=2'set obs 10000local j=1gen xx=0gen ss=0while j'<=mreplace xx=xx+int(uniform()+pp)local j=j'+1gen ppp=xx/msu ppp用文件名""保存在Stata 窗口中打入do 路徑simumean3 樣本量 總體率對于Stata ,輸入下列命令顯示樣本率的頻數(shù)圖graph ppp,bin(50) xlabel對于Stata ,輸入下列命令顯示樣本率的
35、頻數(shù)圖graph7 ppp,bin(50) xlabel7、利用蒙特卡洛方法,產(chǎn)生標準正態(tài)分布的隨機數(shù),并計算樣本方差,驗證方差乘自由度(n 1)S服從于自由度為n 1的 分布,兩個獨立樣本的方差之比服從于自由度為n 1, n 1的 F 分布。答:標準正態(tài)分布資料的樣本方差×(n1)的分布模擬。用記事本寫入下來語句clearset memory 100mdi "輸入 樣本量 "scalar m=1'set obs 10000local j=1gen xx=0gen ss=0while j'<=mgen xj'=invnorm(unif
36、orm()replace xx=xx+xj'replace ss=ss+xj'*xj'local j=j'+1gen ss= ss-xx*xx/m用文件名""保存在Stata 窗口中打入do 路徑 樣本量對于Stata ,輸入下列命令顯示樣本均數(shù)的頻數(shù)圖graph ss,bin(50) xlabel對于 Stata ,輸入下列命令顯示樣本均數(shù)的頻數(shù)圖graph7 ss,bin(50) xlabelF 分布的模擬。用記事本寫入下來語句clearset memory 100mdi "輸入 樣本量1 總體均數(shù)1 樣本量2 總體均數(shù)2 總體
37、標準差 "scalar m1=1'local mn1=1'scalar mm1=2'scalar m2=3'scalar mm2=4'scalar oo=5'set obs 10000local j=1gen xx=0gen ss=0gen xx0=0while j'<=m1replace xx0=invnorm(uniform()*oo+m1replace xx=xx+xx0replace ss=ss+xx0*xx0local j=j'+1gen ss1= (ss-xx*xx/m1)/(m1-1)replace
38、ss=0replace xx=0local j=1while j'<=m2gen xx0=invnorm(uniform()*oo+m2replace xx=xx+xx0replace ss=ss+xx0*xx0local j=j'+1gen ss2= (ss-xx*xx/m2)/(m2-1)gen f=ss1/ss2用文件名""保存在Stata 窗口中打入do 路徑 樣本量對于Stata ,輸入下列命令顯示統(tǒng)計量F 的頻數(shù)圖graph f,bin(50) xlabel對于 Stata ,輸入下列命令顯示統(tǒng)計量F 的頻數(shù)圖graph7 f,bin(50
39、) xlabel第五章一、是非題1t 檢驗統(tǒng)計量服從自由度為 的t 分布。答:錯。只有在H0 假設(shè)為真時才成立。2. 當拒絕H 時,只可能發(fā)生第一類錯誤。答:對。3. 對于H: = H: 的t檢驗,當 H 為真時,檢驗統(tǒng)計量t t > 的_概率為1 。答:對。當H 為真時,作出正確推斷的概率即為1 。4. 對于H : = H : 的t檢驗, H 為真而言,發(fā)生拒絕H 的機會與樣本量n 無關(guān)。答:對。無論樣本量n 多大,犯第一類錯誤的概率為。5. 對于定量資料用95%可信區(qū)間的公式X t S± 估計總體均數(shù)所在范圍,要求資料服從正態(tài)分布或樣本量很大。答:對。二選擇題1在同一總體隨
40、機抽樣,其他條件不變,樣本量越大,則總體均數(shù)的95%可信區(qū)間( A )。A 越窄 B 越寬 C 越可靠 D 越穩(wěn)定2從兩個不同總體中隨機抽樣,樣本含量相同,則兩總體均數(shù)95可信區(qū)間(D )。A 標準差小者,可信度大 B 標準差小者,準確度高C 標準差小者,可信度大且準確度高 D 兩者的可信度相同3其他條件不變,可信度1- 越大,則總體均數(shù)可信區(qū)間( A )A 越寬 B 越窄 C不變 D還與第二類錯誤有關(guān)4其他條件不變,可信度1- 越大,則隨機抽樣所獲得的總體均數(shù)可信區(qū)間將不包含總體均數(shù)的概率( B )。A 越大 B 越小 C 不變 D 不確定5. 區(qū)間內(nèi)包含總體均數(shù)的概率為(D )。A 95
41、B C 99 D 1006 從某正態(tài)總體中隨機抽樣,樣本含量固定, 區(qū)間內(nèi)包含樣本均數(shù)的概率為( A )。A 95 B C 99 D 不確定7增大樣本含量,則錯誤的是( A )。A 可信區(qū)間的可信度變大 B S 變小C 同樣可信度情況下,可信區(qū)間變窄 D 抽樣誤差減少8下列公式中,哪一個可以用于正態(tài)分布總體均數(shù)的95%可信區(qū)間的估計(C )。A ± B ± C X ± t S D X ± t S9由兩個獨立樣本計算得到兩個總體均數(shù)的可信區(qū)間,則下列結(jié)論中正確的是( C )。A 如果兩個可信區(qū)間無重疊,可認為兩樣本均數(shù)差別無統(tǒng)計意義B 如果兩個可信區(qū)間有重
42、疊,可認為兩樣本均數(shù)差別有統(tǒng)計意義C 如果兩個可信區(qū)間無重疊,可認為兩樣本均數(shù)差別有統(tǒng)計意義D 以上都不對10在總體方差相等的條件下,由兩個獨立樣本計算兩個總體均數(shù)之差的可信區(qū)間包含了0,則( B )。A 可認為兩樣本均數(shù)差別無統(tǒng)計學意義B 可認為兩樣本均數(shù)差別有統(tǒng)計學意義C 可認為兩總體均數(shù)差別無統(tǒng)計學意義D 可認為兩總體均數(shù)差別有統(tǒng)計學意義11假設(shè)檢驗中的第二類錯誤是指( D )所犯的錯誤。 ± ± A 拒絕了實際上成立的H0 B 未拒絕實際上成立的H0C 拒絕了實際上不成立的H0 D 未拒絕實際上不成立的H012. 兩樣本均數(shù)比較的假設(shè)檢驗中,差別有統(tǒng)計學意義時,P
43、越小,說明( D )。A. 兩樣本均數(shù)差別越大 B. 兩總體均數(shù)差別越大C. 越有理由認為兩樣本均數(shù)不同 D. 越有理由認為兩總體均數(shù)不同13作兩樣本均數(shù)差別的t 檢驗中,P 值與 值中( A )。A 值是研究者指定的 BP 值是研究者指定的C兩者意義相同,數(shù)值不同 D兩者意義相同,數(shù)值相同14. 兩樣本均數(shù)的t 檢驗,按 的檢驗水準拒絕H0,若此時推斷有誤,其錯誤的概率為( A )。A B > C < D 不一定15.在樣本均數(shù)與總體均數(shù)差別的雙側(cè)顯著性檢驗中,結(jié)果為P< 而拒絕H0,接受H1,原因是( D )。A. H0 假設(shè)成立的可能性小于B. H1 假設(shè)成立的可能性大
44、于1-C. H0 成立的可能性小于 且H1 成立的可能性大于1-D.從H0 成立的總體中隨機抽取一個樣本,其樣本均數(shù)比現(xiàn)有樣本的均數(shù)更遠離(H0 為真時)總體均數(shù)的可能性小于注:假設(shè)檢驗是反證法思想,即:考察H 為真情況下,樣本統(tǒng)計量出現(xiàn)背離H 并且逼近H 的概率是否為小概率事件,所以假設(shè)檢驗中不涉及到H 成立的概率。三、統(tǒng)計分析題和簡答題1. 在假設(shè)檢驗中,當出現(xiàn)P > 時,雖然不能拒絕 H0,但不能推斷 H0成立。(提示:假設(shè)檢驗是基于反證法的思想)。答:假設(shè)檢驗是基于反證法的思想。拒絕H0是因為在H0為真的假設(shè)下樣本統(tǒng)計量出現(xiàn)在小概率事件范圍內(nèi),所以可以推斷H0非真;反之,在H0為
45、真的假設(shè)下樣本統(tǒng)計量未出現(xiàn)在小概率事件范圍,只是沒有足夠證據(jù)支持不能拒絕H0。正如反證法只是尋找推翻假設(shè)的證據(jù),并不是尋找支持假設(shè)的證據(jù),不能推翻假設(shè)的結(jié)果并不能成為證實假設(shè)成立的證據(jù)。事實上,不拒絕H0 時犯第二類錯誤的概率 有時還很大,并且無法由研究者直接控制,所以不拒絕H0 時,不能直接推斷H0 成立。2. 下面是18 例冠心病患者高密度脂蛋白(HDL,g/L)的測定結(jié)果,請回答下列問題。,1)本題所研究的總體是什么答:滿足者該研究中入選標準的全部冠心病患的高密度脂蛋白(HDL,g/L)實際值的全體構(gòu)成的集合。2)根據(jù)本題的研究背景和研究問題,請用研究背景語言給出本題總體均數(shù)的具體定義。
46、答:滿足者該研究中入選標準的全部冠心病患的高密度脂蛋白(HDL,g/L)實際值的平均數(shù)。3)試估計本題的總體均數(shù)及其95%可信區(qū)間,并用通俗的研究背景語言論述您的結(jié)果。答:X = , , 18, / 18 S = n = S = = ,95%可信區(qū)間為: X t s ± =±×=(, )。以95可信度推斷冠心病患者人群的高密度脂蛋白(HDL,g/L)的平均數(shù)在 g/L。3. 已知大腸桿菌在飲用水中呈Poisson 分布,根據(jù)有關(guān)規(guī)定:對于合格的飲用水而言,平均每升飲用水中的大腸桿菌個數(shù)不超過2 個,先在某飲用水生產(chǎn)處抽樣2L 水,經(jīng)檢測發(fā)現(xiàn)6 個大腸桿菌,請估計該
47、處的飲用水平均1L 中的大腸桿菌數(shù)在什么范圍內(nèi)答:X=6,查Poisson 分布總體均數(shù)的可信區(qū)間界值表得,95%的可信區(qū)間為(2, 2)=,。4. 續(xù)第3 題,在實際的衛(wèi)生監(jiān)督執(zhí)法中,一般不進行統(tǒng)計分析,但需要根據(jù)統(tǒng)計學原理和飲用水衛(wèi)生標準,指定一個飲用水大腸桿菌數(shù)的界值:隨機抽取1L 水,當檢測到的細菌數(shù)低于這個界值,可以推斷該處飲用水的平均1L 水的大腸桿菌數(shù)不會超過2 個,請以95的可信度確定這個界值。答: = 2,查 Poisson 分布總體均數(shù)的 95可信區(qū)間界值表得到大于 2 的最小下限為X=6,其95%可信區(qū)間為(,),而X=5 的95可信區(qū)間為(,),所以當檢測結(jié)果為大腸桿菌
48、數(shù)6 時,可以推斷該處飲用水的平均每升水的大腸桿菌數(shù) > 2,即該飲用水不合格。5. 續(xù)第3 題和第4 題,請推敲下列描述有何不同,適用于何種情況1) 每1L 飲用水中的平均大腸桿菌個數(shù)不超過2 個是合格的2)合格的飲用水中,1L 飲用水的大腸桿菌個數(shù)不得高于于2 個3)第3 題中,能否按1L 水檢測到3 個大腸桿菌估計該處的飲用水平均每每1L 中的大腸桿菌數(shù)在什么范圍內(nèi),為什么答:第一個問題是對于合格的飲用水而言,平均每1L 飲用水的大腸桿菌個數(shù)不超過 2( 2),也就是在檢測樣品為 1 升飲用水時,容許樣品中的大腸桿菌數(shù)超過2 個。第二個問題是指檢測樣品為1 升水時,不容許樣品中的大
49、腸桿菌數(shù)超過2個。(X 2)3)根據(jù)Poisson 分布的95可信區(qū)間推斷該處的飲用水平均每升中的大腸桿菌數(shù)在(,)第六章一、是非題1. 隨機區(qū)組設(shè)計的檢驗效能一定高于完全隨機設(shè)計答:錯。如果在完全隨機設(shè)計中,實驗條件和實驗過程控制都非常好,研究對象的同質(zhì)性非常好,幾乎不存在可能的混雜因素,即可以認為可能混雜效應(yīng)很小甚至可以忽略,則完全隨機設(shè)計的檢驗效能可能要高于隨機區(qū)組設(shè)計。2. 隨機對照試驗就是實驗性研究答:對。隨機對照試驗的英文名是Random control trial,縮寫為RCT。在隨機分組前,隨機對照試驗的研究對象來自同一人群,通過選擇不同的干預,構(gòu)成試驗組和對照組,由此評價干預
50、效應(yīng)。因此隨機對照試驗就是實驗性研究,但要注意:實驗性研究未必是隨機對照試驗。3. 隨機對照試驗就是完全隨機設(shè)計答:錯。隨機對照試驗貫徹了隨機化原則,對照組和實驗組間除實驗因素不同外,其他條件基本相同,研究設(shè)計可以是完全隨機對照設(shè)計,也可以是隨機區(qū)組設(shè)計。4. 采取隨機分組可以提高檢驗效能答:錯。采取隨機分組的主要目的是控制或減少混雜因素對結(jié)果的影響,與檢驗效能沒有直接的連續(xù)。5. 為了研究A 因素與死亡的關(guān)系,采用隊列研究,但所獲樣本資料不能估計人群的A 因素暴露比例。答:對。因為隊列研究是根據(jù)A 因素的不同暴露水平分別入選研究對象,由此建立不同暴露水平的隊列進行隨訪研究的。如按A 因素暴露
51、和非暴露分別入組2000 人進行隨訪,因此暴露人數(shù)與非暴露人數(shù)是1:1,與人群中的暴露比例無關(guān)。即:隊列研究中的研究對象中的暴露比例是人為確定的,不是人群的暴露比例。二、選擇題1. 病例對照研究的主要缺點之一是 CA. 研究周期長 B. 病例不容易收集C. 容易產(chǎn)生選擇性偏倚 D. 容易失訪2. 病例對照研究的主要優(yōu)點之一是 CA. 容易失訪 B. 不容易發(fā)生測量偏倚C. 患病率很低的疾病也適用 D. 很容易選擇和收集對照3. 病例對照研究最好應(yīng)選擇 D 為對照A. 健康人 B. 醫(yī)院中未患該疾病的人C. 醫(yī)院中的正常人 D. 根據(jù)研究背景選擇符合一定條件的未患該疾病的人4.采用配對設(shè)計的主要
52、目的是 B 。A 減少樣本含量 B 減少混雜因素對結(jié)果的影響C 提高統(tǒng)計檢驗的功效 D 有利于統(tǒng)計分析5. 下列說法哪一個是正確的 。A. 采用完全隨機設(shè)計可以使試驗組和對照組同時減少混雜因素的影響B(tài). 采用隨機區(qū)組設(shè)計可以控制了混雜因素對結(jié)果的影響C. 采用隨機區(qū)組設(shè)計可以減少了混雜因素對結(jié)果的影響,當效應(yīng)指標與研究因素之間存在混雜效應(yīng)的情況下,采用配對設(shè)計可以提高了統(tǒng)計檢驗的效能。D. 采用完全隨機設(shè)計可以控制混雜因素在試驗組和對照組達到概率意義下的平衡,由此提高了統(tǒng)計檢驗的效能。三、簡答題1. 實驗性研究和觀察性研究的根本區(qū)別是什么答:主要區(qū)別在于是否人為給予干預措施,如果研究者人為施加
53、了干預措施那么就是實驗性研究,如果研究者沒有施加干預措施,而是以客觀、真實的觀察為依據(jù),對觀察結(jié)果進行描述和對比分析,那么就是觀察性研究。另外在干預前,實驗性研究的研究對象來自同一群體;比較性質(zhì)的觀察性研究的對象一般來自不同人群。2. 實驗設(shè)計的三個基本原則是什么答:實驗設(shè)計的基本原則:對照、隨機、重復。設(shè)立對照和貫徹隨機化是使各組均衡可比的兩個非常重要的手段。重復就是指試驗組和對照組需要滿足一定的樣本量。3. 隨機化的作用是什么答:隨機化是采用隨機的方式,使每個受試對象都有同等的機會被抽取或分到不同的實驗組和對照組。隨機化使不可控制的混雜因素在實驗組和對照組中的影響較為均勻,并可歸于實驗誤差
54、之中;它也是對資料進行統(tǒng)計推斷的前提,各種統(tǒng)計分析方法都是建立在隨機化的基礎(chǔ)上。4. 為比較兩種藥物對小鼠移植性肉瘤生長有無抑制作用的效果,如果由文獻報道,小鼠腫瘤重量的標準差在 左右而小鼠腫瘤重量測量的有效精度在 左右,規(guī)定此檢驗分辨的能力 = g,標準差S = g, = , 2 =以及=,試估計每組所需樣本量如何將小鼠分組并寫出分組結(jié)果。答: 每組樣本量估計2 2 2 2 / 2 2 22( ) 2 31n Z Z+ += = =考慮到可能存在一定的脫落,增加 20樣本量,故每組樣本量取n =×31 = 38。隨機分組方案如下:將76 只小鼠編號:1,2,76。設(shè)置種子數(shù)200(可以任意設(shè)置一個數(shù)值作為種子數(shù))借助Stata 軟
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 海南鋪面租賃合同書電子版
- 合同產(chǎn)生質(zhì)量事故考核
- 2024高考政治一輪復習課時練16中國特色社會主義最本質(zhì)的特征含解析新人教版
- 2024年高考生物二輪復習第一篇專題6考向3生物的進化和生物多樣性學案
- 完美國際黃昏圣殿裝備屬性、所需材料系列介紹(武器篇)投
- 2024購買服務(wù)的合同協(xié)議書
- 2024新疆事業(yè)編制合同到期后單位可以選擇不續(xù)簽
- 2024機動車輛保險合同樣本
- 2024北京市豬肉入市場廠掛鉤合同范本
- 2024消防工程改造合同
- 20200310公園安全風險辨識清單
- 華中科技大學官方信紙
- 60立方油罐容積細表
- WI-QA-02-034A0 燈具成品檢驗標準
- 農(nóng)業(yè)信息技術(shù) chapter5 地理信息系統(tǒng)
- 部編版六年級上語文閱讀技巧及解答
- 斯派克max操作手冊
- 項目四 三人表決器ppt課件
- 結(jié)合子的機械加工工藝規(guī)程及銑槽的夾具設(shè)計
- 林武樟 完整陽宅講義 筆記版[方案]
- 《會滾的汽車》ppt課件
評論
0/150
提交評論