版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、習(xí)題答案第一章一、是非題1. 家庭中子女?dāng)?shù)是離散型的定量變量。 答:對。2. 同質(zhì)個體之間的變異稱為個體變異。答:對。3. 學(xué)校對某個課程進(jìn)行 1 次考試,可以理解為對學(xué)生掌握該課程知識的一次隨機抽樣。 答:對。4. 某醫(yī)生用某個新藥治療了 100 名牛皮 癬患者,其中 55 個人有效,則該藥的有效率為 55%。答:錯。只能說該樣本有效率為55或稱用此藥總體有效率的樣本估計值為55%。5. 已知在某個人群中,糖尿病的患病率為8%,則可以認(rèn)為在該人群中,隨機抽一個對象,其患糖尿病的概率為 8%。答:對,人群的患病率稱為總體患病率。在該人群中隨機抽取一個對象,每個對象均有相 同的機會被抽中,抽到是
2、糖尿病患者的概率為8。二、選擇題1. 下列屬于連續(xù)型變量的是 A 。A 血壓 B 職業(yè) C 性別 D 民族1000 例大學(xué)新生調(diào)查,這 1000 例大2. 某高校欲了解大學(xué)新生心理健康狀況,隨機選取了 學(xué)生新生調(diào)查問卷是 A 。A 一份隨機樣本 B 研究總體 C 目標(biāo)總體 D 個體3. 某研究用 X 表示兒童在一年中患感冒的次數(shù),共收集了 1000 人,請問:兒童在一年中 患感冒次數(shù)的資料屬于 C 。A 連續(xù)型資料 B 有序分類資料 C 不具有分類的離散型資料 D 以上均不對4. 下列描述中,不正確的是A 總體中的個體具有同質(zhì)性B 總體中的個體大同小異C 總體中的個體在同質(zhì)的基礎(chǔ)上有變異D 。
3、15 個人降糖無效85%85%D 如果個體間有變異那它們肯定不是來自同一總體 5用某個降糖藥物對糖尿病患者進(jìn)行治療,根據(jù)某個大規(guī)模隨機抽樣調(diào)查的研究結(jié)果得 到該藥的降糖有效率為 85%的結(jié)論,請問降糖有效率是指A 每治療 100 個糖尿病患者,正好有 85 個人降糖有效,B 每個接受該藥物治療的糖尿病患者,降糖有效的機會為C 接受該藥物治療的糖尿病人群中,降糖有效的比例為D 根據(jù)該研究的入選標(biāo)準(zhǔn)所規(guī)定的糖尿病患者人群中,估計該藥降糖有效的比例為 85%三、簡答題1. 某醫(yī)生收治 200 名患者,隨機分成 2 組,每組 100 人。一組用 A 藥,另一組用 B 藥。 經(jīng)過2個月的治療,A藥組治愈
4、了 90人,B組治愈了 85名患者,請根據(jù)現(xiàn)有結(jié)果評議 下列說法是否正確,為什么?a)A 藥組的療效高于 B 藥組。b)A 藥的療效高于 B 藥。答:a)正確,因為就兩組樣本而言,的確A組療效高于B組。b) 不正確,因為樣本的結(jié)果存在抽樣誤差,因此有可能人群的 A 藥療效高于 B 藥,也 可能人群的兩藥的療效相同甚至人群 B 藥的療效高于 A 藥,2. 某校同一年級的 A 班和 B 班用同一試卷進(jìn)行一次數(shù)學(xué)測驗。經(jīng)過盲態(tài)改卷后,公布成 績: A 班的平均成績?yōu)?80 分, B 班的平均成績?yōu)?81 分,請評議下列說法是否正確,為 什么?a) 可以稱A班的這次考試的平均成績低于B班,不存在抽樣誤
5、差。b) 可以稱A班的數(shù)學(xué)平均水平低于 B班。答: a) 正確,因為此處將 A 班和 B 班作為研究總體,故不存在抽樣誤差。b)不正確,因為這一次數(shù)學(xué)平均成績只是兩班數(shù)學(xué)成績總體中的兩個樣本,樣本的差異 可能僅僅由抽樣誤差造成。3. 在某個治療兒童哮喘的激素噴霧劑新藥的臨床試驗中,研究者收集了300 名哮喘兒童患者,隨機分為試驗組和對照組,試驗組在哮喘緩解期內(nèi)采用激素噴霧劑,在哮喘發(fā)作期 內(nèi)采用激素噴霧劑擴展氣管藥;對照組在哮喘緩解期不使用任何藥物,在哮喘發(fā)作期 內(nèi)采用擴展氣管藥物。通過治療 3 個月,以肺功能檢查中的第 1 秒用力呼吸率(FEV1/FRC1)作為主要有效性評價指標(biāo),評價兩種治
6、療方案的有效性和安全性。請闡 述這個研究中的總體和總體均數(shù)是什么? 答:試驗組的研究總體是接受試驗組治療方案的全體哮喘兒童患者在治療3 個月時的FEV1/FRC1 值的全體。對照組的研究總體是接受對照組治療方案的全體哮喘兒童患者 在治療 3 個月時的 FEV1/FRC1 值的全體。 試驗組對應(yīng)的總體均數(shù)是接受試驗組治療方案的全體哮喘兒童患者在治療3 個月時的FEV1/FRC1 的平均值;對照組對應(yīng)的總體均數(shù)是接受對照組治療方案的全體哮喘兒童 患者在治療 3 個月時的 FEV1/FRC1 的平均值。4. 請簡述什么是小概率事件?對于一次隨機抽樣,能否認(rèn)為小概率事件是不可能發(fā)生的?答:在統(tǒng)計學(xué)中,
7、如果隨機事件發(fā)生的概率小于或等于0.05,則通??梢哉J(rèn)為是一個小概率事件, 表示該事件在大多數(shù)情況下不會發(fā)生, 并且一般可以認(rèn)為小概率事件在一次隨機 抽樣中不會發(fā)生,這就是小概率事件原理。小概率事件原理是統(tǒng)計學(xué)檢驗的基礎(chǔ)。5. 變量的類型有哪幾種?請舉例說明,各有什么特點?答:( 1) 連續(xù)型變量,可以一個區(qū)間中任意取值的變量,即在忽略測量精度的情況下, 連續(xù)型變量在理論上可以取到區(qū)間中的任意一個值, 并且通常含有測量單位。 觀察連續(xù)型變 量所得到的數(shù)據(jù)資料稱為計量資料(measurement data)。如例1-1中的身高變量就是連續(xù)型變量,身高資料為計量資料。 .( 2) 離散型變量, 變
8、量的取值范圍是有限個值或者為一個數(shù) 列。離散型變量的取值情況可以分為具有分類性質(zhì)的資料和不具有分類性質(zhì)的資料,表示分類情況的離散型變量亦稱分類變量 (categorical variable) 。觀察分類變量所得到的資料稱為分 類資料 (categorical data) 。分類資料可以分為二分類資料和多分類資料, 而多分類資料又分成 無序分類資料和有序分類資料, 二分類資料如癥狀指標(biāo)分為感染或未感染, 無序多分類資料 (nominal data)如血型可以分為 A、B、AB和O型,有序多分類資料(ordinal data)如病情指 標(biāo)分為無癥狀、輕度、中度和重度。第二章一、是非題1不論數(shù)據(jù)呈
9、何種分布,都可以用算術(shù)均數(shù)和中位數(shù)表示其平均水平。答:錯。只有資料滿足正態(tài)或近似正態(tài)分布時計算算術(shù)均數(shù)是比較有統(tǒng)計學(xué)意義的。2在一組變量值中少數(shù)幾個變量值比大多數(shù)變量值大幾百倍,一般不宜用算術(shù)均數(shù)表示其 平均水平。答:對,可以采用中位數(shù)表示。3只要單位相同,用 s 和用 CV 來表示兩組資料的離散程度,結(jié)論是完全一樣的。 答:錯,標(biāo)準(zhǔn)差 S 是絕對誤差的一種度量,變異系數(shù) CV 是相對誤差的一種度量,對于兩組 資料離散程度的比較, 即使兩組資料的度量單位相同, 也完全有可能出現(xiàn)兩個指標(biāo)的結(jié)論是 不同的。在實際應(yīng)用時,選擇離散程度的指標(biāo)時,考慮其結(jié)果是否有研究背景意義。例如: 一組資料為成人的身
10、高觀察值,另一組資料為 2 歲幼兒的身高觀察值,雖然可以用標(biāo)準(zhǔn)差 S 比較兩組的離散程度, 也不能認(rèn)為這是錯誤的, 但根本沒有研究背景意義, 相反選擇變異系 數(shù)CV比較兩組資料的相對變異程度,這就有一定的研究背景意義。4描述 200 人血壓的分布,應(yīng)繪制頻數(shù)圖。 答:對。5. 算術(shù)均數(shù)與中位數(shù)均不容易受極值的影響。 答:錯。算術(shù)均數(shù)比中位數(shù)容易受到極值的影響。二、選擇題1中位數(shù)是表示變量值 A 的指標(biāo)。ABCD2列哪些指標(biāo)進(jìn)行統(tǒng)計描述?平均水平 變化范圍 頻數(shù)分布 相互間差別大小 對于最小組段無確定下限值和(或)最大組段無確定上限值的頻數(shù)分布表資料,宜用下C 中位數(shù),極差 B 中位數(shù),四分位數(shù)
11、間距 中位數(shù),四分位數(shù)范圍 D 中位數(shù),標(biāo)準(zhǔn)差 描述年齡(分 8 組)與療效(有效率)的關(guān)系,應(yīng)繪制C3A 線圖 B. 圓圖 C. 直方圖 D. 百分條圖 4、為了描述資料分布概況,繪制直方圖時,直方圖的縱軸可以為 A 頻數(shù) B 頻率 C 頻率密度 (頻率/組距) D 三、簡答與分析題 1 100 名健康成年女子血清總蛋白含量( 表2-12 100 名成年健康女子血清總蛋白含量( 73.5 74.3 78.8 78.0 70.4 80.5 84.3 68.8 69.7 71.2 72.0 79.5 75.6 78.8 72.0 72.0 72.7 75.0 74.3 71.2 68.0 75.
12、0 75.0 74.3 75.8 65.0 67.3 78.8 71.2 69.7都可以g/L )如表 2-14,試描述之。 g/L)73.5 73.5 75.8 64.3 75.8 80.3 81.6 72.0 74.3 73.568.0 75.8 72.0 76.5 70.4 71.2 67.3 68.8 75.0 70.474.3 70.4 79.5 74.3 76.5 77.6 81.2 76.5 72.0 75.072.7 73.5 76.5 74.7 65.0 76.5 69.7 73.5 75.4 72.772.7 67.2 73.5 70.4 77.2 68.8 74.3 72
13、.7 67.3 67.374.3 75.8 79.5 72.7 73.5 73.5 72.0 75.0 81.6 74.370.4 73.5 73.5 76.5 72.7 77.2 80.5 70.4 75.0 76.5 答:制作頻數(shù)表如下: 組段 頻數(shù) 百分比 累積頻數(shù) 累積百分比64 3 3.00 3 3.00 66 5 5.00 8 8.00 68 8 8.00 16 16.00 70 11 11.00 27 27.00 72 25 25.00 52 52.00 74 24 24.00 76 76.00 76 10 10.00 86 86.00 78 7 7.00 93 93.00 80
14、 6 6.00 99 99.00 84 1 1.00 100 100.00 變量例數(shù)均數(shù)標(biāo)準(zhǔn)差最小值最大值中位數(shù)25百分位數(shù)75百分位數(shù) x 100 73.7 3.925 64.3 84.3 73.5 71.2 75.82. 某醫(yī)師測得300名正常人尿汞值(ng/L)如表2-15,試描述資料。 表2-13 300名正常人尿汞值(ng/L)尿汞例數(shù)累計例數(shù)累計百分?jǐn)?shù)(%) 0 49 49 16.3 4 27 76 25.3 8 58 134 44.7 12 50 184 61.3 16 45 229 76.3 20 22 251 83.7 24 16 267 89.0 28 10 277 92.
15、3 32 7 284 94.7 36 5 289 96.3 40 5 294 98.0 44 0 294 98.0 48 3 297 99.0 52 0 297 99.0 56 2 299 99.7 60 1 300 100.0合計300 答:根據(jù)資料給出統(tǒng)計描述的指標(biāo)如下: 例數(shù)均數(shù)標(biāo)準(zhǔn)差最小值最大值 16 15.053 49.014 2 623 .對于同一的非負(fù)樣本資料,其算數(shù)均數(shù)一定大于等于幾何均數(shù)。 答:根據(jù)初等數(shù)學(xué)中的不等式1 2,可以得到算數(shù)均數(shù)一定大于等于幾何均數(shù)。4. 常用的描述集中趨勢的指標(biāo)有哪些,并簡述其適用條件。 答:( 1)算術(shù)均數(shù):適用對稱分布,特別是正態(tài)或近似正態(tài)分
16、布的數(shù)值變量資料。(2)幾何均數(shù):適用于頻數(shù)分布呈正偏態(tài)的資料,或者經(jīng)對數(shù)變換后服從正態(tài)分布(對數(shù) 正態(tài)分布)的資料,以及等比數(shù)列資料。(3)中位數(shù):適用各種類型的資料,尤其以下情況:A 資料分布呈明顯偏態(tài); B 資料一端或兩端存在不確定數(shù)值(開口資 料或無界資料); C 資料分布不明。第三章也越接近正態(tài)分布。一、 是非題1. 二項分布越接近 Poisson 分布時,答:錯。當(dāng)二項分布的n 不太接近0或者 1,隨著n的增大,nn和n(1- n )均較大時,二項分布的 X 的逐漸近似正態(tài)分布;n 較大,n較小,二項分布的X近似總體均數(shù)為n 的Poisson分布,只有n較大、n較小并且nn較大時,
17、二項分布的X既近PoissonPoisson分布在其總體均數(shù)卩=n n較大時逼近正態(tài)分布。2. 從同一新生兒總體(無限總體)中隨機抽樣 分布。200 人,其中新生兒窒息人數(shù)服從二項答:對。因為可以假定每個新生發(fā)生窒息的概率7t是相同的并且相互獨立,對于隨機抽取 200 人,新生兒窒息人數(shù) X 服從二項分布B(n,n )。3. 在 n趨向無窮大、總體比例n趨向于0,且nn保持常數(shù)時的二項分布的極限分布是Poisson答: 對。4. 某一放射物體,以一分鐘為單位的放射性計數(shù)為 鐘為時間單位,其標(biāo)準(zhǔn)差為 1605 。分布。這是二項分布的性質(zhì)。50,40,30,30, 10,如果以 5 分答:錯。設(shè)i
18、 X服從總體均數(shù)為 卩 的Poisson分布,i = 1,2,3,4,5,并且相互獨立。根據(jù)Poisson分布的可加性,1 2 3 4 5 X + X + X + X + X服從總體均數(shù)為5卩其總體方差為5卩,本題5分鐘的總體方差5卩 的估計值為50 + 40 + 30 + 30 +10 = 160,所以其分布又近似正態(tài)分布,其本質(zhì)是當(dāng)n較大、n較小時二項分布的 X所近似的標(biāo)準(zhǔn) 差為 160 。5. 一個放射性物體一分鐘脈沖數(shù)為 20 次,另一個放射性物體一分鐘脈沖數(shù)為 假定兩種放射性物體的脈沖性質(zhì)相同,并且兩種放射性物體發(fā)生脈沖是相互獨立的, 則這兩種物體混合后,其一分鐘脈沖數(shù)的總體均數(shù)估計
19、值為 答:對。根據(jù) Poisson 分布的可加性, 合后一分鐘脈沖數(shù)的總體均數(shù)估計值為6. 一個放射性物體平均每分鐘脈沖數(shù)為50 次。70 次。這兩種物體混合后的發(fā)生的脈沖數(shù)為1 2 X + X ,混20+50 = 70 次。5 次(可以認(rèn)為服從Poisson分布),用 X 表示連續(xù)觀察 20 分鐘的脈沖數(shù),則 X 也服從 Poisson 分布。 答:對,這是 Poisson 分布的可加性。7. 一個放射性物體平均每分鐘脈沖數(shù)為 5 次(可以認(rèn)為服從 連續(xù)觀察 20 分鐘的脈沖數(shù),則 X 的總體均數(shù)和總體方差均為 答:對。 Poisson 分布的可加性原理。Poisson100 次。分布),用
20、 X 表示5 次(可以認(rèn)為Y 近似服從正8. 用 X 表示某個放射性物體的每分鐘脈沖數(shù),其平均每分鐘脈沖數(shù)為 服從 Poisson 分布),用 Y 表示連續(xù)觀察 20 分鐘的脈沖數(shù),則可以認(rèn)為 態(tài)分布,但不能認(rèn)為 X 近似服從正態(tài)分布。答:對。因為丫的總體均數(shù)為100,當(dāng)口比較小的時候,Poisson分布是一個偏態(tài)的分布, 但是當(dāng)口增大時,Poisson分布會逐漸趨于對稱。1. A C2. A C3.B。選擇題 理論上,二項分布是一種 連續(xù)性分布 B 離散分布 均勻分布 D 標(biāo)準(zhǔn)正態(tài)分布 在樣本例數(shù)不變的情況下,下列何種情況時,二項分布越接近對稱分布??傮w率n越大B樣本率P越大總體率n越接近0
21、.5 D總體率n越小 醫(yī)學(xué)上認(rèn)為人的尿氟濃度以偏高為不正常,若正常人的尿氟濃度X 呈對數(shù)正態(tài)分布,丫 = IgX , G為X的幾何均數(shù),尿氟濃度的95%參考值范圍的界值計算公式是.Y + S均 服 從 B(4,0.01) , 并 且 1 2 10 X , X , , X 相 互 獨 立 。 令 X ,則 DB Y 近似服從 Poisson 分布D Y B(40,0.01)均服從 Poisson(2.2) ,并且 1 2 10 X , X , , X 相互獨立。令 + X ) /10 ,則 CA lg 1( 1.64 ) 丫 - 丫 + S B + 1.96 X G S C + 1.64 X G
22、 S D lg 1( 1.96 ) 丫 -4. 設(shè)1 2 10 X , X , , X 1 2 10 丫 = X + X + + A 丫 近似服從二項分布 C 丫 近似服從正態(tài)分布5. 設(shè)1 2 10 X , X , X1 2 10 丫 = (X + X +A 丫 近似服從 B(10,0.22) B 丫 服從 Poisson(22)分布C 丫近似服從正態(tài)分布 D 丫服從Poisson(2.2)分布三、簡答題1. 如果X的總體均數(shù)為口,總體標(biāo)準(zhǔn)差為令丫 = a+bX,則可以證明:丫的總體均 數(shù)為a+b 口,標(biāo)準(zhǔn)差為b 6。如果X服從(1 = 40的Poisson分布,請問:丫 = X / 2的總
23、體 均數(shù)和標(biāo)準(zhǔn)差是多少?答:總體均數(shù) =20,總體標(biāo)準(zhǔn)差 = 40 / 2。2. 設(shè)X服從1 = 40的Poisson分布,請問:丫 = X /2是否服從Poisson分布?為什么? 答:不是的。因為 丫 = X /2 的總體均數(shù) =20,不等于總體方差 10。3. 設(shè)X服從1 = 40的Poisson分布,可以認(rèn)為X近似服從正態(tài)分布。令 丫 = X /10 ,試問:是否可以認(rèn)為 Y 也近似服從正態(tài)分布? 答:正態(tài)分布的隨機變量乘以一個非 0 常數(shù)仍服從正態(tài)分布,所以可以認(rèn)為 Y 也近似 服從正態(tài)分布。P(X +1) / P(X ),證明:4. 設(shè)X服從均數(shù)為口的Poisson 分布。請利用兩
24、個概率之比:時,概率 P(X )隨著 X 增大當(dāng)x 卩-1時,概率P(X )隨著X增大而增加;當(dāng) X 卩而減小。 答:1( 1)/( ) ( )/ /( 1)( 1)! !x x+, 顯然,x 卩-1時,對應(yīng)x +1 卩,由此得到1+,所以 P(X = x +1) / P(X = x) 1, ( 1)/( ) 1說明概率P(X )隨著X增大而增加;當(dāng)X 卩時,則1P X x P X x+,說明當(dāng) 冷口時,概率P(X )隨著X增大而減小。5. 已知某飲用水的合格標(biāo)準(zhǔn)是每升水的大腸桿菌數(shù) 2個,如果隨機抽取1升飲用水,檢測出大腸桿菌數(shù)的 95參考值范圍是多少?(提示考慮合格標(biāo)準(zhǔn)的總體均數(shù)最大值 為
25、2個/L,求95%參考值范圍)。答:由于合格標(biāo)準(zhǔn)的總體均數(shù)最大值為2個/L ,對于正常而言,大腸桿菌數(shù)越少越好,所以這是單側(cè)參考值范圍。即求滿足累計概率的不等式 20 0( | 2) 2 0.95的最大 X 的解。X 0 1 2 3 4 5 6P(X ) 0.135335 0.270671 0.270671 0.180447 0.090224 0.036089 0.01203 00.135335 0.406006 0.676676 0.857123 0.947347 0.983436 0.995466 根據(jù)上述計算得到X的95 %參考值范圍是 X B 的可能性 為5%。A、1.96d B 1.
26、96 X d C、0.05/ 2,v t S D 1.96 X S5、下面關(guān)于標(biāo)準(zhǔn)誤的四種說法中,哪一種是不正確C。A、標(biāo)準(zhǔn)誤是樣本統(tǒng)計量的標(biāo)準(zhǔn)差B、標(biāo)準(zhǔn)誤反映了樣本統(tǒng)計量的變異C、標(biāo)準(zhǔn)誤反映了總體參數(shù)的變異D、標(biāo)準(zhǔn)誤反映了抽樣誤差的大小6、變量 X 偏離正態(tài)分布,只要樣本量足夠大,樣本均數(shù) A 、偏離正態(tài)分布 B 、服從 F 分布C、近似正態(tài)分布 D、服從t分布 三、簡答題但同時可以表現(xiàn)為從同一總體通常用樣本均數(shù)的標(biāo)準(zhǔn)誤度量平均的抽樣誤差大1、樣本均數(shù)的抽樣誤差定義是什么? 答:樣本均數(shù)的抽樣誤差是指樣本均數(shù)和總體均數(shù)間的差異, 中多次隨機抽樣所得的樣本均數(shù)間的差異, 小。2、估計樣本均數(shù)的
27、平均抽樣誤差的統(tǒng)計量是什么? 答:是樣本均數(shù)的標(biāo)準(zhǔn)差,即樣本均數(shù)的標(biāo)準(zhǔn)誤。3、簡述樣本均數(shù)的抽樣誤差的規(guī)律?。 答:樣本均數(shù)的標(biāo)準(zhǔn)誤的理論值為 x n(T= ,而其估計值為 X4、簡述t分布、F分布,X分布曲線的特征與自由度的關(guān)系。答: t 分布是一簇以 0 為中心,左右對稱的單峰曲線,隨著自由度的增加, t 分布曲線將越 來越接近于標(biāo)準(zhǔn)正態(tài)分布曲線,當(dāng)自由度為無窮大時,t 分布就是標(biāo)準(zhǔn)正態(tài)分布。 t 分布的曲線下兩側(cè)尾部的面積可以通過查對應(yīng)自由度下的 t 分布界值表得到。X2 分布的圖形為一簇單峰正偏態(tài)分布曲線,且隨著自由度的增加,正偏的程度越來越小。X2 分布的曲線下右側(cè)尾部的面積可通過查
28、X2 界值表得到。F分布的特征有:(1) F分布有兩個自由度,F(xiàn)的取值范圍為08。( 2) F分布為一 簇單峰正偏態(tài)分布曲線,與兩個自由度有關(guān)。(3)每一對自由度下的 F 分布曲線下面積,見方差分析用 F 界值表 (附表4),橫標(biāo)目為第一自由度,縱標(biāo)目為第二自由度,表中分別給 出了概率為 0.05 和0.01 時的 F 界值,記為,1 , 2 F a V V Ot 分布, X2 分布和 F 分布是三種沒有未知參數(shù),只有自由度的概率分布,常用于抽樣研 究中,故稱為三種常見的抽樣分布。5、簡述正態(tài)分布、t分布、F分布、X分布之間的關(guān)系。答:(1)若隨機變量 X服從于正態(tài)分布N (卩,C 2 ),那
29、么從總體中隨機抽取的樣本,其樣本 均數(shù)X將服從于正態(tài)分布 (,2 ) X N卩C 。令Z為對X進(jìn)行標(biāo)準(zhǔn)化變換的結(jié)果,Z 將服從于標(biāo) 準(zhǔn)正態(tài)分布,即CTCT=-=-服從標(biāo)準(zhǔn)正態(tài)分布。(2)自由度為1的X分布可以通過將服從標(biāo)準(zhǔn)正態(tài)分布的變量平方得到。(3)若隨機變量X1和X2分別為服從自由度為vi和 v2 的 X2 分布,并且相互獨立,則比值1 )X /XF XXV= = 分布 ( 分布( 2 ) /服從自由度為(vi,v2)的F分布(F-distribution)。6、目前一般的統(tǒng)計軟件(如 SAS, SPSS和Stata)均能隨機模擬產(chǎn)生服從均勻分布、正態(tài) 分布、二項分布的隨機數(shù)。利用這些程序
30、,可以生成指定參數(shù)下的隨機數(shù)據(jù),這種產(chǎn)生隨機數(shù)的方法稱為蒙特卡洛方法”(Monte-Carlo Method )。請參考光盤中隨機模擬操作,借助統(tǒng)計軟件隨機模擬產(chǎn)生隨機數(shù)據(jù),重現(xiàn)本章中關(guān)于均數(shù)和率的抽樣分布規(guī)律。答:以 Stata 為例正態(tài)分布資料的樣本均數(shù)的分布模擬。 用記事本寫入下來語句 clearset memory 100mdi 輸入 樣本量 總體均數(shù) 總體標(biāo)準(zhǔn)差 scalar m=1scalar mm=2 scalar oo=3set obs 10000 local j=1gen xx=0gen ss=0 while j=mgen xj=invnorm(uniform()*oo+mm
31、 replace xx=xx+xjrep lace ss=ss+xj*xjlocal j=j+1gen ssd=sqrt(ss-xx*xx/m)/(m-1)replace xx=xx/mdi mean= xx di sd= ssd用文件名 simumean.do 保存在Stata窗口中打入do 路徑 simumean 樣本量 總體均數(shù) 總體標(biāo)準(zhǔn)差 對于 Stata 7.0,輸入下列命令顯示樣本均數(shù)的頻數(shù)圖 graph xx,bin(50) xlabel對于 Stata 8.0,輸入下列命令顯示樣本均數(shù)的頻數(shù)圖graph7 xx,bin(50) xlabel非正態(tài)分布的樣本均數(shù)的分布模擬。 用記
32、事本寫入下來語句 clearset memory 100m di 輸入 樣本量 scalar m=1 set obs 10000local j=1gen xx=0gen ss=0while j=mgen xj=invnorm(uni form()2replace xx=xx+xjreplace ss=ss+xj*xjlocal j=j+1gen ssd=sqrt(ss-xx*xx/m)/(m-1)replace xx=xx/mdi mean= xxdi sd= ssd用文件名 simumean1.do 保存在Stata窗口中打入do 路徑 simumean1 樣本量 總體均數(shù) 總體標(biāo)準(zhǔn)差 對于
33、 Stata 7.0,輸入下列命令顯示樣本均數(shù)的頻數(shù)圖 graph xx,bin(50) xlabel顯示原始資料的頻數(shù)分布圖 graph x1,bin(50) xlabel對于 Stata 8.0,輸入下列命令顯示樣本均數(shù)的頻數(shù)圖 graph7 xx,bin(50) xlabel 顯示原始資料的頻數(shù)分布圖 graph7 x1,bin(50) xlabel 樣本率的分布模擬。 用記事本寫入下來語句 clearset memory 100mdi 輸入 樣本量 總體率 scalar m=1scalar pp=2set obs 10000 local j=1gen xx=0gen ss=0while
34、 j=mreplace xx=xx+int(uniform()+pp)local j=j+1gen ppp=xx/msu ppp用文件名 simumean3.do 保存在Stata窗口中打入do 路徑 simumean3 樣本量 總體率對于Stata 7.0輸入下列命令顯示樣本率的頻數(shù)圖 graph ppp,bin(50) xlabel對于 Stata 8.0,輸入下列命令顯示樣本率的頻數(shù)圖graph7 ppp,bin(50) xlabel7、利用蒙特卡洛方法,產(chǎn)生標(biāo)準(zhǔn)正態(tài)分布的隨機數(shù),并計算樣本方差,驗證方差乘自由度 (n -1)9服從于自由度為n -1的X分布,兩個獨立樣本的方差之比服從于
35、自由度為 1 n - 1, 2 n -1的 F 分布。答:標(biāo)準(zhǔn)正態(tài)分布資料的樣本方差x(n- 1)的分布模擬。用記事本寫入下來語句 clearset memory 100m di 輸入 樣本量 scalar m=1set obs 10000 local j=1gen xx=0gen ss=0while j=mgen xj=i nvno rm(u niform() replace xx=xx+xj replace ss=ss+xj*xj local j=j+1gen ss= ss-xx*xx/m用文件名 simuvariance.do 保存在Stata窗口中打入do 路徑 simuvarianc
36、e.do 樣本量對于Stata 7.0,輸入下列命令顯示樣本均數(shù)的頻數(shù)圖 graph ss,bin(50) xlabel對于 Stata 8.0,輸入下列命令顯示樣本均數(shù)的頻數(shù)圖 graph7 ss,bin(50) xlabelF 分布的模擬。用記事本寫入下來語句 clear set memory 100mdi 輸入 樣本量 1 總體均數(shù) 1 樣本量 2 總體均數(shù) 2 總體標(biāo)準(zhǔn)差 scalar m1=1 local mn 1=1 scalar mm1=2scalar m2=3scalar mm2=4 scalar oo=5 set obs 10000 local j=1gen xx=0gen
37、ss=0gen xx0=0while j=m1replace xx0=invnorm(uniform()*oo+m1replace xx=xx+xx0replace ss=ss+xx0*xx0local j=j+1gen ss1= (ss-xx*xx/m1)/(m1-1)replace ss=0replace xx=0local j=1while j概率為答:對。當(dāng)1 H為真時,作出正確推斷的概率即為1- p 。4.對于0 0 1 0 H :卩=11 H :卩工卩的t檢驗,0 H為真而言,發(fā)生拒絕 0 H 的機會與樣 本量n無關(guān)。答:對0無論樣本量 n 多大,犯第一類錯誤的概率為5. 對于定量
38、資料用 95%可信區(qū)間的公式 0.05/ 2,n 1 X X t S- 圍, 要求資料服從正態(tài)分布或樣本量很大。答:對。二.選擇題1. 在同一總體隨機抽樣,其他條件不變,樣本量越大, 區(qū)間( A )。A 越窄 B 越寬 C 越可靠 D 越穩(wěn)定2. 從兩個不同總體中隨機抽樣,樣本含量相同,則兩總體均數(shù)95可信區(qū)間 (D )。A 標(biāo)準(zhǔn)差小者,可信度大 B 標(biāo)準(zhǔn)差小者,準(zhǔn)確度高 C 標(biāo)準(zhǔn)差小者,可信度大且準(zhǔn)確度高 D 兩者的可信度相同 3其他條件不變,可信度1-a越大,則總體均數(shù)可信區(qū)間(A ) A越寬B越窄C不變D還與第二類錯誤有關(guān)4. 其他條件不變,可信度 1-a 越大,則隨機抽樣所獲得的總體均
39、數(shù)可信區(qū)間將 不包含總體均數(shù)的概率( B )。A 越大 B 越小 C 不變 D 不確定5. 區(qū)間內(nèi)包含總體均數(shù)的概率為( D )。 A 95 B 97.5 C 99 D 100a 0估計總體均數(shù)所在范則總體均數(shù)的95%可信一、是非題6 從某正態(tài)總體中隨機抽樣,樣本含量固定, 區(qū)間內(nèi)包含樣本均數(shù) 的概率為( A )0A 95 B 97.5 C 99 D 不確定 7增大樣本含量,則錯誤的是(A )0A 可信區(qū)間的可信度變大B x S 變小C 同樣可信度情況下,可信區(qū)間變窄 D 抽樣誤差減少8下列公式中,哪一個可以用于正態(tài)分布總體均數(shù)的95%可信區(qū)間的估計(C ) 0A 口 1.96 X B 1.9
40、6 X 口 (TC 0.05(v) X X t S D 0.05(v) X t S 9由兩個獨立樣本計算得到兩個總體均數(shù)的可信區(qū)間,則下列結(jié)論中正確的是如果兩個可信區(qū)間無重疊,可認(rèn)為兩樣本均數(shù)差別無統(tǒng)計意義 如果兩個可信區(qū)間有重疊,可認(rèn)為兩樣本均數(shù)差別有統(tǒng)計意義 如果兩個可信區(qū)間無重疊,可認(rèn)為兩樣本均數(shù)差別有統(tǒng)計意義 以上都不對10在總體方差相等的條件下,由兩個獨立樣本計算兩個總體均數(shù)之差的可信區(qū)( C )0ABCD 間包含了 0,則( B )。ABCD可認(rèn)為兩樣本均數(shù)差別無統(tǒng)計學(xué)意義 可認(rèn)為兩樣本均數(shù)差別有統(tǒng)計學(xué)意義 可認(rèn)為兩總體均數(shù)差別無統(tǒng)計學(xué)意義 可認(rèn)為兩總體均數(shù)差別有統(tǒng)計學(xué)意義11假設(shè)
41、檢驗中的第二類錯誤是指(D )所犯的錯誤。1.96 X 口 (T1.96 X 口 (TA 拒絕了實際上成立的 H0 B 未拒絕實際上成立的 H0C 拒絕了實際上不成立的 H0 D 未拒絕實際上不成立的 H012. 兩樣本均數(shù)比較的假設(shè)檢驗中,差別有統(tǒng)計學(xué)意義時, P 越小,說明( D )。A. 兩樣本均數(shù)差別越大 B. 兩總體均數(shù)差別越大C. 越有理由認(rèn)為兩樣本均數(shù)不同 D. 越有理由認(rèn)為兩總體均數(shù)不同13. 作兩樣本均數(shù)差別的t檢驗中,P值與a值中(A)0A. a值是研究者指定的B . P值是研究者指定的C.兩者意義相同,數(shù)值不同 D .兩者意義相同,數(shù)值相同14. 兩樣本均數(shù)的t檢驗,按0
42、.05的檢驗水準(zhǔn)拒絕H0,若此時推斷有誤,其錯誤 的概率為( A )0A 0.05 B 0.05 C a時,雖然不能拒絕 H0,但不能推斷H0成立。(提示:假設(shè)檢驗是基于反證法的思想)。答:假設(shè)檢驗是基于反證法的思想。拒絕 H0是因為在H0為真的假設(shè)下樣本 統(tǒng)計量出現(xiàn)在小概率事件范圍內(nèi),所以可以推斷 H0非真;反之,在H0為 真的假設(shè)下樣本統(tǒng)計量未出現(xiàn)在小概率事件范圍,只是沒有足夠證據(jù)支持 不能拒絕H0。正如反證法只是尋找推翻假設(shè)的證據(jù),并不是尋找支持假設(shè) 的證據(jù),不能推翻假設(shè)的結(jié)果并不能成為證實假設(shè)成立的證據(jù)。事實上, 不拒絕Ho時犯第二類錯誤的概率P有時還很大,并且無法由研究者直接 控制,
43、所以不拒絕 H0 時,不能直接推斷 H0 成立。2. 下面是18 例冠心病患者高密度脂蛋白 (HDL,g/L) 的測定結(jié)果,請回答下列 問題。0.30, 0.43, 0.26, 0.34, 0.57, 0.49, 0.35, 0.22, 0.33, 0.37, 0.28, 0.35, 0.40, 0.36, 0.42, 0.28, 0.41, 0.301) 本題所研究的總體是什么? 答:滿足者該研究中入選標(biāo)準(zhǔn)的全部冠心病患的高密度脂蛋白 (HDL,g/L) 實際值的全體構(gòu)成的集合。2) 根據(jù)本題的研究背景和研究問題,請用研究背景語言給出本題總體均 數(shù)的具體定義。答:滿足者該研究中入選標(biāo)準(zhǔn)的全部
44、冠心病患的高密度脂蛋白 (HDL,g/L) 實際值的平均數(shù)。3) 試估計本題的總體均數(shù)及其 95%可信區(qū)間,并用通俗的研究背景語言 論述您的結(jié)果。答: X = 0.3589, 0.08567, 18, 0.08567 / 18 0.02X S = n = S = = ,95%可信區(qū)間為:x X t s 0.05,17 =0.3589 2.11X 0.02= (0.3167, 0.4011)。以95%可信度推斷冠心病患者人群的高密度脂蛋白(HDL,g/L) 的平均數(shù)在0.31670.4011 g/L。3. 已知大腸桿菌在飲用水中呈 Poisson 分布,根據(jù)有關(guān)規(guī)定:對于合格的飲 用水而言,平均
45、每升飲用水中的大腸桿菌個數(shù)不超過 2 個,先在某飲用水 生產(chǎn)處抽樣 2L 水,經(jīng)檢測發(fā)現(xiàn) 6 個大腸桿菌,請估計該處的飲用水平均 1L 中的大腸桿菌數(shù)在什么范圍內(nèi)?答:X=6,查Poisson分布總體均數(shù)的可信區(qū)間界值表得,95%的可信區(qū)間為 (2.20/2, 13.06/2) =(1.10, 6.53)。4. 續(xù)第3 題,在實際的衛(wèi)生監(jiān)督執(zhí)法中,一般不進(jìn)行統(tǒng)計分析,但需要根據(jù) 統(tǒng)計學(xué)原理和飲用水衛(wèi)生標(biāo)準(zhǔn),指定一個飲用水大腸桿菌數(shù)的界值:隨機 抽取1L水,當(dāng)檢測到的細(xì)菌數(shù)低于這個界值,可以推斷該處飲用水的平均1L水的大腸桿菌數(shù)不會超過2個,請以95%的可信度確定這個界值。答:卩=2,查Pois
46、son分布總體均數(shù)的95%可信區(qū)間界值表得到大于2的 最小下限為X=6,其95%可信區(qū)間為(2.2,13.1),而X=5的95%可信區(qū) 間為(1.6, 11.7),所以當(dāng)檢測結(jié)果為大腸桿菌數(shù) 6時,可以推斷該處飲 用水的平均每升水的大腸桿菌數(shù) 卩 2,即該飲用水不合格。5. 續(xù)第3 題和第 4 題,請推敲下列描述有何不同,適用于何種情況?1)每1L飲用水中的平均大腸桿菌個數(shù)不超過 2個是合格的2)合格的飲用水中, 1L 飲用水的大腸桿菌個數(shù)不得高于于 2 個3)第3 題中,能否按 1L 水檢測到3 個大腸桿菌估計該處的飲用水平均每每 1L 中的大腸桿菌數(shù)在什么范圍內(nèi),為什么? 答:第一個問題是
47、對于合格的飲用水而言,平均每 1L 飲用水的大腸桿菌個 數(shù)不超過2 (卩 2),也就是在檢測樣品為1升飲用水時,容許樣品中的大 腸桿菌數(shù)超過 2 個。第二個問題是指檢測樣品為 1 升水時,不容許樣品中的大腸桿菌數(shù)超過 2 個。(X 2)3)根據(jù)Poisson分布的95%可信區(qū)間推斷該處的飲用水平均每升中的大腸 桿菌數(shù)在( 0.62, 8.8)第六章一、是非題1. 隨機區(qū)組設(shè)計的檢驗效能一定高于完全隨機設(shè)計 答:錯。如果在完全隨機設(shè)計中,實驗條件和實驗過程控制都非常好,研究對象 的同質(zhì)性非常好, 幾乎不存在可能的混雜因素, 即可以認(rèn)為可能混雜效應(yīng)很小甚 至可以忽略,則完全隨機設(shè)計的檢驗效能可能要
48、高于隨機區(qū)組設(shè)計。2. 隨機對照試驗就是實驗性研究答:對。隨機對照試驗的英文名是 Random control trial,縮寫為RCT在隨機分組前, 隨機對照試驗的研究對象來自同一人群, 通過選擇不同的干預(yù), 構(gòu)成 試驗組和對照組, 由此評價干預(yù)效應(yīng)。 因此隨機對照試驗就是實驗性研究, 但要 注意:實驗性研究未必是隨機對照試驗。3. 隨機對照試驗就是完全隨機設(shè)計 答:錯。隨機對照試驗貫徹了隨機化原則,對照組和實驗組間除實驗因素不同 外,其他條件基本相同, 研究設(shè)計可以是完全隨機對照設(shè)計, 也可以是隨機區(qū)組 設(shè)計。4. 采取隨機分組可以提高檢驗效能 答:錯。采取隨機分組的主要目的是控制或減少混
49、雜因素對結(jié)果的影響,與檢 驗效能沒有直接的連續(xù)。5. 為了研究 A 因素與死亡的關(guān)系,采用隊列研究,但所獲樣本資料不能估計人 群的 A 因素暴露比例。答:對。因為隊列研究是根據(jù) A 因素的不同暴露水平分別入選研究對象,由此 建立不同暴露水平的隊列進(jìn)行隨訪研究的。如按 A 因素暴露和非暴露分別入組 2000 人進(jìn)行隨訪,因此暴露人數(shù)與非暴露人數(shù)是 1: 1,與人群中的暴露比例無 關(guān)。即:隊列研究中的研究對象中的暴露比例是人為確定的, 不是人群的暴露比 例。二、選擇題1. 病例對照研究的主要缺點之一是 CA. 研究周期長 B. 病例不容易收集C. 容易產(chǎn)生選擇性偏倚 D. 容易失訪2.A.C.3.
50、A.C.人病例對照研究的主要優(yōu)點之一是 C 容易失訪 B. 不容易發(fā)生測量偏倚 患病率很低的疾病也適用 D. 很容易選擇和收集對照 病例對照研究最好應(yīng)選擇 D 為對照 健康人 B. 醫(yī)院中未患該疾病的人 醫(yī)院中的正常人 D. 根據(jù)研究背景選擇符合一定條件的未患該疾病的4. 采用配對設(shè)計的主要目的是 B 。A 減少樣本含量 B 減少混雜因素對結(jié)果的影響C 提高統(tǒng)計檢驗的功效 D 有利于統(tǒng)計分析5. 下列說法哪一個是正確的 。A. 采用完全隨機設(shè)計可以使試驗組和對照組同時減少混雜因素的影響B(tài). 采用隨機區(qū)組設(shè)計可以控制了混雜因素對結(jié)果的影響C. 采用隨機區(qū)組設(shè)計可以減少了混雜因素對結(jié)果的影響,當(dāng)效應(yīng)指標(biāo)與研究 因素之間存在混雜效應(yīng)的情
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《保險中介》課件
- 《修改棘皮》課件
- 突發(fā)性聾的健康宣教
- 輸尿管癌的臨床護(hù)理
- 繼發(fā)性痛風(fēng)的健康宣教
- 單純性外陰陰道念珠菌病的健康宣教
- 孕期肛門疼痛的健康宣教
- 《迎駕貢酒團(tuán)購培訓(xùn)》課件
- 風(fēng)濕病性貧血的健康宣教
- 幼年型皮肌炎的臨床護(hù)理
- 中醫(yī)科進(jìn)修匯報
- 隨機森林完整版本
- 原發(fā)性肝癌診療規(guī)范
- 交房維穩(wěn)預(yù)案
- 《親子活動設(shè)計與指導(dǎo)》課件-13-18個月嬰兒親子活動設(shè)計與指導(dǎo)(下)
- 新一代公安信息網(wǎng)安全方案設(shè)計方案
- 2024新人教版初中英語單詞表匯總(七-九年級)中考復(fù)習(xí)必背
- 科技館科普活動方案設(shè)計
- 面對困難永不退縮主題班會課件
- 加強能源革命的推進(jìn)實施方案
- 工廠無線網(wǎng)絡(luò)覆蓋方案
評論
0/150
提交評論