樣本含量估計(jì)課件_第1頁(yè)
樣本含量估計(jì)課件_第2頁(yè)
樣本含量估計(jì)課件_第3頁(yè)
樣本含量估計(jì)課件_第4頁(yè)
樣本含量估計(jì)課件_第5頁(yè)
已閱讀5頁(yè),還剩113頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2022/10/281樣本含量估計(jì)estimationofsamplesize第十七章流行病與統(tǒng)計(jì)教研室2022/10/221樣本含量估計(jì)estimationof2022/10/282第一節(jié)樣本含量估計(jì)的意義及應(yīng)具備的條件【例17-1】已知糖尿病患病率一般為2%~3%,現(xiàn)擬采用單純隨機(jī)抽樣方法從某社區(qū)抽取隨機(jī)樣本,以了解該社區(qū)人群中糖尿病患病率。該社區(qū)人口為3000人,希望誤差不超過1%,取a=0.05,需調(diào)查多少人?2022/10/222第一節(jié)樣本含量估計(jì)的意義及應(yīng)具備的2022/10/283一、樣本含量估計(jì)的意義樣本含量(samplesize)又稱樣本容量、樣本例數(shù),是指在抽樣研究中,每個(gè)樣本所包含的觀察單位的數(shù)量。估計(jì)樣本含量的意義是研究設(shè)計(jì)的重要內(nèi)容之一,它是研究設(shè)計(jì)中重復(fù)性原則的體現(xiàn),即各組的受試對(duì)象都應(yīng)有一定的數(shù)量,即每個(gè)組都有足夠的重復(fù)數(shù)(樣本量)。在調(diào)查研究、臨床觀察或?qū)嶒?yàn)研究中,首先要考慮樣本含量(或樣本大?。┑膯栴}。2022/10/223一、樣本含量估計(jì)的意義樣本含量(sam2022/10/284應(yīng)注意克服兩種傾向樣本例數(shù)過大增加實(shí)際工作中的困難,可能引入更多的混雜因素,不易控制研究的質(zhì)量,影響研究結(jié)果的真實(shí)性和可靠性,另外還會(huì)造成人力、物力和時(shí)間上不必要的浪費(fèi)樣本例數(shù)過少致使抽樣誤差較大,所得指標(biāo)不夠穩(wěn)定,檢驗(yàn)效能低,容易得出假陰性的結(jié)果,影響結(jié)論的可靠程度2022/10/224應(yīng)注意克服兩種傾向2022/10/285

樣本含量的估計(jì)是在保證研究結(jié)論具有一定可靠性的條件下,確定最少的調(diào)查單位或?qū)嶒?yàn)單位數(shù)。2022/10/225樣本含量的估計(jì)是在保證2022/10/286二、樣本含量估計(jì)應(yīng)具備的條件I型錯(cuò)誤a的概率或區(qū)間估計(jì)中的可信度Ⅱ型錯(cuò)誤的概率,或檢驗(yàn)效能容許誤差或差值,即欲比較或估計(jì)的總體參數(shù)與樣本統(tǒng)計(jì)量之間或總體參數(shù)相差所容許的限度??傮w平均數(shù)、總體率或總體標(biāo)準(zhǔn)差2022/10/226二、樣本含量估計(jì)應(yīng)具備的條件I型錯(cuò)誤2022/10/287第二節(jié)調(diào)查設(shè)計(jì)常用樣本含量估計(jì)方法一、單純隨機(jī)抽樣的樣本含量估計(jì)(一)估計(jì)總體均數(shù)的樣本含量(二)估計(jì)總體率的樣本含量二、其它概率抽樣方法的樣本含量估計(jì)(一)分層抽樣所需樣本含量估計(jì)(二)整群抽樣所需樣本含量估計(jì)2022/10/227第二節(jié)調(diào)查設(shè)計(jì)常用樣本含量估計(jì)方法2022/10/288單純隨機(jī)抽樣的樣本含量估計(jì)

估計(jì)總體均數(shù)的樣本含量公式:式中,S為總體標(biāo)準(zhǔn)差的估計(jì)值為容許誤差需要查t界值表,可先用標(biāo)準(zhǔn)正態(tài)分布中的代入,算出一個(gè)初步估計(jì)的n,再計(jì)算初步的自由度v,可查表得,以此帶入公式,可算得第二次估計(jì)的n,如此迭代,直到穩(wěn)定為止。2022/10/228單純隨機(jī)抽樣的樣本含量估計(jì)估計(jì)總體均2022/10/289若是從有限總體抽樣,尚需進(jìn)一步校正

2022/10/2292022/10/2810【例17-2】某研究者擬用抽樣方法了解冠心病患者血清膽固醇的平均水平,希望誤差不超過0.2mmlo/L,根據(jù)文獻(xiàn),冠心病患者血清膽固醇標(biāo)準(zhǔn)差約為0.94mmol/L,如取a=0.05,則需調(diào)查多少人?

允許誤差=0.2估計(jì)標(biāo)準(zhǔn)差s=0.942022/10/2210【例17-2】某研究者擬用抽樣方法2022/10/2811【估計(jì)步驟】1.先以=1.96代替,可得2.以自由度,查t界值表得雙側(cè),則因此,本研究應(yīng)調(diào)查88例冠心病患者。2022/10/2211【估計(jì)步驟】2022/10/2812第二節(jié)調(diào)查設(shè)計(jì)常用樣本含量估計(jì)方法一、單純隨機(jī)抽樣的樣本含量估計(jì)(一)估計(jì)總體均數(shù)的樣本含量(二)估計(jì)總體率的樣本含量二、其它概率抽樣方法的樣本含量估計(jì)(一)分層抽樣所需樣本含量估計(jì)(二)整群抽樣所需樣本含量估計(jì)2022/10/2212第二節(jié)調(diào)查設(shè)計(jì)常用樣本含量估計(jì)方2022/10/2813

估計(jì)總體率的樣本含量公式:(用弧度)(用度)2022/10/2213估計(jì)總體率的樣本含量(用弧度)(2022/10/2814當(dāng)π趨向0.5,且n較大時(shí),隨機(jī)抽樣所得的樣本率才趨向于正態(tài)分布或近似正態(tài)分布:或

2022/10/2214當(dāng)π趨向0.5,且n較大時(shí),隨機(jī)抽2022/10/2815【例17-3】某研究者欲了解20歲~24歲婦女生育率,希望誤差不超過2%,a取0.05,問需調(diào)查多少人?本例未給出20歲~24歲婦女生育率π的估計(jì)值,可取p=0.52022/10/2215【例17-3】某研究者欲了解202022/10/2816若根據(jù)文獻(xiàn)知20歲~24歲婦女生育率為5%~25%,則p可取其中較接近0.5的值,即25%2022/10/2216若根據(jù)文獻(xiàn)知20歲~24歲婦女生育率2022/10/2817【例17-1】已知糖尿病患病率一般為2%~3%,現(xiàn)擬采用單純隨機(jī)抽樣方法從某社區(qū)抽取隨機(jī)樣本,以了解該社區(qū)人群中糖尿病患病率。該社區(qū)人口為3000人,希望誤差不超過1%,取a=0.05,需調(diào)查多少人?2022/10/2217【例17-1】已知糖尿病患病率一般為2022/10/2818第二節(jié)調(diào)查設(shè)計(jì)常用樣本含量估計(jì)方法一、單純隨機(jī)抽樣的樣本含量估計(jì)(一)估計(jì)總體均數(shù)的樣本含量(二)估計(jì)總體率的樣本含量二、其它概率抽樣方法的樣本含量估計(jì)(一)分層抽樣所需樣本含量估計(jì)(二)整群抽樣所需樣本含量估計(jì)2022/10/2218第二節(jié)調(diào)查設(shè)計(jì)常用樣本含量估計(jì)方2022/10/2819分層抽樣所需樣本含量估計(jì)按比例分配是按各層觀察單位數(shù)占總體觀察單位數(shù)N的比例抽取樣本,使各層樣本含量與總樣本含量n之比等于各層觀察單位數(shù)與總體觀察單位數(shù)N之比,可按下式計(jì)算:2022/10/2219分層抽樣所需樣本含量估計(jì)2022/10/28202022/10/22202022/10/2821最優(yōu)分配是按總體各層觀察單位數(shù)的多少和標(biāo)準(zhǔn)差(或各層率)大小來分配各層的觀察單位數(shù)(均數(shù)的抽樣)(率的抽樣)2022/10/2221最優(yōu)分配(均數(shù)的抽樣)(率的抽樣)2022/10/28222022/10/22222022/10/2823第二節(jié)調(diào)查設(shè)計(jì)常用樣本含量估計(jì)方法一、單純隨機(jī)抽樣的樣本含量估計(jì)(一)估計(jì)總體均數(shù)的樣本含量(二)估計(jì)總體率的樣本含量二、其它概率抽樣方法的樣本含量估計(jì)(一)分層抽樣所需樣本含量估計(jì)(二)整群抽樣所需樣本含量估計(jì)2022/10/2223第二節(jié)調(diào)查設(shè)計(jì)常用樣本含量估計(jì)方2022/10/2824整群抽樣估計(jì)總體率的樣本含量估計(jì)公式:有限總體需校正:無限總體應(yīng)調(diào)查的群體數(shù)預(yù)調(diào)查的群體數(shù)預(yù)調(diào)查的群體中第i群調(diào)查人數(shù)預(yù)調(diào)查的群體中第i群某事件的發(fā)生頻率群的平均調(diào)查人數(shù)平均發(fā)生頻率2022/10/2224整群抽樣估計(jì)總體率的樣本含量估計(jì)無限2022/10/2825【例17-5】為了解某市40歲以上人群高血壓患病率,擬對(duì)全市55個(gè)街區(qū)采用整群抽樣調(diào)查,隨機(jī)預(yù)調(diào)查了2個(gè)街區(qū),第一街區(qū)調(diào)查了4180人,高血壓病人1060人,患病率為0.2536;第二街區(qū)調(diào)查了4970人,高血壓病人720人,患病率為0.1449,問需要調(diào)查幾個(gè)街區(qū)?(,),,2022/10/2225【例17-5】為了解某市40歲以上2022/10/2826因?yàn)樵撌袨橛邢蘅傮w,K=55

需抽樣調(diào)查3個(gè)街區(qū)。2022/10/22262022/10/2827概率抽樣方法不同,樣本含量的估計(jì)方法不同單純隨機(jī)抽樣、整群抽樣和分層抽樣的樣本含量估計(jì)都有專用公式系統(tǒng)抽樣,因抽樣間隔不同,其抽樣誤差也不同,故系統(tǒng)抽樣尚無統(tǒng)一的方法估計(jì)樣本含量2022/10/2227概率抽樣方法不同,樣本含量的估計(jì)方法2022/10/2828一、定量資料的樣本含量估計(jì)(一)樣本均數(shù)與總體均數(shù)比較所需樣本含量的估計(jì)(二)完全隨機(jī)設(shè)計(jì)兩樣本均數(shù)比較樣本含量估計(jì)(三)配對(duì)設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)(四)完全隨機(jī)設(shè)計(jì)多組均數(shù)比較所需樣本含量估計(jì)(五)隨機(jī)區(qū)組設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)第三節(jié)實(shí)驗(yàn)設(shè)計(jì)樣本含量估計(jì)方法2022/10/2228一、定量資料的樣本含量估計(jì)第三節(jié)實(shí)2022/10/2829樣本均數(shù)與總體均數(shù)比較樣本含量的估計(jì)公式:式中,和分別是I型和II型錯(cuò)誤的概率;估計(jì)的標(biāo)準(zhǔn)差;和為t界值無效假設(shè)和備選假設(shè)間的差距如無效假設(shè)為H0:,H1:則

2022/10/2229樣本均數(shù)與總體均數(shù)比較樣本含量的估計(jì)2022/10/2830【例17-6】已知健康婦女血清膽固醇平均水平為4.4mmol/L,現(xiàn)欲研究服用類固醇類避孕藥對(duì)血清膽固醇水平的影響(雙側(cè),即不知升高還是降低)。改變值≤0.2mmol/L時(shí)作為無改變,改變值≥1.0mmol/L時(shí)作為有改變,,問需研究多少人?

2022/10/2230【例17-6】已知健康婦女血清膽2022/10/2831估計(jì)步驟用和估計(jì)和=1.0-0.2=0.8查t界值表,得雙側(cè)單側(cè)2022/10/2231估計(jì)步驟=1.0-0.2=0.8查2022/10/2832一、定量資料的樣本含量估計(jì)(一)樣本均數(shù)與總體均數(shù)比較所需樣本含量的估計(jì)(二)完全隨機(jī)設(shè)計(jì)兩樣本均數(shù)比較樣本含量估計(jì)(三)配對(duì)設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)(四)完全隨機(jī)設(shè)計(jì)多組均數(shù)比較所需樣本含量估計(jì)(五)隨機(jī)區(qū)組設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)2022/10/2232一、定量資料的樣本含量估計(jì)2022/10/2833完全隨機(jī)設(shè)計(jì)兩樣本均數(shù)比較所需樣本含量的估計(jì)

兩樣本例數(shù)相等時(shí):

兩樣本例數(shù)不相等時(shí):2022/10/2233完全隨機(jī)設(shè)計(jì)兩樣本均數(shù)比較所需樣本含2022/10/2834【例17-8】為研究A、B兩種處理對(duì)血流量的影響,已知?jiǎng)游飳?shí)驗(yàn)時(shí),A處理使血流量平均增加1.8ml/min,B處理平均增加2.5ml/min,兩處理的標(biāo)準(zhǔn)差均為1.1ml/min,規(guī)定雙側(cè),試估計(jì)各組的樣本含量。

2022/10/2234【例17-8】為研究A、B兩種處理2022/10/2835估計(jì)步驟用和估計(jì)和查t界值表,得雙側(cè)單側(cè)2022/10/2235估計(jì)步驟查t界值表,得雙側(cè)單側(cè)2022/10/2836若規(guī)定樣本分配比為

即A組樣本含量為37,B組樣本含量為87。若要求相同的檢驗(yàn)效能,在兩組例數(shù)相等時(shí)所需樣本含量較少,因此在進(jìn)行研究設(shè)計(jì)時(shí),最好取兩樣本例數(shù)相等。2022/10/2236若規(guī)定樣本分配比為2022/10/2837一、定量資料的樣本含量估計(jì)(一)樣本均數(shù)與總體均數(shù)比較所需樣本含量的估計(jì)(二)完全隨機(jī)設(shè)計(jì)兩樣本均數(shù)比較樣本含量估計(jì)(三)配對(duì)設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)(四)完全隨機(jī)設(shè)計(jì)多組均數(shù)比較所需樣本含量估計(jì)(五)隨機(jī)區(qū)組設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)2022/10/2237一、定量資料的樣本含量估計(jì)2022/10/2838配對(duì)設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)公式:式中,、分別是檢驗(yàn)水準(zhǔn)a和犯Ⅱ型錯(cuò)誤的概率β對(duì)應(yīng)的t值;sd為每對(duì)觀察對(duì)象差值的總體標(biāo)準(zhǔn)差的估計(jì)值;為研究者確定的差值,即;n為所需樣本含量的對(duì)子數(shù)。

2022/10/2238配對(duì)設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)2022/10/2839【例17-9】研究新藥提升白細(xì)胞的療效,由預(yù)試驗(yàn)得出用藥前后白細(xì)胞差值的標(biāo)準(zhǔn)差為1.5×103個(gè)/mm3,當(dāng)白細(xì)胞平均上升1×103個(gè)/mm3時(shí)認(rèn)為臨床有效,單側(cè)臨床試驗(yàn)需要多少人?單側(cè)2022/10/2239【例17-9】研究新藥提升白細(xì)胞的2022/10/2840以查t界值表,即本研究需要21對(duì)(因?yàn)楸狙芯渴亲陨砼鋵?duì)設(shè)計(jì),所以為21人)參與試驗(yàn)。2022/10/2240以2022/10/2841一、定量資料的樣本含量估計(jì)(一)樣本均數(shù)與總體均數(shù)比較所需樣本含量的估計(jì)(二)完全隨機(jī)設(shè)計(jì)兩樣本均數(shù)比較樣本含量估計(jì)(三)配對(duì)設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)(四)完全隨機(jī)設(shè)計(jì)多組均數(shù)比較所需樣本含量估計(jì)(五)隨機(jī)區(qū)組設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)2022/10/2241一、定量資料的樣本含量估計(jì)2022/10/2842完全隨機(jī)設(shè)計(jì)多組均數(shù)比較樣本含量估計(jì)公式:式中,k為組數(shù);為各組的均數(shù),;為各組的標(biāo)準(zhǔn)差;為界值,由附表22查得。計(jì)算時(shí)先用自由度時(shí)的代入式中求,再用時(shí)的代入式中求,如此往復(fù),直至結(jié)果趨于穩(wěn)定為止。2022/10/2242完全隨機(jī)設(shè)計(jì)多組均數(shù)比較樣本含量估計(jì)2022/10/2843一、定量資料的樣本含量估計(jì)(一)樣本均數(shù)與總體均數(shù)比較所需樣本含量的估計(jì)(二)完全隨機(jī)設(shè)計(jì)兩樣本均數(shù)比較樣本含量估計(jì)(三)配對(duì)設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)(四)完全隨機(jī)設(shè)計(jì)多組均數(shù)比較所需樣本含量估計(jì)(五)隨機(jī)區(qū)組設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)

2022/10/2243一、定量資料的樣本含量估計(jì)2022/10/2844二、定性資料的樣本含量估計(jì)(一)樣本率與已知總體率比較樣本含量估計(jì)(二)兩樣本率比較時(shí)所需樣本含量估計(jì)(三)多個(gè)樣本率比較時(shí)所需的樣本大小2022/10/2244二、定性資料的樣本含量估計(jì)2022/10/2845樣本率與已知總體率比較時(shí)樣本含量估計(jì)公式:式中,為已知總體率;為預(yù)期試驗(yàn)結(jié)果的總體率,為預(yù)期試驗(yàn)結(jié)果的總體率與已知總體率的差值,即此公式適合大樣本的研究。2022/10/2245樣本率與已知總體率比較時(shí)樣本含量估計(jì)2022/10/2846【例17-12】用傳統(tǒng)方法治療運(yùn)動(dòng)性脛骨結(jié)節(jié)骨骺損傷的有效率約為85%,現(xiàn)采用小鋼針做脛骨結(jié)節(jié)骨骺穿刺,加上物理治療方法,估計(jì)有效率為95%,現(xiàn)欲比較新療法的有效率是否高于傳統(tǒng)療法,選定a=0.05(單側(cè)),β=0.1則至少觀察多少病例?估計(jì)步驟:本例2022/10/2246【例17-12】用傳統(tǒng)方法治療運(yùn)2022/10/2847本試驗(yàn)需至少觀察110個(gè)病例2022/10/22472022/10/2848二、定性資料的樣本含量估計(jì)(一)樣本率與已知總體率比較樣本含量估計(jì)(二)兩樣本率比較時(shí)所需樣本含量估計(jì)(三)多個(gè)樣本率比較時(shí)所需的樣本大小2022/10/2248二、定性資料的樣本含量估計(jì)2022/10/2849兩樣本率比較時(shí)所需樣本含量估計(jì)兩樣本含量相等時(shí)兩樣本含量不相等時(shí)2022/10/2249兩樣本率比較時(shí)所需樣本含量估計(jì)2022/10/2850二、定性資料的樣本含量估計(jì)(一)樣本率與已知總體率比較樣本含量估計(jì)(二)兩樣本率比較時(shí)所需樣本含量估計(jì)(三)多個(gè)樣本率比較時(shí)所需的樣本大小2022/10/2250二、定性資料的樣本含量估計(jì)2022/10/2851多個(gè)樣本率比較時(shí)所需的樣本含量公式:式中,n為每組樣本含量;Pmax、Pmin分別為最大率與最小率;λ為自由度時(shí)的界值;k為組數(shù)。按給定的a、β可從附表25查到λ。2022/10/2251多個(gè)樣本率比較時(shí)所需的樣本含量2022/10/2852檢驗(yàn)效能的意義檢驗(yàn)效能又稱假設(shè)檢驗(yàn)的功效(powerofatest),用1-β表示意義當(dāng)所研究的總體確有差別時(shí),按照檢驗(yàn)水準(zhǔn)a能夠發(fā)現(xiàn)這種差別(拒絕H0)的能力。影響要素樣本含量、客觀事物差異大小、個(gè)體間變異大小和a值增大檢驗(yàn)效能(增大1-β

)一是增大a,二是增大樣本含量。第四節(jié)檢驗(yàn)效能的估計(jì)2022/10/2252檢驗(yàn)效能的意義第四節(jié)檢驗(yàn)效能的估2022/10/2853當(dāng)假設(shè)檢驗(yàn)根據(jù)P>0.05作出無統(tǒng)計(jì)學(xué)意義的結(jié)論時(shí),研究者則面臨著犯II型錯(cuò)誤的可能性,應(yīng)當(dāng)考慮是否總體間的差異確實(shí)存在,但由于檢驗(yàn)效能不足而未能把該差異反映出來。(一般要求75%以上)假設(shè)檢驗(yàn)中P>0.05作出“陰性”結(jié)論時(shí),附上檢驗(yàn)效能或該試驗(yàn)II型錯(cuò)誤的概率2022/10/2253當(dāng)假設(shè)檢驗(yàn)根據(jù)P>0.05作出無統(tǒng)計(jì)2022/10/2854檢驗(yàn)效能的估計(jì)樣本均數(shù)與已知總體均數(shù)比較時(shí)檢驗(yàn)效能的估計(jì)公式:根據(jù)tβ,v值大小,應(yīng)用累計(jì)概率分布函數(shù)得到

β值1?β即為檢驗(yàn)效能2022/10/2254檢驗(yàn)效能的估計(jì)2022/10/2855檢驗(yàn)效能的估計(jì)兩樣本均數(shù)比較時(shí)檢驗(yàn)效能的估計(jì)公式:S

為兩樣本合并標(biāo)準(zhǔn)差

n為任意一組的樣本含量(兩組樣本含量相同)分別為無差異和有差異的判斷界值2022/10/2255檢驗(yàn)效能的估計(jì)兩樣本均數(shù)比較時(shí)檢驗(yàn)效2022/10/2856兩樣本率比較時(shí)檢驗(yàn)效能的估計(jì)公式:P1和P2是估計(jì)的兩個(gè)率P=(P1+P2)/2n

為兩組例數(shù)相等時(shí)的實(shí)際樣本含量計(jì)算出Zβ后,可從正態(tài)分布表中查得β

2022/10/2256兩樣本率比較時(shí)檢驗(yàn)效能的估計(jì)2022/10/2857直線相關(guān)分析的檢驗(yàn)效能估計(jì)公式:

n為樣本含量

r為相關(guān)系數(shù)計(jì)算出Zβ后,可用概率分布函數(shù)計(jì)算或從正態(tài)分布表中查得β

(附表3)2022/10/2257直線相關(guān)分析的檢驗(yàn)效能估計(jì)2022/10/2858檢驗(yàn)效能即當(dāng)所研究的總體確有差別時(shí),按照檢驗(yàn)水準(zhǔn)a能夠發(fā)現(xiàn)這種差別的能力。若要增大檢驗(yàn)效能,一是增大a,二是增大樣本含量。檢驗(yàn)效能的計(jì)算與資料類型、研究目的等有關(guān)在假設(shè)檢驗(yàn)中,一般要求檢驗(yàn)效能達(dá)75%以上2022/10/2258檢驗(yàn)效能即當(dāng)所研究的總體確有差別時(shí),2022/10/2859本節(jié)要求熟悉樣本含量估計(jì)應(yīng)具備的條件了解調(diào)查設(shè)計(jì)、實(shí)驗(yàn)設(shè)計(jì)常用樣本含量的估計(jì)方法掌握檢驗(yàn)效能的意義及主要影響因素2022/10/2259本節(jié)要求2022/10/2860樣本含量估計(jì)estimationofsamplesize第十七章流行病與統(tǒng)計(jì)教研室2022/10/221樣本含量估計(jì)estimationof2022/10/2861第一節(jié)樣本含量估計(jì)的意義及應(yīng)具備的條件【例17-1】已知糖尿病患病率一般為2%~3%,現(xiàn)擬采用單純隨機(jī)抽樣方法從某社區(qū)抽取隨機(jī)樣本,以了解該社區(qū)人群中糖尿病患病率。該社區(qū)人口為3000人,希望誤差不超過1%,取a=0.05,需調(diào)查多少人?2022/10/222第一節(jié)樣本含量估計(jì)的意義及應(yīng)具備的2022/10/2862一、樣本含量估計(jì)的意義樣本含量(samplesize)又稱樣本容量、樣本例數(shù),是指在抽樣研究中,每個(gè)樣本所包含的觀察單位的數(shù)量。估計(jì)樣本含量的意義是研究設(shè)計(jì)的重要內(nèi)容之一,它是研究設(shè)計(jì)中重復(fù)性原則的體現(xiàn),即各組的受試對(duì)象都應(yīng)有一定的數(shù)量,即每個(gè)組都有足夠的重復(fù)數(shù)(樣本量)。在調(diào)查研究、臨床觀察或?qū)嶒?yàn)研究中,首先要考慮樣本含量(或樣本大?。┑膯栴}。2022/10/223一、樣本含量估計(jì)的意義樣本含量(sam2022/10/2863應(yīng)注意克服兩種傾向樣本例數(shù)過大增加實(shí)際工作中的困難,可能引入更多的混雜因素,不易控制研究的質(zhì)量,影響研究結(jié)果的真實(shí)性和可靠性,另外還會(huì)造成人力、物力和時(shí)間上不必要的浪費(fèi)樣本例數(shù)過少致使抽樣誤差較大,所得指標(biāo)不夠穩(wěn)定,檢驗(yàn)效能低,容易得出假陰性的結(jié)果,影響結(jié)論的可靠程度2022/10/224應(yīng)注意克服兩種傾向2022/10/2864

樣本含量的估計(jì)是在保證研究結(jié)論具有一定可靠性的條件下,確定最少的調(diào)查單位或?qū)嶒?yàn)單位數(shù)。2022/10/225樣本含量的估計(jì)是在保證2022/10/2865二、樣本含量估計(jì)應(yīng)具備的條件I型錯(cuò)誤a的概率或區(qū)間估計(jì)中的可信度Ⅱ型錯(cuò)誤的概率,或檢驗(yàn)效能容許誤差或差值,即欲比較或估計(jì)的總體參數(shù)與樣本統(tǒng)計(jì)量之間或總體參數(shù)相差所容許的限度??傮w平均數(shù)、總體率或總體標(biāo)準(zhǔn)差2022/10/226二、樣本含量估計(jì)應(yīng)具備的條件I型錯(cuò)誤2022/10/2866第二節(jié)調(diào)查設(shè)計(jì)常用樣本含量估計(jì)方法一、單純隨機(jī)抽樣的樣本含量估計(jì)(一)估計(jì)總體均數(shù)的樣本含量(二)估計(jì)總體率的樣本含量二、其它概率抽樣方法的樣本含量估計(jì)(一)分層抽樣所需樣本含量估計(jì)(二)整群抽樣所需樣本含量估計(jì)2022/10/227第二節(jié)調(diào)查設(shè)計(jì)常用樣本含量估計(jì)方法2022/10/2867單純隨機(jī)抽樣的樣本含量估計(jì)

估計(jì)總體均數(shù)的樣本含量公式:式中,S為總體標(biāo)準(zhǔn)差的估計(jì)值為容許誤差需要查t界值表,可先用標(biāo)準(zhǔn)正態(tài)分布中的代入,算出一個(gè)初步估計(jì)的n,再計(jì)算初步的自由度v,可查表得,以此帶入公式,可算得第二次估計(jì)的n,如此迭代,直到穩(wěn)定為止。2022/10/228單純隨機(jī)抽樣的樣本含量估計(jì)估計(jì)總體均2022/10/2868若是從有限總體抽樣,尚需進(jìn)一步校正

2022/10/2292022/10/2869【例17-2】某研究者擬用抽樣方法了解冠心病患者血清膽固醇的平均水平,希望誤差不超過0.2mmlo/L,根據(jù)文獻(xiàn),冠心病患者血清膽固醇標(biāo)準(zhǔn)差約為0.94mmol/L,如取a=0.05,則需調(diào)查多少人?

允許誤差=0.2估計(jì)標(biāo)準(zhǔn)差s=0.942022/10/2210【例17-2】某研究者擬用抽樣方法2022/10/2870【估計(jì)步驟】1.先以=1.96代替,可得2.以自由度,查t界值表得雙側(cè),則因此,本研究應(yīng)調(diào)查88例冠心病患者。2022/10/2211【估計(jì)步驟】2022/10/2871第二節(jié)調(diào)查設(shè)計(jì)常用樣本含量估計(jì)方法一、單純隨機(jī)抽樣的樣本含量估計(jì)(一)估計(jì)總體均數(shù)的樣本含量(二)估計(jì)總體率的樣本含量二、其它概率抽樣方法的樣本含量估計(jì)(一)分層抽樣所需樣本含量估計(jì)(二)整群抽樣所需樣本含量估計(jì)2022/10/2212第二節(jié)調(diào)查設(shè)計(jì)常用樣本含量估計(jì)方2022/10/2872

估計(jì)總體率的樣本含量公式:(用弧度)(用度)2022/10/2213估計(jì)總體率的樣本含量(用弧度)(2022/10/2873當(dāng)π趨向0.5,且n較大時(shí),隨機(jī)抽樣所得的樣本率才趨向于正態(tài)分布或近似正態(tài)分布:或

2022/10/2214當(dāng)π趨向0.5,且n較大時(shí),隨機(jī)抽2022/10/2874【例17-3】某研究者欲了解20歲~24歲婦女生育率,希望誤差不超過2%,a取0.05,問需調(diào)查多少人?本例未給出20歲~24歲婦女生育率π的估計(jì)值,可取p=0.52022/10/2215【例17-3】某研究者欲了解202022/10/2875若根據(jù)文獻(xiàn)知20歲~24歲婦女生育率為5%~25%,則p可取其中較接近0.5的值,即25%2022/10/2216若根據(jù)文獻(xiàn)知20歲~24歲婦女生育率2022/10/2876【例17-1】已知糖尿病患病率一般為2%~3%,現(xiàn)擬采用單純隨機(jī)抽樣方法從某社區(qū)抽取隨機(jī)樣本,以了解該社區(qū)人群中糖尿病患病率。該社區(qū)人口為3000人,希望誤差不超過1%,取a=0.05,需調(diào)查多少人?2022/10/2217【例17-1】已知糖尿病患病率一般為2022/10/2877第二節(jié)調(diào)查設(shè)計(jì)常用樣本含量估計(jì)方法一、單純隨機(jī)抽樣的樣本含量估計(jì)(一)估計(jì)總體均數(shù)的樣本含量(二)估計(jì)總體率的樣本含量二、其它概率抽樣方法的樣本含量估計(jì)(一)分層抽樣所需樣本含量估計(jì)(二)整群抽樣所需樣本含量估計(jì)2022/10/2218第二節(jié)調(diào)查設(shè)計(jì)常用樣本含量估計(jì)方2022/10/2878分層抽樣所需樣本含量估計(jì)按比例分配是按各層觀察單位數(shù)占總體觀察單位數(shù)N的比例抽取樣本,使各層樣本含量與總樣本含量n之比等于各層觀察單位數(shù)與總體觀察單位數(shù)N之比,可按下式計(jì)算:2022/10/2219分層抽樣所需樣本含量估計(jì)2022/10/28792022/10/22202022/10/2880最優(yōu)分配是按總體各層觀察單位數(shù)的多少和標(biāo)準(zhǔn)差(或各層率)大小來分配各層的觀察單位數(shù)(均數(shù)的抽樣)(率的抽樣)2022/10/2221最優(yōu)分配(均數(shù)的抽樣)(率的抽樣)2022/10/28812022/10/22222022/10/2882第二節(jié)調(diào)查設(shè)計(jì)常用樣本含量估計(jì)方法一、單純隨機(jī)抽樣的樣本含量估計(jì)(一)估計(jì)總體均數(shù)的樣本含量(二)估計(jì)總體率的樣本含量二、其它概率抽樣方法的樣本含量估計(jì)(一)分層抽樣所需樣本含量估計(jì)(二)整群抽樣所需樣本含量估計(jì)2022/10/2223第二節(jié)調(diào)查設(shè)計(jì)常用樣本含量估計(jì)方2022/10/2883整群抽樣估計(jì)總體率的樣本含量估計(jì)公式:有限總體需校正:無限總體應(yīng)調(diào)查的群體數(shù)預(yù)調(diào)查的群體數(shù)預(yù)調(diào)查的群體中第i群調(diào)查人數(shù)預(yù)調(diào)查的群體中第i群某事件的發(fā)生頻率群的平均調(diào)查人數(shù)平均發(fā)生頻率2022/10/2224整群抽樣估計(jì)總體率的樣本含量估計(jì)無限2022/10/2884【例17-5】為了解某市40歲以上人群高血壓患病率,擬對(duì)全市55個(gè)街區(qū)采用整群抽樣調(diào)查,隨機(jī)預(yù)調(diào)查了2個(gè)街區(qū),第一街區(qū)調(diào)查了4180人,高血壓病人1060人,患病率為0.2536;第二街區(qū)調(diào)查了4970人,高血壓病人720人,患病率為0.1449,問需要調(diào)查幾個(gè)街區(qū)?(,),,2022/10/2225【例17-5】為了解某市40歲以上2022/10/2885因?yàn)樵撌袨橛邢蘅傮w,K=55

需抽樣調(diào)查3個(gè)街區(qū)。2022/10/22262022/10/2886概率抽樣方法不同,樣本含量的估計(jì)方法不同單純隨機(jī)抽樣、整群抽樣和分層抽樣的樣本含量估計(jì)都有專用公式系統(tǒng)抽樣,因抽樣間隔不同,其抽樣誤差也不同,故系統(tǒng)抽樣尚無統(tǒng)一的方法估計(jì)樣本含量2022/10/2227概率抽樣方法不同,樣本含量的估計(jì)方法2022/10/2887一、定量資料的樣本含量估計(jì)(一)樣本均數(shù)與總體均數(shù)比較所需樣本含量的估計(jì)(二)完全隨機(jī)設(shè)計(jì)兩樣本均數(shù)比較樣本含量估計(jì)(三)配對(duì)設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)(四)完全隨機(jī)設(shè)計(jì)多組均數(shù)比較所需樣本含量估計(jì)(五)隨機(jī)區(qū)組設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)第三節(jié)實(shí)驗(yàn)設(shè)計(jì)樣本含量估計(jì)方法2022/10/2228一、定量資料的樣本含量估計(jì)第三節(jié)實(shí)2022/10/2888樣本均數(shù)與總體均數(shù)比較樣本含量的估計(jì)公式:式中,和分別是I型和II型錯(cuò)誤的概率;估計(jì)的標(biāo)準(zhǔn)差;和為t界值無效假設(shè)和備選假設(shè)間的差距如無效假設(shè)為H0:,H1:則

2022/10/2229樣本均數(shù)與總體均數(shù)比較樣本含量的估計(jì)2022/10/2889【例17-6】已知健康婦女血清膽固醇平均水平為4.4mmol/L,現(xiàn)欲研究服用類固醇類避孕藥對(duì)血清膽固醇水平的影響(雙側(cè),即不知升高還是降低)。改變值≤0.2mmol/L時(shí)作為無改變,改變值≥1.0mmol/L時(shí)作為有改變,,問需研究多少人?

2022/10/2230【例17-6】已知健康婦女血清膽2022/10/2890估計(jì)步驟用和估計(jì)和=1.0-0.2=0.8查t界值表,得雙側(cè)單側(cè)2022/10/2231估計(jì)步驟=1.0-0.2=0.8查2022/10/2891一、定量資料的樣本含量估計(jì)(一)樣本均數(shù)與總體均數(shù)比較所需樣本含量的估計(jì)(二)完全隨機(jī)設(shè)計(jì)兩樣本均數(shù)比較樣本含量估計(jì)(三)配對(duì)設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)(四)完全隨機(jī)設(shè)計(jì)多組均數(shù)比較所需樣本含量估計(jì)(五)隨機(jī)區(qū)組設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)2022/10/2232一、定量資料的樣本含量估計(jì)2022/10/2892完全隨機(jī)設(shè)計(jì)兩樣本均數(shù)比較所需樣本含量的估計(jì)

兩樣本例數(shù)相等時(shí):

兩樣本例數(shù)不相等時(shí):2022/10/2233完全隨機(jī)設(shè)計(jì)兩樣本均數(shù)比較所需樣本含2022/10/2893【例17-8】為研究A、B兩種處理對(duì)血流量的影響,已知?jiǎng)游飳?shí)驗(yàn)時(shí),A處理使血流量平均增加1.8ml/min,B處理平均增加2.5ml/min,兩處理的標(biāo)準(zhǔn)差均為1.1ml/min,規(guī)定雙側(cè),試估計(jì)各組的樣本含量。

2022/10/2234【例17-8】為研究A、B兩種處理2022/10/2894估計(jì)步驟用和估計(jì)和查t界值表,得雙側(cè)單側(cè)2022/10/2235估計(jì)步驟查t界值表,得雙側(cè)單側(cè)2022/10/2895若規(guī)定樣本分配比為

即A組樣本含量為37,B組樣本含量為87。若要求相同的檢驗(yàn)效能,在兩組例數(shù)相等時(shí)所需樣本含量較少,因此在進(jìn)行研究設(shè)計(jì)時(shí),最好取兩樣本例數(shù)相等。2022/10/2236若規(guī)定樣本分配比為2022/10/2896一、定量資料的樣本含量估計(jì)(一)樣本均數(shù)與總體均數(shù)比較所需樣本含量的估計(jì)(二)完全隨機(jī)設(shè)計(jì)兩樣本均數(shù)比較樣本含量估計(jì)(三)配對(duì)設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)(四)完全隨機(jī)設(shè)計(jì)多組均數(shù)比較所需樣本含量估計(jì)(五)隨機(jī)區(qū)組設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)2022/10/2237一、定量資料的樣本含量估計(jì)2022/10/2897配對(duì)設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)公式:式中,、分別是檢驗(yàn)水準(zhǔn)a和犯Ⅱ型錯(cuò)誤的概率β對(duì)應(yīng)的t值;sd為每對(duì)觀察對(duì)象差值的總體標(biāo)準(zhǔn)差的估計(jì)值;為研究者確定的差值,即;n為所需樣本含量的對(duì)子數(shù)。

2022/10/2238配對(duì)設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)2022/10/2898【例17-9】研究新藥提升白細(xì)胞的療效,由預(yù)試驗(yàn)得出用藥前后白細(xì)胞差值的標(biāo)準(zhǔn)差為1.5×103個(gè)/mm3,當(dāng)白細(xì)胞平均上升1×103個(gè)/mm3時(shí)認(rèn)為臨床有效,單側(cè)臨床試驗(yàn)需要多少人?單側(cè)2022/10/2239【例17-9】研究新藥提升白細(xì)胞的2022/10/2899以查t界值表,即本研究需要21對(duì)(因?yàn)楸狙芯渴亲陨砼鋵?duì)設(shè)計(jì),所以為21人)參與試驗(yàn)。2022/10/2240以2022/10/28100一、定量資料的樣本含量估計(jì)(一)樣本均數(shù)與總體均數(shù)比較所需樣本含量的估計(jì)(二)完全隨機(jī)設(shè)計(jì)兩樣本均數(shù)比較樣本含量估計(jì)(三)配對(duì)設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)(四)完全隨機(jī)設(shè)計(jì)多組均數(shù)比較所需樣本含量估計(jì)(五)隨機(jī)區(qū)組設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)2022/10/2241一、定量資料的樣本含量估計(jì)2022/10/28101完全隨機(jī)設(shè)計(jì)多組均數(shù)比較樣本含量估計(jì)公式:式中,k為組數(shù);為各組的均數(shù),;為各組的標(biāo)準(zhǔn)差;為界值,由附表22查得。計(jì)算時(shí)先用自由度時(shí)的代入式中求,再用時(shí)的代入式中求,如此往復(fù),直至結(jié)果趨于穩(wěn)定為止。2022/10/2242完全隨機(jī)設(shè)計(jì)多組均數(shù)比較樣本含量估計(jì)2022/10/28102一、定量資料的樣本含量估計(jì)(一)樣本均數(shù)與總體均數(shù)比較所需樣本含量的估計(jì)(二)完全隨機(jī)設(shè)計(jì)兩樣本均數(shù)比較樣本含量估計(jì)(三)配對(duì)設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)(四)完全隨機(jī)設(shè)計(jì)多組均數(shù)比較所需樣本含量估計(jì)(五)隨機(jī)區(qū)組設(shè)計(jì)均數(shù)比較時(shí)所需樣本含量估計(jì)

2022/10/2243一、定量資料的樣本含量估計(jì)2022/10/28103二、定性資料的樣本含量估計(jì)(一)樣本率與已知總體率比較樣本含量估計(jì)(二)兩樣本率比較時(shí)所需樣本含量估計(jì)(三)多個(gè)樣本率比較時(shí)所需的樣本大小2022/10/2244二、定性資料的樣本含量估計(jì)2022/10/28104樣本率與已知總體率比較時(shí)樣本含量估計(jì)公式:式中,為已知總體率;為預(yù)期試驗(yàn)結(jié)果的總體率,為預(yù)期試驗(yàn)結(jié)果的總體率與已知總體率的差值,即此公式適合大樣本的研究。2022/10/2245樣本率與已知總體率比較時(shí)樣本含量估計(jì)2022/10/28105【例17-12】用傳統(tǒng)方法治療運(yùn)動(dòng)性脛骨結(jié)節(jié)骨骺損傷的有效率約為85%,現(xiàn)采用小鋼針做脛骨結(jié)節(jié)骨骺穿刺,加上物理治療方法,估計(jì)有效率為95%,現(xiàn)欲比較新療法的有效率是否高于傳統(tǒng)療法,選定a=0.05(單側(cè)),β=0.1則至少觀察多少病例?估計(jì)步驟:本例2022/10/

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論