醫(yī)學(xué)統(tǒng)計(jì)學(xué)及其軟件包.ppt_第1頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)及其軟件包.ppt_第2頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)及其軟件包.ppt_第3頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)及其軟件包.ppt_第4頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)及其軟件包.ppt_第5頁(yè)
已閱讀5頁(yè),還剩41頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

醫(yī)學(xué)統(tǒng)計(jì)學(xué)及其軟件包,上海第二醫(yī)科大學(xué) 生物統(tǒng)計(jì)教研室,第一章 緒論,第一節(jié) 醫(yī)學(xué)統(tǒng)計(jì)學(xué), 數(shù)學(xué) 統(tǒng)計(jì)學(xué) 醫(yī)學(xué)統(tǒng)計(jì)學(xué),第一節(jié) 醫(yī)學(xué)統(tǒng)計(jì)學(xué),1.統(tǒng)計(jì)學(xué) (statistics):收集,整理和分析帶有隨機(jī)性的數(shù)據(jù)。 2.醫(yī)學(xué)統(tǒng)計(jì)學(xué) (medical statistics):統(tǒng)計(jì)學(xué)的原理和方法在醫(yī)學(xué)和生物學(xué)中的應(yīng)用。,第一節(jié) 醫(yī)學(xué)統(tǒng)計(jì)學(xué),醫(yī)學(xué)統(tǒng)計(jì)學(xué)的主要內(nèi)容有: 1.統(tǒng)計(jì)研究設(shè)計(jì) 2.統(tǒng)計(jì)描述 3.統(tǒng)計(jì)推斷 4.研究聯(lián)系 5.研究分類,鑒別 6.研究檢測(cè),統(tǒng)計(jì)研究設(shè)計(jì),1.估計(jì)研究對(duì)象的數(shù)量(樣本大小估計(jì)) 2.跟據(jù)研究目的確定對(duì)照的類型 3.保證隨機(jī)化和雙盲原則的貫徹 4.跟據(jù)研究目的確定主要和次要考核指標(biāo) 5.如何收集和匯總數(shù)據(jù)以保證數(shù)據(jù)質(zhì)量 6.如何進(jìn)行統(tǒng)計(jì)分析,統(tǒng)計(jì)研究設(shè)計(jì),1調(diào)查研究或觀察性研究(observational study) 2實(shí)驗(yàn)研究(experimental study),統(tǒng)計(jì)描述(statistical discription),統(tǒng)計(jì)描述指用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)表、統(tǒng)計(jì)圖等方法,對(duì)資料的數(shù)量特征及其分布規(guī)律進(jìn)行測(cè)定和描述。,統(tǒng)計(jì)推斷(statistical inference),統(tǒng)計(jì)推斷指用樣本推斷總體。 總體(population):一個(gè)統(tǒng)計(jì)問(wèn)題所研究對(duì)象的全體。 總體中每一個(gè)研究對(duì)象稱為個(gè)體(individual)。 有限總體:有確定的時(shí)間和空間范圍,總體內(nèi)觀察單 位是有限的。 無(wú)限總體:沒(méi)有時(shí)間和空間范圍限制,因而觀察單位 數(shù)無(wú)限。,樣本(sample):按隨機(jī)的方式從總體中抽取若干個(gè) 體構(gòu)成一個(gè)樣本。 參數(shù)(parameter) :用于描述總體分布的數(shù)字特征 的量。如:, 統(tǒng)計(jì)量(statistics):不包含總體中任何未知參數(shù)的 樣本指標(biāo)和樣本數(shù)據(jù)的函數(shù)。如: ,S,P,統(tǒng)計(jì)推斷(statistical inference),1.參數(shù)估計(jì)(estimation of parameter) 根據(jù)總體中所抽得的樣本,由樣本統(tǒng)計(jì)量估計(jì)總體分布中的未知參數(shù)??煞譃辄c(diǎn)估計(jì)和區(qū)間估計(jì)。 1)點(diǎn)估計(jì)(point estimation):選擇一個(gè)適當(dāng)?shù)臉颖窘y(tǒng)計(jì)量作為總體參數(shù)的估計(jì)值稱為點(diǎn)估計(jì)。,統(tǒng)計(jì)推斷(statistical inference),統(tǒng)計(jì)推斷(statistical inference),2)區(qū)間估計(jì)(interval estimation):根據(jù)一定的精確度要求,確定一個(gè)概率水平,由樣本統(tǒng)計(jì)量計(jì)算出一個(gè)適當(dāng)?shù)膮^(qū)間作為未知總體參數(shù)真值所在的范圍,稱為區(qū)間估計(jì)。稱此概率水平為可信度,或置信度,或可信水平,或置信水平( confidence level)。所估計(jì)的區(qū)間稱為可信區(qū)間或置信區(qū)間(confidence interval),區(qū)間的端點(diǎn)稱為可信限(confidence limit),有上限,下限之分。,例如,估計(jì)用某方法治療某病的治愈率。從患某病的病人總體中隨機(jī)抽得100例病人進(jìn)行治療,治愈50例,則可得樣本治愈率為50%??傮w治愈率的點(diǎn)估計(jì)為50%??傮w治愈率區(qū)間估計(jì),當(dāng)可信度為95%時(shí),總體治愈率的95%可信區(qū)間為40%60%。當(dāng)可信度為99%時(shí),總體治愈率的99%可信區(qū)間為37%63%。,統(tǒng)計(jì)推斷(statistical inference),統(tǒng)計(jì)推斷(statistical inference),統(tǒng)計(jì)推斷(statistical inference),2.假設(shè)檢驗(yàn)(hypothesis testing) 又稱顯著性檢驗(yàn)(significance testing)。 先對(duì)總體的參數(shù)或分布作出某種假設(shè),例如總體為正態(tài)分布,兩個(gè)總體均數(shù)相等,兩總體率相等,然后檢驗(yàn)這個(gè)假設(shè)成立的可能性大小,作出推斷。,統(tǒng)計(jì)推斷(statistical inference),統(tǒng)計(jì)推斷(statistical inference),無(wú)效假設(shè)(null hypothesis)H0 : 12 備擇假設(shè)(alternative hypothesis) H1 :12 然后根據(jù)檢驗(yàn)假設(shè), 1270%,成立的情況 下,計(jì)算由于抽樣誤差得到目前樣本及更極端情況 的可能性大小。本例用卡方檢驗(yàn),得到檢驗(yàn)統(tǒng)計(jì)量 2=9.524,根據(jù)檢驗(yàn)統(tǒng)計(jì)量的分布計(jì)算概率(可 能性大?。㏄值,P=0.002,可能性很小。,統(tǒng)計(jì)推斷(statistical inference),概率論認(rèn)為:在一次試驗(yàn)中小概率事件不可能發(fā)生。 在統(tǒng)計(jì)中,一般公認(rèn)為P0.05為小概率。本例P=0.0020.05,因此可認(rèn)為假如12,即使抽樣誤差也不可能得到目前樣本,于是檢驗(yàn)假設(shè), 12不成立;與檢驗(yàn)假設(shè)對(duì)立的備擇假設(shè)成立,即12 ,A藥組的總體有效率不同于B藥組的總體有效率,從本例情況,A藥組的總體有效率大于B藥組的總體有效率。,統(tǒng)計(jì)推斷(statistical inference),如果本例用卡方檢驗(yàn),得到其可能性大小P=0.08 0.05,這個(gè)概率不是很小,有可能檢驗(yàn)假設(shè), 1 2 ,成立的情況下,由于抽樣誤差得到目前樣本, 所以不能拒絕檢驗(yàn)假設(shè)。 總結(jié)假設(shè)性檢驗(yàn)的過(guò)程。 (1)建立H0,H1和確定顯著性水準(zhǔn)(significance level, 用表示,常取0.05) (2)選擇合適的統(tǒng)計(jì)檢驗(yàn)方法,計(jì)算統(tǒng)計(jì)量。 (3)根據(jù)檢驗(yàn)統(tǒng)計(jì)量的分布計(jì)算概率P值, 根據(jù)P值 作出統(tǒng)計(jì)的推斷結(jié)論。,統(tǒng)計(jì)推斷(statistical inference),P值:根據(jù)H0規(guī)定的總體情況,作隨機(jī)抽樣,獲得 大于等于現(xiàn)有樣本統(tǒng)計(jì)量值的概率。 如果P0.05,則不拒絕H0;0.01P0.05,則在 =0.05水平上,拒絕H0;P0.01 則在=0.01水 平上,拒絕H0。 假設(shè)檢驗(yàn)的特點(diǎn): (1)反證法。 (2)結(jié)論是概率性的,不是絕對(duì)的肯定或否定,有 犯錯(cuò)誤的可能性,假設(shè)檢驗(yàn)時(shí)應(yīng)注意的問(wèn)題,1.要有嚴(yán)密的抽樣研究設(shè)計(jì) 保證樣本的隨機(jī)性 組間的均衡性和可比性:除了對(duì)比的主要因素外其它影響結(jié)果的因素也應(yīng)可比?;蚰茉谫Y料處理時(shí)消除其影響。 2.選用的假設(shè)檢驗(yàn)方法應(yīng)符合其應(yīng)用條件。 研究變量的類型不同,設(shè)計(jì)類型不同,是大樣本還是小樣本等,所用假設(shè)檢驗(yàn)的方法也不同。,3.正確理解檢驗(yàn)假設(shè)和備擇假設(shè) 以兩樣本均數(shù)差異的顯著性檢驗(yàn)為例。 正確的寫(xiě)法: H0:兩總體均數(shù)相等 H1:兩總體均數(shù)不相等 以下是錯(cuò)誤的寫(xiě)法。 H0:兩樣本均數(shù)相等 H1:兩樣本均數(shù)不相等 H0:兩總體均數(shù)無(wú)顯著差異 H1:兩總體均數(shù)有顯著差異 H0:兩樣本均數(shù)無(wú)顯著差異 H1:兩樣本均數(shù)有顯著差異,假設(shè)檢驗(yàn)時(shí)應(yīng)注意的問(wèn)題,假設(shè)檢驗(yàn)時(shí)應(yīng)注意的問(wèn)題,4.正確理解差別有無(wú)顯著性的統(tǒng)計(jì)意義,寫(xiě)好統(tǒng)計(jì)結(jié)論 過(guò)去習(xí)慣: P0.05,兩樣本均數(shù)無(wú)顯著差異 P0.05,兩樣本均數(shù)有顯著差異 P0.01,兩樣本均數(shù)有非常顯著差異 “顯著”容易誤解為相差大,這和醫(yī)學(xué)上的差異大有區(qū)別。 不要混淆統(tǒng)計(jì)上的結(jié)論和專業(yè)上的結(jié)論。,現(xiàn)在主張: P0.05,兩樣本均數(shù)的差異無(wú)統(tǒng)計(jì)學(xué)意義( P0.05 ) P0.05,兩樣本均數(shù)的差異有統(tǒng)計(jì)學(xué)意義( P0.05 ) P0.01,兩樣本均數(shù)的差異有統(tǒng)計(jì)學(xué)意義( P0.01 ) 最好給出具體的P值,如P 0.0345 注意: “兩樣本均數(shù)的差異”,而不是“兩總體均數(shù)的差異” 從兩樣本均數(shù)的差異有統(tǒng)計(jì)學(xué)意義(P 0.0345),可 推斷出兩總體均數(shù)有差異,其結(jié)論錯(cuò)誤的可能性為3.45 %,假設(shè)檢驗(yàn)時(shí)應(yīng)注意的問(wèn)題,兩類誤差,第一類誤差常是可控制的,=0.05,P0.05。 第二類誤差常未知。但也可根據(jù)樣本數(shù)據(jù)計(jì)算得到。 1-又稱為檢驗(yàn)的效能(Power of Test),H0不成立時(shí)拒絕H0的概率。,檢驗(yàn)效能(Power of Test),影響效能的四要素 (1) 客觀上兩種藥物效應(yīng)差異越大, 效能 越大。 (2) 個(gè)體間標(biāo)準(zhǔn)差越小, 效能越大。 (3) 樣本量越大, 效能越大。 (4) 第類誤差的概率越大, 效能越大。 同時(shí)降低兩類誤差的唯一辦法是加大樣本。,檢驗(yàn)效能(Power of Test),例:一項(xiàng)關(guān)于降血壓藥的臨床試驗(yàn)分設(shè)兩組隨機(jī)樣本, 各含15例。一組服用常規(guī)藥, 另一組服用新藥。如果新藥的降壓效果至少比常規(guī)藥平均高出0.8kPa方可考慮在臨床推廣; 據(jù)以往經(jīng)驗(yàn), 不論常規(guī)藥還是這種新藥, 個(gè)體降壓值的標(biāo)準(zhǔn)差約為1kPa。經(jīng)0.05水平的兩組均數(shù)比較的統(tǒng)計(jì)檢驗(yàn),兩組平均降壓效果的差異尚無(wú)統(tǒng)計(jì)學(xué)意義,此事如何理解?,檢驗(yàn)效能(Power of Test),經(jīng)計(jì)算:0.2912, 1-0.7088,可見(jiàn), 如果新藥的降壓 效果比常規(guī)藥高出0.8kPa, 只有70.88%的機(jī)會(huì)被此檢驗(yàn)認(rèn)可 ;如果比常規(guī)藥高出的數(shù)值還不如0.8kPa, 則被埋沒(méi)的機(jī)會(huì)更 大, 必須加大樣本量。如取0.01, 則得n59,即兩組各 含59例時(shí),如果新藥的降壓效果比常規(guī)藥高出0.8kPa, 有 99%的機(jī)會(huì)可檢驗(yàn)出差異有統(tǒng)計(jì)學(xué)意義。 如取0.10, 則得n41 如取0.20, 則得n25,檢驗(yàn)效能(Power of Test),例 一項(xiàng)關(guān)于維生素C預(yù)防感冒作用的研究隨機(jī)抽取兩組正常人各30名, 一組服用維生素C, 另一組服用安慰劑, 欲比較一定時(shí)期內(nèi)發(fā)生感冒的頻率。結(jié)果,安慰劑組有6人發(fā)生感冒, 維生素C組有3人發(fā)生感冒, 經(jīng)0.05水平的檢驗(yàn) ,差異無(wú)統(tǒng)計(jì)學(xué)意義,此事如何理解? 經(jīng)計(jì)算:0.7071, 1-0.2929,檢驗(yàn)效能(Power of Test),可見(jiàn), 此項(xiàng)研究的效能只有29.29%。換言之, 若維 生素C 能使發(fā)生感冒的機(jī)會(huì)減為10%,此項(xiàng)研究只有 29.29%的機(jī)會(huì)發(fā)現(xiàn)這一差異性,約70%的機(jī)會(huì)給出 陰性的結(jié)果。 如取0.01, 則得n461,此項(xiàng)研究需要每組各461名受試者。每組各30例是遠(yuǎn)遠(yuǎn)不夠的。,單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn),雙側(cè)檢驗(yàn)(two-tailed test) H0: 1=2 H1: 12 單側(cè)檢驗(yàn)(one-tailed test) H0: 1=2 H1: 12 (或H1: 12),單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn),單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn),單側(cè)檢驗(yàn)如果誤認(rèn)為是雙側(cè)的,就不易拒絕H0 雙側(cè)檢驗(yàn)如誤用單側(cè)就較易拒絕H0 必須根據(jù)實(shí)際問(wèn)題本身決定使用單側(cè)還是雙側(cè)。通常進(jìn)行的都為雙側(cè)檢驗(yàn);進(jìn)行單側(cè)檢驗(yàn)時(shí)必須特別說(shuō)明,要有充分的理由(另一側(cè)為不可能),并且在實(shí)驗(yàn)設(shè)計(jì)階段就要預(yù)先規(guī)定好。,研究聯(lián)系,分類鑒別研究 檢測(cè)研究,第二節(jié) 一些基本概念,資料的類型 數(shù)值變量計(jì)量資料 分類變量-二分類變量 計(jì)數(shù)資料 無(wú)序多分類變量 有序多分類變量等級(jí)資料,自由度(degree of freedom),泛指事物在N維空間中能自由活動(dòng)的維數(shù)。 在數(shù)學(xué)上自由度是指能自由取值的變量個(gè)數(shù)。,自由度(degree of freedom),第三節(jié) 幾種主要的分布,二項(xiàng)分布(binomial distribution) 二項(xiàng)分布常用于描述二分類變量的分布。 二項(xiàng)分布主要用于率的統(tǒng)計(jì)推斷,如總體率的估計(jì), 樣本率與總體率的比較, 兩樣本率的比較,還可用于 兩分類變量的統(tǒng)計(jì)分析,如logistic回歸等。,正態(tài)分布(normal distribution),正態(tài)分布特征:呈鐘形,以均數(shù)為中心,左右對(duì)稱。,正態(tài)分布(normal distribution),均數(shù):位置參數(shù),增大,曲線向右移動(dòng)。 標(biāo)準(zhǔn)差:形狀參數(shù),增大,數(shù)據(jù)分散,曲線 低平;減小,數(shù)據(jù)集中,曲線高尖。 記為 N(, 2),標(biāo)準(zhǔn)正態(tài)分布:uN(0,1) 正態(tài)曲線下面積分布規(guī)律: (1.96)(1.96)占95%,雙側(cè)尾 部各占2.5%。 (2.58)(2.58)占99%,雙側(cè)尾 部各占0.5%。,正態(tài)分布(normal distribution),正態(tài)分布的重要性 1.正態(tài)分布是很多統(tǒng)計(jì)方法的理論基礎(chǔ),很多統(tǒng) 計(jì)方法要求樣本來(lái)自正態(tài)分布的總體。 2.某些分布,如二項(xiàng)分布等的極限為正態(tài)分布, 當(dāng)樣本量較大時(shí)可按正態(tài)近似的方法來(lái)處理。 3.不少醫(yī)學(xué)資料服從正態(tài)分布或近似正態(tài)分布,有的呈偏態(tài)分布的醫(yī)學(xué)資料可經(jīng)過(guò)變量變換轉(zhuǎn) 換為正態(tài)分布。 4.正態(tài)曲線下面積分布規(guī)律可用于醫(yī)學(xué)正常值范圍和控制實(shí)驗(yàn)中的檢測(cè)誤差。,2分布(2 distribution),2 分布是一種連續(xù)型分布,2變量是相互獨(dú)立的標(biāo)準(zhǔn)正態(tài)變量u的平方和,即 2=u12+u22+uv2 其中df=。 用途:檢驗(yàn)資料的實(shí)際觀察頻數(shù)與按某種檢驗(yàn)理論 所算得的理論頻數(shù)是否相符。,t 分布,t分布(t distribution)是一種連續(xù)型分布,隨機(jī)變量t是標(biāo)準(zhǔn)正態(tài)分布變量與 df=的2分布中的比值,即 用途:t檢驗(yàn)、回歸系數(shù)及相關(guān)系數(shù)檢驗(yàn)等。,F 分布,F= F分布有二個(gè)自由度1和2 ,它們分別為分子 的自由度與分母的自由度。 用途:多個(gè)均數(shù)比較的方差分析, 也用于回歸 分析中假設(shè)檢驗(yàn),以及方差齊性檢驗(yàn)等。,第四節(jié) 統(tǒng)計(jì)軟件包簡(jiǎn)介,一. SAS統(tǒng)計(jì)軟件包(Statistical Analysis System) 二.BMDP統(tǒng)計(jì)軟件包(Biomedical Computer Programs) 三.SPSS統(tǒng)計(jì)軟件包(Statistical Package for the Social Science) 四.SYSTAT統(tǒng)計(jì)軟件包(the System for Statistics) 五.GLIM統(tǒng)計(jì)軟件包(Generalized Linear Interactive Model System),第四節(jié) 統(tǒng)計(jì)軟件包簡(jiǎn)介,六MINITAB統(tǒng)計(jì)軟件包(MINITAB statistical software) 七EPIINFO軟件包(statistics program for epidemiology on microcomputers) 八SLIDE軟件包 九STATPAL

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論