版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
緒論
Introduction一、醫(yī)學(xué)統(tǒng)計學(xué)的意義
1.統(tǒng)計學(xué)(statistics):應(yīng)用數(shù)學(xué)的原理與方法,研究數(shù)據(jù)的搜集、整理與分析的科學(xué),對不確定性數(shù)據(jù)作出科學(xué)的推斷。2.醫(yī)學(xué)統(tǒng)計學(xué)(statisticsofmedicine):統(tǒng)計學(xué)的原理與方法應(yīng)用於醫(yī)學(xué)科研與實(shí)踐。一、醫(yī)學(xué)統(tǒng)計學(xué)的意義
3.統(tǒng)計學(xué)方法的特點(diǎn):(1)用數(shù)量反映品質(zhì)1)體格檢查(量血壓、脈搏…)→個體健康品質(zhì)2)考試分?jǐn)?shù)→個體學(xué)習(xí)品質(zhì)
3)期望壽命——反映人群健康狀況的指標(biāo)4)嬰兒死亡率——反映衛(wèi)生服務(wù)品質(zhì)的指標(biāo)………….一、醫(yī)學(xué)統(tǒng)計學(xué)的意義
(2)用群體歸納個體請同學(xué)們回答:2002年長沙市7歲男孩有多高?1)7歲男孩身高有高有矮2)n=100,平均身高=119.5cm95%的長沙市7歲男孩的身高在110.20cm~129.20cm之間二、統(tǒng)計學(xué)中的幾個基本概念1、研究單位(觀察單位、unit)和變數(shù)(variable)、變數(shù)值(valueofvariable)
(1)、研究單位(unit):研究中的個體(individual),是根據(jù)研究目的確定的。
二、統(tǒng)計學(xué)中的幾個基本概念例如:研究7歲男孩身高的正常值範(fàn)圍一個人研究大學(xué)生視力一只眼睛研究水污染情況一毫升水研究細(xì)胞變性一個細(xì)胞研究肝癌的地區(qū)分佈一個地區(qū)二、統(tǒng)計學(xué)中的幾個基本概念(2)變數(shù)(variable):研究單位的研究特徵。例如:研究7歲男孩身高的正常值範(fàn)圍變數(shù):身高(3)變數(shù)值(valueofvariable)二、統(tǒng)計學(xué)中的幾個基本概念變數(shù)值(valueofvariable):變數(shù)的觀察結(jié)果。例如:研究7歲男孩身高變數(shù)值:測得的身高值(120.2cm,118.6cm,121.8cm,…)研究某人群性別構(gòu)成變數(shù)值:男、女。二、統(tǒng)計學(xué)中的幾個基本概念2、同質(zhì)(homogeneity)和變異(variation)(1)、同質(zhì)(homogeneity):根據(jù)研究目的給研究單位確定的相同性質(zhì)。研究長沙市2004年7歲男孩身高的正常值範(fàn)圍?同質(zhì):同長沙市、同7歲、同男孩、同無影響身高的疾病。二、統(tǒng)計學(xué)中的幾個基本概念(2)、變異(variation)變異(variation):同質(zhì)研究單位中變數(shù)值間的差異。例如:1)長沙市2004年7歲男孩身高有高有矮2)相同的藥方治療相同的疾病的病人,療效有好有壞二、統(tǒng)計學(xué)中的幾個基本概念3、總體(population)和樣本(sample)(1)、總體(population):是根據(jù)研究目的確定的同質(zhì)研究單位的全體。更確切地說是同質(zhì)研究單位某種變數(shù)值的集合。例如:調(diào)查某地2002年正常成年男子的紅細(xì)胞數(shù)的正常值範(fàn)圍二、統(tǒng)計學(xué)中的幾個基本概念研究單位:一個人變數(shù):紅細(xì)胞數(shù)同質(zhì):同某地、同2002年、同成年男子、同正常??傮w:1)某地所有的正常成年男子2)某地所有的正常成年男子的紅細(xì)胞數(shù)二、統(tǒng)計學(xué)中的幾個基本概念1)有限總體(finitepopulation):研究單位數(shù)是有限的例如:調(diào)查某地2002年正常成年男子的紅細(xì)胞數(shù)的正常值範(fàn)圍2)無限總體(infinitepopulation):研究單位數(shù)是無限的例如:高血壓患者←無時間、空間限制。二、統(tǒng)計學(xué)中的幾個基本概念(2)樣本(sample):是總體中抽取的有代表性的一部分。注意:隨機(jī)抽樣(無主觀性)樣本含量(sample
size):樣本中包含的研究單位數(shù)。例如:某藥治療高血壓患者30名樣本含量(n)為30二、統(tǒng)計學(xué)中的幾個基本概念4、參數(shù)(parameter)和統(tǒng)計量(statistic)(1)參數(shù)(parameter):根據(jù)總體個體值統(tǒng)計計算出來的描述總體的特徵量。一般用希臘字母表示(2)、統(tǒng)計量(statistic):根據(jù)樣本個體值統(tǒng)計計算出來的描述樣本的特徵量。一般用拉丁字母表示二、統(tǒng)計學(xué)中的幾個基本概念總體參數(shù)一般是不知道的統(tǒng)計學(xué)抽樣研究的目的就是:樣本統(tǒng)計量→總體參數(shù)二、統(tǒng)計學(xué)中的幾個基本概念5、系統(tǒng)誤差(systematicerror)、非系統(tǒng)誤差(nonsystematicerror)、抽樣誤差(samplingerror)誤差(error)是指實(shí)際觀察值與觀察真值之差、樣本指標(biāo)與總體指標(biāo)之差。二、統(tǒng)計學(xué)中的幾個基本概念(1)、系統(tǒng)誤差(systematicerror):由於儀器未校正、測量者感官的某種障礙、醫(yī)生掌握療效標(biāo)準(zhǔn)偏高或偏低等原因,使觀察值不是分散在真值兩側(cè),而是有方向性、系統(tǒng)性或週期性地偏離真值。例如:測量血糖,有斑氏法和葡萄糖氧化法,斑氏法的測量結(jié)果偏高←易受體內(nèi)還原性物質(zhì)的影響。二、統(tǒng)計學(xué)中的幾個基本概念這類誤差可以通過實(shí)驗(yàn)設(shè)計和技術(shù)措施來消除或使之減少。
觀察性研究由於組間不可比性產(chǎn)生的系統(tǒng)誤差稱為偏倚(bias),如吸煙組的平均年齡大於吸煙組,兩組死亡率的差異包含年齡偏倚。二、統(tǒng)計學(xué)中的幾個基本概念(2)、非系統(tǒng)誤差(nonsystematicerror)由於研究者偶然失誤而造成的誤差。例如:儀器失靈、抄錯數(shù)據(jù)、點(diǎn)錯小數(shù)點(diǎn)、寫錯單位等,亦稱過失誤差(grosserror)這類誤差應(yīng)當(dāng)通過認(rèn)真檢查核對予以清除,否則將會影響研究結(jié)果的準(zhǔn)確性。二、統(tǒng)計學(xué)中的幾個基本概念(3)、抽樣誤差(samplingerror):由於抽樣所造成的樣本統(tǒng)計量與總體參數(shù)的差別。例如:=120.0cmn=100N=5萬→=118.6cm特點(diǎn):1)不可避免性2)有統(tǒng)計規(guī)律性二、統(tǒng)計學(xué)中的幾個基本概念產(chǎn)生原因:個體差異(生物變異)二、統(tǒng)計學(xué)中的幾個基本概念6、頻率(relativefrequency)、概率(probability)、小概率事件.(1)、頻率(relativefreguency):
一次隨機(jī)試驗(yàn)有幾種可能結(jié)果,在重複進(jìn)行試驗(yàn)時,個別結(jié)果看來是偶然發(fā)生的,但當(dāng)重複試驗(yàn)次數(shù)相當(dāng)多時,將顯現(xiàn)某種規(guī)律性。例如,投擲一枚硬幣,結(jié)果不外乎出現(xiàn)“正面”與“反面”兩種,現(xiàn)在,我們看一擲幣模擬試驗(yàn):二、統(tǒng)計學(xué)中的幾個基本概念實(shí)驗(yàn)者投擲次數(shù)出現(xiàn)“正面”次數(shù)頻率HuPingcheng111.0000HuPingcheng200.0000HuPingcheng320.6667HuPingcheng430.7500HuPingcheng530.6000HuPingcheng620.4000HuPingcheng740.5714Buffon404020480.5069K.Pearson1200060190.5016K.Pearson24000120120.5005二、統(tǒng)計學(xué)中的幾個基本概念可見,在相同條件下重複試驗(yàn),試驗(yàn)結(jié)果為“正面”或“反面”雖不能事先斷定,但我們知道試驗(yàn)的所有可能結(jié)果只有兩種。
在重複多次後,出現(xiàn)“正面”或“反面”這個結(jié)果的比例稱之為頻率。二、統(tǒng)計學(xué)中的幾個基本概念.(2)、概率(probability)概率是度量隨機(jī)事件發(fā)生可能性大小的一個數(shù)值。
設(shè)在相同條件下,獨(dú)立地重複n次試驗(yàn),隨機(jī)事件A出現(xiàn)
次,則稱為隨機(jī)事件A出現(xiàn)的頻率。當(dāng)n逐漸增大時,頻率
趨向於一個常數(shù),則稱該常數(shù)為隨機(jī)事件A的概率,可記為P(A),簡記為。0≤P(A)≤1二、統(tǒng)計學(xué)中的幾個基本概念0<P(A)<1隨機(jī)事件
P(A)=1必然事件
P(A)=0不可能事件。二、統(tǒng)計學(xué)中的幾個基本概念頻率是就樣本而言的,而概率從總體的意義上說的,m/n是概率p(A)的估計值。試驗(yàn)次數(shù)越多,估計越可靠。二、統(tǒng)計學(xué)中的幾個基本概念(3)小概率事件:統(tǒng)計分析中的很多結(jié)論都基於一定置信程度下的概率推斷,習(xí)慣上將稱為小概率事件,我們認(rèn)為小概率事件在一次試驗(yàn)中不可能發(fā)生。二、統(tǒng)計學(xué)中的幾個基本概念湖南風(fēng)采:中獎概率大約為:1/671萬交通事故:發(fā)生概率為:1/20萬三、統(tǒng)計資料的類型變數(shù)與統(tǒng)計資料的分類方法1.概述2.數(shù)值變數(shù)(numericalvariable)和計量資料(measurementdata)3.無序分類變數(shù)(unorderedcategoriesvariable)和計數(shù)資料(enumerationdata)4.有序分類變數(shù)(ordinalcategoriesvariable)和等級資料(rankeddata)三、統(tǒng)計資料的類型1.概述
數(shù)值變數(shù)………………..構(gòu)成計量資料分類變數(shù)無序分類變數(shù)……………...構(gòu)成計數(shù)資料
有序分類變數(shù)……………...構(gòu)成等級資料三、統(tǒng)計資料的類型2.數(shù)值變數(shù)與計量資料1).數(shù)值變數(shù)(numericalvariable):變數(shù)值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。如:身高(cm)、體重(kg)、血壓(pa)、
坐高/身高。2).計量資料(measurementdata):由一群個體的數(shù)值變數(shù)值構(gòu)成的資料,即一群變數(shù)值。如:長沙市99年7歲男孩身高值(120.2cm,118.6cm,121.8cm…)三、統(tǒng)計資料的類型3.無序分類變數(shù)與計數(shù)資料1).無序分類變數(shù)(unorderedcategoriesvariable):變數(shù)值是定性的,有類別。特點(diǎn):類別是客觀存在的,各類無秩序,可任意排列;類與類之間界限清楚,(理論上)不會錯判。如:性別:男、女。血型:O、A、B、AB。2).計數(shù)資料(enumerationdata):一群個體按無序分類變數(shù)的類別清點(diǎn)每類有多少個個體,即分類個體數(shù)。如:衛(wèi)生統(tǒng)計學(xué)教研室教師性別構(gòu)成:男:6,女:7。某人群血型構(gòu)成:O:20A:35B:30AB:10三、統(tǒng)計資料的類型4.有序分類變數(shù)與等級資料1).有序分類變數(shù)(ordinalcategoriesvariable):變數(shù)值是定性的、分等級。特點(diǎn):等級是主觀劃分的,各級沒有大小但有秩序,必須從低到高或由高到低;級和級之間界限模糊,可能錯判。如:療效:無效、好轉(zhuǎn)、顯效、治癒。血清反應(yīng):–、+、+、++ 2).等級資料(rankeddata):一群個體按有序分類變數(shù)的級別清點(diǎn)每級有多少個個體,即分級個體數(shù)。如:某地某人群EB病毒抗體反應(yīng):–:65
+:2+:3++:1四、醫(yī)學(xué)統(tǒng)計工作的基本步驟1、設(shè)計(design)專業(yè)設(shè)計
統(tǒng)計設(shè)計調(diào)查設(shè)計醫(yī)學(xué)科研設(shè)計實(shí)驗(yàn)設(shè)計臨床實(shí)驗(yàn)設(shè)計
醫(yī)學(xué)科研設(shè)計的程式
科研選題:選題又叫立題,確定所要研究的問題。選題是科研的起點(diǎn),也是關(guān)係到成敗的關(guān)鍵。(1)題意產(chǎn)生:(綜述)背景材料來源:個人經(jīng)驗(yàn)的積累;向有關(guān)專家請教;
文獻(xiàn)檢索等.專業(yè)設(shè)計文獻(xiàn)檢索的要點(diǎn)
(1)有助於認(rèn)識本課題的重要性(2)瞭解有關(guān)的既往研究工作情況(3)瞭解有關(guān)研究現(xiàn)狀(4)尋找可借鑒的研究方法(5)注意有關(guān)的不同見解與爭論。如:與****商榷類文章專業(yè)設(shè)計文獻(xiàn)檢索的幾種查法(1)先查國內(nèi)文獻(xiàn),再查國外文獻(xiàn)(2)先查綜述性文章,後原始文章。(3)先近期後遠(yuǎn)期(4)先核心期刊後一般期刊。專業(yè)設(shè)計
綜述性文章:是收集大量文獻(xiàn)資料經(jīng)過分析綜合,結(jié)合自己的工作和體會整理成的文章。它是對某一課題或新進(jìn)展作出的總結(jié),並指明發(fā)展方向,有較大的參考價值,是專題性文獻(xiàn)資料最集中的表現(xiàn)形式。
專業(yè)設(shè)計科研選題的原則(1)創(chuàng)新性:包括探索和創(chuàng)新兩個連續(xù)的過程,創(chuàng)新就是選擇前人沒有解決或沒有完全解決的問題。是本學(xué)科的空白點(diǎn),或者將會在理論上或應(yīng)用上有新的發(fā)展和補(bǔ)充。(2)科學(xué)性:以科學(xué)理論為指導(dǎo),符合客觀規(guī)律。(3)先進(jìn)性:先進(jìn)性是相對的,有國際先進(jìn)和國內(nèi)先進(jìn)。更重要的是結(jié)合實(shí)際條件選擇適合的先進(jìn)技術(shù)。(4)可行性:研究課題的主要技術(shù)指標(biāo)實(shí)現(xiàn)的可能性。它包括人、財、物的支持和工作基礎(chǔ)。專業(yè)設(shè)計選題方法(1)從招標(biāo)範(fàn)圍中選題。(2)從碰到的問題中選題(3)從文獻(xiàn)的空白點(diǎn)選題(4)從已有的課題延伸中選題(5)從改變研究內(nèi)容組合中選題(6)從其他學(xué)科移植中選題。專業(yè)設(shè)計四、醫(yī)學(xué)統(tǒng)計工作的基本步驟統(tǒng)計設(shè)計的內(nèi)容要包括資料的收集、整理和分析全過和的設(shè)想和安排。例如:研究目的和假說?研究對象和研究單位?研究因素(變數(shù))?收集哪些原始資料?用什麼方式和方法取得這些原始資料?怎樣整理匯總和計算統(tǒng)計指標(biāo)?如何控制誤差?預(yù)期會得到什麼結(jié)果?需要多少經(jīng)費(fèi)?統(tǒng)統(tǒng)計設(shè)計四、醫(yī)學(xué)統(tǒng)計工作的基本步驟在研究者對統(tǒng)計設(shè)計的構(gòu)思過程中,有以下幾個問題最為關(guān)鍵:
如何進(jìn)行抽樣?如何安排設(shè)計所規(guī)定的干預(yù)措施或稱處理(treatment)。要達(dá)到研究目的應(yīng)抽取多少個觀察單位?如何在諸多的影響因素中,分離出研究同素對結(jié)果的效應(yīng)?統(tǒng)計設(shè)計四、醫(yī)學(xué)統(tǒng)計工作的基本步驟(1)、對照的原則
對照(control)原則,即在均衡條件下實(shí)現(xiàn)實(shí)驗(yàn)組與對照組間科學(xué)對比的原則,它回答如何從諸多影響因素中,分離出研究因素對實(shí)驗(yàn)結(jié)果的效應(yīng)問題。所謂均衡性,即可比性,是指在對比組中,除研究因素不同外,或施加的處理不同外,其他影響實(shí)驗(yàn)結(jié)果的非研究因素,包括實(shí)驗(yàn)過程中的實(shí)驗(yàn)條件和輔助措施,都應(yīng)相同。統(tǒng)計設(shè)計無對照的研究誇大了門腔分流手術(shù)的作用表1-2
關(guān)於門腔分流手術(shù)的51次研究結(jié)果對照方式 門腔分流手術(shù)的價值小計
非常支持 支持 不支持
無對照 24 7 1 32非隨機(jī)對照10 3 2 15
隨機(jī)對照0 1 3 4
合計 34 11 6 51統(tǒng)計設(shè)計統(tǒng)計學(xué)家Student
1930年2月至6月主持的牛奶營養(yǎng)試驗(yàn)的現(xiàn)場觀察研究:對照組(1萬兒童)飲奶組(1萬兒童)對照組飲奶組年齡(歲)體重(磅)結(jié)論:對照組體重>飲奶組統(tǒng)計設(shè)計四、醫(yī)學(xué)統(tǒng)計工作的基本步驟(2)、重複(repetition)的原則
重複(repetition
)原則,即確定樣本含量的原則,它回答至少應(yīng)抽取多少個觀察單位的問題。
統(tǒng)計設(shè)計四、醫(yī)學(xué)統(tǒng)計工作的基本步驟(3)、隨機(jī)化(randomization)的原則1)、
隨機(jī)抽樣(randomizedsampling):指總體中的每一個觀察單位都有同等機(jī)會進(jìn)入樣本;2)、隨機(jī)分配(randomizedallocation):指本次研究所選定的實(shí)驗(yàn)受試對象都有同等機(jī)會進(jìn)入根據(jù)研究目的而設(shè)定的處理組和對照組。統(tǒng)計設(shè)計四、醫(yī)學(xué)統(tǒng)計工作的基本步驟2、收集資料(collectionofdata)(1)資料來源第一手資料1)
經(jīng)常性:統(tǒng)計報表(傳染病報表、職業(yè)病報表、醫(yī)院工作報表、死亡登記、疫情報告等),工作記錄(衛(wèi)生監(jiān)督記錄、健康檢查記錄、病歷等);2)一時性:專題調(diào)查、實(shí)驗(yàn)或臨床試驗(yàn)。第二手資料:已公佈的資料,如數(shù)據(jù)銀行、全國、全省衛(wèi)生統(tǒng)計資料。
四、醫(yī)學(xué)統(tǒng)計工作的基本步驟(2)、資料要求
1).完整:觀察單位及觀察專案完整。
2)準(zhǔn)確:即真實(shí)、可靠。真實(shí)是統(tǒng)計學(xué)的靈魂。
3).及時:即時限性。如人口普查規(guī)定調(diào)查開始日期和截止日期。四、醫(yī)學(xué)統(tǒng)計工作的基本步驟3、整理(sortingdata)資料
整理資料即原始數(shù)據(jù)的條理化、系統(tǒng)化的過程。DataCollectionDataAnalysisDataScreening
Timeconsuming,eventediousFundamentaltoanhonestanalysisofthedataTheissuesshouldbeconcernedindatascreeningTheaccuracyofthedataMissingdataOutliersThefitbetweenyourdataandtheassumptionsPerfectornear-perfectcorrelationsamongvariables四、醫(yī)學(xué)統(tǒng)計工作的基本步驟4、分析(analysisofdata)資料任務(wù):計算有關(guān)指標(biāo),反映數(shù)據(jù)的綜合特徵、闡明事物的內(nèi)在聯(lián)繫和規(guī)律。工具:1)foxbase資料庫2)spssforwindows11.03)SAS四、醫(yī)學(xué)統(tǒng)計工作的基本步驟統(tǒng)計描述統(tǒng)計分析統(tǒng)計推斷參數(shù)估計
假設(shè)檢驗(yàn)五、學(xué)習(xí)醫(yī)學(xué)統(tǒng)計學(xué)應(yīng)注意的問題1、醫(yī)學(xué)統(tǒng)計學(xué)研究的是群體的數(shù)量特徵↑適當(dāng)?shù)慕y(tǒng)計指標(biāo)2、學(xué)會統(tǒng)計學(xué)的思維方法抽樣研究→抽樣誤差→結(jié)論具有概率性
↑醫(yī)學(xué)專業(yè)知識解釋
五、學(xué)習(xí)醫(yī)學(xué)統(tǒng)計學(xué)應(yīng)注意的問題3、正確選用統(tǒng)計學(xué)方法(1)資料類型不同→統(tǒng)計學(xué)方法不同(2)設(shè)計類型不同→統(tǒng)計學(xué)方法不同(3)研究目的不同→統(tǒng)計學(xué)方法不同………..ContentFrequencydistributionDescriptionofcentraltendencyMeasuresofdispersionNormaldistributionRangeofreferencevalue第一節(jié)頻數(shù)分佈
一、頻數(shù)分佈表(frequencytable):例2-1從某單位1999年的職工體檢資料中獲得101名正常成年女子的血清總膽固醇()的測量結(jié)果如下,試編制頻數(shù)分佈表。
編制步驟如下:1.求極差
:
極差(range)也稱全距,即最大值和最小值之差,記作R。本例:。
2.確定組距(i):組段數(shù)通常取組
10-15組本例組距
3.寫組段:組下限(L):每個組段的起點(diǎn)組上限(U):每個組段的終點(diǎn)
組
段
2.30~
2.60~
2.90~
3.20~
…5.60~5.902.30~2.60~
4.分組段劃記並統(tǒng)計頻數(shù)
2.30~2.60~
頻數(shù)表:由各組段及其頻數(shù)所構(gòu)成的統(tǒng)計表。二、頻數(shù)分佈圖三、頻數(shù)表和頻數(shù)分佈圖用途
1.描述頻數(shù)分佈的類型
(1)對稱分佈:若各組段的頻數(shù)以頻數(shù)最多組段為中心左右兩側(cè)大體對稱,就認(rèn)為該資料是對稱分佈
(2)偏態(tài)分佈:1)右偏態(tài)分佈(skewedtotherightdistribution)也稱正偏態(tài)分佈(positiveskewnessdistribution):右側(cè)的組段數(shù)多於左側(cè)的組段數(shù),頻數(shù)向右側(cè)拖尾
2)左偏態(tài)分佈(skewedtotheleftdistribution)也稱負(fù)偏態(tài)分佈(negativeskewnessdistribution):左側(cè)的組段數(shù)多於右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾
2.描述頻數(shù)分佈的特徵
①變異的範(fàn)圍在2.30~5.90②有明顯的統(tǒng)計分佈規(guī)律,數(shù)據(jù)主要集中在3.50~4.70之間,尤以組段的人數(shù)3.80~4.10最多,且上下組段數(shù)的頻數(shù)分佈基本對稱。
3.便於發(fā)現(xiàn)一些特大或特小的可疑值
4.便於進(jìn)一步做統(tǒng)計分析和處理第二節(jié)
集中趨勢的描述
統(tǒng)計上使用平均數(shù)(average)這一指標(biāo)體系來描述一組變數(shù)值的集中位置或平均水準(zhǔn)。常用的平均數(shù)有:
算術(shù)均數(shù)幾何均數(shù)中位數(shù)
一、算術(shù)均數(shù)算術(shù)均數(shù):簡稱均數(shù)(mean)
可用於反映一組呈對稱分佈的變數(shù)值在數(shù)量上的平均水準(zhǔn)或者說是集中位置的特徵值。1、計算方法(1)直接計算法
公式:例2-2用直接法計算例2-1某單位101名正常成年女子的血清總膽固醇的均數(shù)。
(2)加權(quán)法:公式:計算4,4,4,6,6,8,8,8,10的均數(shù)?
例2-3利用表2-1計算101名正常成年女子的血總膽固醇的均數(shù)。
式中k表示頻數(shù)表的組段數(shù),及分別表示各組段的頻數(shù)和組中值,如表2-1第1個組段的組中值為,餘類推(見表2-1的第(3)欄)。在這裏,頻數(shù)起到了“權(quán)”(weight)的作用,即某個組段頻數(shù)多,權(quán)數(shù)就大,其組中值對均數(shù)的影響也大;反之,影響則小
2、應(yīng)用
適用於對稱分佈,特別是正態(tài)分佈資料。二、
幾何均數(shù)
幾何均數(shù)(geometricmean):可用於反映一組經(jīng)對數(shù)轉(zhuǎn)換後呈對稱分佈的變數(shù)值在數(shù)量上的平均水準(zhǔn)。1、計算方法(1)、直接計算法
公式:或例2-4某地5例微絲蚴血癥患者治療七年後用間接螢光抗體試驗(yàn)測得其抗體滴度倒數(shù)分別為,10,20,40,40,160,求幾何均數(shù)。(2)加權(quán)法公式:例2-569例類風(fēng)濕關(guān)節(jié)炎(RA)患者血清EBV-VCA-lgG抗體滴度的分佈見表2-4第(1)、(2)欄,求其平均抗體滴度。
故例類風(fēng)濕關(guān)節(jié)炎患者血清EBV-VCA-lgG抗體的平均滴度為:1:150.6。
2、應(yīng)用:
適用於成等比級數(shù)的資料,特別是對數(shù)正態(tài)分佈資料。三、
中位數(shù)與百分位數(shù)(一)中位數(shù)中位數(shù)(median):是將變數(shù)值從小到大排列,位置居於中間的那個變數(shù)值。例:1,3,7,5,>100
中位數(shù)為多少?計算公式:n為奇數(shù)時
n為偶數(shù)時
例2-67名病人患某病的潛伏期分別為2,3,4,5,6,9,16天,求其中位數(shù)。本例n=7,為奇數(shù)
例2-78名患者食物中毒的潛伏期分別為1,2,2,3,5,8,15,24小時,求其中位數(shù)。本例n=8,為偶數(shù)
應(yīng)用
適用於:1、各種分佈類型的資料
2、特別是偏態(tài)分佈資料和開囗資料(一端或兩端無確切數(shù)值的資料)。
(二)百分位數(shù)
百分位數(shù)(percentile)是一種位置指標(biāo),用來表示。一個百分位數(shù)將全部變數(shù)值分為兩部分,在不包含的全部變數(shù)值中有的變數(shù)值比它小,變數(shù)值比它大。
1.直接計算法
設(shè)有x個原始數(shù)據(jù)從小到大排列,第x百分位數(shù)的計算公式為:當(dāng)為帶有小數(shù)位時:
當(dāng)為整數(shù)時:例2-9對某醫(yī)院細(xì)菌性痢疾治癒者的住院天數(shù)統(tǒng)計,名患者的住院天數(shù)從小到大的排列如下,試求第5百分位數(shù)和第99百分位數(shù)。
患
者:
住院天數(shù):
n=120,120X5%=6,為整數(shù):
例2-9對某醫(yī)院細(xì)菌性痢疾治癒者的住院天數(shù)統(tǒng)計,名患者的住院天數(shù)從小到大的排列如下,試求第5百分位數(shù)和第99百分位數(shù)。
患
者:住院天數(shù):,帶有小數(shù),取整後t(yī)runc(118.8)=1182.頻數(shù)表法
公式:式中XL、Xi和Xf分別為第X百分位數(shù)所在組段的下限、組距和頻數(shù),LfS為小於XL各組段的累計頻數(shù),n
為總例數(shù)。
例2-10某地118名鏈球菌咽喉炎患者的潛伏期頻數(shù)表見表2-5第(1)、(2)欄,試分別求中位數(shù)及第25、第75百分位數(shù)。
第三節(jié)
離散趨勢的描述
例2-11三組同齡男孩的身高值(cm)
常用統(tǒng)計指標(biāo):
極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差和變異係數(shù)。
一、
極差極差,用R表示:即一組變數(shù)值最大值與最小值之差。
二、四分位數(shù)間距
四分位數(shù)間距,用QR表示:QR=下四分位數(shù):上四分位數(shù):
例2-12續(xù)例2-10。已知P25=39.2,P75=67.7,計算118名鏈球菌咽喉炎患者潛伏期的四分位數(shù)間距。
(天)請回答:四分位數(shù)間距可以看成大小在中間的一半變數(shù)值的全距(R)。
四分位數(shù)間距可以看成一半變數(shù)值的極差。三、方差與標(biāo)準(zhǔn)差
1、方差(variance)也稱均方差(meansquaredeviation),反映一組數(shù)據(jù)的平均離散水準(zhǔn)。
樣本方差用表示
2、公式:樣本標(biāo)準(zhǔn)差用表示公式:
標(biāo)準(zhǔn)差的公式還可以寫成:利用頻數(shù)表計算標(biāo)準(zhǔn)差的公式為例2-12續(xù)例2-10,計算三組資料的標(biāo)準(zhǔn)差。
甲組:
四、
變異係數(shù)
變異係數(shù)(coefficientofvariation)記為CV,多用於觀察指標(biāo)單位不同時,如身高與體重的變異程度的比較;或均數(shù)相差較大時,如兒童身高與成人身高變異程度的比較。
某地7歲男孩身高的均數(shù)為123.10cm,標(biāo)準(zhǔn)差為4.71;體重均數(shù)為22.59kg,標(biāo)準(zhǔn)差為2.26kg,
比較其變異度?
(觀察指標(biāo)單位不同)均數(shù)相差較大時:第四節(jié)
正態(tài)分佈
正態(tài)分佈:又稱為Gauss分佈(Gaussiandistribution)。
設(shè)想當(dāng)原始數(shù)據(jù)的頻數(shù)分佈圖的觀察人數(shù)逐漸增加且組段不斷分細(xì)時,圖2-4中的直條就不斷變窄,其頂端則逐漸接近於一條光滑的曲線。這條曲線形態(tài)呈鐘形,兩頭低、中間高,左右對稱,近似於數(shù)學(xué)上的正態(tài)分佈。在處理資料時,我們就把它看成是正態(tài)分佈。一、正態(tài)分佈的概念和特徵
1.正態(tài)分佈曲線的數(shù)學(xué)函數(shù)運(yùn)算式
如果隨機(jī)變數(shù)的分佈服從概率密度函數(shù)2.正態(tài)分佈的特徵
(4)正態(tài)曲線下的面積分佈有一定的規(guī)律。對公式(2-17)積分
:正態(tài)分佈是一個分佈族,對應(yīng)於不同的參數(shù)m和s會產(chǎn)生不同位置、不同形狀的正態(tài)分佈。
正態(tài)分佈除了可估計頻數(shù)分佈外,還是許多統(tǒng)計方法的基礎(chǔ),並可應(yīng)用於品質(zhì)控制及制定醫(yī)學(xué)參考值範(fàn)圍。第五節(jié)
醫(yī)學(xué)參考值範(fàn)圍的制定
一、基本概念
醫(yī)學(xué)參考值(referencevalue)是指包括絕大多數(shù)正常人的人體形態(tài)、機(jī)能和代謝產(chǎn)物等各種生理及生化指標(biāo)常數(shù),也稱正常值。由於存在個體差異,生物醫(yī)學(xué)數(shù)據(jù)並非常數(shù)而是在一定範(fàn)圍內(nèi)波動,故採用醫(yī)學(xué)參考值範(fàn)圍(medicalreferencerange)作為判定正常和異常的參考標(biāo)準(zhǔn)。
醫(yī)學(xué)參考值範(fàn)圍涉及到採用單側(cè)界值還是雙側(cè)界值的問題,這通常依據(jù)醫(yī)學(xué)專業(yè)知識而定。
雙側(cè)
:血清總膽固醇無論過低或過高均屬異常白細(xì)胞數(shù)無論過低或過高均屬異常單側(cè):1、血清轉(zhuǎn)氨酶僅過高異常2、肺活量僅過低異常
醫(yī)學(xué)參考值範(fàn)圍有、、等,最常用的為。計算醫(yī)學(xué)參考值範(fàn)圍的常用方法:1、正態(tài)分佈法
2、百分位數(shù)法二、方法1、正態(tài)分佈法:許多生物醫(yī)學(xué)數(shù)據(jù)服從或近似服從正態(tài)分佈,如同年齡同性別兒童的身高值、體重值,同性別健康成人的紅細(xì)胞數(shù)等;有些醫(yī)學(xué)資料雖然呈偏態(tài)分佈,但若能通過適當(dāng)?shù)淖償?shù)變換轉(zhuǎn)換為正態(tài)分佈,也可採用正態(tài)分佈法制定參考值範(fàn)圍。
適用:正態(tài)分佈資料
公式:2、百分位數(shù)法適用:各種分佈資料特別是偏態(tài)分佈資料
公式:
例2-17測得某年某地名正常人的尿汞值如下表,試製定正常人尿汞值的參考值範(fàn)圍。
142Content1.Samplingerrorandstandarderrorofmean2.t-distribution3.EstimationofPopulationMean4.t-test5.Noticeofhypothesistest
6.Normalitytestandhomogeneityofvariancetest143第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤144統(tǒng)計推斷:由樣本資訊推斷總體特徵。樣本統(tǒng)計指標(biāo)(統(tǒng)計量)總體統(tǒng)計指標(biāo)(參數(shù))正態(tài)(分佈)總體:推斷!說明!為說明抽樣誤差規(guī)律,先用一個實(shí)例,後引出理論。145圖3-11999年某市18歲男生身高N(167.7,5.32)的抽樣示意圖
146見P34~36表3-1147
將此100個樣本均數(shù)看成新變數(shù)值,則這100個樣本均數(shù)構(gòu)成一新分佈,繪製直方圖。圖3-2從正態(tài)分佈總體N(167.7,5.32)隨機(jī)抽樣所得樣本均數(shù)分佈148①
,各樣本均數(shù)未必等於總體均數(shù);②各樣本均數(shù)間存在差異;③樣本均數(shù)的分佈為中間多,兩邊少,左右基本對稱。
④樣本均數(shù)的變異範(fàn)圍較之原變數(shù)的變異範(fàn)圍大大縮小。可算得這100個樣本均數(shù)的均數(shù)為167.69cm、標(biāo)準(zhǔn)差為1.69cm。
樣本均數(shù)的抽樣分佈具有如下特點(diǎn):1491、抽樣誤差:
由個體變異產(chǎn)生的、抽樣造成的樣本統(tǒng)計量與總體參數(shù)的差別
均數(shù)的抽樣誤差:由於抽樣造成的樣本均數(shù)與總體均數(shù)的差別原因:1)抽樣
2)個體差異150本書以n=60為界限151表示樣本統(tǒng)計量抽樣誤差大小的統(tǒng)計指標(biāo)。均數(shù)標(biāo)準(zhǔn)誤:說明均數(shù)抽樣誤差的大小,總體計算公式(3-1)2、標(biāo)準(zhǔn)誤(standarderror,SE)實(shí)質(zhì):樣本均數(shù)的標(biāo)準(zhǔn)差152數(shù)理統(tǒng)計證明:
153若用樣本標(biāo)準(zhǔn)差S來估計,
(3-2)降低抽樣誤差的途徑有:①通過增加樣本含量n;②通過設(shè)計減少S。154第二節(jié)t分佈(t-distribution)155t分佈概述
抽樣誤差的分佈規(guī)律
↓樣本→總體
↑
t分佈理論
↑手段(橋樑)目的156
一、t分佈的概念
157158
式中為自由度(degreeoffreedom,df)
3.實(shí)際工作中,由於未知,用代替,則不再服從標(biāo)準(zhǔn)正態(tài)分佈,而服從t分佈。
159二、t分佈的圖形與特徵
分佈只有一個參數(shù),即自由度160
圖3-3不同自由度下的t分佈圖1611.特徵:
1622t界值表:詳見附表2,可反映t分佈曲線下的面積。單側(cè)概率或單尾概率:用表示;雙側(cè)概率或雙尾概率:用表示。
163-tt0164舉例:
165第三節(jié)總體均數(shù)的估計166一、參數(shù)估計用樣本統(tǒng)計量推斷總體參數(shù)??傮w均數(shù)估計:用樣本均數(shù)(和標(biāo)準(zhǔn)差)推斷總體均數(shù)。167168
按預(yù)先給定的概率(1
)所確定的包含未知總體參數(shù)的一個範(fàn)圍??傮w均數(shù)的區(qū)間估計:按預(yù)先給定的概率(1
)所確定的包含未知總體均數(shù)的一個範(fàn)圍。
如給定
=0.05,該範(fàn)圍稱為參數(shù)的95%可信區(qū)間或置信區(qū)間;如給定
=0.01,該範(fàn)圍稱為參數(shù)的99%可信區(qū)間或置信區(qū)間。2.區(qū)間估計(intervalestimation):169二、總體均數(shù)可信區(qū)間的計算170
總體均數(shù)可信區(qū)間的計算需考慮:(1)總體標(biāo)準(zhǔn)差
是否已知,(2)樣本含量n的大小通常有兩類方法:(1)t分佈法
(2)u分佈法171
1.單一總體均數(shù)的可信區(qū)間
172173P25,15號樣本174175176
例3-3某地抽取正常成年人200名,測得其血清膽固醇的均數(shù)為3.64mmol/L,標(biāo)準(zhǔn)差為1.20mmol/L,估計該地正常成年人血清膽固醇均數(shù)的95%可信區(qū)間。
177
故該地正常成年人血清膽固醇均數(shù)的雙側(cè)95%可信區(qū)間為(3.47,3.81)mmol
L。178
179180181
例3-4為了解氨甲喋呤(MTX)對外周血IL-2水準(zhǔn)的影響,某醫(yī)生將61名哮喘患者隨機(jī)分為兩組。其中對照組29例(),採用安慰劑;實(shí)驗(yàn)組32例(),採用小劑量氨甲喋呤(MTX)進(jìn)行治療。測得對照組治療前IL-2的均數(shù)為20.10IU/ml(),標(biāo)準(zhǔn)差為7.02IU/ml();試驗(yàn)組治療前IL-2的均數(shù)為16.89IU/ml(),標(biāo)準(zhǔn)差為8.46IU/ml()。問兩組治療前基線的IL-2總體均數(shù)相差有多大?
182第一步:
183能否下:兩組IL-2的總體均數(shù)“不同”或“有差別”的結(jié)論?184三、可信區(qū)間的確切涵義185
1.95%的可信區(qū)間的理解:(1)所要估計的總體參數(shù)有95%的可能在我們所估計的可信區(qū)間內(nèi)。(2)從正態(tài)總體中隨機(jī)抽取100個樣本,可算得100個樣本均數(shù)和標(biāo)準(zhǔn)差,也可算得100個均數(shù)的可信區(qū)間,平均約有95個可信區(qū)間包含了總體均數(shù)。(3)但在實(shí)際工作中,只能根據(jù)一次試驗(yàn)結(jié)果估計可信區(qū)間,我們就認(rèn)為該區(qū)間包含了總體均數(shù)
。186
2.可信區(qū)間的兩個要素(1)準(zhǔn)確度:用可信度(1
)表示:即區(qū)間包含總體均數(shù)
的理論概率大小。當(dāng)然它愈接近1愈好,如99%的可信區(qū)間比95%的可信區(qū)間要好。(2)精確度:即區(qū)間的寬度區(qū)間愈窄愈好,如95%的可信區(qū)間比99%的可信區(qū)間要好。187
當(dāng)n確定時,上述兩者互相矛盾。提高準(zhǔn)確度(可信度),則精確度降低(可信區(qū)間會變寬),勢必降低可信區(qū)間的實(shí)際應(yīng)用價值,故不能籠統(tǒng)認(rèn)為99%可信區(qū)間比95%可信區(qū)間要好。相反,在實(shí)際應(yīng)用中,95%可信區(qū)間更為常用。188
在可信度確定的情況下,增加樣本含量可減小區(qū)間寬度,提高精確度。189四、總體均數(shù)可信區(qū)間與參考值範(fàn)圍的區(qū)別190*也可用對應(yīng)於雙尾概率時),**也可用對應(yīng)於雙尾概率時)表3-2總體均數(shù)的可信區(qū)間與參考值範(fàn)圍的區(qū)別191第四節(jié)
t檢驗(yàn)1921、樣本均數(shù)與已知某總體均數(shù)比較的t檢驗(yàn)
目的:推斷一個未知總體均數(shù)與已知總體均數(shù)是否有差別,用單樣本設(shè)計。2、兩個樣本均數(shù)與比較的t檢驗(yàn)
目的:推斷兩個未知總體均數(shù)與是否有差別,用成組設(shè)計。3、配對設(shè)計資料均數(shù)比較的t檢驗(yàn)
目的:推斷兩個未知總體均數(shù)與是否有差別用配對設(shè)計。t檢驗(yàn),亦稱studentt檢驗(yàn),有下述情況:193對於大樣本,也可以近似用u檢驗(yàn)。194t檢驗(yàn)和u檢驗(yàn)的應(yīng)用條件:1.t檢驗(yàn)應(yīng)用條件:樣本含量n較小時(如n<60)(1)正態(tài)分佈(2)方差齊性(homogeneityofvariance)2.u
檢驗(yàn)應(yīng)用條件:樣本含量n較大,或n雖小但總體標(biāo)準(zhǔn)差已知
(1)正態(tài)分佈
(2)方差齊性(homogeneityofvariance)195
假設(shè)檢驗(yàn)過去稱顯著性檢驗(yàn)。它是利用小概率反證法思想,從問題的對立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立。然後在H0成立的條件下計算檢驗(yàn)統(tǒng)計量,最後獲得P值來判斷。
假設(shè)檢驗(yàn)基本思想及步驟196例3-5某醫(yī)生測量了36名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標(biāo)準(zhǔn)差為25.74g/L。問從事鉛作業(yè)工人的血紅蛋白是否不同於正常成年男性平均值140g/L?130.83g/L≠140g/L原因:1.可能是總體均數(shù)不同
2.是抽樣造成的197198③
H1的內(nèi)容直接反映了檢驗(yàn)單雙側(cè)。若H1中只是
0或
<
0,則此檢驗(yàn)為單側(cè)檢驗(yàn)。它不僅考慮有無差異,而且還考慮差異的方向。④
單雙側(cè)檢驗(yàn)的確定,首先根據(jù)專業(yè)知識,其次根據(jù)所要解決的問題來確定。若從專業(yè)上看一種方法結(jié)果不可能低於或高於另一種方法結(jié)果,此時應(yīng)該用單側(cè)檢驗(yàn)。一般認(rèn)為雙側(cè)檢驗(yàn)較保守和穩(wěn)妥。199
(3)檢驗(yàn)水準(zhǔn)
,過去稱顯著性水準(zhǔn),是預(yù)先規(guī)定的概率值,它確定了小概率事件的標(biāo)準(zhǔn)。在實(shí)際工作中常取
=0.05??筛鶕?jù)不同研究目的給予不同設(shè)置。200
根據(jù)變數(shù)和資料類型、設(shè)計方案、統(tǒng)計推斷的目的、是否滿足特定條件等(如數(shù)據(jù)的分佈類型)選擇相應(yīng)的檢驗(yàn)統(tǒng)計量。
2.計算檢驗(yàn)統(tǒng)計量201
P的含義是指從H0規(guī)定的總體隨機(jī)抽樣,抽得等於及大於(或/和等於及小於)現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計量(如t、u等)值的概率。例3-5的P值可用圖3-5說明,P為在
=
0=140g/L的前提條件下隨機(jī)抽樣,其t小於及等於-2.138和大於及等於2.138的概率。
3.確定P值202圖3-5例3-5中P值示意圖203204
若,是否也能下“無差別”或“相等”的結(jié)論?
205一、單樣本t
檢驗(yàn)
(onesample/groupt-test)
即樣本均數(shù)(代表未知總體均數(shù)
)與已知總體均數(shù)
0(一般為理論值、標(biāo)準(zhǔn)值或經(jīng)過大量觀察所得穩(wěn)定值等)的比較。其檢驗(yàn)統(tǒng)計量按下式計算206
例3-5某醫(yī)生測量了36名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標(biāo)準(zhǔn)差為25.74g/L。問從事鉛作業(yè)工人的血紅蛋白是否不同於正常成年男性平均值140g/L?
(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)H0:
=
0=140g/L,即鉛作業(yè)男性工人平均血紅蛋白含量與正常成年男性平均值相等H1:
≠
0=140g/L,即鉛作業(yè)男性工人平均血紅蛋白含量與正常成年男性平均值不等
=0.05207(2)計算檢驗(yàn)統(tǒng)計量
208(3)確定P值,作出推斷結(jié)論
209配對t檢驗(yàn)適用於配對設(shè)計的計量資料。配對設(shè)計類型:①兩同質(zhì)受試對象分別接受兩種不同的處理;②同一受試對象分別接受兩種不同處理;③同一受試對象(一種)處理前後。
二、配對t檢驗(yàn)(paired/matchedt-test)210
例3-6為比較兩種方法對乳酸飲料中脂肪含量測定結(jié)果是否不同,某人隨機(jī)抽取了10份乳酸飲料製品,分別用脂肪酸水解法和哥特裏-羅紫法測定其結(jié)果如表3-3第(1)~(3)欄。問兩法測定結(jié)果是否不同?211表3-3兩種方法對乳酸飲料中脂肪含量的測定結(jié)果(%)
212
(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)H0:
d=0,即兩種方法的測定結(jié)果相同H1:
d≠0,即兩種方法的測定結(jié)果不同
=0.05
(2)計算檢驗(yàn)統(tǒng)計量本例n=10,d=2.724,d2=0.8483,
213按公式(3-16)
(3)確定P值,作出推斷結(jié)論查附表2的t界值表得P<0.001。按
=0.05水準(zhǔn),拒絕H0,接受H1,有統(tǒng)計學(xué)意義。可認(rèn)為兩種方法對脂肪含量的測定結(jié)果不同,哥特裏-羅紫法測定結(jié)果較高。214
三、兩樣本t檢驗(yàn)
(two-sample/groupt-test)
又稱成組t檢驗(yàn),適用於完全隨機(jī)設(shè)計兩樣本均數(shù)的比較,此時人們關(guān)心的是兩樣本均數(shù)所代表的兩總體均數(shù)是否不等。兩組完全隨機(jī)設(shè)計是將受試對象完全隨機(jī)分配到兩個不同處理組。215
適用範(fàn)圍:完全隨機(jī)設(shè)計兩樣本均數(shù)的比較檢驗(yàn)方法:依兩總體方差是否齊性而定。216217
例3-7
為研究國產(chǎn)四類新藥阿卡波糖膠囊的降血糖效果,某醫(yī)院用40名II型糖尿病病人進(jìn)行同期隨機(jī)對照試驗(yàn)。試驗(yàn)者將這些病人隨機(jī)等分到試驗(yàn)組(用阿卡波糖膠囊)和對照組(用拜唐蘋膠囊),分別測得試驗(yàn)開始前和8周後的空腹血糖,算得空腹血糖下降值見表3-4,能否認(rèn)為該國產(chǎn)四類新藥阿卡波糖膠囊與拜唐蘋膠囊對空腹血糖的降糖效果不同?218219
(2)計算檢驗(yàn)統(tǒng)計量
220(3)確定P值,作出推斷結(jié)論
221
若變數(shù)變換後總體方差齊性
可採用t檢驗(yàn)(如兩樣本幾何均數(shù)的t檢驗(yàn),就是將原始數(shù)據(jù)取對數(shù)後進(jìn)行t檢驗(yàn));
若變數(shù)變換後總體方差仍然不齊
可採用t
‘
檢驗(yàn)或Wilcoxon秩和檢驗(yàn)。若兩總體方差不等(),?222
2.Cochran&Cox近似t檢驗(yàn)(t‘
檢驗(yàn))
——調(diào)整t界值223224
例3-8
在上述例3-7國產(chǎn)四類新藥阿卡波糖膠囊的降血糖效果研究中,測得用拜唐蘋膠囊的對照組20例病人和用阿卡波糖膠囊的試驗(yàn)組20例病人,其8周時糖化血紅蛋白HbA1c(%)下降值如表3-5。問用兩種不同藥物的病人其HbA1c下降值是否不同?225表3-5對照組和試驗(yàn)組HbA1c下降值(%)
對照組方差是試驗(yàn)組方差的3.77倍,經(jīng)方差齊性檢驗(yàn),認(rèn)為兩組的總體方差不等,故採用近似t檢驗(yàn)。226
(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)(略)(2)計算檢驗(yàn)統(tǒng)計量
227(3)確定P值,作出推斷結(jié)論。查t界值表t0.05/2,19=2.093。
由t
=0.965<t
0.05/2=2.093得P>0.05。按
=0.05水準(zhǔn),不拒絕H0,無統(tǒng)計學(xué)意義。還不能認(rèn)為用兩種不同藥物的病人其HbA1c下降值不同。228
3.Satterthwaite近似t檢驗(yàn)
:
Cochran&Cox法是對臨界值校正而Satterthwaite法則是對自由度校正。
229
以
=28.4
28、t=0.965查附表2的t界值表得0.20<P<0.40。結(jié)論同前。按Satterthwaite法對例3-8做檢驗(yàn),得230
3.Welch法近似t檢驗(yàn)Welch法也是對自由度進(jìn)行校正。校正公式為231對例3-8,如按Welch法,則
以
=29.4
29、t=0.965查附表2的t界值表得0.20<P<0.40。結(jié)論同前。232
第五節(jié)假設(shè)檢驗(yàn)注意事項(xiàng)233一、I型錯誤和II型錯誤
假設(shè)檢驗(yàn)是利用小概率反證法思想,根據(jù)P值判斷結(jié)果,此推斷結(jié)論具有概率性,因而無論拒絕還是不拒絕H0,都可能犯錯誤。見表3-8。234表3-8可能發(fā)生的兩類錯誤235
I型錯誤:“實(shí)際無差別,但下了有差別的結(jié)論”,假陽性錯誤。犯這種錯誤的概率是
(其值等於檢驗(yàn)水準(zhǔn))
II型錯誤:“實(shí)際有差別,但下了不拒絕H0的結(jié)論”,假陰性錯誤。犯這種錯誤的概率是
(其值未知)
。
但n
一定時,
增大,
則減少。1-
:檢驗(yàn)效能(power):當(dāng)兩總體確有差別,按檢驗(yàn)水準(zhǔn)
所能發(fā)現(xiàn)這種差別的能力。236圖3-6I型錯誤與II型錯誤示意圖(以單側(cè)u檢驗(yàn)為例)
237減少I型錯誤的主要方法:假設(shè)檢驗(yàn)時設(shè)定
值。減少II型錯誤的主要方法:提高檢驗(yàn)效能。提高檢驗(yàn)效能的最有效方法:增加樣本量。如何選擇合適的樣本量:實(shí)驗(yàn)設(shè)計。238二、假設(shè)檢驗(yàn)應(yīng)注意的問題1.要有嚴(yán)密的研究設(shè)計這是假設(shè)檢驗(yàn)的前提。組間應(yīng)均衡,具有可比性,也就是除對比的主要因素(如臨床試驗(yàn)用新藥和對照藥)外,其他可能影響結(jié)果的因素(如年齡、性別、病程、病情輕重等)在對比組間應(yīng)相同或相近。保證均衡性的方法主要是從同質(zhì)總體中隨機(jī)抽取樣本,或隨機(jī)分配樣本。2392.不同的資料應(yīng)選用不同檢驗(yàn)方法
應(yīng)根據(jù)分析目的、資料類型以及分佈、設(shè)計方案的種類、樣本含量大小等選用適當(dāng)?shù)臋z驗(yàn)方法。如:配對設(shè)計的計量資料採用配對t檢驗(yàn)。而完全隨機(jī)設(shè)計的兩樣本計量資料,若為小樣本(即任一ni60)且方差齊,則選用兩樣本t檢驗(yàn);若方差不齊,則選用近似t
檢驗(yàn)(Cochran&Cox法或Satterthwaite法)。若為大樣本(所有ni>60),則可選用大樣本u檢驗(yàn)。2403.正確理解“顯著性”一詞的含義
差別有或無統(tǒng)計學(xué)意義,過去稱差別有或無“顯著性”,是對樣本統(tǒng)計量與總體參數(shù)或樣本統(tǒng)計量之間的比較而言,相應(yīng)推斷為:可以認(rèn)為或還不能認(rèn)為兩個或多個總體參數(shù)有差別。2414.結(jié)論不能絕對化因統(tǒng)計結(jié)論具有概率性質(zhì),故“肯定”、“一定”、“必定”等詞不要使用。在報告結(jié)論時,最好列出檢驗(yàn)統(tǒng)計量的值,儘量寫出具體的P值或P值的確切範(fàn)圍,如寫成P=0.040或0.02<P<0.05,而不簡單寫成P<0.05,以便讀者與同類研究進(jìn)行比較或進(jìn)行循證醫(yī)學(xué)時採用Meta分析。2425.假設(shè)檢驗(yàn)是為專業(yè)服務(wù)的,統(tǒng)計結(jié)論必須和專業(yè)結(jié)論有機(jī)地相結(jié)合,才能得出恰如其分、符合客觀實(shí)際的最終結(jié)論。若統(tǒng)計結(jié)論和專業(yè)結(jié)論一致,則最終結(jié)論就和這兩者均一致(即均有或均無意義);若統(tǒng)計結(jié)論和專業(yè)結(jié)論不一致,則最終結(jié)論需根據(jù)實(shí)際情況加以考慮。若統(tǒng)計結(jié)論有意義,而專業(yè)結(jié)論無意義,則可能由於樣本含量過大或設(shè)計存在問題,那麼最終結(jié)論就沒有意義。243
6.可信區(qū)間與假設(shè)檢驗(yàn)各自不同的作用,要結(jié)合使用。
一方面,可信區(qū)間亦可回答假設(shè)檢驗(yàn)的問題,算得的可信區(qū)間若包含了H0,則按
水準(zhǔn),不拒絕H0;若不包含H0,則按
水準(zhǔn),拒絕H0,接受H1。
244
另一方面,可信區(qū)間不但能回答差別有無統(tǒng)計學(xué)意義,而且還能比假設(shè)檢驗(yàn)提供更多的資訊,即提示差別有無實(shí)際的專業(yè)意義。
245圖3-7可信區(qū)間在統(tǒng)計推斷上提供的資訊
246
雖然可信區(qū)間亦可回答假設(shè)檢驗(yàn)的問題,並能提供更多的資訊,但並不意味著可信區(qū)間能夠完全代替假設(shè)檢驗(yàn)??尚艆^(qū)間只能在預(yù)先規(guī)定的概率
檢驗(yàn)水準(zhǔn)
的前提下進(jìn)行計算,而假設(shè)檢驗(yàn)?zāi)軌颢@得一較為確切的概率P值。
247第六節(jié)正態(tài)性檢驗(yàn)和兩樣本方差比較的F檢驗(yàn)248
t檢驗(yàn)的應(yīng)用條件是正態(tài)總體且方差齊性;配對t檢驗(yàn)則要求每對數(shù)據(jù)差值的總體為正態(tài)總體。進(jìn)行兩小樣本t檢驗(yàn)時,一般應(yīng)對資料進(jìn)行方差齊性檢驗(yàn),尤其兩樣本方差懸殊時。若方差齊,採用一般的t檢驗(yàn);若方差不齊,則採用t’檢驗(yàn)。249一、正態(tài)性檢驗(yàn)(normalitytest)
1.圖示法:P-Pplot,Q-Qplot2.矩法偏度係數(shù)(skewness),峰度係數(shù)(kurtosis)。
3.
W檢驗(yàn)法
4.
D檢驗(yàn)法250圖3-8例3-1中100個樣本均數(shù)的P-P圖251圖3-9例3-1中100個樣本均數(shù)的Q-Q圖252253254
例3-9試用矩法對表3-1中電腦模擬抽樣所得100個樣本均數(shù)進(jìn)行正態(tài)性檢驗(yàn)。255(2)計算檢驗(yàn)統(tǒng)計量256二、兩樣本方差比較的F檢驗(yàn)
兩小樣本t
檢驗(yàn)時,檢查兩樣本方差代表的總體方差是否相等(決定t檢驗(yàn)的方法)。
1.Levene檢驗(yàn)
2.F檢驗(yàn)257258259
圖3-10不同自由度時F分佈的圖形260
(2)計算檢驗(yàn)統(tǒng)計量
例3-10對例3-7,用F檢驗(yàn)判斷兩總體空腹血糖下降值的方差是否不等。
(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)261
(3)確定P值,作出推斷結(jié)論
262三、變數(shù)變換
常用的變數(shù)變換有對數(shù)變換、平方根變換、倒數(shù)變換、平方根反正弦變換等,應(yīng)根據(jù)資料性質(zhì)選擇適當(dāng)?shù)淖償?shù)變換方法。263264265266小結(jié)
1.均數(shù)的標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差的區(qū)別2.兩均數(shù)差別檢驗(yàn)的比較:大樣本也可近似用u檢驗(yàn)
Content1.Basalidealandapplicationconditions2.ANOVAofcompletelyrandomdesigneddata
3.ANOVAofrandomizedblockdesigneddata4.ANOVAoflatinsquaredesigneddata
5.ANOVAofcross-overdesigneddata
6.Multiplecomparisonofsamplemeans7.BartletttestandLevenetest第一節(jié)方差分析的基本思想及其應(yīng)用條件目的:推斷多個總體均數(shù)是否有差別。
也可用於兩個
方法:方差分析,即多個樣本均數(shù)比較的F檢驗(yàn)?;舅枷耄焊鶕?jù)資料設(shè)計的類型及研究目的,可將總變異分解為兩個或多個部分,每個部分的變異可由某因素的作用來解釋。通過比較可能由某因素所至的變異與隨機(jī)誤差,即可瞭解該因素對測定結(jié)果有無影響。應(yīng)用條件:總體——正態(tài)且方差相等
樣本——獨(dú)立、隨機(jī)設(shè)計類型:完全隨機(jī)設(shè)計資料的方差分析隨機(jī)區(qū)組設(shè)計資料的方差分析拉丁方設(shè)計資料的方差分析兩階段交叉設(shè)計資料的方差分析完全隨機(jī)設(shè)計資料的方差分析的基本思想
合計
NS:第i個處理組第j個觀察結(jié)果記總均數(shù)為,各處理組均數(shù)為,總例數(shù)為N=nl+n2+…+ng,g為處理組數(shù)。
1.總變異:全部測量值大小不同,這種變異稱為總變異??傋儺惖拇笮】梢杂秒x均差平方和(sumofsquaresofdeviationsfrommean,SS)表示,即各測量值Xij與總均數(shù)差值的平方和,記為SS總??傋儺怱S總反映了所有測量值之間總的變異程度。計算公式為其中:2.組間變異:各處理組由於接受處理的水準(zhǔn)不同,各組的樣本均數(shù)
(i=1,2,…,g)也大小不等,這種變異稱為組間變異。其大小可用各組均數(shù)與總均數(shù)的離均差平方和表示,記為SS組間。計算公式為3.組內(nèi)變異:在同一處理組中,雖然每個受試對象接受的處理相同,但測量值仍各不相同,這種變異稱為組內(nèi)變異(誤差)。組內(nèi)變異可用組內(nèi)各測量值Xij與其所在組的均數(shù)的差值的平方和表示,記為SS組內(nèi),表示隨機(jī)誤差的影響。
三種變異的關(guān)係:
均
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2022屆高考化學(xué)一輪復(fù)習(xí)-第7章-碳族元素-易錯題型解析課件-人教大綱版2
- 人教版五年級語文下冊同步作業(yè)課件第5單元第五單元習(xí)作-一課一練-課課練試卷
- 人教版數(shù)學(xué)五年級下冊-07分?jǐn)?shù)的加法和減法-03分?jǐn)?shù)加減混合運(yùn)算-課件05
- 全國大學(xué)英語CET四級考試試卷及解答參考(2024年)
- 高中政治-經(jīng)濟(jì)生活第三課:《樹立正確的消費(fèi)觀》課件-新人教版必修1
- 6.2中位數(shù)與眾數(shù)練習(xí)北師大版數(shù)學(xué)八年級上冊
- 山西省呂梁市部分學(xué)校2024-2025學(xué)年高三上學(xué)期開學(xué)考試數(shù)學(xué)試題
- 山西省運(yùn)城市2024-2025學(xué)年高三上學(xué)期摸底調(diào)研化學(xué)試題(解析版)
- 云南省昭通市(2024年-2025年小學(xué)四年級語文)統(tǒng)編版小升初真題((上下)學(xué)期)試卷及答案
- 云南省昆明市(2024年-2025年小學(xué)四年級語文)人教版期中考試(下學(xué)期)試卷及答案
- 江蘇省南京市2024-2025學(xué)年高三上學(xué)期第一次學(xué)情調(diào)研英語試題含答案
- 第四屆山東省人工智能融合創(chuàng)新職業(yè)技能競賽(人工智能訓(xùn)練師)試題庫(含答案)
- Symbol LS7708掃描平臺常用設(shè)置條碼
- 導(dǎo)線展放出口張力、牽引力計算表格
- 班級小組評分表(共3頁)
- 《環(huán)境保護(hù)與水土保持專項(xiàng)施工方案》
- 時間管理—撕紙游戲規(guī)則打印
- 腫瘤標(biāo)志物的臨床應(yīng)用建議
- 內(nèi)嚙合齒輪參數(shù)計算
- 加氣站設(shè)備明細(xì)
- 一次性使用醫(yī)療衛(wèi)生用品管理制度
評論
0/150
提交評論