醫(yī)學(xué)統(tǒng)計學(xué)課件_第1頁
醫(yī)學(xué)統(tǒng)計學(xué)課件_第2頁
醫(yī)學(xué)統(tǒng)計學(xué)課件_第3頁
醫(yī)學(xué)統(tǒng)計學(xué)課件_第4頁
醫(yī)學(xué)統(tǒng)計學(xué)課件_第5頁
已閱讀5頁,還剩794頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

緒論

Introduction一、醫(yī)學(xué)統(tǒng)計學(xué)的意義

1.統(tǒng)計學(xué)(statistics):應(yīng)用數(shù)學(xué)的原理與方法,研究數(shù)據(jù)的搜集、整理與分析的科學(xué),對不確定性數(shù)據(jù)作出科學(xué)的推斷。2.醫(yī)學(xué)統(tǒng)計學(xué)(statisticsofmedicine):統(tǒng)計學(xué)的原理與方法應(yīng)用於醫(yī)學(xué)科研與實(shí)踐。一、醫(yī)學(xué)統(tǒng)計學(xué)的意義

3.統(tǒng)計學(xué)方法的特點(diǎn):(1)用數(shù)量反映品質(zhì)1)體格檢查(量血壓、脈搏…)→個體健康品質(zhì)2)考試分?jǐn)?shù)→個體學(xué)習(xí)品質(zhì)

3)期望壽命——反映人群健康狀況的指標(biāo)4)嬰兒死亡率——反映衛(wèi)生服務(wù)品質(zhì)的指標(biāo)………….一、醫(yī)學(xué)統(tǒng)計學(xué)的意義

(2)用群體歸納個體請同學(xué)們回答:2002年長沙市7歲男孩有多高?1)7歲男孩身高有高有矮2)n=100,平均身高=119.5cm95%的長沙市7歲男孩的身高在110.20cm~129.20cm之間二、統(tǒng)計學(xué)中的幾個基本概念1、研究單位(觀察單位、unit)和變數(shù)(variable)、變數(shù)值(valueofvariable)

(1)、研究單位(unit):研究中的個體(individual),是根據(jù)研究目的確定的。

二、統(tǒng)計學(xué)中的幾個基本概念例如:研究7歲男孩身高的正常值範(fàn)圍一個人研究大學(xué)生視力一只眼睛研究水污染情況一毫升水研究細(xì)胞變性一個細(xì)胞研究肝癌的地區(qū)分佈一個地區(qū)二、統(tǒng)計學(xué)中的幾個基本概念(2)變數(shù)(variable):研究單位的研究特徵。例如:研究7歲男孩身高的正常值範(fàn)圍變數(shù):身高(3)變數(shù)值(valueofvariable)二、統(tǒng)計學(xué)中的幾個基本概念變數(shù)值(valueofvariable):變數(shù)的觀察結(jié)果。例如:研究7歲男孩身高變數(shù)值:測得的身高值(120.2cm,118.6cm,121.8cm,…)研究某人群性別構(gòu)成變數(shù)值:男、女。二、統(tǒng)計學(xué)中的幾個基本概念2、同質(zhì)(homogeneity)和變異(variation)(1)、同質(zhì)(homogeneity):根據(jù)研究目的給研究單位確定的相同性質(zhì)。研究長沙市2004年7歲男孩身高的正常值範(fàn)圍?同質(zhì):同長沙市、同7歲、同男孩、同無影響身高的疾病。二、統(tǒng)計學(xué)中的幾個基本概念(2)、變異(variation)變異(variation):同質(zhì)研究單位中變數(shù)值間的差異。例如:1)長沙市2004年7歲男孩身高有高有矮2)相同的藥方治療相同的疾病的病人,療效有好有壞二、統(tǒng)計學(xué)中的幾個基本概念3、總體(population)和樣本(sample)(1)、總體(population):是根據(jù)研究目的確定的同質(zhì)研究單位的全體。更確切地說是同質(zhì)研究單位某種變數(shù)值的集合。例如:調(diào)查某地2002年正常成年男子的紅細(xì)胞數(shù)的正常值範(fàn)圍二、統(tǒng)計學(xué)中的幾個基本概念研究單位:一個人變數(shù):紅細(xì)胞數(shù)同質(zhì):同某地、同2002年、同成年男子、同正常??傮w:1)某地所有的正常成年男子2)某地所有的正常成年男子的紅細(xì)胞數(shù)二、統(tǒng)計學(xué)中的幾個基本概念1)有限總體(finitepopulation):研究單位數(shù)是有限的例如:調(diào)查某地2002年正常成年男子的紅細(xì)胞數(shù)的正常值範(fàn)圍2)無限總體(infinitepopulation):研究單位數(shù)是無限的例如:高血壓患者←無時間、空間限制。二、統(tǒng)計學(xué)中的幾個基本概念(2)樣本(sample):是總體中抽取的有代表性的一部分。注意:隨機(jī)抽樣(無主觀性)樣本含量(sample

size):樣本中包含的研究單位數(shù)。例如:某藥治療高血壓患者30名樣本含量(n)為30二、統(tǒng)計學(xué)中的幾個基本概念4、參數(shù)(parameter)和統(tǒng)計量(statistic)(1)參數(shù)(parameter):根據(jù)總體個體值統(tǒng)計計算出來的描述總體的特徵量。一般用希臘字母表示(2)、統(tǒng)計量(statistic):根據(jù)樣本個體值統(tǒng)計計算出來的描述樣本的特徵量。一般用拉丁字母表示二、統(tǒng)計學(xué)中的幾個基本概念總體參數(shù)一般是不知道的統(tǒng)計學(xué)抽樣研究的目的就是:樣本統(tǒng)計量→總體參數(shù)二、統(tǒng)計學(xué)中的幾個基本概念5、系統(tǒng)誤差(systematicerror)、非系統(tǒng)誤差(nonsystematicerror)、抽樣誤差(samplingerror)誤差(error)是指實(shí)際觀察值與觀察真值之差、樣本指標(biāo)與總體指標(biāo)之差。二、統(tǒng)計學(xué)中的幾個基本概念(1)、系統(tǒng)誤差(systematicerror):由於儀器未校正、測量者感官的某種障礙、醫(yī)生掌握療效標(biāo)準(zhǔn)偏高或偏低等原因,使觀察值不是分散在真值兩側(cè),而是有方向性、系統(tǒng)性或週期性地偏離真值。例如:測量血糖,有斑氏法和葡萄糖氧化法,斑氏法的測量結(jié)果偏高←易受體內(nèi)還原性物質(zhì)的影響。二、統(tǒng)計學(xué)中的幾個基本概念這類誤差可以通過實(shí)驗(yàn)設(shè)計和技術(shù)措施來消除或使之減少。

觀察性研究由於組間不可比性產(chǎn)生的系統(tǒng)誤差稱為偏倚(bias),如吸煙組的平均年齡大於吸煙組,兩組死亡率的差異包含年齡偏倚。二、統(tǒng)計學(xué)中的幾個基本概念(2)、非系統(tǒng)誤差(nonsystematicerror)由於研究者偶然失誤而造成的誤差。例如:儀器失靈、抄錯數(shù)據(jù)、點(diǎn)錯小數(shù)點(diǎn)、寫錯單位等,亦稱過失誤差(grosserror)這類誤差應(yīng)當(dāng)通過認(rèn)真檢查核對予以清除,否則將會影響研究結(jié)果的準(zhǔn)確性。二、統(tǒng)計學(xué)中的幾個基本概念(3)、抽樣誤差(samplingerror):由於抽樣所造成的樣本統(tǒng)計量與總體參數(shù)的差別。例如:=120.0cmn=100N=5萬→=118.6cm特點(diǎn):1)不可避免性2)有統(tǒng)計規(guī)律性二、統(tǒng)計學(xué)中的幾個基本概念產(chǎn)生原因:個體差異(生物變異)二、統(tǒng)計學(xué)中的幾個基本概念6、頻率(relativefrequency)、概率(probability)、小概率事件.(1)、頻率(relativefreguency):

一次隨機(jī)試驗(yàn)有幾種可能結(jié)果,在重複進(jìn)行試驗(yàn)時,個別結(jié)果看來是偶然發(fā)生的,但當(dāng)重複試驗(yàn)次數(shù)相當(dāng)多時,將顯現(xiàn)某種規(guī)律性。例如,投擲一枚硬幣,結(jié)果不外乎出現(xiàn)“正面”與“反面”兩種,現(xiàn)在,我們看一擲幣模擬試驗(yàn):二、統(tǒng)計學(xué)中的幾個基本概念實(shí)驗(yàn)者投擲次數(shù)出現(xiàn)“正面”次數(shù)頻率HuPingcheng111.0000HuPingcheng200.0000HuPingcheng320.6667HuPingcheng430.7500HuPingcheng530.6000HuPingcheng620.4000HuPingcheng740.5714Buffon404020480.5069K.Pearson1200060190.5016K.Pearson24000120120.5005二、統(tǒng)計學(xué)中的幾個基本概念可見,在相同條件下重複試驗(yàn),試驗(yàn)結(jié)果為“正面”或“反面”雖不能事先斷定,但我們知道試驗(yàn)的所有可能結(jié)果只有兩種。

在重複多次後,出現(xiàn)“正面”或“反面”這個結(jié)果的比例稱之為頻率。二、統(tǒng)計學(xué)中的幾個基本概念.(2)、概率(probability)概率是度量隨機(jī)事件發(fā)生可能性大小的一個數(shù)值。

設(shè)在相同條件下,獨(dú)立地重複n次試驗(yàn),隨機(jī)事件A出現(xiàn)

次,則稱為隨機(jī)事件A出現(xiàn)的頻率。當(dāng)n逐漸增大時,頻率

趨向於一個常數(shù),則稱該常數(shù)為隨機(jī)事件A的概率,可記為P(A),簡記為。0≤P(A)≤1二、統(tǒng)計學(xué)中的幾個基本概念0<P(A)<1隨機(jī)事件

P(A)=1必然事件

P(A)=0不可能事件。二、統(tǒng)計學(xué)中的幾個基本概念頻率是就樣本而言的,而概率從總體的意義上說的,m/n是概率p(A)的估計值。試驗(yàn)次數(shù)越多,估計越可靠。二、統(tǒng)計學(xué)中的幾個基本概念(3)小概率事件:統(tǒng)計分析中的很多結(jié)論都基於一定置信程度下的概率推斷,習(xí)慣上將稱為小概率事件,我們認(rèn)為小概率事件在一次試驗(yàn)中不可能發(fā)生。二、統(tǒng)計學(xué)中的幾個基本概念湖南風(fēng)采:中獎概率大約為:1/671萬交通事故:發(fā)生概率為:1/20萬三、統(tǒng)計資料的類型變數(shù)與統(tǒng)計資料的分類方法1.概述2.數(shù)值變數(shù)(numericalvariable)和計量資料(measurementdata)3.無序分類變數(shù)(unorderedcategoriesvariable)和計數(shù)資料(enumerationdata)4.有序分類變數(shù)(ordinalcategoriesvariable)和等級資料(rankeddata)三、統(tǒng)計資料的類型1.概述

數(shù)值變數(shù)………………..構(gòu)成計量資料分類變數(shù)無序分類變數(shù)……………...構(gòu)成計數(shù)資料

有序分類變數(shù)……………...構(gòu)成等級資料三、統(tǒng)計資料的類型2.數(shù)值變數(shù)與計量資料1).數(shù)值變數(shù)(numericalvariable):變數(shù)值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。如:身高(cm)、體重(kg)、血壓(pa)、

坐高/身高。2).計量資料(measurementdata):由一群個體的數(shù)值變數(shù)值構(gòu)成的資料,即一群變數(shù)值。如:長沙市99年7歲男孩身高值(120.2cm,118.6cm,121.8cm…)三、統(tǒng)計資料的類型3.無序分類變數(shù)與計數(shù)資料1).無序分類變數(shù)(unorderedcategoriesvariable):變數(shù)值是定性的,有類別。特點(diǎn):類別是客觀存在的,各類無秩序,可任意排列;類與類之間界限清楚,(理論上)不會錯判。如:性別:男、女。血型:O、A、B、AB。2).計數(shù)資料(enumerationdata):一群個體按無序分類變數(shù)的類別清點(diǎn)每類有多少個個體,即分類個體數(shù)。如:衛(wèi)生統(tǒng)計學(xué)教研室教師性別構(gòu)成:男:6,女:7。某人群血型構(gòu)成:O:20A:35B:30AB:10三、統(tǒng)計資料的類型4.有序分類變數(shù)與等級資料1).有序分類變數(shù)(ordinalcategoriesvariable):變數(shù)值是定性的、分等級。特點(diǎn):等級是主觀劃分的,各級沒有大小但有秩序,必須從低到高或由高到低;級和級之間界限模糊,可能錯判。如:療效:無效、好轉(zhuǎn)、顯效、治癒。血清反應(yīng):–、+、+、++ 2).等級資料(rankeddata):一群個體按有序分類變數(shù)的級別清點(diǎn)每級有多少個個體,即分級個體數(shù)。如:某地某人群EB病毒抗體反應(yīng):–:65

+:2+:3++:1四、醫(yī)學(xué)統(tǒng)計工作的基本步驟1、設(shè)計(design)專業(yè)設(shè)計

統(tǒng)計設(shè)計調(diào)查設(shè)計醫(yī)學(xué)科研設(shè)計實(shí)驗(yàn)設(shè)計臨床實(shí)驗(yàn)設(shè)計

醫(yī)學(xué)科研設(shè)計的程式

科研選題:選題又叫立題,確定所要研究的問題。選題是科研的起點(diǎn),也是關(guān)係到成敗的關(guān)鍵。(1)題意產(chǎn)生:(綜述)背景材料來源:個人經(jīng)驗(yàn)的積累;向有關(guān)專家請教;

文獻(xiàn)檢索等.專業(yè)設(shè)計文獻(xiàn)檢索的要點(diǎn)

(1)有助於認(rèn)識本課題的重要性(2)瞭解有關(guān)的既往研究工作情況(3)瞭解有關(guān)研究現(xiàn)狀(4)尋找可借鑒的研究方法(5)注意有關(guān)的不同見解與爭論。如:與****商榷類文章專業(yè)設(shè)計文獻(xiàn)檢索的幾種查法(1)先查國內(nèi)文獻(xiàn),再查國外文獻(xiàn)(2)先查綜述性文章,後原始文章。(3)先近期後遠(yuǎn)期(4)先核心期刊後一般期刊。專業(yè)設(shè)計

綜述性文章:是收集大量文獻(xiàn)資料經(jīng)過分析綜合,結(jié)合自己的工作和體會整理成的文章。它是對某一課題或新進(jìn)展作出的總結(jié),並指明發(fā)展方向,有較大的參考價值,是專題性文獻(xiàn)資料最集中的表現(xiàn)形式。

專業(yè)設(shè)計科研選題的原則(1)創(chuàng)新性:包括探索和創(chuàng)新兩個連續(xù)的過程,創(chuàng)新就是選擇前人沒有解決或沒有完全解決的問題。是本學(xué)科的空白點(diǎn),或者將會在理論上或應(yīng)用上有新的發(fā)展和補(bǔ)充。(2)科學(xué)性:以科學(xué)理論為指導(dǎo),符合客觀規(guī)律。(3)先進(jìn)性:先進(jìn)性是相對的,有國際先進(jìn)和國內(nèi)先進(jìn)。更重要的是結(jié)合實(shí)際條件選擇適合的先進(jìn)技術(shù)。(4)可行性:研究課題的主要技術(shù)指標(biāo)實(shí)現(xiàn)的可能性。它包括人、財、物的支持和工作基礎(chǔ)。專業(yè)設(shè)計選題方法(1)從招標(biāo)範(fàn)圍中選題。(2)從碰到的問題中選題(3)從文獻(xiàn)的空白點(diǎn)選題(4)從已有的課題延伸中選題(5)從改變研究內(nèi)容組合中選題(6)從其他學(xué)科移植中選題。專業(yè)設(shè)計四、醫(yī)學(xué)統(tǒng)計工作的基本步驟統(tǒng)計設(shè)計的內(nèi)容要包括資料的收集、整理和分析全過和的設(shè)想和安排。例如:研究目的和假說?研究對象和研究單位?研究因素(變數(shù))?收集哪些原始資料?用什麼方式和方法取得這些原始資料?怎樣整理匯總和計算統(tǒng)計指標(biāo)?如何控制誤差?預(yù)期會得到什麼結(jié)果?需要多少經(jīng)費(fèi)?統(tǒng)統(tǒng)計設(shè)計四、醫(yī)學(xué)統(tǒng)計工作的基本步驟在研究者對統(tǒng)計設(shè)計的構(gòu)思過程中,有以下幾個問題最為關(guān)鍵:

如何進(jìn)行抽樣?如何安排設(shè)計所規(guī)定的干預(yù)措施或稱處理(treatment)。要達(dá)到研究目的應(yīng)抽取多少個觀察單位?如何在諸多的影響因素中,分離出研究同素對結(jié)果的效應(yīng)?統(tǒng)計設(shè)計四、醫(yī)學(xué)統(tǒng)計工作的基本步驟(1)、對照的原則

對照(control)原則,即在均衡條件下實(shí)現(xiàn)實(shí)驗(yàn)組與對照組間科學(xué)對比的原則,它回答如何從諸多影響因素中,分離出研究因素對實(shí)驗(yàn)結(jié)果的效應(yīng)問題。所謂均衡性,即可比性,是指在對比組中,除研究因素不同外,或施加的處理不同外,其他影響實(shí)驗(yàn)結(jié)果的非研究因素,包括實(shí)驗(yàn)過程中的實(shí)驗(yàn)條件和輔助措施,都應(yīng)相同。統(tǒng)計設(shè)計無對照的研究誇大了門腔分流手術(shù)的作用表1-2

關(guān)於門腔分流手術(shù)的51次研究結(jié)果對照方式 門腔分流手術(shù)的價值小計

非常支持 支持 不支持

無對照 24 7 1 32非隨機(jī)對照10 3 2 15

隨機(jī)對照0 1 3 4

合計 34 11 6 51統(tǒng)計設(shè)計統(tǒng)計學(xué)家Student

1930年2月至6月主持的牛奶營養(yǎng)試驗(yàn)的現(xiàn)場觀察研究:對照組(1萬兒童)飲奶組(1萬兒童)對照組飲奶組年齡(歲)體重(磅)結(jié)論:對照組體重>飲奶組統(tǒng)計設(shè)計四、醫(yī)學(xué)統(tǒng)計工作的基本步驟(2)、重複(repetition)的原則

重複(repetition

)原則,即確定樣本含量的原則,它回答至少應(yīng)抽取多少個觀察單位的問題。

統(tǒng)計設(shè)計四、醫(yī)學(xué)統(tǒng)計工作的基本步驟(3)、隨機(jī)化(randomization)的原則1)、

隨機(jī)抽樣(randomizedsampling):指總體中的每一個觀察單位都有同等機(jī)會進(jìn)入樣本;2)、隨機(jī)分配(randomizedallocation):指本次研究所選定的實(shí)驗(yàn)受試對象都有同等機(jī)會進(jìn)入根據(jù)研究目的而設(shè)定的處理組和對照組。統(tǒng)計設(shè)計四、醫(yī)學(xué)統(tǒng)計工作的基本步驟2、收集資料(collectionofdata)(1)資料來源第一手資料1)

經(jīng)常性:統(tǒng)計報表(傳染病報表、職業(yè)病報表、醫(yī)院工作報表、死亡登記、疫情報告等),工作記錄(衛(wèi)生監(jiān)督記錄、健康檢查記錄、病歷等);2)一時性:專題調(diào)查、實(shí)驗(yàn)或臨床試驗(yàn)。第二手資料:已公佈的資料,如數(shù)據(jù)銀行、全國、全省衛(wèi)生統(tǒng)計資料。

四、醫(yī)學(xué)統(tǒng)計工作的基本步驟(2)、資料要求

1).完整:觀察單位及觀察專案完整。

2)準(zhǔn)確:即真實(shí)、可靠。真實(shí)是統(tǒng)計學(xué)的靈魂。

3).及時:即時限性。如人口普查規(guī)定調(diào)查開始日期和截止日期。四、醫(yī)學(xué)統(tǒng)計工作的基本步驟3、整理(sortingdata)資料

整理資料即原始數(shù)據(jù)的條理化、系統(tǒng)化的過程。DataCollectionDataAnalysisDataScreening

Timeconsuming,eventediousFundamentaltoanhonestanalysisofthedataTheissuesshouldbeconcernedindatascreeningTheaccuracyofthedataMissingdataOutliersThefitbetweenyourdataandtheassumptionsPerfectornear-perfectcorrelationsamongvariables四、醫(yī)學(xué)統(tǒng)計工作的基本步驟4、分析(analysisofdata)資料任務(wù):計算有關(guān)指標(biāo),反映數(shù)據(jù)的綜合特徵、闡明事物的內(nèi)在聯(lián)繫和規(guī)律。工具:1)foxbase資料庫2)spssforwindows11.03)SAS四、醫(yī)學(xué)統(tǒng)計工作的基本步驟統(tǒng)計描述統(tǒng)計分析統(tǒng)計推斷參數(shù)估計

假設(shè)檢驗(yàn)五、學(xué)習(xí)醫(yī)學(xué)統(tǒng)計學(xué)應(yīng)注意的問題1、醫(yī)學(xué)統(tǒng)計學(xué)研究的是群體的數(shù)量特徵↑適當(dāng)?shù)慕y(tǒng)計指標(biāo)2、學(xué)會統(tǒng)計學(xué)的思維方法抽樣研究→抽樣誤差→結(jié)論具有概率性

↑醫(yī)學(xué)專業(yè)知識解釋

五、學(xué)習(xí)醫(yī)學(xué)統(tǒng)計學(xué)應(yīng)注意的問題3、正確選用統(tǒng)計學(xué)方法(1)資料類型不同→統(tǒng)計學(xué)方法不同(2)設(shè)計類型不同→統(tǒng)計學(xué)方法不同(3)研究目的不同→統(tǒng)計學(xué)方法不同………..ContentFrequencydistributionDescriptionofcentraltendencyMeasuresofdispersionNormaldistributionRangeofreferencevalue第一節(jié)頻數(shù)分佈

一、頻數(shù)分佈表(frequencytable):例2-1從某單位1999年的職工體檢資料中獲得101名正常成年女子的血清總膽固醇()的測量結(jié)果如下,試編制頻數(shù)分佈表。

編制步驟如下:1.求極差

:

極差(range)也稱全距,即最大值和最小值之差,記作R。本例:。

2.確定組距(i):組段數(shù)通常取組

10-15組本例組距

3.寫組段:組下限(L):每個組段的起點(diǎn)組上限(U):每個組段的終點(diǎn)

2.30~

2.60~

2.90~

3.20~

…5.60~5.902.30~2.60~

4.分組段劃記並統(tǒng)計頻數(shù)

2.30~2.60~

頻數(shù)表:由各組段及其頻數(shù)所構(gòu)成的統(tǒng)計表。二、頻數(shù)分佈圖三、頻數(shù)表和頻數(shù)分佈圖用途

1.描述頻數(shù)分佈的類型

(1)對稱分佈:若各組段的頻數(shù)以頻數(shù)最多組段為中心左右兩側(cè)大體對稱,就認(rèn)為該資料是對稱分佈

(2)偏態(tài)分佈:1)右偏態(tài)分佈(skewedtotherightdistribution)也稱正偏態(tài)分佈(positiveskewnessdistribution):右側(cè)的組段數(shù)多於左側(cè)的組段數(shù),頻數(shù)向右側(cè)拖尾

2)左偏態(tài)分佈(skewedtotheleftdistribution)也稱負(fù)偏態(tài)分佈(negativeskewnessdistribution):左側(cè)的組段數(shù)多於右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾

2.描述頻數(shù)分佈的特徵

①變異的範(fàn)圍在2.30~5.90②有明顯的統(tǒng)計分佈規(guī)律,數(shù)據(jù)主要集中在3.50~4.70之間,尤以組段的人數(shù)3.80~4.10最多,且上下組段數(shù)的頻數(shù)分佈基本對稱。

3.便於發(fā)現(xiàn)一些特大或特小的可疑值

4.便於進(jìn)一步做統(tǒng)計分析和處理第二節(jié)

集中趨勢的描述

統(tǒng)計上使用平均數(shù)(average)這一指標(biāo)體系來描述一組變數(shù)值的集中位置或平均水準(zhǔn)。常用的平均數(shù)有:

算術(shù)均數(shù)幾何均數(shù)中位數(shù)

一、算術(shù)均數(shù)算術(shù)均數(shù):簡稱均數(shù)(mean)

可用於反映一組呈對稱分佈的變數(shù)值在數(shù)量上的平均水準(zhǔn)或者說是集中位置的特徵值。1、計算方法(1)直接計算法

公式:例2-2用直接法計算例2-1某單位101名正常成年女子的血清總膽固醇的均數(shù)。

(2)加權(quán)法:公式:計算4,4,4,6,6,8,8,8,10的均數(shù)?

例2-3利用表2-1計算101名正常成年女子的血總膽固醇的均數(shù)。

式中k表示頻數(shù)表的組段數(shù),及分別表示各組段的頻數(shù)和組中值,如表2-1第1個組段的組中值為,餘類推(見表2-1的第(3)欄)。在這裏,頻數(shù)起到了“權(quán)”(weight)的作用,即某個組段頻數(shù)多,權(quán)數(shù)就大,其組中值對均數(shù)的影響也大;反之,影響則小

2、應(yīng)用

適用於對稱分佈,特別是正態(tài)分佈資料。二、

幾何均數(shù)

幾何均數(shù)(geometricmean):可用於反映一組經(jīng)對數(shù)轉(zhuǎn)換後呈對稱分佈的變數(shù)值在數(shù)量上的平均水準(zhǔn)。1、計算方法(1)、直接計算法

公式:或例2-4某地5例微絲蚴血癥患者治療七年後用間接螢光抗體試驗(yàn)測得其抗體滴度倒數(shù)分別為,10,20,40,40,160,求幾何均數(shù)。(2)加權(quán)法公式:例2-569例類風(fēng)濕關(guān)節(jié)炎(RA)患者血清EBV-VCA-lgG抗體滴度的分佈見表2-4第(1)、(2)欄,求其平均抗體滴度。

故例類風(fēng)濕關(guān)節(jié)炎患者血清EBV-VCA-lgG抗體的平均滴度為:1:150.6。

2、應(yīng)用:

適用於成等比級數(shù)的資料,特別是對數(shù)正態(tài)分佈資料。三、

中位數(shù)與百分位數(shù)(一)中位數(shù)中位數(shù)(median):是將變數(shù)值從小到大排列,位置居於中間的那個變數(shù)值。例:1,3,7,5,>100

中位數(shù)為多少?計算公式:n為奇數(shù)時

n為偶數(shù)時

例2-67名病人患某病的潛伏期分別為2,3,4,5,6,9,16天,求其中位數(shù)。本例n=7,為奇數(shù)

例2-78名患者食物中毒的潛伏期分別為1,2,2,3,5,8,15,24小時,求其中位數(shù)。本例n=8,為偶數(shù)

應(yīng)用

適用於:1、各種分佈類型的資料

2、特別是偏態(tài)分佈資料和開囗資料(一端或兩端無確切數(shù)值的資料)。

(二)百分位數(shù)

百分位數(shù)(percentile)是一種位置指標(biāo),用來表示。一個百分位數(shù)將全部變數(shù)值分為兩部分,在不包含的全部變數(shù)值中有的變數(shù)值比它小,變數(shù)值比它大。

1.直接計算法

設(shè)有x個原始數(shù)據(jù)從小到大排列,第x百分位數(shù)的計算公式為:當(dāng)為帶有小數(shù)位時:

當(dāng)為整數(shù)時:例2-9對某醫(yī)院細(xì)菌性痢疾治癒者的住院天數(shù)統(tǒng)計,名患者的住院天數(shù)從小到大的排列如下,試求第5百分位數(shù)和第99百分位數(shù)。

者:

住院天數(shù):

n=120,120X5%=6,為整數(shù):

例2-9對某醫(yī)院細(xì)菌性痢疾治癒者的住院天數(shù)統(tǒng)計,名患者的住院天數(shù)從小到大的排列如下,試求第5百分位數(shù)和第99百分位數(shù)。

者:住院天數(shù):,帶有小數(shù),取整後t(yī)runc(118.8)=1182.頻數(shù)表法

公式:式中XL、Xi和Xf分別為第X百分位數(shù)所在組段的下限、組距和頻數(shù),LfS為小於XL各組段的累計頻數(shù),n

為總例數(shù)。

例2-10某地118名鏈球菌咽喉炎患者的潛伏期頻數(shù)表見表2-5第(1)、(2)欄,試分別求中位數(shù)及第25、第75百分位數(shù)。

第三節(jié)

離散趨勢的描述

例2-11三組同齡男孩的身高值(cm)

常用統(tǒng)計指標(biāo):

極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差和變異係數(shù)。

一、

極差極差,用R表示:即一組變數(shù)值最大值與最小值之差。

二、四分位數(shù)間距

四分位數(shù)間距,用QR表示:QR=下四分位數(shù):上四分位數(shù):

例2-12續(xù)例2-10。已知P25=39.2,P75=67.7,計算118名鏈球菌咽喉炎患者潛伏期的四分位數(shù)間距。

(天)請回答:四分位數(shù)間距可以看成大小在中間的一半變數(shù)值的全距(R)。

四分位數(shù)間距可以看成一半變數(shù)值的極差。三、方差與標(biāo)準(zhǔn)差

1、方差(variance)也稱均方差(meansquaredeviation),反映一組數(shù)據(jù)的平均離散水準(zhǔn)。

樣本方差用表示

2、公式:樣本標(biāo)準(zhǔn)差用表示公式:

標(biāo)準(zhǔn)差的公式還可以寫成:利用頻數(shù)表計算標(biāo)準(zhǔn)差的公式為例2-12續(xù)例2-10,計算三組資料的標(biāo)準(zhǔn)差。

甲組:

四、

變異係數(shù)

變異係數(shù)(coefficientofvariation)記為CV,多用於觀察指標(biāo)單位不同時,如身高與體重的變異程度的比較;或均數(shù)相差較大時,如兒童身高與成人身高變異程度的比較。

某地7歲男孩身高的均數(shù)為123.10cm,標(biāo)準(zhǔn)差為4.71;體重均數(shù)為22.59kg,標(biāo)準(zhǔn)差為2.26kg,

比較其變異度?

(觀察指標(biāo)單位不同)均數(shù)相差較大時:第四節(jié)

正態(tài)分佈

正態(tài)分佈:又稱為Gauss分佈(Gaussiandistribution)。

設(shè)想當(dāng)原始數(shù)據(jù)的頻數(shù)分佈圖的觀察人數(shù)逐漸增加且組段不斷分細(xì)時,圖2-4中的直條就不斷變窄,其頂端則逐漸接近於一條光滑的曲線。這條曲線形態(tài)呈鐘形,兩頭低、中間高,左右對稱,近似於數(shù)學(xué)上的正態(tài)分佈。在處理資料時,我們就把它看成是正態(tài)分佈。一、正態(tài)分佈的概念和特徵

1.正態(tài)分佈曲線的數(shù)學(xué)函數(shù)運(yùn)算式

如果隨機(jī)變數(shù)的分佈服從概率密度函數(shù)2.正態(tài)分佈的特徵

(4)正態(tài)曲線下的面積分佈有一定的規(guī)律。對公式(2-17)積分

:正態(tài)分佈是一個分佈族,對應(yīng)於不同的參數(shù)m和s會產(chǎn)生不同位置、不同形狀的正態(tài)分佈。

正態(tài)分佈除了可估計頻數(shù)分佈外,還是許多統(tǒng)計方法的基礎(chǔ),並可應(yīng)用於品質(zhì)控制及制定醫(yī)學(xué)參考值範(fàn)圍。第五節(jié)

醫(yī)學(xué)參考值範(fàn)圍的制定

一、基本概念

醫(yī)學(xué)參考值(referencevalue)是指包括絕大多數(shù)正常人的人體形態(tài)、機(jī)能和代謝產(chǎn)物等各種生理及生化指標(biāo)常數(shù),也稱正常值。由於存在個體差異,生物醫(yī)學(xué)數(shù)據(jù)並非常數(shù)而是在一定範(fàn)圍內(nèi)波動,故採用醫(yī)學(xué)參考值範(fàn)圍(medicalreferencerange)作為判定正常和異常的參考標(biāo)準(zhǔn)。

醫(yī)學(xué)參考值範(fàn)圍涉及到採用單側(cè)界值還是雙側(cè)界值的問題,這通常依據(jù)醫(yī)學(xué)專業(yè)知識而定。

雙側(cè)

:血清總膽固醇無論過低或過高均屬異常白細(xì)胞數(shù)無論過低或過高均屬異常單側(cè):1、血清轉(zhuǎn)氨酶僅過高異常2、肺活量僅過低異常

醫(yī)學(xué)參考值範(fàn)圍有、、等,最常用的為。計算醫(yī)學(xué)參考值範(fàn)圍的常用方法:1、正態(tài)分佈法

2、百分位數(shù)法二、方法1、正態(tài)分佈法:許多生物醫(yī)學(xué)數(shù)據(jù)服從或近似服從正態(tài)分佈,如同年齡同性別兒童的身高值、體重值,同性別健康成人的紅細(xì)胞數(shù)等;有些醫(yī)學(xué)資料雖然呈偏態(tài)分佈,但若能通過適當(dāng)?shù)淖償?shù)變換轉(zhuǎn)換為正態(tài)分佈,也可採用正態(tài)分佈法制定參考值範(fàn)圍。

適用:正態(tài)分佈資料

公式:2、百分位數(shù)法適用:各種分佈資料特別是偏態(tài)分佈資料

公式:

例2-17測得某年某地名正常人的尿汞值如下表,試製定正常人尿汞值的參考值範(fàn)圍。

142Content1.Samplingerrorandstandarderrorofmean2.t-distribution3.EstimationofPopulationMean4.t-test5.Noticeofhypothesistest

6.Normalitytestandhomogeneityofvariancetest143第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤144統(tǒng)計推斷:由樣本資訊推斷總體特徵。樣本統(tǒng)計指標(biāo)(統(tǒng)計量)總體統(tǒng)計指標(biāo)(參數(shù))正態(tài)(分佈)總體:推斷!說明!為說明抽樣誤差規(guī)律,先用一個實(shí)例,後引出理論。145圖3-11999年某市18歲男生身高N(167.7,5.32)的抽樣示意圖

146見P34~36表3-1147

將此100個樣本均數(shù)看成新變數(shù)值,則這100個樣本均數(shù)構(gòu)成一新分佈,繪製直方圖。圖3-2從正態(tài)分佈總體N(167.7,5.32)隨機(jī)抽樣所得樣本均數(shù)分佈148①

,各樣本均數(shù)未必等於總體均數(shù);②各樣本均數(shù)間存在差異;③樣本均數(shù)的分佈為中間多,兩邊少,左右基本對稱。

④樣本均數(shù)的變異範(fàn)圍較之原變數(shù)的變異範(fàn)圍大大縮小。可算得這100個樣本均數(shù)的均數(shù)為167.69cm、標(biāo)準(zhǔn)差為1.69cm。

樣本均數(shù)的抽樣分佈具有如下特點(diǎn):1491、抽樣誤差:

由個體變異產(chǎn)生的、抽樣造成的樣本統(tǒng)計量與總體參數(shù)的差別

均數(shù)的抽樣誤差:由於抽樣造成的樣本均數(shù)與總體均數(shù)的差別原因:1)抽樣

2)個體差異150本書以n=60為界限151表示樣本統(tǒng)計量抽樣誤差大小的統(tǒng)計指標(biāo)。均數(shù)標(biāo)準(zhǔn)誤:說明均數(shù)抽樣誤差的大小,總體計算公式(3-1)2、標(biāo)準(zhǔn)誤(standarderror,SE)實(shí)質(zhì):樣本均數(shù)的標(biāo)準(zhǔn)差152數(shù)理統(tǒng)計證明:

153若用樣本標(biāo)準(zhǔn)差S來估計,

(3-2)降低抽樣誤差的途徑有:①通過增加樣本含量n;②通過設(shè)計減少S。154第二節(jié)t分佈(t-distribution)155t分佈概述

抽樣誤差的分佈規(guī)律

↓樣本→總體

t分佈理論

↑手段(橋樑)目的156

一、t分佈的概念

157158

式中為自由度(degreeoffreedom,df)

3.實(shí)際工作中,由於未知,用代替,則不再服從標(biāo)準(zhǔn)正態(tài)分佈,而服從t分佈。

159二、t分佈的圖形與特徵

分佈只有一個參數(shù),即自由度160

圖3-3不同自由度下的t分佈圖1611.特徵:

1622t界值表:詳見附表2,可反映t分佈曲線下的面積。單側(cè)概率或單尾概率:用表示;雙側(cè)概率或雙尾概率:用表示。

163-tt0164舉例:

165第三節(jié)總體均數(shù)的估計166一、參數(shù)估計用樣本統(tǒng)計量推斷總體參數(shù)??傮w均數(shù)估計:用樣本均數(shù)(和標(biāo)準(zhǔn)差)推斷總體均數(shù)。167168

按預(yù)先給定的概率(1

)所確定的包含未知總體參數(shù)的一個範(fàn)圍??傮w均數(shù)的區(qū)間估計:按預(yù)先給定的概率(1

)所確定的包含未知總體均數(shù)的一個範(fàn)圍。

如給定

=0.05,該範(fàn)圍稱為參數(shù)的95%可信區(qū)間或置信區(qū)間;如給定

=0.01,該範(fàn)圍稱為參數(shù)的99%可信區(qū)間或置信區(qū)間。2.區(qū)間估計(intervalestimation):169二、總體均數(shù)可信區(qū)間的計算170

總體均數(shù)可信區(qū)間的計算需考慮:(1)總體標(biāo)準(zhǔn)差

是否已知,(2)樣本含量n的大小通常有兩類方法:(1)t分佈法

(2)u分佈法171

1.單一總體均數(shù)的可信區(qū)間

172173P25,15號樣本174175176

例3-3某地抽取正常成年人200名,測得其血清膽固醇的均數(shù)為3.64mmol/L,標(biāo)準(zhǔn)差為1.20mmol/L,估計該地正常成年人血清膽固醇均數(shù)的95%可信區(qū)間。

177

故該地正常成年人血清膽固醇均數(shù)的雙側(cè)95%可信區(qū)間為(3.47,3.81)mmol

L。178

179180181

例3-4為了解氨甲喋呤(MTX)對外周血IL-2水準(zhǔn)的影響,某醫(yī)生將61名哮喘患者隨機(jī)分為兩組。其中對照組29例(),採用安慰劑;實(shí)驗(yàn)組32例(),採用小劑量氨甲喋呤(MTX)進(jìn)行治療。測得對照組治療前IL-2的均數(shù)為20.10IU/ml(),標(biāo)準(zhǔn)差為7.02IU/ml();試驗(yàn)組治療前IL-2的均數(shù)為16.89IU/ml(),標(biāo)準(zhǔn)差為8.46IU/ml()。問兩組治療前基線的IL-2總體均數(shù)相差有多大?

182第一步:

183能否下:兩組IL-2的總體均數(shù)“不同”或“有差別”的結(jié)論?184三、可信區(qū)間的確切涵義185

1.95%的可信區(qū)間的理解:(1)所要估計的總體參數(shù)有95%的可能在我們所估計的可信區(qū)間內(nèi)。(2)從正態(tài)總體中隨機(jī)抽取100個樣本,可算得100個樣本均數(shù)和標(biāo)準(zhǔn)差,也可算得100個均數(shù)的可信區(qū)間,平均約有95個可信區(qū)間包含了總體均數(shù)。(3)但在實(shí)際工作中,只能根據(jù)一次試驗(yàn)結(jié)果估計可信區(qū)間,我們就認(rèn)為該區(qū)間包含了總體均數(shù)

。186

2.可信區(qū)間的兩個要素(1)準(zhǔn)確度:用可信度(1

)表示:即區(qū)間包含總體均數(shù)

的理論概率大小。當(dāng)然它愈接近1愈好,如99%的可信區(qū)間比95%的可信區(qū)間要好。(2)精確度:即區(qū)間的寬度區(qū)間愈窄愈好,如95%的可信區(qū)間比99%的可信區(qū)間要好。187

當(dāng)n確定時,上述兩者互相矛盾。提高準(zhǔn)確度(可信度),則精確度降低(可信區(qū)間會變寬),勢必降低可信區(qū)間的實(shí)際應(yīng)用價值,故不能籠統(tǒng)認(rèn)為99%可信區(qū)間比95%可信區(qū)間要好。相反,在實(shí)際應(yīng)用中,95%可信區(qū)間更為常用。188

在可信度確定的情況下,增加樣本含量可減小區(qū)間寬度,提高精確度。189四、總體均數(shù)可信區(qū)間與參考值範(fàn)圍的區(qū)別190*也可用對應(yīng)於雙尾概率時),**也可用對應(yīng)於雙尾概率時)表3-2總體均數(shù)的可信區(qū)間與參考值範(fàn)圍的區(qū)別191第四節(jié)

t檢驗(yàn)1921、樣本均數(shù)與已知某總體均數(shù)比較的t檢驗(yàn)

目的:推斷一個未知總體均數(shù)與已知總體均數(shù)是否有差別,用單樣本設(shè)計。2、兩個樣本均數(shù)與比較的t檢驗(yàn)

目的:推斷兩個未知總體均數(shù)與是否有差別,用成組設(shè)計。3、配對設(shè)計資料均數(shù)比較的t檢驗(yàn)

目的:推斷兩個未知總體均數(shù)與是否有差別用配對設(shè)計。t檢驗(yàn),亦稱studentt檢驗(yàn),有下述情況:193對於大樣本,也可以近似用u檢驗(yàn)。194t檢驗(yàn)和u檢驗(yàn)的應(yīng)用條件:1.t檢驗(yàn)應(yīng)用條件:樣本含量n較小時(如n<60)(1)正態(tài)分佈(2)方差齊性(homogeneityofvariance)2.u

檢驗(yàn)應(yīng)用條件:樣本含量n較大,或n雖小但總體標(biāo)準(zhǔn)差已知

(1)正態(tài)分佈

(2)方差齊性(homogeneityofvariance)195

假設(shè)檢驗(yàn)過去稱顯著性檢驗(yàn)。它是利用小概率反證法思想,從問題的對立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立。然後在H0成立的條件下計算檢驗(yàn)統(tǒng)計量,最後獲得P值來判斷。

假設(shè)檢驗(yàn)基本思想及步驟196例3-5某醫(yī)生測量了36名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標(biāo)準(zhǔn)差為25.74g/L。問從事鉛作業(yè)工人的血紅蛋白是否不同於正常成年男性平均值140g/L?130.83g/L≠140g/L原因:1.可能是總體均數(shù)不同

2.是抽樣造成的197198③

H1的內(nèi)容直接反映了檢驗(yàn)單雙側(cè)。若H1中只是

0或

<

0,則此檢驗(yàn)為單側(cè)檢驗(yàn)。它不僅考慮有無差異,而且還考慮差異的方向。④

單雙側(cè)檢驗(yàn)的確定,首先根據(jù)專業(yè)知識,其次根據(jù)所要解決的問題來確定。若從專業(yè)上看一種方法結(jié)果不可能低於或高於另一種方法結(jié)果,此時應(yīng)該用單側(cè)檢驗(yàn)。一般認(rèn)為雙側(cè)檢驗(yàn)較保守和穩(wěn)妥。199

(3)檢驗(yàn)水準(zhǔn)

,過去稱顯著性水準(zhǔn),是預(yù)先規(guī)定的概率值,它確定了小概率事件的標(biāo)準(zhǔn)。在實(shí)際工作中常取

=0.05??筛鶕?jù)不同研究目的給予不同設(shè)置。200

根據(jù)變數(shù)和資料類型、設(shè)計方案、統(tǒng)計推斷的目的、是否滿足特定條件等(如數(shù)據(jù)的分佈類型)選擇相應(yīng)的檢驗(yàn)統(tǒng)計量。

2.計算檢驗(yàn)統(tǒng)計量201

P的含義是指從H0規(guī)定的總體隨機(jī)抽樣,抽得等於及大於(或/和等於及小於)現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計量(如t、u等)值的概率。例3-5的P值可用圖3-5說明,P為在

=

0=140g/L的前提條件下隨機(jī)抽樣,其t小於及等於-2.138和大於及等於2.138的概率。

3.確定P值202圖3-5例3-5中P值示意圖203204

若,是否也能下“無差別”或“相等”的結(jié)論?

205一、單樣本t

檢驗(yàn)

(onesample/groupt-test)

即樣本均數(shù)(代表未知總體均數(shù)

)與已知總體均數(shù)

0(一般為理論值、標(biāo)準(zhǔn)值或經(jīng)過大量觀察所得穩(wěn)定值等)的比較。其檢驗(yàn)統(tǒng)計量按下式計算206

例3-5某醫(yī)生測量了36名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標(biāo)準(zhǔn)差為25.74g/L。問從事鉛作業(yè)工人的血紅蛋白是否不同於正常成年男性平均值140g/L?

(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)H0:

=

0=140g/L,即鉛作業(yè)男性工人平均血紅蛋白含量與正常成年男性平均值相等H1:

0=140g/L,即鉛作業(yè)男性工人平均血紅蛋白含量與正常成年男性平均值不等

=0.05207(2)計算檢驗(yàn)統(tǒng)計量

208(3)確定P值,作出推斷結(jié)論

209配對t檢驗(yàn)適用於配對設(shè)計的計量資料。配對設(shè)計類型:①兩同質(zhì)受試對象分別接受兩種不同的處理;②同一受試對象分別接受兩種不同處理;③同一受試對象(一種)處理前後。

二、配對t檢驗(yàn)(paired/matchedt-test)210

例3-6為比較兩種方法對乳酸飲料中脂肪含量測定結(jié)果是否不同,某人隨機(jī)抽取了10份乳酸飲料製品,分別用脂肪酸水解法和哥特裏-羅紫法測定其結(jié)果如表3-3第(1)~(3)欄。問兩法測定結(jié)果是否不同?211表3-3兩種方法對乳酸飲料中脂肪含量的測定結(jié)果(%)

212

(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)H0:

d=0,即兩種方法的測定結(jié)果相同H1:

d≠0,即兩種方法的測定結(jié)果不同

=0.05

(2)計算檢驗(yàn)統(tǒng)計量本例n=10,d=2.724,d2=0.8483,

213按公式(3-16)

(3)確定P值,作出推斷結(jié)論查附表2的t界值表得P<0.001。按

=0.05水準(zhǔn),拒絕H0,接受H1,有統(tǒng)計學(xué)意義。可認(rèn)為兩種方法對脂肪含量的測定結(jié)果不同,哥特裏-羅紫法測定結(jié)果較高。214

三、兩樣本t檢驗(yàn)

(two-sample/groupt-test)

又稱成組t檢驗(yàn),適用於完全隨機(jī)設(shè)計兩樣本均數(shù)的比較,此時人們關(guān)心的是兩樣本均數(shù)所代表的兩總體均數(shù)是否不等。兩組完全隨機(jī)設(shè)計是將受試對象完全隨機(jī)分配到兩個不同處理組。215

適用範(fàn)圍:完全隨機(jī)設(shè)計兩樣本均數(shù)的比較檢驗(yàn)方法:依兩總體方差是否齊性而定。216217

例3-7

為研究國產(chǎn)四類新藥阿卡波糖膠囊的降血糖效果,某醫(yī)院用40名II型糖尿病病人進(jìn)行同期隨機(jī)對照試驗(yàn)。試驗(yàn)者將這些病人隨機(jī)等分到試驗(yàn)組(用阿卡波糖膠囊)和對照組(用拜唐蘋膠囊),分別測得試驗(yàn)開始前和8周後的空腹血糖,算得空腹血糖下降值見表3-4,能否認(rèn)為該國產(chǎn)四類新藥阿卡波糖膠囊與拜唐蘋膠囊對空腹血糖的降糖效果不同?218219

(2)計算檢驗(yàn)統(tǒng)計量

220(3)確定P值,作出推斷結(jié)論

221

若變數(shù)變換後總體方差齊性

可採用t檢驗(yàn)(如兩樣本幾何均數(shù)的t檢驗(yàn),就是將原始數(shù)據(jù)取對數(shù)後進(jìn)行t檢驗(yàn));

若變數(shù)變換後總體方差仍然不齊

可採用t

檢驗(yàn)或Wilcoxon秩和檢驗(yàn)。若兩總體方差不等(),?222

2.Cochran&Cox近似t檢驗(yàn)(t‘

檢驗(yàn))

——調(diào)整t界值223224

例3-8

在上述例3-7國產(chǎn)四類新藥阿卡波糖膠囊的降血糖效果研究中,測得用拜唐蘋膠囊的對照組20例病人和用阿卡波糖膠囊的試驗(yàn)組20例病人,其8周時糖化血紅蛋白HbA1c(%)下降值如表3-5。問用兩種不同藥物的病人其HbA1c下降值是否不同?225表3-5對照組和試驗(yàn)組HbA1c下降值(%)

對照組方差是試驗(yàn)組方差的3.77倍,經(jīng)方差齊性檢驗(yàn),認(rèn)為兩組的總體方差不等,故採用近似t檢驗(yàn)。226

(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)(略)(2)計算檢驗(yàn)統(tǒng)計量

227(3)確定P值,作出推斷結(jié)論。查t界值表t0.05/2,19=2.093。

由t

=0.965<t

0.05/2=2.093得P>0.05。按

=0.05水準(zhǔn),不拒絕H0,無統(tǒng)計學(xué)意義。還不能認(rèn)為用兩種不同藥物的病人其HbA1c下降值不同。228

3.Satterthwaite近似t檢驗(yàn)

:

Cochran&Cox法是對臨界值校正而Satterthwaite法則是對自由度校正。

229

=28.4

28、t=0.965查附表2的t界值表得0.20<P<0.40。結(jié)論同前。按Satterthwaite法對例3-8做檢驗(yàn),得230

3.Welch法近似t檢驗(yàn)Welch法也是對自由度進(jìn)行校正。校正公式為231對例3-8,如按Welch法,則

=29.4

29、t=0.965查附表2的t界值表得0.20<P<0.40。結(jié)論同前。232

第五節(jié)假設(shè)檢驗(yàn)注意事項(xiàng)233一、I型錯誤和II型錯誤

假設(shè)檢驗(yàn)是利用小概率反證法思想,根據(jù)P值判斷結(jié)果,此推斷結(jié)論具有概率性,因而無論拒絕還是不拒絕H0,都可能犯錯誤。見表3-8。234表3-8可能發(fā)生的兩類錯誤235

I型錯誤:“實(shí)際無差別,但下了有差別的結(jié)論”,假陽性錯誤。犯這種錯誤的概率是

(其值等於檢驗(yàn)水準(zhǔn))

II型錯誤:“實(shí)際有差別,但下了不拒絕H0的結(jié)論”,假陰性錯誤。犯這種錯誤的概率是

(其值未知)

。

但n

一定時,

增大,

則減少。1-

:檢驗(yàn)效能(power):當(dāng)兩總體確有差別,按檢驗(yàn)水準(zhǔn)

所能發(fā)現(xiàn)這種差別的能力。236圖3-6I型錯誤與II型錯誤示意圖(以單側(cè)u檢驗(yàn)為例)

237減少I型錯誤的主要方法:假設(shè)檢驗(yàn)時設(shè)定

值。減少II型錯誤的主要方法:提高檢驗(yàn)效能。提高檢驗(yàn)效能的最有效方法:增加樣本量。如何選擇合適的樣本量:實(shí)驗(yàn)設(shè)計。238二、假設(shè)檢驗(yàn)應(yīng)注意的問題1.要有嚴(yán)密的研究設(shè)計這是假設(shè)檢驗(yàn)的前提。組間應(yīng)均衡,具有可比性,也就是除對比的主要因素(如臨床試驗(yàn)用新藥和對照藥)外,其他可能影響結(jié)果的因素(如年齡、性別、病程、病情輕重等)在對比組間應(yīng)相同或相近。保證均衡性的方法主要是從同質(zhì)總體中隨機(jī)抽取樣本,或隨機(jī)分配樣本。2392.不同的資料應(yīng)選用不同檢驗(yàn)方法

應(yīng)根據(jù)分析目的、資料類型以及分佈、設(shè)計方案的種類、樣本含量大小等選用適當(dāng)?shù)臋z驗(yàn)方法。如:配對設(shè)計的計量資料採用配對t檢驗(yàn)。而完全隨機(jī)設(shè)計的兩樣本計量資料,若為小樣本(即任一ni60)且方差齊,則選用兩樣本t檢驗(yàn);若方差不齊,則選用近似t

檢驗(yàn)(Cochran&Cox法或Satterthwaite法)。若為大樣本(所有ni>60),則可選用大樣本u檢驗(yàn)。2403.正確理解“顯著性”一詞的含義

差別有或無統(tǒng)計學(xué)意義,過去稱差別有或無“顯著性”,是對樣本統(tǒng)計量與總體參數(shù)或樣本統(tǒng)計量之間的比較而言,相應(yīng)推斷為:可以認(rèn)為或還不能認(rèn)為兩個或多個總體參數(shù)有差別。2414.結(jié)論不能絕對化因統(tǒng)計結(jié)論具有概率性質(zhì),故“肯定”、“一定”、“必定”等詞不要使用。在報告結(jié)論時,最好列出檢驗(yàn)統(tǒng)計量的值,儘量寫出具體的P值或P值的確切範(fàn)圍,如寫成P=0.040或0.02<P<0.05,而不簡單寫成P<0.05,以便讀者與同類研究進(jìn)行比較或進(jìn)行循證醫(yī)學(xué)時採用Meta分析。2425.假設(shè)檢驗(yàn)是為專業(yè)服務(wù)的,統(tǒng)計結(jié)論必須和專業(yè)結(jié)論有機(jī)地相結(jié)合,才能得出恰如其分、符合客觀實(shí)際的最終結(jié)論。若統(tǒng)計結(jié)論和專業(yè)結(jié)論一致,則最終結(jié)論就和這兩者均一致(即均有或均無意義);若統(tǒng)計結(jié)論和專業(yè)結(jié)論不一致,則最終結(jié)論需根據(jù)實(shí)際情況加以考慮。若統(tǒng)計結(jié)論有意義,而專業(yè)結(jié)論無意義,則可能由於樣本含量過大或設(shè)計存在問題,那麼最終結(jié)論就沒有意義。243

6.可信區(qū)間與假設(shè)檢驗(yàn)各自不同的作用,要結(jié)合使用。

一方面,可信區(qū)間亦可回答假設(shè)檢驗(yàn)的問題,算得的可信區(qū)間若包含了H0,則按

水準(zhǔn),不拒絕H0;若不包含H0,則按

水準(zhǔn),拒絕H0,接受H1。

244

另一方面,可信區(qū)間不但能回答差別有無統(tǒng)計學(xué)意義,而且還能比假設(shè)檢驗(yàn)提供更多的資訊,即提示差別有無實(shí)際的專業(yè)意義。

245圖3-7可信區(qū)間在統(tǒng)計推斷上提供的資訊

246

雖然可信區(qū)間亦可回答假設(shè)檢驗(yàn)的問題,並能提供更多的資訊,但並不意味著可信區(qū)間能夠完全代替假設(shè)檢驗(yàn)??尚艆^(qū)間只能在預(yù)先規(guī)定的概率

檢驗(yàn)水準(zhǔn)

的前提下進(jìn)行計算,而假設(shè)檢驗(yàn)?zāi)軌颢@得一較為確切的概率P值。

247第六節(jié)正態(tài)性檢驗(yàn)和兩樣本方差比較的F檢驗(yàn)248

t檢驗(yàn)的應(yīng)用條件是正態(tài)總體且方差齊性;配對t檢驗(yàn)則要求每對數(shù)據(jù)差值的總體為正態(tài)總體。進(jìn)行兩小樣本t檢驗(yàn)時,一般應(yīng)對資料進(jìn)行方差齊性檢驗(yàn),尤其兩樣本方差懸殊時。若方差齊,採用一般的t檢驗(yàn);若方差不齊,則採用t’檢驗(yàn)。249一、正態(tài)性檢驗(yàn)(normalitytest)

1.圖示法:P-Pplot,Q-Qplot2.矩法偏度係數(shù)(skewness),峰度係數(shù)(kurtosis)。

3.

W檢驗(yàn)法

4.

D檢驗(yàn)法250圖3-8例3-1中100個樣本均數(shù)的P-P圖251圖3-9例3-1中100個樣本均數(shù)的Q-Q圖252253254

例3-9試用矩法對表3-1中電腦模擬抽樣所得100個樣本均數(shù)進(jìn)行正態(tài)性檢驗(yàn)。255(2)計算檢驗(yàn)統(tǒng)計量256二、兩樣本方差比較的F檢驗(yàn)

兩小樣本t

檢驗(yàn)時,檢查兩樣本方差代表的總體方差是否相等(決定t檢驗(yàn)的方法)。

1.Levene檢驗(yàn)

2.F檢驗(yàn)257258259

圖3-10不同自由度時F分佈的圖形260

(2)計算檢驗(yàn)統(tǒng)計量

例3-10對例3-7,用F檢驗(yàn)判斷兩總體空腹血糖下降值的方差是否不等。

(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)261

(3)確定P值,作出推斷結(jié)論

262三、變數(shù)變換

常用的變數(shù)變換有對數(shù)變換、平方根變換、倒數(shù)變換、平方根反正弦變換等,應(yīng)根據(jù)資料性質(zhì)選擇適當(dāng)?shù)淖償?shù)變換方法。263264265266小結(jié)

1.均數(shù)的標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差的區(qū)別2.兩均數(shù)差別檢驗(yàn)的比較:大樣本也可近似用u檢驗(yàn)

Content1.Basalidealandapplicationconditions2.ANOVAofcompletelyrandomdesigneddata

3.ANOVAofrandomizedblockdesigneddata4.ANOVAoflatinsquaredesigneddata

5.ANOVAofcross-overdesigneddata

6.Multiplecomparisonofsamplemeans7.BartletttestandLevenetest第一節(jié)方差分析的基本思想及其應(yīng)用條件目的:推斷多個總體均數(shù)是否有差別。

也可用於兩個

方法:方差分析,即多個樣本均數(shù)比較的F檢驗(yàn)?;舅枷耄焊鶕?jù)資料設(shè)計的類型及研究目的,可將總變異分解為兩個或多個部分,每個部分的變異可由某因素的作用來解釋。通過比較可能由某因素所至的變異與隨機(jī)誤差,即可瞭解該因素對測定結(jié)果有無影響。應(yīng)用條件:總體——正態(tài)且方差相等

樣本——獨(dú)立、隨機(jī)設(shè)計類型:完全隨機(jī)設(shè)計資料的方差分析隨機(jī)區(qū)組設(shè)計資料的方差分析拉丁方設(shè)計資料的方差分析兩階段交叉設(shè)計資料的方差分析完全隨機(jī)設(shè)計資料的方差分析的基本思想

合計

NS:第i個處理組第j個觀察結(jié)果記總均數(shù)為,各處理組均數(shù)為,總例數(shù)為N=nl+n2+…+ng,g為處理組數(shù)。

1.總變異:全部測量值大小不同,這種變異稱為總變異??傋儺惖拇笮】梢杂秒x均差平方和(sumofsquaresofdeviationsfrommean,SS)表示,即各測量值Xij與總均數(shù)差值的平方和,記為SS總??傋儺怱S總反映了所有測量值之間總的變異程度。計算公式為其中:2.組間變異:各處理組由於接受處理的水準(zhǔn)不同,各組的樣本均數(shù)

(i=1,2,…,g)也大小不等,這種變異稱為組間變異。其大小可用各組均數(shù)與總均數(shù)的離均差平方和表示,記為SS組間。計算公式為3.組內(nèi)變異:在同一處理組中,雖然每個受試對象接受的處理相同,但測量值仍各不相同,這種變異稱為組內(nèi)變異(誤差)。組內(nèi)變異可用組內(nèi)各測量值Xij與其所在組的均數(shù)的差值的平方和表示,記為SS組內(nèi),表示隨機(jī)誤差的影響。

三種變異的關(guān)係:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論