醫(yī)學(xué)統(tǒng)計學(xué)基礎(chǔ)_第1頁
醫(yī)學(xué)統(tǒng)計學(xué)基礎(chǔ)_第2頁
醫(yī)學(xué)統(tǒng)計學(xué)基礎(chǔ)_第3頁
醫(yī)學(xué)統(tǒng)計學(xué)基礎(chǔ)_第4頁
醫(yī)學(xué)統(tǒng)計學(xué)基礎(chǔ)_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

本文格式為Word版,下載可任意編輯——醫(yī)學(xué)統(tǒng)計學(xué)基礎(chǔ)醫(yī)學(xué)統(tǒng)計學(xué)

第一講緒論

一、《醫(yī)學(xué)統(tǒng)計學(xué)》的理論基礎(chǔ)和研究對象:

a)問題的提出:

在人們的實踐活動中,往往會遇到類似下面的一些問題:一種新的疫苗,如何判斷它是否有效?吸煙會不會使得肺癌的機遇增加?

如何抽檢幾百或幾千人來估計某種病的流行程度?某批產(chǎn)品中合格品畢竟有多少?該不該報廢?

如何消耗最少的資源和人力來得到我們所需要的某種信息?某種試驗方法(或飼料配方)有沒有明顯改進?患者分組是否具有可比性?

所觀測對象的數(shù)量是否足夠說明其結(jié)論?試驗結(jié)果的誤差有多大?

研究結(jié)果是否適用于觀測樣本以外的同類對象?……等等.其共同特點:只知道事情的不完全信息,或者是單個試驗的結(jié)果有某種不確定性。

例如:為了知道產(chǎn)品合格與否或它的使用壽命,我們往往需要對它作破壞性檢驗,此時顯然不能把所有的產(chǎn)品都檢驗一下,而只能滿足于對少數(shù)幾個作品的抽檢,這樣獲得的信息顯然是不完全的;

要檢驗疫苗的有效性,就一般來說,接種過疫苗的動物也不一定

醫(yī)學(xué)統(tǒng)計學(xué)

全不發(fā)病,而未接種的也不會全發(fā)病.那么發(fā)病與不發(fā)病的區(qū)別畢竟到多大時我們才能認(rèn)為接種是有效的呢?

這些均涉及了我們?nèi)绾卧u價一些并不確定的試驗結(jié)果的問題。要從這類問題中得出科學(xué)的、可靠的結(jié)論,就必需依靠統(tǒng)計學(xué).有人干脆給統(tǒng)計學(xué)下了這樣的定義:“統(tǒng)計學(xué)就是從不完全的信息里取得確鑿知識的一系列技巧〞。

另外,當(dāng)必需根據(jù)有限的、完全的信息作出決策時(例如決定一

批產(chǎn)品是出廠還是報廢,某種新藥是否有效等等),統(tǒng)計學(xué)可以提供一種方法,使我們不僅能做出合理的決策,而且知道所冒風(fēng)險的大小,并幫助我們把可能的損失減至最小。

其次,如何花費最小代價取得所關(guān)心的信息,也是統(tǒng)計學(xué)的一大課題(實險設(shè)計).不注意這一點可能使辛辛苦苦的工作全成為一種浪費.

2.理論基礎(chǔ):“根據(jù)數(shù)理統(tǒng)計的原理、方法緊湊結(jié)合醫(yī)學(xué)實踐,研究醫(yī)藥衛(wèi)生領(lǐng)域中的資料收集、整理、分析和推斷的一門應(yīng)用學(xué)科,來分析和解釋生物界各種現(xiàn)象和試驗調(diào)查資料的科學(xué)〞。隨著生物醫(yī)學(xué)研究的不斷發(fā)展,運用統(tǒng)計學(xué)方法來認(rèn)識、推斷和解釋生命過程中的各種現(xiàn)象也越來越廣泛。運用統(tǒng)計學(xué)方法可以幫助人們分析占有信息,達到去偽存真,去粗取精,正確認(rèn)識世界的目的。

3.研究對象:人體及與人體健康有關(guān)的各種具有不確定性的醫(yī)學(xué)數(shù)據(jù)(變異、數(shù)量、同質(zhì))。

醫(yī)學(xué)統(tǒng)計學(xué)

二、《醫(yī)學(xué)統(tǒng)計學(xué)》的主要任務(wù)和作用:

任務(wù):1、結(jié)合專業(yè)知識和具體研究的要求進行統(tǒng)計設(shè)計2、對收集資料進行整理、做統(tǒng)計描述3、對資料進行統(tǒng)計分析和解釋

作用:1、保證調(diào)查或試驗設(shè)計的科學(xué)性、完整性

2、指標(biāo)的確定應(yīng)具有特異性、客觀性,靈敏性和縝密度高3、樣本含量足夠大,數(shù)據(jù)真實可靠4、選用統(tǒng)計分析方法正確

三、醫(yī)學(xué)統(tǒng)計學(xué)的主要內(nèi)容:

1、統(tǒng)計設(shè)計(design)在進行統(tǒng)計工作和研究之前必需有一個周密的設(shè)計,設(shè)計的內(nèi)容包括資料收集、整理和分析全過程總的設(shè)想和安排。

統(tǒng)計設(shè)計可依照在研究過程中對研究對象是否進行干預(yù)分作調(diào)查研究設(shè)計和試驗研究設(shè)計。

調(diào)查研究設(shè)計:研究者旨在客觀地描述研究總體,未加任何干預(yù)措施,如:調(diào)查了解某地的學(xué)齡兒童缺鐵性貧血的患病率,某地新生兒畸形的發(fā)生率,北京地區(qū)潰瘍病患病率等,其目的在于了解某一醫(yī)學(xué)現(xiàn)象的實際狀況,疾病的危害程度,以便為防治和研究這些疾病提供依據(jù)。調(diào)查設(shè)計主要有抽樣方法、調(diào)查技術(shù)、質(zhì)量控制技術(shù)等。

試驗研究設(shè)計:研究者根據(jù)目的(研究假設(shè)),主動加以干預(yù)措施,并觀測總結(jié)其結(jié)果,回復(fù)研究假設(shè)所提出的問題。

醫(yī)學(xué)統(tǒng)計學(xué)

如:研究脂健乳是否有降脂作用,首先假設(shè)脂健乳可以降低血脂,再將條件相像的20只大鼠先用高脂飼料喂養(yǎng)做成高脂血癥的模型,然后將動物隨機分為試驗組和對照組,試驗組服用脂健乳和豆奶,對照組單純服用豆奶,喂養(yǎng)一個月后觀測比較兩組之間各項血脂指標(biāo)的區(qū)別有無統(tǒng)計學(xué)意義,進而得出脂健乳是否具有降低血脂的保健作用的結(jié)論。

試驗設(shè)計主要有各種試驗設(shè)計模型、分組方法、樣本量估計等。由于統(tǒng)計設(shè)計的質(zhì)量直接影響著試驗結(jié)果的確鑿性、可靠性、嚴(yán)密性和代表性,一旦出現(xiàn)設(shè)計上的失誤或缺陷,可能導(dǎo)致整個研究的失敗。因此,專業(yè)設(shè)計是研究者對專業(yè)知識的把握能力,直接影響著試驗的深度和水平,而統(tǒng)計設(shè)計是研究者對醫(yī)學(xué)統(tǒng)計知識的正確運用,以保證統(tǒng)計描述和推斷正確的基礎(chǔ)。

調(diào)查設(shè)計與試驗研究設(shè)計

專業(yè)設(shè)計

運用專業(yè)知識進行設(shè)計

要求內(nèi)容方向目的

統(tǒng)計設(shè)計運用統(tǒng)計學(xué)知識進行設(shè)計

選題、調(diào)查(試驗)、方法、材料確定設(shè)計方案、收集整理資料、確定

統(tǒng)計指標(biāo)、分析和推斷方法探討試驗、觀測結(jié)果的適用性和創(chuàng)探討試驗、觀測結(jié)果的可重復(fù)性、高造性效性回復(fù)和解決科研課題,驗證假說,減少和控制誤差。保證樣本的代表性保證科研結(jié)果的先進性和可靠性,保證明驗結(jié)果的確切性和

可重復(fù)性

2、收集資料(collectionofdata)方式:1、統(tǒng)計報表2、經(jīng)常性工作記錄3、專題調(diào)查或試驗

醫(yī)學(xué)統(tǒng)計學(xué)

3、整理資料(sortingdata)將原始數(shù)據(jù)進行核對、整理,使其系統(tǒng)化、條理化,對數(shù)據(jù)進行規(guī)律檢查,改正錯誤,提供整理和描述數(shù)據(jù)資料的科學(xué)方法,確定數(shù)據(jù)的數(shù)量特征。

4、分析資料(analysisofdata)根據(jù)不同的資料類型,選擇不同的統(tǒng)計處理方法,計算有關(guān)指標(biāo),反映數(shù)據(jù)的綜合特征,說明事物的內(nèi)在聯(lián)系和規(guī)律。統(tǒng)計分析包括:

①統(tǒng)計描述(descriptivestatistics):用統(tǒng)計指標(biāo)、統(tǒng)計表、統(tǒng)計圖等方法,對資料的數(shù)量特征及分布規(guī)律進行測定和描述。

②統(tǒng)計推斷(inferentialstatistics):包括如何抽樣,以及如何在隨機變量的樣本值基礎(chǔ)上推斷概率分布和總體值。統(tǒng)計推斷中涉及的各種統(tǒng)計分析方法是本次授課的重點內(nèi)容。

四、醫(yī)學(xué)統(tǒng)計學(xué)在科研中的作用:

1、系統(tǒng)積累和表達經(jīng)驗

臨床經(jīng)驗的積累在于大量的臨床實踐。實際上這些經(jīng)驗都可以整理和表達為統(tǒng)計信息,把握了一定的統(tǒng)計學(xué)知識,就可以將積累的經(jīng)驗,通過對資料的收集、整理和分析,轉(zhuǎn)變?yōu)檎?guī)和系統(tǒng)的統(tǒng)計信息,用以報告或發(fā)表,使人類醫(yī)學(xué)知識寶庫不斷充實和發(fā)展。

醫(yī)學(xué)統(tǒng)計學(xué)

2、完成科研工作

生物學(xué)是一門試驗科學(xué),不管你從事的是生物學(xué)的哪一個分支,都不可能完全脫離試驗,只進行規(guī)律推理.而試驗所得到的結(jié)果幾乎無例外地都帶有或多或少的不確定性,即試驗誤差.在這種狀況下,不用統(tǒng)計學(xué)要想得到正確的結(jié)論是不可能的,可以毫不夸誕地說,作為一個試驗科學(xué)工,離開了統(tǒng)計學(xué)就寸步難行,希望通過這門課程的學(xué)習(xí),能夠把握常用的統(tǒng)計方法,特別是它們的條件,適用范圍、優(yōu)缺點等,從而能夠應(yīng)用它們?nèi)ソ鉀Q實踐中遇到的問題。否則,他將無法知道其研究結(jié)果是否具有科學(xué)意義上的可重復(fù)性。要一一回復(fù)這些問題,要求研究者必需在整個研究過程中貫穿和運用統(tǒng)計學(xué)的理論和方法。

3、撰寫研究報告和閱讀書刊

醫(yī)學(xué)研究中往往要涉及大量的數(shù)據(jù),但在撰寫研究報告和論文時,只能使用經(jīng)過整理和歸納的統(tǒng)計指標(biāo),并且用規(guī)范的統(tǒng)計表和統(tǒng)計圖表達。此外,在閱讀國外期刊時,假使不具備統(tǒng)計學(xué)的基礎(chǔ)知識,則不能判斷別人研究結(jié)果的可信性和局限性,更談不上吸收和借鑒。

五、《醫(yī)學(xué)統(tǒng)計學(xué)》中幾個重要的基本概念:

(1)總體(population)、樣本(sample)、個體(observedunit)

a.總體:根據(jù)研究目的所確定的性質(zhì)一致的所有個體的某種

變量值的集合。如:調(diào)查某地1999年正常成年男子的紅細(xì)胞數(shù),則

觀測對象:該地1999年正常成年男子。

觀測單位:統(tǒng)計研究中的最基本單位,如:一個人、一個家庭、

醫(yī)學(xué)統(tǒng)計學(xué)

一個地區(qū)等。

觀測值(變量值):每個人測得的紅細(xì)胞數(shù)。

該地1999年正常成年男子的紅細(xì)胞數(shù)就構(gòu)成一個總體。同質(zhì)基礎(chǔ):同一地區(qū)、同一年份、同為正常成人、同為男性有限總體(finitepopulation):有確定的時間、空間和有限個觀測單位,如上例。

無限總體(infinitepopulation):沒有確定的時間和空間限制,觀測單位數(shù)為無限。如研究用某藥治療缺鐵性貧血的療效,此時,總體的同質(zhì)基礎(chǔ)是貧血患者,同時用某藥治療,該總體應(yīng)包括用該藥治療的所有貧血患者的治療結(jié)果。

b.樣本:從總體中隨機抽取部分個體所組成的集合。

(隨機化原則:總體中每一個觀測單位均有同等機遇被抽?。?/p>

(2)參數(shù)(parameter)、統(tǒng)計量(statistics)

統(tǒng)計學(xué)中把總體的指標(biāo)稱為參數(shù),把所得樣本的平均數(shù)稱為統(tǒng)計量。

(3)誤差(error):

抽樣誤差(samplingerror)由于總體中的個體間往往存在著變異,隨機抽取的樣本僅是總體中的一部分個體,因而樣本測得的指標(biāo)(統(tǒng)計量)往往與總體指標(biāo)(參數(shù))存在著差異,這種由于隨機抽樣而造成的樣本的統(tǒng)計量與總體參數(shù)之間的差異,稱為抽樣誤差,它既不定量,也不定性。

系統(tǒng)誤差:由于設(shè)計不嚴(yán),測量儀器不確鑿,測量者水平的偏差而造成的,這種誤差是定量的,可控的。

醫(yī)學(xué)統(tǒng)計學(xué)

(4)統(tǒng)計資料

對每個觀測單位的某項特征進行測量和觀測,其特征稱為變量,對變量的測值稱為變量值,亦稱為資料。

計量資料(quantitativedata)

統(tǒng)計資料類型計數(shù)資料(qualitativedata)

等級資料(rankeddat)

①、定量資料(quantitativedata)又稱為計量資料:

用專業(yè)儀器測量,具有計量單位的測量數(shù)據(jù),表現(xiàn)為數(shù)值的大小,如身高(cm)、體重(kg)、血壓(kPa)等。特點:每個觀測單位的觀測值間有量的區(qū)別

②、定性資料(qualitativedata):其觀測值是定性的,表現(xiàn)為互不相容的類別或?qū)傩裕磳⒂^測單位按某種屬性或類別分組,所得各組的觀測單位數(shù))。

特點:每個觀測單位的觀測值間有質(zhì)的區(qū)別分兩種狀況:

1、無序分類(unorderedcategories)又稱為計數(shù)資料

a.二項分類檢驗結(jié)果可以是陽性或陰性、治療結(jié)果可以是治愈或未愈、性別屬性等,表現(xiàn)為兩類間相互對立。

b.多項分類某種觀測結(jié)果為互不相容的多個類別,如血型、職業(yè)等。

2、有序分類(ordinalcategories)又稱為等級資料

介于定量測量和定性觀測之間的半定量觀測結(jié)果,如測定某人

醫(yī)學(xué)統(tǒng)計學(xué)

群血清反應(yīng),以人為觀測單位,結(jié)果分為—、±、+、++四級,又如觀測以某種藥治療某病患者的治療結(jié)果,以每個患者為觀測單位,結(jié)果分為治愈、顯效、好轉(zhuǎn)、無效四級,尋常有兩個以上等級。

等級資料與計數(shù)資料的區(qū)別在于,等級資料雖然是多分類資料,但各個類別存在著大小和程度上的區(qū)別。特點:各類之間有程度的區(qū)別

資料的轉(zhuǎn)化和分析:根據(jù)分析問題的需要,各類變量可以相互轉(zhuǎn)化。如:觀測某人群成年男子的血紅蛋白量(g/L),屬數(shù)值變量;

若分析比較某種病人的血紅蛋白水平與正常人有無區(qū)別,須按計量資料進行處理。

序號

123456789

正常人組

病人組

若按血紅蛋白正常與偏低分為兩類,可按二項分類資料處理;

正常偏低合計

正常人組

病人組

若按貧血的診斷標(biāo)準(zhǔn)將血紅蛋白含量分為五個等級:重度貧血、中度貧血、輕度貧血、正常、血紅蛋白增高,可按等級資料處理。

醫(yī)學(xué)統(tǒng)計學(xué)

重度貧血中度貧血輕度貧血正常血紅蛋白增高

合計正常人組

病人組

(5)頻率(frequency)、概率(probability)

醫(yī)學(xué)研究的大多數(shù)現(xiàn)象是隨機現(xiàn)象,例如用同一種治療方法治療某病的一群患者,可以知道治療的結(jié)果有四種,但對于一個病人其治療后的結(jié)果是不確定的,此時的每一種可能發(fā)生的結(jié)果都是一個隨機事件(偶然事件、事件)。

定義:在n次隨機試驗中,隨機事件A發(fā)生了k次,記fn?k??,則稱fn?k?為隨機事件A在n次試驗中出現(xiàn)的頻率。

實踐證明,大量的試驗中隨機事件會浮現(xiàn)出頻率穩(wěn)定性。定義:描述隨機事件A發(fā)生可能性大小的數(shù)值,稱為A的概率,記作P(A),簡記為P。假使臨床觀測中治療200病人的樣本,求得治愈率為75%,這只是一個頻率。實際應(yīng)用中,當(dāng)概率不易求得時,常用n→∞時的頻率作為概率的估計值。但當(dāng)n較少時,頻率的波動性是很大的,用于估計概率是不可靠的。

隨機事件概率的大小在0與1之間。

P值越接近1,表示某事件發(fā)生的可能性越大;P值越接近0,表示某事件發(fā)生的可能性越小。

嚴(yán)格說,P=1表示事件必然發(fā)生,P=0表示事件不可能發(fā)生,他

kn

醫(yī)學(xué)統(tǒng)計學(xué)

們是確定性的,不是隨機事件,但可把他們看成隨機事件的特例。

統(tǒng)計分析中的好多結(jié)論都是帶有概率性的。習(xí)慣上將P≤0.05稱為小概率事件,表示在一次試驗或觀測中該事件發(fā)生的可能性很小,可以視為很可能不發(fā)生?!夺t(yī)學(xué)統(tǒng)計學(xué)》的學(xué)習(xí)重點是:

1、把握其基本知識、基本技能、基本概念、基本方法。建立規(guī)律思維方法和提高分析問題的能力。2、把握調(diào)查設(shè)計和試驗設(shè)計的基本原則。

培養(yǎng)收集、整理、分析統(tǒng)計資料的系統(tǒng)工作能力。3、把握一套統(tǒng)計軟件的使用方法(SAS、SPSS、STATA等)。能夠達到在完成《醫(yī)學(xué)統(tǒng)計學(xué)》課程后,獨立完成科研論

文和正確應(yīng)用統(tǒng)計方法。

醫(yī)學(xué)統(tǒng)計學(xué)

其次講集中趨勢

舉例

設(shè)有A、B兩名新戰(zhàn)士,他們的射擊技術(shù)可用下面的分布來表示:戰(zhàn)士A戰(zhàn)士B擊中環(huán)數(shù)8910擊中環(huán)數(shù)8910對應(yīng)概率0.30.10.6對應(yīng)概率0.20.50.3問哪一個戰(zhàn)士射擊技術(shù)較好?1、頻數(shù)分布表1)、頻數(shù)表的編制

一致觀測結(jié)果出現(xiàn)的次數(shù)稱為頻數(shù)。將所有觀測結(jié)果的頻數(shù)按一定順序排列在一起便是頻數(shù)表(frequencytable)。步驟:

①找出最大和最小值,計算極差R=Xmax―Xmin②根據(jù)斯梯階公式確定組距

H?R1?3.322logn

③掃描樣本值,劃記后獲得頻數(shù)

2)、頻數(shù)表的用途

①大樣本數(shù)據(jù)(不限于計量資料)常用的表達方式。

②便于觀測數(shù)據(jù)的分布類型。

③便于發(fā)現(xiàn)資料中遠(yuǎn)離群體的某些特大或特小的可疑值,必要時經(jīng)檢驗后舍去。

④當(dāng)樣本含量足夠大時,各組段的分布頻率作為分布概率的估計值。

例7.我國某地農(nóng)村1995年已婚育齡婦女現(xiàn)有子女?dāng)?shù)的分布子女?dāng)?shù)(1)0123456789≥10合計

婦女?dāng)?shù)f(2)13751251913042628560217191369572553268151373156145525頻率(%)(3)9.4517.3020.9119.6214.929.414.982.250.100.260.11100.00累計頻數(shù)(4)13751389226934897908119627133322140577143845144996145369145525——累計頻率(%)(5)9.4526.7547.6567.2882.2091.6196.6098.8599.6499.89100.00——醫(yī)學(xué)統(tǒng)計學(xué)

2、集中位置的描述

平均數(shù)(average)是統(tǒng)計中最廣泛、最重要的一個指標(biāo)體系。用來描述一組變量的集中趨勢、中心位置或平均水平,常作為一組資料的代表值,使資料產(chǎn)生簡明概括的印象,又便于組間的比較。常用平均數(shù)有均數(shù)、幾何均數(shù)和中位數(shù)。(一)、均數(shù)(mean)的計算

x?x2?x3...?xnx?1?n①直接法

?xin

例1、10名7歲男童體重(kg)分別為17.3,18.0,19.4,20.6,21.2,21.8,22.5,23.2,

24.0,25.5.求平均體重。

x=(17.3+18.0+19.4+20.6+21.2+21.8+22.5+23.2+24.0+25.5)/10=21.35(kg)

②頻數(shù)表法:

x?f1x1?f2X2?f3x3??fkxk???fxf?f

例2:某地隨機檢查了140名成年男性紅細(xì)胞數(shù)(1012/L)

4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.714.444.945.054.784.524.635.515.244.984.334.834.565.444.794.914.264.384.874.995.604.464.955.074.805.304.654.774.505.375.495.224.585.074.814.543.824.014.894.625.124.854.595.084.824.935.054.404.145.014.375.244.604.714.824.945.054.794.524.644.374.874.604.724.835.334.684.804.154.654.764.884.613.974.084.584.314.054.165.045.154.504.624.734.474.584.704.814.554.284.784.514.634.364.484.595.095.205.325.054.414.524.644.754.494.224.715.214.944.685.174.915.024.76

醫(yī)學(xué)統(tǒng)計學(xué)

紅細(xì)胞數(shù)(1012/L)(1)3.80~4.00~4.20~4.40~4.60~4.80~5.00~5.20~5.40~5.60~5.80~

合計頻數(shù)f(2)

261125322717134

21

140(∑f)

組中值X(3)

3.904.104.304.504.704.905.105.305.505.705.90

Fx(4)=(2)*(3)7.8

24.647.3112.5150.4132.386.768.922.011.45.9

669.8(∑fX)

fx?f2X2?f3x3??fkxkx?11?f?

=4.78(1012/L)

均數(shù)的兩個重要特征:

①各離均差的總和等于零

?fx?f

?(x-x)?0

證明:

?(xi?x)??xi?nx??xi??xi?0

??②各離均差的平方和小于各觀測值X與任何數(shù)a之差的平方

?(x-x)??(x-a)22

均數(shù)的應(yīng)用:

1.用來描述一組變量值的平均水平,具有代表性,因此變量值必需是同質(zhì)的。2.適用于呈正態(tài)分布(對稱分布)的資料。

醫(yī)學(xué)統(tǒng)計學(xué)

(2)幾何均數(shù)(geometricmean)的計算1)直接法

G?nx1?x2?x3???xnlgxlgx1?lgx2????lgxn)?lg?1(?)nn

例3:5人的血清滴度為:1:2,1:4,1:8,1:16,1:32,求平均滴度。

G?lg?1(G?n2?4?8?16?32

LgG=(lg2+lg4+lg8+lg16+lg32)/5=0.903

G=lg-10.903=8故平均滴度為1:8。

2)頻數(shù)表法

G?lg?1(?

例4:40名麻疹疫苗接種麻疹疫苗后一個月,血凝抑制抗體滴度見下表,求平均滴度。抗體滴度人數(shù)f滴度倒數(shù)XLgXf*lgX(1)(2)(3)(4)(5)=(2)*(4)1:4140.60210.60211:8580.90314.51551:166161.20417.22461:322321.50513.01021:647641.806212.64341:128101282.107221.07201:25642562.40829.63281:51255122.709313.54654072.2471LgG=(?flgX/?f)=72.2471/40=1.8062G=lg-11.8062=64血凝抑制抗體滴度的平均滴度為1:64

幾何均數(shù)的應(yīng)用:用于等比級數(shù)資料和對數(shù)正態(tài)分布資料,

如:某些傳染病的潛伏期、抗體滴度、細(xì)菌計數(shù)等。

flgx)?f

醫(yī)學(xué)統(tǒng)計學(xué)

(3)、中位數(shù)和百分位數(shù)的計算

中位數(shù)(median,M)是將一組觀測值從小到大按順序排列,位次居中的數(shù)值對應(yīng)的觀測值就是中位數(shù)。因而全部觀測值中,大于和小于中位數(shù)的觀測值的個數(shù)相等。

1)直接法:將原始觀測值按大小順序排列:

M?Xn為奇數(shù)時,

(n?1)2

??X?X?(n)?n(?1)22?n為偶數(shù)時,M??2例5.測得5個人的低密度脂蛋白中載體B蛋白的含量(mg/dl)分別為0.84,2.58,5.46,8.58,9.60,求其中位數(shù).

M?X

=X3=5.46mg/dl

例6.8名新生兒的身長(cm)依此為50,51,52,53,54,54,55,58,求其中位數(shù)。

??X?X?(n)?n(?1)22??53?54?53.5M??22(n?1)22)頻數(shù)表法

Px?L?i(n?x%??fL)fx

醫(yī)學(xué)統(tǒng)計學(xué)

例7.對某地630名50歲~60歲的正常女性檢查了血清甘油三脂含量,并制成如

下頻數(shù)表,試求中位數(shù)及第25、75、90百分位數(shù)。

甘油三脂mg/dl頻數(shù),f累計頻數(shù)累計頻率(%)

(1)(2)(3)(4)10~27274.340~16919631.170~16736357.6100~9445772.5130~8153885.4160~4258092.1190~2860896.5220~1462298.7250~462699.4280~362999.8310~1630100.0合計630

630?0.5?196m?70??30?91.4(mg/dl)

167

630?0.25?27p25?40??30?63.2(mg/dl)

169

630?0.75?457p75?130??30?135.7(mg/dl)

81

630?0.90?538p90?160??30?180.7(mg/dl)

42

醫(yī)學(xué)統(tǒng)計學(xué)

例8.某日大氣中SO2的日平均濃度(ug/m3)見下表,分別求第25、75、95

百分位數(shù)及中位數(shù)。濃度(ug/m3)天數(shù),f累計頻數(shù)累計頻率(%)(1)(2)(3)(4)5~393910.850~6710629.475~6417047.1100~6323364.5125~4527877.0150~3030885.3175~1732590.0200~933492.5225~734194.5634796.1275~535297.5300~335598.3325~6361100.0361Px?l?i(n?x%??fl)fx

25(361?25%?39)?69.12(?g/m3)6725P75?125?(361?75%?233)?145.97(?g/m3)4525P95?250?(361?95%?341)?258.12(?g/m3)625P50?100?(361/2?170)?104.17(?g/m3)63

中位數(shù)和百分位數(shù)的應(yīng)用:

1.用于描述偏態(tài)分布資料的集中位置。反映位次居中的觀測值的水平。2.百分位數(shù)是用于描述樣本或總體觀測值序列在某百分位置水平,最常用的百分位數(shù)是中位數(shù)。

3.百分位數(shù)常用來確定醫(yī)學(xué)參考值范圍。

P25?50?醫(yī)學(xué)統(tǒng)計學(xué)第三講離散趨勢離散程度的描述

三組同性別、同年齡兒童的體重(kg)如下,分析其集中趨勢與離散趨勢。甲組2628303234X甲=30kgR=8S=3.16已組2427303336X乙=30kgR=12S=4.74丙組2629303134X丙=30kgR=8S=2.91哪一組數(shù)值的代表性好?(1)極差(range)

一組觀測值中,最大值與最小值差,反映個體差異的范圍。極差大,說明變異度大,各變量值離均數(shù)越遠(yuǎn),數(shù)據(jù)越分散;反之亦然。(2)四分位數(shù)(quartile)間距

可看成是特定的百分位數(shù),用它說明個體差異比極差穩(wěn)定。

Q=P75–P25

一般來說,樣本例數(shù)越多,四分位間距越穩(wěn)定。(3)方差(variance)與標(biāo)準(zhǔn)差的計算方差:σ2=?(x??)2/N

2(x?x)?s2?

n?1

由上式可知:方差考慮了總體中每個變量值X與總體均數(shù)之差(x??),稱為離均差平方和(SS),因此方差近似等于離均差平方和的算數(shù)均數(shù),故又稱為均方差(MS),由于SS利用了每一個觀測值的信息,因而反映一批數(shù)據(jù)的變異程度優(yōu)于極差和四分位間距。

(4)標(biāo)準(zhǔn)差(standarddeviation)

方差開方后稱為標(biāo)準(zhǔn)差,其單位與變量值單位及均數(shù)單位一致,變異度越大,則離均差平方和越大,標(biāo)準(zhǔn)差越大,說明個體差異越大,均數(shù)的代表性越差。為了簡化計算,標(biāo)準(zhǔn)差的計算公式還可寫為:

(?x)2?x?nS?n?1

2醫(yī)學(xué)統(tǒng)計學(xué)

分組資料的計算:

S??fx2?(?fx)2n

n?1如上例:n=110∑fx2=1584990∑fx=13194

S??fx2?(?fx)2n?

1584990?131942/110?4.72cm110?1n?1

(5)變異系數(shù)(cofficientofvariation,CV)定義:標(biāo)準(zhǔn)差與算術(shù)均數(shù)之比,cv?sx??100%

其描述了相對于算術(shù)均數(shù)而言標(biāo)準(zhǔn)差的大小,即描述數(shù)據(jù)的變異相對于其平均水平來說是大還是小。

與前面介紹的四種離散程度指標(biāo)相比,變異系數(shù)有以下兩個不同之處:1:它描述的不是數(shù)據(jù)分布的絕對離散程度,而是相對離散程度;2:它不象極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差那樣具有取值單位。這兩個特點決定了變異系數(shù)的應(yīng)用也不同于前面四個離散程度指標(biāo)。它常用于:

1、比較度量衡單位不同的多組資料的變異度:

例如:某地20歲男子100人,其身高均數(shù)為166.06cm,標(biāo)準(zhǔn)差為4.95cm;其體重均數(shù)為53.72kg,標(biāo)準(zhǔn)差為4.96kg.欲比較身高與體重的變異何者為大,由于度量單位不同,不能比較其標(biāo)準(zhǔn)差而應(yīng)比較其變異系數(shù)身高cv?體重cv?4.95cm?100%?2.98%

166.06cm4.96kg?100%?9.23%

53.72kg由此可見,該地20歲男子體重的變異大于身高的變異。

醫(yī)學(xué)統(tǒng)計學(xué)

2.比較均數(shù)相差懸殊的多組資料的變異度:某地不同年齡組男子身高的變異程度

年齡組3-3.5歲30-35歲

表中可見,雖然30~35歲組的標(biāo)準(zhǔn)差明顯大于3~3.5歲組的標(biāo)準(zhǔn)差,但事實上30~35歲組男子身高的變異并不大,而3~3.5歲組男童身高的變異卻很大。這種均數(shù)相差懸殊的資料比較變異程度時,應(yīng)當(dāng)用變異系數(shù)說明其變異狀況。

小結(jié)

為了解數(shù)值變量的分布規(guī)律,可將觀測值編制頻數(shù)表,繪制頻數(shù)分布圖,用于描述資料的分布特征(集中趨勢和離散趨勢),以及分布類型(對稱分布和偏態(tài)分布)。一.

平均數(shù)是描述頻數(shù)分布集中位置的指標(biāo),它代表一組觀測值的平均水平,

人數(shù)100100

均數(shù)±標(biāo)準(zhǔn)差變異系數(shù)(%)90.1±3.1170.2±5.0

3.20.3

常用平均數(shù)的指標(biāo)下表:平均數(shù)均數(shù)幾何均數(shù)中位數(shù)意義平均數(shù)量水平平均增(減)倍數(shù)位次居中的觀測值水平應(yīng)用場合應(yīng)用甚廣,最適用于對稱分布,特別是正態(tài)分布等比級數(shù)資料,對數(shù)正態(tài)分布偏態(tài)分布,分布不明,分布末端無確定值百分位數(shù)描述觀測序列在某百分位置的水平,是分布的百分界值,可用于醫(yī)學(xué)參考值范圍,適用于任何分布。

二、描述頻數(shù)分布離散程度的指標(biāo)有:

1)極差與四分位間距,后者較穩(wěn)定,但均不能綜合反映各觀測值的變異程度;2)方差和標(biāo)準(zhǔn)差,最為常用,對正態(tài)分布尤為重要;

3)變異系數(shù)常用于:不同測量單位的幾組資料變異度的比較;均數(shù)相差懸殊

的幾組資料變異度的比較。

醫(yī)學(xué)統(tǒng)計學(xué)

第四講正態(tài)分布及其應(yīng)用

一、正態(tài)分布的概念和特征

根據(jù)頻數(shù)表資料繪制成直方圖,可以設(shè)想,假使將觀測人數(shù)逐漸增多,線段不斷分細(xì),圖中直條將逐漸變窄,其頂端將逐漸接近一條光滑的曲線,這條曲線稱為頻數(shù)曲線或頻率曲線,略呈鐘型,兩頭低,中間高,左右對稱,近似于數(shù)學(xué)上的正態(tài)分布(normaldistribution)。由于頻率的總和等于100%或1,故橫軸上曲線下的面積等于100%或1。

正態(tài)分布是一種橫重要的連續(xù)型分布,在生物統(tǒng)計學(xué)中,占有極其重要的地位。大量生物學(xué)現(xiàn)象所產(chǎn)生的數(shù)據(jù),都聽從正態(tài)分布。

1、正態(tài)分布的圖形有了正態(tài)分布的密度函數(shù)f(X),即正態(tài)分布的方程,就可給出圖形

f(x)

?

醫(yī)學(xué)統(tǒng)計學(xué)

上式中右側(cè)?為均數(shù),?為標(biāo)準(zhǔn)差,X為自變量。當(dāng)X確定后,就可由此式求得其密度函數(shù)f(X),也就是相應(yīng)的縱坐標(biāo)的高度。所以,已知?和?,就能繪出正態(tài)曲線的圖形。2、正態(tài)分布的特征

(1)正態(tài)分布以?為中心,左右對稱。

(2)正態(tài)分布有兩個參數(shù),即?和?。?是位置參數(shù),當(dāng)?恒定后,

?越大,則曲線沿橫軸越向右移動;?越小,則曲線沿橫軸越向左移動。?是變異參數(shù),當(dāng)?恒定時,?越大,表示數(shù)據(jù)越分散,曲線越“胖〞;?越小,表示數(shù)據(jù)越分散,曲線越“瘦〞。(3)正態(tài)分布的偏斜度?1=0,峭度?2=0

為了應(yīng)用便利,常將上式作如下變換,

u?X???

也就是將原點移到?的位置,使橫軸尺度以?為單位,使?=0,?=1,則正態(tài)分布變換為標(biāo)準(zhǔn)正態(tài)分布。(standardnormaldistribution),u稱為標(biāo)準(zhǔn)正態(tài)離差(standardnormaldeviate)標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)為:

?(u)?1e2??u22

一般用N(?,?2)表示均方為?,方差為?2的正態(tài)分布。于是標(biāo)準(zhǔn)正態(tài)分布用N(0,1)表示。

醫(yī)學(xué)統(tǒng)計學(xué)

標(biāo)準(zhǔn)正態(tài)分布有以下特征:

(1)在u=0時,?(u)達到最大值。

(2)當(dāng)u無論向哪個方向遠(yuǎn)離0時,?(u)的值都減小。(3)曲線關(guān)于Y軸對稱,即?(u)=?(-u)。(4)曲線和橫軸所夾的面積等于1。

二、標(biāo)準(zhǔn)正態(tài)曲線下面積的計算P(u1161cm的概率;(3)X在152~162cm間的概率。(1)依題意:

161?156.2P(X?161)??()??(1)?0.841344.82

所以,“三尺三〞的株高低于161cm的概率為0.84134。

(2)依題意得:

164?156.2P(X?164)??()?1??(1.62)?1?0.94738?0.052624.82

(3)依題意得:

162?156.2152?156.2)P(152?X?162)??()??(??(1.2)??(?0.87)?0.88493?0.19215?0.692784.824.82

醫(yī)學(xué)統(tǒng)計學(xué)

以下一些值很重要,應(yīng)予記憶:

u=-1到u=1面積=0.6827u=-1.96到u=1.96面積=0.9500u=-2.58到u=2.58面積=0.9900三、小結(jié)

1、正態(tài)分布是一種連續(xù)性的分布,不少醫(yī)學(xué)現(xiàn)象聽從正態(tài)分布或近似正態(tài)分布(宛如性別、同年齡兒童的身高,同性別健康成人的紅細(xì)胞數(shù)、血紅蛋白量、脈搏數(shù)等,以及試驗中的隨機誤差等);或經(jīng)變量變換轉(zhuǎn)換為正態(tài)分布(如某些病人的潛伏期以及醫(yī)院病人住院天數(shù)等),可按正態(tài)分布規(guī)律來處理,它也是大量統(tǒng)計方法的理論基礎(chǔ)。

2、正態(tài)分布的特征是:

(1)曲線在橫軸上方,均數(shù)處最高;(2)以均數(shù)為中心,左右對稱;

(3)確定正態(tài)分布的兩個參數(shù)是均數(shù)?和標(biāo)準(zhǔn)差?。

正態(tài)分布用N(?,?2)表示,為了應(yīng)用的便利,常對變量x作u=(x-?)/?使?=0,?=1,則正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布用N(0,1)表示。

3、運用正態(tài)曲線下面積的分布規(guī)律,可計算醫(yī)學(xué)參考值范圍和質(zhì)量控制等。

醫(yī)學(xué)統(tǒng)計學(xué)

第四講:總體均數(shù)的估計和假設(shè)檢驗醫(yī)學(xué)統(tǒng)計學(xué)的最基本問題是研究總體與樣本的關(guān)系。總體與樣本的關(guān)系,可從兩方面研究:

(1)由已知的總體,研究樣本的分布規(guī)律,即由總體到樣本的

研究過程;

(2)由樣本如何去推斷未知的總體,屬于從樣本到總體的研究

過程。

1、從一個正態(tài)總體中抽取的樣本統(tǒng)計量分布

生物學(xué)中遇到最多的是正態(tài)總體。對于正態(tài)總體,可以用數(shù)學(xué)推演的方法,得出嚴(yán)格的樣本統(tǒng)計量的抽樣分布,有了嚴(yán)格的樣本分布規(guī)律,就可以由樣本來推斷總體了。標(biāo)準(zhǔn)差已知時的樣本平均數(shù)的分布——u分布

平均數(shù)為?,標(biāo)準(zhǔn)差為?的正態(tài)總體中,獨立隨機的抽取含量為n的樣本,則:

?x???x??n

樣本平均數(shù)是一聽從正態(tài)分布的隨機變量,記為X。將平均數(shù)標(biāo)準(zhǔn)化,則:

u?x???n

其中的分母稱為平均數(shù)的標(biāo)準(zhǔn)誤差(standarderrorofmean)。假使變量是正態(tài)的或近似正態(tài)的,則標(biāo)準(zhǔn)化的變量聽從或近似地聽從N(0,1)分布。

醫(yī)學(xué)統(tǒng)計學(xué)

1、標(biāo)準(zhǔn)差已知時的樣本平均數(shù)的分布——t分布(t-distribution)若上式中的?是未知的,可用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)化變量并不聽從正態(tài)分布,而聽從具有n-1自由度的t分布。

t?x??Sn

t分布也是一種對稱分布,它只有一個參數(shù),即自由度(degreeoffreedom)t分布與標(biāo)準(zhǔn)正態(tài)分布相比有以下特征:(1)二者都是單峰分布,以0為中心,左右兩側(cè)對稱。

(2)t分布的峰部較矮而尾部翹得較高,說明遠(yuǎn)側(cè)t值的個數(shù)相對較多,即尾部面積(概率P)較大。

自由度越小這種狀況越明顯。?逐漸增大時,t分布逐漸迫近標(biāo)準(zhǔn)正態(tài)分布;當(dāng)?=?時,t分布就完全成為標(biāo)準(zhǔn)正態(tài)分布了。2、統(tǒng)計推斷

統(tǒng)計推斷是探討如何通過樣本去推斷總體。由樣本推斷總體是以各種樣本統(tǒng)計量的抽樣分布為基礎(chǔ)的。對總體做統(tǒng)計推斷(statisticalinference),可以通過兩條途徑進行。

一是通過樣本統(tǒng)計量估計總體參數(shù);二是首先對所估計的總體提出一個假設(shè),例如假設(shè)這個總體的平均數(shù)?等于某個值?0,然后,通過樣本數(shù)據(jù)去推斷這個假設(shè)是否可以接受,假使可以接受,樣本很可能抽自這個總體;否則很可能不是抽自這個總體。前一種途徑稱為總體參數(shù)估計(estimationofpopulationparameter),后一種途徑稱為統(tǒng)計假設(shè)檢驗(statisticaltestofhypothesis)。這兩種不同的統(tǒng)計分析方法

醫(yī)學(xué)統(tǒng)計學(xué)

在實際工作中可相互參照使用。

1、總體均數(shù)的估計——區(qū)間估計(internalestimation)即按一定的概率估計總體均數(shù)在哪個范圍。可根據(jù)資料的條件選用不同的方法。(1)?未知時。一般用t分布的原理作區(qū)間估計。根據(jù)

P(?t?,??t?t?,?)?1??(1-?為可信度)得P(-t?,??x??s/n?t?,?)?1??于是得可信度為1-?時,計算總體均數(shù)可信區(qū)間的通式為:

習(xí)慣上,常取1-?=0.95,即95%可信區(qū)間;或取1-?=0.99,即99%

X?t?,?(可信區(qū)間。

sn)???X?t?,?(sn)例題1、對某人群隨機抽取20人,用某批號的結(jié)核菌素作皮試,平均侵潤直徑為10.9mm,標(biāo)準(zhǔn)差為3.86mm。問這批結(jié)核菌素在該人群中使用時,皮試的平均侵潤直徑的95%可信區(qū)間是多少?本例,n=20,?=n-1=20-1=19,?=0.05(雙側(cè))查附表,得t0.05,19=2.093

(10.9?2.093?3.8620,10.9?2.093?3.8620)?(9.1,12.7)所以,該人群皮試的平均侵潤直徑的95%可信區(qū)間為9.1~12.7mm。

醫(yī)學(xué)統(tǒng)計學(xué)

(2)?已知或樣本例數(shù)n足夠大時,按正態(tài)分布原理作區(qū)間估計。

?已知時(X-u???nsn,X?u??,X?u???nsn)?未知但n大(X-u??)

例題2由某地成年男子中抽得144人的樣本,求得紅細(xì)胞數(shù)的均數(shù)為5.38?1012/L,標(biāo)準(zhǔn)差為0.44?1012/L,試估計該地成年男子紅細(xì)胞均數(shù)的95%可信區(qū)間。

本例n?144,x?5.38,s?0.44,??0.05,由于n較大可取u0.05?1.96(5.38-1.96?0.44144,5.38?1.96?0.44144)?(5.31,5.45)該地成年男子紅細(xì)胞均數(shù)的95%可信區(qū)間為(5.31,5.45)。

可信區(qū)間的涵義意思是從總體中作隨機抽樣,每個樣本可以算出一個可信區(qū)間,如95%可信區(qū)間,意味著100次抽樣,算得100個可信區(qū)間,平均有95個可信區(qū)間包括總體均數(shù)(估計正確),只有5個可信區(qū)間不包括總體均數(shù)(估計錯誤)。5%是小概率事件,實際發(fā)生的可能性小,因此,在實際應(yīng)用中就認(rèn)為總體均數(shù)在算得的可信區(qū)間內(nèi),這種估計方法會冒5%犯錯的風(fēng)險。

可信區(qū)間的兩個要素一是確鑿度,反映在可信度1-?的大小,即區(qū)間包含總體均數(shù)的概率的大小,當(dāng)然愈接近1愈好;二是精度,反映在區(qū)間的長度,當(dāng)然長度愈小愈好。在樣本例數(shù)確定的狀況下,二者是矛盾的。一般狀況下,在可信度確定的狀況下,增加樣本例數(shù),

醫(yī)學(xué)統(tǒng)計學(xué)

可減少區(qū)間長度,提高精度。

醫(yī)學(xué)統(tǒng)計學(xué)

假設(shè)檢驗的基本步驟:

1.建立檢驗假設(shè),確定檢驗水準(zhǔn)α

H0:無效假設(shè)(假定所檢驗的兩個總體均數(shù)相等)H1:備擇假設(shè)(假定所檢驗的兩個總體均數(shù)不相等)單側(cè)檢驗:推斷兩總體均數(shù)有無區(qū)別

雙側(cè)檢驗:根據(jù)專業(yè)知識推斷兩總體均數(shù)中是否可以認(rèn)為一個大于(高于)另一個

2.選擇檢驗方法,計算統(tǒng)計量

根據(jù)分析目的、設(shè)計類型和資料類型,選擇恰當(dāng)?shù)臋z驗方法,計算相應(yīng)的統(tǒng)計量(如:t、u、r、f、χ2等)。3.確定P值,作出統(tǒng)計結(jié)論

用計算出的統(tǒng)計量,根據(jù)不同自由度查相應(yīng)的界值表,確定P值。P值的定義:在H0所規(guī)定的總體中隨機抽樣,獲得等于及大于(或等于及小于)現(xiàn)有樣本統(tǒng)計量的概率。結(jié)論:

①當(dāng)計算的統(tǒng)計量≥界值表上所查到的理論值,則P≤α。此時,表示在H0成立的條件下,出現(xiàn)等于及大于現(xiàn)有樣本統(tǒng)計量的概率是小概率,按其原理,現(xiàn)有信息不支持H0,因而拒絕H0。

②當(dāng)計算的統(tǒng)計量〈界值表上所查到的理論值,則P〉α。此時,表示在H0成立的條件下,出現(xiàn)等于及大于現(xiàn)有樣本統(tǒng)計量的概率不是小概率,現(xiàn)有信息還不足以拒絕H0,因此不拒絕H0。

醫(yī)學(xué)統(tǒng)計學(xué)

第五講均數(shù)差異的假設(shè)檢驗

假設(shè)檢驗的具體方法,尋常是以選定的檢驗統(tǒng)計量來命名的,

如t檢驗要用特定的公式計算檢驗統(tǒng)計量t值,u檢驗要用特定的公式計算檢驗統(tǒng)計量u值。應(yīng)用時首先要了解各種檢驗方法的用途、應(yīng)用條件和檢驗統(tǒng)計量的計算方法。

一、單組完全隨機化設(shè)計資料均數(shù)的t檢驗和u檢驗

從一個總體中完全隨機地抽取一部分個體進行研究,這樣的設(shè)計稱為單組完全隨機化設(shè)計(completelyrandomizeddesignofsinglegroup)。

例題1:根據(jù)大量調(diào)查,已知健康成年男子脈搏均數(shù)為72次/分,某醫(yī)生在某一山區(qū)隨機抽查了25名健康成年男子,求得其脈搏均數(shù)為74.2次/分,標(biāo)準(zhǔn)差為6.0次/分,能否據(jù)此認(rèn)為該山區(qū)成年男子脈搏均數(shù)高于一般成年男子脈搏均數(shù)?

這兩個均數(shù)不等有兩個可能:(1)由于抽樣誤差所致(2)由于環(huán)境條件的影響

如何作出判斷呢?在統(tǒng)計上是通過假設(shè)檢驗來回復(fù)這個問題。以下介紹建立假設(shè)檢驗(t檢驗)的思想、方法與步驟。

1、

建立檢驗假設(shè)和確定檢驗水準(zhǔn)H0:?1=?0(=72次/分)H1:?1??0(=72次/分)

醫(yī)學(xué)統(tǒng)計學(xué)

?=0.05

本例分析目的是比較山區(qū)成年男子脈搏樣本均數(shù)與一般成年男子脈搏總體均數(shù)有無區(qū)別?

?是未知的,可以假設(shè)?等于某一定值?0,?與?0的差等于零,

這樣的假設(shè)稱為無差異假設(shè)或零假設(shè)(nullhypothesis)記為H0:?1=?0

表示該山區(qū)的環(huán)境條件對脈搏數(shù)無影響,他們之間的差異是由于抽樣誤差所致。與零假設(shè)相對立的假設(shè)稱為對立假設(shè)或備擇假設(shè)(alternativehypothesis),符號為H1:?1??0,它是在拒絕H0的狀況下而接受的假設(shè)。假設(shè)檢驗所用的檢驗統(tǒng)計量一般都是建立在零假設(shè)的基礎(chǔ)上,由于H0比較單純明確,而H1卻包含著各種狀況。

檢驗水準(zhǔn)(sizeoftest)亦稱顯著性水準(zhǔn)(significancelevel),符號為?,在實際工作中常取0.05或0.01。2、選定檢驗方法和計算統(tǒng)計量

本例:n=25x?74.2次/分S=6.0次/分檢驗統(tǒng)計量公式為:

?

x??0t?,??n-1sx

74.2?72.0?1.833,??25-1?246.0/25

將以上數(shù)據(jù)代入公式,得:

t?要根據(jù)研究類型和統(tǒng)計推斷目的選用不同檢驗方法,不同檢驗方法有相應(yīng)的檢驗統(tǒng)計量,本例的檢驗統(tǒng)計量t聽從?=n-1的t分布。建設(shè)檢驗方法尋常是以檢驗統(tǒng)計量來命名的,故,本例檢驗稱為t檢驗。

醫(yī)學(xué)統(tǒng)計學(xué)

3、確定P值和作出推斷結(jié)論

查t界值表單側(cè),t(24,0.05)=2.064,由于t0.05。得出結(jié)論按?=0.05水準(zhǔn),拒絕H0,接受H1。認(rèn)為該山區(qū)的成年男子脈搏均數(shù)高于一般的成年男子脈搏均數(shù)。

關(guān)于檢驗水準(zhǔn)是取0.05、0.01或其他數(shù)值,要根據(jù)不同的試驗而定。?取值較小,有利于提高“陽性〞統(tǒng)計檢驗結(jié)果的可靠性;?取值較大,有利于發(fā)現(xiàn)研究總體可能存在的差異,但可靠性降低。較好的做法是確切地計算出P值,這會對人們認(rèn)識你所作的試驗有很大的參考價值。

二、隨機化配對設(shè)計資料均數(shù)的t檢驗

配對設(shè)計資料分三種狀況:

(1)配成對子的同對受試對象分別給予兩種不同的處理;(2)同一受試對象分別接受兩種不同處理;(3)同一受試對象處理前后的比較。

(1)與(2)結(jié)果的比較,其目的是推斷兩種處理的效果有無區(qū)別;(3)比較,其目的是推斷某種處理有無作用。

因此,應(yīng)當(dāng)首先計算出各對差值d的均數(shù)。當(dāng)兩種處理結(jié)果無區(qū)別或某種處理不起作用時,理論上差值d的總體均數(shù)?d=0。故可將配對設(shè)計資料的假設(shè)檢驗視為樣本均數(shù)與總體均數(shù)?d=0的比較,配對設(shè)計資料以小樣本居多,故常用t檢驗。其計算公式為:

d??dd,??n-1t?sd?sd/n

醫(yī)學(xué)統(tǒng)計學(xué)

例題2、將大白鼠配成8對,每對分別飼以正常飼料和缺乏維生素E飼料,測得兩組大白鼠肝中維生素A的含量如下表,試比較兩組大白鼠中維生素A的含量有無區(qū)別。

表不同飼料組大白鼠肝中維生素A的含量(U/g)

大白鼠配對號12345678合計

正常飼料組35502000300039503800375034503050維生素E缺乏組24502400180032003250270025001750差數(shù),d

1100-4001200750550105095013006500

d212100001600001440000562500302500110250090250016900007370000

1)H0:?d=0,H1:?d?0,?=0.052)計算統(tǒng)計量

d6500?d???812.5(u/g)n8Sd?Sdn??d2?(?d)2/nn(n?1)?7370000?(6500)2/8?193.1298(u/g)

8?(8?1)t?812.5-0??4.2070??n?1?7193.1298Sd/nd??d3)確定P值下結(jié)論

查t界值表(雙側(cè)),t>t0.05,7=4.029P醫(yī)學(xué)統(tǒng)計學(xué)

三、兩組完全隨機化設(shè)計資料均數(shù)的t檢驗與u檢驗1、t檢驗

將受試對象完全隨機地分派到兩組中,這兩組分別接受不同的處理。這樣的設(shè)計稱為兩組完全隨機化設(shè)計(completelyrandomizeddesignoftwogroups)。

有些研究設(shè)計既不能作自身對比,也不便于配對。如試驗中只有把受試動物殺死后才能獲得所需數(shù)據(jù),則不可能對動物在處理前后各進行一次測定;再如比較兩種治療方法對同一疾病的療效,每個患者一般只能接受一種方法的治療,把受試患者配成若干對在實際工作中又十分困難,這時只能進行兩組間均數(shù)的比較。在兩組比較的資料中,每個觀測對象都應(yīng)依照隨機的原則進行分組,兩組樣本量可以一致,也可以不同,但只有在兩組例數(shù)一致時檢驗效率才最高。統(tǒng)計量計算公式為:

t?

(X1?X2)?(?1??2)Sx?x12?X1?X2Sx?x12

??n1?n2?2

Sx1?x2?Sc2(11?)n1n22222??x21?(?x1)/n1??x?(?X2)/n211(?)n1?n2?2n1n2

2(n1?1)S12?(n2?1)S2S?(n1?1)?(n2?1)2c

醫(yī)學(xué)統(tǒng)計學(xué)

例題3、某醫(yī)院研究乳酸脫氫同工酶(LDH)測定對心肌梗死的診斷價值時,曾用隨機抽樣方法比較了10例心肌梗死患者與10例健康人LDH測定值的區(qū)別,結(jié)果如下,試問LDH測定值在兩組間有無區(qū)別?

心肌梗死患者(X1)23.245.045.040.035.044.142.052.550.058.0健康人(X2)20.031.030.523.124.238.035.537.839.0131.0(1)、H0:?1=?2H1:?1??2?=0.05

2n1?10,?X1?434.80,?X1?19742.30,X1?43.48,S1?9.64n1?10,?X2?310.10,?X?10025.59,X2?31.01,S1?6.7422

(2)、計算統(tǒng)計量:

將上述數(shù)據(jù)代入公式,得:

Sx1?x21974.230?434.82/10?10025.59?310.102/1011?(?)?3.7217(%)10?10?21010

t?43.48?31.013.7217?3.3506,??10?10-2?18(3)、確定P界作出結(jié)論

本例t>t0.05,18=3.197,Pu0.05,P醫(yī)學(xué)統(tǒng)計學(xué)

(1)兩個或多個樣本均數(shù)間的比較;(2)分析兩個或多個因素的交互作用;(3)回歸方程的假設(shè)檢驗;(4)方差齊性檢驗等。

多個樣本均數(shù)間比較的方差分析應(yīng)用條件為:(1)各樣本必需是相互獨立的隨機樣本;(獨立性)(2)各樣本均來自正態(tài)總體;(正態(tài)性)

(3)相互比較的各樣本所來自的總體其方差相等,(方差齊性)

一、完全隨機設(shè)計的方差分析

醫(yī)學(xué)試驗中,根據(jù)某一試驗因素,用隨機的方法將受試對象分派到各組,各組分別接受不同的處理后,觀測各種處理的效果,比較各組均數(shù)之間有無區(qū)別。

臨床研究中,還可能往往比較幾種不同療法治療某種疾病后某指標(biāo)的變化,以評價它們的療效;或比較某種疾病不同類型之間某一指標(biāo)有無區(qū)別等。

這些都是一個因素不同水平(或狀態(tài))間幾個樣本均數(shù)的比較,可用單因素的方差分析(one-wayANOVA)來處理此類資料。

醫(yī)學(xué)統(tǒng)計學(xué)

例題:某職業(yè)病防治院對31名石棉礦工中的石棉肺患者、可疑患者及非患者進行了用力肺活量(L)測定,結(jié)果見下表:問三組石棉礦工的肺活量有無區(qū)別?表三組石棉礦工的用力肺活量(L)

Xij

合計(?Xij)nj均數(shù)Xj(?X2ij)

石棉肺患者

1.81.41.52.11.91.71.81.91.81.82.019.1111.7935.69

可疑患者

2.32.12.12.12.62.52.32.42.420.892.3148.34

非患者

2.93.22.72.82.73.03.43.03.43.3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論