版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
本文格式為Word版,下載可任意編輯——醫(yī)學(xué)統(tǒng)計學(xué)基礎(chǔ)醫(yī)學(xué)統(tǒng)計學(xué)
第一講緒論
一、《醫(yī)學(xué)統(tǒng)計學(xué)》的理論基礎(chǔ)和研究對象:
a)問題的提出:
在人們的實踐活動中,往往會遇到類似下面的一些問題:一種新的疫苗,如何判斷它是否有效?吸煙會不會使得肺癌的機遇增加?
如何抽檢幾百或幾千人來估計某種病的流行程度?某批產(chǎn)品中合格品畢竟有多少?該不該報廢?
如何消耗最少的資源和人力來得到我們所需要的某種信息?某種試驗方法(或飼料配方)有沒有明顯改進?患者分組是否具有可比性?
所觀測對象的數(shù)量是否足夠說明其結(jié)論?試驗結(jié)果的誤差有多大?
研究結(jié)果是否適用于觀測樣本以外的同類對象?……等等.其共同特點:只知道事情的不完全信息,或者是單個試驗的結(jié)果有某種不確定性。
例如:為了知道產(chǎn)品合格與否或它的使用壽命,我們往往需要對它作破壞性檢驗,此時顯然不能把所有的產(chǎn)品都檢驗一下,而只能滿足于對少數(shù)幾個作品的抽檢,這樣獲得的信息顯然是不完全的;
要檢驗疫苗的有效性,就一般來說,接種過疫苗的動物也不一定
醫(yī)學(xué)統(tǒng)計學(xué)
全不發(fā)病,而未接種的也不會全發(fā)病.那么發(fā)病與不發(fā)病的區(qū)別畢竟到多大時我們才能認(rèn)為接種是有效的呢?
這些均涉及了我們?nèi)绾卧u價一些并不確定的試驗結(jié)果的問題。要從這類問題中得出科學(xué)的、可靠的結(jié)論,就必需依靠統(tǒng)計學(xué).有人干脆給統(tǒng)計學(xué)下了這樣的定義:“統(tǒng)計學(xué)就是從不完全的信息里取得確鑿知識的一系列技巧〞。
另外,當(dāng)必需根據(jù)有限的、完全的信息作出決策時(例如決定一
批產(chǎn)品是出廠還是報廢,某種新藥是否有效等等),統(tǒng)計學(xué)可以提供一種方法,使我們不僅能做出合理的決策,而且知道所冒風(fēng)險的大小,并幫助我們把可能的損失減至最小。
其次,如何花費最小代價取得所關(guān)心的信息,也是統(tǒng)計學(xué)的一大課題(實險設(shè)計).不注意這一點可能使辛辛苦苦的工作全成為一種浪費.
2.理論基礎(chǔ):“根據(jù)數(shù)理統(tǒng)計的原理、方法緊湊結(jié)合醫(yī)學(xué)實踐,研究醫(yī)藥衛(wèi)生領(lǐng)域中的資料收集、整理、分析和推斷的一門應(yīng)用學(xué)科,來分析和解釋生物界各種現(xiàn)象和試驗調(diào)查資料的科學(xué)〞。隨著生物醫(yī)學(xué)研究的不斷發(fā)展,運用統(tǒng)計學(xué)方法來認(rèn)識、推斷和解釋生命過程中的各種現(xiàn)象也越來越廣泛。運用統(tǒng)計學(xué)方法可以幫助人們分析占有信息,達到去偽存真,去粗取精,正確認(rèn)識世界的目的。
3.研究對象:人體及與人體健康有關(guān)的各種具有不確定性的醫(yī)學(xué)數(shù)據(jù)(變異、數(shù)量、同質(zhì))。
醫(yī)學(xué)統(tǒng)計學(xué)
二、《醫(yī)學(xué)統(tǒng)計學(xué)》的主要任務(wù)和作用:
任務(wù):1、結(jié)合專業(yè)知識和具體研究的要求進行統(tǒng)計設(shè)計2、對收集資料進行整理、做統(tǒng)計描述3、對資料進行統(tǒng)計分析和解釋
作用:1、保證調(diào)查或試驗設(shè)計的科學(xué)性、完整性
2、指標(biāo)的確定應(yīng)具有特異性、客觀性,靈敏性和縝密度高3、樣本含量足夠大,數(shù)據(jù)真實可靠4、選用統(tǒng)計分析方法正確
三、醫(yī)學(xué)統(tǒng)計學(xué)的主要內(nèi)容:
1、統(tǒng)計設(shè)計(design)在進行統(tǒng)計工作和研究之前必需有一個周密的設(shè)計,設(shè)計的內(nèi)容包括資料收集、整理和分析全過程總的設(shè)想和安排。
統(tǒng)計設(shè)計可依照在研究過程中對研究對象是否進行干預(yù)分作調(diào)查研究設(shè)計和試驗研究設(shè)計。
調(diào)查研究設(shè)計:研究者旨在客觀地描述研究總體,未加任何干預(yù)措施,如:調(diào)查了解某地的學(xué)齡兒童缺鐵性貧血的患病率,某地新生兒畸形的發(fā)生率,北京地區(qū)潰瘍病患病率等,其目的在于了解某一醫(yī)學(xué)現(xiàn)象的實際狀況,疾病的危害程度,以便為防治和研究這些疾病提供依據(jù)。調(diào)查設(shè)計主要有抽樣方法、調(diào)查技術(shù)、質(zhì)量控制技術(shù)等。
試驗研究設(shè)計:研究者根據(jù)目的(研究假設(shè)),主動加以干預(yù)措施,并觀測總結(jié)其結(jié)果,回復(fù)研究假設(shè)所提出的問題。
醫(yī)學(xué)統(tǒng)計學(xué)
如:研究脂健乳是否有降脂作用,首先假設(shè)脂健乳可以降低血脂,再將條件相像的20只大鼠先用高脂飼料喂養(yǎng)做成高脂血癥的模型,然后將動物隨機分為試驗組和對照組,試驗組服用脂健乳和豆奶,對照組單純服用豆奶,喂養(yǎng)一個月后觀測比較兩組之間各項血脂指標(biāo)的區(qū)別有無統(tǒng)計學(xué)意義,進而得出脂健乳是否具有降低血脂的保健作用的結(jié)論。
試驗設(shè)計主要有各種試驗設(shè)計模型、分組方法、樣本量估計等。由于統(tǒng)計設(shè)計的質(zhì)量直接影響著試驗結(jié)果的確鑿性、可靠性、嚴(yán)密性和代表性,一旦出現(xiàn)設(shè)計上的失誤或缺陷,可能導(dǎo)致整個研究的失敗。因此,專業(yè)設(shè)計是研究者對專業(yè)知識的把握能力,直接影響著試驗的深度和水平,而統(tǒng)計設(shè)計是研究者對醫(yī)學(xué)統(tǒng)計知識的正確運用,以保證統(tǒng)計描述和推斷正確的基礎(chǔ)。
調(diào)查設(shè)計與試驗研究設(shè)計
專業(yè)設(shè)計
運用專業(yè)知識進行設(shè)計
要求內(nèi)容方向目的
統(tǒng)計設(shè)計運用統(tǒng)計學(xué)知識進行設(shè)計
選題、調(diào)查(試驗)、方法、材料確定設(shè)計方案、收集整理資料、確定
統(tǒng)計指標(biāo)、分析和推斷方法探討試驗、觀測結(jié)果的適用性和創(chuàng)探討試驗、觀測結(jié)果的可重復(fù)性、高造性效性回復(fù)和解決科研課題,驗證假說,減少和控制誤差。保證樣本的代表性保證科研結(jié)果的先進性和可靠性,保證明驗結(jié)果的確切性和
可重復(fù)性
2、收集資料(collectionofdata)方式:1、統(tǒng)計報表2、經(jīng)常性工作記錄3、專題調(diào)查或試驗
醫(yī)學(xué)統(tǒng)計學(xué)
3、整理資料(sortingdata)將原始數(shù)據(jù)進行核對、整理,使其系統(tǒng)化、條理化,對數(shù)據(jù)進行規(guī)律檢查,改正錯誤,提供整理和描述數(shù)據(jù)資料的科學(xué)方法,確定數(shù)據(jù)的數(shù)量特征。
4、分析資料(analysisofdata)根據(jù)不同的資料類型,選擇不同的統(tǒng)計處理方法,計算有關(guān)指標(biāo),反映數(shù)據(jù)的綜合特征,說明事物的內(nèi)在聯(lián)系和規(guī)律。統(tǒng)計分析包括:
①統(tǒng)計描述(descriptivestatistics):用統(tǒng)計指標(biāo)、統(tǒng)計表、統(tǒng)計圖等方法,對資料的數(shù)量特征及分布規(guī)律進行測定和描述。
②統(tǒng)計推斷(inferentialstatistics):包括如何抽樣,以及如何在隨機變量的樣本值基礎(chǔ)上推斷概率分布和總體值。統(tǒng)計推斷中涉及的各種統(tǒng)計分析方法是本次授課的重點內(nèi)容。
四、醫(yī)學(xué)統(tǒng)計學(xué)在科研中的作用:
1、系統(tǒng)積累和表達經(jīng)驗
臨床經(jīng)驗的積累在于大量的臨床實踐。實際上這些經(jīng)驗都可以整理和表達為統(tǒng)計信息,把握了一定的統(tǒng)計學(xué)知識,就可以將積累的經(jīng)驗,通過對資料的收集、整理和分析,轉(zhuǎn)變?yōu)檎?guī)和系統(tǒng)的統(tǒng)計信息,用以報告或發(fā)表,使人類醫(yī)學(xué)知識寶庫不斷充實和發(fā)展。
醫(yī)學(xué)統(tǒng)計學(xué)
2、完成科研工作
生物學(xué)是一門試驗科學(xué),不管你從事的是生物學(xué)的哪一個分支,都不可能完全脫離試驗,只進行規(guī)律推理.而試驗所得到的結(jié)果幾乎無例外地都帶有或多或少的不確定性,即試驗誤差.在這種狀況下,不用統(tǒng)計學(xué)要想得到正確的結(jié)論是不可能的,可以毫不夸誕地說,作為一個試驗科學(xué)工,離開了統(tǒng)計學(xué)就寸步難行,希望通過這門課程的學(xué)習(xí),能夠把握常用的統(tǒng)計方法,特別是它們的條件,適用范圍、優(yōu)缺點等,從而能夠應(yīng)用它們?nèi)ソ鉀Q實踐中遇到的問題。否則,他將無法知道其研究結(jié)果是否具有科學(xué)意義上的可重復(fù)性。要一一回復(fù)這些問題,要求研究者必需在整個研究過程中貫穿和運用統(tǒng)計學(xué)的理論和方法。
3、撰寫研究報告和閱讀書刊
醫(yī)學(xué)研究中往往要涉及大量的數(shù)據(jù),但在撰寫研究報告和論文時,只能使用經(jīng)過整理和歸納的統(tǒng)計指標(biāo),并且用規(guī)范的統(tǒng)計表和統(tǒng)計圖表達。此外,在閱讀國外期刊時,假使不具備統(tǒng)計學(xué)的基礎(chǔ)知識,則不能判斷別人研究結(jié)果的可信性和局限性,更談不上吸收和借鑒。
五、《醫(yī)學(xué)統(tǒng)計學(xué)》中幾個重要的基本概念:
(1)總體(population)、樣本(sample)、個體(observedunit)
a.總體:根據(jù)研究目的所確定的性質(zhì)一致的所有個體的某種
變量值的集合。如:調(diào)查某地1999年正常成年男子的紅細(xì)胞數(shù),則
觀測對象:該地1999年正常成年男子。
觀測單位:統(tǒng)計研究中的最基本單位,如:一個人、一個家庭、
醫(yī)學(xué)統(tǒng)計學(xué)
一個地區(qū)等。
觀測值(變量值):每個人測得的紅細(xì)胞數(shù)。
該地1999年正常成年男子的紅細(xì)胞數(shù)就構(gòu)成一個總體。同質(zhì)基礎(chǔ):同一地區(qū)、同一年份、同為正常成人、同為男性有限總體(finitepopulation):有確定的時間、空間和有限個觀測單位,如上例。
無限總體(infinitepopulation):沒有確定的時間和空間限制,觀測單位數(shù)為無限。如研究用某藥治療缺鐵性貧血的療效,此時,總體的同質(zhì)基礎(chǔ)是貧血患者,同時用某藥治療,該總體應(yīng)包括用該藥治療的所有貧血患者的治療結(jié)果。
b.樣本:從總體中隨機抽取部分個體所組成的集合。
(隨機化原則:總體中每一個觀測單位均有同等機遇被抽?。?/p>
(2)參數(shù)(parameter)、統(tǒng)計量(statistics)
統(tǒng)計學(xué)中把總體的指標(biāo)稱為參數(shù),把所得樣本的平均數(shù)稱為統(tǒng)計量。
(3)誤差(error):
抽樣誤差(samplingerror)由于總體中的個體間往往存在著變異,隨機抽取的樣本僅是總體中的一部分個體,因而樣本測得的指標(biāo)(統(tǒng)計量)往往與總體指標(biāo)(參數(shù))存在著差異,這種由于隨機抽樣而造成的樣本的統(tǒng)計量與總體參數(shù)之間的差異,稱為抽樣誤差,它既不定量,也不定性。
系統(tǒng)誤差:由于設(shè)計不嚴(yán),測量儀器不確鑿,測量者水平的偏差而造成的,這種誤差是定量的,可控的。
醫(yī)學(xué)統(tǒng)計學(xué)
(4)統(tǒng)計資料
對每個觀測單位的某項特征進行測量和觀測,其特征稱為變量,對變量的測值稱為變量值,亦稱為資料。
計量資料(quantitativedata)
統(tǒng)計資料類型計數(shù)資料(qualitativedata)
等級資料(rankeddat)
①、定量資料(quantitativedata)又稱為計量資料:
用專業(yè)儀器測量,具有計量單位的測量數(shù)據(jù),表現(xiàn)為數(shù)值的大小,如身高(cm)、體重(kg)、血壓(kPa)等。特點:每個觀測單位的觀測值間有量的區(qū)別
②、定性資料(qualitativedata):其觀測值是定性的,表現(xiàn)為互不相容的類別或?qū)傩裕磳⒂^測單位按某種屬性或類別分組,所得各組的觀測單位數(shù))。
特點:每個觀測單位的觀測值間有質(zhì)的區(qū)別分兩種狀況:
1、無序分類(unorderedcategories)又稱為計數(shù)資料
a.二項分類檢驗結(jié)果可以是陽性或陰性、治療結(jié)果可以是治愈或未愈、性別屬性等,表現(xiàn)為兩類間相互對立。
b.多項分類某種觀測結(jié)果為互不相容的多個類別,如血型、職業(yè)等。
2、有序分類(ordinalcategories)又稱為等級資料
介于定量測量和定性觀測之間的半定量觀測結(jié)果,如測定某人
醫(yī)學(xué)統(tǒng)計學(xué)
群血清反應(yīng),以人為觀測單位,結(jié)果分為—、±、+、++四級,又如觀測以某種藥治療某病患者的治療結(jié)果,以每個患者為觀測單位,結(jié)果分為治愈、顯效、好轉(zhuǎn)、無效四級,尋常有兩個以上等級。
等級資料與計數(shù)資料的區(qū)別在于,等級資料雖然是多分類資料,但各個類別存在著大小和程度上的區(qū)別。特點:各類之間有程度的區(qū)別
資料的轉(zhuǎn)化和分析:根據(jù)分析問題的需要,各類變量可以相互轉(zhuǎn)化。如:觀測某人群成年男子的血紅蛋白量(g/L),屬數(shù)值變量;
若分析比較某種病人的血紅蛋白水平與正常人有無區(qū)別,須按計量資料進行處理。
序號
123456789
正常人組
病人組
若按血紅蛋白正常與偏低分為兩類,可按二項分類資料處理;
正常偏低合計
正常人組
病人組
若按貧血的診斷標(biāo)準(zhǔn)將血紅蛋白含量分為五個等級:重度貧血、中度貧血、輕度貧血、正常、血紅蛋白增高,可按等級資料處理。
醫(yī)學(xué)統(tǒng)計學(xué)
重度貧血中度貧血輕度貧血正常血紅蛋白增高
合計正常人組
病人組
(5)頻率(frequency)、概率(probability)
醫(yī)學(xué)研究的大多數(shù)現(xiàn)象是隨機現(xiàn)象,例如用同一種治療方法治療某病的一群患者,可以知道治療的結(jié)果有四種,但對于一個病人其治療后的結(jié)果是不確定的,此時的每一種可能發(fā)生的結(jié)果都是一個隨機事件(偶然事件、事件)。
定義:在n次隨機試驗中,隨機事件A發(fā)生了k次,記fn?k??,則稱fn?k?為隨機事件A在n次試驗中出現(xiàn)的頻率。
實踐證明,大量的試驗中隨機事件會浮現(xiàn)出頻率穩(wěn)定性。定義:描述隨機事件A發(fā)生可能性大小的數(shù)值,稱為A的概率,記作P(A),簡記為P。假使臨床觀測中治療200病人的樣本,求得治愈率為75%,這只是一個頻率。實際應(yīng)用中,當(dāng)概率不易求得時,常用n→∞時的頻率作為概率的估計值。但當(dāng)n較少時,頻率的波動性是很大的,用于估計概率是不可靠的。
隨機事件概率的大小在0與1之間。
P值越接近1,表示某事件發(fā)生的可能性越大;P值越接近0,表示某事件發(fā)生的可能性越小。
嚴(yán)格說,P=1表示事件必然發(fā)生,P=0表示事件不可能發(fā)生,他
kn
醫(yī)學(xué)統(tǒng)計學(xué)
們是確定性的,不是隨機事件,但可把他們看成隨機事件的特例。
統(tǒng)計分析中的好多結(jié)論都是帶有概率性的。習(xí)慣上將P≤0.05稱為小概率事件,表示在一次試驗或觀測中該事件發(fā)生的可能性很小,可以視為很可能不發(fā)生?!夺t(yī)學(xué)統(tǒng)計學(xué)》的學(xué)習(xí)重點是:
1、把握其基本知識、基本技能、基本概念、基本方法。建立規(guī)律思維方法和提高分析問題的能力。2、把握調(diào)查設(shè)計和試驗設(shè)計的基本原則。
培養(yǎng)收集、整理、分析統(tǒng)計資料的系統(tǒng)工作能力。3、把握一套統(tǒng)計軟件的使用方法(SAS、SPSS、STATA等)。能夠達到在完成《醫(yī)學(xué)統(tǒng)計學(xué)》課程后,獨立完成科研論
文和正確應(yīng)用統(tǒng)計方法。
醫(yī)學(xué)統(tǒng)計學(xué)
其次講集中趨勢
舉例
設(shè)有A、B兩名新戰(zhàn)士,他們的射擊技術(shù)可用下面的分布來表示:戰(zhàn)士A戰(zhàn)士B擊中環(huán)數(shù)8910擊中環(huán)數(shù)8910對應(yīng)概率0.30.10.6對應(yīng)概率0.20.50.3問哪一個戰(zhàn)士射擊技術(shù)較好?1、頻數(shù)分布表1)、頻數(shù)表的編制
一致觀測結(jié)果出現(xiàn)的次數(shù)稱為頻數(shù)。將所有觀測結(jié)果的頻數(shù)按一定順序排列在一起便是頻數(shù)表(frequencytable)。步驟:
①找出最大和最小值,計算極差R=Xmax―Xmin②根據(jù)斯梯階公式確定組距
H?R1?3.322logn
③掃描樣本值,劃記后獲得頻數(shù)
2)、頻數(shù)表的用途
①大樣本數(shù)據(jù)(不限于計量資料)常用的表達方式。
②便于觀測數(shù)據(jù)的分布類型。
③便于發(fā)現(xiàn)資料中遠(yuǎn)離群體的某些特大或特小的可疑值,必要時經(jīng)檢驗后舍去。
④當(dāng)樣本含量足夠大時,各組段的分布頻率作為分布概率的估計值。
例7.我國某地農(nóng)村1995年已婚育齡婦女現(xiàn)有子女?dāng)?shù)的分布子女?dāng)?shù)(1)0123456789≥10合計
婦女?dāng)?shù)f(2)13751251913042628560217191369572553268151373156145525頻率(%)(3)9.4517.3020.9119.6214.929.414.982.250.100.260.11100.00累計頻數(shù)(4)13751389226934897908119627133322140577143845144996145369145525——累計頻率(%)(5)9.4526.7547.6567.2882.2091.6196.6098.8599.6499.89100.00——醫(yī)學(xué)統(tǒng)計學(xué)
2、集中位置的描述
平均數(shù)(average)是統(tǒng)計中最廣泛、最重要的一個指標(biāo)體系。用來描述一組變量的集中趨勢、中心位置或平均水平,常作為一組資料的代表值,使資料產(chǎn)生簡明概括的印象,又便于組間的比較。常用平均數(shù)有均數(shù)、幾何均數(shù)和中位數(shù)。(一)、均數(shù)(mean)的計算
x?x2?x3...?xnx?1?n①直接法
?xin
例1、10名7歲男童體重(kg)分別為17.3,18.0,19.4,20.6,21.2,21.8,22.5,23.2,
24.0,25.5.求平均體重。
x=(17.3+18.0+19.4+20.6+21.2+21.8+22.5+23.2+24.0+25.5)/10=21.35(kg)
②頻數(shù)表法:
x?f1x1?f2X2?f3x3??fkxk???fxf?f
例2:某地隨機檢查了140名成年男性紅細(xì)胞數(shù)(1012/L)
4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.714.444.945.054.784.524.635.515.244.984.334.834.565.444.794.914.264.384.874.995.604.464.955.074.805.304.654.774.505.375.495.224.585.074.814.543.824.014.894.625.124.854.595.084.824.935.054.404.145.014.375.244.604.714.824.945.054.794.524.644.374.874.604.724.835.334.684.804.154.654.764.884.613.974.084.584.314.054.165.045.154.504.624.734.474.584.704.814.554.284.784.514.634.364.484.595.095.205.325.054.414.524.644.754.494.224.715.214.944.685.174.915.024.76
醫(yī)學(xué)統(tǒng)計學(xué)
紅細(xì)胞數(shù)(1012/L)(1)3.80~4.00~4.20~4.40~4.60~4.80~5.00~5.20~5.40~5.60~5.80~
合計頻數(shù)f(2)
261125322717134
21
140(∑f)
組中值X(3)
3.904.104.304.504.704.905.105.305.505.705.90
Fx(4)=(2)*(3)7.8
24.647.3112.5150.4132.386.768.922.011.45.9
669.8(∑fX)
fx?f2X2?f3x3??fkxkx?11?f?
=4.78(1012/L)
均數(shù)的兩個重要特征:
①各離均差的總和等于零
?fx?f
?(x-x)?0
證明:
?(xi?x)??xi?nx??xi??xi?0
??②各離均差的平方和小于各觀測值X與任何數(shù)a之差的平方
?(x-x)??(x-a)22
均數(shù)的應(yīng)用:
1.用來描述一組變量值的平均水平,具有代表性,因此變量值必需是同質(zhì)的。2.適用于呈正態(tài)分布(對稱分布)的資料。
醫(yī)學(xué)統(tǒng)計學(xué)
(2)幾何均數(shù)(geometricmean)的計算1)直接法
G?nx1?x2?x3???xnlgxlgx1?lgx2????lgxn)?lg?1(?)nn
例3:5人的血清滴度為:1:2,1:4,1:8,1:16,1:32,求平均滴度。
G?lg?1(G?n2?4?8?16?32
LgG=(lg2+lg4+lg8+lg16+lg32)/5=0.903
G=lg-10.903=8故平均滴度為1:8。
2)頻數(shù)表法
G?lg?1(?
例4:40名麻疹疫苗接種麻疹疫苗后一個月,血凝抑制抗體滴度見下表,求平均滴度。抗體滴度人數(shù)f滴度倒數(shù)XLgXf*lgX(1)(2)(3)(4)(5)=(2)*(4)1:4140.60210.60211:8580.90314.51551:166161.20417.22461:322321.50513.01021:647641.806212.64341:128101282.107221.07201:25642562.40829.63281:51255122.709313.54654072.2471LgG=(?flgX/?f)=72.2471/40=1.8062G=lg-11.8062=64血凝抑制抗體滴度的平均滴度為1:64
幾何均數(shù)的應(yīng)用:用于等比級數(shù)資料和對數(shù)正態(tài)分布資料,
如:某些傳染病的潛伏期、抗體滴度、細(xì)菌計數(shù)等。
flgx)?f
醫(yī)學(xué)統(tǒng)計學(xué)
(3)、中位數(shù)和百分位數(shù)的計算
中位數(shù)(median,M)是將一組觀測值從小到大按順序排列,位次居中的數(shù)值對應(yīng)的觀測值就是中位數(shù)。因而全部觀測值中,大于和小于中位數(shù)的觀測值的個數(shù)相等。
1)直接法:將原始觀測值按大小順序排列:
M?Xn為奇數(shù)時,
(n?1)2
??X?X?(n)?n(?1)22?n為偶數(shù)時,M??2例5.測得5個人的低密度脂蛋白中載體B蛋白的含量(mg/dl)分別為0.84,2.58,5.46,8.58,9.60,求其中位數(shù).
M?X
=X3=5.46mg/dl
例6.8名新生兒的身長(cm)依此為50,51,52,53,54,54,55,58,求其中位數(shù)。
??X?X?(n)?n(?1)22??53?54?53.5M??22(n?1)22)頻數(shù)表法
Px?L?i(n?x%??fL)fx
醫(yī)學(xué)統(tǒng)計學(xué)
例7.對某地630名50歲~60歲的正常女性檢查了血清甘油三脂含量,并制成如
下頻數(shù)表,試求中位數(shù)及第25、75、90百分位數(shù)。
甘油三脂mg/dl頻數(shù),f累計頻數(shù)累計頻率(%)
(1)(2)(3)(4)10~27274.340~16919631.170~16736357.6100~9445772.5130~8153885.4160~4258092.1190~2860896.5220~1462298.7250~462699.4280~362999.8310~1630100.0合計630
630?0.5?196m?70??30?91.4(mg/dl)
167
630?0.25?27p25?40??30?63.2(mg/dl)
169
630?0.75?457p75?130??30?135.7(mg/dl)
81
630?0.90?538p90?160??30?180.7(mg/dl)
42
醫(yī)學(xué)統(tǒng)計學(xué)
例8.某日大氣中SO2的日平均濃度(ug/m3)見下表,分別求第25、75、95
百分位數(shù)及中位數(shù)。濃度(ug/m3)天數(shù),f累計頻數(shù)累計頻率(%)(1)(2)(3)(4)5~393910.850~6710629.475~6417047.1100~6323364.5125~4527877.0150~3030885.3175~1732590.0200~933492.5225~734194.5634796.1275~535297.5300~335598.3325~6361100.0361Px?l?i(n?x%??fl)fx
25(361?25%?39)?69.12(?g/m3)6725P75?125?(361?75%?233)?145.97(?g/m3)4525P95?250?(361?95%?341)?258.12(?g/m3)625P50?100?(361/2?170)?104.17(?g/m3)63
中位數(shù)和百分位數(shù)的應(yīng)用:
1.用于描述偏態(tài)分布資料的集中位置。反映位次居中的觀測值的水平。2.百分位數(shù)是用于描述樣本或總體觀測值序列在某百分位置水平,最常用的百分位數(shù)是中位數(shù)。
3.百分位數(shù)常用來確定醫(yī)學(xué)參考值范圍。
P25?50?醫(yī)學(xué)統(tǒng)計學(xué)第三講離散趨勢離散程度的描述
三組同性別、同年齡兒童的體重(kg)如下,分析其集中趨勢與離散趨勢。甲組2628303234X甲=30kgR=8S=3.16已組2427303336X乙=30kgR=12S=4.74丙組2629303134X丙=30kgR=8S=2.91哪一組數(shù)值的代表性好?(1)極差(range)
一組觀測值中,最大值與最小值差,反映個體差異的范圍。極差大,說明變異度大,各變量值離均數(shù)越遠(yuǎn),數(shù)據(jù)越分散;反之亦然。(2)四分位數(shù)(quartile)間距
可看成是特定的百分位數(shù),用它說明個體差異比極差穩(wěn)定。
Q=P75–P25
一般來說,樣本例數(shù)越多,四分位間距越穩(wěn)定。(3)方差(variance)與標(biāo)準(zhǔn)差的計算方差:σ2=?(x??)2/N
2(x?x)?s2?
n?1
由上式可知:方差考慮了總體中每個變量值X與總體均數(shù)之差(x??),稱為離均差平方和(SS),因此方差近似等于離均差平方和的算數(shù)均數(shù),故又稱為均方差(MS),由于SS利用了每一個觀測值的信息,因而反映一批數(shù)據(jù)的變異程度優(yōu)于極差和四分位間距。
(4)標(biāo)準(zhǔn)差(standarddeviation)
方差開方后稱為標(biāo)準(zhǔn)差,其單位與變量值單位及均數(shù)單位一致,變異度越大,則離均差平方和越大,標(biāo)準(zhǔn)差越大,說明個體差異越大,均數(shù)的代表性越差。為了簡化計算,標(biāo)準(zhǔn)差的計算公式還可寫為:
(?x)2?x?nS?n?1
2醫(yī)學(xué)統(tǒng)計學(xué)
分組資料的計算:
S??fx2?(?fx)2n
n?1如上例:n=110∑fx2=1584990∑fx=13194
S??fx2?(?fx)2n?
1584990?131942/110?4.72cm110?1n?1
(5)變異系數(shù)(cofficientofvariation,CV)定義:標(biāo)準(zhǔn)差與算術(shù)均數(shù)之比,cv?sx??100%
其描述了相對于算術(shù)均數(shù)而言標(biāo)準(zhǔn)差的大小,即描述數(shù)據(jù)的變異相對于其平均水平來說是大還是小。
與前面介紹的四種離散程度指標(biāo)相比,變異系數(shù)有以下兩個不同之處:1:它描述的不是數(shù)據(jù)分布的絕對離散程度,而是相對離散程度;2:它不象極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差那樣具有取值單位。這兩個特點決定了變異系數(shù)的應(yīng)用也不同于前面四個離散程度指標(biāo)。它常用于:
1、比較度量衡單位不同的多組資料的變異度:
例如:某地20歲男子100人,其身高均數(shù)為166.06cm,標(biāo)準(zhǔn)差為4.95cm;其體重均數(shù)為53.72kg,標(biāo)準(zhǔn)差為4.96kg.欲比較身高與體重的變異何者為大,由于度量單位不同,不能比較其標(biāo)準(zhǔn)差而應(yīng)比較其變異系數(shù)身高cv?體重cv?4.95cm?100%?2.98%
166.06cm4.96kg?100%?9.23%
53.72kg由此可見,該地20歲男子體重的變異大于身高的變異。
醫(yī)學(xué)統(tǒng)計學(xué)
2.比較均數(shù)相差懸殊的多組資料的變異度:某地不同年齡組男子身高的變異程度
年齡組3-3.5歲30-35歲
表中可見,雖然30~35歲組的標(biāo)準(zhǔn)差明顯大于3~3.5歲組的標(biāo)準(zhǔn)差,但事實上30~35歲組男子身高的變異并不大,而3~3.5歲組男童身高的變異卻很大。這種均數(shù)相差懸殊的資料比較變異程度時,應(yīng)當(dāng)用變異系數(shù)說明其變異狀況。
小結(jié)
為了解數(shù)值變量的分布規(guī)律,可將觀測值編制頻數(shù)表,繪制頻數(shù)分布圖,用于描述資料的分布特征(集中趨勢和離散趨勢),以及分布類型(對稱分布和偏態(tài)分布)。一.
平均數(shù)是描述頻數(shù)分布集中位置的指標(biāo),它代表一組觀測值的平均水平,
人數(shù)100100
均數(shù)±標(biāo)準(zhǔn)差變異系數(shù)(%)90.1±3.1170.2±5.0
3.20.3
常用平均數(shù)的指標(biāo)下表:平均數(shù)均數(shù)幾何均數(shù)中位數(shù)意義平均數(shù)量水平平均增(減)倍數(shù)位次居中的觀測值水平應(yīng)用場合應(yīng)用甚廣,最適用于對稱分布,特別是正態(tài)分布等比級數(shù)資料,對數(shù)正態(tài)分布偏態(tài)分布,分布不明,分布末端無確定值百分位數(shù)描述觀測序列在某百分位置的水平,是分布的百分界值,可用于醫(yī)學(xué)參考值范圍,適用于任何分布。
二、描述頻數(shù)分布離散程度的指標(biāo)有:
1)極差與四分位間距,后者較穩(wěn)定,但均不能綜合反映各觀測值的變異程度;2)方差和標(biāo)準(zhǔn)差,最為常用,對正態(tài)分布尤為重要;
3)變異系數(shù)常用于:不同測量單位的幾組資料變異度的比較;均數(shù)相差懸殊
的幾組資料變異度的比較。
醫(yī)學(xué)統(tǒng)計學(xué)
第四講正態(tài)分布及其應(yīng)用
一、正態(tài)分布的概念和特征
根據(jù)頻數(shù)表資料繪制成直方圖,可以設(shè)想,假使將觀測人數(shù)逐漸增多,線段不斷分細(xì),圖中直條將逐漸變窄,其頂端將逐漸接近一條光滑的曲線,這條曲線稱為頻數(shù)曲線或頻率曲線,略呈鐘型,兩頭低,中間高,左右對稱,近似于數(shù)學(xué)上的正態(tài)分布(normaldistribution)。由于頻率的總和等于100%或1,故橫軸上曲線下的面積等于100%或1。
正態(tài)分布是一種橫重要的連續(xù)型分布,在生物統(tǒng)計學(xué)中,占有極其重要的地位。大量生物學(xué)現(xiàn)象所產(chǎn)生的數(shù)據(jù),都聽從正態(tài)分布。
1、正態(tài)分布的圖形有了正態(tài)分布的密度函數(shù)f(X),即正態(tài)分布的方程,就可給出圖形
f(x)
?
醫(yī)學(xué)統(tǒng)計學(xué)
上式中右側(cè)?為均數(shù),?為標(biāo)準(zhǔn)差,X為自變量。當(dāng)X確定后,就可由此式求得其密度函數(shù)f(X),也就是相應(yīng)的縱坐標(biāo)的高度。所以,已知?和?,就能繪出正態(tài)曲線的圖形。2、正態(tài)分布的特征
(1)正態(tài)分布以?為中心,左右對稱。
(2)正態(tài)分布有兩個參數(shù),即?和?。?是位置參數(shù),當(dāng)?恒定后,
?越大,則曲線沿橫軸越向右移動;?越小,則曲線沿橫軸越向左移動。?是變異參數(shù),當(dāng)?恒定時,?越大,表示數(shù)據(jù)越分散,曲線越“胖〞;?越小,表示數(shù)據(jù)越分散,曲線越“瘦〞。(3)正態(tài)分布的偏斜度?1=0,峭度?2=0
為了應(yīng)用便利,常將上式作如下變換,
u?X???
也就是將原點移到?的位置,使橫軸尺度以?為單位,使?=0,?=1,則正態(tài)分布變換為標(biāo)準(zhǔn)正態(tài)分布。(standardnormaldistribution),u稱為標(biāo)準(zhǔn)正態(tài)離差(standardnormaldeviate)標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)為:
?(u)?1e2??u22
一般用N(?,?2)表示均方為?,方差為?2的正態(tài)分布。于是標(biāo)準(zhǔn)正態(tài)分布用N(0,1)表示。
醫(yī)學(xué)統(tǒng)計學(xué)
標(biāo)準(zhǔn)正態(tài)分布有以下特征:
(1)在u=0時,?(u)達到最大值。
(2)當(dāng)u無論向哪個方向遠(yuǎn)離0時,?(u)的值都減小。(3)曲線關(guān)于Y軸對稱,即?(u)=?(-u)。(4)曲線和橫軸所夾的面積等于1。
二、標(biāo)準(zhǔn)正態(tài)曲線下面積的計算P(u1161cm的概率;(3)X在152~162cm間的概率。(1)依題意:
161?156.2P(X?161)??()??(1)?0.841344.82
所以,“三尺三〞的株高低于161cm的概率為0.84134。
(2)依題意得:
164?156.2P(X?164)??()?1??(1.62)?1?0.94738?0.052624.82
(3)依題意得:
162?156.2152?156.2)P(152?X?162)??()??(??(1.2)??(?0.87)?0.88493?0.19215?0.692784.824.82
醫(yī)學(xué)統(tǒng)計學(xué)
以下一些值很重要,應(yīng)予記憶:
u=-1到u=1面積=0.6827u=-1.96到u=1.96面積=0.9500u=-2.58到u=2.58面積=0.9900三、小結(jié)
1、正態(tài)分布是一種連續(xù)性的分布,不少醫(yī)學(xué)現(xiàn)象聽從正態(tài)分布或近似正態(tài)分布(宛如性別、同年齡兒童的身高,同性別健康成人的紅細(xì)胞數(shù)、血紅蛋白量、脈搏數(shù)等,以及試驗中的隨機誤差等);或經(jīng)變量變換轉(zhuǎn)換為正態(tài)分布(如某些病人的潛伏期以及醫(yī)院病人住院天數(shù)等),可按正態(tài)分布規(guī)律來處理,它也是大量統(tǒng)計方法的理論基礎(chǔ)。
2、正態(tài)分布的特征是:
(1)曲線在橫軸上方,均數(shù)處最高;(2)以均數(shù)為中心,左右對稱;
(3)確定正態(tài)分布的兩個參數(shù)是均數(shù)?和標(biāo)準(zhǔn)差?。
正態(tài)分布用N(?,?2)表示,為了應(yīng)用的便利,常對變量x作u=(x-?)/?使?=0,?=1,則正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布用N(0,1)表示。
3、運用正態(tài)曲線下面積的分布規(guī)律,可計算醫(yī)學(xué)參考值范圍和質(zhì)量控制等。
醫(yī)學(xué)統(tǒng)計學(xué)
第四講:總體均數(shù)的估計和假設(shè)檢驗醫(yī)學(xué)統(tǒng)計學(xué)的最基本問題是研究總體與樣本的關(guān)系。總體與樣本的關(guān)系,可從兩方面研究:
(1)由已知的總體,研究樣本的分布規(guī)律,即由總體到樣本的
研究過程;
(2)由樣本如何去推斷未知的總體,屬于從樣本到總體的研究
過程。
1、從一個正態(tài)總體中抽取的樣本統(tǒng)計量分布
生物學(xué)中遇到最多的是正態(tài)總體。對于正態(tài)總體,可以用數(shù)學(xué)推演的方法,得出嚴(yán)格的樣本統(tǒng)計量的抽樣分布,有了嚴(yán)格的樣本分布規(guī)律,就可以由樣本來推斷總體了。標(biāo)準(zhǔn)差已知時的樣本平均數(shù)的分布——u分布
平均數(shù)為?,標(biāo)準(zhǔn)差為?的正態(tài)總體中,獨立隨機的抽取含量為n的樣本,則:
?x???x??n
樣本平均數(shù)是一聽從正態(tài)分布的隨機變量,記為X。將平均數(shù)標(biāo)準(zhǔn)化,則:
u?x???n
其中的分母稱為平均數(shù)的標(biāo)準(zhǔn)誤差(standarderrorofmean)。假使變量是正態(tài)的或近似正態(tài)的,則標(biāo)準(zhǔn)化的變量聽從或近似地聽從N(0,1)分布。
醫(yī)學(xué)統(tǒng)計學(xué)
1、標(biāo)準(zhǔn)差已知時的樣本平均數(shù)的分布——t分布(t-distribution)若上式中的?是未知的,可用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)化變量并不聽從正態(tài)分布,而聽從具有n-1自由度的t分布。
t?x??Sn
t分布也是一種對稱分布,它只有一個參數(shù),即自由度(degreeoffreedom)t分布與標(biāo)準(zhǔn)正態(tài)分布相比有以下特征:(1)二者都是單峰分布,以0為中心,左右兩側(cè)對稱。
(2)t分布的峰部較矮而尾部翹得較高,說明遠(yuǎn)側(cè)t值的個數(shù)相對較多,即尾部面積(概率P)較大。
自由度越小這種狀況越明顯。?逐漸增大時,t分布逐漸迫近標(biāo)準(zhǔn)正態(tài)分布;當(dāng)?=?時,t分布就完全成為標(biāo)準(zhǔn)正態(tài)分布了。2、統(tǒng)計推斷
統(tǒng)計推斷是探討如何通過樣本去推斷總體。由樣本推斷總體是以各種樣本統(tǒng)計量的抽樣分布為基礎(chǔ)的。對總體做統(tǒng)計推斷(statisticalinference),可以通過兩條途徑進行。
一是通過樣本統(tǒng)計量估計總體參數(shù);二是首先對所估計的總體提出一個假設(shè),例如假設(shè)這個總體的平均數(shù)?等于某個值?0,然后,通過樣本數(shù)據(jù)去推斷這個假設(shè)是否可以接受,假使可以接受,樣本很可能抽自這個總體;否則很可能不是抽自這個總體。前一種途徑稱為總體參數(shù)估計(estimationofpopulationparameter),后一種途徑稱為統(tǒng)計假設(shè)檢驗(statisticaltestofhypothesis)。這兩種不同的統(tǒng)計分析方法
醫(yī)學(xué)統(tǒng)計學(xué)
在實際工作中可相互參照使用。
1、總體均數(shù)的估計——區(qū)間估計(internalestimation)即按一定的概率估計總體均數(shù)在哪個范圍。可根據(jù)資料的條件選用不同的方法。(1)?未知時。一般用t分布的原理作區(qū)間估計。根據(jù)
P(?t?,??t?t?,?)?1??(1-?為可信度)得P(-t?,??x??s/n?t?,?)?1??于是得可信度為1-?時,計算總體均數(shù)可信區(qū)間的通式為:
習(xí)慣上,常取1-?=0.95,即95%可信區(qū)間;或取1-?=0.99,即99%
X?t?,?(可信區(qū)間。
sn)???X?t?,?(sn)例題1、對某人群隨機抽取20人,用某批號的結(jié)核菌素作皮試,平均侵潤直徑為10.9mm,標(biāo)準(zhǔn)差為3.86mm。問這批結(jié)核菌素在該人群中使用時,皮試的平均侵潤直徑的95%可信區(qū)間是多少?本例,n=20,?=n-1=20-1=19,?=0.05(雙側(cè))查附表,得t0.05,19=2.093
(10.9?2.093?3.8620,10.9?2.093?3.8620)?(9.1,12.7)所以,該人群皮試的平均侵潤直徑的95%可信區(qū)間為9.1~12.7mm。
醫(yī)學(xué)統(tǒng)計學(xué)
(2)?已知或樣本例數(shù)n足夠大時,按正態(tài)分布原理作區(qū)間估計。
?已知時(X-u???nsn,X?u??,X?u???nsn)?未知但n大(X-u??)
例題2由某地成年男子中抽得144人的樣本,求得紅細(xì)胞數(shù)的均數(shù)為5.38?1012/L,標(biāo)準(zhǔn)差為0.44?1012/L,試估計該地成年男子紅細(xì)胞均數(shù)的95%可信區(qū)間。
本例n?144,x?5.38,s?0.44,??0.05,由于n較大可取u0.05?1.96(5.38-1.96?0.44144,5.38?1.96?0.44144)?(5.31,5.45)該地成年男子紅細(xì)胞均數(shù)的95%可信區(qū)間為(5.31,5.45)。
可信區(qū)間的涵義意思是從總體中作隨機抽樣,每個樣本可以算出一個可信區(qū)間,如95%可信區(qū)間,意味著100次抽樣,算得100個可信區(qū)間,平均有95個可信區(qū)間包括總體均數(shù)(估計正確),只有5個可信區(qū)間不包括總體均數(shù)(估計錯誤)。5%是小概率事件,實際發(fā)生的可能性小,因此,在實際應(yīng)用中就認(rèn)為總體均數(shù)在算得的可信區(qū)間內(nèi),這種估計方法會冒5%犯錯的風(fēng)險。
可信區(qū)間的兩個要素一是確鑿度,反映在可信度1-?的大小,即區(qū)間包含總體均數(shù)的概率的大小,當(dāng)然愈接近1愈好;二是精度,反映在區(qū)間的長度,當(dāng)然長度愈小愈好。在樣本例數(shù)確定的狀況下,二者是矛盾的。一般狀況下,在可信度確定的狀況下,增加樣本例數(shù),
醫(yī)學(xué)統(tǒng)計學(xué)
可減少區(qū)間長度,提高精度。
醫(yī)學(xué)統(tǒng)計學(xué)
假設(shè)檢驗的基本步驟:
1.建立檢驗假設(shè),確定檢驗水準(zhǔn)α
H0:無效假設(shè)(假定所檢驗的兩個總體均數(shù)相等)H1:備擇假設(shè)(假定所檢驗的兩個總體均數(shù)不相等)單側(cè)檢驗:推斷兩總體均數(shù)有無區(qū)別
雙側(cè)檢驗:根據(jù)專業(yè)知識推斷兩總體均數(shù)中是否可以認(rèn)為一個大于(高于)另一個
2.選擇檢驗方法,計算統(tǒng)計量
根據(jù)分析目的、設(shè)計類型和資料類型,選擇恰當(dāng)?shù)臋z驗方法,計算相應(yīng)的統(tǒng)計量(如:t、u、r、f、χ2等)。3.確定P值,作出統(tǒng)計結(jié)論
用計算出的統(tǒng)計量,根據(jù)不同自由度查相應(yīng)的界值表,確定P值。P值的定義:在H0所規(guī)定的總體中隨機抽樣,獲得等于及大于(或等于及小于)現(xiàn)有樣本統(tǒng)計量的概率。結(jié)論:
①當(dāng)計算的統(tǒng)計量≥界值表上所查到的理論值,則P≤α。此時,表示在H0成立的條件下,出現(xiàn)等于及大于現(xiàn)有樣本統(tǒng)計量的概率是小概率,按其原理,現(xiàn)有信息不支持H0,因而拒絕H0。
②當(dāng)計算的統(tǒng)計量〈界值表上所查到的理論值,則P〉α。此時,表示在H0成立的條件下,出現(xiàn)等于及大于現(xiàn)有樣本統(tǒng)計量的概率不是小概率,現(xiàn)有信息還不足以拒絕H0,因此不拒絕H0。
醫(yī)學(xué)統(tǒng)計學(xué)
第五講均數(shù)差異的假設(shè)檢驗
假設(shè)檢驗的具體方法,尋常是以選定的檢驗統(tǒng)計量來命名的,
如t檢驗要用特定的公式計算檢驗統(tǒng)計量t值,u檢驗要用特定的公式計算檢驗統(tǒng)計量u值。應(yīng)用時首先要了解各種檢驗方法的用途、應(yīng)用條件和檢驗統(tǒng)計量的計算方法。
一、單組完全隨機化設(shè)計資料均數(shù)的t檢驗和u檢驗
從一個總體中完全隨機地抽取一部分個體進行研究,這樣的設(shè)計稱為單組完全隨機化設(shè)計(completelyrandomizeddesignofsinglegroup)。
例題1:根據(jù)大量調(diào)查,已知健康成年男子脈搏均數(shù)為72次/分,某醫(yī)生在某一山區(qū)隨機抽查了25名健康成年男子,求得其脈搏均數(shù)為74.2次/分,標(biāo)準(zhǔn)差為6.0次/分,能否據(jù)此認(rèn)為該山區(qū)成年男子脈搏均數(shù)高于一般成年男子脈搏均數(shù)?
這兩個均數(shù)不等有兩個可能:(1)由于抽樣誤差所致(2)由于環(huán)境條件的影響
如何作出判斷呢?在統(tǒng)計上是通過假設(shè)檢驗來回復(fù)這個問題。以下介紹建立假設(shè)檢驗(t檢驗)的思想、方法與步驟。
1、
建立檢驗假設(shè)和確定檢驗水準(zhǔn)H0:?1=?0(=72次/分)H1:?1??0(=72次/分)
醫(yī)學(xué)統(tǒng)計學(xué)
?=0.05
本例分析目的是比較山區(qū)成年男子脈搏樣本均數(shù)與一般成年男子脈搏總體均數(shù)有無區(qū)別?
?是未知的,可以假設(shè)?等于某一定值?0,?與?0的差等于零,
這樣的假設(shè)稱為無差異假設(shè)或零假設(shè)(nullhypothesis)記為H0:?1=?0
表示該山區(qū)的環(huán)境條件對脈搏數(shù)無影響,他們之間的差異是由于抽樣誤差所致。與零假設(shè)相對立的假設(shè)稱為對立假設(shè)或備擇假設(shè)(alternativehypothesis),符號為H1:?1??0,它是在拒絕H0的狀況下而接受的假設(shè)。假設(shè)檢驗所用的檢驗統(tǒng)計量一般都是建立在零假設(shè)的基礎(chǔ)上,由于H0比較單純明確,而H1卻包含著各種狀況。
檢驗水準(zhǔn)(sizeoftest)亦稱顯著性水準(zhǔn)(significancelevel),符號為?,在實際工作中常取0.05或0.01。2、選定檢驗方法和計算統(tǒng)計量
本例:n=25x?74.2次/分S=6.0次/分檢驗統(tǒng)計量公式為:
?
x??0t?,??n-1sx
74.2?72.0?1.833,??25-1?246.0/25
將以上數(shù)據(jù)代入公式,得:
t?要根據(jù)研究類型和統(tǒng)計推斷目的選用不同檢驗方法,不同檢驗方法有相應(yīng)的檢驗統(tǒng)計量,本例的檢驗統(tǒng)計量t聽從?=n-1的t分布。建設(shè)檢驗方法尋常是以檢驗統(tǒng)計量來命名的,故,本例檢驗稱為t檢驗。
醫(yī)學(xué)統(tǒng)計學(xué)
3、確定P值和作出推斷結(jié)論
查t界值表單側(cè),t(24,0.05)=2.064,由于t0.05。得出結(jié)論按?=0.05水準(zhǔn),拒絕H0,接受H1。認(rèn)為該山區(qū)的成年男子脈搏均數(shù)高于一般的成年男子脈搏均數(shù)。
關(guān)于檢驗水準(zhǔn)是取0.05、0.01或其他數(shù)值,要根據(jù)不同的試驗而定。?取值較小,有利于提高“陽性〞統(tǒng)計檢驗結(jié)果的可靠性;?取值較大,有利于發(fā)現(xiàn)研究總體可能存在的差異,但可靠性降低。較好的做法是確切地計算出P值,這會對人們認(rèn)識你所作的試驗有很大的參考價值。
二、隨機化配對設(shè)計資料均數(shù)的t檢驗
配對設(shè)計資料分三種狀況:
(1)配成對子的同對受試對象分別給予兩種不同的處理;(2)同一受試對象分別接受兩種不同處理;(3)同一受試對象處理前后的比較。
(1)與(2)結(jié)果的比較,其目的是推斷兩種處理的效果有無區(qū)別;(3)比較,其目的是推斷某種處理有無作用。
因此,應(yīng)當(dāng)首先計算出各對差值d的均數(shù)。當(dāng)兩種處理結(jié)果無區(qū)別或某種處理不起作用時,理論上差值d的總體均數(shù)?d=0。故可將配對設(shè)計資料的假設(shè)檢驗視為樣本均數(shù)與總體均數(shù)?d=0的比較,配對設(shè)計資料以小樣本居多,故常用t檢驗。其計算公式為:
d??dd,??n-1t?sd?sd/n
醫(yī)學(xué)統(tǒng)計學(xué)
例題2、將大白鼠配成8對,每對分別飼以正常飼料和缺乏維生素E飼料,測得兩組大白鼠肝中維生素A的含量如下表,試比較兩組大白鼠中維生素A的含量有無區(qū)別。
表不同飼料組大白鼠肝中維生素A的含量(U/g)
大白鼠配對號12345678合計
正常飼料組35502000300039503800375034503050維生素E缺乏組24502400180032003250270025001750差數(shù),d
1100-4001200750550105095013006500
d212100001600001440000562500302500110250090250016900007370000
1)H0:?d=0,H1:?d?0,?=0.052)計算統(tǒng)計量
d6500?d???812.5(u/g)n8Sd?Sdn??d2?(?d)2/nn(n?1)?7370000?(6500)2/8?193.1298(u/g)
8?(8?1)t?812.5-0??4.2070??n?1?7193.1298Sd/nd??d3)確定P值下結(jié)論
查t界值表(雙側(cè)),t>t0.05,7=4.029P醫(yī)學(xué)統(tǒng)計學(xué)
三、兩組完全隨機化設(shè)計資料均數(shù)的t檢驗與u檢驗1、t檢驗
將受試對象完全隨機地分派到兩組中,這兩組分別接受不同的處理。這樣的設(shè)計稱為兩組完全隨機化設(shè)計(completelyrandomizeddesignoftwogroups)。
有些研究設(shè)計既不能作自身對比,也不便于配對。如試驗中只有把受試動物殺死后才能獲得所需數(shù)據(jù),則不可能對動物在處理前后各進行一次測定;再如比較兩種治療方法對同一疾病的療效,每個患者一般只能接受一種方法的治療,把受試患者配成若干對在實際工作中又十分困難,這時只能進行兩組間均數(shù)的比較。在兩組比較的資料中,每個觀測對象都應(yīng)依照隨機的原則進行分組,兩組樣本量可以一致,也可以不同,但只有在兩組例數(shù)一致時檢驗效率才最高。統(tǒng)計量計算公式為:
t?
(X1?X2)?(?1??2)Sx?x12?X1?X2Sx?x12
??n1?n2?2
Sx1?x2?Sc2(11?)n1n22222??x21?(?x1)/n1??x?(?X2)/n211(?)n1?n2?2n1n2
2(n1?1)S12?(n2?1)S2S?(n1?1)?(n2?1)2c
醫(yī)學(xué)統(tǒng)計學(xué)
例題3、某醫(yī)院研究乳酸脫氫同工酶(LDH)測定對心肌梗死的診斷價值時,曾用隨機抽樣方法比較了10例心肌梗死患者與10例健康人LDH測定值的區(qū)別,結(jié)果如下,試問LDH測定值在兩組間有無區(qū)別?
心肌梗死患者(X1)23.245.045.040.035.044.142.052.550.058.0健康人(X2)20.031.030.523.124.238.035.537.839.0131.0(1)、H0:?1=?2H1:?1??2?=0.05
2n1?10,?X1?434.80,?X1?19742.30,X1?43.48,S1?9.64n1?10,?X2?310.10,?X?10025.59,X2?31.01,S1?6.7422
(2)、計算統(tǒng)計量:
將上述數(shù)據(jù)代入公式,得:
Sx1?x21974.230?434.82/10?10025.59?310.102/1011?(?)?3.7217(%)10?10?21010
t?43.48?31.013.7217?3.3506,??10?10-2?18(3)、確定P界作出結(jié)論
本例t>t0.05,18=3.197,Pu0.05,P醫(yī)學(xué)統(tǒng)計學(xué)
(1)兩個或多個樣本均數(shù)間的比較;(2)分析兩個或多個因素的交互作用;(3)回歸方程的假設(shè)檢驗;(4)方差齊性檢驗等。
多個樣本均數(shù)間比較的方差分析應(yīng)用條件為:(1)各樣本必需是相互獨立的隨機樣本;(獨立性)(2)各樣本均來自正態(tài)總體;(正態(tài)性)
(3)相互比較的各樣本所來自的總體其方差相等,(方差齊性)
一、完全隨機設(shè)計的方差分析
醫(yī)學(xué)試驗中,根據(jù)某一試驗因素,用隨機的方法將受試對象分派到各組,各組分別接受不同的處理后,觀測各種處理的效果,比較各組均數(shù)之間有無區(qū)別。
臨床研究中,還可能往往比較幾種不同療法治療某種疾病后某指標(biāo)的變化,以評價它們的療效;或比較某種疾病不同類型之間某一指標(biāo)有無區(qū)別等。
這些都是一個因素不同水平(或狀態(tài))間幾個樣本均數(shù)的比較,可用單因素的方差分析(one-wayANOVA)來處理此類資料。
醫(yī)學(xué)統(tǒng)計學(xué)
例題:某職業(yè)病防治院對31名石棉礦工中的石棉肺患者、可疑患者及非患者進行了用力肺活量(L)測定,結(jié)果見下表:問三組石棉礦工的肺活量有無區(qū)別?表三組石棉礦工的用力肺活量(L)
Xij
合計(?Xij)nj均數(shù)Xj(?X2ij)
石棉肺患者
1.81.41.52.11.91.71.81.91.81.82.019.1111.7935.69
可疑患者
2.32.12.12.12.62.52.32.42.420.892.3148.34
非患者
2.93.22.72.82.73.03.43.03.43.3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025形婚協(xié)議書模板與婚后子女撫養(yǎng)權(quán)約定服務(wù)合同3篇
- 二零二五年度珠寶店大數(shù)據(jù)分析與客戶洞察合作協(xié)議2篇
- 2024版勞動合同變更與補充協(xié)議撰寫服務(wù)合同
- 2025年度牛頭梗犬幼犬寄養(yǎng)及銷售服務(wù)合同3篇
- 2024版電力行業(yè)物資供應(yīng)合同模板
- 2025年度建筑材料國際貿(mào)易合同范本3篇
- 二零二五掛名法人實際控制人合作協(xié)議書(含財務(wù)監(jiān)管)3篇
- 二零二五年度大型活動安全保障方案設(shè)計與實施合同3篇
- 2024年預(yù)付款專項委托擔(dān)保合同模板版B版
- 二零二五年度家庭式托管班合伙人利益共享合同3篇
- 數(shù)字媒體技術(shù)應(yīng)用基礎(chǔ)知識單選題及答案解析
- 面部抗皺培訓(xùn)課件
- 2025年高考?xì)v史復(fù)習(xí)之小題狂練300題(選擇題):世界多極化與經(jīng)濟全球化(20題)
- ISO 56001-2024《創(chuàng)新管理體系-要求》專業(yè)解讀與應(yīng)用實踐指導(dǎo)材料之1:0 引言(雷澤佳編制-2025B0)
- 2024版環(huán)衛(wèi)清潔班車租賃服務(wù)協(xié)議3篇
- 生產(chǎn)安全事故事件管理知識培訓(xùn)課件
- 項目施工單位與當(dāng)?shù)卣按迕竦膮f(xié)調(diào)措施
- 藥劑科工作人員的專業(yè)提升計劃
- 2024-2025學(xué)年度第一學(xué)期二年級語文寒假作業(yè)第二十一天
- 浙江省寧波市寧海縣2023-2024學(xué)年三年級上學(xué)期語文期末試卷
- 貸款用設(shè)備購銷合同范例
評論
0/150
提交評論