醫(yī)學(xué)統(tǒng)計學(xué)基礎(chǔ)

上傳人：E*** IP屬地：廣東上傳時間：2023-04-15 格式：DOCX 頁數(shù)：47 大?。?1.23KB 積分：2.4 舉報 版權(quán)申訴

已閱讀5頁，還剩42頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

本文格式為Word版，下載可任意編輯——醫(yī)學(xué)統(tǒng)計學(xué)基礎(chǔ)醫(yī)學(xué)統(tǒng)計學(xué)

第一講緒論

一、《醫(yī)學(xué)統(tǒng)計學(xué)》的理論基礎(chǔ)和研究對象：

a)問題的提出：

在人們的實踐活動中，往往會遇到類似下面的一些問題：一種新的疫苗，如何判斷它是否有效？吸煙會不會使得肺癌的機遇增加？

如何抽檢幾百或幾千人來估計某種病的流行程度？某批產(chǎn)品中合格品畢竟有多少？該不該報廢？

如何消耗最少的資源和人力來得到我們所需要的某種信息？某種試驗方法（或飼料配方）有沒有明顯改進？患者分組是否具有可比性？

所觀測對象的數(shù)量是否足夠說明其結(jié)論？試驗結(jié)果的誤差有多大？

研究結(jié)果是否適用于觀測樣本以外的同類對象？……等等．其共同特點：只知道事情的不完全信息，或者是單個試驗的結(jié)果有某種不確定性。

例如：為了知道產(chǎn)品合格與否或它的使用壽命，我們往往需要對它作破壞性檢驗，此時顯然不能把所有的產(chǎn)品都檢驗一下，而只能滿足于對少數(shù)幾個作品的抽檢，這樣獲得的信息顯然是不完全的；

要檢驗疫苗的有效性，就一般來說，接種過疫苗的動物也不一定

醫(yī)學(xué)統(tǒng)計學(xué)

全不發(fā)病，而未接種的也不會全發(fā)病．那么發(fā)病與不發(fā)病的區(qū)別畢竟到多大時我們才能認(rèn)為接種是有效的呢？

這些均涉及了我們?nèi)绾卧u價一些并不確定的試驗結(jié)果的問題。要從這類問題中得出科學(xué)的、可靠的結(jié)論，就必需依靠統(tǒng)計學(xué)．有人干脆給統(tǒng)計學(xué)下了這樣的定義：“統(tǒng)計學(xué)就是從不完全的信息里取得確鑿知識的一系列技巧〞。

另外，當(dāng)必需根據(jù)有限的、完全的信息作出決策時（例如決定一

批產(chǎn)品是出廠還是報廢，某種新藥是否有效等等），統(tǒng)計學(xué)可以提供一種方法，使我們不僅能做出合理的決策，而且知道所冒風(fēng)險的大小，并幫助我們把可能的損失減至最小。

其次，如何花費最小代價取得所關(guān)心的信息，也是統(tǒng)計學(xué)的一大課題（實險設(shè)計）．不注意這一點可能使辛辛苦苦的工作全成為一種浪費．

2．理論基礎(chǔ)：“根據(jù)數(shù)理統(tǒng)計的原理、方法緊湊結(jié)合醫(yī)學(xué)實踐，研究醫(yī)藥衛(wèi)生領(lǐng)域中的資料收集、整理、分析和推斷的一門應(yīng)用學(xué)科，來分析和解釋生物界各種現(xiàn)象和試驗調(diào)查資料的科學(xué)〞。隨著生物醫(yī)學(xué)研究的不斷發(fā)展，運用統(tǒng)計學(xué)方法來認(rèn)識、推斷和解釋生命過程中的各種現(xiàn)象也越來越廣泛。運用統(tǒng)計學(xué)方法可以幫助人們分析占有信息，達到去偽存真，去粗取精，正確認(rèn)識世界的目的。

3．研究對象：人體及與人體健康有關(guān)的各種具有不確定性的醫(yī)學(xué)數(shù)據(jù)（變異、數(shù)量、同質(zhì)）。

醫(yī)學(xué)統(tǒng)計學(xué)

二、《醫(yī)學(xué)統(tǒng)計學(xué)》的主要任務(wù)和作用：

任務(wù)：1、結(jié)合專業(yè)知識和具體研究的要求進行統(tǒng)計設(shè)計2、對收集資料進行整理、做統(tǒng)計描述3、對資料進行統(tǒng)計分析和解釋

作用：1、保證調(diào)查或試驗設(shè)計的科學(xué)性、完整性

2、指標(biāo)的確定應(yīng)具有特異性、客觀性，靈敏性和縝密度高3、樣本含量足夠大，數(shù)據(jù)真實可靠4、選用統(tǒng)計分析方法正確

三、醫(yī)學(xué)統(tǒng)計學(xué)的主要內(nèi)容：

1、統(tǒng)計設(shè)計（design）在進行統(tǒng)計工作和研究之前必需有一個周密的設(shè)計，設(shè)計的內(nèi)容包括資料收集、整理和分析全過程總的設(shè)想和安排。

統(tǒng)計設(shè)計可依照在研究過程中對研究對象是否進行干預(yù)分作調(diào)查研究設(shè)計和試驗研究設(shè)計。

調(diào)查研究設(shè)計：研究者旨在客觀地描述研究總體，未加任何干預(yù)措施，如：調(diào)查了解某地的學(xué)齡兒童缺鐵性貧血的患病率，某地新生兒畸形的發(fā)生率，北京地區(qū)潰瘍病患病率等，其目的在于了解某一醫(yī)學(xué)現(xiàn)象的實際狀況，疾病的危害程度，以便為防治和研究這些疾病提供依據(jù)。調(diào)查設(shè)計主要有抽樣方法、調(diào)查技術(shù)、質(zhì)量控制技術(shù)等。

試驗研究設(shè)計：研究者根據(jù)目的（研究假設(shè)），主動加以干預(yù)措施，并觀測總結(jié)其結(jié)果，回復(fù)研究假設(shè)所提出的問題。

醫(yī)學(xué)統(tǒng)計學(xué)

如：研究脂健乳是否有降脂作用，首先假設(shè)脂健乳可以降低血脂，再將條件相像的20只大鼠先用高脂飼料喂養(yǎng)做成高脂血癥的模型，然后將動物隨機分為試驗組和對照組，試驗組服用脂健乳和豆奶，對照組單純服用豆奶，喂養(yǎng)一個月后觀測比較兩組之間各項血脂指標(biāo)的區(qū)別有無統(tǒng)計學(xué)意義，進而得出脂健乳是否具有降低血脂的保健作用的結(jié)論。

試驗設(shè)計主要有各種試驗設(shè)計模型、分組方法、樣本量估計等。由于統(tǒng)計設(shè)計的質(zhì)量直接影響著試驗結(jié)果的確鑿性、可靠性、嚴(yán)密性和代表性，一旦出現(xiàn)設(shè)計上的失誤或缺陷，可能導(dǎo)致整個研究的失敗。因此，專業(yè)設(shè)計是研究者對專業(yè)知識的把握能力，直接影響著試驗的深度和水平，而統(tǒng)計設(shè)計是研究者對醫(yī)學(xué)統(tǒng)計知識的正確運用，以保證統(tǒng)計描述和推斷正確的基礎(chǔ)。

調(diào)查設(shè)計與試驗研究設(shè)計

專業(yè)設(shè)計

運用專業(yè)知識進行設(shè)計

要求內(nèi)容方向目的

統(tǒng)計設(shè)計運用統(tǒng)計學(xué)知識進行設(shè)計

選題、調(diào)查（試驗）、方法、材料確定設(shè)計方案、收集整理資料、確定

統(tǒng)計指標(biāo)、分析和推斷方法探討試驗、觀測結(jié)果的適用性和創(chuàng)探討試驗、觀測結(jié)果的可重復(fù)性、高造性效性回復(fù)和解決科研課題，驗證假說，減少和控制誤差。保證樣本的代表性保證科研結(jié)果的先進性和可靠性，保證明驗結(jié)果的確切性和

可重復(fù)性

2、收集資料（collectionofdata）方式：1、統(tǒng)計報表2、經(jīng)常性工作記錄3、專題調(diào)查或試驗

醫(yī)學(xué)統(tǒng)計學(xué)

3、整理資料（sortingdata）將原始數(shù)據(jù)進行核對、整理，使其系統(tǒng)化、條理化，對數(shù)據(jù)進行規(guī)律檢查，改正錯誤，提供整理和描述數(shù)據(jù)資料的科學(xué)方法，確定數(shù)據(jù)的數(shù)量特征。

4、分析資料（analysisofdata）根據(jù)不同的資料類型，選擇不同的統(tǒng)計處理方法，計算有關(guān)指標(biāo)，反映數(shù)據(jù)的綜合特征，說明事物的內(nèi)在聯(lián)系和規(guī)律。統(tǒng)計分析包括：

①統(tǒng)計描述（descriptivestatistics）:用統(tǒng)計指標(biāo)、統(tǒng)計表、統(tǒng)計圖等方法，對資料的數(shù)量特征及分布規(guī)律進行測定和描述。

②統(tǒng)計推斷（inferentialstatistics）:包括如何抽樣，以及如何在隨機變量的樣本值基礎(chǔ)上推斷概率分布和總體值。統(tǒng)計推斷中涉及的各種統(tǒng)計分析方法是本次授課的重點內(nèi)容。

四、醫(yī)學(xué)統(tǒng)計學(xué)在科研中的作用：

1、系統(tǒng)積累和表達經(jīng)驗

臨床經(jīng)驗的積累在于大量的臨床實踐。實際上這些經(jīng)驗都可以整理和表達為統(tǒng)計信息，把握了一定的統(tǒng)計學(xué)知識，就可以將積累的經(jīng)驗，通過對資料的收集、整理和分析，轉(zhuǎn)變?yōu)檎?guī)和系統(tǒng)的統(tǒng)計信息，用以報告或發(fā)表，使人類醫(yī)學(xué)知識寶庫不斷充實和發(fā)展。

醫(yī)學(xué)統(tǒng)計學(xué)

2、完成科研工作

生物學(xué)是一門試驗科學(xué)，不管你從事的是生物學(xué)的哪一個分支，都不可能完全脫離試驗，只進行規(guī)律推理．而試驗所得到的結(jié)果幾乎無例外地都帶有或多或少的不確定性，即試驗誤差．在這種狀況下，不用統(tǒng)計學(xué)要想得到正確的結(jié)論是不可能的，可以毫不夸誕地說，作為一個試驗科學(xué)工，離開了統(tǒng)計學(xué)就寸步難行，希望通過這門課程的學(xué)習(xí)，能夠把握常用的統(tǒng)計方法，特別是它們的條件，適用范圍、優(yōu)缺點等，從而能夠應(yīng)用它們?nèi)ソ鉀Q實踐中遇到的問題。否則，他將無法知道其研究結(jié)果是否具有科學(xué)意義上的可重復(fù)性。要一一回復(fù)這些問題，要求研究者必需在整個研究過程中貫穿和運用統(tǒng)計學(xué)的理論和方法。

3、撰寫研究報告和閱讀書刊

醫(yī)學(xué)研究中往往要涉及大量的數(shù)據(jù)，但在撰寫研究報告和論文時，只能使用經(jīng)過整理和歸納的統(tǒng)計指標(biāo)，并且用規(guī)范的統(tǒng)計表和統(tǒng)計圖表達。此外，在閱讀國外期刊時，假使不具備統(tǒng)計學(xué)的基礎(chǔ)知識，則不能判斷別人研究結(jié)果的可信性和局限性，更談不上吸收和借鑒。

五、《醫(yī)學(xué)統(tǒng)計學(xué)》中幾個重要的基本概念：

(1)總體(population)、樣本(sample)、個體（observedunit）

a.總體：根據(jù)研究目的所確定的性質(zhì)一致的所有個體的某種

變量值的集合。如：調(diào)查某地1999年正常成年男子的紅細(xì)胞數(shù)，則

觀測對象：該地1999年正常成年男子。

觀測單位：統(tǒng)計研究中的最基本單位，如：一個人、一個家庭、

醫(yī)學(xué)統(tǒng)計學(xué)

一個地區(qū)等。

觀測值（變量值）：每個人測得的紅細(xì)胞數(shù)。

該地1999年正常成年男子的紅細(xì)胞數(shù)就構(gòu)成一個總體。同質(zhì)基礎(chǔ)：同一地區(qū)、同一年份、同為正常成人、同為男性有限總體（finitepopulation）:有確定的時間、空間和有限個觀測單位，如上例。

無限總體（infinitepopulation）：沒有確定的時間和空間限制，觀測單位數(shù)為無限。如研究用某藥治療缺鐵性貧血的療效，此時，總體的同質(zhì)基礎(chǔ)是貧血患者，同時用某藥治療，該總體應(yīng)包括用該藥治療的所有貧血患者的治療結(jié)果。

b.樣本:從總體中隨機抽取部分個體所組成的集合。

（隨機化原則：總體中每一個觀測單位均有同等機遇被抽?。?/p>

（2）參數(shù)（parameter）、統(tǒng)計量(statistics)

統(tǒng)計學(xué)中把總體的指標(biāo)稱為參數(shù)，把所得樣本的平均數(shù)稱為統(tǒng)計量。

（3）誤差（error）：

抽樣誤差（samplingerror）由于總體中的個體間往往存在著變異，隨機抽取的樣本僅是總體中的一部分個體，因而樣本測得的指標(biāo)（統(tǒng)計量）往往與總體指標(biāo)（參數(shù)）存在著差異，這種由于隨機抽樣而造成的樣本的統(tǒng)計量與總體參數(shù)之間的差異，稱為抽樣誤差，它既不定量，也不定性。

系統(tǒng)誤差:由于設(shè)計不嚴(yán)，測量儀器不確鑿，測量者水平的偏差而造成的，這種誤差是定量的，可控的。

醫(yī)學(xué)統(tǒng)計學(xué)

（4）統(tǒng)計資料

對每個觀測單位的某項特征進行測量和觀測，其特征稱為變量，對變量的測值稱為變量值，亦稱為資料。

計量資料（quantitativedata）

統(tǒng)計資料類型計數(shù)資料(qualitativedata)

等級資料(rankeddat)

①、定量資料(quantitativedata)又稱為計量資料:

用專業(yè)儀器測量，具有計量單位的測量數(shù)據(jù)，表現(xiàn)為數(shù)值的大小，如身高（cm）、體重（kg）、血壓（kPa）等。特點：每個觀測單位的觀測值間有量的區(qū)別

②、定性資料(qualitativedata):其觀測值是定性的，表現(xiàn)為互不相容的類別或?qū)傩裕磳⒂^測單位按某種屬性或類別分組，所得各組的觀測單位數(shù)）。

特點：每個觀測單位的觀測值間有質(zhì)的區(qū)別分兩種狀況：

1、無序分類（unorderedcategories）又稱為計數(shù)資料

a.二項分類檢驗結(jié)果可以是陽性或陰性、治療結(jié)果可以是治愈或未愈、性別屬性等，表現(xiàn)為兩類間相互對立。

b.多項分類某種觀測結(jié)果為互不相容的多個類別，如血型、職業(yè)等。

2、有序分類（ordinalcategories）又稱為等級資料

介于定量測量和定性觀測之間的半定量觀測結(jié)果，如測定某人

醫(yī)學(xué)統(tǒng)計學(xué)

群血清反應(yīng)，以人為觀測單位，結(jié)果分為—、±、+、++四級，又如觀測以某種藥治療某病患者的治療結(jié)果，以每個患者為觀測單位，結(jié)果分為治愈、顯效、好轉(zhuǎn)、無效四級，尋常有兩個以上等級。

等級資料與計數(shù)資料的區(qū)別在于，等級資料雖然是多分類資料，但各個類別存在著大小和程度上的區(qū)別。特點：各類之間有程度的區(qū)別

資料的轉(zhuǎn)化和分析：根據(jù)分析問題的需要，各類變量可以相互轉(zhuǎn)化。如：觀測某人群成年男子的血紅蛋白量（g/L）,屬數(shù)值變量；

若分析比較某種病人的血紅蛋白水平與正常人有無區(qū)別，須按計量資料進行處理。

序號

123456789

正常人組

病人組

若按血紅蛋白正常與偏低分為兩類，可按二項分類資料處理；

正常偏低合計

正常人組

病人組

若按貧血的診斷標(biāo)準(zhǔn)將血紅蛋白含量分為五個等級：重度貧血、中度貧血、輕度貧血、正常、血紅蛋白增高，可按等級資料處理。

醫(yī)學(xué)統(tǒng)計學(xué)

重度貧血中度貧血輕度貧血正常血紅蛋白增高

合計正常人組

病人組

（5）頻率(frequency)、概率（probability）

醫(yī)學(xué)研究的大多數(shù)現(xiàn)象是隨機現(xiàn)象，例如用同一種治療方法治療某病的一群患者，可以知道治療的結(jié)果有四種，但對于一個病人其治療后的結(jié)果是不確定的，此時的每一種可能發(fā)生的結(jié)果都是一個隨機事件（偶然事件、事件）。

定義：在n次隨機試驗中，隨機事件A發(fā)生了k次，記fn?k??,則稱fn?k?為隨機事件A在n次試驗中出現(xiàn)的頻率。

實踐證明，大量的試驗中隨機事件會浮現(xiàn)出頻率穩(wěn)定性。定義：描述隨機事件A發(fā)生可能性大小的數(shù)值，稱為A的概率，記作P（A），簡記為P。假使臨床觀測中治療200病人的樣本，求得治愈率為75%，這只是一個頻率。實際應(yīng)用中，當(dāng)概率不易求得時，常用n→∞時的頻率作為概率的估計值。但當(dāng)n較少時，頻率的波動性是很大的，用于估計概率是不可靠的。

隨機事件概率的大小在0與1之間。

P值越接近1，表示某事件發(fā)生的可能性越大；P值越接近0，表示某事件發(fā)生的可能性越小。

嚴(yán)格說，P=1表示事件必然發(fā)生，P=0表示事件不可能發(fā)生，他

醫(yī)學(xué)統(tǒng)計學(xué)

們是確定性的，不是隨機事件，但可把他們看成隨機事件的特例。

統(tǒng)計分析中的好多結(jié)論都是帶有概率性的。習(xí)慣上將P≤0.05稱為小概率事件，表示在一次試驗或觀測中該事件發(fā)生的可能性很小，可以視為很可能不發(fā)生?！夺t(yī)學(xué)統(tǒng)計學(xué)》的學(xué)習(xí)重點是：

1、把握其基本知識、基本技能、基本概念、基本方法。建立規(guī)律思維方法和提高分析問題的能力。2、把握調(diào)查設(shè)計和試驗設(shè)計的基本原則。

培養(yǎng)收集、整理、分析統(tǒng)計資料的系統(tǒng)工作能力。3、把握一套統(tǒng)計軟件的使用方法（SAS、SPSS、STATA等）。能夠達到在完成《醫(yī)學(xué)統(tǒng)計學(xué)》課程后，獨立完成科研論

文和正確應(yīng)用統(tǒng)計方法。

醫(yī)學(xué)統(tǒng)計學(xué)

其次講集中趨勢

舉例

設(shè)有A、B兩名新戰(zhàn)士，他們的射擊技術(shù)可用下面的分布來表示：戰(zhàn)士A戰(zhàn)士B擊中環(huán)數(shù)8910擊中環(huán)數(shù)8910對應(yīng)概率0.30.10.6對應(yīng)概率0.20.50.3問哪一個戰(zhàn)士射擊技術(shù)較好？1、頻數(shù)分布表1）、頻數(shù)表的編制

一致觀測結(jié)果出現(xiàn)的次數(shù)稱為頻數(shù)。將所有觀測結(jié)果的頻數(shù)按一定順序排列在一起便是頻數(shù)表(frequencytable)。步驟：

①找出最大和最小值，計算極差R=Xmax―Xmin②根據(jù)斯梯階公式確定組距

H?R1?3.322logn

③掃描樣本值，劃記后獲得頻數(shù)

2）、頻數(shù)表的用途

①大樣本數(shù)據(jù)（不限于計量資料）常用的表達方式。

②便于觀測數(shù)據(jù)的分布類型。

③便于發(fā)現(xiàn)資料中遠(yuǎn)離群體的某些特大或特小的可疑值，必要時經(jīng)檢驗后舍去。

④當(dāng)樣本含量足夠大時，各組段的分布頻率作為分布概率的估計值。

例7．我國某地農(nóng)村1995年已婚育齡婦女現(xiàn)有子女?dāng)?shù)的分布子女?dāng)?shù)（1）0123456789≥10合計

婦女?dāng)?shù)f（2）13751251913042628560217191369572553268151373156145525頻率（%）（3）9.4517.3020.9119.6214.929.414.982.250.100.260.11100.00累計頻數(shù)（4）13751389226934897908119627133322140577143845144996145369145525——累計頻率（%）（5）9.4526.7547.6567.2882.2091.6196.6098.8599.6499.89100.00——醫(yī)學(xué)統(tǒng)計學(xué)

2、集中位置的描述

平均數(shù)(average)是統(tǒng)計中最廣泛、最重要的一個指標(biāo)體系。用來描述一組變量的集中趨勢、中心位置或平均水平，常作為一組資料的代表值，使資料產(chǎn)生簡明概括的印象，又便于組間的比較。常用平均數(shù)有均數(shù)、幾何均數(shù)和中位數(shù)。（一）、均數(shù)（mean）的計算

x?x2?x3...?xnx?1?n①直接法

?xin

例1、10名7歲男童體重（kg）分別為17.3,18.0,19.4,20.6,21.2,21.8,22.5,23.2,

24.0,25.5.求平均體重。

x=（17.3+18.0+19.4+20.6+21.2+21.8+22.5+23.2+24.0+25.5）/10=21.35(kg)

②頻數(shù)表法：

x?f1x1?f2X2?f3x3??fkxk???fxf?f

例2：某地隨機檢查了140名成年男性紅細(xì)胞數(shù)(1012/L)

4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.714.444.945.054.784.524.635.515.244.984.334.834.565.444.794.914.264.384.874.995.604.464.955.074.805.304.654.774.505.375.495.224.585.074.814.543.824.014.894.625.124.854.595.084.824.935.054.404.145.014.375.244.604.714.824.945.054.794.524.644.374.874.604.724.835.334.684.804.154.654.764.884.613.974.084.584.314.054.165.045.154.504.624.734.474.584.704.814.554.284.784.514.634.364.484.595.095.205.325.054.414.524.644.754.494.224.715.214.944.685.174.915.024.76

醫(yī)學(xué)統(tǒng)計學(xué)

紅細(xì)胞數(shù)(1012/L)（1）3.80~4.00~4.20~4.40~4.60~4.80~5.00~5.20~5.40~5.60~5.80~

合計頻數(shù)f(2)

261125322717134

140（∑f）

組中值X（3）

3.904.104.304.504.704.905.105.305.505.705.90

Fx(4)=(2)*(3)7.8

24.647.3112.5150.4132.386.768.922.011.45.9

669.8（∑fX）

fx?f2X2?f3x3??fkxkx?11?f?

=4.78(1012/L)

均數(shù)的兩個重要特征：

①各離均差的總和等于零

?fx?f

?(x-x)?0

證明：

?(xi?x)??xi?nx??xi??xi?0

??②各離均差的平方和小于各觀測值X與任何數(shù)a之差的平方

?(x-x)??(x-a)22

均數(shù)的應(yīng)用：

1.用來描述一組變量值的平均水平，具有代表性，因此變量值必需是同質(zhì)的。2.適用于呈正態(tài)分布（對稱分布）的資料。

醫(yī)學(xué)統(tǒng)計學(xué)

（2）幾何均數(shù)（geometricmean）的計算1)直接法

G?nx1?x2?x3???xnlgxlgx1?lgx2????lgxn)?lg?1(?)nn

例3：5人的血清滴度為：1：2，1：4，1：8，1：16，1：32，求平均滴度。

G?lg?1(G?n2?4?8?16?32

LgG=(lg2+lg4+lg8+lg16+lg32)/5=0.903

G=lg-10.903=8故平均滴度為1：8。

2)頻數(shù)表法

G?lg?1(?

例4：40名麻疹疫苗接種麻疹疫苗后一個月，血凝抑制抗體滴度見下表，求平均滴度。抗體滴度人數(shù)f滴度倒數(shù)XLgXf*lgX（1）(2)（3）(4)(5)=(2)*(4)1：4140.60210.60211：8580.90314.51551：166161.20417.22461：322321.50513.01021：647641.806212.64341：128101282.107221.07201：25642562.40829.63281：51255122.709313.54654072.2471LgG=(?flgX/?f)=72.2471/40=1.8062G=lg-11.8062=64血凝抑制抗體滴度的平均滴度為1：64

幾何均數(shù)的應(yīng)用：用于等比級數(shù)資料和對數(shù)正態(tài)分布資料，

如：某些傳染病的潛伏期、抗體滴度、細(xì)菌計數(shù)等。

flgx)?f

醫(yī)學(xué)統(tǒng)計學(xué)

（3）、中位數(shù)和百分位數(shù)的計算

中位數(shù)（median,M）是將一組觀測值從小到大按順序排列，位次居中的數(shù)值對應(yīng)的觀測值就是中位數(shù)。因而全部觀測值中，大于和小于中位數(shù)的觀測值的個數(shù)相等。

1)直接法：將原始觀測值按大小順序排列：

M?Xn為奇數(shù)時，

(n?1)2

??X?X?(n)?n(?1)22?n為偶數(shù)時，M??2例5．測得5個人的低密度脂蛋白中載體B蛋白的含量(mg/dl)分別為0.84,2.58,5.46,8.58,9.60,求其中位數(shù).

M?X

=X3=5.46mg/dl

例6.8名新生兒的身長（cm）依此為50，51，52，53，54，54，55，58，求其中位數(shù)。

??X?X?(n)?n(?1)22??53?54?53.5M??22(n?1)22）頻數(shù)表法

Px?L?i(n?x%??fL)fx

醫(yī)學(xué)統(tǒng)計學(xué)

例7．對某地630名50歲~60歲的正常女性檢查了血清甘油三脂含量,并制成如

下頻數(shù)表，試求中位數(shù)及第25、75、90百分位數(shù)。

甘油三脂mg/dl頻數(shù)，f累計頻數(shù)累計頻率（%）

（1）（2）（3）（4）10~27274.340~16919631.170~16736357.6100~9445772.5130~8153885.4160~4258092.1190~2860896.5220~1462298.7250~462699.4280~362999.8310~1630100.0合計630

630?0.5?196m?70??30?91.4(mg/dl)

167

630?0.25?27p25?40??30?63.2(mg/dl)

169

630?0.75?457p75?130??30?135.7(mg/dl)

630?0.90?538p90?160??30?180.7(mg/dl)

醫(yī)學(xué)統(tǒng)計學(xué)

例8．某日大氣中SO2的日平均濃度（ug/m3）見下表，分別求第25、75、95

百分位數(shù)及中位數(shù)。濃度（ug/m3）天數(shù)，f累計頻數(shù)累計頻率（%）（1）（2）（3）（4）5~393910.850~6710629.475~6417047.1100~6323364.5125~4527877.0150~3030885.3175~1732590.0200~933492.5225~734194.5634796.1275~535297.5300~335598.3325~6361100.0361Px?l?i(n?x%??fl)fx

25(361?25%?39)?69.12(?g/m3)6725P75?125?(361?75%?233)?145.97(?g/m3)4525P95?250?(361?95%?341)?258.12(?g/m3)625P50?100?(361/2?170)?104.17(?g/m3)63

中位數(shù)和百分位數(shù)的應(yīng)用：

1．用于描述偏態(tài)分布資料的集中位置。反映位次居中的觀測值的水平。2．百分位數(shù)是用于描述樣本或總體觀測值序列在某百分位置水平，最常用的百分位數(shù)是中位數(shù)。

3．百分位數(shù)常用來確定醫(yī)學(xué)參考值范圍。

P25?50?醫(yī)學(xué)統(tǒng)計學(xué)第三講離散趨勢離散程度的描述

三組同性別、同年齡兒童的體重（kg）如下，分析其集中趨勢與離散趨勢。甲組2628303234X甲=30kgR=8S=3.16已組2427303336X乙=30kgR=12S=4.74丙組2629303134X丙=30kgR=8S=2.91哪一組數(shù)值的代表性好？（1）極差（range）

一組觀測值中，最大值與最小值差，反映個體差異的范圍。極差大，說明變異度大，各變量值離均數(shù)越遠(yuǎn)，數(shù)據(jù)越分散；反之亦然。（2）四分位數(shù)（quartile）間距

可看成是特定的百分位數(shù)，用它說明個體差異比極差穩(wěn)定。

Q=P75–P25

一般來說，樣本例數(shù)越多，四分位間距越穩(wěn)定。（3）方差（variance）與標(biāo)準(zhǔn)差的計算方差：σ2=?(x??)2/N

2(x?x)?s2?

n?1

由上式可知：方差考慮了總體中每個變量值X與總體均數(shù)之差(x??)，稱為離均差平方和（SS），因此方差近似等于離均差平方和的算數(shù)均數(shù)，故又稱為均方差（MS），由于SS利用了每一個觀測值的信息，因而反映一批數(shù)據(jù)的變異程度優(yōu)于極差和四分位間距。

（4）標(biāo)準(zhǔn)差（standarddeviation）

方差開方后稱為標(biāo)準(zhǔn)差，其單位與變量值單位及均數(shù)單位一致，變異度越大，則離均差平方和越大，標(biāo)準(zhǔn)差越大，說明個體差異越大，均數(shù)的代表性越差。為了簡化計算，標(biāo)準(zhǔn)差的計算公式還可寫為：

(?x)2?x?nS?n?1

2醫(yī)學(xué)統(tǒng)計學(xué)

分組資料的計算：

S??fx2?(?fx)2n

n?1如上例：n=110∑fx2=1584990∑fx=13194

S??fx2?(?fx)2n?

1584990?131942/110?4.72cm110?1n?1

（5）變異系數(shù)（cofficientofvariation,CV）定義:標(biāo)準(zhǔn)差與算術(shù)均數(shù)之比，cv?sx??100%

其描述了相對于算術(shù)均數(shù)而言標(biāo)準(zhǔn)差的大小，即描述數(shù)據(jù)的變異相對于其平均水平來說是大還是小。

與前面介紹的四種離散程度指標(biāo)相比，變異系數(shù)有以下兩個不同之處：1：它描述的不是數(shù)據(jù)分布的絕對離散程度，而是相對離散程度；2：它不象極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差那樣具有取值單位。這兩個特點決定了變異系數(shù)的應(yīng)用也不同于前面四個離散程度指標(biāo)。它常用于：

1、比較度量衡單位不同的多組資料的變異度：

例如：某地20歲男子100人，其身高均數(shù)為166.06cm，標(biāo)準(zhǔn)差為4.95cm；其體重均數(shù)為53.72kg，標(biāo)準(zhǔn)差為4.96kg.欲比較身高與體重的變異何者為大，由于度量單位不同，不能比較其標(biāo)準(zhǔn)差而應(yīng)比較其變異系數(shù)身高cv?體重cv?4.95cm?100%?2.98%

166.06cm4.96kg?100%?9.23%

53.72kg由此可見，該地20歲男子體重的變異大于身高的變異。

醫(yī)學(xué)統(tǒng)計學(xué)

2.比較均數(shù)相差懸殊的多組資料的變異度：某地不同年齡組男子身高的變異程度

年齡組3－3.5歲30－35歲

表中可見，雖然30～35歲組的標(biāo)準(zhǔn)差明顯大于3～3.5歲組的標(biāo)準(zhǔn)差，但事實上30～35歲組男子身高的變異并不大，而3～3．5歲組男童身高的變異卻很大。這種均數(shù)相差懸殊的資料比較變異程度時，應(yīng)當(dāng)用變異系數(shù)說明其變異狀況。

小結(jié)

為了解數(shù)值變量的分布規(guī)律，可將觀測值編制頻數(shù)表，繪制頻數(shù)分布圖，用于描述資料的分布特征（集中趨勢和離散趨勢），以及分布類型（對稱分布和偏態(tài)分布）。一．

平均數(shù)是描述頻數(shù)分布集中位置的指標(biāo)，它代表一組觀測值的平均水平，

人數(shù)100100

均數(shù)±標(biāo)準(zhǔn)差變異系數(shù)（％）90.1±3.1170.2±5.0

3.20.3

常用平均數(shù)的指標(biāo)下表：平均數(shù)均數(shù)幾何均數(shù)中位數(shù)意義平均數(shù)量水平平均增（減）倍數(shù)位次居中的觀測值水平應(yīng)用場合應(yīng)用甚廣，最適用于對稱分布，特別是正態(tài)分布等比級數(shù)資料，對數(shù)正態(tài)分布偏態(tài)分布，分布不明，分布末端無確定值百分位數(shù)描述觀測序列在某百分位置的水平，是分布的百分界值，可用于醫(yī)學(xué)參考值范圍，適用于任何分布。

二、描述頻數(shù)分布離散程度的指標(biāo)有：

1）極差與四分位間距，后者較穩(wěn)定，但均不能綜合反映各觀測值的變異程度；2）方差和標(biāo)準(zhǔn)差，最為常用，對正態(tài)分布尤為重要；

3）變異系數(shù)常用于：不同測量單位的幾組資料變異度的比較；均數(shù)相差懸殊

的幾組資料變異度的比較。

醫(yī)學(xué)統(tǒng)計學(xué)

第四講正態(tài)分布及其應(yīng)用

一、正態(tài)分布的概念和特征

根據(jù)頻數(shù)表資料繪制成直方圖，可以設(shè)想，假使將觀測人數(shù)逐漸增多，線段不斷分細(xì)，圖中直條將逐漸變窄，其頂端將逐漸接近一條光滑的曲線，這條曲線稱為頻數(shù)曲線或頻率曲線，略呈鐘型，兩頭低，中間高，左右對稱，近似于數(shù)學(xué)上的正態(tài)分布（normaldistribution）。由于頻率的總和等于100%或1，故橫軸上曲線下的面積等于100%或1。

正態(tài)分布是一種橫重要的連續(xù)型分布，在生物統(tǒng)計學(xué)中，占有極其重要的地位。大量生物學(xué)現(xiàn)象所產(chǎn)生的數(shù)據(jù)，都聽從正態(tài)分布。

1、正態(tài)分布的圖形有了正態(tài)分布的密度函數(shù)f(X)，即正態(tài)分布的方程，就可給出圖形

f(x)

醫(yī)學(xué)統(tǒng)計學(xué)

上式中右側(cè)?為均數(shù)，?為標(biāo)準(zhǔn)差，X為自變量。當(dāng)X確定后，就可由此式求得其密度函數(shù)f(X),也就是相應(yīng)的縱坐標(biāo)的高度。所以，已知?和?,就能繪出正態(tài)曲線的圖形。2、正態(tài)分布的特征

（1）正態(tài)分布以?為中心，左右對稱。

（2）正態(tài)分布有兩個參數(shù)，即?和?。?是位置參數(shù)，當(dāng)?恒定后，

?越大，則曲線沿橫軸越向右移動；?越小，則曲線沿橫軸越向左移動。?是變異參數(shù)，當(dāng)?恒定時，?越大，表示數(shù)據(jù)越分散，曲線越“胖〞；?越小，表示數(shù)據(jù)越分散，曲線越“瘦〞。（3）正態(tài)分布的偏斜度?1=0，峭度?2=0

為了應(yīng)用便利，常將上式作如下變換，

u?X???

也就是將原點移到?的位置，使橫軸尺度以?為單位，使?=0，?=1，則正態(tài)分布變換為標(biāo)準(zhǔn)正態(tài)分布。(standardnormaldistribution)，u稱為標(biāo)準(zhǔn)正態(tài)離差（standardnormaldeviate）標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)為：

?(u)?1e2??u22

一般用N（?，?2）表示均方為?，方差為?2的正態(tài)分布。于是標(biāo)準(zhǔn)正態(tài)分布用N（0，1）表示。

醫(yī)學(xué)統(tǒng)計學(xué)

標(biāo)準(zhǔn)正態(tài)分布有以下特征：

（1）在u=0時，?（u）達到最大值。

（2）當(dāng)u無論向哪個方向遠(yuǎn)離0時，?（u）的值都減小。（3）曲線關(guān)于Y軸對稱，即?（u）=?（-u）。（4）曲線和橫軸所夾的面積等于1。

二、標(biāo)準(zhǔn)正態(tài)曲線下面積的計算P(u1161cm的概率；(3)X在152~162cm間的概率。（1）依題意：

161?156.2P(X?161)??()??(1)?0.841344.82

所以，“三尺三〞的株高低于161cm的概率為0.84134。

（2）依題意得：

164?156.2P(X?164)??()?1??(1.62)?1?0.94738?0.052624.82

（3）依題意得：

162?156.2152?156.2)P(152?X?162)??()??(??(1.2)??(?0.87)?0.88493?0.19215?0.692784.824.82

醫(yī)學(xué)統(tǒng)計學(xué)

以下一些值很重要，應(yīng)予記憶：

u=-1到u=1面積=0.6827u=-1.96到u=1.96面積=0.9500u=-2.58到u=2.58面積=0.9900三、小結(jié)

1、正態(tài)分布是一種連續(xù)性的分布，不少醫(yī)學(xué)現(xiàn)象聽從正態(tài)分布或近似正態(tài)分布（宛如性別、同年齡兒童的身高，同性別健康成人的紅細(xì)胞數(shù)、血紅蛋白量、脈搏數(shù)等，以及試驗中的隨機誤差等）；或經(jīng)變量變換轉(zhuǎn)換為正態(tài)分布（如某些病人的潛伏期以及醫(yī)院病人住院天數(shù)等），可按正態(tài)分布規(guī)律來處理，它也是大量統(tǒng)計方法的理論基礎(chǔ)。

2、正態(tài)分布的特征是：

（1）曲線在橫軸上方，均數(shù)處最高；（2）以均數(shù)為中心，左右對稱；

（3）確定正態(tài)分布的兩個參數(shù)是均數(shù)?和標(biāo)準(zhǔn)差?。

正態(tài)分布用N（?，?2）表示，為了應(yīng)用的便利，常對變量x作u=(x-?)/?使?=0，?=1，則正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布用N（0，1）表示。

3、運用正態(tài)曲線下面積的分布規(guī)律，可計算醫(yī)學(xué)參考值范圍和質(zhì)量控制等。

醫(yī)學(xué)統(tǒng)計學(xué)

第四講：總體均數(shù)的估計和假設(shè)檢驗醫(yī)學(xué)統(tǒng)計學(xué)的最基本問題是研究總體與樣本的關(guān)系。總體與樣本的關(guān)系，可從兩方面研究：

（1）由已知的總體，研究樣本的分布規(guī)律，即由總體到樣本的

研究過程；

（2）由樣本如何去推斷未知的總體，屬于從樣本到總體的研究

過程。

1、從一個正態(tài)總體中抽取的樣本統(tǒng)計量分布

生物學(xué)中遇到最多的是正態(tài)總體。對于正態(tài)總體，可以用數(shù)學(xué)推演的方法，得出嚴(yán)格的樣本統(tǒng)計量的抽樣分布，有了嚴(yán)格的樣本分布規(guī)律，就可以由樣本來推斷總體了。標(biāo)準(zhǔn)差已知時的樣本平均數(shù)的分布——u分布

平均數(shù)為?，標(biāo)準(zhǔn)差為?的正態(tài)總體中，獨立隨機的抽取含量為n的樣本，則：

?x???x??n

樣本平均數(shù)是一聽從正態(tài)分布的隨機變量，記為X。將平均數(shù)標(biāo)準(zhǔn)化，則：

u?x???n

其中的分母稱為平均數(shù)的標(biāo)準(zhǔn)誤差（standarderrorofmean）。假使變量是正態(tài)的或近似正態(tài)的，則標(biāo)準(zhǔn)化的變量聽從或近似地聽從N（0，1）分布。

醫(yī)學(xué)統(tǒng)計學(xué)

1、標(biāo)準(zhǔn)差已知時的樣本平均數(shù)的分布——t分布(t-distribution)若上式中的?是未知的，可用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差，標(biāo)準(zhǔn)化變量并不聽從正態(tài)分布，而聽從具有n-1自由度的t分布。

t?x??Sn

t分布也是一種對稱分布，它只有一個參數(shù)，即自由度（degreeoffreedom）t分布與標(biāo)準(zhǔn)正態(tài)分布相比有以下特征：（1）二者都是單峰分布，以0為中心，左右兩側(cè)對稱。

（2）t分布的峰部較矮而尾部翹得較高，說明遠(yuǎn)側(cè)t值的個數(shù)相對較多，即尾部面積（概率P）較大。

自由度越小這種狀況越明顯。?逐漸增大時，t分布逐漸迫近標(biāo)準(zhǔn)正態(tài)分布；當(dāng)?=?時，t分布就完全成為標(biāo)準(zhǔn)正態(tài)分布了。2、統(tǒng)計推斷

統(tǒng)計推斷是探討如何通過樣本去推斷總體。由樣本推斷總體是以各種樣本統(tǒng)計量的抽樣分布為基礎(chǔ)的。對總體做統(tǒng)計推斷（statisticalinference）,可以通過兩條途徑進行。

一是通過樣本統(tǒng)計量估計總體參數(shù)；二是首先對所估計的總體提出一個假設(shè)，例如假設(shè)這個總體的平均數(shù)?等于某個值?0，然后，通過樣本數(shù)據(jù)去推斷這個假設(shè)是否可以接受，假使可以接受，樣本很可能抽自這個總體；否則很可能不是抽自這個總體。前一種途徑稱為總體參數(shù)估計（estimationofpopulationparameter）,后一種途徑稱為統(tǒng)計假設(shè)檢驗（statisticaltestofhypothesis）。這兩種不同的統(tǒng)計分析方法

醫(yī)學(xué)統(tǒng)計學(xué)

在實際工作中可相互參照使用。

1、總體均數(shù)的估計——區(qū)間估計（internalestimation）即按一定的概率估計總體均數(shù)在哪個范圍。可根據(jù)資料的條件選用不同的方法。（1）?未知時。一般用t分布的原理作區(qū)間估計。根據(jù)

P(?t?,??t?t?,?)?1??(1-?為可信度)得P(-t?,??x??s/n?t?,?)?1??于是得可信度為1-?時，計算總體均數(shù)可信區(qū)間的通式為：

習(xí)慣上，常取1-?=0.95，即95%可信區(qū)間；或取1-?=0.99，即99%

X?t?,?(可信區(qū)間。

sn)???X?t?,?(sn)例題1、對某人群隨機抽取20人，用某批號的結(jié)核菌素作皮試，平均侵潤直徑為10.9mm，標(biāo)準(zhǔn)差為3.86mm。問這批結(jié)核菌素在該人群中使用時，皮試的平均侵潤直徑的95%可信區(qū)間是多少？本例，n=20,?=n-1=20-1=19,?=0.05（雙側(cè)）查附表，得t0.05,19=2.093

(10.9?2.093?3.8620,10.9?2.093?3.8620)?(9.1,12.7)所以，該人群皮試的平均侵潤直徑的95%可信區(qū)間為9.1~12.7mm。

醫(yī)學(xué)統(tǒng)計學(xué)

（2）?已知或樣本例數(shù)n足夠大時，按正態(tài)分布原理作區(qū)間估計。

?已知時(X-u???nsn,X?u??,X?u???nsn)?未知但n大(X-u??)

例題2由某地成年男子中抽得144人的樣本，求得紅細(xì)胞數(shù)的均數(shù)為5.38?1012/L,標(biāo)準(zhǔn)差為0.44?1012/L,試估計該地成年男子紅細(xì)胞均數(shù)的95%可信區(qū)間。

本例n?144,x?5.38,s?0.44,??0.05,由于n較大可取u0.05?1.96(5.38-1.96?0.44144,5.38?1.96?0.44144)?(5.31,5.45)該地成年男子紅細(xì)胞均數(shù)的95%可信區(qū)間為(5.31,5.45)。

可信區(qū)間的涵義意思是從總體中作隨機抽樣，每個樣本可以算出一個可信區(qū)間，如95%可信區(qū)間，意味著100次抽樣，算得100個可信區(qū)間，平均有95個可信區(qū)間包括總體均數(shù)（估計正確），只有5個可信區(qū)間不包括總體均數(shù)（估計錯誤）。5%是小概率事件，實際發(fā)生的可能性小，因此，在實際應(yīng)用中就認(rèn)為總體均數(shù)在算得的可信區(qū)間內(nèi),這種估計方法會冒5%犯錯的風(fēng)險。

可信區(qū)間的兩個要素一是確鑿度，反映在可信度1-?的大小，即區(qū)間包含總體均數(shù)的概率的大小，當(dāng)然愈接近1愈好；二是精度，反映在區(qū)間的長度，當(dāng)然長度愈小愈好。在樣本例數(shù)確定的狀況下，二者是矛盾的。一般狀況下，在可信度確定的狀況下，增加樣本例數(shù)，

醫(yī)學(xué)統(tǒng)計學(xué)

可減少區(qū)間長度，提高精度。

醫(yī)學(xué)統(tǒng)計學(xué)

假設(shè)檢驗的基本步驟：

1．建立檢驗假設(shè)，確定檢驗水準(zhǔn)α

H0：無效假設(shè)（假定所檢驗的兩個總體均數(shù)相等）H1：備擇假設(shè)（假定所檢驗的兩個總體均數(shù)不相等）單側(cè)檢驗：推斷兩總體均數(shù)有無區(qū)別

雙側(cè)檢驗：根據(jù)專業(yè)知識推斷兩總體均數(shù)中是否可以認(rèn)為一個大于（高于）另一個

2．選擇檢驗方法，計算統(tǒng)計量

根據(jù)分析目的、設(shè)計類型和資料類型，選擇恰當(dāng)?shù)臋z驗方法，計算相應(yīng)的統(tǒng)計量（如：t、u、r、f、χ2等）。3．確定P值，作出統(tǒng)計結(jié)論

用計算出的統(tǒng)計量，根據(jù)不同自由度查相應(yīng)的界值表，確定P值。P值的定義：在H0所規(guī)定的總體中隨機抽樣，獲得等于及大于（或等于及小于）現(xiàn)有樣本統(tǒng)計量的概率。結(jié)論：

①當(dāng)計算的統(tǒng)計量≥界值表上所查到的理論值，則P≤α。此時，表示在H0成立的條件下，出現(xiàn)等于及大于現(xiàn)有樣本統(tǒng)計量的概率是小概率，按其原理，現(xiàn)有信息不支持H0，因而拒絕H0。

②當(dāng)計算的統(tǒng)計量〈界值表上所查到的理論值，則P〉α。此時，表示在H0成立的條件下，出現(xiàn)等于及大于現(xiàn)有樣本統(tǒng)計量的概率不是小概率，現(xiàn)有信息還不足以拒絕H0，因此不拒絕H0。

醫(yī)學(xué)統(tǒng)計學(xué)

第五講均數(shù)差異的假設(shè)檢驗

假設(shè)檢驗的具體方法，尋常是以選定的檢驗統(tǒng)計量來命名的，

如t檢驗要用特定的公式計算檢驗統(tǒng)計量t值，u檢驗要用特定的公式計算檢驗統(tǒng)計量u值。應(yīng)用時首先要了解各種檢驗方法的用途、應(yīng)用條件和檢驗統(tǒng)計量的計算方法。

一、單組完全隨機化設(shè)計資料均數(shù)的t檢驗和u檢驗

從一個總體中完全隨機地抽取一部分個體進行研究，這樣的設(shè)計稱為單組完全隨機化設(shè)計（completelyrandomizeddesignofsinglegroup）。

例題1：根據(jù)大量調(diào)查，已知健康成年男子脈搏均數(shù)為72次/分，某醫(yī)生在某一山區(qū)隨機抽查了25名健康成年男子，求得其脈搏均數(shù)為74.2次/分，標(biāo)準(zhǔn)差為6.0次/分，能否據(jù)此認(rèn)為該山區(qū)成年男子脈搏均數(shù)高于一般成年男子脈搏均數(shù)？

這兩個均數(shù)不等有兩個可能：（1）由于抽樣誤差所致（2）由于環(huán)境條件的影響

如何作出判斷呢？在統(tǒng)計上是通過假設(shè)檢驗來回復(fù)這個問題。以下介紹建立假設(shè)檢驗（t檢驗）的思想、方法與步驟。

1、

建立檢驗假設(shè)和確定檢驗水準(zhǔn)H0：?1=?0（=72次/分）H1：?1??0（=72次/分）

醫(yī)學(xué)統(tǒng)計學(xué)

?=0.05

本例分析目的是比較山區(qū)成年男子脈搏樣本均數(shù)與一般成年男子脈搏總體均數(shù)有無區(qū)別？

?是未知的，可以假設(shè)?等于某一定值?0，?與?0的差等于零，

這樣的假設(shè)稱為無差異假設(shè)或零假設(shè)(nullhypothesis)記為H0：?1=?0

表示該山區(qū)的環(huán)境條件對脈搏數(shù)無影響，他們之間的差異是由于抽樣誤差所致。與零假設(shè)相對立的假設(shè)稱為對立假設(shè)或備擇假設(shè)(alternativehypothesis),符號為H1：?1??0，它是在拒絕H0的狀況下而接受的假設(shè)。假設(shè)檢驗所用的檢驗統(tǒng)計量一般都是建立在零假設(shè)的基礎(chǔ)上，由于H0比較單純明確，而H1卻包含著各種狀況。

檢驗水準(zhǔn)(sizeoftest)亦稱顯著性水準(zhǔn)（significancelevel）,符號為?，在實際工作中常取0.05或0.01。2、選定檢驗方法和計算統(tǒng)計量

本例：n=25x?74.2次/分S=6.0次/分檢驗統(tǒng)計量公式為：

x??0t?,??n-1sx

74.2?72.0?1.833,??25-1?246.0/25

將以上數(shù)據(jù)代入公式，得：

t?要根據(jù)研究類型和統(tǒng)計推斷目的選用不同檢驗方法，不同檢驗方法有相應(yīng)的檢驗統(tǒng)計量，本例的檢驗統(tǒng)計量t聽從?=n-1的t分布。建設(shè)檢驗方法尋常是以檢驗統(tǒng)計量來命名的，故，本例檢驗稱為t檢驗。

醫(yī)學(xué)統(tǒng)計學(xué)

3、確定P值和作出推斷結(jié)論

查t界值表單側(cè)，t（24，0.05）=2.064，由于t0.05。得出結(jié)論按?=0.05水準(zhǔn)，拒絕H0，接受H1。認(rèn)為該山區(qū)的成年男子脈搏均數(shù)高于一般的成年男子脈搏均數(shù)。

關(guān)于檢驗水準(zhǔn)是取0.05、0.01或其他數(shù)值，要根據(jù)不同的試驗而定。?取值較小，有利于提高“陽性〞統(tǒng)計檢驗結(jié)果的可靠性；?取值較大，有利于發(fā)現(xiàn)研究總體可能存在的差異，但可靠性降低。較好的做法是確切地計算出P值，這會對人們認(rèn)識你所作的試驗有很大的參考價值。

二、隨機化配對設(shè)計資料均數(shù)的t檢驗

配對設(shè)計資料分三種狀況：

（1）配成對子的同對受試對象分別給予兩種不同的處理；（2）同一受試對象分別接受兩種不同處理；（3）同一受試對象處理前后的比較。

（1）與（2）結(jié)果的比較，其目的是推斷兩種處理的效果有無區(qū)別；（3）比較，其目的是推斷某種處理有無作用。

因此，應(yīng)當(dāng)首先計算出各對差值d的均數(shù)。當(dāng)兩種處理結(jié)果無區(qū)別或某種處理不起作用時，理論上差值d的總體均數(shù)?d=0。故可將配對設(shè)計資料的假設(shè)檢驗視為樣本均數(shù)與總體均數(shù)?d=0的比較，配對設(shè)計資料以小樣本居多，故常用t檢驗。其計算公式為：

d??dd,??n-1t?sd?sd/n

醫(yī)學(xué)統(tǒng)計學(xué)

例題2、將大白鼠配成8對，每對分別飼以正常飼料和缺乏維生素E飼料，測得兩組大白鼠肝中維生素A的含量如下表，試比較兩組大白鼠中維生素A的含量有無區(qū)別。

表不同飼料組大白鼠肝中維生素A的含量（U/g）

大白鼠配對號12345678合計

正常飼料組35502000300039503800375034503050維生素E缺乏組24502400180032003250270025001750差數(shù)，d

1100-4001200750550105095013006500

d212100001600001440000562500302500110250090250016900007370000

1)H0:?d=0,H1:?d?0,?=0.052)計算統(tǒng)計量

d6500?d???812.5(u/g)n8Sd?Sdn??d2?(?d)2/nn(n?1)?7370000?(6500)2/8?193.1298(u/g)

8?(8?1)t?812.5-0??4.2070??n?1?7193.1298Sd/nd??d3）確定P值下結(jié)論

查t界值表（雙側(cè)），t>t0.05,7=4.029P醫(yī)學(xué)統(tǒng)計學(xué)

三、兩組完全隨機化設(shè)計資料均數(shù)的t檢驗與u檢驗1、t檢驗

將受試對象完全隨機地分派到兩組中，這兩組分別接受不同的處理。這樣的設(shè)計稱為兩組完全隨機化設(shè)計（completelyrandomizeddesignoftwogroups）。

有些研究設(shè)計既不能作自身對比，也不便于配對。如試驗中只有把受試動物殺死后才能獲得所需數(shù)據(jù)，則不可能對動物在處理前后各進行一次測定；再如比較兩種治療方法對同一疾病的療效，每個患者一般只能接受一種方法的治療，把受試患者配成若干對在實際工作中又十分困難，這時只能進行兩組間均數(shù)的比較。在兩組比較的資料中，每個觀測對象都應(yīng)依照隨機的原則進行分組，兩組樣本量可以一致，也可以不同，但只有在兩組例數(shù)一致時檢驗效率才最高。統(tǒng)計量計算公式為：

(X1?X2)?(?1??2)Sx?x12?X1?X2Sx?x12

??n1?n2?2

Sx1?x2?Sc2(11?)n1n22222??x21?(?x1)/n1??x?(?X2)/n211(?)n1?n2?2n1n2

2(n1?1)S12?(n2?1)S2S?(n1?1)?(n2?1)2c

醫(yī)學(xué)統(tǒng)計學(xué)

例題3、某醫(yī)院研究乳酸脫氫同工酶（LDH）測定對心肌梗死的診斷價值時，曾用隨機抽樣方法比較了10例心肌梗死患者與10例健康人LDH測定值的區(qū)別，結(jié)果如下，試問LDH測定值在兩組間有無區(qū)別？

心肌梗死患者（X1）23.245.045.040.035.044.142.052.550.058.0健康人（X2）20.031.030.523.124.238.035.537.839.0131.0（1）、H0：?1=?2H1：?1??2?=0.05

2n1?10,?X1?434.80,?X1?19742.30,X1?43.48,S1?9.64n1?10,?X2?310.10,?X?10025.59,X2?31.01,S1?6.7422

（2）、計算統(tǒng)計量：

將上述數(shù)據(jù)代入公式，得：

Sx1?x21974.230?434.82/10?10025.59?310.102/1011?(?)?3.7217(%)10?10?21010

t?43.48?31.013.7217?3.3506,??10?10-2?18（3）、確定P界作出結(jié)論

本例t>t0.05,18=3.197,Pu0.05,P醫(yī)學(xué)統(tǒng)計學(xué)

（1）兩個或多個樣本均數(shù)間的比較；（2）分析兩個或多個因素的交互作用；（3）回歸方程的假設(shè)檢驗；（4）方差齊性檢驗等。

多個樣本均數(shù)間比較的方差分析應(yīng)用條件為：（1）各樣本必需是相互獨立的隨機樣本；（獨立性）（2）各樣本均來自正態(tài)總體；（正態(tài)性）

（3）相互比較的各樣本所來自的總體其方差相等，（方差齊性）

一、完全隨機設(shè)計的方差分析

醫(yī)學(xué)試驗中，根據(jù)某一試驗因素，用隨機的方法將受試對象分派到各組，各組分別接受不同的處理后，觀測各種處理的效果，比較各組均數(shù)之間有無區(qū)別。

臨床研究中，還可能往往比較幾種不同療法治療某種疾病后某指標(biāo)的變化，以評價它們的療效；或比較某種疾病不同類型之間某一指標(biāo)有無區(qū)別等。

這些都是一個因素不同水平（或狀態(tài)）間幾個樣本均數(shù)的比較，可用單因素的方差分析（one-wayANOVA）來處理此類資料。

醫(yī)學(xué)統(tǒng)計學(xué)

例題：某職業(yè)病防治院對31名石棉礦工中的石棉肺患者、可疑患者及非患者進行了用力肺活量（L）測定，結(jié)果見下表：問三組石棉礦工的肺活量有無區(qū)別？表三組石棉礦工的用力肺活量(L)

Xij

合計(?Xij)nj均數(shù)Xj(?X2ij)

石棉肺患者

1.81.41.52.11.91.71.81.91.81.82.019.1111.7935.69

可疑患者

2.32.12.12.12.62.52.32.42.420.892.3148.34

非患者

2.93.22.72.82.73.03.43.03.43.3

人人文庫> 全部分類> 教育資料 > 中學(xué)教育

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

醫(yī)學(xué)統(tǒng)計學(xué)基礎(chǔ)

文檔簡介

溫馨提示

最新文檔

評論

醫(yī)學(xué)統(tǒng)計學(xué)基礎(chǔ)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔