醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)概括_第1頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)概括_第2頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)概括_第3頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)概括_第4頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)概括_第5頁(yè)
已閱讀5頁(yè),還剩30頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

醫(yī)學(xué)統(tǒng)計(jì)學(xué)(5+3一體化)出版課時(shí)一緒論第一節(jié)、醫(yī)學(xué)統(tǒng)計(jì)學(xué)的地位和作用醫(yī)學(xué)統(tǒng)計(jì)學(xué)的概念:運(yùn)用統(tǒng)計(jì)學(xué)的基本原理與方法研究醫(yī)學(xué)領(lǐng)域(臨床和基礎(chǔ)醫(yī)學(xué)領(lǐng)域)中數(shù)據(jù)的收集、整理、分析和推斷的一門科學(xué)第二節(jié)、醫(yī)學(xué)統(tǒng)計(jì)學(xué)基本內(nèi)容和統(tǒng)計(jì)工作基本步驟統(tǒng)計(jì)工作的步驟:(一)設(shè)計(jì)根據(jù)研究目的,對(duì)某項(xiàng)醫(yī)學(xué)研究工作的全過程(資料收集、整理和分析)所作的總的設(shè)想和安排;是統(tǒng)計(jì)工作的第一步和最關(guān)鍵的一步。(二)收集資料任務(wù):遵循統(tǒng)計(jì)學(xué)原理,按照設(shè)計(jì)要求,采取必要措施得到準(zhǔn)確可靠的原始資料。原則:及時(shí)、準(zhǔn)確、完整。(三)整理資料編碼,將數(shù)據(jù)輸入計(jì)算機(jī)糾錯(cuò)改錯(cuò)、補(bǔ)漏等根據(jù)研究目的將原始數(shù)據(jù)進(jìn)行歸納、分組或計(jì)算(四)分析資料統(tǒng)計(jì)描述統(tǒng)計(jì)分析參數(shù)估計(jì)統(tǒng)計(jì)推斷假設(shè)檢驗(yàn)第三節(jié)、統(tǒng)計(jì)學(xué)的若干基本概念(一)總體與樣本1.總體:是根據(jù)研究目的所確定的同質(zhì)觀察對(duì)象的全體,或者說所有同質(zhì)的某指標(biāo)實(shí)測(cè)值的集合。2.樣本:根據(jù)隨機(jī)化的原則從總體中抽取有代表性的部分觀察單位,其變量實(shí)測(cè)值構(gòu)成樣本。3.參數(shù)和統(tǒng)計(jì)量*①總體參數(shù)——總體、唯一性、穩(wěn)定性、未知(不可知)②統(tǒng)計(jì)量——樣本、不唯一、可變性、可知·統(tǒng)計(jì)學(xué)通常用統(tǒng)計(jì)量估計(jì)參數(shù)(參數(shù)估計(jì))4.同質(zhì)與變異

①同質(zhì):一個(gè)總體中有許多個(gè)體,他們之所以匯集起來共同成為人們研究的對(duì)象,必定存在共性,具有同質(zhì)性。即具有相同的背景、條件、屬性等。②變異:然而,同一總體內(nèi)的各觀察單位間存在差異又是絕對(duì)的,這種現(xiàn)象稱為變異。(二)變量與資料·變量:觀測(cè)單位的某種特征或?qū)傩浴び^察單位:亦稱個(gè)體(人、動(dòng)物、家庭、地區(qū)、樣品、采樣點(diǎn)……)·變量值(資料):變量的觀察結(jié)果,可以是定量的,也可以是定性的。例:三歲兒童身高、性別·根據(jù)變量值的獲取方法把變量進(jìn)行分類:定量變量和定性變量。1.定量變量:數(shù)值變量或計(jì)量數(shù)據(jù)。①定義:通過度量衡的方法,測(cè)量每一個(gè)觀察單位的某項(xiàng)研究指標(biāo)的量的大小,得到的一系列數(shù)據(jù)資料。②特點(diǎn):有度量衡單位。③舉例:調(diào)查某地某年七歲女童的身體發(fā)育狀況。每個(gè)人的身高(cm)、體重(kg)、脈搏(次/分)、血壓(kPa)、坐高指數(shù)(%,坐高/身高)等均屬定量變量。④類型:·離散型變量:變量取值可以一一列舉的資料。例:家庭人口數(shù),脈搏數(shù)·連續(xù)型變量:變量取值不能一一列舉的資料(變量取值為一定范圍內(nèi)的任意值)。例:人體的身高、體重、總膽固醇2.定性變量(分類資料)①定義:將全體觀測(cè)單位按照某種性質(zhì)或特征分組,然后再分別清點(diǎn)各組觀察單位的個(gè)數(shù)。②特點(diǎn):沒有度量衡單位,多為間斷性變量(通過枚舉或記數(shù)得來)③類型:二分類變量:陰性和陽(yáng)性/男和女·無序分類變量:類與類之間無程度大小的差別多分類變量:血型:A、B、O、AB職業(yè):教師、醫(yī)生、工人·有序分類變量(等級(jí)變量):類與類之間有程度大小的差別療效:治愈、好轉(zhuǎn)、無效;尿蛋白:(-、±、+、++)文化程度:小學(xué)及以下、中學(xué)、大專、本科及以上(三)誤差1.誤差:實(shí)際觀察值與真實(shí)值之差2.誤差分類:(四)頻率和概率1.頻率:稱f為事件A在這n次試驗(yàn)中出現(xiàn)的頻率2.概率:當(dāng)觀察次數(shù)n越來越大,頻率f的波動(dòng)幅度越來越小,并最終趨向于一個(gè)常數(shù)p——隨機(jī)事件A發(fā)生的概率?!じ怕拭枋隽穗S機(jī)事件發(fā)生的可能性的大小,是一種參數(shù);頻率作為概率的估計(jì)值,是統(tǒng)計(jì)量3.小概率事件:概率小于等于0.05的事件(醫(yī)學(xué))·原理:在某一次試驗(yàn)中,由于其發(fā)生的可能性十分小,近似認(rèn)為是不會(huì)發(fā)生的課時(shí)二定量資料的統(tǒng)計(jì)描述第一節(jié)、頻數(shù)分布表和頻數(shù)分布圖1、離散型定量變量的頻數(shù)表;2、連續(xù)型定量變量的頻數(shù)表:要特別注意:分組除了最后一段外均為左閉右開區(qū)間,最后一個(gè)分組一定要有上限;3、頻數(shù)分布圖4、頻數(shù)分布表和頻數(shù)分布圖的作用⑴揭示頻數(shù)分布的特征:集中趨勢(shì)、離散趨勢(shì)(當(dāng)集中趨勢(shì)與離散趨勢(shì)結(jié)合起來時(shí)能全面反映頻數(shù)的分布。)⑵揭示頻數(shù)分布的類型:對(duì)稱型、不對(duì)稱型(分為正偏態(tài)和負(fù)偏態(tài))第二節(jié)、集中位置的描述1.算數(shù)均數(shù)的相關(guān)知識(shí)⑴計(jì)算方法:直接法:加權(quán)法:⑵均數(shù)的特性:各觀察值與均數(shù)之差(離均差)的總和等于零; 各觀察值的離均差平方和最小。⑶均數(shù)的應(yīng)用:它是集中趨勢(shì)的最常用指標(biāo);易受極端值的影響;用于定量數(shù)據(jù),不能用于分類數(shù)據(jù)和等級(jí)數(shù)據(jù);適用于服從對(duì)稱分布定量資料(正態(tài)或近似正態(tài))的集中趨勢(shì)描述。2.幾何均數(shù)的相關(guān)知識(shí)⑴計(jì)算方法:直接法、加權(quán)法(對(duì)比算數(shù)均數(shù),在其基礎(chǔ)上加上對(duì)數(shù))⑵幾何均數(shù)的應(yīng)用:觀察值間呈倍數(shù)或近似倍數(shù)關(guān)系的數(shù)據(jù);正偏態(tài)分布資料(對(duì)數(shù)正態(tài)分布或近似對(duì)數(shù)正態(tài)分布)中位數(shù)的相關(guān)知識(shí)⑴計(jì)算方法:直接法:頻數(shù)表法:⑵中位數(shù)的應(yīng)用:中位數(shù)主要應(yīng)用于不對(duì)稱分布型的資料,兩端無確切值或分布不明確的資料。第三節(jié)、離散程度的描述1.極差的相關(guān)知識(shí)極差一般用于單峰對(duì)稱分布小樣本資料或者初步了解資料的變異程度;一般極差越大,則數(shù)據(jù)的變異性越大;但是它沒有考慮除極值外其他數(shù)據(jù)的變異情況;而且樣本的極差通常過小地估計(jì)了總體的極差;2.四分位數(shù)間距的相關(guān)知識(shí)⑴計(jì)算方法:直接法頻數(shù)表法(常用):Px=Lx+i/fx(n·x%—ΣfL)⑵四分位數(shù)間距的應(yīng)用:四分位數(shù)間距常用于描述偏態(tài)分布資料、兩端無確切值或分布不明確資料的離散程度。3.方差與標(biāo)準(zhǔn)差(總體的方差與標(biāo)準(zhǔn)差公式見課本P55)⑴計(jì)算方法:樣本的方差:樣本的標(biāo)準(zhǔn)差:4.變異系數(shù)的相關(guān)知識(shí)⑴計(jì)算方法:CV=S/X*100%⑵變異系數(shù)的應(yīng)用:消除了數(shù)據(jù)水平高低和計(jì)量單位的影響,用于不同性質(zhì)數(shù)據(jù)或均數(shù)相差較大時(shí),離散程度的比較;5.各種指標(biāo)之間的使用方法:課時(shí)三正態(tài)分布及其應(yīng)用第一節(jié)、正態(tài)分布的概念和特征1.概念:在醫(yī)學(xué)衛(wèi)生領(lǐng)域中,許多變量的頻數(shù)分布是中間(靠近均數(shù)處)頻數(shù)多,兩邊頻數(shù)少,且左右對(duì)稱,兩側(cè)逐漸低下,兩端在無窮遠(yuǎn)處與橫軸無限接近。如人體的許多生理、生化指標(biāo)等。這種變量的頻數(shù)分布規(guī)律可用概率論中的一種重要的隨機(jī)變量分布—正態(tài)分布(Normaldistribution)加以描述。若變量x的頻率曲線對(duì)應(yīng)于數(shù)學(xué)上的正態(tài)分布曲線,則稱該變量服從正態(tài)分布。2.特征①密度函數(shù):②特征:中間(靠近均數(shù)處)頻數(shù)多,兩邊頻數(shù)少;且左右對(duì)稱;二個(gè)參數(shù)(μ、σ),固定σ,改變?chǔ)?,曲線左右移動(dòng),形態(tài)不變,固定μ,σ越小曲線越陡峭,但中心位置不變。3.正態(tài)密度函數(shù)曲線下的面積規(guī)律①正態(tài)密度函數(shù)曲線與橫軸間的面積恒等于1或100%;②正態(tài)分布是一種對(duì)稱分布,其對(duì)稱軸為直線X=μ,X>μ與X<μ范圍內(nèi)曲線下的面積相等,各占50%;③曲線下在區(qū)間(μ-σ,μ+σ)的面積為68.27%,曲線下在區(qū)間(μ-1.64σ,μ+1.64σ)的面積為90%,曲線下在區(qū)間(μ-1.96σ,μ+1.96σ)的面積為95%,曲線下在區(qū)間(μ-2.58σ,μ+2.58σ)的面積為99%。第二節(jié)、標(biāo)準(zhǔn)正態(tài)分布為了計(jì)算方便,對(duì)于正態(tài)或近似正態(tài)分布的資料,只要得出均數(shù)和標(biāo)準(zhǔn)差,可通過標(biāo)準(zhǔn)轉(zhuǎn)化,轉(zhuǎn)化成求標(biāo)準(zhǔn)正態(tài)曲線下橫軸自-∞到z的面積。標(biāo)準(zhǔn)化變化:若x服從正態(tài)分布N(μ,σ2),則z就服從均數(shù)為0、標(biāo)準(zhǔn)差為1的正態(tài)分布,這種正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布或z分布,記為N(0,12),這一變換也稱為標(biāo)準(zhǔn)化變換。

例題1.已知z1=-1.20,z2=1.60,欲求標(biāo)準(zhǔn)正態(tài)下(-1.20,1.60)范圍的面積。解:查表φ(-1.20)=0.1151;φ(1.60)=1-0.0548=0.9452則D=φ(1.60)-φ(-1.20)=0.8301第三節(jié)、正態(tài)分布的應(yīng)用①估計(jì)頻數(shù)分布例題;某項(xiàng)目研究嬰兒的出生體重服從正態(tài)分布,其均數(shù)為3150g,標(biāo)準(zhǔn)差為350g。若以2500g作為低體重兒,試估計(jì)低體重兒的比例。解:首先計(jì)算標(biāo)準(zhǔn)正態(tài)離差z:查標(biāo)準(zhǔn)正態(tài)分布表:φ(-1.86)=0.0314結(jié)果:估計(jì)低體重兒所占比例為96.86%②制定醫(yī)學(xué)參考值范圍(又稱正常值范圍),作為判斷正常與異常的參考標(biāo)準(zhǔn)確定參考值范圍的注意事項(xiàng):?jiǎn)?、雙側(cè)問題:?jiǎn)蝹?cè)下限:肺活量,IQ,單側(cè)上限:轉(zhuǎn)氨酶,尿鉛,雙側(cè):紅細(xì)胞計(jì)數(shù)、血清總膽固醇…選擇百分界值(90%,95%)根據(jù)資料特點(diǎn),選用恰當(dāng)計(jì)算方法計(jì)算醫(yī)學(xué)參考值范圍常用的方法:1.正態(tài)分布法:適用于正態(tài)或近似正態(tài)分布資料。雙側(cè)界值:?jiǎn)蝹?cè)上界:;單側(cè)下界:2.對(duì)數(shù)正態(tài)分布法:適用于對(duì)數(shù)正態(tài)分布資料雙側(cè)界值:3.百分位數(shù)法:常用于偏態(tài)分布資料雙側(cè)界值:P2.5和P97.5;單側(cè)上界:P95;或單側(cè)下界:P5例4.24某地調(diào)查正常成年男子200人的紅細(xì)胞數(shù),得均數(shù)=55.26×1012/L,標(biāo)準(zhǔn)差S=0.38×1012/L,試估計(jì)該地正常成年男子紅細(xì)胞數(shù)的95%參考值范圍。解:該地正常成年男子紅細(xì)胞數(shù)的95%參考值范圍為下限:-1.96S=55.26-1.96×0.38=54.52(×1012/L)上限:+1.96S=55.26+1.96×0.38=56.00(×1012/L)例4.252005年某市進(jìn)行的小學(xué)生體質(zhì)評(píng)價(jià)研究中,測(cè)定了120名9歲男孩的肺活量,均數(shù)=1.672L,S=0.298L,試估計(jì)9歲男孩的肺活量的95%參考值范圍。解:因肺活量?jī)H過低屬異常,故取單側(cè)下限。肺活量的95%參考值范圍為:下限:即該地估計(jì)該地小學(xué)生中9歲男孩的肺活量的95%參考值范圍為不低于1.183L。例.測(cè)得某年某地282名正常人的尿汞值如下表所示,試制定正常人尿汞的95%參考值范圍。解:正常人的尿汞值為偏態(tài)分布,且過高為異常,故用百分位數(shù)法計(jì)算,且取單側(cè)上限。其95%參考值范圍為:上限:即該地正常人尿汞的95%參考值范圍為不高于43.6μg/L。③質(zhì)量控制④正態(tài)分布是許多統(tǒng)計(jì)方法的理論基礎(chǔ)課時(shí)四總體均數(shù)的估計(jì)第一節(jié)、均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤樣本均數(shù)的特點(diǎn)·各個(gè)樣本均數(shù)之間都不相同——抽樣誤差表現(xiàn)形式之一·各個(gè)樣本均數(shù)都不等于總體均數(shù),有的比總體均數(shù)大,有的比它小——抽樣誤差表現(xiàn)形式之二·相對(duì)于各樣本的個(gè)體值,樣本均數(shù)間的變異程度較小樣本均數(shù)的分布規(guī)律·大多數(shù)的樣本均數(shù)相互之間存在差異,絕大多數(shù)的樣本均數(shù)不等于x的總體均數(shù)·樣本均數(shù)的集中趨勢(shì)位置與個(gè)體資料x的集中趨勢(shì)位置較為接近,樣本均數(shù)的頻數(shù)圖均呈現(xiàn)出中間多、兩邊少且基本對(duì)稱的正態(tài)分布特征?!颖揪鶖?shù)的分布范圍較個(gè)體值??;隨著樣本含量的增大,樣本均數(shù)的頻數(shù)分布范圍越來越窄·樣本均數(shù)的標(biāo)準(zhǔn)差都非常接近(?為個(gè)體資料x的總體標(biāo)準(zhǔn)差,n為個(gè)體數(shù))中心極限定理1.從正態(tài)分布N(u,?^2)中,以固定n抽取樣本,樣本均數(shù)的分布仍服從正態(tài)分布,樣本均數(shù)的總體均數(shù)仍為u,樣本均數(shù)的標(biāo)準(zhǔn)差為2.即使是從偏態(tài)分布總體抽樣,只要n足夠大,樣本均數(shù)的分布也近似正態(tài)分布;3.隨著樣本量的增大,樣本均數(shù)的變異范圍也逐漸變窄。樣本均數(shù)的標(biāo)準(zhǔn)誤·為了與個(gè)體的標(biāo)準(zhǔn)差相互區(qū)別,樣本均數(shù)的標(biāo)準(zhǔn)差又稱為樣本均數(shù)的標(biāo)準(zhǔn)誤(SE),或理論標(biāo)準(zhǔn)誤·反映了樣本均數(shù)間的離散程度,如果SE很大則不同的樣本均數(shù)間參差不齊,同時(shí)樣本均數(shù)的分布范圍較大,也反映了樣本均數(shù)與總體均數(shù)間的差異可能較大,因而標(biāo)準(zhǔn)誤反映均數(shù)·抽樣誤差的大??;它與總體標(biāo)準(zhǔn)差成正比,與總體中的個(gè)體數(shù)的平方根成反比代表樣本均數(shù)的標(biāo)準(zhǔn)誤,其表達(dá)式為均數(shù)的標(biāo)準(zhǔn)誤的影響因素·從標(biāo)準(zhǔn)誤的計(jì)算公式中看出它與原先個(gè)體觀察值的總體標(biāo)準(zhǔn)差s有關(guān),同時(shí)也和樣本含量n有關(guān)·在固定樣本含量的情況下,總體標(biāo)準(zhǔn)差越大,則樣本均數(shù)間越參差不齊,抽樣誤差越大;但是總體標(biāo)準(zhǔn)差是參數(shù),在抽樣之前就已經(jīng)存在,無法改變它的大小·故可行的方法是通過擴(kuò)大樣本含量減少標(biāo)準(zhǔn)誤;從而減少抽樣誤差樣本均數(shù)標(biāo)準(zhǔn)誤的估計(jì)值。抽樣誤差越小,表示樣本均數(shù)與總體均數(shù)越接近,用樣本均數(shù)估計(jì)總體均數(shù)的可靠性越高;反之則越低標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差的區(qū)別:(1)概念不同標(biāo)準(zhǔn)差是描述樣本個(gè)體值間的變異,標(biāo)準(zhǔn)差小,說明變量值圍繞均數(shù)的波動(dòng)小,均數(shù)的代表性好。標(biāo)準(zhǔn)誤是描述樣本均數(shù)的抽樣誤差,標(biāo)準(zhǔn)誤越小,表示樣本均數(shù)圍繞總體均數(shù)的波動(dòng)越小。用途不同標(biāo)準(zhǔn)差表示變量值對(duì)均數(shù)的波動(dòng)大小,當(dāng)資料呈正態(tài)分布時(shí),與均數(shù)結(jié)合估計(jì)正常值范圍、計(jì)算變異系數(shù)、標(biāo)準(zhǔn)誤等。標(biāo)準(zhǔn)誤表示樣本統(tǒng)計(jì)量對(duì)總體參數(shù)的波動(dòng)情況,用于估計(jì)參數(shù)的置信區(qū)間、進(jìn)行假設(shè)檢驗(yàn)。(3)聯(lián)系1)兩者均為變異指標(biāo);2)樣本含量不變時(shí),均數(shù)的標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比;3)兩者均可與均數(shù)結(jié)合使用(但描述的內(nèi)容各不相同)。在應(yīng)用過程中要注意標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的區(qū)別:第二節(jié)、t分布·t分布的由來.t分布曲線的特點(diǎn)①單峰分布,曲線在t=0處最高,并以t=0為中心左右對(duì)稱②與標(biāo)準(zhǔn)正態(tài)分布相比,曲線最高處較矮,兩尾部翹得高③其形態(tài)變化與自由度的大小有關(guān)。自由度越小,則t值越分散,曲線越低平;隨自由度增大,曲線逐漸接近正態(tài)分布。它與樣本例數(shù)n或自由度ν有關(guān),某個(gè)自由度對(duì)應(yīng)于一條t分布曲線。當(dāng)n或ν不同時(shí),曲線形狀不同。當(dāng)v→無窮大時(shí),t分布趨近于標(biāo)準(zhǔn)正態(tài)分布。自由度:ν=n-1(隨機(jī)變量能夠自由取值的個(gè)數(shù))t分布曲線下面積規(guī)律t分布曲線下總面積仍為1或100%由于t分布是一簇曲線,故t分布曲線下面積固定面積(如95%或99%)的界值不是一個(gè)常量,而是隨自由度的大小而變化,如附表3。第三節(jié)、總體均數(shù)的估計(jì)參數(shù)的估計(jì)點(diǎn)估計(jì):由樣本統(tǒng)計(jì)量直接估計(jì)總體參數(shù)(缺點(diǎn):沒有考慮抽樣誤差。)區(qū)間估計(jì):在一定可信度下,同時(shí)考慮抽樣誤差。在點(diǎn)估計(jì)的基礎(chǔ)上,結(jié)合抽樣誤差的大小,給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍(由上、下限構(gòu)成的置信區(qū)間)該區(qū)間按照一定的概率可能性,包含所推斷的總體參數(shù)置信區(qū)間:假設(shè)已知的樣本均數(shù)是從較小的m總體中抽取的,它成立的統(tǒng)計(jì)條件是從該總體中抽取一個(gè)樣本,其均數(shù)為當(dāng)前均數(shù)以及更大的可能性并非小概率事件置信區(qū)間與置信度:按預(yù)先給定的概率(1-a)確定的包含未知總體參數(shù)的可能范圍,該范圍通常稱為參數(shù)的信區(qū)間或可信區(qū)間.預(yù)先給定的概率(1-a)稱為可信度或置信度,常取95%或99%置信區(qū)間的確切含義95%置信區(qū)間:從總體中作隨機(jī)抽樣,作100次抽樣,每個(gè)樣本可算得一個(gè)置信區(qū)間,得100個(gè)置信區(qū)間,平均有95個(gè)置信區(qū)間包括μ(估計(jì)正確),只有5個(gè)置信區(qū)間不包括μ(估計(jì)錯(cuò)誤)。總體均數(shù)的置信區(qū)間估計(jì)方法資料不同,總體均數(shù)的估計(jì)方法也不同,根據(jù)資料的條件,計(jì)算方法有三種:未知,且n?。喊磘分布原理計(jì)算置信區(qū)間。未知,但n足夠大時(shí)(n>100),t分布逼近z分布。按z分布原理計(jì)算置信區(qū)間。σ已知,故可按正態(tài)分布原理估計(jì)總體均數(shù)的置信區(qū)間,計(jì)算公式為:置信區(qū)間的注意問題1.置信區(qū)間的涵義意思是從總體中作隨機(jī)抽樣,每個(gè)樣本可以算得一個(gè)置信區(qū)間。如95%置信區(qū)間意味著做100次抽樣,算得100個(gè)置信區(qū)間,平均有95個(gè)估計(jì)正確,估計(jì)錯(cuò)誤的只有5次。5%是小概率事件,實(shí)際發(fā)生的可能性很小,當(dāng)然這種估計(jì)方法會(huì)有5%犯錯(cuò)誤的風(fēng)險(xiǎn)。2.置信區(qū)間的兩個(gè)要素:一是準(zhǔn)確度:反映在可信度的大小,即區(qū)間包含總體均數(shù)的概率的大小,愈接近1愈好。二是精密度:反映在區(qū)間的長(zhǎng)度,長(zhǎng)度愈小愈好。在樣本含量確定的情況下,二者是矛盾的,若只管提高可信度,會(huì)把區(qū)間變得很長(zhǎng),故不宜認(rèn)為99%置信區(qū)間比95%置信區(qū)間好,一般來說95%置信區(qū)間更為常用。3.均數(shù)置信區(qū)間與參考值范圍的區(qū)別95%的置信區(qū)間中的95%是置信度,即所求置信區(qū)間包含總體參數(shù)的可信程度為95%;95%的參考值范圍中的95%是一個(gè)比例,即所求參考值范圍包含了95%的正常人。課時(shí)五假設(shè)檢驗(yàn)第一節(jié)、基本思想反證法+小概率事件原理目前已知這兩組樣本的數(shù)據(jù)不相等,新療法為4min,常規(guī)療法3min,那么造成這兩者之間的差異的原因可能有以下兩種:1.抽樣誤差,即假設(shè)兩者之間的治療效果是沒有差別的,兩個(gè)樣本平均數(shù)之間差別產(chǎn)生的原因單純是因?yàn)槌闃诱`差所導(dǎo)致的。2.這兩組治療效果的確有區(qū)別。于是我們經(jīng)過分析得到了以上兩個(gè)假設(shè),假設(shè)1即認(rèn)為兩組樣本來自同一個(gè)大的總體(兩者之間的治療效果沒有差別),差異是由抽樣誤差導(dǎo)致的,該假設(shè)否認(rèn)了兩組之間的差異,記為H0(零假設(shè));假設(shè)2認(rèn)為兩個(gè)樣本來自不同的總體,即兩者之間的確存在差異,記為H1(備擇假設(shè))。我們這里之所以將抽樣誤差的情況設(shè)為零假設(shè)是因?yàn)槌闃诱`差出現(xiàn)的可能性(P)是可以通過計(jì)算得到的,若P小于等于5%(即小概率事件),我們認(rèn)為在一次的抽樣中是不會(huì)得到小概率事件的,于是我們就可以否認(rèn)造成差異的原因是抽樣誤差而是兩組數(shù)據(jù)來自不同的總體。如果反過來,我們是無法直接證明這兩組數(shù)據(jù)是不同的,所以在這里一定要用反證法來證明兩者之間得而差別,這就是假設(shè)檢驗(yàn)的原理。當(dāng)兩組數(shù)據(jù)本來就十分接近時(shí),P值便容易得到大于5%的情況,此時(shí)便不能否認(rèn)抽樣誤差的可能性,便不能證明兩組數(shù)據(jù)有差異。第二節(jié)、基本步驟1.建立假設(shè)檢驗(yàn),確定檢驗(yàn)水準(zhǔn)H0:差異抽樣誤差H1:兩組數(shù)據(jù)的確存在差異A=0.052.計(jì)算檢驗(yàn)統(tǒng)計(jì)量3.查表,得到P值4.下結(jié)論當(dāng)P≤a(一般為0.05)時(shí),(根據(jù)小概率原理,一次抽樣中不可能出現(xiàn)小概率事件,于是否認(rèn)抽樣誤差存在的可能性)拒絕H0,接受H1,有統(tǒng)計(jì)學(xué)意義。當(dāng)P≥a(一般為0.05)時(shí),(由于此時(shí)的差異有可能是抽樣誤差造成的,不能否認(rèn)抽樣誤差的可能性)尚不能拒絕H0,(不能得出兩組數(shù)據(jù)確實(shí)存在差異的結(jié)論)結(jié)果沒有統(tǒng)計(jì)學(xué)意義。第三節(jié)、Ⅰ型錯(cuò)誤與Ⅱ型錯(cuò)誤Ⅰ型錯(cuò)誤:很不幸,你的一次抽樣就抽到了小概率事件a(一般為0.05),于是把原本只是單純的抽樣誤差造成的差異,判斷為了兩組樣本所在的總體是不同的,于是對(duì)不起,你就犯了Ⅰ型錯(cuò)誤——這兩組數(shù)據(jù)其實(shí)沒有不同。你煩這種錯(cuò)誤的可能性與你臉黑在一次抽樣中抽到小概率事件的判斷標(biāo)準(zhǔn)(a)是一樣的。Ⅱ型錯(cuò)誤:很遺憾,當(dāng)P≥a(一般為0.05)時(shí),你判斷認(rèn)為在這種情況下,這兩組數(shù)據(jù)的差異有可能來自抽樣誤差,于是你就拒絕了H1(兩組數(shù)據(jù)確實(shí)存在差異)的情況,然而事實(shí)上,兩組數(shù)據(jù)所來自的總體確實(shí)存在差異,只是差異很小,被你誤認(rèn)為是由于抽樣誤差造成的,那么很抱歉,你犯了Ⅱ型錯(cuò)誤,你犯這種錯(cuò)誤的概率取決于P大于等于a(一般為0.05)的部分與H1成立相交的面積β(未知)相等。檢驗(yàn)效能:你不犯Ⅱ型錯(cuò)誤的可能性1-β。注:Ⅰ型錯(cuò)誤與Ⅱ型錯(cuò)誤只能盡量減小卻不能完全避免。第四節(jié)、單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)一般用雙側(cè),因?yàn)槟阋话銦o法知道差異是會(huì)變大還是變小,只有在有專業(yè)知識(shí)的情況下才考慮用單側(cè)檢驗(yàn)。因?yàn)閱蝹?cè)檢驗(yàn)更容易拒絕H0,故應(yīng)用雙側(cè)檢驗(yàn)時(shí)用單側(cè)檢驗(yàn)會(huì)使犯Ⅰ型錯(cuò)誤的可能性加大。第五節(jié)、需要注意的問題自己看吧第六節(jié)、假設(shè)檢驗(yàn)與區(qū)間估計(jì)的聯(lián)系假設(shè)檢驗(yàn)的結(jié)果和區(qū)間估計(jì)的方法不能但所得出的結(jié)論是相同。課時(shí)六t檢驗(yàn)根據(jù)問題,需要進(jìn)行假設(shè)檢驗(yàn)的時(shí)候,如果:1)資料是定量資料,且要求正態(tài)總體或近似正態(tài)總體,就選用t檢驗(yàn);2)如果是定性資料,就用卡方檢驗(yàn)。當(dāng)選擇用t檢驗(yàn),t檢驗(yàn)有三種:?jiǎn)螛颖総檢驗(yàn)、成組t檢驗(yàn)、配對(duì)t檢驗(yàn)。t檢驗(yàn)的使用條件:1)單樣本t檢驗(yàn):總體標(biāo)準(zhǔn)差未知且樣本含量較小。用于樣本均數(shù)與總體均數(shù)的比較。2)配對(duì)t檢驗(yàn):是單樣本t檢驗(yàn)的特殊情況,主要有三種類型:(1)配對(duì)的對(duì)象接受不同的處理。(2)同一樣品用兩種不同的方法或儀器檢測(cè)。(3)同一對(duì)象處理前后的對(duì)比。配對(duì)t檢驗(yàn)用來推斷兩種處理方法結(jié)果有無差別。3)成組t檢驗(yàn):兩小樣本均數(shù)比較時(shí),且總體方差相等時(shí)。備注:對(duì)于兩大樣本(均數(shù)均大于50)的均數(shù)比較時(shí),可用Z檢驗(yàn)。第一節(jié)、單樣本t檢驗(yàn)(例8.1)解:第二節(jié)、配對(duì)t檢驗(yàn)重要的是使用條件:(1)配對(duì)的對(duì)象接受不同的處理。(2)同一樣品用兩種不同的方法或儀器檢測(cè)。(3)同一對(duì)象處理前后的對(duì)比。配對(duì)t檢驗(yàn)用來推斷兩種處理方法結(jié)果有無差別。(例8.2)第三節(jié)、成組t檢驗(yàn)1)什么是成組資料設(shè)計(jì)?為了研究?jī)煞N處理效果的差別,將所收集的研究對(duì)象隨機(jī)分配到兩種不同的處理組中,事先沒有作任何匹配2)常見的成組設(shè)計(jì)情況有:沒有交代使用匹配方案,均按照成組資料設(shè)計(jì)處理;相當(dāng)于將兩個(gè)樣本視為來自兩個(gè)不同的總體,比較兩個(gè)未知的總體參數(shù)是否相同。3)假定兩樣本分別服從正態(tài)分布,且兩樣本的總體方差相等,可估計(jì)出兩樣本的的合并方差,其計(jì)算式為:(例8.3)如果兩個(gè)總體的方差不同,那么可以使用近似t檢驗(yàn)(或也稱為校正t檢驗(yàn)或t’檢驗(yàn))(這個(gè)不要求掌握)補(bǔ)充:如何判斷兩樣本所來源的總體方差是否相等?第四節(jié)、F檢驗(yàn)(常用的方差齊性檢驗(yàn)的一種)1)用來判斷兩樣本所來源的總體方差是否相等。2)兩組樣本方差不同,那么S1≠S2究竟是由于兩個(gè)樣本的總體方差不同還是僅僅由于抽樣誤差導(dǎo)致3)現(xiàn)假設(shè)樣本標(biāo)準(zhǔn)差間的差別僅僅由于抽樣誤差所導(dǎo)致,那么兩個(gè)樣本方差間的差別應(yīng)該不會(huì)很大,換句話說兩者的比值應(yīng)該在1附近,如果距離1很遠(yuǎn),例如比1大很多或小很多,那么兩樣本所來源的總體方差就可能不同4)統(tǒng)計(jì)學(xué)家發(fā)現(xiàn)方差比值(樣本含量分別為n1與n2)滿足自由度為v1=n1-1與v2=n2-1的F分布,其中v1與v2分別稱為分子自由度與分母自由度。(例8.3)兩組對(duì)象(n1=n2=12)的標(biāo)準(zhǔn)差分別為s1=27.7,s2=19.5,請(qǐng)問兩組患者的總體方差是否相同?課時(shí)七定性資料的統(tǒng)計(jì)描述定性變量的取值為某種屬性,例如:血型(A、B、O、AB)人群中某病發(fā)生與否(發(fā)生、不發(fā)生)性別(男性、女性)視力等級(jí)(差、中、好)第一節(jié)、常用相對(duì)數(shù)及其應(yīng)用相對(duì)數(shù)是分類資料的描述性統(tǒng)計(jì)指標(biāo),是兩個(gè)有聯(lián)系指標(biāo)之比。常用相對(duì)數(shù)有率、構(gòu)成比、相對(duì)比。1、率率(rate)包括頻率和速率*頻率有如下指標(biāo)

*速率如下2、構(gòu)成比(即說明事物內(nèi)部各組成部分所占比例)如下表:某精神病醫(yī)院2010與2012年精神病的住院情況比較疾病2010年2012年病人數(shù)構(gòu)成比(%)病人數(shù)構(gòu)成比(%)抑郁2010.0208.0精神分裂14070.019076.0神經(jīng)質(zhì)2010.0208.0其他2010.0208.0合計(jì)200100.0250100.0特點(diǎn):