醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)_第1頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)_第2頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)_第3頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第一章 緒論1、統(tǒng)計(jì)學(xué) ,是關(guān)于數(shù)據(jù)收集、整理、分析、表達(dá)和解釋的普遍原理和方法。2、研究對(duì)象 :具有不確定性結(jié)果的事物。3、統(tǒng)計(jì)學(xué)作用 :能夠透過(guò)偶然現(xiàn)象來(lái)探測(cè)其規(guī)律性,使研究結(jié)論具有科學(xué)性。4、統(tǒng)計(jì)分析要點(diǎn) :正確選用統(tǒng)計(jì)分析方法,結(jié)合專(zhuān)業(yè)知識(shí)作出科學(xué)的結(jié)論。5、醫(yī)學(xué)統(tǒng)計(jì)學(xué)基本內(nèi)容 :統(tǒng)計(jì)設(shè)計(jì)、數(shù)據(jù)整理、統(tǒng)計(jì)描述、統(tǒng)計(jì)推斷。6、醫(yī)學(xué)統(tǒng)計(jì)學(xué)中的基本概念(1) 同質(zhì)與變異 同質(zhì),指根據(jù)研究目的所確定的觀察單位其性質(zhì)應(yīng)大致相同。 變異,指總體內(nèi)的個(gè)體間存在的、絕對(duì)的差異。統(tǒng)計(jì)學(xué)通過(guò)對(duì)變異的研究來(lái)探索事物。(2) 變量與數(shù)據(jù)類(lèi)型變量 ,是反映實(shí)驗(yàn)或觀察對(duì)象生理、生化、解剖等特征的指標(biāo)。變量的觀測(cè)值

2、,稱(chēng)為 數(shù)據(jù)分為三種類(lèi)型: 定量數(shù)據(jù) ,也稱(chēng) 計(jì)量資料 ,指對(duì)每個(gè)觀察單位某個(gè)變量用 測(cè)量 或其他定量 方法準(zhǔn)確獲得的定量結(jié)果。(如身高、體重、血壓、溫度等) 定性 數(shù)據(jù),也稱(chēng) 計(jì)數(shù)資料 ,指將觀察單位按某種屬性分組 計(jì)數(shù)的定性觀察結(jié)果。包括二分類(lèi)、 無(wú)序多分類(lèi)。(進(jìn)一步分為二分類(lèi)和多分類(lèi),如性別分為男和女,血型分為A 、 B 、O、AB 等)有序數(shù)據(jù) ,也稱(chēng) 半定量數(shù)據(jù)或等級(jí)資料 ,指將觀察單位按某種屬性的不同程度或次序分成 等級(jí) 后分組計(jì)數(shù)的觀察結(jié)果,具有半定量性質(zhì)。統(tǒng)計(jì)方法的選用與數(shù)據(jù)類(lèi)型有密切的關(guān)系。(3) 總體與樣本 總體,指根據(jù)研究目的確定的所有 同質(zhì) 觀察單位的全體,包括所有定義

3、范圍內(nèi)的個(gè)體變量 值。樣本,是從研究總體中隨機(jī)抽取部分有代表性的觀察單位,對(duì)變量進(jìn)行觀測(cè)得到的數(shù)據(jù)。 抽樣,是從研究總體中隨機(jī)抽取部分有代表性的觀察單位。參數(shù),指描述 總體特征 的指標(biāo)。 統(tǒng)計(jì)量,指描述 樣本特征 的指標(biāo)。(4) 誤差 誤差,指觀測(cè)值與真實(shí)值、統(tǒng)計(jì)量與參數(shù)之間的差別。 可分為三種:系統(tǒng)誤差,也稱(chēng)統(tǒng)計(jì)偏倚,是某種必然因素所致,不是偶然機(jī)遇造成的,誤 差的大小通常恒定, 具有明確的方向性 。隨機(jī)測(cè)量誤差,是偶然機(jī)遇所致 , 誤差沒(méi)有固定的大小和方向 。 抽樣誤差,是抽樣引起的統(tǒng)計(jì)量與參數(shù)間的差異。抽樣誤差主要來(lái)源于個(gè)體的變異。 統(tǒng)計(jì)學(xué)主要研究抽樣誤差。(5) 概率 概率,是描述某事

4、件發(fā)生可能性大小的量度。必然事件,事件肯定發(fā)生,概率 P(U) 1; 隨機(jī)事件,事件可能發(fā)生,可能不發(fā)生,概率介于0P(A) ; 1不可能事件,事件肯定不發(fā)生,概率P() 0;小概率事件,事件發(fā)生的可能性很小,概率P(A) 0.05、或 P(A) 0.01。醫(yī)學(xué)科研中,P(A)0.05 作為事物差別有統(tǒng)計(jì)意義,P(A)0.01 作為事物差別有高度統(tǒng)計(jì)意義。第二章定量數(shù)據(jù)的統(tǒng)計(jì)描述定量數(shù)據(jù)的統(tǒng)計(jì)描述方法: 頻數(shù)表、直方圖、統(tǒng)計(jì)指標(biāo)。(1)頻數(shù)分布頻數(shù)分布的目的: 了解數(shù)據(jù)的分布范圍、集中位置以及分布形態(tài)等特征,以便根據(jù)資料分 布情況選擇合適的統(tǒng)計(jì)方法。頻數(shù)分布的用途: 作為陳述資料的形式; 便于

5、觀察數(shù)據(jù)的分布類(lèi)型; 便于發(fā)現(xiàn)數(shù)據(jù)中特大或特小的可疑值; 當(dāng)樣本量大時(shí),可用各組段的頻率作為概率的估計(jì)值。計(jì)算全距( range,R):是一組數(shù)據(jù)的最大值與最小值之差。 R Max-Min 確定組數(shù)與組距樣本量在 100例左右,組數(shù)選擇 815 之間,一般取 10組左右。 組距全距/組數(shù)確定組限 第一組段必須包括最小值,最后一組段必須包括最大值。 最后一組段包括最大值,且一般情況下應(yīng)包含該組段上限,其余各組段區(qū)間左閉右開(kāi)。 計(jì)算各組段頻數(shù)( frequency):即計(jì)算各組段內(nèi)觀察值的個(gè)數(shù)。計(jì)算各組段頻率( percent):即計(jì)算各組段頻數(shù)與總觀察值個(gè)數(shù)之比,用百分?jǐn)?shù)表示。 計(jì)算累計(jì)頻數(shù)(

6、cumulativefrequency)和累計(jì)頻率(cumulativepercent):累計(jì)頻數(shù)是由上至下將頻數(shù)累加; 累計(jì)頻率是由上至下將頻率累加。(2)直方圖 直方圖,是以垂直條段代表頻數(shù)分布的一種圖形。( 3)頻數(shù)分布表的用途1、作為稱(chēng)述資料的形式,可以代替原始資料,便于進(jìn)一步分析。2、便于觀察數(shù)據(jù)的分布類(lèi)型。資料分布類(lèi)型分為:對(duì)稱(chēng)分布和偏態(tài)分布。 在統(tǒng)計(jì)分析時(shí)常需要根據(jù)資料的分布形式選擇相應(yīng)的統(tǒng)計(jì)分析方法,因此對(duì)數(shù)據(jù)分布形式 的判定非常重要。3、便于發(fā)現(xiàn)資料中某些遠(yuǎn)離群體的特大或特小值。4、當(dāng)樣本含量比較大時(shí),可用各組段的頻率作為概率的估計(jì)值。集中趨勢(shì)的統(tǒng)計(jì)指標(biāo) 平均數(shù),是描述一組觀

7、察值集中位置或平均水平的統(tǒng)計(jì)指標(biāo),常作為一組數(shù)據(jù)的代表值用 于分析和進(jìn)行組間的比較。常用的有算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、百分位數(shù)等。 算術(shù)均數(shù),等于一個(gè)變量所有觀察值的和除以觀察值個(gè)數(shù)??傮w均數(shù)用希臘字母 表示,樣本均數(shù)用符號(hào) 拔表示。 算術(shù)均數(shù)適用于對(duì)稱(chēng)分布的資料,如分布均勻的小樣本數(shù)據(jù)或近似正態(tài)分布的大樣本數(shù)據(jù)。 算術(shù)均數(shù)易受極端值的影響,并且受極大值的影響大于受極小值的影響。幾何均數(shù)幾何均數(shù)( geometric mean,G),等于一個(gè)變量所有 n 個(gè)觀察值的乘積的 n次方根。 幾何均數(shù)適用于取對(duì)數(shù)后近似呈對(duì)稱(chēng)分布的資料,尤其是右偏態(tài)分布數(shù)據(jù)。醫(yī)學(xué)研究中常用于比例數(shù)據(jù)?!咀ⅰ坑?jì)算幾何均

8、數(shù)的觀察值不能小于或等于0,因?yàn)闊o(wú)法求對(duì)數(shù)。中位數(shù)中位數(shù)( median,M),是在按大小順序排列的變量的所有觀察值中,位于正中間的一個(gè) 或兩個(gè)數(shù)值。當(dāng)數(shù)據(jù)呈偏態(tài)分布、或頻數(shù)分布兩端無(wú)確定數(shù)值,均宜采用中位數(shù)描述集中趨勢(shì)。 中位數(shù)的確定取決于它在數(shù)據(jù)序列中的位置,因此對(duì)極端值不敏感。百分位數(shù)百分位數(shù)( percentile),是一個(gè)位置指標(biāo),它將一組變量值排列后劃分為若干相等部分的 分割點(diǎn)數(shù)值。用 Px表示, X 用百分?jǐn)?shù)表示。表示在按照升序排列的數(shù)據(jù)中,其左側(cè)( Px )的觀察值個(gè)數(shù)在整個(gè)樣本中所占百分比為 X%,其右側(cè)(Px )的觀察值個(gè)數(shù)在整個(gè)樣本中所占百分比為(100X )% 。百分位

9、數(shù)不論資料分布類(lèi)型均可計(jì)算,在實(shí)際工作中常用于確定醫(yī)學(xué)參考值范圍;在假設(shè) 檢驗(yàn)中用作拒絕或不拒絕檢驗(yàn)假設(shè)的界值。百分位數(shù)并非由全部觀察值綜合計(jì)算得來(lái),因此,它不如均數(shù)和標(biāo)準(zhǔn)差精確;然而中間部 分的百分位數(shù)因不受資料中個(gè)別極端數(shù)據(jù)的影響,具有較好的穩(wěn)定性。小結(jié)指標(biāo)意義適用場(chǎng)合均數(shù)個(gè)體的平均值對(duì)稱(chēng)分布,特別是正態(tài)分布資料。幾何均數(shù)平均倍數(shù)取對(duì)數(shù)后對(duì)稱(chēng)分布。中位數(shù)位次居中的觀察值非對(duì)稱(chēng)分布;半定量資料;末端無(wú)確切數(shù)值;分布不明。變異程度的統(tǒng)計(jì)指標(biāo) 變異指標(biāo),又稱(chēng)離散指標(biāo), 用以描述一組計(jì)量資料各觀察值之間參差不齊的程度。 變異指標(biāo)越大,觀察值之間差異愈大,說(shuō)明變異程度越大;反之亦然。 常用的有極差、

10、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差和變異系數(shù)。極差極差( range, R ) ,等于一個(gè)變量所有觀察值中最大值與最小值之間的差值。R Max Min 缺點(diǎn):沒(méi)有利用觀察值的全部信息,不能反映其它數(shù)據(jù)的離散度;各樣本含量大小懸殊時(shí),不宜比較其極差; 極差的抽樣誤差也較大,所以不夠穩(wěn)定。 極差僅適用于對(duì)未知分布的小樣本資料作粗略的分析。四分位數(shù)間距 四分位數(shù),是統(tǒng)計(jì)學(xué)對(duì)特殊的三個(gè)百分位數(shù) P25% 、 P50% 和 P75%的統(tǒng)稱(chēng) 四分位數(shù)間距( quartile range,Q),等于第三四分位數(shù)與第一四分位數(shù)之間的差值。 Q P75% P25%缺點(diǎn): 沒(méi)有利用觀察值的全部信息,不能反映其它數(shù)據(jù)的離散

11、度; 四分位數(shù)間距僅用來(lái)描述大樣本偏態(tài)資料的變異情況。方差方差( variance) , 是描述一個(gè)變量的所有觀察值與總體均數(shù)的平均離散程度的指標(biāo)。 總體方差用 2表示,樣本方差用 S2 表示。標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差( standarddeviation, S),是描述一個(gè)變量的所有觀察值與均數(shù)的平均離散程度的指標(biāo)。 總體標(biāo)準(zhǔn)差用 表示,樣本標(biāo)準(zhǔn)差用 S 表示。標(biāo)準(zhǔn)差 方差或標(biāo)準(zhǔn)差屬同類(lèi)變異指標(biāo),它們多用來(lái)描述均勻分布或近似正態(tài)分布的資料,大、小 樣本均可,其中以標(biāo)準(zhǔn)差的應(yīng)用最廣,通常與均數(shù)結(jié)合使用。比如在許多醫(yī)學(xué)研究報(bào)告中 常用 X 拔 ±S 的形式表達(dá)資料。變異系數(shù)變異系數(shù)( coeffi

12、cient of variation , CV ), 是一個(gè)度量相對(duì)離散程度的指標(biāo)。CV 是無(wú)量綱的指標(biāo),可以用來(lái)比較幾個(gè)量綱不同的指標(biāo)變量之間的離散程度的差異,或 比較量綱相同但均數(shù)相差懸殊的變量之間的離散程度的差異。小結(jié)指標(biāo)意義適用場(chǎng)合極差觀察值的取值范圍不拘分布形式,概略分析。四分位數(shù) 間距居中半數(shù)觀察值的極差非對(duì)稱(chēng)分布;半定量資料;末端無(wú)確切數(shù)值;分布不明。標(biāo)準(zhǔn)差(方差)觀察值距離均數(shù)的平均程度對(duì)稱(chēng)分布,特別是正態(tài)分布資料。變異系數(shù)變異程度大小的對(duì)比不同量綱的變量間比較; 量綱相同但數(shù)量級(jí)相差懸殊的變 量間比較。第三章 正態(tài)分布與醫(yī)學(xué)參考值范圍正態(tài)分布, 是一種連續(xù)型隨機(jī)變量常見(jiàn)而重要

13、的分布。正態(tài)曲線(xiàn) ,是一條高峰位于中央,兩側(cè)逐漸下降并完全對(duì)稱(chēng),曲線(xiàn)兩端永遠(yuǎn)不與橫軸相交 的鐘型曲線(xiàn)。如果隨機(jī)變量 X 的分布服從概率密度函數(shù)和概率分布函數(shù)稱(chēng)連續(xù)型隨機(jī)變量 X 服從正態(tài)分 布,記為 XN ( , 2。 )為圓周率,e 為自然對(duì)數(shù)的底值, 為總體標(biāo)準(zhǔn)差, 為總體均數(shù)。正態(tài)分布的特征1、正態(tài)分布是單峰分布,以X=為中心,左右完全對(duì)稱(chēng),正態(tài)曲線(xiàn)以X 軸為漸近線(xiàn),兩端與 X 軸不相交。2、正態(tài)曲線(xiàn)在X=處有最大值,其值為f( )=1/( ;2X越) 遠(yuǎn)離 ,f(X) 值越小,在 X= ± 處有 拐點(diǎn),呈現(xiàn)鐘形。3、正態(tài)分布完全由參數(shù) 和決定。 是位置參數(shù),決定正態(tài)曲線(xiàn)在 X

14、 軸上的位置。在 一定時(shí), 增大,曲線(xiàn)沿橫軸向右移動(dòng); 較小,曲線(xiàn)沿橫軸向左移動(dòng)。 是形狀參數(shù),決定正態(tài)曲線(xiàn)的分布形態(tài)。 越大,曲線(xiàn)的形狀越 “矮胖”,表示數(shù)據(jù)分布越 分散; 越小,曲線(xiàn)的形狀越 “瘦高”,表示數(shù)據(jù)分布越集中。正態(tài)曲線(xiàn)下面積分布規(guī)律1、服從正態(tài)分布的隨機(jī)變量在某一區(qū)間上的曲線(xiàn)下面積與其在同一區(qū)間上取值的概率相等2、曲線(xiàn)下的總面積為1 或 100%,以 為中心左右兩側(cè)面積各占 50%,越靠近 處曲線(xiàn)下面積越大,兩邊逐漸減少。3、所有的正態(tài)曲線(xiàn),在 左右的任意個(gè)標(biāo)準(zhǔn)差范圍內(nèi)面積相同。一些特殊情況,在 ±范圍內(nèi)的面積約為 68.27%,在±1.96范圍內(nèi)的面積約為

15、 95.00% ,在±2.58范圍內(nèi)的面積約為 99.00% 。標(biāo)準(zhǔn)正態(tài)分布對(duì)任意一個(gè)服從 N (, 分2 布)的隨機(jī)變量 X,經(jīng) Z=X- / 變換都可以轉(zhuǎn)為 =0、 =1的標(biāo)準(zhǔn)正態(tài)分布,也稱(chēng)隨機(jī)變量的標(biāo)準(zhǔn)化變換。標(biāo)準(zhǔn)正態(tài)分布的應(yīng)用 實(shí)際應(yīng)用中,經(jīng) z 變換可把求解任意一個(gè)正態(tài)分布曲線(xiàn)下面積的問(wèn)題,轉(zhuǎn)化成標(biāo)準(zhǔn)正態(tài)分 布曲線(xiàn)下相應(yīng)面積的問(wèn)題。正態(tài)分布的應(yīng)用1、制定醫(yī)學(xué)參考值范圍2、質(zhì)量控制3、正態(tài)分布是很多統(tǒng)計(jì)方法的理論基礎(chǔ) 醫(yī)學(xué)參考值范圍 醫(yī)學(xué)參考值范圍,指正常人的解剖、生理、生化、免疫及組織代謝產(chǎn)物的含量等各種數(shù)據(jù) 的波動(dòng)范圍。醫(yī)學(xué)參考值范圍,習(xí)慣上是包含95%的參照總體的范圍。

16、制訂的注意事項(xiàng)a、抽取足夠例數(shù)的同質(zhì) “正常人”樣本“正常人”的定義,樣本量( n>120),隨機(jī)化。b、確定具有實(shí)際意義的統(tǒng)一測(cè)量標(biāo)準(zhǔn)指標(biāo)的測(cè)量方法等要有規(guī)定,控制測(cè)量誤差。c、根據(jù)指標(biāo)的性質(zhì)確定是否要分組根據(jù)實(shí)際情況、專(zhuān)業(yè)知識(shí)。d、根據(jù)指標(biāo)含義決定單、雙側(cè)范圍 單側(cè)下限,過(guò)低異常;單側(cè)上限,過(guò)高異常;雙側(cè),過(guò)高、過(guò)低均異常。e、選擇適當(dāng)?shù)陌俜址秶?絕大多數(shù)人,一般 80%、90%、95%、99%; 減少誤診,取較大范圍;減少漏診,取較小范圍。f 、估計(jì)參考值范圍根據(jù)資料分布類(lèi)型:正態(tài)分布法、百分位數(shù)法。第四章 定性數(shù)據(jù)的統(tǒng)計(jì)描述相對(duì)數(shù) ,是兩個(gè)有關(guān)的絕對(duì)數(shù)之比,也可以是兩個(gè)統(tǒng)計(jì)指標(biāo)之

17、比。 計(jì)算相對(duì)數(shù)的意義 主要是把基數(shù)化作相等,便于相互比較。相對(duì)數(shù) 主要用于 定性資料的統(tǒng)計(jì)描述。 常用的指標(biāo)有頻率、構(gòu)成比、相對(duì)比。頻率頻率 (rate),表示在一定范圍內(nèi)某現(xiàn)象的發(fā)生數(shù)與可能發(fā)生的總數(shù)之比,說(shuō)明某現(xiàn)象出現(xiàn) 的頻率或概率。總體率 用 來(lái)表示, 樣本率 用 P 來(lái)表示。 需要注意的是,率在更多情況下是一個(gè)具有時(shí)間概念的指標(biāo),即用于說(shuō)明在一段時(shí)間內(nèi)某 現(xiàn)象發(fā)生的強(qiáng)度或頻率。構(gòu)成比構(gòu)成比, 表示某事物內(nèi)部各組成部分在整體中所占的比重。構(gòu)成比之和應(yīng)為100,某一構(gòu)成部分的增減會(huì)影響其他構(gòu)成部分相應(yīng)的減少或增加;而某一部分率的變化并不影響其他部分率的變化,且其平均率不能簡(jiǎn)單地將各率相加

18、后平均 求得。相對(duì)比相對(duì)比 ,是 A、B 兩個(gè)有關(guān)聯(lián)指標(biāo)之比,用以描述兩者的對(duì)比水平。 相對(duì)危險(xiǎn)度( relative risk , RR ), 用于流行病學(xué)中隊(duì)列研究資料。 比數(shù)比( odds ratio,OR),用于流行病學(xué)中病例對(duì)照研究資料。 小結(jié)指標(biāo)計(jì)算公式適用場(chǎng)合頻率n/N估計(jì)總體中某一結(jié)局發(fā)生的概率或可能性構(gòu)成比n1/N,n2/N, ,nk/N估計(jì)總體中所有可能結(jié)局所占的比例或比重相對(duì)比A/B估計(jì)兩個(gè)指標(biāo)的相對(duì)大小構(gòu)成比表示某事物內(nèi)部各部分所占的比例或比重,頻率是表明某現(xiàn)象發(fā)生的頻率或概率。 構(gòu)成比的分子中的個(gè)體一定是分母中的一部分,而相對(duì)比則不一定;構(gòu)成比是同一類(lèi)事物 的數(shù)值之比

19、,相對(duì)比可以是任意兩個(gè)數(shù)值之比。相對(duì)數(shù)的使用注意a、區(qū)別構(gòu)成比和頻率頻率,強(qiáng)度相對(duì)數(shù);構(gòu)成比,結(jié)構(gòu)相對(duì)數(shù)。b、使用相對(duì)數(shù)時(shí)分母不宜過(guò)小如分母太小,用絕對(duì)數(shù)表示,如 “3例中死亡例 ”。c、注意相對(duì)數(shù)的可比性研究對(duì)象要同質(zhì),方法要相同,觀察時(shí)期要一致等。d、考慮存在抽樣誤差對(duì)總體進(jìn)行推斷應(yīng)作統(tǒng)計(jì)學(xué)檢驗(yàn)。率的標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化率, 是為了在比較兩個(gè)不同人群的患病率、發(fā)病率、死亡率等資料時(shí),消除內(nèi)部構(gòu) 成(如年齡、性別、工齡、病程長(zhǎng)短等)不同而不能直接比較所產(chǎn)生的影響。 標(biāo)準(zhǔn)化率僅用于相互比較,不代表實(shí)際水平;當(dāng)標(biāo)準(zhǔn)構(gòu)成不同時(shí),標(biāo)準(zhǔn)化率一般也不相同標(biāo)準(zhǔn)構(gòu)成的選取 從外部取一個(gè)公認(rèn)的標(biāo)準(zhǔn)構(gòu)成比,如全國(guó)范圍或

20、全省范圍的數(shù)據(jù)、國(guó)際間比較時(shí)取世界 通用標(biāo)準(zhǔn)。 將幾個(gè)組的觀察例數(shù)合并,計(jì)算出合并的構(gòu)成比,以其作為標(biāo)準(zhǔn)構(gòu)成比。 取某一個(gè)組的構(gòu)成比為標(biāo)準(zhǔn)構(gòu)成比。醫(yī)學(xué)中常用相對(duì)數(shù)指標(biāo) 死亡率,又稱(chēng)粗死亡率, 表示某年某地每千人中的死亡人數(shù)。反映當(dāng)?shù)鼐用窨傮w死亡水平 。 對(duì)不同地區(qū)的死亡率進(jìn)行比較時(shí),應(yīng)注意不同地區(qū)人口年齡或性別構(gòu)成的影響。若年齡或 性別構(gòu)成存在差異,需先將死亡率標(biāo)化后再進(jìn)行比較。年齡別死亡率, 表示某年某地某年齡組每千人口中的死亡數(shù)。死因別死亡率, 表示某年某地每 10 萬(wàn)人中因某種疾病死亡的人數(shù)。反映各類(lèi)病傷死亡對(duì)居 民生命的危害程度。死亡 (因)構(gòu)成,也稱(chēng)相對(duì)死亡比, 表示全部死亡人數(shù)中,

21、死于某死因者占總死亡數(shù)的百分 比。反映各種死因的相對(duì)重要性。疾病統(tǒng)計(jì)指標(biāo) 發(fā)病率, 表示在一定期間內(nèi),一定人群中某病新發(fā)生的病例出現(xiàn)的頻率。反映疾病對(duì)人群 健康影響和描述疾病分布狀態(tài)的一項(xiàng)測(cè)量指標(biāo)?;疾÷?,也稱(chēng)現(xiàn)患率, 表示某一時(shí)點(diǎn)某人群中患某病的頻率。反映病程較長(zhǎng)的慢性病的發(fā) 生或流行情況。病死率, 表示某期間內(nèi),某病患者中因某病死亡的頻率。反映該疾病的嚴(yán)重程度和醫(yī)療水 平。治愈率, 表示接受治療的病人中治愈的頻率。第五章 統(tǒng)計(jì)表與統(tǒng)計(jì)圖統(tǒng)計(jì)表, 把反映某事物的數(shù)量特征以及相互關(guān)系的統(tǒng)計(jì)數(shù)字用表格的形式歸納起來(lái)。 特點(diǎn):避免冗長(zhǎng)的文字?jǐn)⑹?、減少篇幅;便于表達(dá)事物間的內(nèi)在聯(lián)系和區(qū)別; 便于分析

22、、比較并易于發(fā)現(xiàn)和糾正錯(cuò)誤。編制原則a、重點(diǎn)突出,簡(jiǎn)單明了一張表表達(dá)一個(gè)中心內(nèi)容或主題。b、主謂分明,層次清楚定語(yǔ)在標(biāo)題內(nèi),主語(yǔ)作為橫標(biāo)目,謂語(yǔ)作為縱標(biāo)目。c、數(shù)據(jù)表達(dá)規(guī)范、文字和線(xiàn)條從簡(jiǎn) 結(jié)構(gòu)a、標(biāo)題位于統(tǒng)計(jì)表的最上部,應(yīng)包括表的編號(hào)。b、標(biāo)目 縱標(biāo)目標(biāo)示相應(yīng)一列(或數(shù)列)的內(nèi)容;橫標(biāo)目標(biāo)示相應(yīng)行的內(nèi)容。c、線(xiàn)條不宜太多,一般為三線(xiàn)表; 不允許使用豎線(xiàn)與斜線(xiàn)。d、數(shù)字一律使用阿拉伯?dāng)?shù)字; 同一指標(biāo)的小數(shù)位數(shù)應(yīng)一致,位次要對(duì)齊; 數(shù)值為零時(shí)應(yīng)寫(xiě)“ 0”,缺省用“”表示,不存在或不需要用“”表示。e、備注 不是統(tǒng)計(jì)表的必須項(xiàng)目,需要時(shí)才用; 位于統(tǒng)計(jì)表的最下部,表格之外,用“* ”號(hào)標(biāo)出。統(tǒng)計(jì)圖

23、 統(tǒng)計(jì)圖 是指用幾何圖形(點(diǎn)、線(xiàn)段、直條等)顯示統(tǒng)計(jì)指標(biāo)的大小、對(duì)比關(guān)系或變化趨勢(shì)。 特點(diǎn) 與統(tǒng)計(jì)表相比,統(tǒng)計(jì)圖更加直觀,更便于比較和分析。但它不能確切地顯示數(shù)字大小,因 此常與統(tǒng)計(jì)表一并使用。常用的統(tǒng)計(jì)圖有:條圖、圓圖、百分條圖 、線(xiàn)圖、直方圖等。制作原則a、根據(jù)資料性質(zhì)、分析目的選用適當(dāng)?shù)慕y(tǒng)計(jì)圖b、一個(gè)圖表達(dá)一個(gè)中心內(nèi)容或主題。c、圖形應(yīng)準(zhǔn)確、美觀。結(jié)構(gòu)a、標(biāo)題 位于統(tǒng)計(jì)圖的下方,應(yīng)包括圖的編號(hào)。b、圖域 一般用直角坐標(biāo)系第一象限的位置表示圖域。c、標(biāo)目縱標(biāo)目和橫標(biāo)目,表示縱軸和橫軸數(shù)字刻度; 一般有度量衡單位。d、圖例 對(duì)圖中不同顏色或圖案代表的指標(biāo)進(jìn)行注釋?zhuān)?圖例放在橫標(biāo)目與標(biāo)題之間,

24、或放在圖域中。e、刻度 刻度數(shù)值從小到大,縱軸由下向上,橫軸由左向右。描述定量數(shù)據(jù)的統(tǒng)計(jì)圖 直方圖, 用于表示連續(xù)變量頻數(shù)分布情況。線(xiàn)圖 ,適用于描述一個(gè)變量隨另一個(gè)變量變化的趨勢(shì)。 半對(duì)數(shù)線(xiàn)圖, 用來(lái)比較事物之間相對(duì)的變化速度。 箱圖 適用于比較多組資料的集中趨勢(shì)和離散趨勢(shì)。一般選用五個(gè)描述統(tǒng)計(jì)量(Min 、P25、M、P75、 Max )來(lái)繪制。誤差條圖, 適用于比較多組資料的均值和可信區(qū)間。散點(diǎn)圖, 用點(diǎn)的密集程度和變化趨勢(shì)來(lái)表示兩指標(biāo)之間的直線(xiàn)或曲線(xiàn)關(guān)系。 條圖 ,適用于各組資料之間指標(biāo)的比較。圓圖, 描述一組構(gòu)成比資料。百分條圖, 描述多組構(gòu)成比資料小結(jié)圖形主要目的說(shuō)明條圖比較各組之

25、間的統(tǒng)計(jì)指標(biāo)的差別一個(gè)坐標(biāo)軸為組名稱(chēng),另一個(gè)坐標(biāo)軸為頻率;多個(gè)指標(biāo)變量可放在一個(gè)圖中圓圖描述變量的構(gòu)成比沒(méi)有坐標(biāo)軸;用圖例區(qū)分各部分百分條圖比較多個(gè)指標(biāo)變量的構(gòu)成比一個(gè)坐標(biāo)軸為各變量名稱(chēng),另一個(gè)坐標(biāo)軸刻度為 0100% ;用圖例區(qū)分各部分線(xiàn)圖描述一個(gè)變量隨另一個(gè)變量變化的趨勢(shì)兩個(gè)變量的觀察值必須一一對(duì)應(yīng);橫軸為自變量,縱軸為因變量半對(duì)數(shù)線(xiàn) 圖同上因變量的變異較大時(shí)使用;其他同上箱圖比較一個(gè)變量在多個(gè)組上的分布一個(gè)坐標(biāo)軸為組名稱(chēng),另一個(gè)坐標(biāo)軸為該變量的取值散點(diǎn)圖描述兩個(gè)指標(biāo)變量之間的直線(xiàn)相關(guān)關(guān)系兩個(gè)變量的觀察值可以不一一對(duì)應(yīng);橫軸為自變量,縱軸為因變量第六章 參數(shù)估計(jì)抽樣誤差 :由個(gè)體差異和抽樣

26、造成的樣本統(tǒng)計(jì)量與總體參數(shù)的差異。 包括:樣本統(tǒng)計(jì)量與總體參數(shù)間的差異,樣本統(tǒng)計(jì)量間的差異。具有如下特點(diǎn): 1、各樣本均數(shù)未必等于總體均數(shù);2、各樣本均數(shù)間存在差異;3、 樣本均數(shù)的分布圍繞著總體均數(shù)呈現(xiàn)中間多、兩邊少、左右基本對(duì)稱(chēng),近似服從正態(tài)分布;4、樣本均數(shù)的變異范圍較之原變量的變異范圍??;5、隨著樣本含量的增大,樣本均數(shù)的變異范圍逐漸縮小。均數(shù)的標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤 ( standard error ,SE),指樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差。均數(shù)的標(biāo)準(zhǔn)誤 ( standarderror ofmean,SEM ),指樣本均數(shù)的標(biāo)準(zhǔn)誤。它反映樣本均數(shù)間的離散程度,反映樣本均數(shù)與相 應(yīng)總體均數(shù)間的差異,說(shuō)明了

27、均數(shù)抽樣誤差的大小。在 n 一定的情況下,標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差呈正比,說(shuō)明當(dāng)總體中各觀測(cè)值變異較小時(shí),抽到的X 拔 與 可能相差較小, X 拔 用 估計(jì) 的可靠程度高;反之,當(dāng)總體中各觀測(cè)值變異較大時(shí),可靠程度較低。標(biāo)準(zhǔn)誤與樣本含量的平方根呈反比,說(shuō)明在同一總體中隨機(jī)抽樣,n 越大,標(biāo)準(zhǔn)誤越小。率的抽樣誤差率的標(biāo)準(zhǔn)誤 ( standarderror ofrate,SER),指樣本率的標(biāo)準(zhǔn)誤。它反映樣本率間的離散程度,反映樣本率與相應(yīng)總體率間的差異,說(shuō)明了率抽樣誤差的大小。總體率標(biāo)準(zhǔn)誤用 p 表示,樣本率標(biāo)準(zhǔn)誤用 Sp 表示。總體均數(shù)的估計(jì)概述點(diǎn)估計(jì) ( point estimation ),是用樣本

28、統(tǒng)計(jì)量直接作為其總體參數(shù)的估計(jì)值。區(qū)間估計(jì) ( interval estimation ),是按預(yù)先給定的概率 (1- 所)確定的包含未知總體參數(shù)的一個(gè)范圍。點(diǎn)估計(jì): 優(yōu)點(diǎn):表達(dá)簡(jiǎn)單 缺點(diǎn):未考慮抽樣誤差,無(wú)法評(píng)價(jià)參數(shù)估計(jì)的準(zhǔn)確程度可信區(qū)間在區(qū)間估計(jì)中,預(yù)先給定的概率(1- ) ,稱(chēng)為 可信度 ( confidence level ),常取 95% 或99% 。通過(guò)可信度,計(jì)算得到的區(qū)間范圍,稱(chēng)為 可信區(qū)間 ( confidence interval , CI )。 可信區(qū)間由兩個(gè)數(shù)值界定的可信限( confidence limit , CL )構(gòu)成,較小的數(shù)值為下限( lowerlimit

29、,L ) ,較大的數(shù)值為上限( upper limit ,U ),一般表示為 LU 。 可信度為 95% 可信區(qū)間的涵義: 若重復(fù) 100次樣本含量相同的抽樣,每個(gè)樣本均按同一方法 構(gòu)建 95%可信區(qū)間,則理論上平均有 95個(gè)可信區(qū)間包含了總體均數(shù),只有 5個(gè)可信區(qū)間未包 含??尚艆^(qū)間估計(jì)的優(yōu)劣: 準(zhǔn)確性,反映可信度 1-的大小,其值越接近 1越好。 精確性,用可信區(qū)間的寬度 CU CL衡量,寬度越小越好。t 分布t 分布: 主要用于總體均數(shù)的區(qū)間估計(jì)和t 檢驗(yàn)等。為自由度 ( degree of freedom, df ),指能夠自由取值的變量個(gè)數(shù)。t 分布的特點(diǎn): 1、 t 分布圖是一簇曲

30、線(xiàn),曲線(xiàn)的形態(tài)變化與自由度有關(guān)。2、隨 的增大,曲線(xiàn)越來(lái)越接近標(biāo)準(zhǔn)正態(tài)分布曲線(xiàn);3、當(dāng) 時(shí), t 分布的極限分布就是標(biāo)準(zhǔn)正態(tài)分布。4、t分布的密度曲線(xiàn)下面積有一定的規(guī)律性。在t界值表中,橫標(biāo)目為自由度,縱標(biāo)目為尾部概率。一側(cè)尾部面積稱(chēng)為單側(cè)概率( one-tailed probability ),兩側(cè)尾部面積之和稱(chēng)為雙側(cè)概率(two-tailed probability )。從t界值表中看出:在相同自由度時(shí), t 值越大,概率 P越小。小結(jié)區(qū)別 總體均數(shù)的可信區(qū)間 點(diǎn)參考值范圍含義 按預(yù)先給定的概率確定的 未知參數(shù) 的可能范圍?!罢H?”的解剖,生理, 生化等某項(xiàng)指標(biāo)的波動(dòng)范 圍??傮w均數(shù)的

31、波動(dòng)范圍個(gè)體值的波動(dòng)范圍計(jì)算 未知:正態(tài)分布:±z /2S公式 已知或未知但 n>60:(雙側(cè))偏態(tài)分布: Px P100-x(雙側(cè))樣本 n越大, CI越?。?n,n越大,參考值范圍越穩(wěn)兩總體均數(shù)差值的區(qū)間估計(jì)在實(shí)際工作中,常常需要估計(jì)兩總體均數(shù)之差1 2的大小,需估計(jì)兩總體均數(shù)差值的可信區(qū)間。總體率的區(qū)間估計(jì)小樣本率的區(qū)間估計(jì):在樣本例數(shù)較小,且樣本率接近 1或 0時(shí),利用二項(xiàng)分布可估計(jì)其總體率的(1-)可信區(qū)間。當(dāng)n50,樣本例數(shù) n和陽(yáng)性例數(shù) Xn/2時(shí),直接查表得到 95%和 99%可信區(qū)間。當(dāng)陽(yáng)性例數(shù) X > n/2時(shí),用 nX查表,獲得總體陰性率可信區(qū)間,再

32、用1減去總體陰性率可信區(qū)間,既為總體陽(yáng)性率可信區(qū)間。大樣本率的區(qū)間估計(jì)在樣本例數(shù)較大,且 p 和 1p 均不太小,如 np 與 n(1 p)均大于 5 時(shí),樣本率 p 的抽樣分 布近似正態(tài)分布,可按正態(tài)分布近似法求總體率的 (1-可)信區(qū)間。兩總體率差值的區(qū)間估計(jì)設(shè)兩樣本率分別為 p1和p2,當(dāng) n1與 n2均較大,且 p1 ,1 p1及p2 ,1p2均不太小,如 n1 p1 、 n1(1 p1) 、 n2 p2 、 n2(1 p2)均大于 5時(shí), 可采用正態(tài)近似法對(duì)兩總體率差值進(jìn)行可信區(qū)間估計(jì)。第七章 假設(shè)檢驗(yàn)假設(shè)檢驗(yàn) ( hypothesis testing )也稱(chēng)顯著性檢驗(yàn)( signi

33、ficance test ),是用來(lái)判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成 的統(tǒng)計(jì)推斷方法。假設(shè)檢驗(yàn)的基本思想反證法思想: 先提出假設(shè),再用適當(dāng)?shù)慕y(tǒng)計(jì)方法確定假設(shè)成立的可能性大小,如可能性小,則認(rèn)為假設(shè) 不成立。小概率事件:是指在一次試驗(yàn)中基本上不大會(huì)發(fā)生的事件。假設(shè)檢驗(yàn)的基本步驟a、建立假設(shè)無(wú)效假設(shè)( null hypothesis ),記為 H0,指需要檢驗(yàn)的假設(shè),即 1=。2b、確定檢驗(yàn)水準(zhǔn)檢驗(yàn)水準(zhǔn)( level of a test )也稱(chēng)為顯著性水準(zhǔn)( significancelevel ),是預(yù)先規(guī)定的判斷小概率事件的概率尺度,記為 。實(shí)際中一般取 =0.0

34、5 或 =0.01 。c、選擇檢驗(yàn)方法,計(jì)算統(tǒng)計(jì)量 根據(jù)資料類(lèi)型、研究設(shè)計(jì)方案和統(tǒng)計(jì)推斷的目的,選擇適當(dāng)?shù)臋z驗(yàn)方法和計(jì)算公式。如: t 檢驗(yàn)、 u 檢驗(yàn)、 F 檢驗(yàn)、 2檢驗(yàn)。c、確定 P 值,作出統(tǒng)計(jì)推斷結(jié)論P(yáng)值( probabilityvalue),指由 H0 所規(guī)定的總體做重復(fù)隨機(jī)抽樣,獲得等于及大于當(dāng)前檢驗(yàn)統(tǒng)計(jì)量的概率。確定 P 值的方法: 依據(jù)檢驗(yàn)統(tǒng)計(jì)量的自由度、檢驗(yàn)水準(zhǔn),查檢驗(yàn)統(tǒng)計(jì)量對(duì)應(yīng)的界值表,通過(guò)檢驗(yàn)界值,得到 與檢驗(yàn)統(tǒng)計(jì)量相對(duì)應(yīng)的 P 值范圍。如: u0.05/2=1.96對(duì)應(yīng)的 P 值為 0.05。d、確定 P 值,作出統(tǒng)計(jì)推斷結(jié)論假設(shè)檢驗(yàn)規(guī)定:如果一次試驗(yàn)結(jié)果?P,拒絕

35、H0 ,結(jié)論為“差別有統(tǒng)計(jì)學(xué)意義”。?P,不拒絕 H0 ,結(jié)論為“差別沒(méi)有統(tǒng)計(jì)學(xué)意義P 值的習(xí)慣表述:P >0.05稱(chēng)“不顯著”(not significant );P 0.0稱(chēng)5 “顯著”( significant );P 0.0稱(chēng)1“非常顯著”(highly significant )。假設(shè)檢驗(yàn)中兩類(lèi)錯(cuò)誤 假設(shè)檢驗(yàn)是利用小概率反證法思想,從問(wèn)題的對(duì)立面(H0)出發(fā)間接判斷要解決的問(wèn)題 (H1)是否成立,然后在假定 H0成立的條件下計(jì)算檢驗(yàn)統(tǒng)計(jì)量,最后根據(jù)P值判斷結(jié)果,此推斷結(jié)論具有概率性,因而無(wú)論拒絕還是不拒絕H0,都可能犯錯(cuò)誤。檢驗(yàn)效能( power of test ),指當(dāng)兩總體

36、確有差別,按 水準(zhǔn),假設(shè)檢驗(yàn)?zāi)馨l(fā)現(xiàn)其差別的能力。記為1- 。愈小, 愈大;愈大, 愈小。若要同時(shí)減小型錯(cuò)誤和型錯(cuò)誤,唯一方法是增加樣本量。第七章單樣本 t 檢驗(yàn)( one sample t-test),適用于樣本均 X 拔 與已知均數(shù)0的比較,目的是檢驗(yàn)樣本均數(shù) 0 所代表的未知總體均數(shù) 是否與已知總體均數(shù)0有差別。已知總體均數(shù) 0一般指理論值、標(biāo)準(zhǔn)值或經(jīng)過(guò)大量觀察所得到的穩(wěn)定值。配對(duì)樣本均數(shù) t 檢驗(yàn)( paired t-test),適用于配對(duì)設(shè)計(jì)的計(jì)量資料兩相關(guān)樣本均數(shù)的比 較,目的是檢驗(yàn)兩相關(guān)樣本均數(shù)所代表的未知總體均數(shù)是否有差別。配對(duì)設(shè)計(jì)( paired design),是將受試對(duì)象按

37、某些重要特征相近的原則配成對(duì)子,每對(duì)中的兩個(gè)個(gè)體隨機(jī)地給予兩種處理。配對(duì)設(shè)計(jì)處理分配方式:?將同一受試對(duì)象處理前后的結(jié)果進(jìn)行比較; ?同一受試對(duì)象隨機(jī)分配接受不同處理;?同一標(biāo)本的兩個(gè)部位測(cè)試同一指標(biāo);?兩個(gè)同質(zhì)受試對(duì)象分別接受兩種處理。兩獨(dú)立樣本均數(shù) t 檢驗(yàn)( two independent samples t-test ),適用于完全隨機(jī)設(shè)計(jì)兩獨(dú)立樣 本均數(shù)的比較,目的是檢驗(yàn)兩獨(dú)立樣本均數(shù)所代表的未知總體均數(shù)是否有差別。完全隨機(jī)設(shè)計(jì)( completely random design):從某研究總體隨機(jī)抽取一定數(shù)量的研究對(duì) 象,將其隨機(jī)分配到兩組,接受不同的處理后,測(cè)量某指標(biāo)后進(jìn)行組間比

38、較。兩獨(dú)立樣本均數(shù) t 檢驗(yàn)要求兩樣本所代表的總體方差相等 ,即方差齊性 注意事項(xiàng):a、假設(shè)檢驗(yàn)結(jié)論正確的前提 作假設(shè)檢驗(yàn)用的樣本資料,必須能代表相應(yīng)的總體,各對(duì)比組具有良好的組間均衡 性。b、檢驗(yàn)方法的選用及其適用條件 根據(jù)分析目的、研究設(shè)計(jì)、資料類(lèi)型、樣本量大小等選用適當(dāng)?shù)臋z驗(yàn)方法。c、雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)的選擇 根據(jù)研究目的和專(zhuān)業(yè)知識(shí)予以選擇,一般選用雙側(cè)檢驗(yàn)。d、假設(shè)檢驗(yàn)的結(jié)論不能絕對(duì)化 列出概率的確切數(shù)值或給出范圍,注明采用單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn)。e、正確理解 P 值的統(tǒng)計(jì)意義第八章 方差分析方差分析,能用于兩個(gè)或兩個(gè)以上樣本均數(shù)的比較,還可分析兩個(gè)或多個(gè)研究因素的交互 作用以及線(xiàn)性回歸

39、方程的假設(shè)檢驗(yàn)等?;舅枷胧牵悍治鲎儺?,也就是分解變異,即將數(shù)據(jù)總的變異分解為處理因素引起的變異 和隨機(jī)誤差引起的變異,通過(guò)對(duì)兩者進(jìn)行比較作出處理因素有無(wú)作用的統(tǒng)計(jì)推斷。應(yīng)用條件?各組樣本是相互獨(dú)立的隨機(jī)樣本 ?各組樣本都來(lái)自正態(tài)總體。?各組總體方差相等,即方差齊性。完全隨機(jī)設(shè)計(jì)的方差分析完全隨機(jī)設(shè)計(jì),是按一個(gè)處理因素隨機(jī)分組,統(tǒng)計(jì)分析處理因素各個(gè)水平組間均數(shù)差別有 無(wú)統(tǒng)計(jì)學(xué)意義。a、變異的分解b、自由度分解c、估計(jì)方差(均方)d、F 統(tǒng)計(jì)量的計(jì)算e、F 分布及確定 P 值隨機(jī)區(qū)組設(shè)計(jì)的方差分析隨機(jī)區(qū)組設(shè)計(jì)( randomized block design),是先按對(duì)試驗(yàn)結(jié)果有影響的非研究因素

40、將受 試對(duì)象配成若干個(gè)區(qū)組,再分別將各區(qū)組內(nèi)的受試對(duì)象隨機(jī)分配到處理水平不同的各個(gè) 組。多個(gè)樣本均數(shù)的兩兩比較 經(jīng)方差分析,若各組的均數(shù)差別無(wú)統(tǒng)計(jì)學(xué)意義,則不需要作進(jìn)一步的統(tǒng)計(jì)處理,但是當(dāng)方 差分析結(jié)果為 P< 時(shí),只說(shuō)明各組總體均數(shù)不相同或不全相同,不能說(shuō)明各組總體均數(shù) 間有差別。如果要分析哪兩組間均數(shù)有差別,需進(jìn)行多組均數(shù)間的多重比較。 多個(gè)樣本均數(shù)兩兩比較方法選擇策略第九章 卡方檢驗(yàn)方差齊性檢驗(yàn)的作用 : Bartlett 檢驗(yàn)法主要適用于正態(tài)分布資料的方差齊性檢驗(yàn)問(wèn)題。 卡方檢驗(yàn)常用于 推斷兩個(gè)總體率(或構(gòu)成比)之間有無(wú)差別。 2 值反映了實(shí)際頻數(shù)與理論頻數(shù)的吻合程度。 若假設(shè)成

41、立,實(shí)際頻數(shù)與理論頻數(shù)的差值較小, 2值也較?。?若假設(shè)不成立,實(shí)際頻數(shù)與理論頻數(shù)的差值較大, 2值也較大。配對(duì)四格表資料的卡方檢驗(yàn) 計(jì)數(shù)資料的配對(duì)設(shè)計(jì)常用于兩種檢驗(yàn)方法、培養(yǎng)方法、診斷方法的比較。 特點(diǎn)是對(duì)樣本中各觀察單位分別用兩種方法處理,然后觀察兩種處理方法的某兩分類(lèi)變量 的計(jì)數(shù)結(jié)果R×C 列聯(lián)表資料的卡方檢驗(yàn) 用于多個(gè)樣本率的比較、兩個(gè)或多個(gè)構(gòu)成比的比較?;緮?shù)據(jù)為:多個(gè)樣本率比較時(shí),有 R 行 2 列;兩個(gè)樣本構(gòu)成比比較時(shí),有 2 行 C 列; 多個(gè)樣本構(gòu)成比比較時(shí),有 R 行 C 列。 采用 Bonferroni 法進(jìn)行多個(gè)樣本率的兩兩比較,步驟如下:對(duì)需要比較的行 &#

42、215;列表資料 進(jìn)行 2分割,變成多個(gè)四格表;對(duì)每個(gè)四格表進(jìn)行 2檢驗(yàn);采用( =比/較次 數(shù) )計(jì)算調(diào)整的水準(zhǔn),其中 為事先確定的水準(zhǔn);以 調(diào)整作為檢驗(yàn)檢驗(yàn)水準(zhǔn),作出 結(jié)論。R×C 列表表 2檢驗(yàn)注意事項(xiàng): 若有 1/5 以上的格子出現(xiàn) 1T<5 ,則 增大樣本含量,以達(dá)到增大理論頻數(shù)的目的; 結(jié)合專(zhuān)業(yè),刪去理論頻數(shù)太小的格子對(duì)應(yīng)的行或列; 結(jié)合專(zhuān)業(yè),將理論頻數(shù)太小的行或列與性質(zhì)相近的行或列合并; 用雙向無(wú)序 R×C 表資料的 Fisher確切概率法。b、多個(gè)樣本率比較,若統(tǒng)計(jì)推斷為拒絕H0 ,接受 H1 ,只能認(rèn)為各總體率或構(gòu)成比之間總的來(lái)說(shuō)有差別。若要進(jìn)一步了

43、解哪兩者之間有差別,可用卡方分割法,或者調(diào)整檢驗(yàn) 水準(zhǔn)。c、對(duì)于單向有序的 R×C 表資料,在比較各處理組的效應(yīng)有無(wú)差別時(shí),應(yīng)該用秩和檢驗(yàn)。第十章 非參數(shù)秩和檢驗(yàn) 參數(shù)檢驗(yàn),是基于隨機(jī)樣本來(lái)自某已知分布的總體,推斷兩個(gè)或兩個(gè)以上總體參數(shù)是否相同的方法。常用的方法有: t 檢驗(yàn)、方差分析。 特點(diǎn)主要有:對(duì)總體參數(shù)進(jìn)行估計(jì)或檢驗(yàn)是主要目的; 要求總體分布已知;統(tǒng)計(jì)量有明確的理論依據(jù); 有嚴(yán)格的使用條件,要求總體分布符合正態(tài)分布、總體方差齊性、數(shù)據(jù)間相互獨(dú)立。 非參數(shù)檢驗(yàn)( nonparametric test),是在不考慮總體參數(shù)和分布類(lèi)型的情況下,對(duì)總體的 參數(shù)和分布位置進(jìn)行檢驗(yàn)的方法。常用的方法有:秩和檢驗(yàn)、符號(hào)檢驗(yàn)。特點(diǎn)主要有: 適用范圍廣,可應(yīng)用于總體分布類(lèi)型未知的計(jì)量資料、偏態(tài)分布的資料、等級(jí)資料、不 滿(mǎn)足參數(shù)檢驗(yàn)條件的資料等;受限條件少,更適合一般情況; 具有較好的穩(wěn)健性; 方法簡(jiǎn)便,易于理解和掌握。 秩和檢驗(yàn)( rank sum test ) ,是基于 秩次的假設(shè)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論