醫(yī)學(xué)統(tǒng)計學(xué)基本概念資料_第1頁
醫(yī)學(xué)統(tǒng)計學(xué)基本概念資料_第2頁
醫(yī)學(xué)統(tǒng)計學(xué)基本概念資料_第3頁
醫(yī)學(xué)統(tǒng)計學(xué)基本概念資料_第4頁
醫(yī)學(xué)統(tǒng)計學(xué)基本概念資料_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、醫(yī)學(xué)統(tǒng)計學(xué)基本概念1 .醫(yī)學(xué)統(tǒng)計學(xué)是以醫(yī)學(xué)理論為指導(dǎo),應(yīng)用概率論與數(shù)理統(tǒng)計的有關(guān)原理和方法,研究醫(yī)學(xué)資料的搜集、整理、分析和推斷的一門應(yīng)用科學(xué)。2 .統(tǒng)計工作的步驟:(1)設(shè)計(2)收集資料(3)整理資料(4)分析資料;或者分三步:(1)研究設(shè)計(2)資料分析(3)結(jié)論。3 .定量資料:又稱為數(shù)值變量資料,特點:(1)各觀察值之間有量的差別;(2)數(shù)據(jù)間有連續(xù)性。它是指變量的取值不止是可列個,而是可取某區(qū)間a,b,(-oo,oo)上的一切值。4 .定性資料:又稱為分類資料、分類變量資料(包括二項分類、多項分類資料),特點:(1)各觀察值之間有質(zhì)的差別;(2)數(shù)據(jù)間有離散性。它是指變量的取值有限

2、的,至多是可列多個。附:無序分類:二項分類、多項分類5 .等級資料:又稱為半定量資料,有序分類,指各類之間有程度的差別。特點:()各觀察單位間或者相同,或者存在質(zhì)的差別;(2)各等級間只有順序,而無數(shù)值大小,故等級之間不可度量。6 .個體individual:即每個觀察單位。7 .總體population:根據(jù)研究目的確定的同質(zhì)觀察單位的全體。8 .樣本:是從總體中隨機抽取部分觀察單位,其實測值的集合。樣本包含的觀察單位數(shù)稱為樣本含量或樣本大小。9 .參數(shù)parameters:描述某總體特征的統(tǒng)計指標(biāo)稱為總體參數(shù),簡稱參數(shù)。如總體均數(shù)、總體標(biāo)準(zhǔn)差等。特點:參數(shù)是未知的,固有的,不變的!10 .

3、統(tǒng)計量:描述某樣本特征的的統(tǒng)計指標(biāo)稱為樣本統(tǒng)計量,簡稱統(tǒng)計量。特點:統(tǒng)計量是已知的,變化的,有誤差的!11 .概率probability:是描述隨機事件發(fā)生的可能性大小的數(shù)值。常用P表示。它的大小界于0和1之間。12 .隨機事件:(1)可重復(fù)性:相同條件下可重復(fù)進行;(2)隨機性:出現(xiàn)兩種機兩種以上結(jié)果;(3)偶然性:實驗前不能肯定將出現(xiàn)哪種結(jié)果。13 .頻率的穩(wěn)定性:在重復(fù)試驗中,事件A的頻率隨著試驗次數(shù)的不斷增加將愈來愈接近一個常數(shù)p,頻率的這一特性稱為頻率的穩(wěn)定性。14 .概率的統(tǒng)計定義:頻率的穩(wěn)定性充分說明隨機事件出現(xiàn)的可能是事物本身固有的一種客觀屬性,因而是可以被認(rèn)識和度量的。這個常

4、數(shù)p就稱為事件A出現(xiàn)的概率(probability),記作P(A)或P。這一定義稱為概率的統(tǒng)計定義。它是事件A發(fā)生的可能性大小的一個度量。容易看出,頻率為一變量,是樣本統(tǒng)計量,而概率為常數(shù),是一總體參數(shù)。實踐中,當(dāng)試驗次數(shù)足夠多時,可以近似地將頻率作為概率的一個估計。15 .小概率原理:當(dāng)某事件發(fā)生的概率小于或等于0.05時,統(tǒng)計學(xué)通常稱該事件為小概率事件,其涵義為該事件發(fā)生的可能性很小,進而認(rèn)為其在一次抽樣中不可能發(fā)生,此即為小概率原理。16 .同質(zhì)(homogeneity):性質(zhì)相同的事物稱為同質(zhì)的。17 .變異(variation):同質(zhì)的事物內(nèi)個體之間或同一個體重復(fù)測量間的差別稱為變異

5、。18 .參考值范圍(referenceinterval)又稱正常值范圍(normalrange)。由于正常人的形態(tài)、功能、生化等各種指標(biāo)的數(shù)據(jù)因人而異,而且同一個人的某些指標(biāo)還會隨著時間、機體內(nèi)外環(huán)境的改變而變化,因此需要確定其波動范圍,即正常值范圍,簡稱正常值(normalvalue)。19 .正常值范圍(normalranges),是指絕大多數(shù)正常人的某指標(biāo)范圍。20 .抽樣誤差(samplingerror):由于抽樣造成的樣本統(tǒng)計量和總體參數(shù)之間的差異。21 .標(biāo)準(zhǔn)誤(standarderror):樣本統(tǒng)計量的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。樣本均數(shù)的標(biāo)準(zhǔn)差稱為均數(shù)的標(biāo)準(zhǔn)誤。22 .參數(shù)估計:由樣本

6、信息估計總體參數(shù)稱為參數(shù)估計,包括點估計和區(qū)間估計。23 .點估計(pointestimation):直接用樣本統(tǒng)計量作為總體參數(shù)的估計值。這種估計方法簡單,但未考慮抽樣誤差的大小。24 .區(qū)間估計(intervalestimation):按一定的概率或可信度(1-)用一個區(qū)間估計總體參數(shù)所在范圍,這個范圍稱作可信度為1-的可信區(qū)間(confidenceinterval,CI),又稱置信區(qū)間。這種估計方法稱為區(qū)間估計。25 .可信度為1-的可信區(qū)間的確切涵義是:每100個樣本所算得的100(1-)%可信區(qū)間,平均有100(1-)個包含了總體參數(shù)。如取=0.05,則每100個樣本所算得的100個

7、95%可信區(qū)間,平均有95個包含總體參數(shù)在內(nèi),有5個不包含總體參數(shù)。26 .可信區(qū)間的兩個要素:第一個要素是可靠性,常用可信度1-的大小表示;第二個要素是精確性,常用可信區(qū)間的長度CU-CL衡量。27 .均數(shù)95%可信區(qū)間,其涵義是:如果重復(fù)100次抽樣,每次樣本含量均為n,每個樣本均按(見課本P42)構(gòu)建可信區(qū)間,則在此100個可信區(qū)間內(nèi),理論上有95個包含總體土§數(shù),而有5個不包含總體均數(shù)。28 .可信度為95%的CI的涵義:每100個樣本,按同本方法計算95%的CI,平均有95%的CI包含了總體參數(shù)。這里的95%,指的是方法本身!而不是某個區(qū)間!29 .第一類錯誤(I型錯誤):

8、拒絕了實際上成立的H0假設(shè),稱為假陽性”,用a來表示。30 .第二類錯誤(II型錯誤):不拒絕實際上不成立的H0,稱為假陰性”,用0來表示。31 .檢驗效能(powerofatest)或檢驗功效:1稱檢驗效能(powerofatest),過去稱把握度。為當(dāng)兩總體確有差異,按檢驗水準(zhǔn)所能發(fā)現(xiàn)該差異的能力。1只取單尾。32 .完全隨機設(shè)計:根據(jù)某一試驗因素,將試驗對象完全按隨機設(shè)計分為若干個組,每個組的樣本例數(shù)可以相等,也可以不等,分別求出各組試驗結(jié)果的均數(shù),即為單因素多個樣本均數(shù),單個因素可以有多個水平,R>233 .隨機區(qū)組設(shè)計又稱配伍組設(shè)計(RandomBlockDesign):即兩因

9、素多個樣本均數(shù)的比較(或稱兩因素方差分析,twowayanalysisofvariance)o34 .絕對數(shù):在計數(shù)資料中,各組的觀察數(shù)稱絕對數(shù)。35 .相對數(shù):是兩個有聯(lián)系的指標(biāo)的比,計數(shù)資料的統(tǒng)計描述主要是相對數(shù)(relativenumber)。以保留1-2位整數(shù)為宜。36 .率(rate):說明某現(xiàn)象發(fā)生的頻率或強度,常用、%。、1/萬、1/10萬等作單位,表示在一定范圍內(nèi),某現(xiàn)象的發(fā)生數(shù)與可能發(fā)生某現(xiàn)象的總數(shù)之比。率的結(jié)果常發(fā)生某現(xiàn)象的觀察單位數(shù)率_Xk二可能發(fā)生某現(xiàn)象的觀察單位總數(shù)37 .構(gòu)成比(constituentratio):說明一事物內(nèi)部各組成部分所占的比例,常以來表示。構(gòu)成

10、比=X100%基一組成部分的姍琮單位數(shù)同-由物各部分的觀察單位靜教38 .比:也稱相對比(relativeratio),兩個有關(guān)指標(biāo)之比。通常以某種現(xiàn)象的數(shù)量為1或100作基數(shù)看另一種現(xiàn)象的數(shù)量是多少,說明一事物是另一事物的若干倍或百分之幾。兩個相比的指標(biāo)可以性質(zhì)相同,如時間比、性別比;也可性質(zhì)不同。比=A/B39 .秩次是指全部觀察值按某種順序排列的位序;秩和:是同組秩次之和。40 .秩變換:將等級變成秩次的方法稱為秩變換。41 .秩和檢驗:就是通過秩次的排列求出秩和,從而對總體的分布進行假設(shè)檢驗的方法。42 .確定性關(guān)系:是指兩變量間的關(guān)系是函數(shù)關(guān)系。非確定性關(guān)系:是指兩變量在宏觀上存在關(guān)

11、系,但并未精確到可以用函數(shù)關(guān)系來表達(dá)。相關(guān)關(guān)系:指既是必然的又是不確定的關(guān)系稱為相關(guān)關(guān)系。當(dāng)兩個變量之間出現(xiàn)如下關(guān)系,一個增大,另一個也同時增大,或縮小,我們稱這種現(xiàn)象為共變,也就是說兩個變量之間有相關(guān)關(guān)系。相關(guān)關(guān)系不一定是因果關(guān)系。相關(guān)關(guān)系可以是因果關(guān)系,也可以是伴隨關(guān)系。43 .直線相關(guān)系數(shù):簡稱為相關(guān)系數(shù)用符號r表示,是用于說明具有直線關(guān)系兩個變量之間,相關(guān)關(guān)系的密切程度和相關(guān)方向的指標(biāo)。44 .等級相關(guān)的含義:等級相關(guān)反映的是兩變量等級間的相關(guān),并不反映兩變量間的數(shù)值關(guān)系。45 .直線相關(guān):這種直線關(guān)系,或分析這種直線關(guān)系的理論和方法,統(tǒng)稱為直線相關(guān)。46 .直線回歸:直線回歸是用于研

12、究兩個變量x與y之間的線性依存關(guān)系的一種統(tǒng)計分析方法。47 .試驗研究設(shè)計:是指研究者根據(jù)研究目的、通過對受試對象施加干預(yù),嚴(yán)格控制各種影響因素,獲得干預(yù)研究結(jié)果。48 .雙盲臨床試驗:是指觀察者方和被觀察者方在整個試驗過程中不知道受試者接受的是何種處理;單盲臨床試驗是指僅被觀察者方處于盲態(tài)。觀察者方指的是研究者、參與試驗效應(yīng)評價的研究人員、數(shù)據(jù)管理人員、統(tǒng)計分析人員;被觀察者方指的是受試對象及其親屬或監(jiān)護人。雙盲雙模擬:試驗組:試驗藥+陽性對照藥的安慰劑;對照組:陽性對照藥+試驗藥的安慰劑。醫(yī)學(xué)統(tǒng)計學(xué)相關(guān)知識1.頻數(shù)分布表的用途:(1)看出頻數(shù)分布的兩個重要特征:集中趨勢、離散趨勢(2)揭示

13、資料的分布類型2. 描述定量資料集中趨勢的三個指標(biāo)及其應(yīng)用條件:(1)均數(shù)(也稱算術(shù)均數(shù)):適用于單峰對稱分布的資料;(2)幾何均數(shù):適用于等比資料、對數(shù)正態(tài)分布資料;(3)中位數(shù):適用于偏態(tài)分布資料、分布不規(guī)則或未知分布資料、一端或兩端有不確定數(shù)據(jù)(開口資料)的資料。3. 描述定量資料離散程度的指標(biāo)(極差、四分位數(shù)間距、標(biāo)準(zhǔn)差、變異系數(shù))及其適用范圍:這四個指標(biāo)均反映定量資料的離散程度。極差和四分位數(shù)間距可用于任何分布(極差常用于描述單峰對稱分布小樣本分布資料的變異程度,或用于初步了解資料的變異程度;四分位數(shù)間距常用于描述偏態(tài)分布資料、兩端無確切值或分布不明確資料的離散程度),后者比前者穩(wěn)定

14、,但均不能綜合反映各觀察值的變異程度;標(biāo)準(zhǔn)差最常用,要求資料近似服從正態(tài)分布;變異系數(shù)可用于比較度量單位不同的兩組或多組資料的變異度或均數(shù)相差懸殊的兩組或多組資料的變異度。4. 正態(tài)分布的特征:(1)正態(tài)分布是一單峰分布,高峰位置在均數(shù)處;(2)正態(tài)分布以均數(shù)為中心,左右完全對稱;(3)正態(tài)分布取決于兩個參數(shù),即均數(shù)R和標(biāo)準(zhǔn)差aoR是位置參數(shù),R越大,則曲線沿橫軸向右移動;R越小,曲線沿橫軸向左移動。b為形態(tài)參數(shù),表示數(shù)據(jù)的離散程度,若b小,則曲線形態(tài)“瘦高”;b大,則曲線形態(tài)“矮胖”。(4)有些指標(biāo)不服從正態(tài)分布,但通過適當(dāng)?shù)淖儞Q后服從正態(tài)分布;(5)正態(tài)分布曲線下的面積分布是有規(guī)律的。5.

15、 正態(tài)曲線下的面積規(guī)律?正態(tài)曲線下面積總和為1;正態(tài)曲線關(guān)于均數(shù)對稱;對稱的區(qū)域內(nèi)面積相等;?對任意正態(tài)曲線,按標(biāo)準(zhǔn)差為單位,對應(yīng)的面積相等;-1.64+1.64內(nèi)面積為90%;?-1.96+1.96內(nèi)面積為95%;-2.58+2.58內(nèi)面積為99%。?小于-3的面積為0.13%;小于-2的面積為2.28%;小于-的面積為15.87%。6. 標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差的關(guān)系區(qū)別標(biāo)準(zhǔn)差s標(biāo)準(zhǔn)誤sx意義個體變異統(tǒng)計量的抽樣誤差用途正常值范圍(x土1.96s)總體均數(shù)的可信區(qū)間(x土t,sx)與n關(guān)系ns趨于穩(wěn)定nsx趨于0聯(lián)系1兩者都是變異指標(biāo),說明個體之間的變異用標(biāo)準(zhǔn)差,說明統(tǒng)計量之間的變異用標(biāo)準(zhǔn)誤。2.當(dāng)

16、樣本含量不變時,標(biāo)準(zhǔn)差大,標(biāo)準(zhǔn)誤亦大,均數(shù)的標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤成正比。7 .下列說法正確嗎?算得某95%的可信區(qū)間,則:總體參數(shù)有95%的可能落在該區(qū)間。(錯)有95%的總體參數(shù)在該區(qū)間內(nèi)。(錯)該區(qū)間包含95%的總體參數(shù)。(錯)該區(qū)間有95%的可能包含總體參數(shù)。(錯)該區(qū)間包含總體參數(shù),可信度為95%o(對)(3)樣本含量:樣本含量越大,區(qū)間越窄8 .影響可信區(qū)間大小的因素:(1)可信度:可信度越大,區(qū)間越寬;(2)個體變異:變異越大,區(qū)間越寬;9,均數(shù)的可信區(qū)間和參考值范圍的區(qū)別區(qū)別可信區(qū)間參考值范圍意義未知參數(shù)的可能范圍正常值的波動范圍公式已知或未知,但n足夠大(x±u/2,sx)

17、或(x±u/2,x)(x±u/2,sx)未知(x±t,sx)用途估計總體均數(shù)判斷正異常小結(jié):均數(shù)的可信區(qū)間:均數(shù)界值X標(biāo)準(zhǔn)誤個體的容許區(qū)間(參考值范圍):均數(shù)界值X標(biāo)準(zhǔn)差10 .可信區(qū)間與容許區(qū)間的區(qū)別:見P4411 .假設(shè)檢驗的基本思想:?提出一個假設(shè)(H0);驗證這個假設(shè)。如果假設(shè)成立,會得到現(xiàn)在的結(jié)果嗎?兩種可能的情況:(1)得到現(xiàn)在的結(jié)果可能性很?。ㄐ「怕剩?拒絕H0(2)有可能得到現(xiàn)在的結(jié)果(不是小概率)-沒有理由拒絕H0假設(shè)檢驗的步驟:(1)建立檢驗假設(shè);(2)確定檢驗水準(zhǔn)a;(3)計算檢驗統(tǒng)計量并求P值;(5)界定P值并作結(jié)論。12 .I型錯誤和II

18、型錯誤實際情況假設(shè)檢驗的結(jié)果拒絕H0不拒絕H0H0成立I型錯誤()H0不成立把握度(1-)II型錯誤()13 .差異檢驗和優(yōu)度檢驗:差異檢驗之意義在于是否能夠確認(rèn)H1成立,故希望所得P值很小,因為P值越小,表示手頭樣本從H0總體隨機獲得之概率越小,即否定H0而確認(rèn)H1成立的把握越大。優(yōu)度檢驗之意義在于是否能夠確認(rèn)H0成立,故希望所得P值較大,因為P值越大,表示手頭樣本從H0總體隨機獲得之概率越大。14 .可信區(qū)間與假設(shè)檢驗區(qū)別和聯(lián)系:可信區(qū)間說明量的大小即推斷總體均數(shù)范圍,假設(shè)檢驗推斷質(zhì)的不同即判斷兩總體均數(shù)是否不等;可信區(qū)間可回答假設(shè)檢驗問題,可信區(qū)間若包含了H0,按水準(zhǔn),不拒絕H0;若不包

19、含H0,按水準(zhǔn),拒絕H0,接受H1;可信區(qū)間不但能回答差別有無統(tǒng)計學(xué)意義,還能提示差別有無實際專業(yè)意義;可信區(qū)間不能夠完全代替假設(shè)檢驗??尚艆^(qū)間只能在預(yù)先規(guī)定概率的前提下進行計算,假設(shè)檢驗?zāi)塬@得一較為確切的P值。15,下列說法正確嗎?P是H0成立的概率。(錯)P是I型誤差的概率。(錯)P是H0成立時,獲得現(xiàn)有差別的概率。(錯)P是H0成立時,獲得現(xiàn)有差別以及更大的差別的概率。(對)統(tǒng)計推斷時的風(fēng)險。(錯)拒絕H0時所冒的風(fēng)險。(對)(2)正態(tài)性:兩組均數(shù)比較時,要求兩組數(shù)據(jù)服從正態(tài)分布;配16.t檢驗的應(yīng)用條件:(1)獨立性:各觀察個體間是相互獨立的,不能互相影響,亦不能一方影響另一方;對設(shè)計

20、時,要求差值服從正態(tài)分布。(3)方差齊性:兩樣本所對應(yīng)的正態(tài)總體之方差相等。17.總體方差不相等的t檢驗:(1激據(jù)變換后進行t檢驗;(2)秩轉(zhuǎn)換的非參數(shù)檢驗;(3)近似t檢驗t'檢驗。18 .兩樣本均數(shù)比較方法的選擇方差齊方差不齊小樣本t檢驗t檢驗大樣本u檢驗u檢驗19 .方差分析的基本思想:方差分析(analysisofvariance)又稱為變異數(shù)分析,采用F檢驗統(tǒng)計量,也稱F檢驗。這種方法的基本思想是對變異進行分解和分析,把全部觀察值之間的變異一總變異,按照設(shè)計和需要分為兩個或多個組成部分,再作分析,從而達(dá)到統(tǒng)計推斷之目的??傋儺?組內(nèi)變異+組間變異;組內(nèi)變異:抽樣(隨機)誤差(

21、個體差異和測量誤差);組間變異:組間本質(zhì)差別+抽樣(隨機)誤差;如果組間無本質(zhì)差別,則組間變異=組內(nèi)變異或F=MSBetween1MSWithin|20 .方差分析的優(yōu)點:(1)不受比較組數(shù)的限制;(2)可同時分析多個因素的作用;(3)可分析因素間的交互作用。21 .方差分析的意義:是按照實驗設(shè)計把總變異分成若干部分,劃分得越細(xì),各部分的涵義越明確,對結(jié)論亦較易解釋;同時,殘余的變異即誤差部分越小,因而能夠提高檢驗的靈敏度和結(jié)論的準(zhǔn)確性。22 .F分布是方差比的分布,常用于方差齊性檢驗,方差分析等。F分布特征:(1)F分布為一簇單峰正偏態(tài)分布曲線,與兩個自由度有關(guān)。(2)若F服從自由度為(1,

22、2)的F分布,則其倒數(shù)1/F服從自由度為(2,1)的F分布。(3)自由度為(1,2)的F分布,其均數(shù)為2/(2-2),與第一自由度無關(guān)。(4)第一自由度1=1時,F(xiàn)分布實際上是t分布之平方;第二自由度2=8時,F(xiàn)分布實際上等于2分布。(5)每一對自由度下的F分布曲線下的面積分布規(guī)律,見方差分析用F界值表,表中橫標(biāo)目為第一自由度,縱標(biāo)目為第二自由度,表中分別給出了右側(cè)尾部概率為0.05和0.01時的F界值23.方差分析表,異來源SSvMSFP卜間SS組間k-1SS組間/v組間MS組間/MS組內(nèi)|且內(nèi)SS組內(nèi)N-kSS組內(nèi)/v組內(nèi)總SS總N-124方差分析與t檢驗的關(guān)系當(dāng)比較兩個均數(shù)時,從同一資料

23、算得之F值與t值有如下關(guān)系:F=t2可見在兩組均數(shù)比較時,方差分析與t檢驗的效果是完全一樣的。25 .方差分析后的兩兩比較(多重比較)的幾種方法:一、SNKq檢驗(多個均數(shù)間全面比較)二、LSDt檢驗(有專業(yè)意義的均數(shù)間比較)三、Dunnett檢驗(多個實驗組與對照組比較)還有TUKEY、DUNCAN、SCHEFFE、WALLER、BON等比較方法各組間的比較用SNK法;各試驗組與某一對1組間的比較用Dunnet法。26 .方差分析應(yīng)用條件:各樣本是相互獨立的隨機樣本:各樣本來自正態(tài)總體:各組總體方差相等,即方差齊。方差分析和t檢驗要求:獨立性、正態(tài)性、方差齊性。27 .總結(jié):均數(shù)、方差的比較

24、:樣本均數(shù)與總體均數(shù)的比較(t檢驗)配對設(shè)計樣本均數(shù)的比較(配又tt檢9)兩樣本均數(shù)的比較(t檢驗,u檢驗,F(xiàn)檢驗,SNK,Duncan)多樣本均數(shù)的比較(F檢驗,ANOVA)?各組間白比較(SNK法);各試驗組與某一對照組間的比較用(Duncan法)兩個方差的比較(F檢驗)多個方差的比較(Bartlett檢驗28 .二項分布應(yīng)用條件:醫(yī)學(xué)領(lǐng)域有許多二分類記數(shù)資料都符合二項分布(傳染病和遺傳病除外),但應(yīng)用時仍應(yīng)注意考察是否滿足以下應(yīng)用條件:(1)每次實驗只有兩類對立的結(jié)果;如陽性或陰性、生存或死亡,不允許考慮可疑”等模糊結(jié)果,屬于二項分類的資料。(2)n次事件相互獨立;即每個觀察單位的觀察結(jié)

25、果不會影響到其它觀察單位的結(jié)果。如要求疾病無傳染性、無家族聚集性等。(3)每次實驗?zāi)愁惤Y(jié)果的發(fā)生的概率是一個常數(shù)。已知發(fā)生某一結(jié)果(如陽性)的概率為TT,其對應(yīng)的概率必然是(1-兀),我們知道總體率TT一般是未知的,在實際工作中要求%是從大量觀察中獲得的比較穩(wěn)定的數(shù)值。29. 二項分布的應(yīng)用:(1)樣本率與總體率的比較;(2)兩樣本率的比較。30. Poisson分布特征:非對稱,但R增大時趨于對稱;均數(shù)與方差均為c分布的可加性,n個獨立的Poisson分布相加仍符合Poisson分布,可使科>20,使得可用正態(tài)近似。31. Poisson分布應(yīng)用條件:(1)平穩(wěn)性:X的取值與觀察單位的

26、位置無關(guān);(2)獨立增量性:在某個觀察單位X的取值與前面各觀察單位上X的取值獨立.;(3)普通性:在充分小的觀察單位上X的取值最多為1。32. Possion分布的應(yīng)用:(1)總體均數(shù)估計;(2)樣本均數(shù)與總體均數(shù)的比較;(3)兩樣本均數(shù)的比較。33. x2檢驗的用途:(1)推斷多個總體率之間有無差別(2)推斷幾組總體構(gòu)成比之間有無差別(3)兩個變量之間有無關(guān)聯(lián)性(4)頻數(shù)分布的擬合優(yōu)度檢驗。34. x2檢驗的基本思想:x2=如果H0假設(shè)成立,那么實際頻數(shù)與理論頻數(shù)應(yīng)該比較接近。如果實際頻數(shù)與理論頻數(shù)相差很大,超出了抽樣誤差所能解釋的范圍,則可認(rèn)為H0假設(shè)不成立,即兩樣本對應(yīng)的總體率不等。x2

27、值反映了實際頻數(shù)與理論頻數(shù)吻合的程度。如果兩總體率相同的假設(shè)成立,則實際頻數(shù)與理論頻數(shù)之差異純系抽樣誤差所致,故一般不會很大,x2值也就不會很大;在一次隨機試驗中,出現(xiàn)大的x2值的I«率P是很小的。因此,若根據(jù)實際樣本資料求得一個很小的P,且PVa(檢驗水準(zhǔn)),根據(jù)小概率原理,就有理由懷疑H0假設(shè)的真實性,因而拒絕它;若P>a,則沒有理由拒絕HCLx2值的大小除取決于1A-T的差值外,還與基本數(shù)據(jù)的格子數(shù)有關(guān),嚴(yán)格地說是與自由度有關(guān)。在x2檢驗中,自由度指在表中周邊合計不變的前提下,基本數(shù)據(jù)可以自由變動的格子數(shù)。35. x2檢驗的精髓:檢驗實際頻數(shù)和理論頻數(shù)的吻合程度。如果實際

28、頻數(shù)和理論頻數(shù)越吻合,說明H0假設(shè)成立的可能性就越大,反之,如果實際頻數(shù)和理論頻數(shù)相差越遠(yuǎn),說明H0越不可能成立。36. 普通四個表資料卡方檢驗公式的選用條件:1)n>40,且T上5時,用未校正的值2I2(adbc)n(ab)(cd)(ac)(bd)2) 1VT<5,且n上40時,宜用校正x2值2|AT|52|adbCn/2nTabcdacbd3) T<1或n<40時,宜用確切概率計算法p(ab)!(cd)!(ac)!(vd)!a!b!c!d!n!37 .行x列表的x2值計算專用公式:22=nA1nrnc38 .行X列表資料采用2檢驗時,注意事項:(1)注意理論數(shù)的大小

29、。行X列表資料采用x2檢驗時,對理論數(shù)的要求與四格表資料相同,不能有T<1,T<5的個數(shù)不能超過所有理論數(shù)個數(shù)的1/5(四格表中有一個T<5即超過1/5),如出現(xiàn)上述情況,可用以下辦法解決:1)增加觀察例數(shù)可使實際頻數(shù)增加,從而使T增大。2)合并相鄰行或列的實際數(shù),從而使T增大。合并時應(yīng)注意合理性,一般有序分類可合并,無序分類則不可合并。3)采用精確概率檢驗法或似然比x2檢驗法,(2)最小理論數(shù)求法。上述x2檢驗時,采用專用公式計算x2值無須理論數(shù),但也必須求出最小理論數(shù),觀察其大小是否滿足上述各項條件。最小理論數(shù)位于最小行列合計數(shù)相對應(yīng)的位置上,因此可用行、列合計數(shù)中小者相

30、乘除以總例數(shù)即得到最小理論數(shù)。(3)多組資料比較經(jīng)x2檢驗拒絕H0時只能認(rèn)為多組間總的看差別有統(tǒng)計學(xué)意義,并不說明兩兩之間差別均有統(tǒng)計學(xué)意義。若需分析兩兩之間構(gòu)成差別有無統(tǒng)計學(xué)意義,可采用x2分割法或改變檢驗水準(zhǔn)法進行分析等。39 .配對四格表資料的2檢驗步驟:(H0、H1寫法特殊)一.H0:兩法檢出陽性率相同,總體B=C;H1:兩法檢出陽性率不同,總體BC。=0.05。二.計算統(tǒng)計量:2。三.查2界值表,判斷P與a大小四.按=0.05水準(zhǔn),拒絕H0或接受H1o得出結(jié)論。40 .列聯(lián)表:將單一樣本的每個觀察單位,同時按兩種因素,進行分組,分組以后就得到RXC表。然后對這個表進行x2檢驗,以判斷

31、兩個因素的關(guān)聯(lián)性。而這種配對設(shè)計而形成的雙向交叉排列的統(tǒng)計表,用以描述行變量和列變量之間的關(guān)系,特稱為列聯(lián)表。關(guān)于列聯(lián)表內(nèi)兩個分類變量是否有關(guān)聯(lián)性的統(tǒng)計推斷,仍然是用x2檢驗,但是它的檢驗假設(shè)有所不同。一.列聯(lián)表關(guān)聯(lián)性分析的2檢驗步驟:(結(jié)合課件看)H0:不同矽肺期次的患者肺門密度分布相同;H1:不同矽肺期次的患者肺門密度分布不同或不全相同。=0.05。二.計算統(tǒng)計量:2,v。三.P=?四.按=0.05水準(zhǔn),拒絕H0,接受H1。認(rèn)為肺門密度與矽肺期次有關(guān)。結(jié)合本資料,肺門密度有隨矽肺期次增高而增加的趨勢。41 .RXC表資料中的行一般為研究因素的不同水平分組,列一般為研究結(jié)果(效應(yīng)指標(biāo))的分類

32、。根據(jù)行和列的分組或分類情況,可將RXC表資料分為以下幾種情況:1)雙向無序RXC表行和列的分組或分類均為無序。此時可采用x2檢驗處理。2)單向有序RXC表若行的分組為有序(如藥物劑量、患者年齡、病情輕重等),但率的效應(yīng)為無序分類(如染色體損傷的類型、疾病的證型等),此時仍可按雙向無序處理,采用12檢驗;若行的分組為無序(如三種藥物處理),而列的效應(yīng)為有序(如痊愈、顯效、好轉(zhuǎn)、無效),此時應(yīng)采用秩和檢驗或Ridit檢驗方可判斷療效上的優(yōu)劣。因為x2檢驗不考慮有序分類變量的順序。如果固定有序分類變量的順序,將列的頻數(shù)互換后,檢驗的結(jié)論相同,顯然不合理。3)雙向有序RXC表若行的分組為有序(如年齡

33、),效應(yīng)分類也為有序(如療效等級),可按單向有序RXC表中.列為有序分類時的處理方法.采用秩和檢驗或Ridit檢驗。若行和列均為同一觀察對象的兩個有序變量,如矽肺的期次和肺門密度的級別,病程與療效等,此時為配對設(shè)計,可先采用x2檢驗。42.資料的分類數(shù)值變量資料分類資料二分類多分類無序多分類有序多分類(等級資料)43.參數(shù)統(tǒng)計和非參數(shù)統(tǒng)計參數(shù)統(tǒng)計(parametricstatistics)J已知總體分布類型,對未知參數(shù)進行統(tǒng)計推斷非參數(shù)統(tǒng)計(nonparametricstatistics)對總體的分布類型不作任何要求不受總體參數(shù)的影響,比較分布或分布位置依賴于特定分布類型,比較的是參色J適用范

34、圍廣;可用于任何類型資料(等級資料,或">50mg")44 .非參數(shù)檢驗適用情況:總體分布形式未知或分布類型不明;偏態(tài)分布的資料:等級資料:不能精確測定,只能以嚴(yán)重程度、優(yōu)劣等級、次序先后等表示;不滿足參數(shù)檢驗條件的資料:各組方差明顯不齊。數(shù)據(jù)的一端或兩端是不確定數(shù)值,如">50mg等。45 .秩和檢驗的適用范圍:(1)等級資料;(2)定量資料,但數(shù)據(jù)的某一端或兩端無確定數(shù)值(開口資料);(3)定量資料,但數(shù)值的分布是極度偏態(tài)的,如L形分布,或個別數(shù)值偏離過大而不屬于“過失誤差”者;(4)定量資料,但各組離散程度相差懸殊,即使經(jīng)變量變換,也難以達(dá)到方差

35、齊性;(5)定量資料,但分布型尚未確知,此時可先用秩和檢驗法進行分析;(6)兼有等級和定量性質(zhì)的資料。46 .秩和檢驗的優(yōu)缺點:優(yōu)點:不論樣本所來自的總體分布的形式如何,甚至是未知的,都能適用。某些非參數(shù)方法計算簡便。因此在急需獲得初步結(jié)果時可采用。易于理解和掌握??捎糜诓荒芑蛭醇泳_測量的資料,如等級資料或某些記數(shù)資料。缺點:對適宜用參數(shù)方法的資料,若用非參數(shù)法處理,常損失部分信息,降低效率。雖然許多非參數(shù)法計算簡單,但不少問題的計算仍嫌繁冗。47 .樣本的相關(guān)系數(shù)r的特征:(1)-1VrV1,沒有單位;(2)r的絕對值大小表示相關(guān)關(guān)系的密切程度;(3)r的符號表示相關(guān)的方向:r>0為

36、正相關(guān);r<0為負(fù)相關(guān);r=0為零相關(guān)或無相關(guān)48 .回歸系數(shù)和回歸方程的意義及性質(zhì):bX(1) b的意義:回歸系數(shù)b稱為斜率,表示自變量增加一個單位時,應(yīng)變量的平均改變量。(2) a的意義:a為截距或常數(shù)項,a的值表示當(dāng)X=0時,應(yīng)變量丫的估計值。從坐標(biāo)軸上看,a對應(yīng)回歸直線延伸至X=0時與丫軸的交點,故稱為截距。(3)人丫(Y-hat)的意義:人丫表示給定X時丫的平均值的估計。人Y的涵義是均數(shù)一不同X時丫均數(shù)的估計值,與一般的均數(shù)的計算方法不同,這里的均數(shù)是給定X的條件下,由回歸方程估計得到的,故又稱為條件均數(shù)。(4) 丫-人丫的意義:丫-八丫稱為剩余,又稱殘差,是丫的觀察值與對應(yīng)的

37、估計值之差,在回歸圖中表示各散點到回歸直線的縱向距離。(5) (丫?丫朋意義:稱為殘差平方和(residualsumofsquares或剩余平方和,是所有剩余之平方和,綜合表示點距直線的距離。在所有的直線中,回歸直線的殘差平方和是最小的。(最小二乘)49 .回歸直線的有關(guān)性質(zhì):(1) 直線通過均點(X丫)(2) 直線上方各點到直線的縱向距離之和=直線下方各點到直線的縱向距離之和即:(YW)0(3)各點到該回歸線縱向距離平方和較到其它任何直線者為小。Y丫?2丫?abX250 .應(yīng)變量Y的總變異分解:22-2?總回剩決定系數(shù)r2SS上SS、v總=曠回+曠乘J,v回=1,曠剩二門刀。51 .直線回歸

38、中三種假設(shè)檢驗間的關(guān)系:在直線回歸中,相關(guān)系數(shù)的假設(shè)檢驗,回歸系數(shù)的假設(shè)檢驗,以及回歸方程的方差分析結(jié)果等價。52 .5可信區(qū)間與丫的容許區(qū)間:Lh可信區(qū)間是針對條件均數(shù)的,而容許區(qū)間是針對Y的取值范圍的。圖容許區(qū)間估計:給定X時丫的估計值是Y的均數(shù)的一個估計。給定X時丫值的容許區(qū)間是Y值的可能范圍。53 .回歸方程的應(yīng)用:(1)描述兩個變量間的依存關(guān)系。(2)利用回歸方程進行預(yù)測。(3)利用回歸方程進行估計。(4)利用回歸方程獲得更高精度的參考值。(5)利用回歸方程進行控制。54 .應(yīng)用直線回歸的注意點:(1) .回歸分析要有實際意義:?要有實際意義;充分利用散點圖,判斷:(1)線性趨勢(2)離群值?當(dāng)樣本含量較大時,統(tǒng)計學(xué)檢驗的作用減弱;回歸關(guān)系可以內(nèi)插,不宜外延;?自變量的選擇:原因容易測量的變異小的年齡、身高、體重、體表面積(2)在作回歸前應(yīng)先作散點圖(3)內(nèi)插和外延55 .回歸分析的正確應(yīng)用:.回歸系數(shù)是有單位的,不能根據(jù)b的大小判斷回歸關(guān)系的密切程度。.應(yīng)用條件(LINE):(1)線性(linear)(2)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論