醫(yī)學統(tǒng)計學重點完整版本.doc_第1頁
醫(yī)學統(tǒng)計學重點完整版本.doc_第2頁
醫(yī)學統(tǒng)計學重點完整版本.doc_第3頁
醫(yī)學統(tǒng)計學重點完整版本.doc_第4頁
醫(yī)學統(tǒng)計學重點完整版本.doc_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1.變異:同質(zhì)事物之間的差別。2.頻數(shù)分布的兩個特征:集中位置,離散趨勢3.數(shù)據(jù)分布的類型:對稱分布和非對稱分布。非對稱分布又稱偏態(tài)分布,包括正偏態(tài)和負偏態(tài)。單峰分布,雙峰分布,多峰分布。4.統(tǒng)計描述:用統(tǒng)計表、統(tǒng)計圖和統(tǒng)計指標等方法對資料的數(shù)量特征與分布規(guī)律進行描述。5.集中位置的描述,集中位置指標又稱平均數(shù)指標。有哪些及適用條件?(1)算數(shù)平均數(shù):最適用于單峰對稱分布資料的平均水平的描述,特別是正態(tài)分布資料(2)幾何平均數(shù):適用于等比資料 對數(shù)正態(tài)分布資料(3)中位數(shù)和百分位數(shù):適用于偏態(tài)分布的資料 開口資料 資料分布不明等6.離散趨勢的描述(1)全距亦稱極差,適用于單峰小樣本資料(2)四分位數(shù)間距,適用于單峰小樣本資料(3)方差和標準差,適用于對稱分布尤其是正態(tài)分布資料(4)變異系數(shù),常用于比較度量衡單位不同的兩組或多種資料的變異度 比較均數(shù)相差懸殊的兩組或多組資料的變異度7.常用相對數(shù)(1)率,是二分類指標(2)構(gòu)成比(3)比8.正確應(yīng)用相對數(shù)應(yīng)注意幾個問題:(1)計算相對數(shù)的分母不宜過?。?)分析時不能以構(gòu)成比代替率(3)對觀察單位數(shù)不等的幾個率,不能直接相加求其總率(4)計算率時要注意資料的同質(zhì)性,對比分析時應(yīng)注意資料的可比性(5)也有抽樣誤差,需要假設(shè)檢驗。9.率的標準法(1)基本思想:采用統(tǒng)一的標準,以消除病情構(gòu)成不同對治愈率比較的影響,使算得的標準化治愈率有可比性。(2)目的:控制混雜因素對研究結(jié)果的影響。10.正態(tài)分布(1)概念P16(2)標準正態(tài)分布,u變換:u=,u是標準正態(tài)離差,是均數(shù),是標準差。uN(0,1)(3)正態(tài)分布的特征:是單峰分布,高峰位置在均數(shù)X=處。以均數(shù)為中心,左右完全對稱。取決于兩個參數(shù),均數(shù)和標準差。為位置參數(shù),越大,則曲線沿橫軸向右移動;越小,則曲線沿橫軸向左移動。為形態(tài)參數(shù),表示數(shù)據(jù)的離散程度,若小,則曲線形態(tài)“瘦高”;大,則曲線形態(tài)“矮胖”。有些指標不服從正態(tài)分布,但通過適當?shù)淖儞Q后服從正態(tài)分布,如對數(shù)正態(tài)分布。正態(tài)分布曲線下的面積是有規(guī)律的:總面積恒定為1,對稱區(qū)域面積相等,對應(yīng)區(qū)域面積相等。(4)幾個u界值:90:雙側(cè)=單側(cè)=1.64 95:雙側(cè)=單側(cè)=1.96 99:雙側(cè)=單側(cè)=2.5811.二項分布(1)樣本率的標準差的估計值計算公式:=,p是樣本率(2)樣本個數(shù)n和概率如何影響二項分布的圖形? 給定n后,形狀取決于。當=0.5時,分布對稱;當0.5時分布呈負偏態(tài)。隨n的增大,分布逐漸逼近正態(tài)分布。如果n或n(1-)大于5時,則可用正態(tài)近似原理處理二項分布的相關(guān)問題。(3)應(yīng)用條件:對立性,重復(fù)性,獨立性。12.Poisson分布(1)概念,描述罕見事件發(fā)生次數(shù)的概率分布,是特殊的二項分布。(2)均數(shù)與方差相等,均為。(3)形狀取決于的大小,為正偏態(tài)分布,越小分布越偏;隨著的增大,分布逐漸趨于對稱,當=20時,已基本接近對稱分布;當50時,可按正態(tài)分布原理處理Poisson分布的有關(guān)問題。(4)Poisson分布具有可加性。(5)應(yīng)用條件:對立性,重復(fù)性,獨立性。即事件的發(fā)生是相互獨立的,且發(fā)生的概率不變,結(jié)果是二分類的(發(fā)生或不發(fā)生)13.參考值范圍(1)概念:絕大多數(shù)正常人某指標的波動范圍。(2)正態(tài)分布法計算100(1) 正常值范圍:雙側(cè) S 單側(cè) S(高側(cè)) +S(低側(cè))注意取值:雙側(cè)95 1.96S 單側(cè)95 高側(cè)+1.64S(3)百分位數(shù)法:知道求得第幾個百分位數(shù)P2614.抽樣誤差(1)概念:由于個體變異的存在,由抽樣引起的樣本統(tǒng)計量與總體參數(shù)間的差異。(2)產(chǎn)生的兩個必備條件:抽樣研究 個體變異,是根本原因(3)中心極限定理的涵義從均數(shù)為、標準差為的正態(tài)總體中獨立、重復(fù)、隨機抽取含量為n的樣本,樣本均數(shù)的分布仍為正態(tài)分布,其均數(shù)為,標準差為。XN(,)XN(,)即使從非正態(tài)總體(均數(shù)為、標準差為)中獨立、重復(fù)、隨機抽取含量為n的樣本,只要樣本含量足夠大(如n50),樣本均數(shù)也近似服從均數(shù)為,標準差為的正態(tài)分布。(4)標準誤意義:1.用來衡量抽樣誤差的大小 2.= 標準誤與個體變異成正比,與樣本含量n的平方根成反比(5) 標準誤的估計值的計算公式:樣本標準差s代替總體標準差,=(6) 標準差與標準誤的關(guān)系區(qū)別標準差s標準誤意義個體變異統(tǒng)計量的抽樣誤差用途正常值范圍(1.96s)總體均數(shù)的可信區(qū)間(1.96)與n關(guān)系n,s趨于穩(wěn)定n,趨于聯(lián)系:兩者都是變異指標,說明個體之間的變異用標準差,說明統(tǒng)計量之間的變異用標準誤; 當樣本量不足時,標準差大,標準誤也大,均數(shù)的標準差與標準誤成正比。=15. 醫(yī)學統(tǒng)計學:運用概率論和數(shù)理統(tǒng)計等數(shù)學的原理和方法,研究醫(yī)學領(lǐng)域中資料的搜集、整理、分析和推斷的一門學科。16. 三類資料:定量資料(數(shù)值資料)定性資料(無序分類資料)等級資料(有序分類資料)17. 總體:按研究目的所確定的研究對象中,所有觀察單位某項指標取值的集合。18. 樣本:從研究總體中,隨機抽取具有代表性的部分觀察單位某項指標取值的集合。19. 同質(zhì)性:具有相同性質(zhì)的事物。20. 參數(shù):描述某總體特征的指標。21. 統(tǒng)計量:描述某樣本特征的指標。22. 概率:隨機事件發(fā)生可能性大小的一個度量,取值范圍為0P123. 小概率事件:發(fā)生概率0.05的事件。24. 小概率原理:小概率事件發(fā)生的可能性很小,進而認為其在一次抽樣中不可能發(fā)生。25. 理解和解釋可信區(qū)間26. 統(tǒng)計推斷:根據(jù)樣本所提供的信息,以一定的概率推斷總體的性質(zhì)。包括兩方面的內(nèi)容:參數(shù)估計和檢驗假設(shè)。27. 可信區(qū)間的兩個要素:可靠性,精確性28. 均數(shù)的可信區(qū)間:從正態(tài)分布總體N(,)中隨機抽取一個樣本,則t=服從自由度=n-1的t分布??傮w均數(shù)的(1-)可信區(qū)間定義為(,+)。如n100,可用標準正態(tài)分布代替t分布,相應(yīng)的100(1-)可信區(qū)間為(,+)。29. 率的可信區(qū)間:(1)率的標準差又稱率的標準誤,為=(2)總體率的區(qū)間估計用正態(tài)近似法的條件:樣本含量n足夠大,且樣本率p和(1-p)都不太小時,如np和n(1-p)均大于5時,的可信區(qū)間為(p,p+)。30.事件數(shù)的可信區(qū)間:當X50也可以查附表7“Poisson分布的可信區(qū)間”,得到的95或99可信區(qū)間。31.假設(shè)檢驗(1)基本思想:(2)4個基本步驟:建立檢驗假設(shè):= :、之間不等或不全相等。確定檢驗水準(拒絕時的最大允許誤差)計算檢驗統(tǒng)計量并求值界定P值并作結(jié)論(要回下結(jié)論):,拒絕,接受; ,不拒絕。(3) 型錯誤:真實時被拒絕。P0.05卻拒絕H0接受H1(4) 型錯誤:不真實時不拒絕。H1真實即P2時,q檢驗的檢驗功效高于q檢驗,所以當實驗研究設(shè)計為一個對照組與多個實驗組均數(shù)比較時,q檢驗科得到較高的功效。定性資料的分析39. 假設(shè)檢驗步驟P7340. 檢驗(1) 基本思想:(2)應(yīng)用條件:n40,T5,用檢驗n40但1T5,需用校正檢驗T1或n40,改用確切概率法。(3)理論頻數(shù)T的計算公式:=(4)RC表的自由度=(行數(shù)-1)(列數(shù)-1),故四格表=1(5)要記的界值:=3. 8441.配對檢驗的應(yīng)用條件:b、c為結(jié)果不同部分(甲陽乙陰、甲陰乙陽)b+c40時不用校正 = =120b+c40時要校正 = =142. RC表的應(yīng)用條件:多個率或構(gòu)成比的比較,其自由度大于1RC表中不宜有以上格子的理論頻數(shù)小于5,或不宜有一個理論頻數(shù)小于143. 對理論頻數(shù)太小的樣本的處理辦法:增加樣本例數(shù)刪去理論頻數(shù)太小的行或列將太小理論頻數(shù)所在的行或列的實際頻數(shù),與性質(zhì)相近的鄰行或鄰列的頻數(shù),合并。44. 參數(shù)檢驗:以特定的總體分布(如正態(tài)分布、二項分布)作為前提,對總體的參數(shù)進行的假設(shè)檢驗,限制條件:總體正態(tài)分布、總體方差齊性。45. 非參數(shù)檢驗:不依賴于總體的分布類型,不針對總體參數(shù),只針對總體分布是否相同的檢驗方法;常用于解決總體分布未知的統(tǒng)計問題。46. 秩和檢驗(1) 基本思想:兩組秩和相加等于N(N+1)/2。(+=N)(2) 兩組比較的秩和檢驗基本思想:若A、B兩組等級分布相同,則含量為的樣本之實際秩和T與其理論秩和(N+1)/2之差純系抽樣誤差所致,因此差值不會很大,差值越大的概率越小。方法步驟:P88仔細弄明白1建立檢驗假設(shè):兩組分布相同; :兩組分布不同。 =0.052編秩3求秩和T4確定檢驗統(tǒng)計量T5確定P值,作出推斷性結(jié)論(3) 配對秩和檢驗:設(shè)n為非0差值的個數(shù),則+=n(n+1)/2。(4) 秩和檢驗的使用范圍:理論上可用于任意分布的資料等級資料定量資料,開口資料定量資料,分布極度偏態(tài),或個別數(shù)值偏離過大而不屬于“過失誤差”者定量資料,各組離散程度相差懸殊,即使經(jīng)變量變換,也難以達到方差齊性定量資料,分布型尚未確知兼有等級和定量性質(zhì)的資料(5) 秩和檢驗的優(yōu)缺點:P9547. 直線相關(guān)(1)概念:用來描述兩個呈正態(tài)分布的變量之間的線性共變關(guān)系。(2)應(yīng)用條件:雙變量正態(tài)分布48.相關(guān)系數(shù)(1)概念:表達兩變量間線性相關(guān)的程度和方向的一個統(tǒng)計指標。(2)特征:無量綱取值范圍為-1r1。相關(guān)系數(shù)小于0為負相關(guān);大于0為正相關(guān);等于0為零相關(guān)相關(guān)系數(shù)的絕對值越大,表示兩變量間的相關(guān)程度越密切;相關(guān)系數(shù)越接近于0,表示相關(guān)越不密切。(3) 相關(guān)系數(shù)的假設(shè)檢驗用t檢驗為相關(guān)系數(shù)的標準誤 = r有公式 t=/建立檢驗假設(shè):=0,與無相關(guān)關(guān)系; :0,與有相關(guān)關(guān)系。 =0.05計算檢驗統(tǒng)計量,r,t,=n-2作結(jié)論:按=8查t界值表得P0.001。按=0.05水準拒絕,接受。故可認為與之間有正相關(guān)關(guān)系。50. 何時用等級相關(guān)?51. 直線回歸(1) 自變量x,應(yīng)變量y(2) 直線回歸方程的一般表達式:=a+bXa、 b是決定回歸直線的兩個參數(shù):a為回歸直線在y軸上的截距;b為回歸系數(shù),即回歸直線的斜率。(3) b的意義:表示自變量增加一個單位時,應(yīng)變量的平均改變量。要會解釋,例如b=0.2385(/kg),表示體重增加1(kg),則體表面積平均遞增0.2385()。(4) 的意義:表示給定X時Y的平均值的估計。例如X=12(kg)時,=5.3832(),其意義是:所有體重為12(kg)的3歲男童,估計其平均體表面積為5.3832()。 (5) Y-的意義:稱為剩余、殘差,是y的觀察值與對應(yīng)的估計值之差。在回歸圖中表示各散點到回歸直線的縱向距離。=0(6) 的意義:剩余平方和。坐標系中,每一條直線均可計算散點到該直線的縱向距離之平方和;但只有各散點到回歸直線的縱向距離之平方和,即是唯一最小的。以此為準則,可導(dǎo)出a、b的最小二乘估計(公式)。52. 回歸系數(shù)的假設(shè)檢驗用t檢驗(1) 為剩余標準差,常用于評價啊回歸方程的擬合精度??鄢齲的影響后,y本身的變異程度。=(2) 為樣本回歸系數(shù)的標準誤 =/(3) 檢驗假設(shè):總體回歸系數(shù)=0,即與無回歸關(guān)系; :總體回歸系數(shù)0,即與有回歸關(guān)系。 =0.05。計算檢驗統(tǒng)計量:,=,=n-2作結(jié)論:按=8查t界值表得P0.001。按=0.05水準拒絕,接受。故可認為與有回歸關(guān)系。(4) =,因為自由度相同,故回歸系數(shù)是否為0的假設(shè)檢驗與相關(guān)系數(shù)是否為0的假設(shè)檢驗是等價的。相關(guān)系數(shù)的假設(shè)檢驗更簡單。53. 應(yīng)變量總變異的分解=+=+=+;=n-1;=1;=n-254. 回歸方程的方差分析 要會填表P125=,即在直線相關(guān)與回歸分析中,相關(guān)系數(shù)的t檢驗、回歸系數(shù)的t檢驗、回歸方程的方差分析是等價的。55. 直線回歸與直線相關(guān)的區(qū)別及聯(lián)系(1) 區(qū)別對資料的要求:回歸只要求應(yīng)變量y是隨機變量且服從正態(tài)分布,變量x有兩種:精確測量和嚴格控制的變量(型回歸)、隨機變量(型回歸)。相關(guān):x、y均為隨機變量且服從雙變量正態(tài)分布應(yīng)用:回歸反映兩變量間的依存關(guān)系;相關(guān)反映兩變量間的相互關(guān)系。計量單位:r沒有單位;b的單位是:y單位/x單位(2) 聯(lián)系正負符號:在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論