醫(yī)學統(tǒng)計學重點_第1頁
醫(yī)學統(tǒng)計學重點_第2頁
醫(yī)學統(tǒng)計學重點_第3頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1.變異:同質事物之間的差別。2頻數分布的兩個特征:集中位置,離散趨勢3. 數據分布的類型:對稱分布和非對稱分布。非對稱分布又稱偏態(tài)分布,包括正偏態(tài)和負偏態(tài)。單峰分布,雙峰分布,多峰分布。4. 統(tǒng)計描述:用統(tǒng)計表、統(tǒng)計圖和統(tǒng)計指標等方法對資料的數量特征與分布規(guī)律進行描述。5. 集中位置的描述,集中位置指標又稱平均數指標。有哪些及適用條件?(1 )算數平均數:最適用于單峰對稱分布資料的平均水平的描述,特別是正態(tài)分布資料(2 )幾何平均數:適用于 等比資料對數正態(tài)分布資料(3 )中位數和百分位數:適用于 偏態(tài)分布的資料 開口資料 資料分布不明等6. 離散趨勢的描述(1 )全距亦稱極差,適用于單峰小

2、樣本資料(2 )四分位數間距,適用于單峰小樣本資料(3)方差和標準差,適用于對稱分布尤其是正態(tài)分布資料(4 )變異系數,常用于 比較度量衡單位不同的兩組或多種資料的變異度 比較均數相差懸殊的兩組或多組資料的變異度7常用相對數(1 )率,是二分類指標(2)構成比(3)比8. 正確應用相對數應注意幾個問題:(1 )計算相對數的分母不宜過?。? )分析時不能以構成比代替率(3)對觀察單位數不等的幾個率,不能直接相加求其總率(4 )計算率時要注意資料的同質性,對比分析時應注意資料的可比性(5 )也有抽樣誤差,需要假設檢驗。9. 率的標準法(1 )基本思想:采用統(tǒng)一的標準,以消除病情構成不同對治愈率比較

3、的影響,使算得的標準化治愈率有可比性。(2 )目的:控制混雜因素對研究結果的影響。10. 正態(tài)分布(1 )概念P16一X » 一一(2 )標準正態(tài)分布,u變換:u=,u是標準正態(tài)離差,卩是均數, 晟標準差。CFu N (0 , 1)(3)正態(tài)分布的特征: 是單峰分布,高峰位置在均數 X=卩處。 以均數為中心,左右完全對稱。 取決于兩個參數,均數 和標準差do 為位置參數,卩越大,則曲線沿橫軸向右移動;越小,則曲線沿橫軸向左移動。d為形態(tài)參數,表示數據的離散程度,若胡、,則曲線形態(tài)“瘦高” ;d大,則曲線形態(tài)“矮胖”。 有些指標不服從正態(tài)分布,但通過適當的變換后服從正態(tài)分布,如對數正態(tài)

4、分布。 正態(tài)分布曲線下的面積是有規(guī)律的:總面積恒定為1,對稱區(qū)域面積相等,對應區(qū)域面積相等。(4)幾個u界值:90 %雙側Uo.1 =:單側U0.05 =1.6495 %:雙側Uo.O5 -=單側U0025=1.9699 %:雙側Uo.01 -=單側Uo.005 =2.5811.二項分布(1 )樣本率的標準差 叭的估計值Sp計算公式:Sp=,P是樣本率(2 )樣本個數n和概率n如何影響二項分布的圖形?給定n后,形狀取決于 n當n=0.5時,分布對稱;當n<0.5時分布呈正偏態(tài);當n>0.5 時分布呈負偏態(tài)。隨 n的增大,分布逐漸逼近正態(tài)分布。 如果n n或n(1- n)大于5時,則

5、可 用正態(tài)近似原理處理二項分布的相關問題。(3)應用條件:對立性,重復性,獨立性。12. Poiss on 分布(1) 概念,描述罕見事件發(fā)生次數的概率分布,是特殊的二項分布。(2) 均數與方差相等,均為 入。(3) 形狀取決于入的大小,為正偏態(tài)分布,/越小分布越偏;隨著泊勺增大,分布逐漸趨于對稱,當入 =20時,已基本接近對稱分布;當 入>0時,可按正態(tài)分布原理處理Poisson分布的有關冋題。(4) Poiss on分布具有可加性。(5) 應用條件:對立性,重復性,獨立性。即事件的發(fā)生是相互獨立的,且發(fā)生的概率不變,結果是二分類的(發(fā)生或不發(fā)生)13. 參考值范圍(1 )概念:絕大多

6、數正常人某指標的波動范圍。(2 )正態(tài)分布法計算 100 (1 a) % 正常值范圍:雙側X單側X u - S (高側)X + u S (低側)注意a取值:雙側95 % X -1.96S單側95 % 高側< X 1.64S低側 > X +1.64S(3) 百分位數法:知道求得第幾個百分位數P2614. 抽樣誤差(1 )概念:由于個體變異的存在,由抽樣引起的樣本統(tǒng)計量與總體參數間的差異。(2 )產生的兩個必備條件:抽樣研究 個體變異,是根本原因(3) 中心極限定理的涵義 從均數為P標準差為刖正態(tài)總體中獨立、重復、隨機抽取含量為n的樣本,樣本均數2的分布仍為正態(tài)分布,其均數為卩,標準差

7、為 N。XN( ,;') TXN() 即使從非正態(tài)總體(均數為卩、標準差為(7)中獨立、重復、隨機抽取含量為n的樣本,只要樣本含量足夠大 (如n弟0 ),樣本均數也近似服從均數為 (1,標準差為二-的正態(tài)分布。(4) 標準誤意義:1.用來衡量抽樣誤差的大小標準誤與個體變異7成正比,與樣本含量n的平方根成反比(5)標準誤的估計值的計算公式:樣本標準差s代替總體標準差_ sS=n(6 )標準差與標準誤的關系區(qū)別標準差s標準誤sx意義個體變異統(tǒng)計量的抽樣誤差用途正常值范圍(x ± 1.96s)總體均數的可信區(qū)間(X ± 1.96孚)與n關系n ,s趨于穩(wěn)定n £

8、趨于聯系:兩者都是變異指標,說明個體之間的變異用標準差,說明統(tǒng)計量之間的變異用標準誤; 當樣本量不足時,標準差大,標準誤也大,均數的標準差與標準誤成正比。_ sn15. 醫(yī)學統(tǒng)計學:運用概率論和數理統(tǒng)計等數學的原理和方法,研究醫(yī)學領域中資料的搜集、 整理、分析和推斷的一門學科。16. 三類資料:定量資料(數值資料)定性資料(無序分類資料)等級資料(有序分類資料)17. 總體:按研究目的所確定的研究對象中,所有觀察單位某項指標取值的集合。18. 樣本:從研究總體中,隨機抽取具有代表性的部分觀察單位某項指標取值的集合。19. 同質性:具有相同性質的事物。20. 參數:描述某總體特征的指標。21.

9、統(tǒng)計量:描述某樣本特征的指標。22. 概率:隨機事件發(fā)生可能性大小的一個度量,取值范圍為0哥W23. 小概率事件:發(fā)生概率 0.05的事件。24. 小概率原理:小概率事件發(fā)生的可能性很小,進而認為其在一次抽樣中不可能發(fā)生。25. 理解和解釋可信區(qū)間26. 統(tǒng)計推斷:根據樣本所提供的信息,以一定的概率推斷總體的性質。包括兩方面的內容:參數估計和檢驗假設。27. 可信區(qū)間的兩個要素:可靠性,精確性2X-»28. 均數的可信區(qū)間:從正態(tài)分布總體N(卩,匚)中隨機抽取一個樣本,貝Ut=服從自Sx由度尸n-1的t分布??傮w均數的(1- a可信區(qū)間定義為(X tq J s , X + ta fS

10、)。如n>100,可用標準正態(tài)分布代替 t分布,相應的100 (1- a %可信區(qū)間為(X u Sx,X + uSx)29. 率的可信區(qū)間:(1 )率的標準差又稱率的標準誤,為(2 )總體率n的區(qū)間估計用正態(tài)近似法的條件:樣本含量n足夠大,且樣本率p和(1-p )都不太小時,如np和n( 1-p )均大于5時,n的可信區(qū)間為(p 口 一. Sp,P+Sp)。30. 事件數的可信區(qū)間:當X<50也可以查附表7“ Poisson分布入的可信區(qū)間”,得到入的95 % 或99 %可信區(qū)間。31. 假設檢驗(1 )基本思想:(2 ) 4個基本步驟: 建立檢驗假設:H0 :叫=2= "

11、;3= H1 :7、J2、J3之間不等或不全相等。 確定檢驗水準(拒絕 H。時的最大允許誤差 a) 計算檢驗統(tǒng)計量并求 P值 界定P值并作結論(要回下結論):P < a拒絕H °,接受H1 ;P> a,不拒絕H °。(3)1型錯誤:H°真實時被拒絕。P>0.05卻拒絕H0接受H1(4型錯誤:Ho不真實時不拒絕。H1真實即P<0.05卻不拒絕H0(5) 檢驗功效:H型錯誤率B表示失去對真實的 Hj作出肯定結論之概率,故1- B就是對真實的H“作出肯定結論之概率,常被用來表達某假設檢驗方法的檢驗功效,即假設檢驗對真實的Hj作出肯定結論之把握程度

12、。(6 )1型錯誤與n型錯誤的關系P51(7 )單側檢驗與雙側檢驗的關系(8 )假設檢驗與可信區(qū)間的關系32. 怎么做題?判斷資料類型t設計方法t計算自由度t確定P值t下結論33. 區(qū)分配對和成組配對:同質性差,要算差值自身配對 一般有編號成組:無原始數據(還有均數)兩組樣本含量不等,不能配對無編號34. t檢驗(1 )應用條件:獨立性,正態(tài)性,方差齊性(2 )兩樣本均數比較方差不齊時t'檢驗(3)兩樣本幾何均數比較:取對數,t檢驗,不用反對數35. 方差分析,多個均數比較(1) 總變異SS、: = S3間+ SS且內處理因素、個體差異、隨機因素,共同導致的差異。(2 )組間變異 o&

13、#39;SS組間:多個組的處理因素不同和隨機誤差,導致的差異。(3) 組內變異S3內:組內個體差異和其他隨機因素,導致的差異。(4) 三種變異的關系:SS、= SSa間+ SSa內,:總=:組間+ :組內F二MS組間/ MS組內(5 )單因素方差分析表和兩因素方差分析表36. 多個樣本均數的兩兩比較,對比的組數k大于2,分別t檢驗則需經過 m=k ( k-1 ) /2次比較,若每次比較的第一類錯誤率為a,則多次比較后,至少犯一次第一類錯誤的概率為1 -(1-口),比預先設計的 a要大。37. 變量轉換目的38. F值、t值、q值、q '值之間的關系(1 )兩樣本均數比較時,.F = t

14、。用q檢驗或q'檢驗也得到同樣的結論。說明在兩樣本均數比較時,t檢驗、F檢驗、q檢驗和q'檢驗是等價的。(2) 當組數k>2時,q'檢驗的檢驗功效高于 q檢驗,所以當實驗研究設計為一個對照組與 多個實驗組均數比較時,q'檢驗科得到較高的功效。定性資料的分析39. 假設檢驗步驟P73240. 檢驗(1 )基本思想:(2 )應用條件: n紹0, T苑,用 檢驗 n紹0但1 <T<5,需用校正 2檢驗 T<1或n<40,改用確切概率法。(3 )理論頻數T的計算公式: T_ nRnCRC =n(4) R XC表的自由度 v (行數-1 )(

15、列數-1 ),故四格表v=1(5)要記的 2界值:2=3. 840.05,141. 配對 2檢驗的應用條件:b、c為結果不同部分(甲陽乙陰、甲陰乙陽)b+c紹0時不用校正冥2_ qb_c|V=120切+c <40時要校正(jb- C-1 丫42. R XC表的應用條件: 多個率或構成比的比較,其自由度大于1R>C表中不宜有15以上格子的理論頻數小于5,或不宜有一個理論頻數小于43. 對理論頻數太小的樣本的處理辦法: 增加樣本例數 刪去理論頻數太小的行或列 將太小理論頻數所在的行或列的實際頻數,與性質相近的鄰行或鄰列的頻數,合并。44. 參數檢驗:以特定的總體分布(如正態(tài)分布、二項分

16、布)作為前提,對總體的參數進行 的假設檢驗,限制條件:總體正態(tài)分布、總體方差齊性。45. 非參數檢驗:不依賴于總體的分布類型,不針對總體參數,只針對總體分布是否相同的 檢驗方法;常用于解決總體分布未知的統(tǒng)計問題。46. 秩和檢驗(1 )基本思想:兩組秩和相加等于N(N+1)/2 。 (n n2=N)(2 )兩組比較的秩和檢驗 基本思想:若A、B兩組等級分布相同,則含量為n1的樣本之實際秩和 T與其理論秩和n1(N+1)/2 之差T-n 1(N 1)/2】純系抽樣誤差所致,因此差值不會很大,差值越大的概率 越小。 方法步驟:P88仔細弄明白1 °建立檢驗假設:H。:兩組分布相同;H1

17、:兩組分布不同。0=0.052。編秩3。求秩和T4。確定檢驗統(tǒng)計量T5。確定P值,作出推斷性結論(3) 配對秩和檢驗:設 n為非0差值的個數,貝U T .+T_= n (n+1 ) 12。(4) 秩和檢驗的使用范圍:理論上可用于任意分布的資料 等級資料 定量資料,開口資料 定量資料,分布極度偏態(tài),或個別數值偏離過大而不屬于“過失誤差”者 定量資料,各組離散程度相差懸殊,即使經變量變換,也難以達到方差齊性 定量資料,分布型尚未確知 兼有等級和定量性質的資料(5 )秩和檢驗的優(yōu)缺點:P9547. 直線相關(1 )概念:用來描述兩個呈正態(tài)分布的變量之間的線性共變關系。(2 )應用條件:雙變量正態(tài)分布

18、48. 相關系數(1 )概念:表達兩變量間線性相關的程度和方向的一個統(tǒng)計指標。(2 )特征:無量綱 取值范圍為-1奇1。相關系數小于0為負相關;大于0為正相關;等于0為零相關 相關系數的絕對值越大,表示兩變量間的相關程度越密切;相關系數越接近于0,表示相關越不密切。(3 )相關系數的假設檢驗用t檢驗sr為相關系數的標準誤r有公式建立檢驗假設:Ho :p=0 ,與無相關關系;H1: p羽,與有相關關系。0=0.05 計算檢驗統(tǒng)計量 Sr , r, t, v=n-2 作結論:按v=8查t界值表得P<0.001。按0=0.05水準拒絕H。,接受Hi。故可認為 與之間有正相關關系。50. 何時用

19、等級相關?51. 直線回歸(1 )自變量x,應變量y(2 )直線回歸方程的一般表達式:Y?=a+bXa、b是決定回歸直線的兩個參數:a為回歸直線在y軸上的截距;b為回歸系數,即回歸直線的斜率。(3) b的意義:表示自變量增加一個單位時,應變量的平均改變量。要會解釋,例如3232b=0.2385 ( 10 cm /kg ),表示體重增加1( kg ),則體表面積平均遞增 0.2385 ( 10 cm )。(4) Y?的意義:表示給定X時Y的平均值的估計。 例如X=12 ( kg )時,Y? =5.3832 ( 1023cm ),其意義是:所有體重為12 ( kg )的3歲男童,估計其平均體表面積

20、為 5.3832 ( 10cm )。(5) Y-Y?的意義:稱為剩余、殘差,是y的觀察值與對應的估計值之差。在回歸圖中表示各散點到回歸直線的縱向距離。' (丫-用=02(6 )7 丫-丫?的意義:剩余平方和。坐標系中,每一條直線均可計算散點到該直線的縱向距離之平方和; 但只有各散點到回歸直線的縱向距離之平方和, 最小的。以此為準則,可導出 a、b的最小二乘估計(公式)。52.回歸系數的假設檢驗用 t檢驗2即' 丫 -Y? 是唯一(1)Sy為剩余標準差,常用于評價啊回歸方程的擬合精度??鄢齲的影響后,y本身的變異程度。2(y-Yn -2殘差:自由度(3)檢驗假設:H。:總體回歸系數3=0 ,即與'無回歸關系;總體回歸系數B哲,即與有回歸關系。a=0.05 。b-0|計算檢驗統(tǒng)計量:SY, Sb , t b =,v=n-2Sb(2) Sb為樣本回歸系數的標準誤 Sb =S丫必/ . lXx作結論:按v

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論