衛(wèi)生統(tǒng)計(jì)學(xué)基本知識(shí)課件_第1頁
衛(wèi)生統(tǒng)計(jì)學(xué)基本知識(shí)課件_第2頁
衛(wèi)生統(tǒng)計(jì)學(xué)基本知識(shí)課件_第3頁
衛(wèi)生統(tǒng)計(jì)學(xué)基本知識(shí)課件_第4頁
衛(wèi)生統(tǒng)計(jì)學(xué)基本知識(shí)課件_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、衛(wèi)生統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)健康管理師培訓(xùn)公共衛(wèi)生導(dǎo)論流行病學(xué):研究疾病在人群中分布特點(diǎn)的一門方法學(xué)醫(yī)學(xué)統(tǒng)計(jì)學(xué):流行病學(xué)得出科學(xué)結(jié)論所必需的方法。什么是統(tǒng)計(jì)學(xué)(Statistics)?統(tǒng)計(jì)學(xué)是科學(xué)(Science)研究的一種方法學(xué)。是對數(shù)字收集、整理和解釋的科學(xué)。主要是通過對樣本的推論來分析總體的特征。統(tǒng)計(jì)學(xué)按照應(yīng)用的領(lǐng)域分為不同分支學(xué)科:衛(wèi)生統(tǒng)計(jì)學(xué)、理論統(tǒng)計(jì)學(xué)、經(jīng)濟(jì)統(tǒng)計(jì)學(xué)、社會(huì)統(tǒng)計(jì)學(xué)、人口統(tǒng)計(jì)學(xué)、生物統(tǒng)計(jì)學(xué)等歷史上著名的統(tǒng)計(jì)學(xué)家統(tǒng)計(jì)學(xué)建立在17世紀(jì)概率論的基礎(chǔ)上18世紀(jì)誕生了世界上最偉大的統(tǒng)計(jì)學(xué)家19、20世紀(jì)出現(xiàn)了大量的統(tǒng)計(jì)學(xué)家20世紀(jì)計(jì)算機(jī)的出現(xiàn)是統(tǒng)計(jì)學(xué)飛速發(fā)展的前提。皮埃爾德費(fèi)馬布萊茲帕斯卡卡爾

2、弗里德里希高斯Johann Gregor Mendel, Karl Pearson,Ronald Aylmer Fisher, Jerzy Neyman統(tǒng)計(jì)應(yīng)用軟件開源的(免費(fèi)):R商業(yè)的(收費(fèi)):SPSS(PASW), Stata, S-PLUS, SAS, MATLAB 這些都為統(tǒng)計(jì)學(xué)的廣泛應(yīng)用提供了條件,也對我們的工作質(zhì)量提出了要求!要學(xué)習(xí)什么?了解一些統(tǒng)計(jì)學(xué)的基本概念。統(tǒng)計(jì)學(xué)的思維。明白一些統(tǒng)計(jì)學(xué)的術(shù)語。知道用哪些統(tǒng)計(jì)學(xué)方法。知道怎么解釋統(tǒng)計(jì)結(jié)果。學(xué)會(huì)如何歸納統(tǒng)計(jì)結(jié)論。進(jìn)一步了解:哪些統(tǒng)計(jì)學(xué)方法不能用?用這種方法容易出現(xiàn)哪些錯(cuò)誤?對一個(gè)結(jié)果采用不同的統(tǒng)計(jì)方法進(jìn)行比較,驗(yàn)證。7統(tǒng)計(jì)工作的

3、步驟第一步設(shè)計(jì)(design):第二步收集資料(collection of data):第三步整理資料(sorting data):第四步分析資料(analysis of data):試驗(yàn)設(shè)計(jì)、實(shí)施后的數(shù)據(jù)分析過程面對一個(gè)問題(一堆數(shù)據(jù))- 想得到一個(gè)什么結(jié)論(了解哪些問題)- 需要哪些數(shù)據(jù) - 使用什么方法 - 這種方法是否適合這些數(shù)據(jù) - 這個(gè)方法有哪些優(yōu)缺點(diǎn) - 通過這個(gè)得出的結(jié)果是否有實(shí)際意義、與事實(shí)相符、符合邏輯 - 從一堆結(jié)果中選出對自己有用的條目 - 形成結(jié)論基本概念和術(shù)語總體與樣本、個(gè)體總體(Population):根據(jù)研究目的確定的研究對象的全體。當(dāng)研究有具體而明確的指標(biāo)時(shí),

4、總體是指該項(xiàng)變量值的全體??傮w可大、可小。大到宇宙、小到一個(gè)班級(jí)。樣本(Sample):或稱抽樣??傮w中的一部分。好的抽樣能近似地反映總體的特征。個(gè)體(Individual):總體中的單個(gè)觀察單位(Observation unit)?;蛘叻Q為一個(gè)樣本。抽樣(sample)表達(dá)的是一個(gè)動(dòng)作,一個(gè)過程。個(gè)體表達(dá)的是一個(gè)靜止的物體??傮w表達(dá)的是一個(gè)不可測的動(dòng)態(tài)全體。例子:為了了解某地2029歲健康女性血紅蛋白的正常值范圍,現(xiàn)隨機(jī)調(diào)查了該地2000名2029歲的健康女性,并對其血紅蛋白進(jìn)行測量,請問本次調(diào)查的總體是?樣本是什么?個(gè)體是什么?2. 變量(Variable)與變異(Variation)變量

5、:一個(gè)觀察單位(個(gè)體)所表現(xiàn)的特征。比如,身高、體重、血壓特征:一次抽樣中,所有個(gè)體的變量值的集合為這個(gè)樣本的特征。變量、個(gè)體、樣本變異:針對同一個(gè)特征,個(gè)體間的差異。比如,每個(gè)人的身高都有差異。變異產(chǎn)生的原因:來源于未知的、已知的,可以控制的和不可控制原因。比如,身高產(chǎn)生差異的原因有歸根結(jié)底,統(tǒng)計(jì)學(xué)其實(shí)就是在研究變異。3. 誤差(Error)與偏倚(Bias)誤差:在研究中得到的錯(cuò)誤的結(jié)果(定性概念);測量值與(理論)真實(shí)值之差(定量概念)。誤差按性質(zhì)可分為系統(tǒng)誤差和隨機(jī)誤差/抽樣誤差。隨機(jī)誤差:由隨機(jī)性產(chǎn)生,無方向性,無法完全避免。系統(tǒng)誤差:由一個(gè)可識(shí)別的來源造成。比如人為主觀因素、比如測

6、量工具的缺陷。有方向性(始終一個(gè)方向)。原則上可以避免。隨機(jī)變化系統(tǒng)誤差舒張壓(mm Hg)8090真實(shí)舒張壓(動(dòng)脈內(nèi)置管)一般的測量方法(血壓計(jì))Difference between Radom error and Systematic error隨機(jī)誤差系統(tǒng)誤差來源客觀存在主觀造成方向性無(不可預(yù)測)始終一個(gè)方向消除可能性無法完全消除可以消除,并應(yīng)盡可能消除解決方法增加樣本量,取平均值改進(jìn)設(shè)備,方法,流程偏倚(Bias)在數(shù)據(jù)的收集、分析、解釋、發(fā)表、監(jiān)測等所有過程中,由于系統(tǒng)性的原因?qū)е掠^察結(jié)果推論與真實(shí)情況存在的差異。偏倚就是系統(tǒng)誤差。偏倚的類型選擇偏倚(Selection bias)

7、信息偏倚(Information / Measurement bias)混雜偏倚(Confounding bias)4. 概率與小概率事件概念:描述隨機(jī)事件發(fā)生的可能性大小的數(shù)值,常用 P 來表示。大小:P 的大小在0和1之間,越接近于1,說明發(fā)生的可能性越大,越接近于0,說明發(fā)生的可能性越小。統(tǒng)計(jì)學(xué)中的許多結(jié)論是帶有概率性質(zhì)的,通常一個(gè)事件的發(fā)生小于5%,就叫小概率事件。頻率:在實(shí)際工作中,當(dāng)觀察單位的例數(shù)足夠多時(shí),可以用頻率來代替概率。頻率是概率的估計(jì)值。 統(tǒng)計(jì)分析的兩件事統(tǒng)計(jì)工作的兩件事:描述性、探索性統(tǒng)計(jì)描述(Statistical description)統(tǒng)計(jì)推斷(Statistic

8、al inference)統(tǒng)計(jì)描述:數(shù)據(jù)加工、整理。生成統(tǒng)計(jì)指標(biāo)(Statistic)、統(tǒng)計(jì)表格、統(tǒng)計(jì)圖形,對資料的數(shù)量特征及分布規(guī)律進(jìn)行描述和檢驗(yàn)。統(tǒng)計(jì)推斷:從樣本的信息推斷總體的特征。-用于描述總體特征的指標(biāo)稱為參數(shù)(Parameter)-通過樣本計(jì)算得到的特征指標(biāo)稱為統(tǒng)計(jì)量(Statistic)統(tǒng)計(jì)推斷分成兩種工作:參數(shù)估計(jì)和假設(shè)檢驗(yàn)參數(shù)估計(jì)(parameter estimation)分為點(diǎn)估計(jì)和區(qū)間估計(jì)點(diǎn)估計(jì):用樣本的一個(gè)統(tǒng)計(jì)量值來估計(jì)總體的參數(shù)值。比如平均身高、治愈率。區(qū)間估計(jì):通過可信區(qū)間(confidence interval)來估計(jì)總體參數(shù)值在一個(gè)范圍內(nèi)的概率。常用95% CI

9、。假設(shè)檢驗(yàn)(hypothesis testing)先提出假設(shè)(試驗(yàn)設(shè)計(jì)),再檢驗(yàn)假設(shè)的正確性。-比如提出一個(gè)假設(shè):較高職稱的干部因?yàn)楣ぷ鲏毫?dǎo)致血壓升高??萍?jí)干部 VS. 處級(jí)干部到底是由工作壓力引起的,還是其他原因(年齡、性別、肥胖)?假設(shè)檢驗(yàn)的步驟結(jié)論的表述I類錯(cuò)誤與II類錯(cuò)誤客觀實(shí)際主觀推斷拒絕H0不拒絕H0H0成立推斷正確H0不成立推斷正確描述性統(tǒng)計(jì)分析認(rèn)識(shí)你的數(shù)據(jù)變量的類型一般分為兩類:定量數(shù)據(jù)(quantitative data)和定性數(shù)據(jù)(qualitative data)數(shù)量變量分類變量計(jì)量變量無等級(jí)計(jì)數(shù)變量和有等級(jí)分類變量(ordinal category)。定量數(shù)據(jù)定性資料

10、別名1數(shù)值變量分類變量別名2連續(xù)性變量間斷性變量無等級(jí)有等級(jí)別名3計(jì)量資料計(jì)數(shù)資料分類等級(jí)變量特點(diǎn)有度量衡單位無度量衡單位例子身高、體重性別,種族疾病嚴(yán)重程度一、對定量數(shù)據(jù)(連續(xù)變量)的統(tǒng)計(jì)描述定量資料:年齡、身高、體重、血壓、血脂、血糖數(shù)據(jù)的特點(diǎn):連續(xù)性的數(shù)字,分布有一定的特征。頻數(shù)及其分布100名18歲健康女大學(xué)生身高的頻數(shù)分布身高組段劃記頻數(shù) f 1541121561111415811111,11111,11116011111,11111,1111316211111,11111,11111,11111,112216411111,11111,11111,11111916611111,111

11、11,111111516811111,111191701111417217411合 計(jì)10037頻數(shù):當(dāng)匯總大量的數(shù)據(jù)時(shí),把數(shù)據(jù)按區(qū)段分組,其中每個(gè)組的數(shù)據(jù)個(gè)數(shù),稱為該組的頻數(shù)。頻數(shù)表(頻數(shù)分布):表示各組及它們對應(yīng)的組頻數(shù)的表格稱為頻數(shù)表或頻數(shù)分布。通過直方圖可以直觀地了解頻數(shù)的分布。39頻數(shù)分布的兩個(gè)特征: 集中程度與離散程度頻數(shù)分布的類型: 對稱分布與偏態(tài)分布(集中位置偏向小的一側(cè)叫正偏態(tài),反之叫負(fù)偏態(tài))頻數(shù)表的主要用途: 1. 揭示分布類型 2. 發(fā)現(xiàn)特大值和特小值 3. 計(jì)算集中趨勢指標(biāo)與離散趨勢指標(biāo)40集中程度集中程度:表示大多數(shù)數(shù)值落在什么位置。對集中程度的特征描述用平均值:算數(shù)

12、平均值(均數(shù),Mean)幾何均數(shù)(Geometric mean)中位數(shù)(Median)算數(shù)平均數(shù)幾何均數(shù)意義:N個(gè)數(shù)值的乘積開N次方即為這N個(gè)數(shù)的幾何均數(shù)。表示:G 計(jì)算:應(yīng)用:原始數(shù)據(jù)分布不對稱,經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的資料。例如抗體滴度。443.中位數(shù)、百份位數(shù)(percentile)、眾數(shù)(mode)應(yīng)用范圍離散程度統(tǒng)計(jì)學(xué)研究的對象是富于變化的事物,同一總體中的各個(gè)體之間存在著變異,同質(zhì)各觀察值之間具有的相互偏離、彌散的趨向,這種趨向叫離散趨勢。 描述離散程度的常用指標(biāo):全距(極差,Range)四分位數(shù)間距( Quartile range)方差 (Variance)標(biāo)準(zhǔn)差(Standar

13、d deviation)變異系數(shù) (coefficient of variation, CV)計(jì)算方法方差(Variance) 描述定量資料分布離散程度的指標(biāo)之一,它反映了各觀察單位與均數(shù)之間的離散程度。適用于對稱分布的計(jì)量資料,包括正態(tài)分布和近似正態(tài)分布的計(jì)量資料??傮w方差的計(jì)算樣本方差的計(jì)算 標(biāo)準(zhǔn)差(Standard deviation)標(biāo)準(zhǔn)差是方差的算術(shù)平方根,與方差的應(yīng)用條件相同,適用于對稱分布的計(jì)量資料包括正態(tài)分布和近似正態(tài)分布的資料。計(jì)算方法變異系數(shù)(Coefficient of Variation)變異系數(shù):標(biāo)準(zhǔn)差與均數(shù)之比。描述了數(shù)據(jù)的變異相對于其平均水平的大小。可用于比較單位

14、不同或者均數(shù)大小相差懸殊的多組數(shù)據(jù)之間的離散程度正態(tài)分布(高斯分布)正態(tài)分布是對稱分布的一種理想狀態(tài)。57正態(tài)分布的特征標(biāo)準(zhǔn)正態(tài)曲線下的面積與橫軸數(shù)值的關(guān)系非標(biāo)準(zhǔn)正態(tài)曲線下的面積與橫軸數(shù)值的關(guān)系正態(tài)分布用于正常參考值的估計(jì)正態(tài)分布的意義正態(tài)分布是參數(shù)檢驗(yàn)的基礎(chǔ)。參數(shù)檢驗(yàn)包括t-test,ANOVA(方差分析)等。如果一個(gè)大樣本符合正態(tài)分布(近似正態(tài)),或者一個(gè)隨機(jī)抽樣的小樣本來自一個(gè)正態(tài)分布的總體,這時(shí)候才能夠采用正態(tài)分布。樣本的正態(tài)性檢驗(yàn)觀察法(圖示法)1、P-P圖如果資料服從正態(tài)分布,則樣本點(diǎn)應(yīng)圍繞第一象限的對角線分布。2、Q-Q圖如果資料服從正態(tài)分布,則樣本點(diǎn)應(yīng)該呈一條圍繞第一象限對角線

15、的直線。以上兩種方法以Q-Q圖為佳,效率較高。3、直方圖判斷方法:是否以鐘形分布,同時(shí)可以選擇輸出正態(tài)性曲線。4、箱式圖判斷方法:觀測離群值和中位數(shù)。5、莖葉圖判斷方法:類似直方圖計(jì)算法1.偏度系數(shù)(Skewness)和峰度系數(shù)(Kurtosis)除以各自的標(biāo)準(zhǔn)誤2.非參數(shù)檢驗(yàn)方法包括適用于大樣本的Kolmogorov-Smirnov檢驗(yàn)(D檢驗(yàn))和適用于小樣本的Shapiro- Wilk (W 檢驗(yàn))二、對定性數(shù)據(jù)(分類變量)的統(tǒng)計(jì)描述定性資料:性別、種族、膚色、血型、患病與否、治愈與否、有無并發(fā)癥數(shù)據(jù)的特點(diǎn):間斷性,可以用“是/否,輕/中/重,A/B/C/D,1/2/3/4/5”表示。分類資料的描述絕對數(shù),或稱計(jì)數(shù)(count)相對數(shù):兩個(gè)數(shù)值之比。分為:構(gòu)成比(proportion),指一事物內(nèi)部某一組成部分所占的比重。 學(xué)歷 人數(shù)構(gòu)成比(%)本科 99 0.14大專 1248 1.74中專53521 72.65無學(xué)歷18763 25.47合計(jì)73667100.00某地1992年護(hù)理人員學(xué)歷構(gòu)成2.率(rate):在某一事件中,實(shí)際發(fā)生某一現(xiàn)象的觀察數(shù)與可能會(huì)發(fā)生該現(xiàn)象的總觀察數(shù)之比。用于說明某現(xiàn)象發(fā)生的頻率或強(qiáng)度。如:患病率、發(fā)病率、感染率、治愈率、死亡率、病死率 2022/7/2170病名平均人口數(shù)人數(shù)死亡率(1/10萬)高血

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論