版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
多元統(tǒng)計與軟件應用研究生教學用書/教育部學位管理與研究生教育司推薦
醫(yī)
學
統(tǒng)
計
學(第三版)
出版日:2010-08-01
孫振球主編徐勇勇副主編課程安排
72學時
4~17周,每周6學時(星期一、日)考試時間另行通知由衛(wèi)生部教材辦和全國高等醫(yī)藥教材建設研究會規(guī)劃的研究生教材《醫(yī)學統(tǒng)計學》于2010年8月(第三版)出版以來,為全國大多數高等醫(yī)藥院校選用,反映良好。2002年8月(第一版)2005年8月(第二版)2010年8月(第三版)2014年(第四版)講授內容內容提要第一節(jié)概述第二節(jié)醫(yī)學統(tǒng)計資料的來源與分類第三節(jié)統(tǒng)計學常用的基本概念第四節(jié)統(tǒng)計工作的基本步驟第五節(jié)統(tǒng)計學發(fā)展簡史統(tǒng)計學(statistics)統(tǒng)計學是關于數據(data)的科學,是從數據中提取信息的一門學科,包括設計、搜集、整理、分析和表達等步驟。第一節(jié)概述1.采用統(tǒng)計學方法,發(fā)現不確定現象背后隱藏的規(guī)律。變異(variation)是社會和生物醫(yī)學中的普遍現象。變異使得實驗或觀察的結果具有不確定性,如每個人的身高、體重、血壓等各有不同。
為什么要學統(tǒng)計學?
最大值=6.18,最小值=3.29,極差=2.89。算術均數=4.72,標準差=0.57。2.用統(tǒng)計學思維方式考慮有關醫(yī)學研究中的問題
“陽性”結果是否是虛假聯系?某感冒藥治療1周后,治愈率為90%,能否說該感冒藥十分有效?
“陰性”結果是否是樣本含量不足?
有人曾對發(fā)表在Lancet,NEnglJMed,JAMA等著名醫(yī)學雜志上的71篇陰性結果的論文作過分析,發(fā)現其中有62篇(93%)可能是由于樣本含量不足造成的假陰性。
JAMA,新英格蘭醫(yī)學雜志(NEJM)、英國醫(yī)學雜志、中華醫(yī)學會雜志對來稿都有統(tǒng)計學要求或統(tǒng)計學指導。國際生物醫(yī)學雜志編輯協會在其《生物醫(yī)學期刊投稿的統(tǒng)一要求》中也包含了統(tǒng)計學要求。UniformRequirementsforManuscripts
SubmittedtoBiomedicalJournals
http://4.獲得循證醫(yī)學證據的主要手段“良好愿望的醫(yī)學”(well-meaningmedicine)轉入“以證據為基礎的醫(yī)學”(evidence-basedmedicine,EBM)需要有統(tǒng)計學方法的支持。
全世界的醫(yī)學期刊每年大約刊登600萬學術論文,但能作為可靠“證據”的論文并不多。
二、統(tǒng)計數據的分類只有認識了數據的特點,才能正確地選用統(tǒng)計分析方法
按變量測量的精確程度由低到高,將數據分類為:名義數據(如性別、婚姻狀況)、有序變量(如療效,類別間差別大小難以度量)、區(qū)間變量(如攝氏體溫,類別間差別有實際意義)、比變量(如身高,除具有區(qū)間變量的特征外,還具有真實意義的零點。攝氏溫度的零點為水結冰時溫度,并非絕對意義的零點,所以它不屬于比變量)定量數據定性數據1、定性數據(qualitativedata)
(二項與多項)分類數據(categoricaldata)計數數據(enumeration(counting)data)
2、定量數據(quantitativedata)
計量數據(measurementdata)區(qū)間數據(intervaldata)數值數據(numericaldata)3、等級資料(rankeddata)
有序資料(ordinaldata)
(一)定性與定量數據的別名(二)三類數據間的關系
例:一組2040歲成年人的血壓以12kPa為界分為正常與異常兩組,統(tǒng)計每組例數
<8低血壓8正常血壓12輕度高血壓15中度高血壓17重度高血壓定量數據等級數據定性數據觀察單位observations個體individuals變量variablesQuantitativedata定量資料Qualitativedata定性數據Units;elements(三)三類數據的編碼與計算(1)
例:一組2040歲成年人的血壓以12kPa為界分為正常(=0)與異常(=1)兩組,統(tǒng)計每組例數
<8低血壓418正常血壓102
12輕度高血壓13315中度高血壓164
17重度高血壓185定量數據等級數據定性數據(三)三類數據的編碼與計算(2)1.定量數據:允許計算均數、標準差等(可采用t、F檢驗等,可當做有序或定性數據處理)2.定性數據:編碼是任意的,不能對編碼執(zhí)行均數標準差等計算,但可計算率或比(可采用卡方檢驗等)
調查14名男子的婚姻狀況3.有序數據:允許基于順序的計算,如計算中位數、百分位數(可當做定性數據處理)1、變量——可以測量的任何特征或屬性Anycharacteristicorattributethatcanbemeasured。(不同個體結果可能不同)隨機變量——在概率論中稱變量為隨機變量
一、變量與隨機變量Variableandrandomvariable根據觀察數據之間有無縫隙(gap),常將數據分類為離散型(discrete)變量(有縫隙)與連續(xù)型(continuous)變量(無縫隙)兩大類。三、總體與樣本populationandsample總體:根據研究目的確定的同質研究對象的全體(集合)。分有限總體與無限總體樣本:從總體中隨機抽取的部分研究對象
隨機抽樣randomsampling為了保證樣本的可靠性和代表性,需要采用隨機的方法抽取樣本(在總體中每個個體具有相同的機會被抽到)。四、參數與統(tǒng)計量
parameterandstatistic參數:總體的統(tǒng)計指標,如總體均數、標準差,采用希臘字母分別記為μ、σ。固定的常數
總體樣本抽取部分觀察單位
統(tǒng)計量
參數
推斷inference統(tǒng)計量:樣本的統(tǒng)計指標,如樣本均數、標準差,采用拉丁字母分別記為。參數附近波動的隨機變量。
樣本的實際發(fā)生率稱為頻率。設在相同條件下,獨立重復進行n次試驗,事件A出現f次,則事件A出現的頻率為f/n。
概率:隨機事件發(fā)生的可能性大小,用大寫的P表示;取值[0,1]。五、頻率與概率
frequencyandprobability必然事件P=1隨機事件0<P<1不可能事件P=0
P≤0.05(5%)或P≤0.01(1%)稱為小概率事件(習慣),統(tǒng)計學上認為不大可能發(fā)生。小概率事件CertainImpossible0.501頻率與概率間的關系:1.樣本頻率總是圍繞概率上下波動2.樣本含量n越大,波動幅度越小,頻率越接近概率。六、誤差(Error)測量值=真值+隨機誤差+非隨機誤差
Xi=i+i
1.隨機誤差(隨機抽樣誤差):影響因素眾多,變化無方向性,不可避免,但可用統(tǒng)計方法進行分析。2.系統(tǒng)誤差受確定因素影響,大小變化有方向性。3.非系統(tǒng)誤差(過失誤差)研究者偶然失誤而造成的誤差。偏差(bias)七、準確度與可靠度準確度(accuracy)或真實性(validity):觀察值與真值的接近程度,受系統(tǒng)誤差的影響(常用指標:如靈敏度、特異度)??煽慷龋╮eliabiliy)——也稱精密度(precision)或重復性(repeatability):重復觀察時觀察值與其均值的接近程度,受隨機誤差的影響(常用指標:一致百分率、Kappa值)。八、因果關系與統(tǒng)計學聯系因果關系(causality)統(tǒng)計學聯系(association)由于混雜因素,標準的統(tǒng)計學方法一般只能獲得是否存在統(tǒng)計學聯系的結論。一、研究設計二、搜集資料三、整理資料四、分析資料五、結果表達第四節(jié)統(tǒng)計工作的基本步驟1.調查設計(surveydesign)對研究對象不施加任何干預,通常建立隨機抽樣(randomsampling)方案。2.實驗設計(experimentdesign)對研究對象施加干預,如動物實驗研究、臨床試驗,通常建立隨機分組(randomallocation)方案。一、研究設計實驗設計的三個基本原則1.隨機化(randomization)2.對照(control)3.重復(replication)Fisher在他的著作中多次強調,統(tǒng)計學家與科學研究者的合作應該在實驗設計階段,而不是在需要數據處理的時候?!霸囼炌瓿珊笤僬医y(tǒng)計學家,無異于請統(tǒng)計學家為試驗進行“尸體解剖”。統(tǒng)計學家或許只能告訴你試驗失敗的原因。”
二、搜集資料(datacollection)搜集資料要遵循準確、完整、及時三個原則。資料搜集計劃包括:①選擇搜集資料的地點、人員和時間;②搜集資料人員的培訓方案;③預調查或預實驗方案擬定;④資料的記錄方式;⑤調查表的擬訂和印刷;⑥調查或實驗儀器、試劑的準備;⑦調查資料的抽樣復核比例和方法;⑧搜集資料所需經費的準備等。人員選擇:高素質、有相關專業(yè)基礎、以往曾有類似研究經歷的人員加以嚴格培訓和管理是能夠遵循三原則的保證。搜集資料的方式:直接觀察、采訪、填表和通信。直接觀察、采訪:調查人員親自參與和記錄,若調查人員素質高,工作認真負責,并接受過統(tǒng)一的培訓,調查結果可靠。填表和通信由被調查者自己填寫,若被調查者文化水平高,素質高,樂意配合調查,也可以得到可靠的資料,否則資料的誤差較大。三、整理資料(datasorting)
目的是將搜集到的原始資料系統(tǒng)化、條理化,便于進一步計算與分析。編碼,將數據輸入計算機糾錯改錯、補漏等四、分析資料(dataanalysis)根據研究設計的目的、要求,資料的類型和分布的特征等選擇統(tǒng)計分析方法。1.統(tǒng)計描述:即計算統(tǒng)計指標,如平均值、發(fā)病率等,繪制統(tǒng)計圖。2.統(tǒng)計推斷:即可信區(qū)間估計與統(tǒng)計學假設檢驗總體均數、總體率的可信區(qū)間及其假設檢驗兩個總體均數、總體率差值的可信區(qū)間及其假設檢驗多個總體指標之間的假設檢驗。3.多因素回歸模型分析等。統(tǒng)計描述統(tǒng)計推斷指標描述圖表描述參數估計假設檢驗統(tǒng)計分析五、結果表達使用的統(tǒng)計學方法使用的統(tǒng)計學軟件假設檢驗的統(tǒng)計量、P值等結論第五節(jié)統(tǒng)計學發(fā)展簡史
1.早期公元前3050年古埃及人為修建金字塔籌集建筑費,對全國的人口和財產進行了普查。19世紀,應用數學家為解決賭徒們在博彩中出現的輸贏概率問題逐漸形成和發(fā)展了概率論,從而為統(tǒng)計學的發(fā)展奠定了堅實的基礎。2.近代
計算機和統(tǒng)計軟件如SAS、SPSS的出現使統(tǒng)計學得到了突飛猛進的發(fā)展。
3.現代
生物統(tǒng)計學著名歷史人物其人其事
1.數學神童Gauss
(1777-1855)德國數學神童高斯
在孩童時就能夠快速計算出“1+2+3+…+100=5050”的答案。他對統(tǒng)計的主要貢獻除了正態(tài)分布(
normaldistribution)外,還有算術均數、幾何均數、二項分布理論和最小二乘法等。其實,在Gauss之前就有人發(fā)現了正態(tài)分布,但只有他很快將之應用于天文學研究,并使其應用價值廣為人知,故正態(tài)分布又稱高斯分布(Gaussiandistribution)。2.從釀酒師到統(tǒng)計主管的Gosset(1876-1937)
1899年Gosset在英國都柏林一釀酒公司做釀酒師,在對小樣本進行質量控制的研究中發(fā)現了t分布,其論文1908年以Student為筆名發(fā)表。自此開創(chuàng)了小樣本統(tǒng)計的新紀元。
非常有趣的現象是,Gosset的數學欠佳,因而不能自己解決t檢驗的理論和應用問題,其最后的完善,是由Fisher,Neyman和EPearson先后完成的。正如后人評價的那樣:“Gosset提出實際問題,Fisher和EPearson將其轉成統(tǒng)計問題,Neyman用數學解決問題”。
實際上是1925年Fisher在《t分布的應用》一文中定義的。
大家熟知的公式:3.醫(yī)院統(tǒng)計與衛(wèi)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024智慧城市交通信號控制系統(tǒng)優(yōu)化合同
- 2025年度橙子包裝設計與定制生產合同2篇
- 2025年度環(huán)保設備銷售與服務合同4篇
- 2024版人身損害賠償協議
- 二零二四年外墻清洗專業(yè)團隊服務合同樣本3篇
- 2024-2025學年高中地理第一章環(huán)境與環(huán)境問題第一節(jié)我們周圍的環(huán)境課時分層作業(yè)含解析新人教版選修6
- 二零二五版城市綜合體土方運輸與臨時堆場租賃合同3篇
- 二零二五年度餐飲業(yè)人力資源派遣合同范本3篇
- 2025年特色小鎮(zhèn)物業(yè)經營權及配套設施合作合同3篇
- 二零二五版科技公司股份交易與稅收籌劃合同3篇
- 經濟思維方式課后部分習題
- 【真題】2024年常州市中考物理試卷(含答案解析)
- 高考全國Ⅲ卷語文真題含答案
- 10kV架空線路專項施工方案
- OGSM戰(zhàn)略規(guī)劃框架:實現企業(yè)目標的系統(tǒng)化方法論
- 遼寧省大連市中山區(qū)2023-2024學年七年級下學期期末數學試題
- 2023年版《安寧療護實踐指南(試行)》解讀課件
- 2024年新課標高考化學試卷(適用黑龍江、遼寧、吉林地區(qū) 真題+答案)
- AQ6111-2023個體防護裝備安全管理規(guī)范
- 鈷酸鋰-安全技術說明書MSDS
- 江蘇省“大唐杯”全國大學生新一代信息通信技術大賽省賽題庫(含答案)
評論
0/150
提交評論