統(tǒng)計(jì)1第一講緒論_第1頁
統(tǒng)計(jì)1第一講緒論_第2頁
統(tǒng)計(jì)1第一講緒論_第3頁
統(tǒng)計(jì)1第一講緒論_第4頁
統(tǒng)計(jì)1第一講緒論_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第一章緒論緒論什么是醫(yī)學(xué)統(tǒng)計(jì)學(xué)統(tǒng)計(jì)工作的步驟統(tǒng)計(jì)學(xué)的幾個基本概念2什么是醫(yī)學(xué)統(tǒng)計(jì)學(xué)(medicalstatistics)statistics:Asciencedealingwiththecollection,analysis,interpretation,andpresentationofmassesofnumericaldata(Webster’sInternationalDictionary)。醫(yī)學(xué)統(tǒng)計(jì)學(xué)就是應(yīng)用統(tǒng)計(jì)學(xué)的原理和方法,研究醫(yī)學(xué)領(lǐng)域的數(shù)據(jù)收集、整理和分析的應(yīng)用科學(xué)。3工作生活中常見的統(tǒng)計(jì)學(xué)問題如何判斷藥物的療效?(假設(shè)檢驗(yàn))肝癌手術(shù)后能活過5年的可能性有多大?(概率論)了解頭發(fā)的鉛含量與血鉛含量的關(guān)系,其強(qiáng)度有多大?(相關(guān)與回歸)想研究肝癌的病因,應(yīng)該要如何進(jìn)行的?(設(shè)計(jì),抽樣)中國成人體質(zhì)調(diào)查了解成人的體質(zhì)狀況(現(xiàn)場調(diào)查)

統(tǒng)計(jì)學(xué)是對令人困惑費(fèi)解的數(shù)字問題做出設(shè)想的藝術(shù)。4統(tǒng)計(jì)工作的步驟第一步設(shè)計(jì):制定計(jì)劃,對整個過程進(jìn)行安排。是整個工作的關(guān)鍵。如何進(jìn)行設(shè)計(jì)?舉例。背景-目的-方法-內(nèi)容-經(jīng)費(fèi)預(yù)算(觀察性設(shè)計(jì)、實(shí)驗(yàn)性設(shè)計(jì):實(shí)驗(yàn)設(shè)計(jì);臨床設(shè)計(jì))樣本量、如何隨機(jī)抽樣、如何安排處理、效應(yīng)變量。第二步收集資料:根據(jù)計(jì)劃取得可靠、完整的資料。收集資料的方法有三種:統(tǒng)計(jì)報表(完整、準(zhǔn)確、及時)、日常性工作、專題調(diào)查、統(tǒng)計(jì)年鑒和統(tǒng)計(jì)數(shù)據(jù)專輯。注重資料的真實(shí)性。第三步整理資料:原始資料的整理、清理、核實(shí)、查對,使其條理化、系統(tǒng)化便于計(jì)算和分析。可借助于計(jì)算機(jī)(常用軟件:EPI、SPSS、SAS)。第四步分析資料(統(tǒng)計(jì)分析):統(tǒng)計(jì)學(xué)的關(guān)鍵所在。運(yùn)用統(tǒng)計(jì)學(xué)的基本原理和方法,分析計(jì)算有關(guān)的指標(biāo)和數(shù)據(jù),揭示事物內(nèi)部的規(guī)律。(統(tǒng)計(jì)描述、統(tǒng)計(jì)推斷)5統(tǒng)計(jì)學(xué)中的幾個基本概念1、同質(zhì)與變異2、變量與資料3、總體與樣本4、參數(shù)與統(tǒng)計(jì)量5、誤差6、頻率與概率

6同質(zhì)與變異

(

homogeneityandvariation)同質(zhì):指事物的性質(zhì)、影響條件或背景相同或非常相近。

變異:同質(zhì)事物個體間的差異。來源于一些未加控制或無法控制的甚至不明原因的因素。是統(tǒng)計(jì)學(xué)存在的基礎(chǔ),從本質(zhì)上說,統(tǒng)計(jì)學(xué)就是研究變異的科學(xué)。78表1-1120名正常成年男子紅細(xì)胞計(jì)數(shù)值(1012/L)

84.314.094.414.334.584.245.454.324.844.994.794.905.094.645.145.464.635.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.824.444.134.434.025.865.125.363.864.685.485.314.534.834.113.263.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69最大值=6.18,最小值=3.29,極差=2.89算術(shù)均數(shù)=4.72,標(biāo)準(zhǔn)差=0.57

變量與資料(VariableandData)基本概念:變量及變量值,研究者對每個觀察單位的某項(xiàng)特征進(jìn)行觀察和測量,這種特征能表現(xiàn)觀察單位的變異性,稱為變量,變量的測得值叫變量值(也叫觀察值),變量值構(gòu)成資料。按變量值的性質(zhì)可將資料分為計(jì)量資料、計(jì)數(shù)資料、等級資料。資料類型:計(jì)量資料、計(jì)數(shù)資料、等級資料9資料計(jì)量資料連續(xù)型離散型分類型資料無序分類有序分類資料類型無序分類(unordercategoricalvariable)或名義變量(nominativevariable)。例如,職業(yè)(工、農(nóng)、商、學(xué)、兵等)是一個分類變量;其可能的“取值”不是數(shù)字,而是類別,二分類變量(binaryvariable),稱為0-1變量例如,性別(男女)、疾?。ㄓ袩o)和結(jié)局(生死)等。二分類變量常用0和1來編碼,0-1變量常稱為假變量(dummyvariable)或啞變量,可以和真變量一樣參與計(jì)算。有序變量(ordinalvariable)或等級變量。分類變量的“取值”中自然地存在著次序。例如,問卷調(diào)查常問對某件事情的滿意程度:極不滿意、有點(diǎn)滿意、中度滿意、很滿意、極滿意。有些臨床體檢或?qū)嶒?yàn)室檢驗(yàn)常用–、±、+、++和+++來表示測量結(jié)果。離散型變量(discretevariable):離散型變量只能取整數(shù)值。例如,一月中的手術(shù)病人數(shù),一年里的新生兒數(shù)。連續(xù)型變量(continuousvariable):連續(xù)型變量可以取實(shí)數(shù)軸上的任何數(shù)值?!斑B續(xù)”是指該變量可以在實(shí)數(shù)軸上連續(xù)變動,由測量而得到。例如,血壓、身高、體重等。11住院號年齡身高體重住院天數(shù)職業(yè)文化程度分娩方式妊娠結(jié)局20256552716571.55無中學(xué)順產(chǎn)足月20256532216074.05無小學(xué)助產(chǎn)足月20258302515868.06管理員大學(xué)順產(chǎn)足月20225432316169.05無中學(xué)剖宮產(chǎn)足月20224662515962.011商業(yè)中學(xué)剖宮產(chǎn)足月20245352715768.02無小學(xué)順產(chǎn)早產(chǎn)20258342015866.04無中學(xué)助產(chǎn)早產(chǎn)20194642415870.53無中學(xué)助產(chǎn)足月20257832915457.07干部中學(xué)剖宮產(chǎn)足月觀察單位observations個體Units;elements變量variablesQuantitativedata計(jì)量資料Categoricaldata分類資料計(jì)量資料(measurementdata)12定義:通過度量衡的方法,測量每一個觀察單位的某項(xiàng)研究指標(biāo)的量的大小,得到的一系列數(shù)據(jù)資料。例如:體重與身高特點(diǎn):有度量衡單位,連續(xù)性資料(continuous)或離散型(discrete)

(通過測量得到)計(jì)數(shù)資料(enumerationdata)定義:將全體觀測單位按照某種性質(zhì)或特征分組,然后再分別清點(diǎn)各組觀察單位的個數(shù)。特點(diǎn):沒有度量衡單位多為間斷性資料(通過枚舉或記數(shù)得來)13無序分類(unorderedcategories)二項(xiàng)分類男女多項(xiàng)分類

A型、B型、O型、AB型14等級資料(rankeddata)

又稱有序分類(ordinalcategories)、半定量(semi-quantitativedata)。特點(diǎn):各分類之間有程度上的不同。例:療效(治愈、顯效、好轉(zhuǎn)、無效)尿蛋白(-、±、+、++)1516實(shí)例數(shù)據(jù)1編號性別年齡(歲)部位分化程度分期肝轉(zhuǎn)移PCNA指數(shù)生存時間(月)(1)(2)(3)(4)(5)(6)(7)(8)(9)1男61上低分化Ⅰ陽性52142女58中高分化Ⅱ陰性89203女63上高分化Ⅳ陰性93194女71下中分化Ⅱ陽性7855男59上高分化Ⅲ陰性8535………………………膽管癌患者部分指標(biāo)17實(shí)例數(shù)據(jù)2體重指數(shù)身高班制勞動強(qiáng)度緊張程度心率嗜肥肉史收縮壓舒張壓中風(fēng)家族史(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)12.241.6211370114690有16.471.6331372011070無15.191.6412272010070無15.591.6311384111470無12.601.6431368111668無…………………………變量與資料

變量轉(zhuǎn)化:變量只能由高級向低級轉(zhuǎn)化:19資料類型間關(guān)系

例:一組2040歲成年人的血壓以12kPa為界分為正常與異常兩組,統(tǒng)計(jì)每組例數(shù)

<8低血壓

8

正常血壓

12

輕度高血壓

15

中度高血壓

17

重度高血壓定量資料二項(xiàng)分類資料有序分類總體與樣本(populationandsample)總體:根據(jù)研究目的確定的同質(zhì)觀察單位的全體。當(dāng)研究有具體而明確的指標(biāo)時,總體是指該項(xiàng)變量值的全體。觀察單位(個體):最基本的研究單位分為有限總體和無限總體。由于調(diào)查總體的不可能性、巨大性和沒必要。對其中的一部分對象進(jìn)行調(diào)查----樣本:總體中有代表性的一部分。樣本(總體與樣本的關(guān)系。舉例。)樣本選擇的原則--??樣本量(samplesize)2021參數(shù)與統(tǒng)計(jì)量

parameterandstatistic

參數(shù):總體的統(tǒng)計(jì)指標(biāo),如總體均數(shù)、標(biāo)準(zhǔn)差,采用希臘字母分別記為μ、σ。固定的常數(shù)

統(tǒng)計(jì)量:樣本的統(tǒng)計(jì)指標(biāo),如樣本均數(shù)、標(biāo)準(zhǔn)差,采用拉丁字母分別記為。

參數(shù)附近波動的隨機(jī)變量。總體樣本抽取部分觀察單位

統(tǒng)計(jì)量

參數(shù)

推斷inference誤差(error)誤差:統(tǒng)計(jì)上所說的誤差泛指測量值與真值之差,樣本指標(biāo)與總體指標(biāo)之差。主要有以下二種:非隨機(jī)誤差和隨機(jī)誤差(隨機(jī)測量誤差,抽樣誤差)。(1)系統(tǒng)誤差:指數(shù)據(jù)搜集和測量過程中由于儀器不準(zhǔn)確、標(biāo)準(zhǔn)不規(guī)范等原因,造成觀察結(jié)果呈傾向性的偏大或偏小,這種誤差稱為系統(tǒng)誤差。(systemicerror)(2)非系統(tǒng)誤差(過失誤差):失誤引起(3)隨機(jī)誤差:由于一些非人為的偶然因素使得結(jié)果或大或小,是不確定、不可預(yù)知的。(randomerror)

23隨機(jī)測量誤差(randommeasurementerror)

在消除了系統(tǒng)誤差的前提下,由于非人為的偶然因素,對于同一樣本多次測定結(jié)果不完全一樣,結(jié)果有時偏大有時偏小,沒有傾向性,這種誤差叫隨機(jī)測量誤差。特點(diǎn):沒有傾向性,多次測量計(jì)算平均值可以減小甚至消除隨機(jī)測量誤差。24總體:5歲男童身高樣本Xi:一個樣本5歲男童樣本抽樣誤差抽樣誤差:

樣本與總體5歲男童身高不同抽樣誤差(randomsamplingerror)由于抽樣原因造成的樣本指標(biāo)與總體指標(biāo)之間的差別。26特點(diǎn):有抽樣誤差就不可避免。統(tǒng)計(jì)上可以計(jì)算并在一定范圍內(nèi)控制抽樣誤差。(1)改進(jìn)抽樣方法,增加樣本的代表性。樣本量n相等的情況下:整群抽樣>單純隨機(jī)抽樣>系統(tǒng)抽樣>分層抽樣(2)增加樣本量n(3)選擇變異程度較小的研究指標(biāo)27減少抽樣誤差的方法:頻率拋一枚硬幣,是否國徽面一定向上?明天的股市升還是降?某患者痊愈的可能性?這些問題的答案都不可能絕對??疾炷硞€可能的結(jié)果,若在n次觀察中,有m次觀察到這種可能的結(jié)果,則稱這種可能的結(jié)果發(fā)生的比例為頻率,m稱為頻數(shù)。顯然有。在醫(yī)學(xué)上所說的患病率、病死率等都是頻率。如治療了n個幽門螺旋桿菌感染(HP陽性)的患者,其中有m個人治愈(HP呈陰性),則治愈率。頻率f是一個隨機(jī)抽樣觀察的結(jié)果,因此頻率f呈一定的隨機(jī)波動。如在某地區(qū)隨機(jī)抽樣調(diào)查糖尿病的患病率,其結(jié)果如下2829抽樣(調(diào)查)人數(shù)n1005001000500010000500001000001000000糖尿病人數(shù)m124810249399249991000399999頻率(患病率%)f12.09.6010.29.869.9210.0010.0010.00由上述表可以看到頻率f呈某種隨機(jī)性。但隨著抽樣人數(shù)n的增大,頻率(患病率)f隨機(jī)波動的幅度越來越小并且趨向常數(shù)10%??梢宰C明:當(dāng)觀察次數(shù)n越來越大,頻率f的隨機(jī)波動幅度越來越小,并最終趨向于一個常數(shù),這個常數(shù)被稱為隨機(jī)事件A發(fā)生的概率(又稱為統(tǒng)計(jì)學(xué)上的概率定義)。

結(jié)果概率(probability)

概念:描述隨機(jī)事件發(fā)生的可能性大小的數(shù)值,常用P來表示。大?。篜的大小在0和1之間,越接近于1,說明發(fā)生的可能性越大,越接近于0,說明發(fā)生的可能性越小。統(tǒng)計(jì)學(xué)中的許多結(jié)論是帶有概率性質(zhì)的,通常一個事件的發(fā)生小于5%,就叫小概率事件。頻率:在實(shí)際工作中,當(dāng)觀察單位的例數(shù)足夠多時,可以用頻率來代替概率。頻率是概率的估計(jì)值。3031統(tǒng)計(jì)學(xué)發(fā)展及有關(guān)問題

20世紀(jì)20年代,英國統(tǒng)計(jì)學(xué)家R.A.Fisher爵士(1890-1962)創(chuàng)立了實(shí)驗(yàn)設(shè)計(jì)方法和統(tǒng)計(jì)分析技術(shù),奠定現(xiàn)代生物統(tǒng)計(jì)的基礎(chǔ)。1948年,英國發(fā)表了評價鏈霉素治療肺結(jié)核療效的隨機(jī)對照的臨床試驗(yàn)報告,第一次采用生物統(tǒng)計(jì)方法進(jìn)行臨床干預(yù)試驗(yàn)。1948年,郭祖超教授(1912~1999)編著的《醫(yī)學(xué)與生物統(tǒng)計(jì)方法》,是我國第一部醫(yī)學(xué)統(tǒng)計(jì)方法的教科書。實(shí)例

遺傳學(xué)家F.Galton爵士(1822-1911)對上千家庭父親身高和兒子身高的觀察發(fā)現(xiàn)遺傳的“回歸”現(xiàn)象1960年英國醫(yī)生Doll,Hill等發(fā)現(xiàn)吸煙與肺癌有關(guān)醫(yī)學(xué)論文中的統(tǒng)計(jì)學(xué)問題60年代到80年代,國外醫(yī)學(xué)雜志調(diào)查結(jié)果:有統(tǒng)計(jì)錯誤的論文20%~72%。1996年對4586篇論文統(tǒng)計(jì)(中華醫(yī)學(xué)會系列雜志占6.9%),數(shù)據(jù)分析方法誤用達(dá)55.7%。偽造統(tǒng)計(jì)數(shù)據(jù)違反科學(xué)道德1976年NewScience雜志關(guān)于科研舞弊行為的調(diào)查(1)74%的調(diào)查表反映有不正當(dāng)修改數(shù)據(jù)的情況(2)17%拼湊實(shí)驗(yàn)結(jié)果(3)7%憑空捏造數(shù)據(jù)(4)2%故意曲解結(jié)果FancystatisticalmethodscannotrescuegarbagedataFancystatisticalmethodscanhelpyougaininsightintoyourdata,overandabovewhatseemsobviousonitsfaceYoushouldalwaysworryaboutwhetherthesampledresultsarerepresentativeofthepopulation,andwhetheryoursampleallowsyoutomakeinferencesaboutthepopulation.AWarning!如何學(xué)習(xí)統(tǒng)計(jì)學(xué)(特點(diǎn):靈活、抽象)理解基本的統(tǒng)計(jì)原理培養(yǎng)統(tǒng)計(jì)思維能力:抽象的,邏輯推理多練習(xí):課堂練習(xí),課下做習(xí)題(要求:上課帶計(jì)算器)聯(lián)系實(shí)際:閱讀文獻(xiàn)工作和生活實(shí)際36思考題371.統(tǒng)計(jì)工作的基本步驟是什么?2.統(tǒng)計(jì)資料分為幾類?特點(diǎn)?3.什么是總體?什么是樣本?4.什么是抽樣誤差?如何減小?能否避免?5.什么是概率?概率與頻率的區(qū)別某年級甲班、乙班各有男生50人。從兩個班各抽取10人測量身高,如果甲班的平均身高大于乙班,能否推論甲班所有同學(xué)的平均身高也大于乙班?為什么?用A,B兩種藥物分別治療一批患者。如果A藥的治愈率高于B藥,證明A藥的療效優(yōu)于B藥。這種說法對嗎?為什么?思考題39為了了解某地20~29歲健康女性血紅蛋白的正常值范圍,現(xiàn)隨機(jī)調(diào)查了該地2000名20~29歲

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論