統(tǒng)計(jì)1第一講緒論

上傳人：我*** IP屬地：北京上傳時間：2023-01-09 格式：PPTX 頁數(shù)：41 大?。?.19MB 積分：14 舉報 版權(quán)申訴

已閱讀5頁，還剩36頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第一章緒論緒論什么是醫(yī)學(xué)統(tǒng)計(jì)學(xué)統(tǒng)計(jì)工作的步驟統(tǒng)計(jì)學(xué)的幾個基本概念2什么是醫(yī)學(xué)統(tǒng)計(jì)學(xué)（medicalstatistics)statistics:Asciencedealingwiththecollection,analysis,interpretation,andpresentationofmassesofnumericaldata(Webster’sInternationalDictionary)。醫(yī)學(xué)統(tǒng)計(jì)學(xué)就是應(yīng)用統(tǒng)計(jì)學(xué)的原理和方法，研究醫(yī)學(xué)領(lǐng)域的數(shù)據(jù)收集、整理和分析的應(yīng)用科學(xué)。3工作生活中常見的統(tǒng)計(jì)學(xué)問題如何判斷藥物的療效？(假設(shè)檢驗(yàn))肝癌手術(shù)后能活過5年的可能性有多大？(概率論)了解頭發(fā)的鉛含量與血鉛含量的關(guān)系，其強(qiáng)度有多大？(相關(guān)與回歸)想研究肝癌的病因，應(yīng)該要如何進(jìn)行的？(設(shè)計(jì),抽樣)中國成人體質(zhì)調(diào)查了解成人的體質(zhì)狀況(現(xiàn)場調(diào)查)

統(tǒng)計(jì)學(xué)是對令人困惑費(fèi)解的數(shù)字問題做出設(shè)想的藝術(shù)。4統(tǒng)計(jì)工作的步驟第一步設(shè)計(jì)：制定計(jì)劃，對整個過程進(jìn)行安排。是整個工作的關(guān)鍵。如何進(jìn)行設(shè)計(jì)？舉例。背景-目的-方法-內(nèi)容-經(jīng)費(fèi)預(yù)算（觀察性設(shè)計(jì)、實(shí)驗(yàn)性設(shè)計(jì)：實(shí)驗(yàn)設(shè)計(jì)；臨床設(shè)計(jì)）樣本量、如何隨機(jī)抽樣、如何安排處理、效應(yīng)變量。第二步收集資料：根據(jù)計(jì)劃取得可靠、完整的資料。收集資料的方法有三種：統(tǒng)計(jì)報表（完整、準(zhǔn)確、及時）、日常性工作、專題調(diào)查、統(tǒng)計(jì)年鑒和統(tǒng)計(jì)數(shù)據(jù)專輯。注重資料的真實(shí)性。第三步整理資料：原始資料的整理、清理、核實(shí)、查對，使其條理化、系統(tǒng)化便于計(jì)算和分析。可借助于計(jì)算機(jī)（常用軟件：EPI、SPSS、SAS）。第四步分析資料(統(tǒng)計(jì)分析)：統(tǒng)計(jì)學(xué)的關(guān)鍵所在。運(yùn)用統(tǒng)計(jì)學(xué)的基本原理和方法，分析計(jì)算有關(guān)的指標(biāo)和數(shù)據(jù)，揭示事物內(nèi)部的規(guī)律。（統(tǒng)計(jì)描述、統(tǒng)計(jì)推斷）5統(tǒng)計(jì)學(xué)中的幾個基本概念1、同質(zhì)與變異2、變量與資料3、總體與樣本4、參數(shù)與統(tǒng)計(jì)量5、誤差6、頻率與概率

6同質(zhì)與變異

(

homogeneityandvariation)同質(zhì)：指事物的性質(zhì)、影響條件或背景相同或非常相近。

變異：同質(zhì)事物個體間的差異。來源于一些未加控制或無法控制的甚至不明原因的因素。是統(tǒng)計(jì)學(xué)存在的基礎(chǔ),從本質(zhì)上說,統(tǒng)計(jì)學(xué)就是研究變異的科學(xué)。78表1-1120名正常成年男子紅細(xì)胞計(jì)數(shù)值(1012/L)

84.314.094.414.334.584.245.454.324.844.994.794.905.094.645.145.464.635.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.824.444.134.434.025.865.125.363.864.685.485.314.534.834.113.263.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69最大值=6.18,最小值=3.29,極差=2.89算術(shù)均數(shù)=4.72，標(biāo)準(zhǔn)差=0.57

變量與資料(VariableandData)基本概念：變量及變量值，研究者對每個觀察單位的某項(xiàng)特征進(jìn)行觀察和測量，這種特征能表現(xiàn)觀察單位的變異性，稱為變量，變量的測得值叫變量值（也叫觀察值），變量值構(gòu)成資料。按變量值的性質(zhì)可將資料分為計(jì)量資料、計(jì)數(shù)資料、等級資料。資料類型:計(jì)量資料、計(jì)數(shù)資料、等級資料9資料計(jì)量資料連續(xù)型離散型分類型資料無序分類有序分類資料類型無序分類（unordercategoricalvariable)或名義變量(nominativevariable)。例如，職業(yè)（工、農(nóng)、商、學(xué)、兵等）是一個分類變量；其可能的“取值”不是數(shù)字，而是類別，二分類變量(binaryvariable)，稱為0-1變量例如，性別（男女）、疾?。ㄓ袩o）和結(jié)局（生死）等。二分類變量常用0和1來編碼，0-1變量常稱為假變量(dummyvariable)或啞變量，可以和真變量一樣參與計(jì)算。有序變量(ordinalvariable)或等級變量。分類變量的“取值”中自然地存在著次序。例如，問卷調(diào)查常問對某件事情的滿意程度：極不滿意、有點(diǎn)滿意、中度滿意、很滿意、極滿意。有些臨床體檢或?qū)嶒?yàn)室檢驗(yàn)常用–、±、+、++和+++來表示測量結(jié)果。離散型變量(discretevariable)：離散型變量只能取整數(shù)值。例如，一月中的手術(shù)病人數(shù)，一年里的新生兒數(shù)。連續(xù)型變量(continuousvariable)：連續(xù)型變量可以取實(shí)數(shù)軸上的任何數(shù)值?！斑B續(xù)”是指該變量可以在實(shí)數(shù)軸上連續(xù)變動，由測量而得到。例如，血壓、身高、體重等。11住院號年齡身高體重住院天數(shù)職業(yè)文化程度分娩方式妊娠結(jié)局20256552716571.55無中學(xué)順產(chǎn)足月20256532216074.05無小學(xué)助產(chǎn)足月20258302515868.06管理員大學(xué)順產(chǎn)足月20225432316169.05無中學(xué)剖宮產(chǎn)足月20224662515962.011商業(yè)中學(xué)剖宮產(chǎn)足月20245352715768.02無小學(xué)順產(chǎn)早產(chǎn)20258342015866.04無中學(xué)助產(chǎn)早產(chǎn)20194642415870.53無中學(xué)助產(chǎn)足月20257832915457.07干部中學(xué)剖宮產(chǎn)足月觀察單位observations個體Units；elements變量variablesQuantitativedata計(jì)量資料Categoricaldata分類資料計(jì)量資料（measurementdata)12定義：通過度量衡的方法，測量每一個觀察單位的某項(xiàng)研究指標(biāo)的量的大小，得到的一系列數(shù)據(jù)資料。例如：體重與身高特點(diǎn)：有度量衡單位，連續(xù)性資料(continuous)或離散型（discrete)

（通過測量得到）計(jì)數(shù)資料（enumerationdata)定義：將全體觀測單位按照某種性質(zhì)或特征分組，然后再分別清點(diǎn)各組觀察單位的個數(shù)。特點(diǎn)：沒有度量衡單位多為間斷性資料（通過枚舉或記數(shù)得來）13無序分類（unorderedcategories)二項(xiàng)分類男女多項(xiàng)分類

A型、B型、O型、AB型14等級資料（rankeddata)

又稱有序分類（ordinalcategories)、半定量(semi-quantitativedata)。特點(diǎn)：各分類之間有程度上的不同。例：療效（治愈、顯效、好轉(zhuǎn)、無效）尿蛋白（－、±、＋、＋＋）1516實(shí)例數(shù)據(jù)1編號性別年齡（歲）部位分化程度分期肝轉(zhuǎn)移PCNA指數(shù)生存時間(月)（1）（2）（3）（4）（5）（6）（7）（8）（9）1男61上低分化Ⅰ陽性52142女58中高分化Ⅱ陰性89203女63上高分化Ⅳ陰性93194女71下中分化Ⅱ陽性7855男59上高分化Ⅲ陰性8535………………………膽管癌患者部分指標(biāo)17實(shí)例數(shù)據(jù)2體重指數(shù)身高班制勞動強(qiáng)度緊張程度心率嗜肥肉史收縮壓舒張壓中風(fēng)家族史（1）（2）（3）（4）（5）（6）（7）（8）（9）（10）12.241.6211370114690有16.471.6331372011070無15.191.6412272010070無15.591.6311384111470無12.601.6431368111668無…………………………變量與資料

變量轉(zhuǎn)化：變量只能由高級向低級轉(zhuǎn)化：19資料類型間關(guān)系

例：一組2040歲成年人的血壓以12kPa為界分為正常與異常兩組，統(tǒng)計(jì)每組例數(shù)

<8低血壓

正常血壓

輕度高血壓

中度高血壓

重度高血壓定量資料二項(xiàng)分類資料有序分類總體與樣本(populationandsample)總體：根據(jù)研究目的確定的同質(zhì)觀察單位的全體。當(dāng)研究有具體而明確的指標(biāo)時，總體是指該項(xiàng)變量值的全體。觀察單位（個體）：最基本的研究單位分為有限總體和無限總體。由于調(diào)查總體的不可能性、巨大性和沒必要。對其中的一部分對象進(jìn)行調(diào)查----樣本：總體中有代表性的一部分。樣本（總體與樣本的關(guān)系。舉例。）樣本選擇的原則--？？樣本量（samplesize）2021參數(shù)與統(tǒng)計(jì)量

parameterandstatistic

參數(shù)：總體的統(tǒng)計(jì)指標(biāo)，如總體均數(shù)、標(biāo)準(zhǔn)差，采用希臘字母分別記為μ、σ。固定的常數(shù)

統(tǒng)計(jì)量：樣本的統(tǒng)計(jì)指標(biāo)，如樣本均數(shù)、標(biāo)準(zhǔn)差，采用拉丁字母分別記為。

參數(shù)附近波動的隨機(jī)變量。總體樣本抽取部分觀察單位

統(tǒng)計(jì)量

參數(shù)

推斷inference誤差（error)誤差：統(tǒng)計(jì)上所說的誤差泛指測量值與真值之差，樣本指標(biāo)與總體指標(biāo)之差。主要有以下二種：非隨機(jī)誤差和隨機(jī)誤差（隨機(jī)測量誤差,抽樣誤差）。（1）系統(tǒng)誤差：指數(shù)據(jù)搜集和測量過程中由于儀器不準(zhǔn)確、標(biāo)準(zhǔn)不規(guī)范等原因，造成觀察結(jié)果呈傾向性的偏大或偏小，這種誤差稱為系統(tǒng)誤差。(systemicerror)（2）非系統(tǒng)誤差（過失誤差）：失誤引起（3）隨機(jī)誤差：由于一些非人為的偶然因素使得結(jié)果或大或小，是不確定、不可預(yù)知的。(randomerror)

23隨機(jī)測量誤差(randommeasurementerror)

在消除了系統(tǒng)誤差的前提下，由于非人為的偶然因素，對于同一樣本多次測定結(jié)果不完全一樣，結(jié)果有時偏大有時偏小，沒有傾向性，這種誤差叫隨機(jī)測量誤差。特點(diǎn)：沒有傾向性，多次測量計(jì)算平均值可以減小甚至消除隨機(jī)測量誤差。24總體：5歲男童身高樣本Xi:一個樣本5歲男童樣本抽樣誤差抽樣誤差：

樣本與總體5歲男童身高不同抽樣誤差(randomsamplingerror)由于抽樣原因造成的樣本指標(biāo)與總體指標(biāo)之間的差別。26特點(diǎn)：有抽樣誤差就不可避免。統(tǒng)計(jì)上可以計(jì)算并在一定范圍內(nèi)控制抽樣誤差。（1）改進(jìn)抽樣方法，增加樣本的代表性。樣本量n相等的情況下：整群抽樣>單純隨機(jī)抽樣>系統(tǒng)抽樣>分層抽樣（2）增加樣本量n（3）選擇變異程度較小的研究指標(biāo)27減少抽樣誤差的方法:頻率拋一枚硬幣，是否國徽面一定向上？明天的股市升還是降？某患者痊愈的可能性？這些問題的答案都不可能絕對?？疾炷硞€可能的結(jié)果，若在n次觀察中，有m次觀察到這種可能的結(jié)果，則稱這種可能的結(jié)果發(fā)生的比例為頻率，m稱為頻數(shù)。顯然有。在醫(yī)學(xué)上所說的患病率、病死率等都是頻率。如治療了n個幽門螺旋桿菌感染(HP陽性)的患者，其中有m個人治愈(HP呈陰性)，則治愈率。頻率f是一個隨機(jī)抽樣觀察的結(jié)果，因此頻率f呈一定的隨機(jī)波動。如在某地區(qū)隨機(jī)抽樣調(diào)查糖尿病的患病率，其結(jié)果如下2829抽樣(調(diào)查)人數(shù)n1005001000500010000500001000001000000糖尿病人數(shù)m124810249399249991000399999頻率(患病率%)f12.09.6010.29.869.9210.0010.0010.00由上述表可以看到頻率f呈某種隨機(jī)性。但隨著抽樣人數(shù)n的增大，頻率(患病率)f隨機(jī)波動的幅度越來越小并且趨向常數(shù)10%?？梢宰C明：當(dāng)觀察次數(shù)n越來越大，頻率f的隨機(jī)波動幅度越來越小，并最終趨向于一個常數(shù)，這個常數(shù)被稱為隨機(jī)事件A發(fā)生的概率(又稱為統(tǒng)計(jì)學(xué)上的概率定義)。

結(jié)果概率(probability)

概念：描述隨機(jī)事件發(fā)生的可能性大小的數(shù)值，常用P來表示。大?。篜的大小在0和1之間，越接近于1，說明發(fā)生的可能性越大，越接近于0，說明發(fā)生的可能性越小。統(tǒng)計(jì)學(xué)中的許多結(jié)論是帶有概率性質(zhì)的，通常一個事件的發(fā)生小于5%，就叫小概率事件。頻率：在實(shí)際工作中，當(dāng)觀察單位的例數(shù)足夠多時，可以用頻率來代替概率。頻率是概率的估計(jì)值。3031統(tǒng)計(jì)學(xué)發(fā)展及有關(guān)問題

20世紀(jì)20年代，英國統(tǒng)計(jì)學(xué)家R.A.Fisher爵士（1890-1962）創(chuàng)立了實(shí)驗(yàn)設(shè)計(jì)方法和統(tǒng)計(jì)分析技術(shù)，奠定現(xiàn)代生物統(tǒng)計(jì)的基礎(chǔ)。1948年，英國發(fā)表了評價鏈霉素治療肺結(jié)核療效的隨機(jī)對照的臨床試驗(yàn)報告，第一次采用生物統(tǒng)計(jì)方法進(jìn)行臨床干預(yù)試驗(yàn)。1948年，郭祖超教授（1912~1999）編著的《醫(yī)學(xué)與生物統(tǒng)計(jì)方法》，是我國第一部醫(yī)學(xué)統(tǒng)計(jì)方法的教科書。實(shí)例

遺傳學(xué)家F.Galton爵士（1822-1911）對上千家庭父親身高和兒子身高的觀察發(fā)現(xiàn)遺傳的“回歸”現(xiàn)象1960年英國醫(yī)生Doll，Hill等發(fā)現(xiàn)吸煙與肺癌有關(guān)醫(yī)學(xué)論文中的統(tǒng)計(jì)學(xué)問題60年代到80年代，國外醫(yī)學(xué)雜志調(diào)查結(jié)果：有統(tǒng)計(jì)錯誤的論文20%~72%。1996年對4586篇論文統(tǒng)計(jì)（中華醫(yī)學(xué)會系列雜志占6.9%），數(shù)據(jù)分析方法誤用達(dá)55.7%。偽造統(tǒng)計(jì)數(shù)據(jù)違反科學(xué)道德1976年NewScience雜志關(guān)于科研舞弊行為的調(diào)查（1）74%的調(diào)查表反映有不正當(dāng)修改數(shù)據(jù)的情況（2）17%拼湊實(shí)驗(yàn)結(jié)果（3）7%憑空捏造數(shù)據(jù)（4）2%故意曲解結(jié)果FancystatisticalmethodscannotrescuegarbagedataFancystatisticalmethodscanhelpyougaininsightintoyourdata,overandabovewhatseemsobviousonitsfaceYoushouldalwaysworryaboutwhetherthesampledresultsarerepresentativeofthepopulation,andwhetheryoursampleallowsyoutomakeinferencesaboutthepopulation.AWarning!如何學(xué)習(xí)統(tǒng)計(jì)學(xué)（特點(diǎn)：靈活、抽象）理解基本的統(tǒng)計(jì)原理培養(yǎng)統(tǒng)計(jì)思維能力:抽象的,邏輯推理多練習(xí):課堂練習(xí),課下做習(xí)題（要求：上課帶計(jì)算器）聯(lián)系實(shí)際:閱讀文獻(xiàn)工作和生活實(shí)際36思考題371.統(tǒng)計(jì)工作的基本步驟是什么?2.統(tǒng)計(jì)資料分為幾類?特點(diǎn)?3.什么是總體?什么是樣本?4.什么是抽樣誤差?如何減小?能否避免?5.什么是概率?概率與頻率的區(qū)別某年級甲班、乙班各有男生50人。從兩個班各抽取10人測量身高，如果甲班的平均身高大于乙班，能否推論甲班所有同學(xué)的平均身高也大于乙班？為什么？用A，B兩種藥物分別治療一批患者。如果A藥的治愈率高于B藥，證明A藥的療效優(yōu)于B藥。這種說法對嗎？為什么？思考題39為了了解某地20~29歲健康女性血紅蛋白的正常值范圍，現(xiàn)隨機(jī)調(diào)查了該地2000名20~29歲

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

統(tǒng)計(jì)1第一講緒論

文檔簡介

溫馨提示

最新文檔

評論

統(tǒng)計(jì)1第一講緒論

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔