統(tǒng)計學基礎知識_第1頁
統(tǒng)計學基礎知識_第2頁
統(tǒng)計學基礎知識_第3頁
統(tǒng)計學基礎知識_第4頁
統(tǒng)計學基礎知識_第5頁
已閱讀5頁,還剩80頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、整理ppt統(tǒng)計學基礎知識統(tǒng)計學基礎知識整理ppt一一. .醫(yī)學統(tǒng)計學的意義醫(yī)學統(tǒng)計學的意義1.1.統(tǒng)計學(統(tǒng)計學(statisticsstatistics): :應用數(shù)學的原理與方應用數(shù)學的原理與方法,研究數(shù)據(jù)的搜集、整理與分析的科學,對法,研究數(shù)據(jù)的搜集、整理與分析的科學,對不確定性數(shù)據(jù)作出科學的推斷。不確定性數(shù)據(jù)作出科學的推斷。2.2.醫(yī)學統(tǒng)計學(醫(yī)學統(tǒng)計學(statistics of medicinestatistics of medicine): :應應用統(tǒng)計學的原理與方法進行醫(yī)學科研與實踐。用統(tǒng)計學的原理與方法進行醫(yī)學科研與實踐。3.3.統(tǒng)計學方法的特點統(tǒng)計學方法的特點: : (1)

2、 (1)用數(shù)量反映質量用數(shù)量反映質量 1)1)體格檢查體格檢查( (量血壓、脈搏量血壓、脈搏)個體健康質量個體健康質量 2)2)考試分數(shù)考試分數(shù)個體學習質量個體學習質量 3)3)期望壽命期望壽命反映人群健康狀況反映人群健康狀況 4)4)嬰兒死亡率嬰兒死亡率反映衛(wèi)生服務質量反映衛(wèi)生服務質量 整理ppt(2)(2)用群體歸納個體用群體歸納個體n20112011年長沙市年長沙市7 7歲男孩有多高歲男孩有多高?n7 7歲男孩身高有高有矮,平均身高歲男孩身高有高有矮,平均身高=119.5cm=119.5cmn95%95%的長沙市的長沙市7 7歲男孩的身高在歲男孩的身高在110.20cm110.20cm1

3、29.20cm129.20cm之間之間整理ppt二、基本概念二、基本概念)、)、變變量值量值(value of variablevalue of variable) (1 1)研究單位()研究單位(unitunit):研究中的個體):研究中的個體。如:研究如:研究20112011年長沙市年長沙市7 7歲男孩歲男孩身高身高的正常值范圍的正常值范圍 1 1個人個人 測得的身高值(測得的身高值(120.2cm,118.6cm,121.8cm,)120.2cm,118.6cm,121.8cm,)整理ppt2 2、同質同質(homogeneityhomogeneity)和變異()和變異(variatio

4、nvariation)n研究長沙市研究長沙市20112011年年7 7歲男孩身高的正常值范圍?歲男孩身高的正常值范圍?n同質同質:同長沙市、:同長沙市、7 7歲、男孩、無影響身高的疾病。歲、男孩、無影響身高的疾病。n變異:變異:長沙市長沙市20112011年年7 7歲男孩歲男孩身高有高有矮身高有高有矮整理ppt3 3、總體總體(populationpopulation)和樣本()和樣本(samplesample)(1 1)總體:是根據(jù)研究目的確定的同質研究單位的全體。)總體:是根據(jù)研究目的確定的同質研究單位的全體。更確切地說是同質研究單位某種變量值的集合。更確切地說是同質研究單位某種變量值的集

5、合。n例如:調查例如:調查某地某地20112011年正常成年男子年正常成年男子的的紅細胞數(shù)紅細胞數(shù)的正的正常值范圍。常值范圍。 總體:總體:1 1)某地所有的正常成年男子)某地所有的正常成年男子 2 2)某地所有的正常成年男子的紅細胞數(shù))某地所有的正常成年男子的紅細胞數(shù)整理ppt1 1)有限總體()有限總體(finite populationfinite population):研究單位數(shù)是):研究單位數(shù)是有限的。有限的。例如:調查某地例如:調查某地20112011年正常成年男子的紅細胞數(shù)的正年正常成年男子的紅細胞數(shù)的正常值范圍。常值范圍。2 2)無限總體()無限總體(infinite pop

6、ulationinfinite population):研究單位數(shù)):研究單位數(shù)是無限的。是無限的。例如:高血壓患者例如:高血壓患者無時間、空間限制。無時間、空間限制。整理ppt(2 2)樣本()樣本(samplesample):是總體中抽取的有代表性的一部分。):是總體中抽取的有代表性的一部分。 注意:隨機抽樣(無主觀性)注意:隨機抽樣(無主觀性) 樣本含量(樣本含量(sample sizesample size):樣本中包含的研究單位數(shù)。):樣本中包含的研究單位數(shù)。 例如:某藥治療高血壓患者例如:某藥治療高血壓患者3030名名 樣本含量(樣本含量(n n)為)為3030整理ppt4 4、參

7、數(shù)(、參數(shù)(parameterparameter)和統(tǒng)計量()和統(tǒng)計量(statisticstatistic)(1 1)參數(shù):根據(jù)總體個體值統(tǒng)計計算出來的描述總體的)參數(shù):根據(jù)總體個體值統(tǒng)計計算出來的描述總體的特征量。特征量。n一般用希臘字母表示一般用希臘字母表示(2 2)統(tǒng)計量:根據(jù)樣本個體值統(tǒng)計計算出來的描述樣本)統(tǒng)計量:根據(jù)樣本個體值統(tǒng)計計算出來的描述樣本的特征量。的特征量。n一般用拉丁字母表示一般用拉丁字母表示整理pptn總體參數(shù)一般是不知道的總體參數(shù)一般是不知道的n統(tǒng)計學抽樣研究的目的就是:統(tǒng)計學抽樣研究的目的就是:n 樣本統(tǒng)計量樣本統(tǒng)計量總體參數(shù)總體參數(shù)5 5、抽樣誤差、抽樣誤差n

8、由于抽樣原因所造成的由于抽樣原因所造成的樣本統(tǒng)計量樣本統(tǒng)計量與與總體參數(shù)總體參數(shù)之間的之間的差別。差別。 特點:特點:1 1)抽樣誤差是不可避免;)抽樣誤差是不可避免; 2 2)有統(tǒng)計規(guī)律性。)有統(tǒng)計規(guī)律性。n 產(chǎn)生原因產(chǎn)生原因: :個體差異個體差異( (生物變異生物變異) )整理ppt6 6、頻率(、頻率(frequencyfrequency)、概率()、概率(probabilityprobability)、小概率)、小概率事件事件(1 1)頻率頻率: : 一次隨機試驗出現(xiàn)各種可能結果的比例。一次隨機試驗出現(xiàn)各種可能結果的比例。n例如,投擲一枚硬幣,結果不外乎出現(xiàn)例如,投擲一枚硬幣,結果不外

9、乎出現(xiàn)“正面正面”與與“反面反面”兩種,在重復多次后,出現(xiàn)兩種,在重復多次后,出現(xiàn)“正面正面” 或或“反反面面”這個結果的比例稱之為頻率。這個結果的比例稱之為頻率。整理pptn(2)(2)概率(概率(probabilityprobability) 概率是度量隨機事件發(fā)生可概率是度量隨機事件發(fā)生可能性大小的一個數(shù)值。能性大小的一個數(shù)值。 n頻率是就樣本而言的,而概率從總體的意義上說的。頻率是就樣本而言的,而概率從總體的意義上說的。 整理ppt 0 P(A) 1 隨機事件隨機事件 P(A)=1 必然事件必然事件 P(A)=0 不可能事件。不可能事件。整理ppt(3 3)小概率事件)小概率事件: :

10、統(tǒng)計分析中的很多結論都基于統(tǒng)計分析中的很多結論都基于一定置信程度下的概率推斷,習慣上將一定置信程度下的概率推斷,習慣上將 稱為小概率事件。稱為小概率事件。( )0.05 ( )0.01P AP A或整理ppt湖南風采:湖南風采:n中獎概率大約為:中獎概率大約為: 1/6711/671萬萬交通事故:交通事故:n發(fā)生概率為:發(fā)生概率為:1/201/20萬萬整理ppt三、統(tǒng)計資料的類型變量與統(tǒng)計資料的分類方法變量與統(tǒng)計資料的分類方法n概述概述 數(shù)值變量數(shù)值變量.構成計量資料構成計量資料 分類變量分類變量 無序分類變量無序分類變量構成計數(shù)資料構成計數(shù)資料 有序分類變量有序分類變量構成等級資料構成等級資

11、料. . 數(shù)值變量與計量資料數(shù)值變量與計量資料1) 1) 數(shù)值變量數(shù)值變量(numerical variable) (numerical variable) :變量值是定量的,:變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。如表現(xiàn)為數(shù)值大小,一般有度量衡單位。如: :身高身高(cm)(cm)、體重體重(kg)(kg)。 2) 2) 計量資料計量資料(measurement data) (measurement data) :由一群個體的數(shù)值變:由一群個體的數(shù)值變量值構成的資料,即一群變量值。量值構成的資料,即一群變量值。 如:長沙市如:長沙市20112011年年7 7歲男孩身高值歲男孩身高

12、值( (118.6cm,121.8cm) 118.6cm,121.8cm) 3.3.無序分類變量與計數(shù)資料無序分類變量與計數(shù)資料1)1)無序分類變量無序分類變量(unordered categories variable)(unordered categories variable):變量值:變量值是定性的,有類別。是定性的,有類別。 特點:類別是客觀存在的,各類無秩序,可任意排列;特點:類別是客觀存在的,各類無秩序,可任意排列;類與類之間界限清楚,(理論上類與類之間界限清楚,(理論上) )不會錯判。不會錯判。 如:性別:男、女。如:性別:男、女。 血型:血型:O O、A A、B B、ABAB

13、。2)2)計數(shù)資料計數(shù)資料( (enumeration data)enumeration data):一群個體按無序分類變量:一群個體按無序分類變量的類別清點每類有多少個個體,即分類個體數(shù)。的類別清點每類有多少個個體,即分類個體數(shù)。 如:某人群性別構成:男:,如:某人群性別構成:男:, 女:女:7 7。 某人群血型構成:某人群血型構成:O O:2020, A A:3535, B B:3030, AB AB:15154.4.有序分類變量與等級資料有序分類變量與等級資料1)1)有序分類變量有序分類變量(ordinal categories variable) (ordinal categories

14、 variable) :變量值:變量值是定性的、是定性的、 分等級。分等級。 特點:等級是主觀劃分的,各級有秩序,從低到高或特點:等級是主觀劃分的,各級有秩序,從低到高或由高到低;級和級之間界限模糊,可能錯判。由高到低;級和級之間界限模糊,可能錯判。 如:療效:無效、好轉、顯效、治愈。如:療效:無效、好轉、顯效、治愈。 血清反應:血清反應:、+ +、+2)2)等級資料等級資料(ranked data)(ranked data):一群個體按有序分類變量的級別:一群個體按有序分類變量的級別清點每級有多少個個體清點每級有多少個個體, ,即分級個體數(shù)。即分級個體數(shù)。 如:某地某人群如:某地某人群EBE

15、B病毒抗體反應:病毒抗體反應: :6565, + +:5 5, +:6 6整理ppt整理ppt1.1.專業(yè)設計:選題、建立假說、確定研究專業(yè)設計:選題、建立假說、確定研究對象和技術方法等對象和技術方法等2.2.統(tǒng)計設計:圍繞專業(yè)設計確定統(tǒng)計設類統(tǒng)計設計:圍繞專業(yè)設計確定統(tǒng)計設類型、樣本大小、分組方法、統(tǒng)計分析指標型、樣本大小、分組方法、統(tǒng)計分析指標及統(tǒng)計分析方法。及統(tǒng)計分析方法。四、醫(yī)學統(tǒng)計工作的基本步驟設計n統(tǒng)計設計統(tǒng)計設計的內容包括資料的搜集、整理和分析全過和的內容包括資料的搜集、整理和分析全過和的設想和安排。的設想和安排。n例如:研究目的和假說?例如:研究目的和假說?n 研究對象和研究單

16、位?研究對象和研究單位?n 研究因素(變量)?研究因素(變量)?n 搜集哪些原始資料?搜集哪些原始資料? 用什么方式和方法取得這些原始資料?用什么方式和方法取得這些原始資料? 怎樣整理匯總和計算統(tǒng)計指標?怎樣整理匯總和計算統(tǒng)計指標? 如何控制誤差?如何控制誤差? 預期會得到什么結果?預期會得到什么結果? 需要多少經(jīng)費?需要多少經(jīng)費?統(tǒng)整理ppt(一)資料來源(一)資料來源第一手資料第一手資料 經(jīng)常性:統(tǒng)計報表(死亡登記、疫情報經(jīng)常性:統(tǒng)計報表(死亡登記、疫情報告等),工作記錄(病歷、化驗);告等),工作記錄(病歷、化驗); 一時性:專題調查、實驗或臨床試驗。一時性:專題調查、實驗或臨床試驗。第

17、二手資料:已公布的資料,如數(shù)據(jù)銀行、第二手資料:已公布的資料,如數(shù)據(jù)銀行、全國、全省衛(wèi)生統(tǒng)計資料。全國、全省衛(wèi)生統(tǒng)計資料。 收集資料整理ppt分析資料分析資料 1.1.統(tǒng)計描述:用統(tǒng)計指標、統(tǒng)計圖表對資料統(tǒng)計描述:用統(tǒng)計指標、統(tǒng)計圖表對資料的數(shù)量特征及分布規(guī)律進行測定和描述。的數(shù)量特征及分布規(guī)律進行測定和描述。 2.2.統(tǒng)計推斷:用樣本信息推斷總體特征:統(tǒng)計推斷:用樣本信息推斷總體特征: 參數(shù)估計參數(shù)估計 假設檢驗。假設檢驗。 工具:工具:1 1)foxbasefoxbase數(shù)據(jù)庫數(shù)據(jù)庫 2 2)spssspss 3 3)SASSAS整理ppt五、數(shù)值變量資料的統(tǒng)計描述n頻數(shù)分布表頻數(shù)分布表(

18、frequency tablefrequency table) :n例例 從某單位從某單位19991999年的職工體檢資料中獲得年的職工體檢資料中獲得101101名正常成年女子的血清總膽固醇的測量結果如名正常成年女子的血清總膽固醇的測量結果如下,試編制頻數(shù)分布表。下,試編制頻數(shù)分布表。 2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.91 3.91 4.59 4.19 2.68 4.52 4.91 3.18 3

19、.68 4.83 3.87 3.95 3.91 4.15 4.55 4.80 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84 3.60 3.51 4.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.96 4.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.71 3.30 4.73 4.17 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.28 4.06 5.26 5.25 3.98 5.03 3.51 3.86 3

20、.02 3.70 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26 組段頻數(shù)f(1)(2)2.3012.6032.9063.2083.50173.80204.10174.40124.7095.0055.3025.605.901合計101頻數(shù)表整理ppt頻數(shù)分布圖整理pptn統(tǒng)計圖統(tǒng)計圖:指利用點的位置、線段的升降、直條:指利用點的位置、線段的升降、直條的長短和面積的大小等各種幾何圖形來表達統(tǒng)的長短和面積的大小等各種幾何圖形來表達統(tǒng)計資料。計資料。n統(tǒng)計圖統(tǒng)計圖只能提供概略只能提供概略的情況,而不能獲得確切的情況,而不能獲得確切數(shù)值,因此不能完全代替統(tǒng)計表,常需要同

21、時數(shù)值,因此不能完全代替統(tǒng)計表,常需要同時列出統(tǒng)計表作為統(tǒng)計圖的數(shù)值依據(jù)。列出統(tǒng)計表作為統(tǒng)計圖的數(shù)值依據(jù)。 統(tǒng)計圖統(tǒng)計圖統(tǒng)計圖的結構n標題標題:用于簡明扼要地說明資料的內容,一般位于圖的:用于簡明扼要地說明資料的內容,一般位于圖的下方中央位置。下方中央位置。n圖域圖域:即制圖空間,是整個統(tǒng)計圖的視覺中心。除圓圖:即制圖空間,是整個統(tǒng)計圖的視覺中心。除圓圖外,一般都是存在于特定的坐標體系下。外,一般都是存在于特定的坐標體系下。n標目標目:分為縱標目和橫標目,表示坐標系下縱軸與橫軸:分為縱標目和橫標目,表示坐標系下縱軸與橫軸的含義。的含義。n圖例圖例:用于識別比較的統(tǒng)計圖中各種圖形所代表的含義。:

22、用于識別比較的統(tǒng)計圖中各種圖形所代表的含義。n刻度刻度:即縱軸和橫軸上的坐標??潭葦?shù)值按從小到大的:即縱軸和橫軸上的坐標。刻度數(shù)值按從小到大的順序,縱軸由下向上,橫軸由左向右排列。順序,縱軸由下向上,橫軸由左向右排列。常用的統(tǒng)計圖n直條圖直條圖n百分條圖百分條圖n圓圖圓圖n線圖線圖n半對數(shù)線圖半對數(shù)線圖n直方圖直方圖n散點圖散點圖直條圖/條圖丁地區(qū)丙地區(qū)乙地區(qū)甲地區(qū)發(fā)病率(1 / 1 0萬)26242220181614121086420522圖12-1 某省1979年四個地區(qū)脊髓灰質炎發(fā)病率圖12-2 某地1952年與1972年三種疾病死亡率比較5.4%23.1%44.3%27.1%無效有效顯

23、效臨床治愈圖12-4 復方豬膽囊治療單純型老年性氣管炎療效整理ppt0%20%40%60%80%100%70年代80年代肺癌鼻咽癌肝癌胃癌腸癌其它 圖12-5 20世紀70年代和80年代某地7常見惡性腫瘤發(fā)病構成比較 1974197319721971197019691968結核病死亡率(1 / 1 0萬)605040302010性別男性女性圖12-6 某地1968-1974年結核病死亡率比較整理ppt1958195719561955195419531952195119501949死亡率(1 / 1 0萬)1086420白喉傷寒、副傷寒195819571956195519541953195219

24、5119501949對數(shù)化后死亡率(1 / 1 0萬)1.51.0.50.0-.5-1.0-1.5白喉傷寒、副傷寒圖12-7 某地1949-1958年白喉、傷寒、副傷寒死亡率比較(普通線圖)圖12-8 某地1949-1958年白喉、傷寒、副傷寒死亡率比較(半對數(shù)線圖) 請注意:在普通線圖中,白喉死亡率線條的坡度比傷寒、副傷寒死亡率請注意:在普通線圖中,白喉死亡率線條的坡度比傷寒、副傷寒死亡率線條下降的陡峭,只能說明兩種疾病的死亡率線條下降的陡峭,只能說明兩種疾病的死亡率逐年變化幅度不同逐年變化幅度不同,不能錯認,不能錯認為為白喉死亡率的下降速度比傷寒、副傷寒死亡率的下降速度快白喉死亡率的下降速

25、度比傷寒、副傷寒死亡率的下降速度快。在半對數(shù)線。在半對數(shù)線圖中就不會出現(xiàn)這種錯覺。圖中就不會出現(xiàn)這種錯覺。頻數(shù)紅細胞數(shù)(1012/L)圖圖12-9 140名正常男子紅細胞計數(shù)的直方圖名正常男子紅細胞計數(shù)的直方圖圖圖12-10 1997年某地乙型病毒性腦膜炎病例的年齡分布年某地乙型病毒性腦膜炎病例的年齡分布 1 2 3 4 5 6 7 8 9 10 15 2 0 25 30 35年齡(歲)年齡(歲)散點圖(scatter chart)n散點圖散點圖:使用點的密集程度和趨勢來表示兩種指標或:使用點的密集程度和趨勢來表示兩種指標或變量間的相關關系。變量間的相關關系。圖圖10-12 12名女大學生身高

26、與體重散點圖名女大學生身高與體重散點圖( (一一) )平均指標平均指標1.1.算術均數(shù)(算術均數(shù)(meanmean):):可用于反映一組呈對稱分布的變量值在數(shù)量可用于反映一組呈對稱分布的變量值在數(shù)量上的平均水平或者說是集中位置的特征。上的平均水平或者說是集中位置的特征。適用范圍:對稱分布,尤其正態(tài)分布適用范圍:對稱分布,尤其正態(tài)分布計量資料的描述指標計量資料的描述指標整理ppt計算方法12nXXXXXnn整理pptn例 :從某單位1999年的職工體檢資料中獲得101名正常成年女子的血清總膽固醇( )的測量結果如下:mmol/L2.35 4.21 3.32 5.35 4.17 4.13 2.78

27、 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.91 3.91 4.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.91 4.15 4.55 4.80 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84 3.60 3.51 4.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.96 4.50 3.27 4.52 3.19 4.59 3.75 3.98

28、 4.13 4.26 3.63 3.87 5.71 3.30 4.73 4.17 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.28 4.06 5.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26 2.354.783.914.03(mmol/L)101X整理ppt2.2.中位數(shù)中位數(shù)n中位數(shù)(中位數(shù)(medianmedian):是將變量值從小到大按順):是將變量值從小到大按順序排列,位置序排列,位置( (位次位次) )居于中間的那個居于中間的那個變量值

29、變量值。n1 1,3 3,7 7,5 5,100100n中位數(shù)為多少中位數(shù)為多少? ?整理pptn n為奇數(shù)時 nn為偶數(shù)時 1()2nMX( )(1)2212nnMXX例例 7 7名病人患某病的潛伏期分別為名病人患某病的潛伏期分別為2,3,4,5,6,9,162,3,4,5,6,9,16天,求其天,求其中位數(shù)中位數(shù)。n本例本例n=7,為奇數(shù)為奇數(shù) n例例 8 8 名 患 者 食 物 中 毒 的 潛 伏 期 分 別 為名 患 者 食 物 中 毒 的 潛 伏 期 分 別 為1,2,2,3,5,8,15,241,2,2,3,5,8,15,24小時,求其中位數(shù)。小時,求其中位數(shù)。n本例本例n=8,n

30、=8,為偶數(shù)為偶數(shù) 7 14()25()MXX天8845( )(1)22111354()222MXXXX小時整理ppt應用n 適用于適用于:1:1、各種分布各種分布類型的資料類型的資料 2 2、特別是、特別是偏態(tài)分布偏態(tài)分布資料和資料和開口資料開口資料(一端或兩端無確切數(shù)值的資料)。(一端或兩端無確切數(shù)值的資料)。 整理ppt3、幾何均數(shù)n幾何均數(shù)(幾何均數(shù)(geometric meangeometric mean):可用于反映一):可用于反映一組經(jīng)對數(shù)轉換后呈對稱分布的變量值在數(shù)量上組經(jīng)對數(shù)轉換后呈對稱分布的變量值在數(shù)量上的平均水平。的平均水平。n計算方法計算方法12nnGX XX例例 某地

31、某地5 5例微絲蚴血癥患者治療七年后用間接例微絲蚴血癥患者治療七年后用間接熒光抗體試驗測得其抗體滴度倒數(shù)分別為,熒光抗體試驗測得其抗體滴度倒數(shù)分別為,1010,2020,4040,40,16040,160,求幾何均數(shù)。,求幾何均數(shù)。510 20 40 40 16034.8G 適用于成等比級數(shù)的資料,特別是對數(shù)正態(tài)分布資料。適用于成等比級數(shù)的資料,特別是對數(shù)正態(tài)分布資料。整理ppt(二)變異指標例 三組同齡男孩的身高值(cm) 甲組:90 95 100 105 110 100cmX 甲 乙組:96 98 100 102 104 100cmX 乙 丙組:96 99 100 101 104 100c

32、mX 丙 1. 極差n極差極差( (R R) ):即一組變量值最大值與最小值之差。:即一組變量值最大值與最小值之差。 1 1 09 02 0 c mR甲104968cmR 乙104968cmR丙2.2.方差方差(variancevariance)也稱均方差,即將離均差平方和用樣也稱均方差,即將離均差平方和用樣本含量本含量n n 取平均,可反映一組數(shù)據(jù)的平均離散水平。總體取平均,可反映一組數(shù)據(jù)的平均離散水平。總體方差方差- - ,樣本方差,樣本方差- 。22()1XXSn22S整理ppt樣本標準差用樣本標準差用s s 表示表示 n公式:2()1XXSn3.標準差22()1XXnSn整理ppt計算

33、三組資料的標準差n甲組: 5,9095 100105 110500nX222222909510010511050250X 2(500)5025057.91(cm)5 1S同理得:乙組:3.16(cm)S ,丙組:2.92(cm)S 。 整理ppt4、百分位數(shù)n百分位數(shù)(百分位數(shù)(percentilepercentile)是一種位置指標。)是一種位置指標。n一個百分位數(shù)一個百分位數(shù) 將全部變量值分為兩部分,將全部變量值分為兩部分,在不包含的全部變量值中有在不包含的全部變量值中有 的變量值比的變量值比它小,它小, 變量值比它大。變量值比它大。 XP%X(100)%X整理pptn變異系數(shù)(coeff

34、icient of variation,CV),多用于觀察指標單位不同時,如身高與體重的變異程度的比較;或均數(shù)相差較大時,如兒童身高與成人身高變異程度的比較。5. 變異系數(shù)CVSX100%例例: :某地某地7 7歲男孩身高的均數(shù)為歲男孩身高的均數(shù)為123.10cm123.10cm,標準差為,標準差為4.71cm4.71cm;體重均數(shù)為;體重均數(shù)為22.59kg22.59kg,標準差為,標準差為2.26kg, 2.26kg, 比較其變異度?比較其變異度?體重 2.26100% 10.14%22.29CV 身 高 4.71100% 3.83%123.10CV 整理ppt第五章第五章 計數(shù)資料的統(tǒng)計

35、描述計數(shù)資料的統(tǒng)計描述常用的相對數(shù):常用的相對數(shù):一、率。一、率。二、構成比二、構成比三、相對比三、相對比整理ppt第一節(jié) 常用相對數(shù)一、率一、率率率:說明某現(xiàn)象發(fā)生的頻率或強度。:說明某現(xiàn)象發(fā)生的頻率或強度。 常以常以百分率百分率(% %)、)、千分率千分率()、)、萬分率萬分率(1/1/萬)、萬)、十萬分率十萬分率(1/101/10萬)等表示,計算公式為:萬)等表示,計算公式為: 某時期內發(fā)生某現(xiàn)象的觀察單位數(shù)率比例基數(shù) 同期可能發(fā)生某現(xiàn)象的觀察單位總數(shù)整理pptn例例5-1 5-1 某醫(yī)院某醫(yī)院19981998年在某城區(qū)隨機調查了年在某城區(qū)隨機調查了85898589例例6060歲及以上老

36、人,體檢發(fā)現(xiàn)高血壓歲及以上老人,體檢發(fā)現(xiàn)高血壓患者為患者為28232823例。例。n高血壓患病率為:高血壓患病率為:n28232823 / / 85898589 100% = 32.87% 100% = 32.87% 。 整理ppt、構成比、構成比n構成比:表示事物內部某一部分的個體數(shù)與該構成比:表示事物內部某一部分的個體數(shù)與該事物各部分個體數(shù)的總和之比,用來說明各構事物各部分個體數(shù)的總和之比,用來說明各構成部分在總體中所占的比重或分布。成部分在總體中所占的比重或分布。n通常以通常以100%100%為比例基數(shù)。其計算公式為為比例基數(shù)。其計算公式為100%(5-2)某一組成部分的觀察單位數(shù)構成比

37、 同一事物各組成部分的觀察單位總數(shù)例-某正常人的白細胞分類計數(shù)整理ppt三、相對比三、相對比n相對比簡稱比(相對比簡稱比(ratioratio),是兩個有關指標之),是兩個有關指標之比,說明兩指標間的比例關系。比,說明兩指標間的比例關系。n兩個指標兩個指標可以是可以是性質相同性質相同,如不同時期發(fā)病,如不同時期發(fā)病數(shù)之比;也可以數(shù)之比;也可以性質不同性質不同,如醫(yī)院的門診人,如醫(yī)院的門診人次與病床數(shù)之比。通常以倍數(shù)或百分數(shù)(次與病床數(shù)之比。通常以倍數(shù)或百分數(shù)(% %)表示。表示。整理pptn例例5-3 5-3 某年某醫(yī)院出生嬰兒中,男性嬰兒為某年某醫(yī)院出生嬰兒中,男性嬰兒為370370人,人,

38、女 性 嬰 兒 為女 性 嬰 兒 為 3 5 83 5 8 人 , 則 出 生 嬰 兒 性 別 比 例 為人 , 則 出 生 嬰 兒 性 別 比 例 為370370/ /358358100 = 100 = 103103,說明該醫(yī)院該年每出生,說明該醫(yī)院該年每出生100100名女名女嬰兒,就有嬰兒,就有103103名男性嬰兒出生,它反映了男性嬰兒與名男性嬰兒出生,它反映了男性嬰兒與女性嬰兒出生的對比水平。女性嬰兒出生的對比水平。整理ppt第二節(jié) 應用相對數(shù)的注意事項1 1、計算相對數(shù)應有足夠數(shù)量即、計算相對數(shù)應有足夠數(shù)量即分母不宜太小分母不宜太小。 n如果例數(shù)較少會使相對數(shù)波動較大。如某種療法治

39、療如果例數(shù)較少會使相對數(shù)波動較大。如某種療法治療5 5例病人例病人5 5例全部治愈,則計算治愈率為例全部治愈,則計算治愈率為5 55 5100% 100% =100%=100%,若,若4 4例治愈,則治愈率為例治愈,則治愈率為4 45 5100% =80%100% =80%,由,由100%100%至至80%80%波動幅度較大,但實際上只有波動幅度較大,但實際上只有1 1例的變化。例的變化。在臨床試驗或流行病調查中,各種偶然因素都可能導在臨床試驗或流行病調查中,各種偶然因素都可能導致計算結果的較大變化,因此致計算結果的較大變化,因此例數(shù)很少例數(shù)很少的情況下的情況下最好最好用絕對數(shù)用絕對數(shù)直接表示

40、。直接表示。 整理ppt2 2、不能以構成比代替率不能以構成比代替率n構成比是用以說明事物內部某種構成所占比重構成比是用以說明事物內部某種構成所占比重或分布,并不說明某現(xiàn)象發(fā)生的頻率或強度,或分布,并不說明某現(xiàn)象發(fā)生的頻率或強度,在實際工作中經(jīng)常會出現(xiàn)將構成比指標按率的在實際工作中經(jīng)常會出現(xiàn)將構成比指標按率的概念去解釋的錯誤例如表概念去解釋的錯誤例如表5-25-2研究已婚育齡婦研究已婚育齡婦女在不同情況下放置避孕環(huán)與失敗率的關系。女在不同情況下放置避孕環(huán)與失敗率的關系。整理ppt表5-2 已婚育齡婦女不同情況下放環(huán)失敗率的比較 放環(huán)情況 (1) 放環(huán)人數(shù) (2) 失敗人數(shù) (3) 失敗人數(shù)比

41、(%) (4) 失敗率(%) (5) 人工流產(chǎn)后 255 78 61.9 30.6 月經(jīng)后 87 39 31.0 44.8 哺乳期 17 9 7.1 52.9 合 計 359 126 100.0 35.1 整理ppt3.3.正確計算合計率正確計算合計率n對分組資料計算合計率或稱平均率時,不能簡單地由對分組資料計算合計率或稱平均率時,不能簡單地由各組率相加或平均而得,而應用合計的有關實際數(shù)字各組率相加或平均而得,而應用合計的有關實際數(shù)字進行計算。例如用某療法治療肝炎,進行計算。例如用某療法治療肝炎,甲醫(yī)院甲醫(yī)院治療治療150150人,人,治愈治愈3030人,治愈率為人,治愈率為20%20%;乙醫(yī)

42、院乙醫(yī)院治療治療100100人,治愈人,治愈3030人,治愈率為人,治愈率為30%30%。兩個醫(yī)院合計治愈率應該是。兩個醫(yī)院合計治愈率應該是(3030+ +3030)/()/(150150+ +100100)100%=24%100%=24%。若算為。若算為20%+30%=50%20%+30%=50%或或(20% +30%)/2=25%(20% +30%)/2=25%,則是錯的。,則是錯的。整理ppt4.4.注意資料的可比性注意資料的可比性 n在比較相對數(shù)時,除了要對比的因素在比較相對數(shù)時,除了要對比的因素( (如不同如不同的藥物的藥物) ),其余的影響因素應盡可能相同或相,其余的影響因素應盡可

43、能相同或相近。在臨床研究和動物實驗時,應遵循隨機抽近。在臨床研究和動物實驗時,應遵循隨機抽樣原則進行分組。樣原則進行分組。 整理ppt5.5.對比不同時期資料應注意客觀條件是否相同對比不同時期資料應注意客觀條件是否相同 n例如例如, , 疾病報告制度完善和資料完整的地區(qū)或年份,疾病報告制度完善和資料完整的地區(qū)或年份,發(fā)病率可以發(fā)病率可以“升高升高”;居民因醫(yī)療普及,就診機會增;居民因醫(yī)療普及,就診機會增加,或診斷技術提高,也會引起發(fā)病率加,或診斷技術提高,也會引起發(fā)病率“升高升高”。因。因此在分析討論時,應根據(jù)各方面情形全面考慮,慎重此在分析討論時,應根據(jù)各方面情形全面考慮,慎重對待。對待。6

44、.6.樣本率(或構成比)的比較應做樣本率(或構成比)樣本率(或構成比)的比較應做樣本率(或構成比)假設檢驗。假設檢驗。整理ppt 假設檢驗過去稱顯著性檢驗。它是利用小概率反假設檢驗過去稱顯著性檢驗。它是利用小概率反證法思想,從問題的對立面證法思想,從問題的對立面( (H H0 0) )出發(fā)間接判斷要解出發(fā)間接判斷要解決的問題決的問題( (H H1 1) )是否成立。然后在是否成立。然后在H H0 0成立的條件下計成立的條件下計算檢驗統(tǒng)計量,最后獲得算檢驗統(tǒng)計量,最后獲得P P值來判斷。值來判斷。 七、統(tǒng)計推斷 整理pptn例3-5 某醫(yī)生測量了36名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標準差為25.74g/L。問從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L?n130.83g/L 140g/Ln原因: 1.可能是總體均數(shù)不同 2.是抽樣造成的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論