預(yù)防醫(yī)學變量的統(tǒng)計描述課件_第1頁
預(yù)防醫(yī)學變量的統(tǒng)計描述課件_第2頁
預(yù)防醫(yī)學變量的統(tǒng)計描述課件_第3頁
預(yù)防醫(yī)學變量的統(tǒng)計描述課件_第4頁
預(yù)防醫(yī)學變量的統(tǒng)計描述課件_第5頁
已閱讀5頁,還剩146頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1 預(yù)防醫(yī)學預(yù)防醫(yī)學 福醫(yī)衛(wèi)生統(tǒng)計系福醫(yī)衛(wèi)生統(tǒng)計系 林征林征 2 第七章提綱第七章提綱 n數(shù)值變量的統(tǒng)計描述數(shù)值變量的統(tǒng)計描述 n分類資料的統(tǒng)計描述分類資料的統(tǒng)計描述 n統(tǒng)計圖表統(tǒng)計圖表 n醫(yī)學統(tǒng)計中常見的分布及其應(yīng)用醫(yī)學統(tǒng)計中常見的分布及其應(yīng)用 3 統(tǒng)計描述統(tǒng)計描述 n統(tǒng)計描述就是用適當?shù)谋砀?、圖形、數(shù)統(tǒng)計描述就是用適當?shù)谋砀?、圖形、數(shù) 量化的指標,表達數(shù)據(jù)的數(shù)量特征,揭量化的指標,表達數(shù)據(jù)的數(shù)量特征,揭 示其分布的規(guī)律性示其分布的規(guī)律性 n統(tǒng)計描述分為:統(tǒng)計描述分為:形象化描述形象化描述(統(tǒng)計圖統(tǒng)計圖 表表)建立對資料的初步印象;建立對資料的初步印象;數(shù)值數(shù)值 化的描述化的描述(統(tǒng)計指標統(tǒng)

2、計指標)給出分布規(guī)給出分布規(guī) 律及具體數(shù)值律及具體數(shù)值 4 統(tǒng)計描述統(tǒng)計描述 n為什么要對資料進行統(tǒng)計描述?為什么要對資料進行統(tǒng)計描述? n醫(yī)學研究得到的原始數(shù)據(jù)醫(yī)學研究得到的原始數(shù)據(jù)(raw data)往往是龐大的、混亂的往往是龐大的、混亂的 n個體變異的存在,醫(yī)學研究中某指標在各個體上的觀察結(jié)個體變異的存在,醫(yī)學研究中某指標在各個體上的觀察結(jié) 果不是恒定不變的,但也不是雜亂無章的;從總體的角度上果不是恒定不變的,但也不是雜亂無章的;從總體的角度上 個體值的出現(xiàn)是有一定規(guī)律的,即呈一定的分布個體值的出現(xiàn)是有一定規(guī)律的,即呈一定的分布 n統(tǒng)計描述的結(jié)果為進一步的統(tǒng)計推斷提供參考統(tǒng)計描述的結(jié)果為

3、進一步的統(tǒng)計推斷提供參考 5 統(tǒng)計描述統(tǒng)計描述 n統(tǒng)計描述的思路:統(tǒng)計描述的思路: 計算相應(yīng)統(tǒng)計指標計算相應(yīng)統(tǒng)計指標 繪制合適統(tǒng)計圖表繪制合適統(tǒng)計圖表 判斷類型判斷類型 獲取資料獲取資料 分類匯總相應(yīng)統(tǒng)計指標分類匯總相應(yīng)統(tǒng)計指標 繪制合適統(tǒng)計圖表繪制合適統(tǒng)計圖表 數(shù)值數(shù)值 變量變量 分類分類 變量變量 6 一、數(shù)值變量的統(tǒng)計描述一、數(shù)值變量的統(tǒng)計描述 n例例71:某地:某地1998年隨機抽查年隨機抽查120名名20歲健康男大學生身高歲健康男大學生身高(cm) 175.7 171.6 172.4 170.5 172.3 163.8 172.4 167.5 173.6 175.0 178.4 17

4、0.4 169.9 173.6 172.0 172.1 179.1 179.4 173.1 172.4 170.4 178.2 172.9 172.7 179.6 174.5 174.8 172.0 175.8 172.7 170.0 168.5 173.8 168.9 179.9 172.4 166.5 171.6 177.0 171.4 170.3 167.4 174.3 172.3 175.3 170.4 171.6 174.1 171.6 173.8 162.8 172.7 174.0 179.6 166.7 166.6 164.3 177.8 182.7 171.4 168.9 17

5、5.2 176.7 169.5 176.3 177.7 172.1 166.6 177.1 176.1 171.5 172.3 174.2 174.4 173.5 171.9 167.4 171.7 179.5 177.3 175.3 172.3 174.2 174.4 173.5 171.9 167.4 181.7 179.5 177.3 166.9 168.4 175.2 172.3 172.9 173.6 165.3 171.9 169.1 168.9 178.2 169.5 172.1 178.4 166.6 165.8 171.1 174.9 176.7 174.8 168.2 17

6、8.1 170.5 172.3 172.3 169.8 168.1 172.1 180.0 171.2 7 理想的描述結(jié)果理想的描述結(jié)果 身高身高例數(shù)例數(shù)比例比例(%) 16221.67 16432.50 166108.33 1681310.83 1701915.83 1722823.33 1742016.67 176108.33 178108.33 18043.33 18218410.83 8 如何得到上述理想的結(jié)果?如何得到上述理想的結(jié)果? 頻數(shù)分布表頻數(shù)分布表 分組劃計分組劃計 原始資料原始資料 頻數(shù)分布圖頻數(shù)分布圖各項統(tǒng)計指標各項統(tǒng)計指標 9 n求極差求極差R:R=max-min n確

7、定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目 的。對于的。對于100余例的數(shù)據(jù)通常分為余例的數(shù)據(jù)通常分為815組?;蚋鶕?jù)以下經(jīng)驗公式:組?;蚋鶕?jù)以下經(jīng)驗公式: n確定組距:組距確定組距:組距i是一個組的下限與下一個組段下限之差,可根據(jù)是一個組的下限與下一個組段下限之差,可根據(jù) 全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即 n列出組段:第一組段的列出組段:第一組段的下限略小于最小值下限略小于最小值,最后一個組段,最后一個組段上限必上限必 須包含最大值須包含最大值 n統(tǒng)計出各組的頻數(shù)并

8、整理成頻數(shù)分布表統(tǒng)計出各組的頻數(shù)并整理成頻數(shù)分布表 為為樣樣本本含含量量)為為組組數(shù)數(shù),n(k 2lg lg 1 n K 1.頻數(shù)表頻數(shù)表 10 1.頻數(shù)表頻數(shù)表 身高身高例數(shù)例數(shù)頻率頻率(%) 頻率密度頻率密度 (每(每cm身高頻率)身高頻率) 16221.670.0083 16432.500.0125 166108.330.0417 1681310.830.0542 1701915.830.0792 1722823.330.1167 1742016.670.0833 176108.330.0417 178108.330.0417 18043.330.0167 18218410.830.00

9、42 11 2.頻數(shù)分布圖(直方圖)頻數(shù)分布圖(直方圖) 12 頻數(shù)表與頻數(shù)圖的作用頻數(shù)表與頻數(shù)圖的作用 n頻數(shù)表與頻數(shù)圖可以提供不同分組的觀察人數(shù)、頻數(shù)表與頻數(shù)圖可以提供不同分組的觀察人數(shù)、 頻率與頻率密度頻率與頻率密度 n觀察分布范圍及有無可疑值觀察分布范圍及有無可疑值 n確定分布的類型:對稱或不對稱分布確定分布的類型:對稱或不對稱分布 13 289只近視眼只近視眼Lasik術(shù)后術(shù)后1月裸眼視力月裸眼視力 Frequency nv 0.000.100.200.300.400.500.600.700.800.901.001.10 1.20 0 60 14 對稱分布對稱分布 n該人群身高介于該

10、人群身高介于162183cm間間 n以以“172”組段的頻數(shù)最多組段的頻數(shù)最多 n從從“172”組段向兩端逐漸減少組段向兩端逐漸減少 n表現(xiàn)出以表現(xiàn)出以“172”組段為中心基本對稱組段為中心基本對稱 的特點的特點 15 不對稱分布不對稱分布 n分布不對稱者稱為分布不對稱者稱為偏態(tài)分布偏態(tài)分布skewness distribution n偏態(tài)分布又分為正偏分布和負偏分布偏態(tài)分布又分為正偏分布和負偏分布 n正偏分布正偏分布positive skewness是指分布的長尾在峰的右側(cè),是指分布的長尾在峰的右側(cè), 又稱又稱右偏分布右偏分布right skewed n所謂所謂負偏分布負偏分布negativ

11、e skewness是指分布的長尾在峰的是指分布的長尾在峰的 左側(cè),又稱左側(cè),又稱左偏分布左偏分布left skewed 16 Negative skewness:老年人生存質(zhì)量自評分:老年人生存質(zhì)量自評分 0 10 20 30 40 50 60 70 80 90 100 100 200 300 0 400 自評分自評分 人人 數(shù)數(shù) 17 Positive skewness: 黑色素瘤患者的生存時間黑色素瘤患者的生存時間 0 5 10 15 20 25 30 35 40 45 0 1 0 2 0 3 0 4 0 生存時間生存時間( (月月) ) 人人 數(shù)數(shù) 18 如何更具體、精確?如何更具體、

12、精確? n了解了數(shù)據(jù)分布的形了解了數(shù)據(jù)分布的形 態(tài)(對稱與否)、是態(tài)(對稱與否)、是 否有異常值,僅僅意否有異常值,僅僅意 味著對數(shù)據(jù)有了初步味著對數(shù)據(jù)有了初步 認識,尚未得到數(shù)據(jù)認識,尚未得到數(shù)據(jù) 的的“精確精確”特征特征 n例如:教務(wù)處得到例如:教務(wù)處得到04 與與05兩個年級的預(yù)防兩個年級的預(yù)防 醫(yī)學成績,如何判斷醫(yī)學成績,如何判斷 優(yōu)劣?優(yōu)劣? 分數(shù)段分數(shù)段 04級級05級級 例數(shù)例數(shù)%例數(shù)例數(shù)% 中位數(shù),故算術(shù)中位數(shù),故算術(shù) 均數(shù)減去中位數(shù)為正值,稱這種數(shù)據(jù)分布為正均數(shù)減去中位數(shù)為正值,稱這種數(shù)據(jù)分布為正 偏態(tài)偏態(tài) n對于負偏態(tài)數(shù)據(jù)有算術(shù)均數(shù)對于負偏態(tài)數(shù)據(jù)有算術(shù)均數(shù)0.98kg? 變

13、異度間的比較問題變異度間的比較問題 64 變異系數(shù)變異系數(shù) n變異系數(shù)變異系數(shù)coefficient of variation:標準差與其:標準差與其 相應(yīng)的均值之比相應(yīng)的均值之比 n它反映數(shù)據(jù)它反映數(shù)據(jù)相對相對離散程度,沒有量綱離散程度,沒有量綱 n消除了數(shù)據(jù)水平高低和計量單位的影響,用于消除了數(shù)據(jù)水平高低和計量單位的影響,用于 不同性質(zhì)數(shù)據(jù)或均數(shù)相差較大時,離散程度的不同性質(zhì)數(shù)據(jù)或均數(shù)相差較大時,離散程度的 比較比較 65 頻數(shù)分布表、圖頻數(shù)分布表、圖 分組劃計分組劃計 原始資料原始資料 分布分布 類型類型 算術(shù)均數(shù)與標準差算術(shù)均數(shù)與標準差 幾何均數(shù)與對數(shù)值幾何均數(shù)與對數(shù)值 標準差的反對數(shù)

14、標準差的反對數(shù) 中位數(shù)與四分位數(shù)間距中位數(shù)與四分位數(shù)間距不對稱不對稱 對稱對稱 66 二、分類資料的統(tǒng)計描述二、分類資料的統(tǒng)計描述 n分類變量的取值為某種屬性,例如:分類變量的取值為某種屬性,例如: 血型血型(A、B、O、AB) 人群中某病發(fā)生與否人群中某病發(fā)生與否(發(fā)生、不發(fā)生發(fā)生、不發(fā)生) 性別(男性、女性)性別(男性、女性) 視力等級(差視力等級(差 、中、好)、中、好) n這些變量值無法直接進行統(tǒng)計運算,通常的做法是按這些變量值無法直接進行統(tǒng)計運算,通常的做法是按 照類別進行統(tǒng)計匯總,分別計算每一個類別的觀察單照類別進行統(tǒng)計匯總,分別計算每一個類別的觀察單 位數(shù),即某個分類的頻數(shù)位數(shù),

15、即某個分類的頻數(shù) n將上述頻數(shù)繪制成頻數(shù)分布表將上述頻數(shù)繪制成頻數(shù)分布表 67 某年某社區(qū)各年齡居民高血壓患病情況某年某社區(qū)各年齡居民高血壓患病情況 年齡年齡患病人數(shù)患病人數(shù) 209 3013 4091 50102 60及以上及以上12 合計合計227 n40與與50年齡段為高血壓的高危年齡段!年齡段為高血壓的高危年齡段! 68 某年某單位各年齡居民高血壓患病情況某年某單位各年齡居民高血壓患病情況 年齡年齡調(diào)查人數(shù)調(diào)查人數(shù)患病人數(shù)患病人數(shù)患病率患病率(1/萬萬) 20104590.9 30443132.9 407029113.0 5063710216.0 60321237.5 合計合計2859

16、2277.9 n60歲以上年齡段為高血壓的高危年齡段!歲以上年齡段為高血壓的高危年齡段! 69 相對數(shù)相對數(shù) n對分類變量匯總后,通常這些頻數(shù)不能對分類變量匯總后,通常這些頻數(shù)不能 直接比較;分類資料的統(tǒng)計描述與推斷直接比較;分類資料的統(tǒng)計描述與推斷 中通常使用中通常使用相對數(shù)相對數(shù),而不是絕對數(shù),而不是絕對數(shù) n相對數(shù)指標是由兩個有聯(lián)系的指標之比相對數(shù)指標是由兩個有聯(lián)系的指標之比 組成組成 70 常用的相對數(shù)指標常用的相對數(shù)指標 n比比(ratio) n構(gòu)成比構(gòu)成比(proportion) n率率(rate) 71 1、相對比、相對比 n相對比相對比ratio含義:兩個相關(guān)聯(lián)的指標之比含義:

17、兩個相關(guān)聯(lián)的指標之比 n計算公式:計算公式: n特點:無量綱、取值可以超過特點:無量綱、取值可以超過1;A與與B的量綱可以的量綱可以 相同也可以不同,但是相同也可以不同,但是A與與B互不包含互不包含 n常用指標有:性別比、每千人口的醫(yī)生數(shù)、動態(tài)數(shù)常用指標有:性別比、每千人口的醫(yī)生數(shù)、動態(tài)數(shù) 列分析指標等列分析指標等 指指標標 指指標標 相相對對比比型型指指標標 B A 72 2、構(gòu)成比、構(gòu)成比 n構(gòu)成比構(gòu)成比proportion含義:反映事物內(nèi)部某個部分占含義:反映事物內(nèi)部某個部分占 總體的比重;分子包含在分母中總體的比重;分子包含在分母中 n計算公式:計算公式: n特點:無量綱、在特點:無量

18、綱、在01間取值、不獨立性、可加性間取值、不獨立性、可加性 n常用指標有:性別構(gòu)成、疾病構(gòu)成、年齡構(gòu)成、職常用指標有:性別構(gòu)成、疾病構(gòu)成、年齡構(gòu)成、職 業(yè)構(gòu)成等業(yè)構(gòu)成等 011 0010 K K 萬萬 某一組成部分個體數(shù) 構(gòu)成比比例基數(shù) 同一事物內(nèi)部各組成單位個體的總數(shù) 可以根據(jù)具體情況取、 、 、等。 73 3、率、率 n率率rate含義:反映某一時間段內(nèi),某一事件出現(xiàn)的機會大小含義:反映某一時間段內(nèi),某一事件出現(xiàn)的機會大小 (近似于一段時間內(nèi)發(fā)生某事件的平均概率)(近似于一段時間內(nèi)發(fā)生某事件的平均概率) n計算公式:計算公式: n特點:多來源于隨訪性資料、分母中含有時間定義、取值特點:多來

19、源于隨訪性資料、分母中含有時間定義、取值有有 時時會超過會超過1(時間取半年、半月)(時間取半年、半月) n常用指標有:發(fā)病率、死亡率、出生率等常用指標有:發(fā)病率、死亡率、出生率等 011 0010 K K 萬萬 某一時間內(nèi)發(fā)生某現(xiàn)象的個體數(shù) 率 同期可能發(fā)生該事件的總個體數(shù) 可以根據(jù)具體情況取、 、 、等;時間通常取一年。 74 應(yīng)用相對數(shù)的注意事項應(yīng)用相對數(shù)的注意事項 n防止概念混淆;防止概念混淆;分析時不能以構(gòu)成比代分析時不能以構(gòu)成比代 替率替率 n計算相對數(shù)的分母一般不宜過小計算相對數(shù)的分母一般不宜過小 n正確地合并估計率(平均率或合計率)正確地合并估計率(平均率或合計率) n相對數(shù)比

20、較時要注意可比性相對數(shù)比較時要注意可比性 75 防止概念混淆防止概念混淆 n并非所有并非所有 含含“率率” ” 的指標都表達是發(fā)生的可能性的指標都表達是發(fā)生的可能性 大小,很多情況下這些含大小,很多情況下這些含“率率”的指標是相對比的指標是相對比 n例如:例如: 5 5 某年 歲以下兒童死亡數(shù) 歲以下兒童死亡率 同年活產(chǎn)兒總數(shù) 某年孕產(chǎn)婦死亡數(shù) 孕產(chǎn)婦死亡率 同年活產(chǎn)兒總數(shù) 76 某年某市高血壓發(fā)病情況某年某市高血壓發(fā)病情況 某年某市畸胎發(fā)病情況某年某市畸胎發(fā)病情況 季節(jié)季節(jié)發(fā)病人數(shù)發(fā)病人數(shù)百分比百分比(%) 春春1010.00 夏夏2020.00 秋秋3030.00 冬冬4040.00 季節(jié)

21、季節(jié)畸胎例數(shù)畸胎例數(shù)百分比百分比(%) 春春1010.00 夏夏2020.00 秋秋3030.00 冬冬4040.00 proportion vs. rate 77 相對數(shù)比較時的可比性相對數(shù)比較時的可比性 科室科室 甲甲 院院乙乙 院院 出院人數(shù)出院人數(shù) 治愈人數(shù)治愈人數(shù) 治愈率治愈率(%)出院人數(shù)出院人數(shù) 治愈人數(shù)治愈人數(shù) 治愈率治愈率(%) 內(nèi)科內(nèi)科87629533.6732910431.61 外科外科30529295.7470265793.59 婦科婦科56449287.2359150184.77 兒科兒科32930191.4926323388.59 合計合計2074138066.54

22、1885149579.31 78 4、率的標準化、率的標準化 n出現(xiàn)這種矛盾現(xiàn)象的原因在于兩院不同科室病出現(xiàn)這種矛盾現(xiàn)象的原因在于兩院不同科室病 例構(gòu)成不同例構(gòu)成不同 n甲院以內(nèi)科病例居多,乙院卻以外科病例居多,甲院以內(nèi)科病例居多,乙院卻以外科病例居多, 而外科病例的治愈情況較內(nèi)科好得多,造成乙而外科病例的治愈情況較內(nèi)科好得多,造成乙 院的治愈人數(shù)較多,在合計時乙院的總治愈率院的治愈人數(shù)較多,在合計時乙院的總治愈率 高于甲院高于甲院 n可見這兩組資料內(nèi)部的構(gòu)成不同可見這兩組資料內(nèi)部的構(gòu)成不同(不同的科室治不同的科室治 愈率是不同的愈率是不同的),可比性差,不可直接比較總治,可比性差,不可直接比

23、較總治 愈或合計治愈率愈或合計治愈率 79 率的標準化率的標準化 n采用統(tǒng)一的標準對內(nèi)部構(gòu)成不同的各組頻率進采用統(tǒng)一的標準對內(nèi)部構(gòu)成不同的各組頻率進 行調(diào)整,而后對比各組標準化率的方法稱為行調(diào)整,而后對比各組標準化率的方法稱為率率 的標準化法的標準化法 n調(diào)整后的率為標準化率,簡稱調(diào)整后的率為標準化率,簡稱標化率標化率 (standard rate),或調(diào)整率(),或調(diào)整率(adjusted rate) n標準化的目的是使得不同構(gòu)成的各組間比較時標準化的目的是使得不同構(gòu)成的各組間比較時 具有可比性;其做法是對那些在各組間分布不具有可比性;其做法是對那些在各組間分布不 均衡,并且可能對研究結(jié)果造

24、成影響的因素均衡,并且可能對研究結(jié)果造成影響的因素 (混雜因素)進行調(diào)整、校正,使得它們對結(jié)(混雜因素)進行調(diào)整、校正,使得它們對結(jié) 果的影響在各組間一致果的影響在各組間一致 n常見的混雜因素有年齡、性別、病情等常見的混雜因素有年齡、性別、病情等 80 率的標準化率的標準化 淋巴結(jié)淋巴結(jié) 轉(zhuǎn)移轉(zhuǎn)移 甲醫(yī)院甲醫(yī)院乙醫(yī)院乙醫(yī)院 病例數(shù)病例數(shù) 生存數(shù)生存數(shù) 生存率生存率 ()() 病例數(shù)病例數(shù) 生存數(shù)生存數(shù) 生存率生存率 ()() 無無453577.7730021571.67 有有71045068.38834250.60 合計合計75548564.2438325767.10 81 標準化率的計算標準

25、化率的計算 n率的標準化的方法通常有直接與間率的標準化的方法通常有直接與間 接法兩種接法兩種 n兩種方法的使用條件不同兩種方法的使用條件不同 82 直接標準化率直接標準化率 n已知各構(gòu)成組分的率時(或已知各組分已知各構(gòu)成組分的率時(或已知各組分 的觀察單位數(shù)與各組分觀察陽性數(shù)),的觀察單位數(shù)與各組分觀察陽性數(shù)), 可采用該法可采用該法 n在用直接標準化法計算標準化率(標化在用直接標準化法計算標準化率(標化 率)時要選擇一個率)時要選擇一個“標準人群標準人群”,例如:,例如: 標準人口、標準年齡構(gòu)成,等標準人口、標準年齡構(gòu)成,等 n該標準不可隨便選擇,一般選用標準的該標準不可隨便選擇,一般選用標

26、準的 方法有三種方法有三種 83 直接標準化率直接標準化率標準選取標準選取 n選擇一個有代表性的、內(nèi)部構(gòu)成相對穩(wěn)選擇一個有代表性的、內(nèi)部構(gòu)成相對穩(wěn) 定的較大人群作為標準;例如全國人口、定的較大人群作為標準;例如全國人口、 全省人口全省人口 n將要比較的兩組資料合并后作為共同的將要比較的兩組資料合并后作為共同的 標準標準 n將要比較的兩組中任意一組作為共用標將要比較的兩組中任意一組作為共用標 準準 84 直接標準化率直接標準化率 腋下腋下 淋巴結(jié)淋巴結(jié) 轉(zhuǎn)移轉(zhuǎn)移 標準人口數(shù)標準人口數(shù) Ni (ni=n甲 甲+n乙乙) 甲院甲院乙縣乙縣 原生存率原生存率 pi 原生存率原生存率 pi 無無3457

27、7.7771.67 有有79368.3850.60 合計合計1138 期望生存期望生存 人數(shù)人數(shù) ei=nipi 811 期望生存期望生存 人數(shù)人數(shù) ei=nipi 649 247 401 268 542 使用合并的人口數(shù)使用合并的人口數(shù)Ni作為標準人口作為標準人口 n甲院標化生存率甲院標化生存率 =811/1138=71.23% n乙院標化生存率乙院標化生存率 =649/1138=56.99% n排除了兩院病例淋巴結(jié)轉(zhuǎn)移情況不同后,甲院的生存情況較乙院排除了兩院病例淋巴結(jié)轉(zhuǎn)移情況不同后,甲院的生存情況較乙院 好好 85 直接標準化率直接標準化率 直接標準化法的一般公式:直接標準化法的一般公式

28、: n求得人群不同構(gòu)成標準人口求得人群不同構(gòu)成標準人口ni與原構(gòu)成的與原構(gòu)成的 率率pi時,標化率時,標化率p: ii i n p p n 86 標準化法的注意事項標準化法的注意事項 n通常在不同群體間的內(nèi)部構(gòu)成不同時,如果欲通常在不同群體間的內(nèi)部構(gòu)成不同時,如果欲 對它們進行相互比較,可以考慮采用標準化法對它們進行相互比較,可以考慮采用標準化法 n常見的內(nèi)部構(gòu)成因素有:年齡、性別、病情等常見的內(nèi)部構(gòu)成因素有:年齡、性別、病情等 因素因素 n標準化率并不是本身的標準化率并不是本身的 “真值真值”,而是以標準,而是以標準 人口作為參考,對各被標化組進行的調(diào)整后得人口作為參考,對各被標化組進行的調(diào)

29、整后得 到的相對的到的相對的“率率”,僅僅反映不同的組間的相,僅僅反映不同的組間的相 對水平對水平 87 標準化法的注意事項標準化法的注意事項 n標準化率隨著標準人群的不同而不同;標準化率隨著標準人群的不同而不同; 但是標化率的大小傾向是相同的;通常但是標化率的大小傾向是相同的;通常 的的“標準人群標準人群”有前述幾種情況,不可有前述幾種情況,不可 隨意選擇隨意選擇 n對于總體資料,經(jīng)過標準化后的調(diào)整率對于總體資料,經(jīng)過標準化后的調(diào)整率 可以直接比較;而對于樣本資料,標化可以直接比較;而對于樣本資料,標化 后的率需要作假設(shè)檢驗后的率需要作假設(shè)檢驗 n如果資料出現(xiàn)如果資料出現(xiàn)“交叉交叉”情況,慎

30、用標準情況,慎用標準 化化 88 三、統(tǒng)計圖表三、統(tǒng)計圖表 n避免冗長的文字敘述,使要表達的內(nèi)容中避免冗長的文字敘述,使要表達的內(nèi)容中 心突心突 出,簡單明了,便于直觀分析和比較出,簡單明了,便于直觀分析和比較 n它是資料組織、整理的有力工具,方便研究者它是資料組織、整理的有力工具,方便研究者 進行資料的校對進行資料的校對 89 1、統(tǒng)計表、統(tǒng)計表statistical tables n什么是統(tǒng)計表:什么是統(tǒng)計表: 統(tǒng)計表就是以表格的形式,表達被研究對象的統(tǒng)計表就是以表格的形式,表達被研究對象的 特征、內(nèi)部構(gòu)成及研究項目分組之間的數(shù)量關(guān)特征、內(nèi)部構(gòu)成及研究項目分組之間的數(shù)量關(guān) 系系 n統(tǒng)計表結(jié)

31、構(gòu)與繪制要求:統(tǒng)計表結(jié)構(gòu)與繪制要求: 三大組成(線條、文字、數(shù)字)三大組成(線條、文字、數(shù)字) 重點突出,簡潔明了(一事一表)重點突出,簡潔明了(一事一表) 層次分明(避免層次過多或結(jié)構(gòu)混亂)層次分明(避免層次過多或結(jié)構(gòu)混亂) 90 統(tǒng)計表的結(jié)構(gòu)統(tǒng)計表的結(jié)構(gòu) n線條線條 n文字文字 n數(shù)字數(shù)字 91 線線 條條 三線到五線、只有橫線三線到五線、只有橫線 92 文字文字 n標題標題 n標目標目 n備注備注 93 文文 字字 94 數(shù)數(shù) 字字 158.9 68.5 0.0 95 統(tǒng)計表格的種類統(tǒng)計表格的種類 n簡單表:只有一個分組依據(jù)簡單表:只有一個分組依據(jù) n組合表:有兩個或兩個以上的分組依據(jù)組

32、合表:有兩個或兩個以上的分組依據(jù) 96 簡單表簡單表 18 6143合合 計計 14 3218甲硝唑甲硝唑 4 2925替硝唑替硝唑 未愈未愈 合計合計治愈治愈藥物分組藥物分組 97 組合表組合表 藥物藥物 甲醫(yī)院甲醫(yī)院乙醫(yī)院乙醫(yī)院 總計總計 有效有效無效無效合計合計有效有效無效無效合計合計 A40105042850100 B351550331750100 合計合計75251007550100200 98 統(tǒng)計圖統(tǒng)計圖 統(tǒng)計圖的結(jié)構(gòu)和繪制原則統(tǒng)計圖的結(jié)構(gòu)和繪制原則 n按照資料的性質(zhì)與分析目的選擇適當?shù)慕y(tǒng)計圖按照資料的性質(zhì)與分析目的選擇適當?shù)慕y(tǒng)計圖 n與統(tǒng)計表相似,構(gòu)成統(tǒng)計圖的主要有:標題(圖下

33、與統(tǒng)計表相似,構(gòu)成統(tǒng)計圖的主要有:標題(圖下 方)、標目(坐標軸上)、坐標軸(方)、標目(坐標軸上)、坐標軸(5:7)、圖形、圖)、圖形、圖 例等例等 n坐標軸如果沒有特殊要求最好從坐標軸如果沒有特殊要求最好從0開始開始 n線圖中各個點的連接采用線段,不作外延線圖中各個點的連接采用線段,不作外延 99 城、郊城、郊89-98年糖尿病死亡情況年糖尿病死亡情況 地區(qū)地區(qū)89909192939495969798 城城4.454.774.655.645.786.867.457.738.9110.59 郊郊2.122.462.893.563.874.124.284.595.326.22 100 線圖線圖

34、 101 線圖線圖 n用線段的上升或下降表示某事物隨另外一個事物變化用線段的上升或下降表示某事物隨另外一個事物變化 的趨勢(的趨勢(普通線圖普通線圖)或變化的相對速度()或變化的相對速度(半對數(shù)線圖半對數(shù)線圖) 繪制線圖時應(yīng)注意以下幾點繪制線圖時應(yīng)注意以下幾點 n時間一般繪在橫軸,指標數(shù)據(jù)繪在縱軸時間一般繪在橫軸,指標數(shù)據(jù)繪在縱軸 n圖形的長寬比例要適當,其長寬比例大致為圖形的長寬比例要適當,其長寬比例大致為10 : 7 n一般情況下,縱軸數(shù)據(jù)下端應(yīng)從一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開始,以便于比開始,以便于比 較。數(shù)據(jù)與較。數(shù)據(jù)與“0”之間的間距過大時,可以采取折斷的之間的間距過大時,可以

35、采取折斷的 符號將縱軸折斷符號將縱軸折斷 102 普通線圖與半對數(shù)線圖普通線圖與半對數(shù)線圖 n普通線圖的縱坐標為算術(shù)尺度,刻度是普通線圖的縱坐標為算術(shù)尺度,刻度是 等間距的;半對數(shù)線圖的縱坐標為對數(shù)等間距的;半對數(shù)線圖的縱坐標為對數(shù) 尺度,刻度間是等比例的(呈倍數(shù)變化)尺度,刻度間是等比例的(呈倍數(shù)變化) n普通線圖用于反映一個變量隨另一個變普通線圖用于反映一個變量隨另一個變 量的變化的趨勢;半對數(shù)線圖則反映一量的變化的趨勢;半對數(shù)線圖則反映一 個變量隨另一個變量變化的相對速度個變量隨另一個變量變化的相對速度 103 兩種疾病兩種疾病15年的死亡率變化年的死亡率變化 疾病種類疾病種類 死亡率(

36、死亡率(1/10萬)萬) 1975198019851990 痢疾痢疾1.450.820.230.14 百日咳百日咳0.220.050.020.01 104 線圖線圖vs.半對數(shù)線圖半對數(shù)線圖 105 線圖線圖vs.半對數(shù)線圖半對數(shù)線圖 n將線圖中的縱坐標轉(zhuǎn)換為對數(shù)值,而橫坐標尺將線圖中的縱坐標轉(zhuǎn)換為對數(shù)值,而橫坐標尺 度仍為算術(shù)值不變,這樣的線圖稱為半對數(shù)線度仍為算術(shù)值不變,這樣的線圖稱為半對數(shù)線 圖圖 n依據(jù)對數(shù)值的特點,任意兩個點縱坐標值之差依據(jù)對數(shù)值的特點,任意兩個點縱坐標值之差 可以看作相同底數(shù)的冪次之差,體現(xiàn)了事物發(fā)可以看作相同底數(shù)的冪次之差,體現(xiàn)了事物發(fā) 展的相對速度展的相對速度

37、n所以線圖反映指標隨時間變化的趨勢和改變的所以線圖反映指標隨時間變化的趨勢和改變的 絕對幅度,而半對數(shù)線圖則反映變化的趨勢與絕對幅度,而半對數(shù)線圖則反映變化的趨勢與 相對速度相對速度 106 某年某地三種疾病的死亡率某年某地三種疾病的死亡率 死因死因 死亡率死亡率 (1/10萬)萬) 肺結(jié)核肺結(jié)核27.4 心臟病心臟病83.6 惡性腫瘤惡性腫瘤178.2 107 直條圖直條圖 n用寬度相同的條形的高度或長短來表示用寬度相同的條形的高度或長短來表示 各獨立分類數(shù)據(jù)的大小各獨立分類數(shù)據(jù)的大小 n有單式條形圖、復(fù)式條形圖等形式有單式條形圖、復(fù)式條形圖等形式 n繪制時,各類別可以放在縱軸,稱為繪制時,

38、各類別可以放在縱軸,稱為條條 形圖形圖,也可以放在橫軸,稱為,也可以放在橫軸,稱為柱形圖柱形圖 108 某年某地某年某地120名名20歲健康男大學生身高歲健康男大學生身高 身高身高例數(shù)例數(shù)比例比例(%) 16221.67 16432.50 166108.33 1681310.83 1701915.83 1722823.33 1742016.67 176108.33 178108.33 18043.33 18218410.83 109 直方圖直方圖 n用矩形的寬度和高度來表示頻數(shù)分布的圖用矩形的寬度和高度來表示頻數(shù)分布的圖 形,實際上是用矩形的面積來表示各組的形,實際上是用矩形的面積來表示各組的

39、 頻數(shù)分布頻數(shù)分布 n在直角坐標中,用橫軸表示數(shù)據(jù)分組,縱在直角坐標中,用橫軸表示數(shù)據(jù)分組,縱 軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就 形成了一個矩形,即直方圖形成了一個矩形,即直方圖 n設(shè)定直方圖下的總面積等于設(shè)定直方圖下的總面積等于1 110 直方圖直方圖vs.直條圖直條圖 n條圖是用條形的長度或高度表示各類別頻數(shù)的多少,其條圖是用條形的長度或高度表示各類別頻數(shù)的多少,其 寬度是固定的,沒有意義寬度是固定的,沒有意義 n直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示 每一組的頻數(shù),寬度則表示各組的組距,其高

40、度與寬度每一組的頻數(shù),寬度則表示各組的組距,其高度與寬度 均有意義均有意義 n直方圖的各矩形通常是連續(xù)排列,不同分組間不可調(diào)換;直方圖的各矩形通常是連續(xù)排列,不同分組間不可調(diào)換; 條形圖則是分開排列,通常情況下任意兩個或多個條塊條形圖則是分開排列,通常情況下任意兩個或多個條塊 間可以相互調(diào)換間可以相互調(diào)換 n條形圖主要用于展示獨立分組變量的數(shù)值大小,直方圖條形圖主要用于展示獨立分組變量的數(shù)值大小,直方圖 則主要用于展示定量變量的頻數(shù)分布則主要用于展示定量變量的頻數(shù)分布 111 兩種脫落牙的再植效果兩種脫落牙的再植效果 脫落方式脫落方式成功成功良好良好較好較好失敗失敗合計合計 嵌入式嵌入式 脫位

41、牙脫位牙 121212440 脫落牙脫落牙277131057 合計合計3919251497 112 百分圓圖百分圓圖 113 百分條圖百分條圖 114 構(gòu)成圖構(gòu)成圖 n包括百分條圖和圓圖包括百分條圖和圓圖 n分別是用矩形以及圓形內(nèi)各部分的面積來分別是用矩形以及圓形內(nèi)各部分的面積來 表示總體或樣本中各組成部分所占的比例,表示總體或樣本中各組成部分所占的比例, 即內(nèi)部構(gòu)成問題即內(nèi)部構(gòu)成問題 115 散點圖散點圖 n以點的密集以點的密集 程度和趨勢表程度和趨勢表 示兩個變量間示兩個變量間 的關(guān)聯(lián)密切程的關(guān)聯(lián)密切程 度與關(guān)聯(lián)方向度與關(guān)聯(lián)方向 116 統(tǒng)計圖表小結(jié)統(tǒng)計圖表小結(jié) n統(tǒng)計圖表是統(tǒng)計描述的得力

42、工具統(tǒng)計圖表是統(tǒng)計描述的得力工具 n統(tǒng)計表展現(xiàn)精確的數(shù)值指標但不夠直觀;統(tǒng)計表展現(xiàn)精確的數(shù)值指標但不夠直觀; 統(tǒng)計圖令人映象深刻卻不夠精確統(tǒng)計圖令人映象深刻卻不夠精確 n兩者通常一起結(jié)合使用兩者通常一起結(jié)合使用 117 四、正態(tài)分布四、正態(tài)分布 n最早是由法國數(shù)學家德最早是由法國數(shù)學家德.莫阿弗爾莫阿弗爾(A. de. Moivre, 16671754)于于1733年提出(年提出(The Doctrine of Chances,1738););C.F.高斯高斯(Carl Friedrich Gauss, 17771855)則將其成功推導(則將其成功推導(Theory of motion of

43、the celestial bodies moving in conic sections around the sun ,1809),用于使得正態(tài)分布廣為人知,故又),用于使得正態(tài)分布廣為人知,故又 稱為稱為Gauss Distribution n許多現(xiàn)象都可以由高斯分布來描述許多現(xiàn)象都可以由高斯分布來描述 :例如,在生產(chǎn)條:例如,在生產(chǎn)條 件不變的情況下,抗壓強度、口徑、長度等指標;同件不變的情況下,抗壓強度、口徑、長度等指標;同 一種生物體的身長、體重等指標;同一種種子的重量;一種生物體的身長、體重等指標;同一種種子的重量; 測量同一物體的誤差;彈著點沿某一方向的偏差;某測量同一物體的誤

44、差;彈著點沿某一方向的偏差;某 個地區(qū)的年降水量;以及理想氣體分子的速度分量,個地區(qū)的年降水量;以及理想氣體分子的速度分量, 等等。等等。 于是人們將正?,F(xiàn)象的數(shù)值滿足的分布稱為于是人們將正常現(xiàn)象的數(shù)值滿足的分布稱為 “Normal Distribution” 118 10 Deutsche Mark 119 隨著組段的無限細分、樣本含量的無限增加,隨著組段的無限細分、樣本含量的無限增加, 原本崎嶇不平的直方圖的輪廓逐漸變得平整,原本崎嶇不平的直方圖的輪廓逐漸變得平整, 以至于形成一條光滑的連續(xù)曲線以至于形成一條光滑的連續(xù)曲線正態(tài)分布正態(tài)分布 曲線曲線 直方圖直方圖 鐘形曲線鐘形曲線 120

45、正如數(shù)學曲線中正如數(shù)學曲線中 x 與與 y 嚴格的對應(yīng)關(guān)系,在正嚴格的對應(yīng)關(guān)系,在正 態(tài)分布曲線坐標軸上的點態(tài)分布曲線坐標軸上的點 x, y也有嚴格的數(shù)學也有嚴格的數(shù)學 對應(yīng)關(guān)系:對應(yīng)關(guān)系: 上式中上式中 f(x) = 隨機變量隨機變量 X X 的概率密度函數(shù)的概率密度函數(shù) = = 正態(tài)隨機變量正態(tài)隨機變量X X的總體均數(shù)的總體均數(shù) s s 2 2= = 正態(tài)隨機變量正態(tài)隨機變量X X的總體方差的總體方差 = 3.1415926; e = 2.71828= 3.1415926; e = 2.71828 x = x = 隨機變量的取值隨機變量的取值 (- (- x x ) ) Probabili

46、ty density function 121 隨機變量隨機變量 n如果隨機變量如果隨機變量X X的概率密度函數(shù)滿足:的概率密度函數(shù)滿足: 則稱則稱X X服從正態(tài)分布服從正態(tài)分布, ,記作記作xN N( ( , , s s2 2), ),其中:其中: 為分布的均數(shù),為分布的均數(shù), s s 為分布的標準差。為分布的標準差。 2 2 () 2 1 ( ), 2 x f xex s s ss 122 方差相等、均數(shù)不等的正態(tài)分布圖示方差相等、均數(shù)不等的正態(tài)分布圖示 312 213 123 均數(shù)相等、方差不等的正態(tài)分布圖示均數(shù)相等、方差不等的正態(tài)分布圖示 s2 s1 s3 312 sss 124 正態(tài)

47、分布的圖形特征正態(tài)分布的圖形特征 n單峰分布;高峰在均數(shù)處;兩邊沿橫坐標軸無限延伸,單峰分布;高峰在均數(shù)處;兩邊沿橫坐標軸無限延伸, 理論上永遠不與之相交理論上永遠不與之相交 n以均數(shù)為中心,均數(shù)兩側(cè)完全對稱;在以均數(shù)為中心,均數(shù)兩側(cè)完全對稱;在 s s處有拐點處有拐點 (在該范圍內(nèi)是凸的(在該范圍內(nèi)是凸的, ,其它范圍內(nèi)是凹的)其它范圍內(nèi)是凹的) ,表現(xiàn)為關(guān)于,表現(xiàn)為關(guān)于 均數(shù)完全對稱的鐘形曲線。均數(shù)完全對稱的鐘形曲線。 n正態(tài)分布有兩個參數(shù)正態(tài)分布有兩個參數(shù)(parameter),總體均數(shù)決定了正態(tài),總體均數(shù)決定了正態(tài) 分布的高峰位置,所以它是正態(tài)分布的位置參數(shù);而總分布的高峰位置,所以它

48、是正態(tài)分布的位置參數(shù);而總 體標準差決定了正態(tài)分布的分布跨度,所以它是正態(tài)分體標準差決定了正態(tài)分布的分布跨度,所以它是正態(tài)分 布的形狀參數(shù)。布的形狀參數(shù)。 n總體均數(shù)增大,分布向橫坐標右側(cè)平移;反之,向右平總體均數(shù)增大,分布向橫坐標右側(cè)平移;反之,向右平 移;如果總體標準差增大,分布變得矮胖,反之變得高移;如果總體標準差增大,分布變得矮胖,反之變得高 瘦瘦 125 正態(tài)分布曲線下面積的含義正態(tài)分布曲線下面積的含義 n曲線下面積是指由分布曲線與橫坐標或者橫坐標上的曲線下面積是指由分布曲線與橫坐標或者橫坐標上的 特定區(qū)間所圍成的區(qū)域的面積特定區(qū)間所圍成的區(qū)域的面積 曲線下面積曲線下面積曲線下面積曲

49、線下面積曲線下面積曲線下面積 126 正態(tài)分布曲線下面積的含義正態(tài)分布曲線下面積的含義 n對于連續(xù)型的計量資料,對于連續(xù)型的計量資料,x可以取某個區(qū)間或整條數(shù)軸可以取某個區(qū)間或整條數(shù)軸 上的任意點值;對于橫坐標軸上的任意特定點,上的任意點值;對于橫坐標軸上的任意特定點,其所其所 對應(yīng)的曲線下面積都等于對應(yīng)的曲線下面積都等于0(因為線的面積等于(因為線的面積等于0) 127 正態(tài)分布曲線下面積的含義正態(tài)分布曲線下面積的含義 n設(shè)定設(shè)定曲線下面積等于曲線下面積等于1,對于橫坐標軸上的某,對于橫坐標軸上的某 個區(qū)間(個區(qū)間(axb)的曲線下面積,其含義為的曲線下面積,其含義為x取取 該區(qū)間值時對應(yīng)的

50、概率有多大該區(qū)間值時對應(yīng)的概率有多大;其數(shù)值的大?。黄鋽?shù)值的大小 用分布函數(shù)式用分布函數(shù)式F(X)表示表示 128 曲線下的面積的計算曲線下的面積的計算 對于任意一個區(qū)間的曲線下面積,在知道變量值對于任意一個區(qū)間的曲線下面積,在知道變量值x對應(yīng)對應(yīng) 的概率密度函數(shù)的概率密度函數(shù)f (x)后,都可以根據(jù)微積分的方法求出后,都可以根據(jù)微積分的方法求出 其面積的大小其面積的大小 129 正態(tài)曲線下的面積規(guī)律正態(tài)曲線下的面積規(guī)律 nX軸與正態(tài)曲線所夾面積恒等于軸與正態(tài)曲線所夾面積恒等于1(相當于(相當于x的的 所有取值都在橫坐標軸上)所有取值都在橫坐標軸上) 。 n對稱區(qū)域面積相等對稱區(qū)域面積相等 F

51、(-, -X)F( +X,) F( +X,)F(-, -X) 130 正態(tài)曲線下的面積規(guī)律正態(tài)曲線下的面積規(guī)律 -3s s -2s s -s s +s s +2s s +3s s F(- , -3s s)=0.0013 F(- , -2s s)=0.0228 F(- , -1s s)=0.1587 F(- , )=0.5 F(- , +3s s)=0.9987 F(- , +2s s)=0.9772 F(- , +1s s)=0.8413 F(- , )=1 131 正態(tài)曲線下的面積規(guī)律正態(tài)曲線下的面積規(guī)律 n正態(tài)分布的一個顯著特點:正態(tài)分布的一個顯著特點: 其曲線下面積完全決定于以標準差為其

52、曲線下面積完全決定于以標準差為 單位從點單位從點x到到的標準離差(標準離差的標準離差(標準離差 的含義為標準差的倍數(shù))的含義為標準差的倍數(shù)) 132 正態(tài)曲線下的面積規(guī)律正態(tài)曲線下的面積規(guī)律 n正態(tài)曲線下面積總和為正態(tài)曲線下面積總和為1 n正態(tài)曲線關(guān)于均數(shù)對稱;對稱的區(qū)域內(nèi)面積相正態(tài)曲線關(guān)于均數(shù)對稱;對稱的區(qū)域內(nèi)面積相 等等 n對任意正態(tài)曲線,按標準差為單位,對應(yīng)的面對任意正態(tài)曲線,按標準差為單位,對應(yīng)的面 積相等積相等 n -1.96s s +1.96s s內(nèi)面積為內(nèi)面積為95% n -2.58s s +2.58s s內(nèi)面積為內(nèi)面積為99% 133 n雖然服從正態(tài)分布的指標,只要知道均數(shù)雖然

53、服從正態(tài)分布的指標,只要知道均數(shù) 與標準差與標準差s s , , 就可用微積分的方法求得任意范圍曲線下面積,但此積就可用微積分的方法求得任意范圍曲線下面積,但此積 分是困難的,這給實際使用帶來諸多不便。分是困難的,這給實際使用帶來諸多不便。 n例如:當例如:當 =0=0,s s=1=1時,在(時,在(-1.96,1.96-1.96,1.96)范圍內(nèi)正態(tài)變量)范圍內(nèi)正態(tài)變量 取值概率為取值概率為0.950.95,而當,而當 =0, =0, s s=1.96=1.96時,在時,在 (-1.96, 1.96)(-1.96, 1.96)范圍范圍 內(nèi)正態(tài)變量取值概率就不是內(nèi)正態(tài)變量取值概率就不是0.95

54、0.95,而是,而是0.680.68。這就是說。這就是說P P的的 大小不僅與區(qū)間上下限(大小不僅與區(qū)間上下限(x x1 1, x, x2 2)有關(guān),還與)有關(guān),還與 、s s 有關(guān),有關(guān), 而我們不可能針對每個不同而我們不可能針對每個不同 的的s s與都制一張表供研究者與都制一張表供研究者 參考參考 n為了制一張可供不同的為了制一張可供不同的 、s s 共同使用的表,考慮引進標共同使用的表,考慮引進標 準化變換與標準正態(tài)分布準化變換與標準正態(tài)分布。 計算曲線下面積的問題計算曲線下面積的問題 134 標準正態(tài)分布標準正態(tài)分布 n標準正態(tài)分布標準正態(tài)分布standard normal distr

55、ibution是均數(shù)為是均數(shù)為 0,標準差為,標準差為1的正態(tài)分布的正態(tài)分布 n記為記為N(0,1) n標準正態(tài)分布是唯一的標準正態(tài)分布是唯一的 n概率密度函數(shù):概率密度函數(shù): 2 2 1 , 2 z zez 135 正態(tài)分布轉(zhuǎn)換為標準正態(tài)分布正態(tài)分布轉(zhuǎn)換為標準正態(tài)分布 n若若 xN(,s2),作變換作變換: 則則z服從標準正態(tài)分布服從標準正態(tài)分布N(0,12) x z s 136 標準正態(tài)分布曲線下面積標準正態(tài)分布曲線下面積 f f(z):附表附表7-1 z 0.00 0.02 0.04 0.06 0.08 -3.00.0013 0.0013 0.0012 0.0011 0.0010 -2.

56、50.0062 0.0059 0.0055 0.0052 0.0049 -1.90.0287 0.0274 0.0262 0.0250 0.0239 -1.60.0548 0.0526 0.0505 0.0485 0.0465 -1.00.1587 0.1539 0.1492 0.1446 0.1401 00.5000 0.4920 0.4840 0.4761 0.4681 0z 137 例例7-15 n已知某地已知某地120名名20歲男大學生的平均身高歲男大學生的平均身高 為為 ,標準差,標準差s為為4.09cm,求,求 n身高在身高在160175cm者所占比例者所占比例 n該地該地80男大

57、學生的身高在何范圍男大學生的身高在何范圍 172.90 xcm 138 12 1 1 2 2 165175 165172.90 1.93 4.09 175172.90 0.51 4.09 xxx ZxZ xs xx z s xx z s s 本題的解題思路是將問題轉(zhuǎn)換為求相應(yīng)的標準正態(tài)分布 的曲線下面積: 令,;根據(jù)題意,變量 服從正態(tài)分布所可 以通過 轉(zhuǎn)換,使得 轉(zhuǎn)變?yōu)?;雖然題目沒有提供總體參數(shù) 與 ,可以將 與 作為它們的估計值: 所以 (165,175)( 1.93,0.51)(, 1.93)0.0268 (, 0.51)0.3050,(0.51,)0.3050( 1.93,0.51)

58、 1(, 1.93)(0.51,)0.6682 F ,查表得; 所以 例例7-15Q1 139 12 1 1 80 8010 0.10000.11.28 0.10031.28, 1.28 167.7 z xx zzz s xcm 之前的題目都是告訴我們具體數(shù)值求曲線下面積而本題則 為告訴曲線下面積求對應(yīng)的具體數(shù)值;所以先從附表7- 入手, 根據(jù)題意求的范圍,身高過高與過矮均為極端情況,所 以除去中間的 ,左右兩邊各有 為極端值,因此在表中 查找所對應(yīng)的 值;與最接近的是(對應(yīng)的面積為 )。故,代入中,得: 2 180.2xcm, 例例7-15Q2 140 正態(tài)分布的其它特性正態(tài)分布的其它特性(了解了解)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論