版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
Medicalstatistics醫(yī)學(xué)統(tǒng)計學(xué)統(tǒng)計資料的整理與描述數(shù)值變量資料2023/9/212主要內(nèi)容
個體變異頻數(shù)分布表(圖)
定量指標(biāo)的描述集中位置離散趨勢總結(jié)2023/9/213個體變異(individualvariation)是同質(zhì)觀察對象間表現(xiàn)出的差異。變異是生物體在一種或多種、已知或未知的不可控因素作用下所產(chǎn)生的綜合反映。就個體而言:變異是隨機(jī)的(random)。就總體而言:個體變異是有規(guī)律的。2023/9/214原始數(shù)據(jù)4.095.335.624.635.184.275.073.603.315.324.884.314.125.334.404.793.925.464.815.094.204.133.944.415.264.665.295.235.583.534.544.684.484.404.764.814.574.973.945.484.275.105.785.123.604.014.755.806.015.505.364.184.334.844.744.604.764.584.344.724.813.844.174.853.294.914.454.434.994.494.355.265.045.384.935.414.523.864.994.244.504.924.135.055.145.055.174.555.425.704.676.184.375.404.154.084.714.124.794.89100名成年男性血紅細(xì)胞計數(shù)(1012/L)資料如下:頻數(shù)分布表和頻數(shù)分布圖原因:由于個體變異的存在,醫(yī)學(xué)研究中某指標(biāo)在各個體上的觀察結(jié)果不是恒定不變的,但也不是雜亂無章的,而是有一定規(guī)律的,呈一定的分布(distribution)。解決:頻數(shù)分布表的基本思想:將原始數(shù)據(jù)按照一定的標(biāo)準(zhǔn)劃分為若干各組,合計各組的頻數(shù),得到頻數(shù)分布表;在將頻數(shù)表繪制成頻數(shù)分布圖。
2023/9/216頻數(shù)表編制步驟
求極差選定適當(dāng)?shù)慕M段數(shù)后估計組距列出組段劃記歸組獲得頻數(shù)求頻率,完成頻數(shù)表
2023/9/217頻數(shù)分布表的編制求極差或全距(Range):R=Xmax-XminR=6.18-3.29=2.89選定適當(dāng)?shù)慕M段數(shù)后估計組距(i)組段數(shù)的選取以能反映資料的分布特征為宜一般取8~15組
i=2.89/10=0.289≈0.32023/9/218頻數(shù)分布表的編制列出組段組段的含義:包括組段的下限而不含組段的上限。如:3.20~等價于[3.20,3.50)第一個組段應(yīng)包含最小值
最后一個組段應(yīng)包含最大值2023/9/219頻數(shù)分布表的編制劃記歸組獲得頻數(shù)常用的劃記方法:“正”;“||||”求頻率,完成頻數(shù)表相應(yīng)的頻數(shù)除以總數(shù)即為頻率各組段的頻率總和為1或者100%100名成年男性血紅細(xì)胞計數(shù)頻數(shù)表組段(1)頻數(shù)(2)頻率(%)(3)3.20~22.003.50~33.003.80~88.004.10~1616.004.40~1818.004.70~2121.005.00~1414.005.30~1212.005.60~44.005.90~6.2022.00合計100100.0011100名成年男子紅細(xì)胞計數(shù)頻數(shù)圖圖2.1100名成年男性的血紅細(xì)胞計數(shù)的頻數(shù)分布
人數(shù)血紅細(xì)胞(1012個/L)3.2
3.5
3.8
4.1
4.4
4.7
5.0
5.3
5.6
5.9
6.2
0
5
10
15
20
2023/9/2112頻數(shù)分布表和頻數(shù)分布圖的用途
描述分布類型描述分布的特征便于發(fā)現(xiàn)特大、特小的可疑值便于計算有關(guān)指標(biāo)、統(tǒng)計分析與處理2023/9/2113頻數(shù)分布類型對稱分布:以正態(tài)分布較為常見非對稱分布:偏態(tài)分布正偏態(tài):右側(cè)>左側(cè)向右側(cè)拖尾 負(fù)偏態(tài):左側(cè)>右側(cè)向左側(cè)拖尾
2023/9/2114頻數(shù)分布特征
數(shù)據(jù)分布的范圍:3.29~6.18
集中位置:中等大小人數(shù)居多,向中間集中數(shù)據(jù)最集中的區(qū)間:4.70~5.00
離散趨勢:以中等大小的區(qū)間為中心,向兩側(cè)逐漸減少分布形態(tài):基本對稱2023/9/2115圖239人發(fā)汞含量的頻數(shù)分布13579111315171921發(fā)汞含量(umol/kg)706050403020100人數(shù)2023/9/2116圖某城市892名老年人生存質(zhì)量自評分的頻數(shù)分布0102030405060708090100自評分4003002001000人數(shù)2023/9/2117圖102名黑色數(shù)瘤患者的生存時間頻數(shù)分布151015202530354045生存時間(月)403020100人數(shù)2023/9/2118圖某地1990~1992年男性死亡年齡分布
0510152025
303540455055606570758085死亡年齡(歲)250020001500100050002023/9/2119數(shù)值變量資料的統(tǒng)計指標(biāo)集中位置的描述離散趨勢的描述2023/9/2120集中位置的描述----平均數(shù)(average)均數(shù)(arithmeticmean,mean)總體均數(shù)樣本均數(shù)2023/9/2121平均數(shù)(average)加權(quán)均數(shù)(weightedmean)
均數(shù)是加權(quán)均數(shù)的一個特例2023/9/2122平均數(shù)(average)幾何均數(shù)(geometricmean)
2023/9/2123幾何均數(shù)例1:10,1:20,1:40,1:80,1:1602023/9/2124平均數(shù)(average)中位數(shù)(median)
將一組數(shù)據(jù)按從小到大的順序排列,位置居中的數(shù)即是中位數(shù)。2023/9/2125中位數(shù)例9例正常人的發(fā)汞值(
mol/kg):
1.1,1.83.54.24.85.65.97.110.5
M=4.810例正常人的發(fā)汞值:
1.1,1.83.54.24.85.65.97.110.516.3
M=(4.8+5.6)/2=5.2
2023/9/2126平均數(shù)(average)LP1P2P3P4HP97P98P991%1%1%1%1%1%1%同樣有十分位數(shù)、四分位數(shù)……百分位數(shù)(percentile)2023/9/2127
M=P50排序數(shù)據(jù):按從小到大順序排列X%(100-X)%PXHL2023/9/2128平均數(shù)應(yīng)用的注意事項同質(zhì)的資料計算平均數(shù)才有意義根據(jù)資料分布的特征選用適當(dāng)?shù)钠骄鶖?shù)均數(shù):單峰對稱分布的資料幾何均數(shù):各變量值之間成倍數(shù)關(guān)系,分布呈偏態(tài),經(jīng)對數(shù)變換后呈單峰對稱分布資料中位數(shù):理論上可用于任何分布資料,但當(dāng)資料適合計算均數(shù)或幾何均數(shù)時,不宜用中位數(shù)。(偏態(tài)分布、不規(guī)則分布資料、有不確定值的資料)2023/9/2129平均數(shù)應(yīng)用的注意事項計算幾何均數(shù)時:變量值中不能有0
同一組變量值不能同時存在正、負(fù)值若變量值全為負(fù)值,可先將負(fù)號除去,算出結(jié)果后再冠以負(fù)號樣本含量較少時不宜計算靠近兩端的百分位數(shù)
平均數(shù)要與變異指標(biāo)結(jié)合使用2023/9/2130看一個例子:有甲、乙兩組同性別同年齡兒童體重(kg):甲組26,28,30,32,34=30kgn甲=5
乙組24,27,30,33,36=30kgn乙=5上述兩組數(shù)據(jù)的特點:集中位置相同:均為30kg
離散程度不同:各觀察值離均數(shù)的遠(yuǎn)近不同2023/9/2131離散趨勢的描述全距(Range)
亦稱極差,記為R,是一組變量值中最大值與最小值之差。優(yōu)點:簡單明了缺點:不靈敏、不穩(wěn)定
2023/9/2132離散趨勢的描述四分位數(shù)間距(interquartilerange)
定義為:
QL~QU,即中間一半觀察值的極差。 四分位數(shù)(quartile)是兩個特定的百分位數(shù):第25%分位數(shù)P25,和第75%分位數(shù)P75,分別記為QL和QU。
四分位數(shù)間距較全距穩(wěn)定,常與中位數(shù)一起,描述不對稱分布資料的特征。2023/9/213325%25%25%25%排序數(shù)據(jù):按從小到大順序排列MQLQUinter-quartilerangeQ2Q1Q32023/9/2134離散趨勢的描述方差(Variance)和標(biāo)準(zhǔn)差(StandardDeviation)總體均數(shù)
未知,用樣本均數(shù)估計
2023/9/2135標(biāo)準(zhǔn)差“離均差平方之和平均后的方根”“均方根”n-1稱為(標(biāo)準(zhǔn)差的)自由度,即“可以自由變異的程度”分子有n項離均差,但只有n-1項獨立,根據(jù)任一離均差均可以用另外n-1個離均差表示,所以“只有n-1個獨立的離均差”。2023/9/2136標(biāo)準(zhǔn)差大:分布分散、不整齊、波動大;標(biāo)準(zhǔn)差小:分布集中、整齊、波動較小。2023/9/2137離散趨勢的描述變異系數(shù)(coefficientofvariation)亦稱離散系數(shù)(coefficientofdispersion),是標(biāo)準(zhǔn)差s與均數(shù)之比,即:
2023/9/2138變異系數(shù)的兩個特點及相應(yīng)的用途
沒有單位反映標(biāo)準(zhǔn)差占均數(shù)的百分比或標(biāo)準(zhǔn)差是均數(shù)的幾倍可用來比較度量衡單位不同的資料的變異度
不受平均水平的影響反映的是以均數(shù)為基數(shù)的相對變異的大小比較均數(shù)相差懸殊的資料的變異度
2023/9/2139某地20歲男子100人,身高均數(shù)為171.06cm,標(biāo)準(zhǔn)差為4.95cm;體重均數(shù)為61.54kg,標(biāo)準(zhǔn)差為5.02kg,試比較身高和體重的變異。
身高體重
2023/9/2140絕對變異受平均水平的影響相對變異排除了平均水平的影響年齡組人數(shù)均數(shù)標(biāo)準(zhǔn)差變異系數(shù)(%)1~2月10056.32.13.75~6月12066.52.23.33~3.5歲30096.13.13.25~5.5歲400107.83.33.14個不同年齡組兒童身高(cm)的變異
2023/9/2141平均數(shù)與變異度的關(guān)系
平均數(shù)表示的集中性與變異度表示的離散性,是從兩個不同的角度闡明計量資料的特征變異度越小,平均數(shù)對各變量值的代表性越好
變異度越大,平均數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 土地轉(zhuǎn)讓協(xié)議書2023標(biāo)準(zhǔn)版
- 顱縫分離病因介紹
- 2024賓館轉(zhuǎn)讓協(xié)議
- 雙方協(xié)議離婚嗎
- 中考?xì)v史基礎(chǔ)知識第7講中華民族的抗日戰(zhàn)爭
- (2024)果蔬交易市場建設(shè)項目可行性研究報告(一)
- 湖南省永州市道縣2024-2025學(xué)年八年級上學(xué)期期中生物學(xué)試題(原卷版)-A4
- 2024秋新滬科版物理八年級上冊課件 第一章 運動的世界 第一節(jié) 動與靜 1
- 管理評審會議材料匯編培訓(xùn)課件
- 熱工基礎(chǔ)模擬習(xí)題
- 2024-2030年水培蔬菜行業(yè)市場發(fā)展分析及發(fā)展趨勢與投資戰(zhàn)略研究報告
- 2024年部編版語文五年級上冊全冊單元檢測題及答案(共8套)
- 集成電路制造工藝 課件 6光刻工藝2
- 建筑邊坡工程施工質(zhì)量驗收標(biāo)準(zhǔn)
- 2020海灣JTW-LD-GST85B纜式線型感溫火災(zāi)探測器
- 微測網(wǎng)題庫完整版行測
- 2024中華人民共和國農(nóng)村集體經(jīng)濟(jì)組織法詳細(xì)解讀課件
- 2024年貴州省中考理科綜合試卷(含答案)
- 2024應(yīng)急管理部國家自然災(zāi)害防治研究院公開招聘34人(高頻重點提升專題訓(xùn)練)共500題附帶答案詳解
- 2002版《水利工程施工機(jī)械臺時費定額》
- 創(chuàng)意思維與演講口才智慧樹知到期末考試答案章節(jié)答案2024年宜賓學(xué)院
評論
0/150
提交評論