版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、統(tǒng)計(jì)學(xué)基礎(chǔ)知識,一.醫(yī)學(xué)統(tǒng)計(jì)學(xué)的意義,1.統(tǒng)計(jì)學(xué)(statistics):應(yīng)用數(shù)學(xué)的原理與方法,研究數(shù)據(jù)的搜集、整理與分析的科學(xué),對不確定性數(shù)據(jù)作出科學(xué)的推斷。 2.醫(yī)學(xué)統(tǒng)計(jì)學(xué)(statistics of medicine):應(yīng)用統(tǒng)計(jì)學(xué)的原理與方法進(jìn)行醫(yī)學(xué)科研與實(shí)踐。,3.統(tǒng)計(jì)學(xué)方法的特點(diǎn): (1)用數(shù)量反映質(zhì)量 1)體格檢查(量血壓、脈搏)個(gè)體健康質(zhì)量 2)考試分?jǐn)?shù)個(gè)體學(xué)習(xí)質(zhì)量 3)期望壽命反映人群健康狀況 4)嬰兒死亡率反映衛(wèi)生服務(wù)質(zhì)量,(2)用群體歸納個(gè)體 2011年長沙市7歲男孩有多高? 7歲男孩身高有高有矮,平均身高=119.5cm 95%的長沙市7歲男孩的身高在110.20cm12
2、9.20cm之間,二、基本概念,1、研究單位(觀察單位、unit)、變量(variable)、變量值(value of variable) (1)研究單位(unit):研究中的個(gè)體。 如:研究2011年長沙市7歲男孩身高的正常值范圍 1個(gè)人 測得的身高值(120.2cm,118.6cm,121.8cm,),2、同質(zhì)(homogeneity)和變異(variation) 研究長沙市2011年7歲男孩身高的正常值范圍? 同質(zhì):同長沙市、7歲、男孩、無影響身高的疾病。 變異:長沙市2011年7歲男孩身高有高有矮,3、總體(population)和樣本(sample) (1)總體:是根據(jù)研究目的確定的
3、同質(zhì)研究單位的全體。更確切地說是同質(zhì)研究單位某種變量值的集合。 例如:調(diào)查某地2011年正常成年男子的紅細(xì)胞數(shù)的正常值范圍。 總體:1)某地所有的正常成年男子 2)某地所有的正常成年男子的紅細(xì)胞數(shù),1)有限總體(finite population):研究單位數(shù)是有限的。 例如:調(diào)查某地2011年正常成年男子的紅細(xì)胞數(shù)的正常值范圍。 2)無限總體(infinite population):研究單位數(shù)是無限的。 例如:高血壓患者無時(shí)間、空間限制。,(2)樣本(sample):是總體中抽取的有代表性的一部分。 注意:隨機(jī)抽樣(無主觀性) 樣本含量(sample size):樣本中包含的研究單位數(shù)。
4、例如:某藥治療高血壓患者30名 樣本含量(n)為30,4、參數(shù)(parameter)和統(tǒng)計(jì)量(statistic) (1)參數(shù):根據(jù)總體個(gè)體值統(tǒng)計(jì)計(jì)算出來的描述總體的特征量。 一般用希臘字母表示 (2)統(tǒng)計(jì)量:根據(jù)樣本個(gè)體值統(tǒng)計(jì)計(jì)算出來的描述樣本的特征量。 一般用拉丁字母表示,總體參數(shù)一般是不知道的 統(tǒng)計(jì)學(xué)抽樣研究的目的就是: 樣本統(tǒng)計(jì)量總體參數(shù) 5、抽樣誤差 由于抽樣原因所造成的樣本統(tǒng)計(jì)量與總體參數(shù)之間的差別。 特點(diǎn):1)抽樣誤差是不可避免; 2)有統(tǒng)計(jì)規(guī)律性。 產(chǎn)生原因:個(gè)體差異(生物變異),6、頻率(frequency)、概率(probability)、小概率事件 (1)頻率: 一次隨機(jī)
5、試驗(yàn)出現(xiàn)各種可能結(jié)果的比例。 例如,投擲一枚硬幣,結(jié)果不外乎出現(xiàn)“正面”與“反面”兩種,在重復(fù)多次后,出現(xiàn)“正面” 或“反面”這個(gè)結(jié)果的比例稱之為頻率。,(2)概率(probability) 概率是度量隨機(jī)事件發(fā)生可能性大小的一個(gè)數(shù)值。 頻率是就樣本而言的,而概率從總體的意義上說的。,0 P(A) 1 隨機(jī)事件 P(A)=1 必然事件 P(A)=0 不可能事件。,(3)小概率事件:統(tǒng)計(jì)分析中的很多結(jié)論都基于一定置信程度下的概率推斷,習(xí)慣上將 稱為小概率事件。,湖南風(fēng)采: 中獎(jiǎng)概率大約為: 1/671萬 交通事故: 發(fā)生概率為:1/20萬,三、統(tǒng)計(jì)資料的類型,變量與統(tǒng)計(jì)資料的分類方法 概述 數(shù)值
6、變量.構(gòu)成計(jì)量資料 分類變量 無序分類變量構(gòu)成計(jì)數(shù)資料 有序分類變量構(gòu)成等級資料,. 數(shù)值變量與計(jì)量資料 1) 數(shù)值變量(numerical variable) :變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。如:身高(cm)、體重(kg)。 2) 計(jì)量資料(measurement data) :由一群個(gè)體的數(shù)值變量值構(gòu)成的資料,即一群變量值。 如:長沙市2011年7歲男孩身高值(118.6cm,121.8cm),3.無序分類變量與計(jì)數(shù)資料 1)無序分類變量(unordered categories variable):變量值是定性的,有類別。 特點(diǎn):類別是客觀存在的,各類無秩序,可任意排
7、列;類與類之間界限清楚,(理論上)不會(huì)錯(cuò)判。 如:性別:男、女。 血型:O、A、B、AB。 2)計(jì)數(shù)資料(enumeration data):一群個(gè)體按無序分類變量的類別清點(diǎn)每類有多少個(gè)個(gè)體,即分類個(gè)體數(shù)。 如:某人群性別構(gòu)成:男:, 女:7。 某人群血型構(gòu)成:O:20, A:35, B:30, AB:15,4.有序分類變量與等級資料 1)有序分類變量(ordinal categories variable) :變量值是定性的、 分等級。 特點(diǎn):等級是主觀劃分的,各級有秩序,從低到高或由高到低;級和級之間界限模糊,可能錯(cuò)判。 如:療效:無效、好轉(zhuǎn)、顯效、治愈。 血清反應(yīng):、+、+ 2)等級資料
8、(ranked data):一群個(gè)體按有序分類變量的級別清點(diǎn)每級有多少個(gè)個(gè)體,即分級個(gè)體數(shù)。 如:某地某人群EB病毒抗體反應(yīng): :65, +:5, +:6,1.專業(yè)設(shè)計(jì):選題、建立假說、確定研究對象和技術(shù)方法等2.統(tǒng)計(jì)設(shè)計(jì):圍繞專業(yè)設(shè)計(jì)確定統(tǒng)計(jì)設(shè)類型、樣本大小、分組方法、統(tǒng)計(jì)分析指標(biāo)及統(tǒng)計(jì)分析方法。,四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,設(shè)計(jì),統(tǒng)計(jì)設(shè)計(jì)的內(nèi)容包括資料的搜集、整理和分析全過和的設(shè)想和安排。 例如:研究目的和假說? 研究對象和研究單位? 研究因素(變量)? 搜集哪些原始資料? 用什么方式和方法取得這些原始資料? 怎樣整理匯總和計(jì)算統(tǒng)計(jì)指標(biāo)? 如何控制誤差? 預(yù)期會(huì)得到什么結(jié)果? 需要多少經(jīng)費(fèi)
9、?,統(tǒng),(一)資料來源 第一手資料 經(jīng)常性:統(tǒng)計(jì)報(bào)表(死亡登記、疫情報(bào)告等),工作記錄(病歷、化驗(yàn)); 一時(shí)性:專題調(diào)查、實(shí)驗(yàn)或臨床試驗(yàn)。 第二手資料:已公布的資料,如數(shù)據(jù)銀行、全國、全省衛(wèi)生統(tǒng)計(jì)資料。,收集資料,分析資料 1.統(tǒng)計(jì)描述:用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)圖表對資料的數(shù)量特征及分布規(guī)律進(jìn)行測定和描述。 2.統(tǒng)計(jì)推斷:用樣本信息推斷總體特征: 參數(shù)估計(jì) 假設(shè)檢驗(yàn)。 工具:1)foxbase數(shù)據(jù)庫 2)spss 3)SAS,五、數(shù)值變量資料的統(tǒng)計(jì)描述,頻數(shù)分布表(frequency table) : 例 從某單位1999年的職工體檢資料中獲得101名正常成年女子的血清總膽固醇的測量結(jié)果如下,試編制頻
10、數(shù)分布表。,頻數(shù)表,頻數(shù)分布圖,統(tǒng)計(jì)圖:指利用點(diǎn)的位置、線段的升降、直條的長短和面積的大小等各種幾何圖形來表達(dá)統(tǒng)計(jì)資料。 統(tǒng)計(jì)圖只能提供概略的情況,而不能獲得確切數(shù)值,因此不能完全代替統(tǒng)計(jì)表,常需要同時(shí)列出統(tǒng)計(jì)表作為統(tǒng)計(jì)圖的數(shù)值依據(jù)。,統(tǒng)計(jì)圖,統(tǒng)計(jì)圖的結(jié)構(gòu),標(biāo)題:用于簡明扼要地說明資料的內(nèi)容,一般位于圖的下方中央位置。 圖域:即制圖空間,是整個(gè)統(tǒng)計(jì)圖的視覺中心。除圓圖外,一般都是存在于特定的坐標(biāo)體系下。 標(biāo)目:分為縱標(biāo)目和橫標(biāo)目,表示坐標(biāo)系下縱軸與橫軸的含義。 圖例:用于識別比較的統(tǒng)計(jì)圖中各種圖形所代表的含義。 刻度:即縱軸和橫軸上的坐標(biāo)。刻度數(shù)值按從小到大的順序,縱軸由下向上,橫軸由左向右排
11、列。,常用的統(tǒng)計(jì)圖,直條圖 百分條圖 圓圖 線圖 半對數(shù)線圖 直方圖 散點(diǎn)圖,直條圖/條圖,圖12-1 某省1979年四個(gè)地區(qū)脊髓灰質(zhì)炎發(fā)病率,圖12-2 某地1952年與1972年三種疾病死亡率比較,圖12-4 復(fù)方豬膽囊治療單純型老年性氣管炎療效,圖12-5 20世紀(jì)70年代和80年代某地7常見惡性腫瘤發(fā)病構(gòu)成比較,圖12-6 某地1968-1974年結(jié)核病死亡率比較,圖12-7 某地1949-1958年白喉、傷寒、副傷寒 死亡率比較(普通線圖),圖12-8 某地1949-1958年白喉、傷寒、副傷寒 死亡率比較(半對數(shù)線圖),請注意:在普通線圖中,白喉死亡率線條的坡度比傷寒、副傷寒死亡率
12、線條下降的陡峭,只能說明兩種疾病的死亡率逐年變化幅度不同,不能錯(cuò)認(rèn)為白喉死亡率的下降速度比傷寒、副傷寒死亡率的下降速度快。在半對數(shù)線圖中就不會(huì)出現(xiàn)這種錯(cuò)覺。,頻 數(shù),紅細(xì)胞數(shù)(1012/L),圖12-9 140名正常男子紅細(xì)胞計(jì)數(shù)的直方圖,圖12-10 1997年某地乙型病毒性腦膜炎病例的年齡分布,1 2 3 4 5 6 7 8 9 10 15 2 0 25 30 35,年齡(歲),散點(diǎn)圖(scatter chart),散點(diǎn)圖:使用點(diǎn)的密集程度和趨勢來表示兩種指標(biāo)或變量間的相關(guān)關(guān)系。,圖10-12 12名女大學(xué)生身高與體重散點(diǎn)圖,(一)平均指標(biāo),1.算術(shù)均數(shù)(mean): 可用于反映一組呈對稱
13、分布的變量值在數(shù)量上的平均水平或者說是集中位置的特征。,適用范圍:對稱分布,尤其正態(tài)分布,計(jì)量資料的描述指標(biāo),計(jì)算方法,例 :從某單位1999年的職工體檢資料中獲得101名正常成年女子的血清總膽固醇( )的測量結(jié)果如下:,2.中位數(shù) 中位數(shù)(median):是將變量值從小到大按順序排列,位置(位次)居于中間的那個(gè)變量值。 1,3,7,5,100 中位數(shù)為多少?,n為奇數(shù)時(shí) n為偶數(shù)時(shí),例 7名病人患某病的潛伏期分別為2,3,4,5,6,9,16天,求其中位數(shù)。,本例n=7,為奇數(shù) 例8名患者食物中毒的潛伏期分別為1,2,2,3,5,8,15,24小時(shí),求其中位數(shù)。 本例n=8,為偶數(shù),應(yīng)用,適
14、用于:1、各種分布類型的資料 2、特別是偏態(tài)分布資料和開口資料(一端或兩端無確切數(shù)值的資料)。,3、幾何均數(shù),幾何均數(shù)(geometric mean):可用于反映一組經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的變量值在數(shù)量上的平均水平。 計(jì)算方法,例 某地5例微絲蚴血癥患者治療七年后用間接熒光抗體試驗(yàn)測得其抗體滴度倒數(shù)分別為,10,20,40,40,160,求幾何均數(shù)。,適用于成等比級數(shù)的資料,特別是對數(shù)正態(tài)分布資料。,(二)變異指標(biāo),例 三組同齡男孩的身高值(cm),1.極差 極差(R):即一組變量值最大值與最小值之差。,2.方差(variance)也稱均方差,即將離均差平方和用樣本含量n 取平均,可反映一組數(shù)
15、據(jù)的平均離散水平??傮w方差- ,樣本方差- 。,樣本標(biāo)準(zhǔn)差用s 表示 公式:,3.標(biāo)準(zhǔn)差,計(jì)算三組資料的標(biāo)準(zhǔn)差,甲組:,4、百分位數(shù),百分位數(shù)(percentile)是一種位置指標(biāo)。 一個(gè)百分位數(shù) 將全部變量值分為兩部分,在不包含的全部變量值中有 的變量值比它小, 變量值比它大。,變異系數(shù)(coefficient of variation,CV),多用于觀察指標(biāo)單位不同時(shí),如身高與體重的變異程度的比較;或均數(shù)相差較大時(shí),如兒童身高與成人身高變異程度的比較。,5.變異系數(shù),例:某地7歲男孩身高的均數(shù)為123.10cm,標(biāo)準(zhǔn)差為4.71cm;體重均數(shù)為22.59kg,標(biāo)準(zhǔn)差為2.26kg, 比較其
16、變異度?,第五章計(jì)數(shù)資料的統(tǒng)計(jì)描述,常用的相對數(shù): 一、率。 二、構(gòu)成比 三、相對比,第一節(jié) 常用相對數(shù),一、率 率:說明某現(xiàn)象發(fā)生的頻率或強(qiáng)度。 常以百分率(%)、千分率()、萬分率(1/萬)、十萬分率(1/10萬)等表示,計(jì)算公式為:,例5-1 某醫(yī)院1998年在某城區(qū)隨機(jī)調(diào)查了8589例60歲及以上老人,體檢發(fā)現(xiàn)高血壓患者為2823例。 高血壓患病率為: 2823 / 8589 100% = 32.87% 。,、構(gòu)成比 構(gòu)成比:表示事物內(nèi)部某一部分的個(gè)體數(shù)與該事物各部分個(gè)體數(shù)的總和之比,用來說明各構(gòu)成部分在總體中所占的比重或分布。 通常以100%為比例基數(shù)。其計(jì)算公式為,例-某正常人的白
17、細(xì)胞分類計(jì)數(shù),三、相對比 相對比簡稱比(ratio),是兩個(gè)有關(guān)指標(biāo)之比,說明兩指標(biāo)間的比例關(guān)系。 兩個(gè)指標(biāo)可以是性質(zhì)相同,如不同時(shí)期發(fā)病數(shù)之比;也可以性質(zhì)不同,如醫(yī)院的門診人次與病床數(shù)之比。通常以倍數(shù)或百分?jǐn)?shù)(%)表示。,例5-3 某年某醫(yī)院出生嬰兒中,男性嬰兒為370人,女性嬰兒為358人,則出生嬰兒性別比例為370/358100 = 103,說明該醫(yī)院該年每出生100名女嬰兒,就有103名男性嬰兒出生,它反映了男性嬰兒與女性嬰兒出生的對比水平。,第二節(jié) 應(yīng)用相對數(shù)的注意事項(xiàng),1、計(jì)算相對數(shù)應(yīng)有足夠數(shù)量即分母不宜太小。 如果例數(shù)較少會(huì)使相對數(shù)波動(dòng)較大。如某種療法治療5例病人5例全部治愈,則
18、計(jì)算治愈率為55100% =100%,若4例治愈,則治愈率為45100% =80%,由100%至80%波動(dòng)幅度較大,但實(shí)際上只有1例的變化。在臨床試驗(yàn)或流行病調(diào)查中,各種偶然因素都可能導(dǎo)致計(jì)算結(jié)果的較大變化,因此例數(shù)很少的情況下最好用絕對數(shù)直接表示。,2、不能以構(gòu)成比代替率 構(gòu)成比是用以說明事物內(nèi)部某種構(gòu)成所占比重或分布,并不說明某現(xiàn)象發(fā)生的頻率或強(qiáng)度,在實(shí)際工作中經(jīng)常會(huì)出現(xiàn)將構(gòu)成比指標(biāo)按率的概念去解釋的錯(cuò)誤例如表5-2研究已婚育齡婦女在不同情況下放置避孕環(huán)與失敗率的關(guān)系。,3.正確計(jì)算合計(jì)率 對分組資料計(jì)算合計(jì)率或稱平均率時(shí),不能簡單地由各組率相加或平均而得,而應(yīng)用合計(jì)的有關(guān)實(shí)際數(shù)字進(jìn)行計(jì)算
19、。例如用某療法治療肝炎,甲醫(yī)院治療150人,治愈30人,治愈率為20%;乙醫(yī)院治療100人,治愈30人,治愈率為30%。兩個(gè)醫(yī)院合計(jì)治愈率應(yīng)該是(30+30)/(150+100)100%=24%。若算為20%+30%=50%或(20% +30%)/2=25%,則是錯(cuò)的。,4.注意資料的可比性 在比較相對數(shù)時(shí),除了要對比的因素(如不同的藥物),其余的影響因素應(yīng)盡可能相同或相近。在臨床研究和動(dòng)物實(shí)驗(yàn)時(shí),應(yīng)遵循隨機(jī)抽樣原則進(jìn)行分組。,5.對比不同時(shí)期資料應(yīng)注意客觀條件是否相同 例如, 疾病報(bào)告制度完善和資料完整的地區(qū)或年份,發(fā)病率可以“升高”;居民因醫(yī)療普及,就診機(jī)會(huì)增加,或診斷技術(shù)提高,也會(huì)引起發(fā)病率“升高”。因此在分析討論時(shí),應(yīng)根據(jù)各方面情形全面考慮,慎重對待。 6.樣本率(或構(gòu)成比)的比較應(yīng)做樣本率(或構(gòu)成比)假設(shè)檢驗(yàn)。,假設(shè)檢驗(yàn)過去稱顯著性檢驗(yàn)。它是利用小概率反證法思想,從問題的對立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立。然后在H0成立的條件下計(jì)算檢驗(yàn)統(tǒng)計(jì)量,最后獲得P值來判斷。,七、統(tǒng)計(jì)推斷,例3-5 某醫(yī)生測量了36名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標(biāo)準(zhǔn)差為25.74g/L。問從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L? 130.83g/L 14
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二手房買賣房屋合同
- 虛擬課堂直播教育服務(wù)合同
- 醫(yī)療軟件開發(fā)外包合同
- 建筑業(yè)信息化管理與綠色建筑技術(shù)方案
- 農(nóng)業(yè)智能化種植園區(qū)規(guī)劃與管理方案
- 兒童玩具設(shè)計(jì)制作合作協(xié)議
- 移動(dòng)通信網(wǎng)絡(luò)升級與優(yōu)化實(shí)施方案
- 建筑安裝工程施工協(xié)議
- 企業(yè)內(nèi)部培訓(xùn)課程開發(fā)服務(wù)合作協(xié)議
- 智慧物流配送中心智能化改造項(xiàng)目案例分享會(huì)
- DZ∕T 0148-2014 水文水井地質(zhì)鉆探規(guī)程(正式版)
- 英語學(xué)習(xí)活動(dòng)觀下的高中英語課堂活動(dòng)設(shè)計(jì) 論文
- CRTSIII型板式無砟軌道專項(xiàng)施工施工方法及工藝要求
- 新人教版數(shù)學(xué)一年級下冊第四單元《100以內(nèi)數(shù)的認(rèn)識》教材解讀
- MOOC 外科護(hù)理學(xué)-中山大學(xué) 中國大學(xué)慕課答案
- 事業(yè)單位年度考核方案
- 2024年土地管理法
- 醫(yī)學(xué)統(tǒng)計(jì)學(xué):醫(yī)學(xué)統(tǒng)計(jì)學(xué)課后習(xí)題答案
- 框架玻璃幕墻施工工藝
- 2024年福建省投資開發(fā)集團(tuán)有限責(zé)任公司招聘筆試參考題庫含答案解析
- 23秋國家開放大學(xué)《法律職業(yè)倫理》形考任務(wù)1-3參考答案
評論
0/150
提交評論