醫(yī)學(xué)統(tǒng)計(jì)學(xué)在健康管理科研領(lǐng)域中的應(yīng)用概述_第1頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)在健康管理科研領(lǐng)域中的應(yīng)用概述_第2頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)在健康管理科研領(lǐng)域中的應(yīng)用概述_第3頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)在健康管理科研領(lǐng)域中的應(yīng)用概述_第4頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)在健康管理科研領(lǐng)域中的應(yīng)用概述_第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、醫(yī)學(xué)統(tǒng)計(jì)學(xué)在健康管理科研領(lǐng)域中的應(yīng)用概述喬昆,李星明.醫(yī)學(xué)統(tǒng)計(jì)學(xué)在健康管理科研領(lǐng)域中的應(yīng)用概述,中華健康管理學(xué)雜志J .2020,14(02) : 194-200. 摘要 健康管理專業(yè)人員在日常工作、科研工作以及論文撰寫過程中都要使用健康相關(guān)的數(shù)據(jù),需要通過嚴(yán)謹(jǐn)?shù)目蒲性O(shè)計(jì)和科學(xué)的統(tǒng)計(jì)方法去處理數(shù)據(jù)、發(fā)現(xiàn)規(guī)律。作為認(rèn)識醫(yī)學(xué)現(xiàn)象數(shù)量特征的重要工具,醫(yī)學(xué)統(tǒng)計(jì)學(xué)對健康管理專業(yè)人員科研工作很重要,本文簡要介紹了醫(yī)學(xué)統(tǒng)計(jì)學(xué)的一些基本概念、統(tǒng)計(jì)工作的步驟和常用方法,為健康管理專業(yè)人員開展科研工作和數(shù)據(jù)分析提供參考。隨著健康管理學(xué)科的發(fā)展,越來越多的健康管理專業(yè)人員在日常工作、科研工作和論文撰寫過程中都要使用

2、健康相關(guān)的數(shù)據(jù)。例如,某街道社區(qū)衛(wèi)生服務(wù)中心健康管理科負(fù)責(zé)2個社區(qū)的居民慢性病管理工作,一個社區(qū)地處老工業(yè)基地,另外一個社區(qū)地處開發(fā)區(qū),工作人員要比較這個社區(qū)的高血壓知曉率、管理率和達(dá)標(biāo)率(簡稱三率)的差別,以此來開展工作績效評估。前期調(diào)查發(fā)現(xiàn)前者的三率分別為68%,56%和46%,而后者三率為60%,52%和45%,表面看來前者比后者高一些,由此得出老工業(yè)區(qū)的居民高血壓管理效果要比開發(fā)區(qū)居民好的結(jié)論。這個結(jié)論是否可靠需要打一個問號。因?yàn)橐卮疬@個問題,除了要考慮抽樣誤差對結(jié)果的影響之外,還要考慮混雜因素對結(jié)果的影響,這里既有統(tǒng)計(jì)設(shè)計(jì)問題又有統(tǒng)計(jì)分析技術(shù)問題。從科研設(shè)計(jì)角度考慮,在人群年齡分布

3、上,老工業(yè)區(qū)居民老齡化嚴(yán)重,而開發(fā)區(qū)居民年輕化,就會對高血壓管理指標(biāo)產(chǎn)生混雜影響;同時,職業(yè)、經(jīng)濟(jì)狀況等其他因素也可能對結(jié)論產(chǎn)生影響,所以需要通過假設(shè)檢驗(yàn)對比兩地區(qū)居民三率差異,同時需要通過分層或者多元回歸分析控制混雜因素對2組率對比的影響。通過上述例題,可以看到在健康管理領(lǐng)域,研究對象主要是人體以及人體健康相關(guān)的各種因素,具有特殊性,并受到社會、經(jīng)濟(jì)、行為和心理等諸多因素的影響。需要考慮的因素越多,就越是需要通過嚴(yán)謹(jǐn)?shù)目蒲性O(shè)計(jì)和科學(xué)的統(tǒng)計(jì)分析去發(fā)現(xiàn)。而醫(yī)學(xué)統(tǒng)計(jì)學(xué)(medical statistics)作為認(rèn)識醫(yī)學(xué)現(xiàn)象數(shù)量特征的重要工具,其對健康管理專業(yè)人員科研工作的重要性不言而喻。醫(yī)學(xué)統(tǒng)計(jì)學(xué)

4、是運(yùn)用概率論和數(shù)理統(tǒng)計(jì)原理,結(jié)合醫(yī)藥衛(wèi)生工作的實(shí)際情況,闡述醫(yī)學(xué)科研設(shè)計(jì)的基本原理,研究醫(yī)學(xué)資料(信息)的收集、整理和分析的方法學(xué)總稱 HYPERLINK javascript:void(0) t _blank 1。本文在2019年中華健康管理學(xué)雜志繼續(xù)教育園地欄目科研方法學(xué)系列介紹的基礎(chǔ)上,結(jié)合健康管理學(xué)的基本應(yīng)用要求,簡要介紹醫(yī)學(xué)統(tǒng)計(jì)學(xué)的一些基本概念、統(tǒng)計(jì)工作的步驟和常用方法,為健康管理專業(yè)人員開展科研工作和數(shù)據(jù)分析提供參考。一、醫(yī)學(xué)統(tǒng)計(jì)學(xué)在健康管理學(xué)科發(fā)展中的作用健康管理是以現(xiàn)代健康概念(生理、心理和社會適應(yīng)能力)和新的醫(yī)學(xué)模式(生理-心理-社會)以及中醫(yī)治未病為指導(dǎo),通過采用現(xiàn)代醫(yī)學(xué)和

5、現(xiàn)代管理學(xué)的理論、技術(shù)、方法和手段,對個體或群體整體健康狀況及其影響健康的危險(xiǎn)因素進(jìn)行全方面監(jiān)測、評估、有效干預(yù)與連續(xù)跟蹤服務(wù)的醫(yī)學(xué)行為及過程。健康管理學(xué)集醫(yī)學(xué)科學(xué)、管理科學(xué)與信息科學(xué)于一體,重點(diǎn)研究健康的概念、內(nèi)涵與評價標(biāo)準(zhǔn)、健康風(fēng)險(xiǎn)因素監(jiān)測與控制、健康干預(yù)方法與手段、健康管理服務(wù)模式與實(shí)施路徑、健康信息技術(shù)以及健康保險(xiǎn)等一系列理論和實(shí)踐問題 HYPERLINK javascript:void(0) t _blank 2。健康管理具有如下幾個重要特點(diǎn) HYPERLINK javascript:void(0) t _blank 3,因此醫(yī)學(xué)統(tǒng)計(jì)學(xué)方法在該領(lǐng)域具有重要的實(shí)際意義。1標(biāo)準(zhǔn)化。健康管

6、理的具體服務(wù)內(nèi)容和工作流程必須依據(jù)循證醫(yī)學(xué)和循證公共衛(wèi)生的標(biāo)準(zhǔn)和學(xué)術(shù)界已經(jīng)公認(rèn)的預(yù)防和控制指南及規(guī)范。健康管理資料收集過程中要注意資料數(shù)據(jù)的標(biāo)準(zhǔn)化,否則會導(dǎo)致數(shù)據(jù)收集出現(xiàn)誤差,數(shù)據(jù)的信度和效度就會受到影響,進(jìn)而影響數(shù)據(jù)統(tǒng)計(jì)分析結(jié)果的真實(shí)性,最后整個研究就會得出錯誤的結(jié)論。這就提示我們在開展健康管理科研設(shè)計(jì)和統(tǒng)計(jì)分析過程中,首先要注意標(biāo)準(zhǔn)化問題,包括指標(biāo)定義的標(biāo)準(zhǔn)化、測量方法和工具的標(biāo)準(zhǔn)化、統(tǒng)計(jì)分析方法選擇和結(jié)果表達(dá)的標(biāo)準(zhǔn)化等,這樣得出的結(jié)果才能進(jìn)行對比,得出的信息才能共享。2定量化。隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)的應(yīng)用,健康管理更多地依托網(wǎng)絡(luò)來實(shí)現(xiàn)大數(shù)據(jù)的集合與挖掘,用戶健康數(shù)據(jù)的開發(fā)也更加完備。健康數(shù)據(jù)

7、一般通過初期的設(shè)計(jì)、收集、整理得到,然后再利用醫(yī)學(xué)統(tǒng)計(jì)學(xué)工具進(jìn)行分析,最終得到報(bào)告,這些健康數(shù)據(jù)的產(chǎn)生就體現(xiàn)了健康管理定量化的特點(diǎn)。定量化也體現(xiàn)在健康管理科研設(shè)計(jì)中,比如一些指標(biāo)的確定,我們需要將各種指標(biāo)量化,才能通過分析從而發(fā)現(xiàn)各種指標(biāo)之間的規(guī)律所在。定量分析研究是統(tǒng)計(jì)研究的特色,但統(tǒng)計(jì)的定量分析不是純粹數(shù)量意義的分析,而是為了把握健康管理的規(guī)律,達(dá)到定性和結(jié)論的目的。因此,在健康管理科學(xué)研究中,除了要注意定量化思維,同時還要注重及時總結(jié)和科學(xué)推理,使研究能不斷上升到更高的認(rèn)識,深入認(rèn)識事物的本質(zhì)。3個體化。健康評估和風(fēng)險(xiǎn)干預(yù)的結(jié)果既要針對群體的特征和健康需求,又要注重服務(wù)的個體化,即健康評

8、估和風(fēng)險(xiǎn)干預(yù)的可重復(fù)性和有效性。為了發(fā)現(xiàn)健康管理服務(wù)個體的需求,需要我們通過數(shù)據(jù)分析來發(fā)現(xiàn)個體和總體的差異,這包含2個層面的含義。在開展科學(xué)研究的過程中,既要注重收集樣本信息,以達(dá)到管中窺豹略見一斑的推論目的,又要通過樣本和總體的對比,發(fā)現(xiàn)樣本的個性化差異,以實(shí)現(xiàn)對健康風(fēng)險(xiǎn)從個別到一般,從個性到共性的認(rèn)識過程,在兼顧共性基礎(chǔ)上尊重個性的需求。例如均數(shù)和標(biāo)準(zhǔn)差就是反映了事物在數(shù)量上共性和個性的特點(diǎn)。4系統(tǒng)化。影響和決定人的健康因素是多維的,因此對于健康評估和風(fēng)險(xiǎn)干預(yù)既要考慮系統(tǒng)內(nèi)各子系統(tǒng)的相互影響,又要強(qiáng)調(diào)各子系統(tǒng)合作服務(wù),形成統(tǒng)一的標(biāo)準(zhǔn)。體現(xiàn)健康管理的系統(tǒng)化,也要發(fā)揮各專業(yè)優(yōu)勢,形成具有各自服

9、務(wù)特色的健康管理模式。這和統(tǒng)計(jì)學(xué)思維是不謀而合的,統(tǒng)計(jì)學(xué)也具有系統(tǒng)化思維,即對于一切分析對象,不僅要將它本身作為一個單獨(dú)的整體來認(rèn)識,而且還要將它作為更大系統(tǒng)的組成要素來認(rèn)識。這種對系統(tǒng)客體的“主體”認(rèn)識,是一種對研究對象進(jìn)行整體性度量的系統(tǒng)思維方式,因此我們在分析健康管理有關(guān)問題時需要具備系統(tǒng)論思維,樹立生物-心理-社會醫(yī)學(xué)系統(tǒng)論、哲學(xué)思維論,把相關(guān)因素構(gòu)成和作用機(jī)制考慮得更全面系統(tǒng)一些。二、醫(yī)學(xué)統(tǒng)計(jì)學(xué)的基本概念要想在健康管理工作實(shí)踐中順利地學(xué)習(xí)和運(yùn)用統(tǒng)計(jì)學(xué)方法解決數(shù)據(jù)分析的問題,首先必須熟悉有關(guān)統(tǒng)計(jì)學(xué)的基本概念。為了幫助讀者更好地學(xué)習(xí)統(tǒng)計(jì)學(xué)方法,首先介紹統(tǒng)計(jì)學(xué)基本概念。1同質(zhì)和變異:一個總

10、體中有許多個體,它們之所以共同成為人們研究的對象,必定存在共性。性質(zhì)相同的事物稱為同質(zhì)(homogeneity),否則稱為異質(zhì)(heterogeneity)。沒有同質(zhì)性就構(gòu)不成一個總體供人們研究,如兒童組和老年人組的身高不能簡單進(jìn)行加權(quán)來計(jì)算平均數(shù),因?yàn)樗媒Y(jié)果年齡跨度太大就失去了專業(yè)意義。不同研究中或同一研究中不同觀察指標(biāo)對觀察對象的同質(zhì)性要求不同,即同質(zhì)是相對的。例如,男性和女性的身高存在本質(zhì)的差別,在體檢中,男性和女性身高這一指標(biāo)不能共用一個標(biāo)準(zhǔn),因?yàn)閮烧呤钱愘|(zhì)的,要根據(jù)性別制定不同的標(biāo)準(zhǔn),而性別對視力沒有影響,所以男性女性的視力測試可以共用一個標(biāo)準(zhǔn),在視力這項(xiàng)指標(biāo)上,男性和女性就是同質(zhì)

11、的。即使是同質(zhì)事物,就某一觀察指標(biāo)來看,各觀察單位(亦稱個體)之間也有差別,這種同質(zhì)事物間的差別稱為變異(variation)。例如在慢病管理中,同性別、同身體素質(zhì)的高血壓患者的血壓并不相同,稱之為血壓的變異。由于觀察單位是個體,故變異亦稱為個體變異(individual variation)。變異體現(xiàn)在2個方面,其一,個體與個體間的差別,就像前面看到的即使是同性別、同身體素質(zhì)的高血壓患者的血壓值差異;其二,同一個體反復(fù)測量值間的差別,同一個人的血壓早上測量和中午測量差別很大,不同人對同一個人測量血壓時讀數(shù)也有差別。變異是宇宙事物的個性反映,在生物學(xué)和醫(yī)學(xué)現(xiàn)象中尤為明顯。變異是由于一種或多種不

12、可控因素(包括已知的和未知的)以不同程度、不同形式作用于生物體的綜合表現(xiàn)。如果我們掌握了所有因素對生物體的作用機(jī)制,那么,生物體某項(xiàng)指標(biāo)的觀察值就是可預(yù)測的了。有些指標(biāo)的變異原因已被人們認(rèn)識,但尚有一部分影響因素是未知的;更多的情況下,影響變異的因素是未知的。就每個觀察單位而言,其觀察指標(biāo)的變異是不可預(yù)測的,或者是隨機(jī)的,觀察指標(biāo)用變量(variable)表述。個體變異現(xiàn)象廣泛存在于人體及其他生物體,是個性的反映。雖然每個個體的變異表現(xiàn)出一定的隨機(jī)性和不可預(yù)測性,但變異并不等于雜亂無章,指標(biāo)的變異是有規(guī)律的,當(dāng)觀察的個數(shù)達(dá)到足夠多時,其觀察值的分布將趨于穩(wěn)定,并最終服從于總體分布(distri

13、bution of population) HYPERLINK javascript:void(0) t _blank 1。2總體與樣本:總體(population)是指根據(jù)研究目所確定的同質(zhì)觀察單位的全體,確切地說,是同質(zhì)的所有觀察單位某種變量值的集合;個體(individual)是構(gòu)成總體的最基本的觀察單位;樣本(sample)是從總體中隨機(jī)抽取部分觀察單位,其變量值的集合;樣本中所包含的個體數(shù)稱為樣本含量(sample size)。例如調(diào)查北京市2020年所有慢性病患者的月均醫(yī)藥費(fèi),觀察單位是北京市2020年所有的慢性病患者,測量值為每一位患者的月均醫(yī)藥費(fèi),那么北京市2020年所有慢性病

14、患者就構(gòu)成了一個研究總體(study population)。而2020年北京市的慢性病患者數(shù)量非常巨大,如果全部調(diào)查,要花費(fèi)大量的人力、物力、財(cái)力,而且也是不可能或者沒有必要的。實(shí)際工作中,往往從研究總體中抽取部分有代表性的觀察單位,組成統(tǒng)計(jì)學(xué)上所謂的樣本。從總體中抽取樣本,根據(jù)樣本信息來推斷總體特征的方法,即抽樣研究(sampling research) HYPERLINK javascript:void(0) t _blank 1。通過抽樣方法得到的5 000例慢性病患者就構(gòu)成了樣本,5 000就是樣本含量,它也是需要進(jìn)行統(tǒng)計(jì)學(xué)估算得到的。這里的總體只包括(確定的時間、空間范圍內(nèi))有限個

15、觀察單位,稱為有限總體(finite population)。有時總體是假想的,如研究某種干預(yù)措施對高血壓患者的干預(yù)效果,這里總體的同質(zhì)基礎(chǔ)是同為高血壓患者,采用同種干預(yù)措施,總體包括設(shè)想用該干預(yù)措施的所有高血壓患者,沒有時間、空間概念,因而觀察單位是無限的,稱為無限總體(infinite population)。3參數(shù)和統(tǒng)計(jì)量:總體中全部觀察單位的觀測值所得的特征值稱為參數(shù)(parameter)。參數(shù)是固定的常數(shù),通常是未知的,如2019年北京市全體4669歲男性的平均身高,這個值通常是未知的。如果有2個總體的參數(shù)相等,則可以認(rèn)為這2個總體某特征水平相同。當(dāng)然,并非是指2個總體中所有觀察單位

16、的觀測值都相同,而是指依據(jù)研究目的這2個總體在某種屬性特征上是一致的,如平均水平相等。在通過樣本信息對總體特征進(jìn)行估計(jì)和推斷中,統(tǒng)計(jì)上把由樣本計(jì)算得到的反應(yīng)資料特征的統(tǒng)計(jì)指標(biāo)稱為統(tǒng)計(jì)量(statistic)。如2019年在某三甲醫(yī)院健康管理中心進(jìn)行體檢的500名4669歲男性的平均身高。樣本是從總體中抽取的部分觀察單位的觀測值,由于個體變異的存在,重復(fù)抽樣時,樣本與樣本之間往往不同,故由樣本計(jì)算的統(tǒng)計(jì)量也會有變化。因此,統(tǒng)計(jì)量是隨機(jī)變量,只是取值在參數(shù)附近波動,可作為參數(shù)的估計(jì)值 HYPERLINK javascript:void(0) t _blank 4。上例中,2019年在某三甲醫(yī)院健康

17、管理中心進(jìn)行體檢的500名4669歲男性的平均身高就可以作為北京市1845歲男性的平均身高的估計(jì)值,這個值會在北京市4669歲男性平均身高值附近波動。4概率和頻率:概率(probability)是描述隨機(jī)事件發(fā)生可能性大小的一個度量。概率作為一個總體參數(shù),是一個固定的常數(shù),取值在0到1之間,常用P來表示,即0P1。P越接近1,表示事件發(fā)生的可能性越大;P越接近0,表示事件發(fā)生的可能性越小。P=1,表示事件必然發(fā)生,稱為必然事件;P=0,表示事件不可能發(fā)生,稱為不可能事件。頻率(relative frequency)指相同的條件下,獨(dú)立重復(fù)進(jìn)行n次實(shí)驗(yàn),隨機(jī)事件A出現(xiàn)了f次,則f/n為事件A出現(xiàn)

18、的頻率。在實(shí)際工作中,當(dāng)概率不易求得時,只要觀察次數(shù)足夠多,可將頻率作為概率的估計(jì)值。如為了調(diào)查某地常駐居民糖尿病的患病率,某研究者抽取了當(dāng)?shù)? 000名常駐居民,測得其糖尿病患病率為8.2%。此處,8.2%即為該地常駐居民患糖尿病這一事件出現(xiàn)的頻率。一般隨著n逐漸增大,頻率f/n為始終在一個常數(shù)左右微小波動,這個常數(shù)就是概率。但是需要注意的是,觀察次數(shù)較少時,頻率的波動性很大,用于估計(jì)概率是不可靠的 HYPERLINK javascript:void(0) t _blank 4。若在一次觀察或試驗(yàn)中某事件發(fā)生的可能性很小,可以看作很可能不發(fā)生,則稱該事件為小概率事件。不同研究問題對小概率的要

19、求不同,醫(yī)學(xué)研究中,將概率小于等于0.05或0.01者稱為小概率事件。這種小概率事件雖不是不可能事件,但一般認(rèn)為小概率事件在一次隨機(jī)試驗(yàn)中基本上不會發(fā)生,這就是小概率原理。小概率原理是統(tǒng)計(jì)推斷的一條重要原理 HYPERLINK javascript:void(0) t _blank 1。5誤差:統(tǒng)計(jì)上所說的誤差泛指測量值與真實(shí)值之差。包括系統(tǒng)誤差和隨機(jī)誤差。系統(tǒng)誤差是指數(shù)據(jù)收集和測量過程中由于儀器不準(zhǔn)確、標(biāo)準(zhǔn)不規(guī)范等人為原因,造成觀察結(jié)果偏大或偏小的一種誤差,是由確定原因造成的誤差。系統(tǒng)誤差可以通過研究設(shè)計(jì)和技術(shù)措施來消除或使之減少。隨機(jī)誤差是由于一些非人為的偶然因素,使得結(jié)果或大或小,是不確

20、定、不可預(yù)知的一種誤差。隨機(jī)誤差分為隨機(jī)的測量誤差和抽樣誤差兩種。由于總體中每個個體存在著變異,因此從同一總體中隨機(jī)抽取若干個體組成的樣本,其統(tǒng)計(jì)量如均數(shù)、標(biāo)準(zhǔn)差或樣本頻率等,與相應(yīng)的總體參數(shù)一般不會恰好相等。如從某地某年65歲以上參加健康管理的老年人總體中抽取含量為200的樣本,算得其平均體重(統(tǒng)計(jì)量)為60.3 kg,這個數(shù)不一定恰好等于該地60歲以上老年人的總體均數(shù)(參數(shù))。這種樣本的統(tǒng)計(jì)指標(biāo)(統(tǒng)計(jì)量)與總體的統(tǒng)計(jì)指標(biāo)(參數(shù))的差別稱為抽樣誤差(sampling error)。由于生物體的變異總是客觀存在的,因而抽樣誤差是不可避免的,但抽樣誤差的規(guī)律是可以被認(rèn)識的,因而是可以控制的,“統(tǒng)

21、計(jì)推斷”就是運(yùn)用抽樣誤差的規(guī)律性通過樣本對總體的某些特征進(jìn)行估計(jì)和推斷。一般來說,樣本含量愈大,抽樣誤差愈小,用樣本推斷總體的精度就愈高。當(dāng)樣本無限接近總體時,抽樣誤差就會逐漸消失。隨機(jī)測量誤差是由于測量過程中各種微小變動性引起的誤差,如觀測者在判斷和估計(jì)測量儀器讀數(shù)上的變動等。測量誤差也是不可避免的,但同樣也是可控的 HYPERLINK javascript:void(0) t _blank 1。6資料類型:按照變量取值的特征,可以將變量分為定量變量和定性變量,前者反映事物的數(shù)量特征,后者說明事物的類型和性質(zhì),不同類型變量應(yīng)采用不同的統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷的方法。定量變量也稱計(jì)量變量或數(shù)值變量,

22、是通過度量衡的方法,測定每一個觀察單位的某項(xiàng)研究指標(biāo)的量的大小得到的資料。其取值是定量的,表現(xiàn)為數(shù)值大小。按取值的不同可分為離散型變量(discrete variable)和連續(xù)性變量(continuous variable)2種,前者如兒童齲齒數(shù)、胎次等,后者如身高、體重等。定性變量也稱計(jì)數(shù)變量或分類變量,是將全體觀測單位按照某種性質(zhì)或特征分組,然后再分別清點(diǎn)各組觀察單位的個數(shù)所獲得的資料。其取值是定性的,一般無度量衡單位。表現(xiàn)為互不相容的類別或?qū)傩?,?種情況。(1)無序分類(unordered categorles)資料。二項(xiàng)分類。如性別(男女)、疾病(有無)和結(jié)局(生死)等。表現(xiàn)為互相

23、對立的2種結(jié)果。多項(xiàng)分類。如“血型”變量,分為A、B、O、AB四種。表現(xiàn)為互不相容的多類結(jié)果。(2)有序分類(ordered categories)資料。各類之間有程度上的差別或等級順序關(guān)系,有半定量的意義,亦稱等級變量。如問卷調(diào)查常詢問對某件事情的滿意程度,給出5項(xiàng)答案“非常不滿意、不滿意、一般、滿意、非常滿意”,有程度上的差別。在進(jìn)行數(shù)據(jù)分析時,往往需要從不同角度去分析問題,所謂“橫看成嶺側(cè)成峰,遠(yuǎn)近高低各不同”,這樣可以使數(shù)據(jù)分析變得更靈活。所以,數(shù)據(jù)的類型不是一成不變的,可以根據(jù)分析需要,按照一定的專業(yè)分類標(biāo)準(zhǔn)把數(shù)值變量轉(zhuǎn)化為有序分類變量,再把有序分類變量轉(zhuǎn)化為無序分類變量。但需要注意

24、的是,變量只能由“高級”向“低級”轉(zhuǎn)化,即定量有序分類,不能向相反方向的轉(zhuǎn)化。如上述“體重”變量屬于數(shù)值變量,如按體重小于2 500 g為低體重兒,大于2 500 g為正常兒,則“體重”變量轉(zhuǎn)化為二項(xiàng)分類變量。但需注意,這種轉(zhuǎn)換可能損失部分信息 HYPERLINK javascript:void(0) t _blank 1,見 HYPERLINK javascript:void(0) t _blank 圖1。圖1統(tǒng)計(jì)學(xué)常用的資料類型三、統(tǒng)計(jì)工作的基本步驟醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟包括研究設(shè)計(jì)、收集資料、整理資料和分析資料 HYPERLINK javascript:void(0) t _blank

25、1。1研究設(shè)計(jì)。醫(yī)學(xué)研究設(shè)計(jì)(design)是根據(jù)特定的研究目的,對一項(xiàng)醫(yī)學(xué)科學(xué)研究的全過程進(jìn)行科學(xué)、有效和周密的計(jì)劃和安排,包括專業(yè)設(shè)計(jì)和統(tǒng)計(jì)設(shè)計(jì)2部分內(nèi)容。專業(yè)設(shè)計(jì)主要考慮醫(yī)學(xué)專業(yè)方面的需要,如研究對象的選擇,實(shí)驗(yàn)技術(shù)與方法的確定等。統(tǒng)計(jì)設(shè)計(jì)圍繞專業(yè)設(shè)計(jì)確定,其內(nèi)容包括資料收集、整理和分析全過程總的設(shè)想和安排。例如,什么是研究目的和假說?什么是觀察對象和觀察單位?需要收集哪些原始資料?用什么方式和方法取得這些原始資料?怎樣將取得的資料進(jìn)一步整理匯總和計(jì)算統(tǒng)計(jì)指標(biāo)?如何控制誤差?預(yù)期會得到什么結(jié)果等。凡此種種,都要結(jié)合實(shí)際,周密考慮,妥善安排。設(shè)計(jì)是后續(xù)步驟的依據(jù),是最關(guān)鍵的一環(huán)。2收集資料

26、。收集資料(collection of data)的任務(wù)是取得準(zhǔn)確可靠的原始數(shù)據(jù),健康管理工作中的統(tǒng)計(jì)資料主要來自3個方面。統(tǒng)計(jì)報(bào)告表,如法定傳染病報(bào)表,職業(yè)病報(bào)表,醫(yī)院工作報(bào)表等。這是國家規(guī)定的報(bào)表,由國家統(tǒng)一設(shè)計(jì),要求有關(guān)醫(yī)療衛(wèi)生機(jī)構(gòu)定期逐級上報(bào),提供居民健康狀況和醫(yī)療衛(wèi)生機(jī)構(gòu)工作的主要數(shù)字,作為制定衛(wèi)生計(jì)劃與措施,及檢查與總結(jié)工作的依據(jù)。報(bào)表資料的質(zhì)量取決于填報(bào)人員的認(rèn)識和責(zé)任感,使用時應(yīng)對數(shù)據(jù)的準(zhǔn)確性作出判斷。經(jīng)常性工作記錄,如經(jīng)常性衛(wèi)生監(jiān)測記錄、健康體檢記錄等,要做到登記的完整準(zhǔn)確。病歷是醫(yī)療工作的重要記錄,分析時應(yīng)注意其局限性(如不能反映一般人群特征)。專題調(diào)查或?qū)嶒?yàn),實(shí)驗(yàn)和現(xiàn)場調(diào)

27、查一般都經(jīng)過嚴(yán)格的研究設(shè)計(jì)過程,但應(yīng)注意收集資料過程中的質(zhì)量控制和審核。無論何種方法收集資料都應(yīng)強(qiáng)調(diào)完整(是指收集的數(shù)據(jù)指標(biāo)齊全,樣本案例數(shù)量充足)、準(zhǔn)確(是指數(shù)據(jù)盡量接近真實(shí)情況)、及時(是講究數(shù)據(jù)的實(shí)效性)、可靠(是指數(shù)據(jù)可重復(fù)性好),才能得到高質(zhì)量的資料信息,此外,通過統(tǒng)計(jì)簡報(bào)、統(tǒng)計(jì)年鑒、學(xué)術(shù)論文等同樣可以得到高質(zhì)量的資料信息,見 HYPERLINK javascript:void(0) t _blank 圖2。圖2健康管理統(tǒng)計(jì)資料來源3整理資料:整理資料(sorting data)的任務(wù)是凈化原始數(shù)據(jù),使其系統(tǒng)化,條理化,便于進(jìn)一步計(jì)算和分析。首先是資料清理(data cleaning

28、),因?yàn)闊o論是調(diào)查或?qū)嶒?yàn)的原始記錄過程還是計(jì)算機(jī)錄入過程,常會有錯誤,必須經(jīng)過反復(fù)地檢查和核對。這是需要耐心從事的基礎(chǔ)工作,特別是數(shù)據(jù)較多時,一定要在修正錯誤,去偽存真之后,再開始按分析要求,分組匯總資料。檢查與核對可以借助現(xiàn)代計(jì)算機(jī)手段按照邏輯檢查和統(tǒng)計(jì)檢查進(jìn)行,目前Epidata、SAS等軟件都可以幫助我們實(shí)現(xiàn)這一點(diǎn)。4分析資料:分析資料(analysis of data)的目的是計(jì)算有關(guān)指標(biāo),反映數(shù)據(jù)的綜合特征(亦稱綜合指標(biāo)),闡明事物的內(nèi)在聯(lián)系和規(guī)律。統(tǒng)計(jì)分析包括,統(tǒng)計(jì)描述(descriptive statistics),指用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)表、統(tǒng)計(jì)圖等方法,對資料的數(shù)量特征及其分布規(guī)律

29、進(jìn)行測定和描述。統(tǒng)計(jì)推斷(inferential statistics),指如何抽樣,以及如何由樣本信息推斷總體特征問題,包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)。四、常見醫(yī)學(xué)統(tǒng)計(jì)學(xué)方法概述1統(tǒng)計(jì)描述:統(tǒng)計(jì)描述是統(tǒng)計(jì)分析的主要內(nèi)容之一,是指利用統(tǒng)計(jì)表、統(tǒng)計(jì)圖等方法,對資料的數(shù)量特征及分布規(guī)律進(jìn)行測定和描述,從而把數(shù)據(jù)資料的特征準(zhǔn)確地展現(xiàn)出來。不同類型資料常見的統(tǒng)計(jì)描述方法在后面的講座中都會具體講到。2統(tǒng)計(jì)推斷:統(tǒng)計(jì)推斷是在一定置信程度下,根據(jù)樣本資料的特征,對總體的特征做出估計(jì)和預(yù)測的方法。統(tǒng)計(jì)推斷是現(xiàn)代統(tǒng)計(jì)學(xué)的基本方法,在統(tǒng)計(jì)研究中得到了極為廣泛的應(yīng)用,它既可以用于對總體參數(shù)的估計(jì),也可以用作對總體某些分布特

30、征(包括分布差異、關(guān)聯(lián)性、預(yù)測的效果、模型擬合程度等方面)的假設(shè)檢驗(yàn)。3分析思路:當(dāng)獲得一批健康管理數(shù)據(jù)后,如何進(jìn)行分析?可能很多讀者會陷于迷茫,大家可以按照如下的路徑思想選擇合適的分析方法。路徑主要考慮以下幾個方面,反應(yīng)變量類型,是定量變量還是定性變量,又或者是等級變量?處理因素多少,是單因素試驗(yàn)還是多因素試驗(yàn)(3個及以上因素)?設(shè)計(jì)類型,是完全隨機(jī)還是隨機(jī)區(qū)組,或是拉丁方等試驗(yàn)類型?處理的組別,單樣本、兩樣本或者是多樣本比較?檢驗(yàn)方法的前提條件,資料的分布類型,樣本量大小等。下面分別從單變量計(jì)量資料、單變量計(jì)數(shù)資料、單變量等級資料、雙(多)變量資料所對應(yīng)的常用統(tǒng)計(jì)方法進(jìn)行概述,采用流程圖的

31、方式,希望讀者在應(yīng)用時能夠按圖索驥。具體的每個方法在應(yīng)用時應(yīng)該注意哪些事項(xiàng)以及統(tǒng)計(jì)分析是如何實(shí)現(xiàn)的,將在后面章節(jié)中詳細(xì)介紹。單變量計(jì)量資料分析路徑圖:對于單變量計(jì)量資料,首先考慮處理的組別,是樣本與總體比較,還是兩樣本比較,又或者是多樣本的比較?在樣本與總體比較中,我們要考慮數(shù)據(jù)的分布類型,是正態(tài)或是非正態(tài),從而采用不同的分析方法;在兩樣本比較中,考慮資料是否是配對資料,再考慮資料(配對研究中差值)的分布類型,同時要考慮方差齊性問題,從而決定不同的分析方法;在多樣本比較中,要先考慮設(shè)計(jì)類型,是完全隨機(jī)設(shè)計(jì)還是隨機(jī)區(qū)組設(shè)計(jì)、重復(fù)測量設(shè)計(jì)還是兩兩比較?再考慮數(shù)據(jù)的分布類型和方差齊性問題,最終確定分

32、析方法。 HYPERLINK javascript:void(0) t _blank 圖3列出了單變量計(jì)量資料的分析路徑供讀者參考。圖3單變量計(jì)量資料的分析路徑圖單變量計(jì)數(shù)資料的分析路徑圖:單變量計(jì)數(shù)資料分析方法的選擇往往和結(jié)局指標(biāo)有關(guān),所以,先考慮結(jié)局指標(biāo)的類型,是2個率的比較還是RC表的形式,或者是分層計(jì)數(shù)資料?2個率的比較中,是總體與樣本之間率的比較還是兩樣本間率的比較?兩樣本間率的比較時,還要考慮兩樣本是配對資料還是非配對資料。RC表形式的資料分析要先考慮表的橫縱指標(biāo)是雙向無序、單向有序還是雙向有序的,再考慮樣本間的關(guān)系,從而使用合適的分析方法, HYPERLINK javascrip

33、t:void(0) t _blank 圖4列出了單變量計(jì)數(shù)資料的分析路徑圖供讀者參考。圖4單變量計(jì)數(shù)資料的分析路徑圖單變量等級資料的分析路徑圖:首先考慮是2組比較或是多組(3組及以上)間進(jìn)行比較,2組比較中,考慮是配對或是非配對資料;多組比較中,根據(jù)設(shè)計(jì)類型(完全隨機(jī)設(shè)計(jì)或是隨機(jī)區(qū)組設(shè)計(jì))選擇分析方法。 HYPERLINK javascript:void(0) t _blank 圖5列出了單變量等級資料的分析思路供讀者參考。圖5單變量等級資料的分析路徑圖雙(多)變量資料的分析路徑圖:雙變量資料分析中,考慮2個變量的關(guān)系,是線性關(guān)系還是曲線關(guān)系。線性關(guān)系中,又分為線性相關(guān)和線性回歸,再考慮2個變

34、量的分布類型決定使用哪種分析方法。多變量資料分析中,考慮因變量與多個自變量間的關(guān)系,若應(yīng)變量Y為數(shù)值型隨機(jī)變量,且服從正態(tài)分布,自變量滿足多元正態(tài)分布,可選多元回歸分析或多元逐步回歸分析。若因變量Y為分類變量(二分類或多分類),且以判別分類為主要目的,自變量滿足多元正態(tài)分布,可選判別分析或逐步判別分析。若因變量Y為生存時間,并含有截尾數(shù)據(jù),可選Cox模型做生存分析。若因變量Y為二分類變量或多分類變量,且以分析危險(xiǎn)因素為主要目的,如果為配比設(shè)計(jì),使用條件Logistic回歸;如果無配比設(shè)計(jì),使用非條件Logistic回歸。 HYPERLINK javascript:void(0) t _blan

35、k 圖6列出了雙(多)變量資料的分析思路供讀者參考。對于多變量資料,還可以進(jìn)行聚類分析,將變量或觀察單位劃分為性質(zhì)相近的k類;主成分分析,尋找綜合指標(biāo);因子分析,尋找潛變量;典型相關(guān)分析,尋找兩組變量之間的相關(guān)。圖6雙(多)變量資料的分析路徑圖五、統(tǒng)計(jì)學(xué)應(yīng)用注意事項(xiàng)1在統(tǒng)計(jì)學(xué)學(xué)習(xí)和應(yīng)用過程中樹立路徑依賴的思維。醫(yī)學(xué)統(tǒng)計(jì)學(xué)是一門應(yīng)用性和實(shí)踐性很強(qiáng)學(xué)科,對于初學(xué)統(tǒng)計(jì)學(xué)讀者來說,大家可能比較畏懼復(fù)雜的推理和計(jì)算,實(shí)際上在學(xué)習(xí)和實(shí)踐過程中,只要能夠熟練掌握健康管理科研課題的設(shè)計(jì)目的、資料類型、處理因素?cái)?shù)量以及每個檢驗(yàn)方法使用的前提條件,借助于上文總結(jié)的方法路徑圖示,再依靠現(xiàn)在強(qiáng)大的互聯(lián)網(wǎng)查詢技術(shù),就可以很好地實(shí)現(xiàn)統(tǒng)計(jì)分析的目的。2統(tǒng)計(jì)分析一定要服從和服務(wù)于專業(yè)設(shè)計(jì)。統(tǒng)計(jì)學(xué)既是指導(dǎo)數(shù)據(jù)收集和分析的指導(dǎo)思想,更是服務(wù)于專業(yè)要求的應(yīng)用工具。很多讀者把統(tǒng)計(jì)學(xué)和流行病學(xué)混為一談,要知道統(tǒng)計(jì)學(xué)關(guān)聯(lián)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論