科研設計與統(tǒng)計常見錯誤解析_第1頁
科研設計與統(tǒng)計常見錯誤解析_第2頁
科研設計與統(tǒng)計常見錯誤解析_第3頁
科研設計與統(tǒng)計常見錯誤解析_第4頁
科研設計與統(tǒng)計常見錯誤解析_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、中日友好醫(yī)院中日友好醫(yī)院 李光偉李光偉臨床科研系指以病人為研究對象的醫(yī)學科學研究其目的是為了提高診斷水平和治療效果,改善預后和對疾病病因做宏觀研究。選題是臨床科研的起點體現(xiàn)科研設計和實施的指導思想影響臨床科研工作的全過程因此在科研過程中自始至終處于主導地位。從這個角度來說,選題比科研方法更重要。選題就是要正確地發(fā)現(xiàn)和提出問題 這些問題有的來自于臨床實踐 有的來自文獻資料所謂正確就是這些提出的問題要符合科學的認識規(guī)律提出新問題、新假設比完成一項科研工作更難沒有好的科研假設,再好的科研方法也不會有好的科研成果。 醫(yī)生的共識-冠心病來自已知危險因素。但是無已知危險因素的人為什么發(fā)生冠心病?冠心病人群

2、血同型半胱氨酸水平顯著升高,那末同性半胱氨酸是否是冠心病新的危險因素?使之下降發(fā)生冠心病危險是否會下降?選題-同型半胱氨酸是否是冠心病新的危險因素? l 首先是研究的問題要涉及我國的常見病、多發(fā)病、危害人民健康較嚴重的疾病。l 第二個原則是所選的課題要有創(chuàng)造性和先進性,要選擇前人沒有解決或沒有完全解決的問題。研究的結(jié)果應該是前人不明了或不完全明了的。 開拓性(獨創(chuàng)性)研究最有價值。 發(fā)展性研究,爭鳴性研究也有一定的價值 沒有探索性,缺乏創(chuàng)造性,只是重復前人做過 的工作,不能算作好的科研。 選題必須具有科學性。所提出的新問題、新假設、新思路必須要符合客觀規(guī)律。臨床實踐是臨床科研選題的源泉:在日常

3、臨床實踐中,人們無時無刻不面臨著許多診斷、治療、病因和預后估計等問題,診斷方法和治療措施有待于科學的系統(tǒng)評價,這些課題其中不少可能具有較高的研究價值 臨床醫(yī)學已發(fā)展成為一門綜合性的學科,不僅涉及生物醫(yī)學,而且涉及臨床經(jīng)濟學和醫(yī)學社會等,這一方面有許多有待研究的臨床問題。 l 最后一個原則是可行性,指研究課題主要技術指標實現(xiàn)的可能性。 選題時必須考慮完成課題的條件,包括人力、物力等,如果這些條件不能滿足或根本沒有條件,即使所選課題有創(chuàng)造性、科學性又具有臨床價值,也無望于成功。 臨床科研選題時應注意幾點:l前沿,新穎,最好實用(近5-10年有無類似 工作,或存在某些問題)l涉及人群健康的重大問題(

4、發(fā)病危險因素,提出新的診斷方法)l建立新實驗方法(提供研究新手段)l確定新藥療效及副作用科研設計是科研的靈魂嚴密的設計是取得有價值結(jié)果的先決條件從這個意義上說沒有“設計”就沒有科研。 不少回顧性分析,內(nèi)容包羅萬象,是研究無主題的反映:研究者在研究之初對研究要解決的問題即主攻方向心中無數(shù),對研究所報的態(tài)度是逮著什么算什么,并不是想通過研究解決某一特定的問題,或不知道通過研究能解決什么問題。 這些研究缺乏嚴格的設計或無設計,這類研究即使有重要的發(fā)現(xiàn)也屬偶然。 “前瞻性”研究,無前瞻性的設計 幾年前做了幾萬人的糖尿病普查,發(fā)現(xiàn)了400例糖尿病和500例糖耐量低減,幾年后的今天忽然想起這些病例很可能出

5、一篇文章,于是又去調(diào)查了一番,找到了200例糖尿病和300例糖耐量低減。 寫出 1.糖尿病人冠心病危險因素分析糖尿病人冠心病危險因素分析 2.高危人群糖尿病的危險因素高危人群糖尿病的危險因素. 這種研究是殘缺不全的隨訪,并不是前瞻性研究,缺點是難以彌補的。 高達50%的失訪率會造成嚴重的信息偏差(information Bias): 若是有問題的人召之即來,則發(fā)病率會被高估; 若嚴重者已去醫(yī)院看病不來參加,來的只有輕的病人,則會低估疾病的發(fā)病率。例如糖尿病人群中有許多人合并了高血壓、高血脂病不少人已用藥物治療治療中有的長期堅持用藥,有人僅偶爾用藥有人血壓或血脂一直控制很好,有些人時好時差 此時

6、不論以隨訪的血壓、血脂指標,還是以末次隨訪的指標分析,都不能反映干預對疾病的影響。 這些重要混雜因素的干擾,分析的結(jié)果常會遠離實際情況. 有些研究者為了某種原因,希望盡早發(fā)表自己研究的結(jié)果,僅隨訪極短的時間(半年或一年),僅有幾個或十幾個終點事件(如死亡)就進行多因素分析,尋找危險因素。 終點事件過少的這種分析看上去可能條條是道,但其結(jié)果往往是不可靠的。應延長隨訪時間,增加終點事件后再分析 Navigntor研究設計出現(xiàn)1000個終點事體時才結(jié)題。為保證科研的成功,一個完整的科研設計應包括以下幾項內(nèi)容:l有理論或?qū)嵱脙r值的選題l選擇合適的研究對象l制定可靠的測量指標l選擇科學的統(tǒng)計分析方法若能

7、對結(jié)果做恰當?shù)拿枋?,則會得出符合實際的結(jié)論。 隨機化分組在大多數(shù)情況下十分重要,但隨機化并非總是有利的和有道理的。在某些情況下有比隨機化更重要的東西那就是要滿足適應癥的要求。適應癥不合理,隨機化反使結(jié)果變糟。 19世紀70年代結(jié)論:雌激素加孕激素能有效緩解更年期癥狀,治療泌尿生殖道萎縮,防止骨質(zhì)疏松。但不會增加子宮內(nèi)膜癌危險。WHI(大規(guī)模,多中心,(大規(guī)模,多中心,隨機對照隨機對照)結(jié)論:雌激素孕激素聯(lián)合治療不宜用于絕經(jīng)后婦女心血管疾病預防,預防骨質(zhì)疏松時應考慮乳腺及心血管病風險。乳腺及心血管病風險。弊多利少!心臟事件心臟事件 29%,卒中 41%,乳腺癌乳腺癌 26%,結(jié)腸癌 37%,髖骨

8、骨折 34%l 忽略了HRT最明顯的益處:(緩解更年期癥狀,治療泌尿生殖道萎縮,防止骨質(zhì)疏松)l沒有遵照處方藥應該嚴格掌握適應癥的原則(性激素低下 而非所有老年婦女,更不是健康老年婦女。該研究中80%以上是沒有絕經(jīng)期癥狀的老年婦女。不具有HRT適應癥l結(jié)論不應隨意擴大(品種,劑量,種族)l與某些風險相比WHI所闡明的HRT對各種事件的絕對風險是 很低的 要想證實研究者的思想,確定入選和排除標準,選擇合理的研究對象是關鍵的一環(huán)。l 1. 研究對象要有代表性l 做疾病患病率的調(diào)查,隨機化的原做疾病患病率的調(diào)查,隨機化的原則可保證研究樣本是總體人群的則可保證研究樣本是總體人群的“縮影縮影”,從而避免

9、結(jié)果失真。從而避免結(jié)果失真。l 從某一局部地區(qū)從某一局部地區(qū)“整體人體整體人體”調(diào)查出調(diào)查出的的“率率”如推廣到普遍認群,應說明該局部如推廣到普遍認群,應說明該局部的的“整體整體”人群與全局的人群結(jié)構(gòu)相似。人群與全局的人群結(jié)構(gòu)相似。l l 1. 研究對象要有代表性l 隨機化抽樣的缺點是研究對象地域較為分隨機化抽樣的缺點是研究對象地域較為分散,每個單位僅有少量病例,這散,每個單位僅有少量病例,這對于干預治療的對于干預治療的前瞻性研究的病人管理極為不利前瞻性研究的病人管理極為不利,耗費更多人力,耗費更多人力,常使研究無法進行。常使研究無法進行。l 而在人群較多的社區(qū)進行而在人群較多的社區(qū)進行“整群

10、整群”調(diào)查,調(diào)查,會在相對較小的地域找到較大樣本,從而有利干會在相對較小的地域找到較大樣本,從而有利干預治療的管理。如果其人群結(jié)構(gòu)接近全局的人群,預治療的管理。如果其人群結(jié)構(gòu)接近全局的人群,其統(tǒng)計的其統(tǒng)計的“率率”也有重要參考價值也有重要參考價值。例1, 看生長激素水平與身高的關系: 對2574歲者測GH與身高 結(jié)果發(fā)現(xiàn)GH與身高不相關 結(jié)論肯定錯了 因為GH的最重要作用在于促生長 原因是人群選擇失當 GH促生長表現(xiàn)在身高增長期,即兒童期 成人身高已不再增高。 研究肥胖與糖尿病的關系 不能僅選擇僅選擇超重和肥胖的人群(BMI 25-30) 因為(BMI 25-27) 與(BMI 27-30)的

11、人群糖尿病的患病率可能無明顯差別, 但與BMI24人群差別會很顯著 變量的梯度是成功的關鍵。 恰當?shù)娜脒x和排除標準可防止混雜因素的干擾,保證研究結(jié)果的科學性,這是在各項研究遵守的。 例如,看血壓與胰島關系,不可納入有心功障礙及腎病患者,否則可結(jié)果會有偏差。 入組的研究對象的準入指標,是保證研究質(zhì)量的最重要和最基本的條件,在研究設計和發(fā)表的論著中務必詳細交代。 但這種選入排除標準應是實事求是的而不是過于苛求。 在制訂納入和排除標準時,在保證研究質(zhì)量的前題下,一定要考慮研究成果的代表性和研究結(jié)果推廣的受益面。例:有一重點課題僅考慮入組病例診斷的嚴格性 排除標準竟設計了17項 合格的納入對象約占整個

12、患該病人群的合格的納入對象約占整個患該病人群的10%左右左右 90%左右的患者被排除掉。即使該研究的結(jié)果有高度的內(nèi)在真實性(internal validity),其代表性也僅為10%左右。 過度嚴格的選擇會有輕型病人被排除,使研究結(jié)果出現(xiàn)偏差。例:冠心病與胰島素的關系僅用冠脈造影資料作為診斷標準結(jié)果發(fā)現(xiàn)冠脈造影(-)者:FINS 22 mm/ml冠脈造影(+)者:FINS 23 mm/ml結(jié)論是冠心病與胰島素無關問題出在什么地方? 問題出在“診斷標準”: 冠脈造影(-)的人為什么能接受這種不無危險的檢查? 因為這些人已有許多危險因素! 或有輕度狹窄但達不到“狹窄的定義”的切點 沒達到“狹窄”切

13、點, 只是時間尚短。 這并不能說明胰島素與冠心病無關。 對測量的方法和指標的要求 敏感性要好:對于治療出現(xiàn)的客觀反應,要能敏感地發(fā)現(xiàn)并能量度,其敏感性越高越好; l關聯(lián)性:指標與研究目的有本質(zhì)的聯(lián)系,應能確切反映處理因素的作用。 生物學意義合理:冠脈造影,HbA1c看降糖藥物療效。l靈敏性:指標能正確反映效應變化的最小數(shù)量或最小水平 。l特異性:對治療反應的陽性結(jié)果要能準確地測量和確定,其特異性越強越好;盡量選用客觀指標作為主要觀察指標。l精確性:包含準確度(效度)和精密度(信度)兩個方面。l穩(wěn)定性:變異程度l經(jīng)濟可行:在考慮敏感性和特異性的基礎上,應從各種方法比較中,選擇經(jīng)濟及可行性良好的測

14、試方法和指標。l指標的選擇要少而精 在我國臨床科研的統(tǒng)計學應用中,在統(tǒng)計方法的選擇上存在過分強調(diào)統(tǒng)計檢驗而忽略統(tǒng)計學估計的傾向,存在統(tǒng)計方法越復雜越好的片面看法。 在發(fā)表的醫(yī)學論文中,大多強調(diào)是否得到差別有統(tǒng)計學意義,而較少對測定值進行95%可信區(qū)間估計,提及樣本量估計及抽樣方法、樣本代表性問題的文章就更少了 在80年代初期,國外醫(yī)學雜志針對類似的情況曾進行廣泛的討論,提出應重視區(qū)間估計的意義而不能將注意力集中在P值是否小于0.05上。 現(xiàn)在大多數(shù)的國際醫(yī)學刊物發(fā)表的論文中要求作者同時給出點估計、區(qū)間估計和具體的檢驗統(tǒng)計值,如相對危險度(Relative Risk , RR, RR值就是暴露人

15、群發(fā)病機與非暴露人群發(fā)病機率之比,即a/(a+b)與c/(c+b)之比),RR的95%可信限和P值。諸如95%可信限的區(qū)間估計可以提供更多有價值的信息 但在我國臨床科研的統(tǒng)計學應用中尚未引起足夠的重視。片面地認為越復雜的統(tǒng)計方法越好,而忽視統(tǒng)計檢驗方法的適用性和恰當性。 (1)、描述性統(tǒng)計 描述性統(tǒng)計分析是統(tǒng)計檢驗的基礎,能提供資料的總體特征,不論在最后的論文報告中描述性統(tǒng)計分析的結(jié)果占多大的比重,它都是實際的資料分析過程中的起點 它為選擇進一步的分析方法如選擇合理的變量提供重要的信息, 發(fā)現(xiàn)原始資料中的錯誤忽略必須的描述性統(tǒng)計分析是導致統(tǒng)計方法應用不當?shù)脑颉?從簡單到復雜 最基本的分析形式

16、為單個因素的不匹配不分層資料組間比較的分析 這是病例對照研究推斷性統(tǒng)計的基礎??杀容^病例組與對照之間危險因素的分布情況,分析其危險因素與患病之間的聯(lián)系。 由于病例和對照只是總體的代表, 無法直接計算真實的患病率,也就無法直接計算RR值,可以估計相對危險度OR,用以來代替RR。 變量的確定: 研究的目的是相看哪兩個變量之間的關系(不妨假設一因,一果) 例 ;高血壓為因,冠心病為果 重點和首要的看變量是否為正態(tài)分布分析中對變量進行正態(tài)分布檢驗 血胰島素、血脂、生長激素、皮質(zhì)醇、尿微量白蛋白,骨密度等都常為非正態(tài)分布。 非正態(tài)分布的變量是不能以原始資料進行參數(shù)統(tǒng)計分析,此時不進行正態(tài)化處理,得出結(jié)論

17、會面目全非。 1.首先可根據(jù)自己對所研究領域?qū)I(yè)知識的了解初步選擇 例: 對氧磷脂酶基因多態(tài)性與糖尿病人群合并冠心病的關系 對照組 糖尿病組 糖尿病組+冠心病組病例數(shù) 38 36 39 男/女 29/9 24/12 36/3 年齡 70.8+10.8 64.8+11.9 72.7+8.3高血壓(有/無) 30/8 19/17 17/22 BMI 23.86+3.41 24.96+3.14 25.29+2.56? DM病程 0 ? ? 服藥 0 ? ?PON-192 BB 13.2% 11.1% 30.8% 年齡是必須調(diào)整的混雜因素2. 然后加入文獻中同類研究必須納入的變量3.應用逐步回歸分析也

18、會發(fā)現(xiàn)哪些變量應該選入。 有些研究在分析中囊括全部已測變量來做多因素步回歸分析,或以為計算機挑出的變量就是最佳變量,是一種誤解。 計算機挑出的變量受許多因素的影響,有些未被計算計挑出的變量有時非常重要(如年齡、性別), 所選變量中若不含有這些變量,分析結(jié)果可能不會被承認。 將本應作為連續(xù)變量的參數(shù)改為等級變量有時會丟掉許多有用的信息。 決定哪些變量應作為連續(xù)變量,哪些變量應作為等級變量應由其與因變量線性相關(pearson)及等級相關(spearman)的結(jié)果來決定,線性相關優(yōu)于等級相關的變量不應以等級變量進入分析。pearson 相關優(yōu)于spearman 相關用連續(xù)變量較合理。spearma

19、n 相關優(yōu)于Pearson相關用分組變量較合理。 入選變量并非入選變量的數(shù)目越多研究越嚴密, 總的自變量數(shù)應由樣本數(shù)決定(1:10),(對于多因素設計,觀測變量數(shù)為樣本例數(shù)的1/5-1/10)。 一些作者在分析中自變量的選擇目的不明,一共有100個病例,每人有30個變量,就將30個變量都用作為自變量,以為自變量越多,分析水平越高。 注意變量間相互關系l作者應十分明確所研究的兩個主要變量的關系l 將可能的混雜因素作為協(xié)變量放入模型l 選入過多變量畫蛇添足,徒勞無益,甚至有害 選入過多的協(xié)變量統(tǒng)計學上稱為“過度調(diào)整”,這種調(diào) 整常常掩蓋有意義的關聯(lián)。 作為一個原則,多因素分析中,如不是為什么特殊目

20、的,不宜將兩個密切相關的變量放入一個方程進行分析過度調(diào)整常會丟失一些有價值的信息。多因素分析模式的選擇取決于 研究的性質(zhì):現(xiàn)狀研究可選用線性回歸和Logistic回歸,前瞻性研究選用成比例風險模型或Logistic回歸 因變量的性質(zhì):因變量為連續(xù)變量選用線性回歸,因度量為分組變量(0,1)選Logistic回歸或成比例風險模型。 一般說來前瞻性研究的成比例風險模型更為優(yōu)越。 應以審視的眼光看待統(tǒng)計分析的結(jié)果: 為什麼? 因為人們常犯下述錯誤l先入為主的一個想法(自己創(chuàng)造的,或別人特別是外國人發(fā)表的);l在最容易取材的環(huán)境中收集病例(常常數(shù)量不多,不管或不知有多少因素干擾);l統(tǒng)計分析t檢驗“定

21、終身”,lP0.05就皆大歡喜。 這些研究在做統(tǒng)計學分析時常常是在 搞“逼、供、信”:l強制一個不適當?shù)娜巳鹤鰹檠芯繉ο髄強加給一個不適當?shù)姆治龇椒╨逼出一個結(jié)果并對之深信不疑 這些研究是垃圾文章的制造廠。 在進行研究和閱讀文獻時應物別注意P值的大小。但是,P值并沒有告訴我們這一性狀出現(xiàn)的頻率或水平的大小和方向 要了解這些信息必須依靠基本統(tǒng)計量基本統(tǒng)計量包括率、均數(shù)、標準差等。 比較兩組(或多組)的率或均數(shù)可以了解該性狀在組間分布的差異有多大及其變化的方向。在此基礎上,結(jié)合統(tǒng)計檢驗的P值和專業(yè)知識下結(jié)論。 在分析評價研究結(jié)果時P值和基本統(tǒng)計量都是非常重要的,缺一不可。 觀察對象的數(shù)量較少時,基本統(tǒng)計量的差別可能很大而P值大于0.05,此時應注意其專業(yè)意義。 如果這種差別在專業(yè)上已非常重要,應考慮繼續(xù)擴大樣本量,直至隨機發(fā)生這種差別的機率小于5%。 當基本統(tǒng)計量的差別較小而觀察對象的數(shù)量很大時,往往發(fā)現(xiàn)組間差異有顯著性,此時應特別注意組間差別在專業(yè)上有無意義 如果這種差異在專業(yè)上并無重要意義,即使P值小于0.05,我們也認為其并無重要的意義命題 進行科學研究的重要目的之一就是探求某件事是否是發(fā)生的另一件事的結(jié)果.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論