醫(yī)學雜志論文中常見的統(tǒng)計學錯誤分析及對策PPT精選文檔_第1頁
醫(yī)學雜志論文中常見的統(tǒng)計學錯誤分析及對策PPT精選文檔_第2頁
醫(yī)學雜志論文中常見的統(tǒng)計學錯誤分析及對策PPT精選文檔_第3頁
醫(yī)學雜志論文中常見的統(tǒng)計學錯誤分析及對策PPT精選文檔_第4頁
醫(yī)學雜志論文中常見的統(tǒng)計學錯誤分析及對策PPT精選文檔_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、1醫(yī)學雜志論文中常見的統(tǒng)計學錯誤及對策醫(yī)學雜志論文中常見的統(tǒng)計學錯誤及對策同濟大學醫(yī)學院同濟大學醫(yī)學院 醫(yī)學統(tǒng)計學教研室醫(yī)學統(tǒng)計學教研室 艾自勝艾自勝2014-9-282內(nèi)容內(nèi)容n(1)描述性分析中的常見錯誤)描述性分析中的常見錯誤n(2)假設檢驗中常見的統(tǒng)計學方法選擇)假設檢驗中常見的統(tǒng)計學方法選擇錯誤錯誤n(3)研究設計中的常見錯誤)研究設計中的常見錯誤n(4)糾正錯誤的對策)糾正錯誤的對策3描述性分析中的常見錯誤描述性分析中的常見錯誤 在醫(yī)學論文中在醫(yī)學論文中, ,對不同類型的研究資料需要用不對不同類型的研究資料需要用不同的統(tǒng)計指標進行描述。實際工作中統(tǒng)計指標選擇同的統(tǒng)計指標進行描述。實

2、際工作中統(tǒng)計指標選擇常見的問題有常見的問題有: : 計量資料無論是否服從正態(tài)分布計量資料無論是否服從正態(tài)分布, ,統(tǒng)統(tǒng)用均數(shù)統(tǒng)統(tǒng)用均數(shù)標準差描述研究結(jié)果的數(shù)據(jù)特征標準差描述研究結(jié)果的數(shù)據(jù)特征; ; 計數(shù)資料混淆率和構(gòu)成比計數(shù)資料混淆率和構(gòu)成比( (百分比百分比) )的概念的概念, ,常將常將構(gòu)成比誤用為率來說明事物發(fā)生的強度構(gòu)成比誤用為率來說明事物發(fā)生的強度; ;率和構(gòu)成率和構(gòu)成比的分母太小比的分母太小, ,卻計算相對數(shù)來進行描述和比較。卻計算相對數(shù)來進行描述和比較。4計量資料描述常見錯誤分析計量資料描述常見錯誤分析(1)誤用正態(tài)分布的描述性統(tǒng)計指標描述呈偏態(tài)分布)誤用正態(tài)分布的描述性統(tǒng)計指標

3、描述呈偏態(tài)分布的資料的資料(標準差(標準差均數(shù)均數(shù) )仍采用)仍采用“ 均數(shù)均數(shù)標準差標準差”表表示,特別當表中采用標準誤示,特別當表中采用標準誤 取代標準差取代標準差s時,前述的錯時,前述的錯誤很難被察覺出來誤很難被察覺出來 ; (2)統(tǒng)計圖方面的主要錯誤有兩個,其一,橫坐標軸上統(tǒng)計圖方面的主要錯誤有兩個,其一,橫坐標軸上的刻度值不準確,等長的間隔代表的數(shù)量不等;在直的刻度值不準確,等長的間隔代表的數(shù)量不等;在直角坐標系中,從任何一個數(shù)值開始作為橫軸或縱軸上角坐標系中,從任何一個數(shù)值開始作為橫軸或縱軸上的第一個刻度值。其二,的第一個刻度值。其二,用條圖或復式條圖表達連用條圖或復式條圖表達連續(xù)

4、性變量的變化趨勢;續(xù)性變量的變化趨勢;5(3)統(tǒng)計表中數(shù)據(jù)的含義未表達清楚,令人費解;統(tǒng)計表中數(shù)據(jù)的含義未表達清楚,令人費解; (4)運用相對數(shù)時,混淆運用相對數(shù)時,混淆“百分比百分比”與與“百分率百分率”; 6計量資料的案例一計量資料的案例一7計量資料的案例一的分析與對策計量資料的案例一的分析與對策 各項指標的均數(shù)均大于各項指標的均數(shù)均大于2倍標準差倍標準差, 說明資說明資料為偏態(tài)分布料為偏態(tài)分布, 用均數(shù)、標準差描述資料的集中用均數(shù)、標準差描述資料的集中趨勢和離散程度顯然是不妥當?shù)内厔莺碗x散程度顯然是不妥當?shù)? 案例一中只列出案例一中只列出P 值值, 也未說明具體的統(tǒng)計學也未說明具體的統(tǒng)計

5、學方法。方法。 正確的做法應用中位數(shù)描述集中趨勢正確的做法應用中位數(shù)描述集中趨勢, 用四用四分位數(shù)間距表示離散程度?;蛘呤菍⒃紨?shù)值分位數(shù)間距表示離散程度?;蛘呤菍⒃紨?shù)值經(jīng)對數(shù)等轉(zhuǎn)換后經(jīng)對數(shù)等轉(zhuǎn)換后, 再計算轉(zhuǎn)換值的平均數(shù)和標準再計算轉(zhuǎn)換值的平均數(shù)和標準差差, 同時在表格中應該列出具體的統(tǒng)計量及同時在表格中應該列出具體的統(tǒng)計量及P 值值。8計數(shù)資料描述性分析中的常見錯誤計數(shù)資料描述性分析中的常見錯誤(1)錯誤地將構(gòu)成比當作率使用)錯誤地將構(gòu)成比當作率使用(2)錯誤地計算平均率)錯誤地計算平均率(3)計算相對數(shù)時分母過?。┯嬎阆鄬?shù)時分母過小9計數(shù)資料的案例一計數(shù)資料的案例一10計數(shù)資料的案例

6、一的分析與對策計數(shù)資料的案例一的分析與對策 研究者對計數(shù)資料的案例一資料進行分析研究者對計數(shù)資料的案例一資料進行分析, , 認為認為“輪狀病毒腹瀉的發(fā)病率最高為輪狀病毒腹瀉的發(fā)病率最高為43.1%,43.1%,痢痢疾次之疾次之28. 8%, 28. 8%, 傷寒最低為傷寒最低為13. 1%13. 1%” 。這是將這是將構(gòu)成比當作發(fā)病率使用的典型錯誤構(gòu)成比當作發(fā)病率使用的典型錯誤, , 是臨床科是臨床科研中最常見的錯誤之一。研中最常見的錯誤之一。 11實際上表中所提供的信息實際上表中所提供的信息, 只能用來說明在只能用來說明在該腹瀉門診就診的該腹瀉門診就診的521例病人中例病人中, 各種腹瀉各種

7、腹瀉病人所占的比重病人所占的比重, 并不能反映出各自發(fā)病率并不能反映出各自發(fā)病率的高低的高低, 而且計數(shù)資料的案例一所列的而且計數(shù)資料的案例一所列的% 號也未指明是構(gòu)成比還是發(fā)病率號也未指明是構(gòu)成比還是發(fā)病率, 容易引起容易引起歧義。正確的描述應該是在腹瀉門診病人歧義。正確的描述應該是在腹瀉門診病人中中, 輪狀病毒引起的腹瀉所占的比例最高輪狀病毒引起的腹瀉所占的比例最高, 傷寒最低。傷寒最低。12計數(shù)資料的案例二計數(shù)資料的案例二13計數(shù)資料的案例二的分析與對策計數(shù)資料的案例二的分析與對策 某研究者為了研究三種不同值班情況孕婦的早某研究者為了研究三種不同值班情況孕婦的早產(chǎn)發(fā)生情況產(chǎn)發(fā)生情況, ,

8、 作者在計算平均率時作者在計算平均率時, , 錯誤地將幾個率錯誤地將幾個率相加后取其平均值相加后取其平均值, , 這種類型的錯誤也是臨床科研這種類型的錯誤也是臨床科研論文中常見的錯誤之一。論文中常見的錯誤之一。 如計算如計算計數(shù)資料的案例二計數(shù)資料的案例二中三種值班女工的早中三種值班女工的早產(chǎn)的合計發(fā)生率產(chǎn)的合計發(fā)生率( ( 即平均率即平均率) )時時, , 以以( 2. 7+ 4. 8+ 10. 3) ( 2. 7+ 4. 8+ 10. 3) /3= 5. 9, /3= 5. 9, 即平均發(fā)生率為即平均發(fā)生率為5. 9%5. 9%。正確的算法是正確的算法是: ( 94 /1547) 100%

9、 = 6. 1%。14假設檢驗中常見的統(tǒng)計學方法選擇錯誤假設檢驗中常見的統(tǒng)計學方法選擇錯誤n定量資料進行假設檢驗的方法很多定量資料進行假設檢驗的方法很多, 其常其常見錯誤是見錯誤是: n(1)忽視)忽視t 檢驗和檢驗和F (方差分析方差分析) 檢驗的前檢驗的前提條件;提條件;n(2)誤用)誤用t檢驗代替檢驗代替F 檢驗;檢驗;n(3)誤用參數(shù)檢驗代替非參數(shù)檢驗;)誤用參數(shù)檢驗代替非參數(shù)檢驗;n(4)各種方差分析混用。)各種方差分析混用。15假設檢驗中常見的統(tǒng)計學方法選擇錯誤假設檢驗中常見的統(tǒng)計學方法選擇錯誤 計數(shù)資料統(tǒng)計分析的常見錯誤是:計數(shù)資料統(tǒng)計分析的常見錯誤是:(1 1)錯誤選擇了四格表

10、卡方檢驗方法)錯誤選擇了四格表卡方檢驗方法, , 未未選用選用FisherFisher精確檢驗;精確檢驗;(2 2)等級變量資料一律地使用卡方檢驗。)等級變量資料一律地使用卡方檢驗。16計量資料統(tǒng)計分析的常見錯誤計量資料統(tǒng)計分析的常見錯誤n(1)忽視了)忽視了t檢驗的使用條件;檢驗的使用條件;n(2)多個樣本均數(shù)比較錯誤地用多個)多個樣本均數(shù)比較錯誤地用多個t 檢驗代替方差分析;檢驗代替方差分析;n(3)誤用)誤用t檢驗分析重復測量設計資料檢驗分析重復測量設計資料17t檢驗的使用條件檢驗的使用條件 單樣本單樣本t檢驗的應用條件:樣本服從正檢驗的應用條件:樣本服從正態(tài)分布;態(tài)分布; 成組成組t檢

11、驗的應用條件:樣本服從正態(tài)分檢驗的應用條件:樣本服從正態(tài)分布布;兩樣本的總體方差相等即方差齊性。兩樣本的總體方差相等即方差齊性。 配對配對t檢驗的應用條件:差值服從正態(tài)分檢驗的應用條件:差值服從正態(tài)分布。布。18假設檢驗的案例一假設檢驗的案例一19假設檢驗的案例一的分析與對策假設檢驗的案例一的分析與對策這類錯誤是臨床醫(yī)學科研論文中定量資料這類錯誤是臨床醫(yī)學科研論文中定量資料分析中最常見的錯誤分析中最常見的錯誤, , 而且是原則性錯誤而且是原則性錯誤, , 會增加犯第一類錯誤的概率。假設檢驗的會增加犯第一類錯誤的概率。假設檢驗的案例一資料為不同年齡組不同性別基礎能案例一資料為不同年齡組不同性別基

12、礎能耗情況耗情況, , 原作者用原作者用t t檢驗分別對各組均數(shù)逐一檢驗分別對各組均數(shù)逐一進行比較進行比較, , 得出在男女研究對象青年組與中得出在男女研究對象青年組與中年、老年組的基礎能耗差異有顯著性。年、老年組的基礎能耗差異有顯著性。20假設檢驗的案例一的分析與對策假設檢驗的案例一的分析與對策 這種檢驗方法有誤這種檢驗方法有誤, 因為該資料為多組因為該資料為多組基本均數(shù)間的比較基本均數(shù)間的比較, 正確的方法是用單因素正確的方法是用單因素方差分析方差分析, 只有在方差分析有顯著性的基礎只有在方差分析有顯著性的基礎上有必要再作均數(shù)間的兩兩比較上有必要再作均數(shù)間的兩兩比較, 用用q檢驗檢驗, 而

13、不是而不是t檢驗檢驗, 同時假設檢驗的案例一中應該同時假設檢驗的案例一中應該列出方差分析的統(tǒng)計量列出方差分析的統(tǒng)計量F值及具體的值及具體的P值。值。21假設檢驗的案例二假設檢驗的案例二22假設檢驗的案例二的分析與對策假設檢驗的案例二的分析與對策重復測量數(shù)據(jù)是指同一受試對象的同一指標重復測量數(shù)據(jù)是指同一受試對象的同一指標在不同時間點上進行多次測量所獲得的資料在不同時間點上進行多次測量所獲得的資料, , 常用來分析某項觀察指標在不同時間點上的常用來分析某項觀察指標在不同時間點上的變化特點變化特點, , 這類資料在臨床試驗中較為常見。這類資料在臨床試驗中較為常見。本案例是兩種不同處理方案對病人血漿本

14、案例是兩種不同處理方案對病人血漿ET ET 濃濃度度( pg /m l)( pg /m l)變化比較變化比較, , 分別在麻醉前、術畢、分別在麻醉前、術畢、術后術后24 h24 h、術后、術后48 h48 h測量病人血漿測量病人血漿ETET濃度濃度, , 觀觀察兩種處理方案對病人血漿察兩種處理方案對病人血漿ETET濃度的影響及濃度的影響及變化趨勢。變化趨勢。23假設檢驗的案例二的分析與對策假設檢驗的案例二的分析與對策 原文作者用配對比較原文作者用配對比較t t檢驗對不同時間兩個處檢驗對不同時間兩個處理方式血漿理方式血漿ETET濃度的差異進行檢驗濃度的差異進行檢驗, , 發(fā)現(xiàn)有統(tǒng)計發(fā)現(xiàn)有統(tǒng)計學差

15、異學差異, , 并認為并認為A A 組術后組術后ETET濃度相對穩(wěn)定濃度相對穩(wěn)定, , 術后術后無明顯升高。我們認為資料的統(tǒng)計處理不恰當無明顯升高。我們認為資料的統(tǒng)計處理不恰當, , 因為這時一個典型的重復測量的多個樣本均數(shù)因為這時一個典型的重復測量的多個樣本均數(shù)的比較的比較, , 故應該采用重復測量方差分析檢驗不同故應該采用重復測量方差分析檢驗不同處理組間和時間因素及處理因素與時間的交互處理組間和時間因素及處理因素與時間的交互效應是否具有統(tǒng)計學意義效應是否具有統(tǒng)計學意義, , 如果差異有顯著性如果差異有顯著性, , 然后再作兩均數(shù)間的兩兩比較。然后再作兩均數(shù)間的兩兩比較。24假設檢驗的案例三

16、假設檢驗的案例三25假設檢驗的案例三的分析與對策假設檢驗的案例三的分析與對策 本案例反映不同分娩方式重癥肝炎孕婦本案例反映不同分娩方式重癥肝炎孕婦結(jié)局的比較。結(jié)局的比較。 原作者使用一般四格表卡方檢驗原作者使用一般四格表卡方檢驗, 得得: 卡卡方值方值= 7. 24, P = 0. 007; 但觀察了但觀察了22例例, 總例總例數(shù)小于數(shù)小于40, 不適合使用一般卡方檢驗。應用不適合使用一般卡方檢驗。應用Fisher精確概率檢驗法。精確概率檢驗法。26假設檢驗的案例三的分析與對策假設檢驗的案例三的分析與對策本例正確的計算結(jié)果為本例正確的計算結(jié)果為P = 0. 011(雙側(cè)概率雙側(cè)概率)。很多分析

17、人員認為兩種方法分析的結(jié)果都是認很多分析人員認為兩種方法分析的結(jié)果都是認為不同分娩方式重癥肝炎孕婦結(jié)局有差別為不同分娩方式重癥肝炎孕婦結(jié)局有差別, 但但統(tǒng)計學意義是不一樣的統(tǒng)計學意義是不一樣的, 因為因為P 值大小不一樣值大小不一樣, 拒絕和不拒絕無效假設的概率是不一樣的。拒絕和不拒絕無效假設的概率是不一樣的。27假設檢驗的案例四假設檢驗的案例四28假設檢驗的案例四的分析與對策假設檢驗的案例四的分析與對策 本文作者將資料中三個等級中的本文作者將資料中三個等級中的“有效有效”和和“顯效顯效”合并合并, 使之成為二分變量。然后使之成為二分變量。然后, 用用四格表卡方檢驗四格表卡方檢驗, 得卡方值得

18、卡方值 =3.302, P=0.069, 作出兩組治療總有效率差異無統(tǒng)計學的結(jié)論作出兩組治療總有效率差異無統(tǒng)計學的結(jié)論。原統(tǒng)計分析中將三個等級合并為兩個等級。原統(tǒng)計分析中將三個等級合并為兩個等級, 導致信息丟失導致信息丟失, 結(jié)果得出兩處理組總療效無結(jié)果得出兩處理組總療效無顯著性差異的結(jié)論。顯著性差異的結(jié)論。29假設檢驗的案例四的分析與對策假設檢驗的案例四的分析與對策 從本案例中可見到對照組從本案例中可見到對照組“有效有效”的構(gòu)成的構(gòu)成比為比為28.57%,高于治療組的,高于治療組的“ 有效有效”構(gòu)成比構(gòu)成比17.64%, 而治療組而治療組“ 顯效顯效”構(gòu)成比構(gòu)成比76.47% 高高于對照組于

19、對照組“顯效顯效”構(gòu)成比構(gòu)成比50.00%, 另外顯效另外顯效與有效在臨床上都是表示治療的有利效果與有效在臨床上都是表示治療的有利效果, 盲盲目合并會導致錯誤的結(jié)果。目合并會導致錯誤的結(jié)果。30假設檢驗的案例四的分析與對策假設檢驗的案例四的分析與對策正確顯著性檢驗方法應該正確顯著性檢驗方法應該 用用Ridit分析分析 或者非參數(shù)檢驗或者非參數(shù)檢驗(秩和檢驗秩和檢驗) 或者或者CMH檢驗檢驗 或者或者Logistic回歸分析回歸分析 本案例采用秩和檢驗分析本案例采用秩和檢驗分析, z= 2.27, P = 0.023, 差異有統(tǒng)計學意義差異有統(tǒng)計學意義, 說明治療組的療效優(yōu)于對說明治療組的療效優(yōu)

20、于對照組。照組。31研究設計中的常見錯誤研究設計中的常見錯誤n(1)隨機分組與隨機抽樣沒有真正遵循)隨機分組與隨機抽樣沒有真正遵循隨機化原則;隨機化原則;n(2)無對照或?qū)φ赵O計不合理;)無對照或?qū)φ赵O計不合理;n(3)樣本含量太少。)樣本含量太少。32隨機分組與隨機抽樣的錯誤隨機分組與隨機抽樣的錯誤 無論是隨機抽樣還是隨機分組都要有足夠的無論是隨機抽樣還是隨機分組都要有足夠的樣本作前提樣本作前提, ,要在文章中描述清楚隨機抽樣的抽要在文章中描述清楚隨機抽樣的抽樣總體、樣本含量、抽樣方法樣總體、樣本含量、抽樣方法, ,隨機分組的隨機隨機分組的隨機方法、各組的樣本含量與基本特征等。醫(yī)學科研方法、

21、各組的樣本含量與基本特征等。醫(yī)學科研論文中最普遍的問題是濫用論文中最普遍的問題是濫用“隨機隨機”, ,只要是抽只要是抽樣或分組樣或分組, ,不管實際是否采用了隨機的方法不管實際是否采用了隨機的方法, ,在論在論文中均不談采用了什么樣的隨機方法文中均不談采用了什么樣的隨機方法, ,就將就將“隨隨機機”寫上寫上, ,將隨機誤解為隨意、隨便、不采用隨將隨機誤解為隨意、隨便、不采用隨機化處理方法機化處理方法, ,導致結(jié)果缺乏可靠性。導致結(jié)果缺乏可靠性。33隨機分組與隨機抽樣的錯誤的對策隨機分組與隨機抽樣的錯誤的對策 隨機化原則是由隨機化原則是由Fisher在創(chuàng)建實驗設計在創(chuàng)建實驗設計理論的過程中首先提

22、出的理論的過程中首先提出的,隨機化原則是實驗隨機化原則是實驗研究中保證取得無偏估計的重要措施。隨機研究中保證取得無偏估計的重要措施。隨機化方法由最初的抽簽、擲硬幣和抓鬮等方法化方法由最初的抽簽、擲硬幣和抓鬮等方法發(fā)展到隨機數(shù)字表、隨機排列表和用計算機發(fā)展到隨機數(shù)字表、隨機排列表和用計算機軟件或計算器產(chǎn)生的偽隨機數(shù)。軟件或計算器產(chǎn)生的偽隨機數(shù)。34對照的錯誤與對策對照的錯誤與對策 醫(yī)學研究醫(yī)學研究, ,尤其是實驗設計的研究尤其是實驗設計的研究, ,需要需要設立合適的對照組設立合適的對照組, ,只有設立了對照只有設立了對照, ,才能消才能消除非處理因素對實驗結(jié)果的影響除非處理因素對實驗結(jié)果的影響, ,從而將所從而將所關心的處理因素的效應分離出來。在論文關心的處理因素的效應分離出來。在論文中應說明對照取自的總體中應說明對照取自的總體, ,如何得來的如何得來的, ,樣本樣本含量多大?含量多大? 是否與實驗匹配或配伍是否與實驗匹配或配伍, ,與試驗與試驗組的均衡性如何?組的均衡性如何? 35對照的錯誤與對策對照的錯誤與對策 有些文章雖然設立了對照組有些文章雖然設立了對照組, ,卻使用非同卻使用非同期對照或歷史對照期對照或歷史對照, ,組

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論