選擇正確的統(tǒng)計(jì)方法_第1頁(yè)
選擇正確的統(tǒng)計(jì)方法_第2頁(yè)
選擇正確的統(tǒng)計(jì)方法_第3頁(yè)
選擇正確的統(tǒng)計(jì)方法_第4頁(yè)
選擇正確的統(tǒng)計(jì)方法_第5頁(yè)
已閱讀5頁(yè),還剩42頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

選擇正確的統(tǒng)計(jì)方法一、概述什么時(shí)候開始考慮選擇統(tǒng)計(jì)方法:應(yīng)在研究設(shè)計(jì)的時(shí)候考慮,而不應(yīng)是一切結(jié)束之后的結(jié)果“修飾”常見的現(xiàn)象:無科學(xué)設(shè)計(jì)、數(shù)據(jù)量不夠、統(tǒng)計(jì)結(jié)果與專業(yè)結(jié)論自相矛盾、無法得出期望的統(tǒng)計(jì)結(jié)果此刻,才考慮用什么統(tǒng)計(jì)方法得到想要的結(jié)果,統(tǒng)計(jì)成了“數(shù)字游戲”正確運(yùn)用統(tǒng)計(jì)方法的前提:良好完善的研究設(shè)計(jì)如果沒有科學(xué)的設(shè)計(jì)、良好的數(shù)據(jù)質(zhì)量那么無論用什么方法和軟件都無法獲得真實(shí)的結(jié)果,甚至得出錯(cuò)誤的結(jié)論。例:20世紀(jì)30-40年代,金的化合物普遍用于治療結(jié)核病,視作特效藥,為此發(fā)表過數(shù)以百計(jì)的文章,并作為定論寫入教科書。40年代末,隨機(jī)對(duì)照臨床試驗(yàn),否定了這種結(jié)論。并用幾個(gè)月的時(shí)間肯定了鏈霉素、對(duì)氨柳酸、異煙肼的療效。二、科研中的資料類型變量類型變量值表現(xiàn)實(shí)例資料類型數(shù)量變量定量(具體數(shù)值)身高(cm)計(jì)量資料分類變量無序二分類對(duì)立的兩類屬性性別(男,女)計(jì)數(shù)資料多分類不相容的多類屬性血型(A,B,O)有序多分類類間有程度差異的屬性(又稱等級(jí)資料)文化程度(初中、高中、大學(xué)...)某疫苗皮下注射免疫結(jié)果觀察對(duì)象抗體滴度目測(cè)判斷抗體水平免疫效果觀察11:40++無效21:60++++有效…………

為何類資料?為何類資料?為何類資料?計(jì)量資料有序多分類二分類數(shù)據(jù)類型的相互轉(zhuǎn)換

如年齡(歲),為何類資料?

轉(zhuǎn)換為“未成年、成人”,是何類資料?

再轉(zhuǎn)換為“嬰幼兒、青年、中年、老年”則又是何類資料?

如治療效果分類“無效、好轉(zhuǎn)、顯效、痊愈”為何類資料?

分別給予編碼0,1,2,3后又為何類資料?年齡(歲)為計(jì)量資料,轉(zhuǎn)換為“未成年、成人”,就是二分類的計(jì)數(shù)資料,再轉(zhuǎn)換為“嬰幼兒、青年、中年、老年”則為多分類有序的計(jì)數(shù)資料(等級(jí)資料)如治療效果分類“無效、好轉(zhuǎn)、顯效、痊愈”為多分類有序的計(jì)數(shù)資料,分別給予編碼0,1,2,3后即便為計(jì)量資料了三、統(tǒng)計(jì)方法選用各種情形下最常用的統(tǒng)計(jì)方法索引(張文彤整理)應(yīng)變量:連續(xù)單個(gè)自變量:

二分類

T檢驗(yàn)

多分類

單因素方差分析

連續(xù)

相關(guān)分析,回歸分析多個(gè)自變量:分類變量為主

方差分析模型

連續(xù)變量為主

線性回歸模型應(yīng)變量:有序分類

單個(gè)自變量:

二分類

秩和檢驗(yàn)

多分類

秩和檢驗(yàn)

連續(xù)

Logistic回歸分析多個(gè)自變量:

分類變量為主

Logistic回歸分析

連續(xù)變量為主

判別分析、Logistic回歸分析應(yīng)變量:無序分類(含二分類)單個(gè)自變量:

二分類

卡方檢驗(yàn)

多分類

卡方檢驗(yàn)

連續(xù)

Logistic回歸分析多個(gè)自變量:

分類變量為主

Logistic回歸分析、最優(yōu)尺度分析

連續(xù)變量為主

判別分析、Logistic回歸分析希望將變量/紀(jì)錄分成若干個(gè)類別,但類別數(shù)不清楚,或各類別的特征不明:聚類分析希望建立判別方程,對(duì)以后新進(jìn)入的案例進(jìn)行所屬類別的預(yù)測(cè):判別分析需要探索多個(gè)變量間的內(nèi)在聯(lián)系或內(nèi)在結(jié)構(gòu):因子分析、對(duì)應(yīng)分析生存時(shí)間和生存結(jié)局都是需要關(guān)心的因素,同時(shí)數(shù)據(jù)中存在大量的失訪:生存分析得到的是時(shí)間序列數(shù)據(jù),需要對(duì)以后的情形加以預(yù)測(cè):時(shí)間序列模型考察的特征需要有多個(gè)應(yīng)變量來表示,同時(shí)研究多個(gè)自變量對(duì)他們的影響:多元方差分析模型多變量統(tǒng)計(jì)方法選用指導(dǎo)目的或數(shù)據(jù)要求選用的方法尋找變量間的函數(shù)關(guān)系結(jié)果變量是連續(xù)型回歸分析典則相關(guān)分析結(jié)果變量是定性資料判別分析,Logistic回歸生存分析廣義線性模型尋找變量共性對(duì)共性全然不知因子分析大體已知隱變量分析檢驗(yàn)?zāi)P鸵褬?gòu)造通徑圖隱變量分析目的或數(shù)據(jù)要求選用的方法尋找變量綜合指標(biāo)綜合指標(biāo)不相關(guān)主成分分析綜合指標(biāo)相關(guān)因子分析變量的分類先定義變量間的相似性變量的聚類分析全無所知因子分析對(duì)個(gè)體的分類定義類間距離聚類分析匹配資料找危險(xiǎn)因素大樣本,概率比準(zhǔn)則條件Logistic回歸均數(shù)差準(zhǔn)則條件均數(shù)法統(tǒng)計(jì)應(yīng)用錯(cuò)誤的實(shí)例分析實(shí)例1

某研究小組對(duì)圍手術(shù)期老年人頭孢唑啉鈉的合理用法進(jìn)行研究,得結(jié)果如下表兩組患者頭孢唑啉鈉藥物動(dòng)力學(xué)參數(shù)比較組別(h-1)K10(h-1)老年組n=70.62130.11770.28560.042760歲以下組n=53.55053.55530.82573.5329成組t檢驗(yàn)t值1.841.60P值>0.05>0.05存在的問題老年組變異較小,60歲以下組變異較大:可能60歲以下年齡變動(dòng)較大而變異加大個(gè)別超常值的存在也可能存在年齡增大個(gè)體差異減小T檢驗(yàn)要求:個(gè)體獨(dú)立、正態(tài)性、方差相等。后兩個(gè)條件得不到滿足正態(tài)性經(jīng)驗(yàn)判斷:所有觀測(cè)值為正值時(shí),如為正態(tài)分布,S不會(huì)大于均值,更不會(huì)是均值的若干倍,60歲以下組k10的s為均數(shù)的若干倍,不符合正態(tài)性要求方差齊顯然指標(biāo)、k10的兩組間方差不齊。解決的辦法變量變換:對(duì)數(shù)變換、開方變換非參數(shù)檢驗(yàn):秩和檢驗(yàn)、符號(hào)檢驗(yàn)等實(shí)例二某醫(yī)院為了解昏迷時(shí)血清甲狀腺素的變化分別測(cè)定了昏迷病人和普通病人的血清T3、T4、rT3.62例昏迷病人血清T3、T4、rT3與對(duì)照組比較組別例數(shù)T3T4rT3昏迷病人620.610.2544.7910.600.460.29對(duì)照組621.860.77129.5025.740.220.19研究者采用t檢驗(yàn)對(duì)每?jī)山M的均值進(jìn)行比較,分別比較昏迷病人與對(duì)照組、淺昏迷與中昏迷、中昏迷與深昏迷比62例昏迷病人血清T3、T4、rT3與對(duì)照組比較組別例數(shù)T3T4rT3淺昏迷300.950.3849.213.40.310.13中度昏迷190.730.2844.510.560.440.19深度昏迷130.510.1539.67.200.540.22分析這是一個(gè)單因素(昏迷)、四水平(無、淺、中、高)設(shè)計(jì)誤用t檢驗(yàn)代替單因素方差分析如果要同時(shí)比較三項(xiàng)指標(biāo),應(yīng)當(dāng)采用多元方差分析實(shí)例三研究大豆黃酮對(duì)sp2/0腫瘤細(xì)胞DNA合成的影響,在大豆黃酮組中加入[3H]Tdr后0.5h,1h,2h,4h分別測(cè)量Cpm值。每次試驗(yàn)均設(shè)空白對(duì)照,每個(gè)大豆黃酮?jiǎng)┝烤O(shè)一式3份,取平均值。用t檢驗(yàn),差異顯著,大豆黃酮作用于腫瘤細(xì)胞后,其[3H]Tdr摻入量隨時(shí)間的延長(zhǎng)而增加,但抑制率下降。大豆黃酮對(duì)sp2/0腫瘤細(xì)胞DNA合成影響的時(shí)間-效應(yīng)關(guān)系時(shí)間(h)對(duì)照組大豆黃酮組抑制率%0.529735151737583**41.61393463303635428*7.6246239874313783*6.7447607335472873*5.0注:*p<0.05**p<0.01分析隨時(shí)間變化,腫瘤細(xì)胞數(shù)目的變化有較強(qiáng)的自相關(guān)性,而且同時(shí)涉及兩個(gè)因素,資料與設(shè)計(jì)類型不滿足t檢驗(yàn)的要求。統(tǒng)計(jì)結(jié)果不可信。此資料是重復(fù)測(cè)量的兩因素設(shè)計(jì)資料重復(fù)測(cè)量資料的方差分析常采用輪廓分析方法。輪廓分析通常進(jìn)行組間輪廓相似性或平行性、組間平均水平差異顯著性和組內(nèi)條件變異顯著性三方面的假設(shè)檢驗(yàn)進(jìn)行分析。實(shí)例四定性資料的分析雙向無序RC資料2檢驗(yàn)或Fisher檢驗(yàn)?zāi)车?094人按兩種血型系統(tǒng)劃分的結(jié)果ABO血型MNMN合計(jì)O4314909021823A3884108001598B4955879502032AB137179325641合計(jì)1451166629776094單向有序RC資料3種藥物療效的觀察結(jié)果療效藥物A藥物B藥物C合計(jì)治愈154120顯效4991573好轉(zhuǎn)315045126無效5222451合計(jì)1008585270不適合使用2檢驗(yàn)因?yàn)?檢驗(yàn)與“療效”的有序性間沒有任何聯(lián)系應(yīng)該采用與“有序性”有聯(lián)系的秩和檢驗(yàn)或Ridit

分析雙向有序且屬性不同的資料眼晶狀體混濁度與年齡關(guān)系混濁度20-30-40-合計(jì)+215131148494++67101128296+++4463132239合計(jì)3262954081029也不適合采用2檢驗(yàn)2檢驗(yàn)與兩變量的有序性沒有任何聯(lián)系應(yīng)采用等級(jí)相關(guān)分析典則相關(guān)分析線性趨勢(shì)檢驗(yàn)雙向有序且屬性相同的資料兩種方法檢查室壁收縮運(yùn)動(dòng)的符合情況對(duì)比法正常減弱異常合計(jì)正常582363減弱142750異常891734合計(jì)675327147研究目的是考察兩種測(cè)定方法的測(cè)定結(jié)果間是否有一致性不適合使用2檢驗(yàn)應(yīng)當(dāng)采用一致性檢驗(yàn)或Kappa檢驗(yàn)實(shí)例五綜合分析(一)某研究者將直腸癌根治術(shù)后會(huì)陰傷口感染42例,按隨機(jī)法分為噴氧組(A組)21例,常規(guī)換藥組(B組)21例,經(jīng)治療后觀察傷口愈合的時(shí)間:A組:2例5天,5例7天,6例9天,4例11天,4例14天B組:7天、9天各1例,3例11天,7例14天,9例28-103天。T檢驗(yàn)結(jié)果:A組傷口愈合時(shí)間平均9.48天B組傷口愈合時(shí)間平均22.57天P<0.001,有顯著差異錯(cuò)誤:資料不符合t檢驗(yàn)的要求正態(tài)性方差齊將原資料轉(zhuǎn)化為有序列聯(lián)表因B組中有9例的時(shí)間不具體,無法按定量資料來分析兩組例數(shù)都較少,故采用秩和檢驗(yàn),HC=15.9495,p<0.0001A組與B組傷口愈合天數(shù)比較組別<88-14->=28合計(jì)A7104021B147921合計(jì)81411942實(shí)例五綜合分析(二)某研究者收集了103例冠心病與100例正常對(duì)照的多項(xiàng)指標(biāo)組別(G)性別(X1)年齡(X2)高血壓史(X3)

吸煙史(X4)膽固醇含量(X5)甘油三脂含量(X6)低密度脂蛋白(X7)高密度脂蛋白(X8)脂蛋白(X9)載脂蛋白1(X10)載脂蛋白1(X11)基因型XbaI(X12)基因型EcoRI(X13)用藥情況(X14)冠心病人與正常人多項(xiàng)指標(biāo)的觀測(cè)結(jié)果NOGX1X2X3X4X5X6X711男60NN22320512221女46NN1665184………………………1031男76YY1951011351042女39NN22348157………………………2032男69YN22411058冠心病人與正常人多項(xiàng)指標(biāo)的觀測(cè)結(jié)果NOGX8X9X10X11X12X13X1411301060.920.74-/--/-12157561.140.54-/++/-2………………………1031423020.910.65+/-+/-0104255321.060.71-/-+/+1………………………2032491321.100.69-/-+/+0該研究者采用的方法求一組定量指標(biāo)的均值、標(biāo)準(zhǔn)差T檢驗(yàn)分析某定量指標(biāo)的某兩水平的差異簡(jiǎn)單直線相關(guān)、回歸分析兩定量指標(biāo)間關(guān)系等這樣做,會(huì)犧牲大量有用的信息,得到一些支離破碎的甚至錯(cuò)誤的結(jié)論。推薦的做法:

列出希望達(dá)到的目的,逐一選用相應(yīng)的統(tǒng)計(jì)分析方法。目的一、對(duì)冠心病人而言,直接分析某種基因型取不同水平時(shí)7項(xiàng)血脂指標(biāo)的均值和均值向量間差別有無統(tǒng)計(jì)學(xué)差異?基因型X12或X13是定性分組變量,7項(xiàng)血脂指標(biāo)是定量資料。通常把定性的分組變量稱為“試驗(yàn)因素或影響因素”,將定量的觀測(cè)指標(biāo)稱為“反應(yīng)變量”。每次只分析一個(gè)反應(yīng)變量當(dāng)分析水平為2,影響因素為1時(shí),t檢驗(yàn)當(dāng)分析水平>2,影響因素為1時(shí),方差分析每次分析反應(yīng)變量>1時(shí)當(dāng)分析水平為2,影響因素為1時(shí),T2檢驗(yàn)影響因素個(gè)數(shù)>=2或雖影響因素=1但其水平數(shù)>=3,多元方差分析目的二、對(duì)冠心病人而言,“性別、吸煙史、高血壓史、基因型”等因素對(duì)血脂指標(biāo)有無影響?性別、吸煙史、高血壓史、基因型等因素都是“影響因素”。需采用四因素析因設(shè)計(jì)的方差分析或多元方差分析目的三、對(duì)冠心病人而言

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論