




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、常用假設檢驗方法和回歸分析常用假設檢驗方法和回歸分析綜述綜述昆明醫(yī)學院公衛(wèi)學院昆明醫(yī)學院公衛(wèi)學院流行病與衛(wèi)生統(tǒng)計學系流行病與衛(wèi)生統(tǒng)計學系何利平何利平 資資 料料計量資料計量資料計數(shù)資料計數(shù)資料等級資料等級資料正態(tài)分布資料正態(tài)分布資料非正態(tài)分布資料非正態(tài)分布資料t檢驗檢驗方差分析方差分析秩和檢驗秩和檢驗2檢驗檢驗秩和檢驗秩和檢驗常見的設計類型常見的設計類型w單樣本設計單樣本設計w配對設計配對設計w完全隨機設計完全隨機設計w配伍組設計配伍組設計w析因設計析因設計w拉丁方設計拉丁方設計w正交設計正交設計w重復測量重復測量單樣本資料單樣本資料(One-sample data)w已知一個總體的參數(shù)和一份
2、樣本已知一個總體的參數(shù)和一份樣本例例1: 某醫(yī)生在一山區(qū)隨機抽查了某醫(yī)生在一山區(qū)隨機抽查了25名名健康成年男子,求得脈搏均數(shù)為健康成年男子,求得脈搏均數(shù)為74.2次次/分,標準差為分,標準差為6.0次次/分。根據(jù)大量分。根據(jù)大量調查,健康成年男子的脈搏均數(shù)為調查,健康成年男子的脈搏均數(shù)為72次次/分,能否認為該山區(qū)健康成年男子分,能否認為該山區(qū)健康成年男子的脈搏均數(shù)高于一般?的脈搏均數(shù)高于一般?單樣本資料單樣本資料(One-sample data)單樣本資料單樣本資料(One-sample data)w例例2 某醫(yī)師在某地某工廠隨機抽取某醫(yī)師在某地某工廠隨機抽取16名工人,名工人,測得尿鉛含量
3、測得尿鉛含量(mol/L)mol/L)為為0.65,0.78,2.13,2.48,2.54,2.68,2.73,3.01,0.65,0.78,2.13,2.48,2.54,2.68,2.73,3.01,3.13,3.27,3.54,4.38,4.47,5.05,6.08,11.23.13,3.27,3.54,4.38,4.47,5.05,6.08,11.27.7.已知該地正常人尿鉛含量的中位數(shù)為已知該地正常人尿鉛含量的中位數(shù)為2.50 2.50 mol/Lmol/L,問該工廠工人的尿鉛含量是否高于,問該工廠工人的尿鉛含量是否高于當?shù)卣H??當?shù)卣H??配對資料配對資料(Paired-sampl
4、e data)w配對設計資料:將受試對象按一定條件配對設計資料:將受試對象按一定條件配成對子,分別給予每對中的兩個受試配成對子,分別給予每對中的兩個受試對象以不同的處理。對象以不同的處理。w自身對照資料:同一個受試對象給予不自身對照資料:同一個受試對象給予不同的處理或者處理前后的觀察結果。同的處理或者處理前后的觀察結果。配對資料配對資料(Paired-sample data)w例例3 15名接種卡介苗的兒童,名接種卡介苗的兒童,8周后用兩批不同周后用兩批不同的結核菌素,一批是標準結核菌素,一批是新的結核菌素,一批是標準結核菌素,一批是新制結核菌素,分別注射在兒童的左右前臂。以制結核菌素,分別注
5、射在兒童的左右前臂。以皮膚浸潤直徑(皮膚浸潤直徑(mm)為指標。數(shù)據(jù)如下表所)為指標。數(shù)據(jù)如下表所示。示。編號編號123456789101112131415標準品標準品12.014.515.513.012.010.57.59.015.013.014.014.06.511.05.5新制品新制品10.010.012.510.0 5.5 8.56.55.5 8.0 6.5 5.510.04.0 3.53.5例例4 為研究女性服用某避孕新藥后是否影響為研究女性服用某避孕新藥后是否影響其血清總膽固醇含量,將其血清總膽固醇含量,將20名女性按年齡配名女性按年齡配成成10對。每對中隨機抽取一人服用新藥,另對
6、。每對中隨機抽取一人服用新藥,另一人服用安慰劑。經(jīng)過一定時間后,測得血一人服用安慰劑。經(jīng)過一定時間后,測得血清總膽固醇含量(清總膽固醇含量(mmol/L),結果見下表。),結果見下表。問新藥是否影響女性血清總膽固醇含量?問新藥是否影響女性血清總膽固醇含量?配對資料配對資料(Paired-sample data)編號編號 1 2 3 4 5 6 7 8 910標準品標準品4.45.05.84.64.94.86.05.94.35.1新制品新制品6.25.25.55.04.45.45.06.45.86.2 兩種方法測定水中硫酸鹽的含量(兩種方法測定水中硫酸鹽的含量(mmol/L)水樣號水樣號(1)E
7、DTA法法(2)重量法重量法(3)1129.89119.58259.6852.63328.7929.68469.8570.56546.7842.5662.353.2171.562.42878.8870.56956.8750.551066.8562.45配對資料配對資料(Paired-sample data)配對資料配對資料(Paired-sample data)w例例6 某醫(yī)院采用甲乙兩種方法測定某醫(yī)院采用甲乙兩種方法測定60例惡性例惡性腫瘤患者體內腫瘤患者體內ck20基因表達陽性率,甲法測基因表達陽性率,甲法測定陽性率為定陽性率為70.0,乙法測定陽性率為,乙法測定陽性率為38.3,兩種方法
8、一致測定陽性率為,兩種方法一致測定陽性率為26.7。比。比較甲乙兩種方法的測定陽性率是否有差異?較甲乙兩種方法的測定陽性率是否有差異?組別組別陽性陽性陰性陰性合計合計陽性率陽性率()()甲法甲法4218 6070.0乙法乙法2337 6038.3合計合計655512054.2配對資料配對資料(Paired-sample data)甲法甲法乙法乙法合計合計162642 71118合計合計233760n成組設計(完全隨機設計)成組設計(完全隨機設計):將受試對將受試對象按照隨機分配的原則分配到實驗組和對象按照隨機分配的原則分配到實驗組和對照組中,然后給予不同的處理因素,對各照組中,然后給予不同的處
9、理因素,對各組的效應進行同期平行觀察,最后比較各組的效應進行同期平行觀察,最后比較各組的觀察指標有無差別。組的觀察指標有無差別。 成組設計成組設計( (completely randomized design) 例例7 為研究肥胖與脂質代謝的關系,在某地小學為研究肥胖與脂質代謝的關系,在某地小學中隨機抽取中隨機抽取30名肥胖兒童(肥胖組)和名肥胖兒童(肥胖組)和30名正常名正常兒童(對照組),用改良八木國夫法測定兩組兒兒童(對照組),用改良八木國夫法測定兩組兒童血中脂質過氧化物(童血中脂質過氧化物(LPO)得下表結果,)得下表結果,能否能否認為肥胖與脂質代謝有關?認為肥胖與脂質代謝有關?表表
10、兩組兒童血中兩組兒童血中LPO含量(含量( mol/L)分組n肥胖組309.361.83對照組307.580.64SX 成組設計兩樣本資料成組設計兩樣本資料成組設計兩樣本資料成組設計兩樣本資料w例例8 某醫(yī)生隨機抽取正常人和腦病病人各某醫(yī)生隨機抽取正常人和腦病病人各11例,測定尿中類固醇排出量(例,測定尿中類固醇排出量(mg/dl),結),結果如下表果如下表 分組分組尿中類固醇排出量(尿中類固醇排出量(mg/dl)正常人2.905.415.484.604.035.104.974.244.373.052.78腦病病人5.288.793.846.463.796.645.894.577.716.02
11、4.06成組設計兩樣本資料成組設計兩樣本資料w例例9 為觀察美能注射液對酒精性脂肪肝降血為觀察美能注射液對酒精性脂肪肝降血脂的作用,將脂的作用,將72例酒精性脂肪肝患者隨機分例酒精性脂肪肝患者隨機分為兩組,為兩組,觀察組觀察組38例例應用美能注射液靜脈注應用美能注射液靜脈注射,射,對照組對照組34例例口服非諾貝特膠囊,一個療口服非諾貝特膠囊,一個療程后比較兩組療效。結果見下表程后比較兩組療效。結果見下表 :分組分組時間時間TCTGLDL-CHDL-C觀察組觀察組治療前治療前6.60 1.123.32 1.223.86 0.760.82 0.16治療后治療后5.64 0.862.46 0.862
12、.86 0.701.74 0.24對照組對照組治療前治療前6.58 0.973.34 1.282.68 0.780.86 0.18治療后治療后5.49 0.822.34 0.882.58 0.681.68 0.18成組設計兩樣本資料成組設計兩樣本資料w例例10 2005年某縣疾病預防控制中心為評價年某縣疾病預防控制中心為評價該縣小學生卡介苗抗體效價,隨機抽取了該縣小學生卡介苗抗體效價,隨機抽取了30名小學生,測定結果見下表。名小學生,測定結果見下表。性性 別別卡介苗抗體滴度倒數(shù)卡介苗抗體滴度倒數(shù)男生男生40201604032080402040801604080404040女生女生8020160
13、4040160402040160160408040成組設計兩樣本資料成組設計兩樣本資料w例例11 某醫(yī)生研究男性甲狀腺機能減退癥患者尺骨某醫(yī)生研究男性甲狀腺機能減退癥患者尺骨骨礦含量與正常人是否有差別,隨機抽取骨礦含量與正常人是否有差別,隨機抽取10例患例患者和者和10例正常人,分別測得骨礦含量如下例正常人,分別測得骨礦含量如下(g/cm2)。)?;颊呓M:患者組:0.31 0.35 0.37 0.39 0.52 0.62 0.62 0.63 0.74 0.98正常組:正常組:0.28 0.29 0.31 0.35 0.36 0.37 0.41 0.48 0.53 0.53w例例12 某醫(yī)生用某
14、種中藥治療某醫(yī)生用某種中藥治療I型糖尿病患型糖尿病患者和者和II型糖尿病患者共型糖尿病患者共45例,結果見下表。例,結果見下表。該中藥對兩型糖尿病的療效有無差異?該中藥對兩型糖尿病的療效有無差異?組別組別無效無效好轉好轉顯效顯效合計合計型糖尿型糖尿病病98 522型糖尿型糖尿病病391123成組設計兩樣本資料成組設計兩樣本資料成組設計兩樣本資料成組設計兩樣本資料w例例13 13 某醫(yī)師為比較中藥和西藥治療胃炎的療某醫(yī)師為比較中藥和西藥治療胃炎的療效,隨機抽取效,隨機抽取140140例胃炎患者分成中藥組和西例胃炎患者分成中藥組和西藥組,結果中藥組治療藥組,結果中藥組治療8080例,有效例,有效6
15、464例,西例,西藥組治療藥組治療6060例,有效例,有效3535例。中西藥治療胃炎例。中西藥治療胃炎的療效有無差別?的療效有無差別?組別組別有效有效無效無效合計合計中藥中藥641680西藥西藥352560四格表2檢驗的應用條件n 40和和T 5,用用 2檢驗。檢驗。n 40,1 T 5,校正校正 2檢驗。檢驗。n40,或,或T1,不能用不能用 2檢驗,可改檢驗,可改用確切概率法。用確切概率法。成組設計兩樣本資料成組設計兩樣本資料 中藥和西藥治療胃炎患者有效率的比較中藥和西藥治療胃炎患者有效率的比較藥物藥物有效有效無效無效合計合計中藥中藥6416 80西藥西藥3525 60合計合計994114
16、0成組設計兩樣本資料成組設計兩樣本資料中藥和西藥治療非典病人有效率的比較中藥和西藥治療非典病人有效率的比較 組別組別緩解數(shù)緩解數(shù)未緩解數(shù)未緩解數(shù)合計合計陽性率陽性率()()西藥西藥2101216.7中藥中藥14142850.0合計合計16244040.0(4.8)成組設計兩樣本資料成組設計兩樣本資料w為比較中西藥治療急性心肌梗塞的療效,某為比較中西藥治療急性心肌梗塞的療效,某醫(yī)師將醫(yī)師將27例急性心肌梗塞患者隨機分成兩例急性心肌梗塞患者隨機分成兩組,分別給予中藥和西藥治療,結果見下表,組,分別給予中藥和西藥治療,結果見下表,中藥和西藥的療效是否有差異?中藥和西藥的療效是否有差異?藥物藥物有效有
17、效無效無效合計合計有效率(有效率(%)中藥中藥1221485.7西藥西藥 671346.2合計合計1892766.7成組設計多樣本資料成組設計多樣本資料例例14 某社區(qū)隨機抽取了某社區(qū)隨機抽取了30名糖尿病人、名糖尿病人、IGT異常和正常人進行載脂蛋白(異常和正常人進行載脂蛋白(mg/dL)測)測定,結果見下表。問三種人的載脂蛋白有定,結果見下表。問三種人的載脂蛋白有無差別?無差別?人人 群群糖尿病人(糖尿病人(n=11)105.4510.87IGT異常者(異常者(n=9)102.3914.55正常人(正常人(n=10)122.8017.07sx 成組設計多樣本資料成組設計多樣本資料w例例15
18、 某醫(yī)生為研究慢性阻塞性肺部疾病患者某醫(yī)生為研究慢性阻塞性肺部疾病患者的肺動脈血氧分壓情況,按肺動脈壓的分級的肺動脈血氧分壓情況,按肺動脈壓的分級標準將標準將44例患者隨機分為三組,分別測量肺例患者隨機分為三組,分別測量肺動脈血氧分壓,結果見下表。三組患者之間動脈血氧分壓,結果見下表。三組患者之間動脈血氧分壓有無差異?動脈血氧分壓有無差異?肺動脈正常組肺動脈正常組556969728080849091929297100108109隱性肺動脈高隱性肺動脈高壓組壓組455657596666707476777880839092肺動脈高壓組肺動脈高壓組24383942505056606265687181
19、81成組設計多樣本資料成組設計多樣本資料三種中藥治療流感的療效比較三種中藥治療流感的療效比較組別組別有效有效例數(shù)例數(shù)無效無效例數(shù)例數(shù)合計合計有效率有效率()()熱毒清熱毒清 5826096.7板蘭根板蘭根48 126080.0復方板復方板蘭根蘭根57 36095.0合計合計1631718090.6成組設計多樣本資料成組設計多樣本資料w例例17 某醫(yī)生用七氟醚對即行肺切除術的三組某醫(yī)生用七氟醚對即行肺切除術的三組患者進行麻醉,麻醉效果分三級,結果如下,患者進行麻醉,麻醉效果分三級,結果如下,問三組患者的麻醉效果是否相同?問三組患者的麻醉效果是否相同?組別組別合計合計肺癌肺癌 1813839肺化膿
20、癥肺化膿癥12151340肺結核肺結核 9111939隨機區(qū)組設計隨機區(qū)組設計(Randomized block design)w又稱為配伍設計,它是配對設計的擴大。隨又稱為配伍設計,它是配對設計的擴大。隨機區(qū)組設計是將幾個條件相同的受試對象劃機區(qū)組設計是將幾個條件相同的受試對象劃成一個區(qū)組,區(qū)組中觀察對象的數(shù)量取決于成一個區(qū)組,區(qū)組中觀察對象的數(shù)量取決于對比組的組數(shù)。如處理因素有四個對比組,對比組的組數(shù)。如處理因素有四個對比組,則一個區(qū)組就有四個或八個受試對象。將區(qū)則一個區(qū)組就有四個或八個受試對象。將區(qū)組中的受試對象采用隨機的方法,分配到不組中的受試對象采用隨機的方法,分配到不同的對比組中,
21、以增強各對比組的均衡性。同的對比組中,以增強各對比組的均衡性。隨機區(qū)組設計資料隨機區(qū)組設計資料w例例18 對小白鼠喂以對小白鼠喂以A、B、C三種不同的營三種不同的營養(yǎng)素,目的是了解不同營養(yǎng)素增重的效果。養(yǎng)素,目的是了解不同營養(yǎng)素增重的效果。采用隨機區(qū)組設計方法,以窩別作為劃分區(qū)采用隨機區(qū)組設計方法,以窩別作為劃分區(qū)組的特征,以消除遺傳因素對體重增長的影組的特征,以消除遺傳因素對體重增長的影響?,F(xiàn)將同品系、同體重的響?,F(xiàn)將同品系、同體重的 24只小白鼠分為只小白鼠分為8個區(qū)組,每個區(qū)組個區(qū)組,每個區(qū)組3只小白鼠。三周后體重只小白鼠。三周后體重增加結果(克)列于表增加結果(克)列于表3。問小白鼠經(jīng)
22、三種不。問小白鼠經(jīng)三種不同營養(yǎng)素喂養(yǎng)后所增體重有無差別?同營養(yǎng)素喂養(yǎng)后所增體重有無差別?表表 不同營養(yǎng)素組小白鼠增加體重不同營養(yǎng)素組小白鼠增加體重(g)配伍組配伍組ABC150.158.264.557.6247.848.562.452.9353.153.858.655.2463.564.272.566.7571.268.479.373.0641.445.738.441.8761.953.051.255.4842.239.846.242.7合計合計431.2431.6473.1 24 (N)53.9053.9559.1455.66 ( )iXXjX隨機區(qū)組設計資料隨機區(qū)組設計資料w例例19 觀測
23、龍葵濃縮果汁對觀測龍葵濃縮果汁對S180實體瘤實體瘤NK細細胞活性的影響,將同種屬的胞活性的影響,將同種屬的32只大白鼠按窩只大白鼠按窩別、性別、體重配成別、性別、體重配成10個區(qū)組,建成個區(qū)組,建成S180實實體瘤模型。一定時間后將小鼠脫椎處死,測體瘤模型。一定時間后將小鼠脫椎處死,測定并計算定并計算NK細胞活性,結果見下表,不同劑細胞活性,結果見下表,不同劑量組之間小鼠量組之間小鼠NK細胞活性有無差異?細胞活性有無差異?表表 龍葵濃縮果汁不同劑量組小鼠龍葵濃縮果汁不同劑量組小鼠NK細細胞活性測定結果(胞活性測定結果(%)配伍組配伍組高劑量組高劑量組 中劑量組中劑量組 低劑量組低劑量組對照組
24、對照組 120.717.312.3 6.5 212.411.618.6 8.4 314.914.610.811.3 418.5 9.419.915.6 513.2 9.0 9.0 8.9 614.220.111.514.1 712.811.57.312.3 813.511.714.710.6 914.410.912.6 9.81013.818.4 9.5 7.2析因設計資料析因設計資料(Factorial design data)w例例20 某研究人員為了解升白細胞藥物和純苯對大某研究人員為了解升白細胞藥物和純苯對大鼠吞噬指數(shù)的影響,以及兩者同時使用的作用,鼠吞噬指數(shù)的影響,以及兩者同時使用的
25、作用,將將20只性別相同、體重相近的大鼠,按只性別相同、體重相近的大鼠,按A、B兩因兩因素有無分為四組,測得其吞噬指數(shù)結果如下素有無分為四組,測得其吞噬指數(shù)結果如下:用升白細胞藥物用升白細胞藥物不用升白細胞藥物不用升白細胞藥物用純苯用純苯不用純苯不用純苯用純苯用純苯不用純苯不用純苯1.943.801.853.882.253.902.013.842.034.062.103.962.103.851.923.922.083.842.043.80析因設計資料析因設計資料w結果:結果:SourceSSdfMSFsigA 0.0141 0.014 1.5190.236B 17.1681 17.168185
26、7.0090.000 A*B 0.0091 0.009 1.0000.332拉丁方設計(拉丁方設計(Latin square design)w拉丁方設計是將三個因素按水平數(shù)拉丁方設計是將三個因素按水平數(shù)r排列排列成一個成一個rr隨機方陣,要求各因素的水隨機方陣,要求各因素的水平數(shù)相等且無交互作用,并要盡量避免平數(shù)相等且無交互作用,并要盡量避免數(shù)據(jù)缺失。可以用較少的重復次數(shù)獲得數(shù)據(jù)缺失??梢杂幂^少的重復次數(shù)獲得較多的信息。較多的信息。拉丁方設計資料拉丁方設計資料w例例21 為研究不同劑量甲狀腺素注射液對甲狀腺體為研究不同劑量甲狀腺素注射液對甲狀腺體的影響,以豚鼠的影響,以豚鼠5個種系,每個種系各
27、個種系,每個種系各5只,分養(yǎng)于只,分養(yǎng)于5個籠子,每籠內放置各種系豚鼠個籠子,每籠內放置各種系豚鼠1只,并以甲狀腺只,并以甲狀腺素的素的5個不同劑量分別注射,測得甲狀腺素的重量個不同劑量分別注射,測得甲狀腺素的重量如下表:如下表:種系種系 籠號籠號甲甲C(65)E(85)A(57)B(49)D(79)乙乙E(82)A (73)D(92)B(81)B(63)丙丙D(68)C(67)A(56)D(77)C(51)丁丁B(63)E(99)C(70)E(76)A(41)戊戊D(75)A(46)B(52)E(68)C(66)拉丁方設計資料拉丁方設計資料w結果:結果:SourceSSdfMSFsig劑量劑
28、量2690.9604672.7408.0080.002種系種系 375.7604 93.9401.1180.393籠子籠子 908.1604227.0402.7030.081正交設計正交設計(Orthogonal design)w正交設計利用一套規(guī)格化的正交表將各實驗正交設計利用一套規(guī)格化的正交表將各實驗因素、各水平之間的組合均勻搭配,合理安因素、各水平之間的組合均勻搭配,合理安排,大大減少實驗次數(shù),提供較多的信息。排,大大減少實驗次數(shù),提供較多的信息。w正交設計可以了解哪些因素存在交互效應,正交設計可以了解哪些因素存在交互效應,還可以找出諸因素各水平的最佳組合;避免還可以找出諸因素各水平的最
29、佳組合;避免了析因設計的全面試驗、工作量大的弊病。了析因設計的全面試驗、工作量大的弊病。正交設計資料正交設計資料w例例22 過氧乙酸是廣泛使用的消毒劑,但其有效成過氧乙酸是廣泛使用的消毒劑,但其有效成分極不穩(wěn)定,以致影響其消毒效果?,F(xiàn)欲通過實分極不穩(wěn)定,以致影響其消毒效果?,F(xiàn)欲通過實驗找出有關因素對其穩(wěn)定性的影響,選出各因素驗找出有關因素對其穩(wěn)定性的影響,選出各因素的一個最佳組合,組成保持過氧乙酸穩(wěn)定性的最的一個最佳組合,組成保持過氧乙酸穩(wěn)定性的最優(yōu)條件。已知的可能影響因素及水平有:優(yōu)條件。已知的可能影響因素及水平有:水平水平12A:穩(wěn)定劑:穩(wěn)定劑加磷酸加磷酸0.3%不加磷酸不加磷酸B:水浴溫
30、度:水浴溫度2530oC3540oCC:浸泡口表:浸泡口表浸泡口表浸泡口表10支支不浸口表不浸口表D:加蓋與否:加蓋與否加蓋加蓋不加蓋不加蓋正交設計資料正交設計資料w同時穩(wěn)定劑和水浴溫度、穩(wěn)定劑與加蓋與否間可同時穩(wěn)定劑和水浴溫度、穩(wěn)定劑與加蓋與否間可能存在交互效應。現(xiàn)根據(jù)能存在交互效應?,F(xiàn)根據(jù)L8正交設計表進行了實正交設計表進行了實驗,每種組合重復兩次,測得數(shù)據(jù)如下:驗,每種組合重復兩次,測得數(shù)據(jù)如下:ABCD第一次測量第一次測量第二次測量第二次測量11117.004.1111226.053.5012121.100.8012211.900.9621122.401.6521214.001.502
31、2110.350.3022220.300.90正交設計資料正交設計資料w結果:結果:SourceSSdfMSFsigA12.285112.2859.2720.014B34.810134.81026.2740.001C0.12210.1220.0920.768D0.73110.7310.5520.477 A*B4.20214.2023.1720.109 A*D0.16410.1640.1240.733重復測量資料(重復測量資料(Repeated measurement data)w重復測量資料:同一受試對象的同一觀察指重復測量資料:同一受試對象的同一觀察指標在不同時間點上進行測量所得的資料。標在
32、不同時間點上進行測量所得的資料。w重復測量資料的方差分析,除需滿足一般方重復測量資料的方差分析,除需滿足一般方差分析的條件外,還需滿足協(xié)方差陣差分析的條件外,還需滿足協(xié)方差陣(covariance matrix)的球形性)的球形性(sphericity)。球對稱性通常采用)。球對稱性通常采用Mauchly檢驗來判斷。檢驗來判斷。重復測量資料重復測量資料w例例23 某研究者為了解某藥對血液某因某研究者為了解某藥對血液某因子的提升作用,將子的提升作用,將16名患者隨機分為名患者隨機分為2組,一組用該藥,另一組用傳統(tǒng)藥,組,一組用該藥,另一組用傳統(tǒng)藥,分別與治療前和治療后分別與治療前和治療后1,2,
33、3周測定結周測定結果,資料如下:果,資料如下:重復測量資料重復測量資料受試受試對象對象j組別組別k測定時間測定時間i(周)(周)受試受試對象對象j組別組別k測定時間測定時間i(周)(周)01230123119.7354.6155.9146.81925.6426.3231.5645.69215.5050.8779.9082.371022.5615.2423.2633.27317.9633.4346.1056.211123.6918.7521.3035.69412.3718.6533.1256.051227.5222.3232.5642.12514.3725.8551.2668.231328.33
34、32.2141.5655.12616.3048.2365.1878.361425.6841.1253.4562.54718.3452.1365.3269.511523.6638.5645.1656.33812.9823.4546.8756.211624.8731.2542.6545.77重復測量資料重復測量資料w結果:結果:SourceSSdfMSFP處理處理 2214.05512214.055 7.4870.016時間時間22615.62337538.541145.3380.000處理處理*時間時間 826.4113 275.470 5.3110.003回歸分析(回歸分析(Regressio
35、n analysis)w線性回歸(線性回歸(Linear regression)wLogistic回歸(回歸(Logistic regression)wCox回歸(回歸(Cox regression)w例例24 為探討父母身高對子女成年后身高的影響,為探討父母身高對子女成年后身高的影響,某研究者調查了某研究者調查了12個家庭的父母和成年兒子的身個家庭的父母和成年兒子的身高,見下表,請建立回歸方程。高,見下表,請建立回歸方程。 家庭編號家庭編號父親身高父親身高x1(cm) 母親身高母親身高x2(cm) 兒子身高兒子身高y(cm)1172149173218816719031761641824170
36、14917051851701956182164190717316218281851601899179158182101701501721116816017012170164178w回歸分析的前提條件回歸分析的前提條件線性(線性(Linearity)獨立性(獨立性(Independence)正態(tài)性(正態(tài)性(Normality)等方差(等方差(Equal variance)線性回歸線性回歸(Linear regression)線性回歸線性回歸(Linear regression)線性回歸方程線性回歸方程kkxbxbxbby 22110b1,b2 2bk稱偏回歸系數(shù)(稱偏回歸系數(shù)(Partial r
37、egression coefficient),),b0 0為截距為截距(intercept)。)。w 偏回歸系數(shù)(偏回歸系數(shù)(Partial regression coefficient):): bk是自變量是自變量xk的偏回歸系數(shù),的偏回歸系數(shù),表示當方程中其它自變量保持不變表示當方程中其它自變量保持不變時,自變量時,自變量xk每變化一個單位,應每變化一個單位,應變量平均變化變量平均變化bk個單位。個單位。線性回歸線性回歸(Linear regression)w標準化偏回歸系數(shù)(標準化偏回歸系數(shù)(standardized partial regression coefficient) 表示自
38、變量對應變量的貢獻大表示自變量對應變量的貢獻大小的指標,標準化偏回歸系數(shù)越大,小的指標,標準化偏回歸系數(shù)越大,表示自變量對應變量的貢獻越大。表示自變量對應變量的貢獻越大。線性回歸線性回歸(Linear regression)線性回歸線性回歸(Linear regression)w例例24 中以兒子的身高為應變量中以兒子的身高為應變量Y,父親的身高父親的身高X1、母親的身高、母親的身高X2為自為自變量,進行多重回歸分析,所得的變量,進行多重回歸分析,所得的回歸模型(方程)為回歸模型(方程)為21445. 0861. 0940.41XXY線性回歸線性回歸(Linear regression)w 假
39、設檢驗:假設檢驗: (1 1)多重線性回歸方程的假設檢驗:)多重線性回歸方程的假設檢驗: 檢驗應變量檢驗應變量y y與與P P個自變量之間是否個自變量之間是否存在線性回歸關系,用方差分析。存在線性回歸關系,用方差分析。FMSMSRE 線性回歸線性回歸(Linear regression)wH0:12i0wH1:各偏回歸系數(shù):各偏回歸系數(shù)i不全為不全為0w0.05w可認為父母身高與兒子身高的多重線性回歸方程有可認為父母身高與兒子身高的多重線性回歸方程有統(tǒng)計學意義,回歸方程成立。統(tǒng)計學意義,回歸方程成立。SourceSSdfMSFsig回歸回歸 767.509 2 383.75464.6680.0
40、00殘差殘差 53.408 9 5.934 總總 820.91711(2)偏回歸系數(shù)的假設檢驗:偏回歸系數(shù)的假設檢驗: 為檢驗每個自變量是否對為檢驗每個自變量是否對y y都有線性回都有線性回歸關系,需分別對每個自變量進行假設檢歸關系,需分別對每個自變量進行假設檢驗,以免把作用不顯著的自變量引入方程驗,以免把作用不顯著的自變量引入方程中。中。 t t檢驗:檢驗: 計算一個包含計算一個包含P P個自變量的多重線性回個自變量的多重線性回歸方程,再用歸方程,再用t t檢驗法對各偏回歸系數(shù)進行檢驗法對各偏回歸系數(shù)進行假設檢驗。假設檢驗。線性回歸線性回歸(Linear regression)線性回歸線性回
41、歸(Linear regression)wH0:i0wH1:i0w0.05wP10.001,P2=0.008,均拒絕,均拒絕H0,接受,接受H1,可認,可認為父親身高和母親身高的偏回歸系數(shù)均有統(tǒng)計學意為父親身高和母親身高的偏回歸系數(shù)均有統(tǒng)計學意義。義。 ibiSbt0模型模型偏回歸系數(shù)偏回歸系數(shù)標準誤標準誤標準回歸系數(shù)標準回歸系數(shù)t值值P值值常數(shù)項常數(shù)項-41.94019.650-2.1340.062父親身高父親身高 0.861 0.1320.701 6.5270.000母親身高母親身高 0.445 0.1320.363 3.3820.008線性回歸線性回歸(Linear regression
42、)w回歸方程為回歸方程為wX1的偏回歸系數(shù)的偏回歸系數(shù)b10.861的意義為母親身的意義為母親身高不變的情況下,父親身高每增加高不變的情況下,父親身高每增加1cm,兒,兒子的身高平均增加子的身高平均增加0.861cm。w標化偏回歸系數(shù)分別為標化偏回歸系數(shù)分別為0.701和和0.363。即對。即對兒子身高影響較大的是父親的身高,其次為兒子身高影響較大的是父親的身高,其次為母親的身高。母親的身高。21445. 0861. 0940.41XXYw篩選自變量的方法:篩選自變量的方法:最優(yōu)子集法(最優(yōu)子集法(the best subset):得到):得到的回歸方程殘差最小。的回歸方程殘差最小。強制法(強
43、制法(enter):即所有自變量均進入):即所有自變量均進入方程。方程。向前法(向前法(forward)向后法(向后法(backward):可反映自變量間):可反映自變量間的交互作用。的交互作用。逐步法(逐步法(stepwise)線性回歸線性回歸(Linear regression)線性回歸線性回歸(Linear regression)w例例25 某醫(yī)學院校對某醫(yī)學院校對25名健康男性教工測定年名健康男性教工測定年齡(齡(x1)、體重()、體重(x2) 、跑完、跑完1000米用時米用時(x3) 、跑時平均脈搏數(shù)(、跑時平均脈搏數(shù)(x4) 、跑后動脈、跑后動脈血氧分壓(血氧分壓(y),要分析跑后
44、動脈血氧分壓與),要分析跑后動脈血氧分壓與其它其它4項指標的關系。項指標的關系。線性回歸線性回歸(Linear regression)wH0:1340wH1:各偏回歸系數(shù):各偏回歸系數(shù)i不全為不全為0w0.05w可認為回歸方程成立??烧J為回歸方程成立。SourceSSdfMSFsig回歸回歸12.80334.26820.7000.000殘差殘差4.330210.206總總17.13324線性回歸線性回歸(Linear regression)wH0:i0wH1:i0w0.05ibiSbt0模型模型偏回歸偏回歸系數(shù)系數(shù)標準誤標準誤標準回歸標準回歸系數(shù)系數(shù)t值值P值值常數(shù)項常數(shù)項8.8102.068
45、4.2590.000年齡年齡-0.0760.018-0.508-4.307 0.000所用時間所用時間-0.5340.109-0.581-4.909 0.000跑時平均心率跑時平均心率0.0240.0110.2782.2850.033線性回歸線性回歸(Linear regression)w以跑后動脈血氧分壓以跑后動脈血氧分壓Y為應變量,年齡為應變量,年齡X1、體重體重X2 、跑完、跑完1000米用時米用時X3、跑時平均、跑時平均脈搏數(shù)脈搏數(shù)X4為自變量做線性回歸分析,所得為自變量做線性回歸分析,所得的回歸模型(方程)為:的回歸模型(方程)為:431024. 0538. 0076. 0810.
46、8XXXY線性回歸線性回歸(Linear regression)w標化偏回歸系數(shù)分別為標化偏回歸系數(shù)分別為-0.508、-0.581和和0.278。即對跑后動脈血氧分壓影響。即對跑后動脈血氧分壓影響較大的是跑完較大的是跑完1000米用時,其次為年齡。米用時,其次為年齡。 Logistic回歸回歸計數(shù)資料計數(shù)資料二分類二分類多分類多分類等級資料等級資料Binary Logistic regressionMultinomial Logistic regressionOrdinal regressionw哪些因素導致了人群中有的人患胃癌而哪些因素導致了人群中有的人患胃癌而有的人不患胃癌有的人不患胃癌
47、?w哪些因素導致了手術后有的人感染,而哪些因素導致了手術后有的人感染,而有的人不感染?有的人不感染?Logistic回歸回歸wLogistic回歸的概念:Logistic回歸是一種用于多因素分析的曲線模型,特別適用于應變量為離散型多項分類的資料。二分類二分類Logistic回歸回歸wLogistic回歸的概率公式:回歸的概率公式:1).exp(11)0().exp(1).exp()1(01221102211022110QpxxxYQxxxxxxYPYmmmmmm出現(xiàn)失敗的結果出現(xiàn)成功的結果 對概率P取logit變換,則Logistic回歸模型變成:mmxxxQPPit.)ln()(log221
48、10即:變量logit(P)關于x的線性函數(shù)。 P/Q表示了某事件發(fā)生的比數(shù)比(odds)。Logistic回歸對變量的要求:應變量為二分類或多分類變量自變量為數(shù)值變量、等級或二分類變量多分類的計數(shù)資料需進行變量轉換,形成一組啞變量(dummy variable)篩選自變量:l 意義:l 方法:前進法(Forward)后退法(Backward)逐步法(Stepwise)篩選方法:似然比檢驗、Wald檢驗w檢驗一:對建立的整個模型做檢驗。檢驗一:對建立的整個模型做檢驗。 檢驗方法檢驗方法 似然比檢驗似然比檢驗 (likelihood ratio test) 檢驗全部自變量(包括常數(shù)項)對應變量的
49、聯(lián)檢驗全部自變量(包括常數(shù)項)對應變量的聯(lián)合作用,即整個回歸方程是否有意義。合作用,即整個回歸方程是否有意義。0:210mH1:12)0jHjm各 (, , ,不全為說明自變量對說明自變量對y的作用是否有的作用是否有統(tǒng)計意義。統(tǒng)計意義。w檢驗二:檢驗模型中某檢驗二:檢驗模型中某是否對是否對y有作用。有作用。 檢驗假設:檢驗假設: 檢驗統(tǒng)計量:主要為檢驗統(tǒng)計量:主要為Wald檢驗檢驗0:0jH1:0jH22)(jbjSb=1Logistic回歸系數(shù)的解釋:l當偏回歸系數(shù)為正時,x增加,OR增加,為危險因素。l當偏回歸系數(shù)為負時,x增加導致OR減小,為保護因素。Logistic 回歸中回歸系數(shù)的意
50、義回歸中回歸系數(shù)的意義Logistic 回歸中回歸系數(shù)的意義回歸中回歸系數(shù)的意義0(常數(shù)項)(常數(shù)項):暴露因素:暴露因素xi=0時,個體發(fā)病時,個體發(fā)病概率與不發(fā)病概率之比的自然對數(shù)比值。概率與不發(fā)病概率之比的自然對數(shù)比值。 0=)0|0(1)0|1(ln xyPxyPmmxxxPP 22110=1lnlogit(P)Logistic 回歸中回歸系數(shù)的意義回歸中回歸系數(shù)的意義w當某暴露因素當某暴露因素xi(危險因素)(危險因素)只有兩個水只有兩個水平平時,且暴露時為時,且暴露時為1,不暴露時為,不暴露時為0, 則則模型中該暴露變量前的系數(shù)模型中該暴露變量前的系數(shù)i就是當其它就是當其它變量值固
51、定時,變量值固定時, xi暴露與不暴露的比數(shù)比暴露與不暴露的比數(shù)比的對數(shù)值。的對數(shù)值。 即即:Ln(OR) = i 或或 OR = exp(i)Logistic 回歸中回歸系數(shù)的意義回歸中回歸系數(shù)的意義w當暴露因素為當暴露因素為等級變量等級變量時,如收入水平,時,如收入水平, xi 的取值為:的取值為:1、2、3、 4表示不同的表示不同的等級。等級。 i的意義為當其它變量值固定時,的意義為當其它變量值固定時,xi每相差一個等級時的比數(shù)比的對數(shù),而每相差一個等級時的比數(shù)比的對數(shù),而Exp(i)表示表示xi每增加一個等級時的比數(shù)每增加一個等級時的比數(shù)比比Logistic 回歸中回歸系數(shù)的意義回歸中
52、回歸系數(shù)的意義w當暴露因素為當暴露因素為連續(xù)變量連續(xù)變量(如年齡)時,(如年齡)時,i i就表示當其它變量值固定時就表示當其它變量值固定時, ,年齡每增年齡每增加一歲時比數(shù)比的對數(shù)。加一歲時比數(shù)比的對數(shù)。Exp(Exp(i i) )表示年表示年齡增加一歲時比數(shù)比。齡增加一歲時比數(shù)比。例例26 26 自變量是分類型變量自變量是分類型變量 為了了解冠心病與種族的關系,某研究所為了了解冠心病與種族的關系,某研究所調查了調查了100100個樣品,數(shù)據(jù)列在下表中。試估計各個樣品,數(shù)據(jù)列在下表中。試估計各種族間患冠心病的相對危險度。種族間患冠心病的相對危險度。設設y=1表示患冠心病,表示患冠心病,y=0表
53、示未患冠心病。把種表示未患冠心病。把種族轉換為兩個啞變量族轉換為兩個啞變量, x(1)=1表示黑人,表示黑人,x(2)=1表表示其它種族示其它種族,兩個啞變量都為兩個啞變量都為0時表示白人時表示白人.Variables in the Equation11.3322.0032.079.63210.8101.0018.0001.609.5837.6181.0065.000-1.386.5007.6871.006.250XX(1)X(2)ConstantStep1aBS.E.WalddfSig.Exp(B)Variable(s) entered on step 1: X.a. 模型總體檢驗結果說明該模型具有統(tǒng)計意義模型總體檢驗結果說明該模型具有統(tǒng)計意義(p=0.0035)。參數(shù)檢驗說明,黑人與白人患冠心病的相對危險度是:參數(shù)檢驗說明,黑人與白人患冠心病的相對危險度是:OR=8(p=0.0010),說明黑人患冠心病的幾率大約是白人的說明黑人患冠心病的幾率大約
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新型鄰苯二甲腈樹脂合成及其改性環(huán)氧樹脂性能研究
- 健康評估實驗報告
- 冬季安全教育班會
- 生動活潑健康課件
- 《社會財務共享服務實務》課件-智能報稅
- 預防疾病課件
- 行政管理制度培訓
- 《航空渦輪發(fā)動機》課件-27典型高涵道比渦扇發(fā)動機起飛推力設置與發(fā)動機環(huán)境污染介紹
- 勞動促成長健康伴我行
- 預算工程師課件
- 商業(yè)保理行業(yè)營銷策略方案
- 《掃描電子顯微鏡》課件
- 水利水電工程施工截流設計說明書
- 變速箱廠總平面布置設計設施規(guī)劃與物流分析課程設計
- 兒科高級生命支持(NEW)
- 婦科門診工作流程
- 鋼筋加工廠安全教育培訓
- 高中數(shù)學研究性學習報告
- 學校章程樣稿
- 天然藥物提取與分離技術
- GB/T 18255-2022焦化粘油類產品餾程的測定方法
評論
0/150
提交評論