常用假設(shè)檢驗方法和回歸分析綜述_第1頁
常用假設(shè)檢驗方法和回歸分析綜述_第2頁
常用假設(shè)檢驗方法和回歸分析綜述_第3頁
常用假設(shè)檢驗方法和回歸分析綜述_第4頁
常用假設(shè)檢驗方法和回歸分析綜述_第5頁
已閱讀5頁,還剩85頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

常用假設(shè)檢驗方法和回歸分析綜述第一頁,共九十頁,2022年,8月28日

資料計量資料計數(shù)資料等級資料正態(tài)分布資料非正態(tài)分布資料t檢驗方差分析→秩和檢驗→χ2檢驗→秩和檢驗第二頁,共九十頁,2022年,8月28日常見的設(shè)計類型單樣本設(shè)計配對設(shè)計完全隨機設(shè)計配伍組設(shè)計析因設(shè)計拉丁方設(shè)計正交設(shè)計重復測量第三頁,共九十頁,2022年,8月28日單樣本資料(One-sampledata)已知一個總體的參數(shù)和一份樣本第四頁,共九十頁,2022年,8月28日例1:某醫(yī)生在一山區(qū)隨機抽查了25名健康成年男子,求得脈搏均數(shù)為74.2次/分,標準差為6.0次/分。根據(jù)大量調(diào)查,健康成年男子的脈搏均數(shù)為72次/分,能否認為該山區(qū)健康成年男子的脈搏均數(shù)高于一般?單樣本資料(One-sampledata)第五頁,共九十頁,2022年,8月28日單樣本資料(One-sampledata)例2某醫(yī)師在某地某工廠隨機抽取16名工人,測得尿鉛含量(μmol/L)為0.65,0.78,2.13,2.48,2.54,2.68,2.73,3.01,3.13,3.27,3.54,4.38,4.47,5.05,6.08,11.27.已知該地正常人尿鉛含量的中位數(shù)為2.50μmol/L,問該工廠工人的尿鉛含量是否高于當?shù)卣H耍康诹摚簿攀摚?022年,8月28日配對資料(Paired-sampledata)配對設(shè)計資料:將受試對象按一定條件配成對子,分別給予每對中的兩個受試對象以不同的處理。自身對照資料:同一個受試對象給予不同的處理或者處理前后的觀察結(jié)果。第七頁,共九十頁,2022年,8月28日配對資料(Paired-sampledata)例315名接種卡介苗的兒童,8周后用兩批不同的結(jié)核菌素,一批是標準結(jié)核菌素,一批是新制結(jié)核菌素,分別注射在兒童的左右前臂。以皮膚浸潤直徑(mm)為指標。數(shù)據(jù)如下表所示。編號123456789101112131415標準品12.014.515.513.012.010.57.59.015.013.014.014.06.511.05.5新制品10.010.012.510.05.58.56.55.58.06.55.510.04.03.53.5第八頁,共九十頁,2022年,8月28日例4為研究女性服用某避孕新藥后是否影響其血清總膽固醇含量,將20名女性按年齡配成10對。每對中隨機抽取一人服用新藥,另一人服用安慰劑。經(jīng)過一定時間后,測得血清總膽固醇含量(mmol/L),結(jié)果見下表。問新藥是否影響女性血清總膽固醇含量?配對資料(Paired-sampledata)編號12345678910標準品4.45.05.84.64.94.86.05.94.35.1新制品6.25.25.55.04.45.45.06.45.86.2第九頁,共九十頁,2022年,8月28日

兩種方法測定水中硫酸鹽的含量(mmol/L)水樣號(1)EDTA法(2)重量法(3)1129.89119.58259.6852.63328.7929.68469.8570.56546.7842.5662.353.2171.562.42878.8870.56956.8750.551066.8562.45配對資料(Paired-sampledata)第十頁,共九十頁,2022年,8月28日配對資料(Paired-sampledata)例6某醫(yī)院采用甲乙兩種方法測定60例惡性腫瘤患者體內(nèi)ck20基因表達陽性率,甲法測定陽性率為70.0%,乙法測定陽性率為38.3%,兩種方法一致測定陽性率為26.7%。比較甲乙兩種方法的測定陽性率是否有差異?組別陽性陰性合計陽性率(%)甲法42186070.0乙法23376038.3合計655512054.2第十一頁,共九十頁,2022年,8月28日配對資料(Paired-sampledata)甲法乙法合計+-+162642-71118合計233760第十二頁,共九十頁,2022年,8月28日成組設(shè)計(完全隨機設(shè)計):將受試對象按照隨機分配的原則分配到實驗組和對照組中,然后給予不同的處理因素,對各組的效應(yīng)進行同期平行觀察,最后比較各組的觀察指標有無差別。

成組設(shè)計(completelyrandomizeddesign)第十三頁,共九十頁,2022年,8月28日

例7為研究肥胖與脂質(zhì)代謝的關(guān)系,在某地小學中隨機抽取30名肥胖兒童(肥胖組)和30名正常兒童(對照組),用改良八木國夫法測定兩組兒童血中脂質(zhì)過氧化物(LPO)得下表結(jié)果,能否認為肥胖與脂質(zhì)代謝有關(guān)?表兩組兒童血中LPO含量(mol/L)分組n肥胖組309.36±1.83對照組307.58±0.64成組設(shè)計兩樣本資料第十四頁,共九十頁,2022年,8月28日成組設(shè)計兩樣本資料例8某醫(yī)生隨機抽取正常人和腦病病人各11例,測定尿中類固醇排出量(mg/dl),結(jié)果如下表

分組尿中類固醇排出量(mg/dl)正常人2.905.415.484.604.035.104.974.244.373.052.78腦病病人5.288.793.846.463.796.645.894.577.716.024.06第十五頁,共九十頁,2022年,8月28日成組設(shè)計兩樣本資料例9為觀察美能注射液對酒精性脂肪肝降血脂的作用,將72例酒精性脂肪肝患者隨機分為兩組,觀察組38例應(yīng)用美能注射液靜脈注射,對照組34例口服非諾貝特膠囊,一個療程后比較兩組療效。結(jié)果見下表:分組時間TCTGLDL-CHDL-C觀察組治療前6.60±1.123.32±1.223.86±0.760.82±0.16治療后5.64±0.862.46±0.862.86±0.701.74±0.24對照組治療前6.58±0.973.34±1.282.68±0.780.86±0.18治療后5.49±0.822.34±0.882.58±0.681.68±0.18第十六頁,共九十頁,2022年,8月28日成組設(shè)計兩樣本資料例102005年某縣疾病預(yù)防控制中心為評價該縣小學生卡介苗抗體效價,隨機抽取了30名小學生,測定結(jié)果見下表。性別卡介苗抗體滴度倒數(shù)男生40201604032080402040801604080404040女生80201604040160402040160160408040第十七頁,共九十頁,2022年,8月28日成組設(shè)計兩樣本資料例11某醫(yī)生研究男性甲狀腺機能減退癥患者尺骨骨礦含量與正常人是否有差別,隨機抽取10例患者和10例正常人,分別測得骨礦含量如下(g/cm2)?;颊呓M:0.310.350.370.390.520.620.620.630.740.98正常組:0.280.290.310.350.360.370.410.480.530.53第十八頁,共九十頁,2022年,8月28日例12某醫(yī)生用某種中藥治療I型糖尿病患者和II型糖尿病患者共45例,結(jié)果見下表。該中藥對兩型糖尿病的療效有無差異?組別無效好轉(zhuǎn)顯效合計Ⅰ型糖尿病98522Ⅱ型糖尿病391123成組設(shè)計兩樣本資料第十九頁,共九十頁,2022年,8月28日成組設(shè)計兩樣本資料例13某醫(yī)師為比較中藥和西藥治療胃炎的療效,隨機抽取140例胃炎患者分成中藥組和西藥組,結(jié)果中藥組治療80例,有效64例,西藥組治療60例,有效35例。中西藥治療胃炎的療效有無差別?組別有效無效合計中藥641680西藥352560第二十頁,共九十頁,2022年,8月28日四格表2檢驗的應(yīng)用條件n≥40和T≥5,用2檢驗。n≥40,1≤T<5,校正2檢驗。n<40,或T<1,不能用2檢驗,可改用確切概率法。第二十一頁,共九十頁,2022年,8月28日成組設(shè)計兩樣本資料

中藥和西藥治療胃炎患者有效率的比較藥物有效無效合計中藥641680西藥352560合計9941140第二十二頁,共九十頁,2022年,8月28日成組設(shè)計兩樣本資料中藥和西藥治療非典病人有效率的比較

組別緩解數(shù)未緩解數(shù)合計陽性率(%)西藥2101216.7中藥14142850.0合計16244040.0(4.8)第二十三頁,共九十頁,2022年,8月28日成組設(shè)計兩樣本資料為比較中西藥治療急性心肌梗塞的療效,某醫(yī)師將27例急性心肌梗塞患者隨機分成兩組,分別給予中藥和西藥治療,結(jié)果見下表,中藥和西藥的療效是否有差異?藥物有效無效合計有效率(%)中藥1221485.7西藥671346.2合計1892766.7第二十四頁,共九十頁,2022年,8月28日成組設(shè)計多樣本資料例14某社區(qū)隨機抽取了30名糖尿病人、IGT異常和正常人進行載脂蛋白(mg/dL)測定,結(jié)果見下表。問三種人的載脂蛋白有無差別?人群糖尿病人(n=11)105.45±10.87IGT異常者(n=9)102.39±14.55正常人(n=10)122.80±17.07第二十五頁,共九十頁,2022年,8月28日成組設(shè)計多樣本資料例15某醫(yī)生為研究慢性阻塞性肺部疾病患者的肺動脈血氧分壓情況,按肺動脈壓的分級標準將44例患者隨機分為三組,分別測量肺動脈血氧分壓,結(jié)果見下表。三組患者之間動脈血氧分壓有無差異?肺動脈正常組556969728080849091929297100108109隱性肺動脈高壓組455657596666707476777880839092肺動脈高壓組2438394250505660626568718181第二十六頁,共九十頁,2022年,8月28日成組設(shè)計多樣本資料三種中藥治療流感的療效比較組別有效例數(shù)無效例數(shù)合計有效率(%)熱毒清5826096.7板蘭根48126080.0復方板蘭根5736095.0合計1631718090.6第二十七頁,共九十頁,2022年,8月28日成組設(shè)計多樣本資料例17某醫(yī)生用七氟醚對即行肺切除術(shù)的三組患者進行麻醉,麻醉效果分三級,結(jié)果如下,問三組患者的麻醉效果是否相同?組別ⅠⅡⅢ合計肺癌1813839肺化膿癥12151340肺結(jié)核9111939第二十八頁,共九十頁,2022年,8月28日隨機區(qū)組設(shè)計(Randomizedblockdesign)又稱為配伍設(shè)計,它是配對設(shè)計的擴大。隨機區(qū)組設(shè)計是將幾個條件相同的受試對象劃成一個區(qū)組,區(qū)組中觀察對象的數(shù)量取決于對比組的組數(shù)。如處理因素有四個對比組,則一個區(qū)組就有四個或八個受試對象。將區(qū)組中的受試對象采用隨機的方法,分配到不同的對比組中,以增強各對比組的均衡性。第二十九頁,共九十頁,2022年,8月28日隨機區(qū)組設(shè)計資料例18對小白鼠喂以A、B、C三種不同的營養(yǎng)素,目的是了解不同營養(yǎng)素增重的效果。采用隨機區(qū)組設(shè)計方法,以窩別作為劃分區(qū)組的特征,以消除遺傳因素對體重增長的影響?,F(xiàn)將同品系、同體重的24只小白鼠分為8個區(qū)組,每個區(qū)組3只小白鼠。三周后體重增加結(jié)果(克)列于表3。問小白鼠經(jīng)三種不同營養(yǎng)素喂養(yǎng)后所增體重有無差別?第三十頁,共九十頁,2022年,8月28日表不同營養(yǎng)素組小白鼠增加體重(g)配伍組ABC150.158.264.557.6247.848.562.452.9353.153.858.655.2463.564.272.566.7571.268.479.373.0641.445.738.441.8761.953.051.255.4842.239.846.242.7合計431.2431.6473.124(N)53.9053.9559.1455.66()第三十一頁,共九十頁,2022年,8月28日隨機區(qū)組設(shè)計資料例19觀測龍葵濃縮果汁對S180實體瘤NK細胞活性的影響,將同種屬的32只大白鼠按窩別、性別、體重配成10個區(qū)組,建成S180實體瘤模型。一定時間后將小鼠脫椎處死,測定并計算NK細胞活性,結(jié)果見下表,不同劑量組之間小鼠NK細胞活性有無差異?第三十二頁,共九十頁,2022年,8月28日表龍葵濃縮果汁不同劑量組小鼠NK細胞活性測定結(jié)果(%)配伍組高劑量組中劑量組低劑量組對照組120.717.312.36.5212.411.618.68.4314.914.610.811.3418.59.419.915.6513.29.09.08.9614.220.111.514.1712.811.57.312.3813.511.714.710.6914.410.912.69.81013.818.49.57.2第三十三頁,共九十頁,2022年,8月28日析因設(shè)計資料(Factorialdesigndata)例20某研究人員為了解升白細胞藥物和純苯對大鼠吞噬指數(shù)的影響,以及兩者同時使用的作用,將20只性別相同、體重相近的大鼠,按A、B兩因素有無分為四組,測得其吞噬指數(shù)結(jié)果如下:用升白細胞藥物不用升白細胞藥物用純苯不用純苯用純苯不用純苯1.943.801.853.882.253.902.013.842.034.062.103.962.103.851.923.922.083.842.043.80第三十四頁,共九十頁,2022年,8月28日析因設(shè)計資料結(jié)果:SourceSSdfMSFsigA0.01410.0141.5190.236B17.168117.1681857.0090.000A*B0.00910.0091.0000.332第三十五頁,共九十頁,2022年,8月28日拉丁方設(shè)計(Latinsquaredesign)拉丁方設(shè)計是將三個因素按水平數(shù)r排列成一個r×r隨機方陣,要求各因素的水平數(shù)相等且無交互作用,并要盡量避免數(shù)據(jù)缺失??梢杂幂^少的重復次數(shù)獲得較多的信息。第三十六頁,共九十頁,2022年,8月28日拉丁方設(shè)計資料例21為研究不同劑量甲狀腺素注射液對甲狀腺體的影響,以豚鼠5個種系,每個種系各5只,分養(yǎng)于5個籠子,每籠內(nèi)放置各種系豚鼠1只,并以甲狀腺素的5個不同劑量分別注射,測得甲狀腺素的重量如下表:種系

籠號ⅠⅡⅢⅣⅤ甲C(65)E(85)A(57)B(49)D(79)乙E(82)A(73)D(92)B(81)B(63)丙D(68)C(67)A(56)D(77)C(51)丁B(63)E(99)C(70)E(76)A(41)戊D(75)A(46)B(52)E(68)C(66)第三十七頁,共九十頁,2022年,8月28日拉丁方設(shè)計資料結(jié)果:SourceSSdfMSFsig劑量2690.9604672.7408.0080.002種系375.760493.9401.1180.393籠子908.1604227.0402.7030.081第三十八頁,共九十頁,2022年,8月28日正交設(shè)計(Orthogonaldesign)正交設(shè)計利用一套規(guī)格化的正交表將各實驗因素、各水平之間的組合均勻搭配,合理安排,大大減少實驗次數(shù),提供較多的信息。正交設(shè)計可以了解哪些因素存在交互效應(yīng),還可以找出諸因素各水平的最佳組合;避免了析因設(shè)計的全面試驗、工作量大的弊病。第三十九頁,共九十頁,2022年,8月28日正交設(shè)計資料例22過氧乙酸是廣泛使用的消毒劑,但其有效成分極不穩(wěn)定,以致影響其消毒效果?,F(xiàn)欲通過實驗找出有關(guān)因素對其穩(wěn)定性的影響,選出各因素的一個最佳組合,組成保持過氧乙酸穩(wěn)定性的最優(yōu)條件。已知的可能影響因素及水平有:水平12A:穩(wěn)定劑加磷酸0.3%不加磷酸B:水浴溫度25~30oC35~40oCC:浸泡口表浸泡口表10支不浸口表D:加蓋與否加蓋不加蓋第四十頁,共九十頁,2022年,8月28日正交設(shè)計資料同時穩(wěn)定劑和水浴溫度、穩(wěn)定劑與加蓋與否間可能存在交互效應(yīng)?,F(xiàn)根據(jù)L8正交設(shè)計表進行了實驗,每種組合重復兩次,測得數(shù)據(jù)如下:ABCD第一次測量第二次測量11117.004.1111226.053.5012121.100.8012211.900.9621122.401.6521214.001.5022110.350.3022220.300.90第四十一頁,共九十頁,2022年,8月28日正交設(shè)計資料結(jié)果:SourceSSdfMSFsigA12.285112.2859.2720.014B34.810134.81026.2740.001C0.12210.1220.0920.768D0.73110.7310.5520.477A*B4.20214.2023.1720.109A*D0.16410.1640.1240.733第四十二頁,共九十頁,2022年,8月28日重復測量資料(Repeatedmeasurementdata)重復測量資料:同一受試對象的同一觀察指標在不同時間點上進行測量所得的資料。重復測量資料的方差分析,除需滿足一般方差分析的條件外,還需滿足協(xié)方差陣(covariancematrix)的球形性(sphericity)。球?qū)ΨQ性通常采用Mauchly檢驗來判斷。第四十三頁,共九十頁,2022年,8月28日重復測量資料例23某研究者為了解某藥對血液某因子的提升作用,將16名患者隨機分為2組,一組用該藥,另一組用傳統(tǒng)藥,分別與治療前和治療后1,2,3周測定結(jié)果,資料如下:第四十四頁,共九十頁,2022年,8月28日重復測量資料受試對象j組別k測定時間i(周)受試對象j組別k測定時間i(周)01230123119.7354.6155.9146.81925.6426.3231.5645.69215.5050.8779.9082.371022.5615.2423.2633.27317.9633.4346.1056.211123.6918.7521.3035.69412.3718.6533.1256.051227.5222.3232.5642.12514.3725.8551.2668.231328.3332.2141.5655.12616.3048.2365.1878.361425.6841.1253.4562.54718.3452.1365.3269.511523.6638.5645.1656.33812.9823.4546.8756.211624.8731.2542.6545.77第四十五頁,共九十頁,2022年,8月28日重復測量資料結(jié)果:SourceSSdfMSFP處理2214.05512214.0557.4870.016時間22615.62337538.541145.3380.000處理*時間826.4113275.4705.3110.003第四十六頁,共九十頁,2022年,8月28日回歸分析(Regressionanalysis)線性回歸(Linearregression)Logistic回歸(Logisticregression)Cox回歸(Coxregression)第四十七頁,共九十頁,2022年,8月28日例24

為探討父母身高對子女成年后身高的影響,某研究者調(diào)查了12個家庭的父母和成年兒子的身高,見下表,請建立回歸方程。家庭編號父親身高x1(cm)母親身高x2(cm)兒子身高y(cm)117214917321881671903176164182417014917051851701956182164190717316218281851601899179158182101701501721116816017012170164178第四十八頁,共九十頁,2022年,8月28日回歸分析的前提條件線性(Linearity)獨立性(Independence)正態(tài)性(Normality)等方差(Equalvariance)線性回歸(Linearregression)第四十九頁,共九十頁,2022年,8月28日線性回歸(Linearregression)線性回歸方程b1,b2…bk稱偏回歸系數(shù)(Partialregressioncoefficient),b0為截距(intercept)。第五十頁,共九十頁,2022年,8月28日

偏回歸系數(shù)(Partialregressioncoefficient):

bk是自變量xk的偏回歸系數(shù),表示當方程中其它自變量保持不變時,自變量xk每變化一個單位,應(yīng)變量平均變化bk個單位。線性回歸(Linearregression)第五十一頁,共九十頁,2022年,8月28日第五十二頁,共九十頁,2022年,8月28日標準化偏回歸系數(shù)(standardizedpartialregressioncoefficient)表示自變量對應(yīng)變量的貢獻大小的指標,標準化偏回歸系數(shù)越大,表示自變量對應(yīng)變量的貢獻越大。線性回歸(Linearregression)第五十三頁,共九十頁,2022年,8月28日線性回歸(Linearregression)例24中以兒子的身高為應(yīng)變量Y,父親的身高X1、母親的身高X2為自變量,進行多重回歸分析,所得的回歸模型(方程)為第五十四頁,共九十頁,2022年,8月28日線性回歸(Linearregression)

假設(shè)檢驗:(1)多重線性回歸方程的假設(shè)檢驗:檢驗應(yīng)變量y與P個自變量之間是否存在線性回歸關(guān)系,用方差分析。第五十五頁,共九十頁,2022年,8月28日線性回歸(Linearregression)H0:β1=β2=…βi=0H1:各偏回歸系數(shù)βi不全為0α=0.05可認為父母身高與兒子身高的多重線性回歸方程有統(tǒng)計學意義,回歸方程成立。SourceSSdfMSFsig回歸767.5092383.75464.6680.000殘差53.40895.934

總820.91711第五十六頁,共九十頁,2022年,8月28日(2)偏回歸系數(shù)的假設(shè)檢驗:為檢驗每個自變量是否對y都有線性回歸關(guān)系,需分別對每個自變量進行假設(shè)檢驗,以免把作用不顯著的自變量引入方程中。

t檢驗:計算一個包含P個自變量的多重線性回歸方程,再用t檢驗法對各偏回歸系數(shù)進行假設(shè)檢驗。線性回歸(Linearregression)第五十七頁,共九十頁,2022年,8月28日線性回歸(Linearregression)H0:βi=0H1:βi≠0α=0.05P1<0.001,P2=0.008,均拒絕H0,接受H1,可認為父親身高和母親身高的偏回歸系數(shù)均有統(tǒng)計學意義。模型偏回歸系數(shù)標準誤標準回歸系數(shù)t值P值常數(shù)項-41.94019.650-2.1340.062父親身高0.8610.1320.7016.5270.000母親身高0.4450.1320.3633.3820.008第五十八頁,共九十頁,2022年,8月28日線性回歸(Linearregression)回歸方程為X1的偏回歸系數(shù)b1=0.861的意義為母親身高不變的情況下,父親身高每增加1cm,兒子的身高平均增加0.861cm。標化偏回歸系數(shù)分別為0.701和0.363。即對兒子身高影響較大的是父親的身高,其次為母親的身高。第五十九頁,共九十頁,2022年,8月28日篩選自變量的方法:最優(yōu)子集法(thebestsubset):得到的回歸方程殘差最小。強制法(enter):即所有自變量均進入方程。向前法(forward)向后法(backward):可反映自變量間的交互作用。逐步法(stepwise)線性回歸(Linearregression)第六十頁,共九十頁,2022年,8月28日線性回歸(Linearregression)例25某醫(yī)學院校對25名健康男性教工測定年齡(x1)、體重(x2)、跑完1000米用時(x3)、跑時平均脈搏數(shù)(x4)、跑后動脈血氧分壓(y),要分析跑后動脈血氧分壓與其它4項指標的關(guān)系。第六十一頁,共九十頁,2022年,8月28日線性回歸(Linearregression)H0:β1=β3=β4=0H1:各偏回歸系數(shù)βi不全為0α=0.05可認為回歸方程成立。SourceSSdfMSFsig回歸12.80334.26820.7000.000殘差4.330210.206總17.13324第六十二頁,共九十頁,2022年,8月28日線性回歸(Linearregression)H0:βi=0H1:βi≠0α=0.05模型偏回歸系數(shù)標準誤標準回歸系數(shù)t值P值常數(shù)項8.8102.0684.2590.000年齡-0.0760.018-0.508-4.3070.000所用時間-0.5340.109-0.581-4.9090.000跑時平均心率0.0240.0110.2782.2850.033第六十三頁,共九十頁,2022年,8月28日線性回歸(Linearregression)以跑后動脈血氧分壓Y為應(yīng)變量,年齡X1、體重X2

、跑完1000米用時X3、跑時平均脈搏數(shù)X4為自變量做線性回歸分析,所得的回歸模型(方程)為:第六十四頁,共九十頁,2022年,8月28日線性回歸(Linearregression)標化偏回歸系數(shù)分別為-0.508、-0.581和0.278。即對跑后動脈血氧分壓影響較大的是跑完1000米用時,其次為年齡。

第六十五頁,共九十頁,2022年,8月28日Logistic回歸計數(shù)資料二分類多分類等級資料→BinaryLogisticregression→MultinomialLogisticregression→Ordinalregression第六十六頁,共九十頁,2022年,8月28日醫(yī)學研究者經(jīng)常關(guān)心的問題諸如:哪些因素導致了人群中有的人患胃癌而有的人不患胃癌?哪些因素導致了手術(shù)后有的人感染,而有的人不感染?

是回歸分析的問題嗎?第六十七頁,共九十頁,2022年,8月28日“問題如何解決?”

y=f(x)p=p(y=1|x)=p(x)不能直接分析變量y與x的關(guān)系轉(zhuǎn)換為分析y取某個值的概率變量

p與x的關(guān)系y=1,0x任意0≤p≤1,x任意Logistic回歸模型不存在第六十八頁,共九十頁,2022年,8月28日Logistic回歸Logistic回歸的概念:Logistic回歸是一種用于多因素分析的曲線模型,特別適用于應(yīng)變量為離散型多項分類的資料。第六十九頁,共九十頁,2022年,8月28日二分類Logistic回歸Logistic回歸的概率公式:第七十頁,共九十頁,2022年,8月28日

對概率P取logit變換,則Logistic回歸模型變成:二分類Logistic回歸即:變量logit(P)關(guān)于x的線性函數(shù)。

P/Q表示了某事件發(fā)生的比數(shù)比(odds)。第七十一頁,共九十頁,2022年,8月28日Logistic回歸對變量的要求:應(yīng)變量為二分類或多分類變量自變量為數(shù)值變量、等級或二分類變量多分類的計數(shù)資料需進行變量轉(zhuǎn)換,形成一組啞變量(dummyvariable)二分類Logistic回歸第七十二頁,共九十頁,2022年,8月28日篩選自變量:意義:將回歸系數(shù)有顯著意義的自變量選入模型中,作用不顯著的自變量則排除在外。方法:前進法(Forward)后退法(Backward)逐步法(Stepwise)篩選方法:似然比檢驗、Wald檢驗二分類Logistic回歸第七十三頁,共九十頁,2022年,8月28日Logistic回歸模型的假設(shè)檢驗檢驗一:對建立的整個模型做檢驗。

檢驗方法

似然比檢驗

(likelihoodratiotest)

檢驗全部自變量(包括常數(shù)項)對應(yīng)變量的聯(lián)合作用,即整個回歸方程是否有意義。說明自變量對y的作用是否有統(tǒng)計意義。第七十四頁,共九十頁,2022年,8月28日檢驗二:檢驗?zāi)P椭心肠率欠駥有作用。檢驗假設(shè):檢驗統(tǒng)計量:主要為Wald檢驗ν=1Logistic回歸模型的假設(shè)檢驗第七十五頁,共九十頁,2022年,8月28日Logistic回歸系數(shù)的解釋:當偏回歸系數(shù)為正時,x增加,OR增加,為危險因素。當偏回歸系數(shù)為負時,x增加導致OR減小,為保護因素。Logistic回歸中回歸系數(shù)的意義第七十六頁,共九十頁,2022年,8月28日Logistic回歸中回歸系數(shù)的意義β0(常數(shù)項):暴露因素xi=0時,個體發(fā)病概率與不發(fā)病概率之比的自然對數(shù)比值。第七十七頁,共九十頁,2022年,8月28日Logistic回歸中回歸系數(shù)的意義當某暴露因素xi(危險因素)只有兩個水平時,且暴露時為1,不暴露時為0,則模型中該暴露變量前的系數(shù)βi就是當其它變量值固定時,xi暴露與不暴露的比數(shù)比的對數(shù)值。即:Ln(OR)=

βi

或OR=

exp(βi)

第七十八頁,共九十頁,2022年,8月28日Logistic回歸中回歸系數(shù)的意義當暴露因素為等級變量時,如收入水平,xi

的取值為:1、2、3、 4…表示不同的等級。βi的意義為當其它變量值固定時,xi每相差一個等級時的比數(shù)比的對數(shù),而Exp(βi)表示xi每增加一個等級時的比數(shù)比

第七十九頁,共九十頁,2022年,8月28日Logistic回歸中回歸系數(shù)的意義當暴露因素為連續(xù)變量(如年齡)時,βi就表示當其它變量值固定時,年齡每增加一歲時比數(shù)比的對數(shù)。Exp(βi)表示年齡增加一歲時比數(shù)比。第八十頁,共九十頁,2022年,8月28日Logistic回歸中參數(shù)的意義

——————————————————————

MI非MI

合計

——————————————————————

服OC 392463

未服OC114154 268

————————————————————

合計153 178331

——————————————————————擬合的Logistic回歸模型為:

logitP=-1.859+0.786xOR=exp(0.786)=2.195

即:服用口服避孕藥者發(fā)生心肌梗塞的概率是不服者的2.195倍。第八十一頁,共九十頁,2022年,8月28日例26自變量是分類型變量

為了了解冠心病與種族的關(guān)系,某研究所調(diào)查了100個樣品,數(shù)據(jù)列在下表中。試估計各種族間患冠心病的相對危險度。設(shè)y=1表示患冠心病,y=0表示未患冠心病。把種族轉(zhuǎn)換為兩個啞變量,x(1)=1表示黑人,x(2)=1表示其它種族,兩個啞變量都為0時表示白人.Logistic回歸中參數(shù)的意義第八十二頁,共九十頁,2022年,8月28日Logistic回歸分析結(jié)果模型總體檢驗結(jié)果說

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論