版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第十章
簡(jiǎn)單回歸分析線性相關(guān)分析
linearcorrelationanalysis
回歸(regression)和相關(guān)(correlation)分析:研究兩個(gè)或多個(gè)變量間相互關(guān)系的統(tǒng)計(jì)方法。簡(jiǎn)單線性回歸分析
simplelinearregressionanalysis:研究兩個(gè)變量間的數(shù)量依存關(guān)系的統(tǒng)計(jì)方法。:研究兩個(gè)或多個(gè)變量之間關(guān)聯(lián)性或關(guān)聯(lián)程度的一種統(tǒng)計(jì)分析方法。1.是否有線性聯(lián)系?
2.正向的還是負(fù)向的?
3.聯(lián)系的程度?矮個(gè)子的父代:64英寸而它子代:67英寸1.父代的總均數(shù)=68英寸子代的總均數(shù)=69英寸2.高個(gè)子的父代:72英寸而它子代:71英寸調(diào)查了1087對(duì)父子:1.1線性回歸的概念高個(gè)子父子矮個(gè)子父子簡(jiǎn)單回歸分析1.1線性回歸的概念1.2線性回歸模型的適用條件1.3
回歸參數(shù)的估計(jì)1.4總體回歸系數(shù)β的統(tǒng)計(jì)推斷1.5線性回歸的應(yīng)用線性回歸(linearregression)又稱簡(jiǎn)單回歸(simpleregression)
:討論兩個(gè)變量間的數(shù)量依存關(guān)系的統(tǒng)計(jì)方法,即研究一個(gè)變量如何隨另一個(gè)變量變化的常用方法。因變量dependentvariable反應(yīng)變量
responsevariable:非獨(dú)立的、受其它變量影響的變量,常用“Y”表示。自變量
independentvariable或預(yù)測(cè)因子
predictor
或解釋變量explanatoryvariable
:能獨(dú)立自由變化的變量,常用“X”表示。兩個(gè)變量:例10-1:對(duì)14名40-60歲健康婦女的基礎(chǔ)代謝(Y)與體重(X)的相關(guān)系數(shù)r=0.964,現(xiàn)問基礎(chǔ)代謝(Y)是如何依存體重(X)變化而變化的?編號(hào)基礎(chǔ)代謝(kj/d)體重(kg)編號(hào)基礎(chǔ)代謝(kj/d)體重(kg)14175.650.783970.648.624435.053.793983.244.633460.237.1105050.158.644020.851.7115355.571.053987.447.8124560.659.764970.662.8134874.462.175359.767.3145029.261.5表10-114名健康中年婦女的基礎(chǔ)代謝與體重的測(cè)量值圖10-114名健康中年婦女的基礎(chǔ)代謝與體重的散點(diǎn)圖由散點(diǎn)圖看基礎(chǔ)代謝與體重可能是直線關(guān)系μ
Y∣X=α+βX上述直線方程稱為線性回歸模型
linearregressionmodel可以假定固定基礎(chǔ)代謝的總體均數(shù)μ
Y∣X與體重X的關(guān)系可能是直線關(guān)系,即有:回歸直線的截距參數(shù)(intercept),即X取0時(shí),根據(jù)方程估算出的Y的平均水平。回歸直線的斜率參數(shù)(slope),又稱回歸系數(shù)(regressioncoefficient),即X每增加一個(gè)單位,Y平均改變?chǔ)聜€(gè)單位。通常情況下,研究者只能獲得一定數(shù)量的樣本數(shù)據(jù),用樣本數(shù)據(jù)建立的有關(guān)Y依從X變化的線性表達(dá)式稱為回歸方程(regressionequation),記為:稱為Y的預(yù)測(cè)值;其意義為固定x時(shí),Y的總體均數(shù)μ
Y∣X的估計(jì)值。a與b分別為回歸模型參數(shù)α和β的估計(jì)值。
利用回歸方程,只要給定一個(gè)40-60歲的健康婦女的體重值,就可估計(jì)出該體重個(gè)體的基礎(chǔ)代謝值的平均值。以樣本數(shù)據(jù),可算出α和β的估計(jì)值a和b。后在直角坐標(biāo)系以X為橫坐標(biāo),Y為縱坐標(biāo)作圖,圖形是一條直線,斜率為b,截距為a。線性回歸關(guān)系的特點(diǎn):一個(gè)變量的取值不能由另一個(gè)變量唯一確定。當(dāng)變量X取某個(gè)值時(shí),變量Y取值可能有幾個(gè)。各觀測(cè)點(diǎn)分布在直線周圍線性回歸的分類:I型回歸:因變量(Y)是隨機(jī)變化的,但自變量(X)可以不隨機(jī),當(dāng)它是能夠精確測(cè)量和嚴(yán)密控制的量時(shí),叫Y關(guān)于X的I型回歸。II型回歸
:因變量(Y)和自變量(X)都是隨機(jī)變化的,叫Y關(guān)于X的II型回歸。表12-1不同IgG濃度下的沉淀環(huán)數(shù)據(jù)IgG濃度(IU/ml)X12345沉淀環(huán)直徑(mm)Y4.05.56.27.78.5小結(jié):回歸分析(Regressionanalysis)從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式;對(duì)這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),并從影響某一特定變量的諸多變量中找出具有統(tǒng)計(jì)學(xué)意義的變量;利用所求的關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的取值來預(yù)測(cè)或控制另一個(gè)特定變量的取值,并給出這種預(yù)測(cè)或控制的精確程度。1.2線性回歸模型的適用條件linenormal正態(tài)性equalvariance等方差性因變量Y的總體平均值與自變量X呈線性關(guān)系在一定范圍內(nèi)任意給定X值,則對(duì)應(yīng)的隨機(jī)變量Y服從正態(tài)分布在一定范圍內(nèi),不同X值所對(duì)應(yīng)的隨機(jī)變量Y的方差相同linear線性independent獨(dú)立性指任意兩個(gè)觀察值互相獨(dú)立誤差
與殘差稱為隨機(jī)誤差(總體)稱為殘差(residual)(樣本)根據(jù)上述,直線回歸分析要求資料滿足固定X,則Y服從正態(tài)分布等價(jià)于殘差服從正態(tài)分布。直線回歸原理示意圖:所以如果固定X,Y服從正態(tài)分布,其散點(diǎn)圖呈直線帶狀分布回歸分析的主要步驟繪制散點(diǎn)圖回歸參數(shù)的估計(jì):求回歸系數(shù)β和常數(shù)項(xiàng)α回歸系數(shù)β和常數(shù)項(xiàng)α的假設(shè)檢驗(yàn)列出回歸方程,并進(jìn)行假設(shè)檢驗(yàn)回歸方程的解釋(一)繪制散點(diǎn)圖:從散點(diǎn)圖可見:基礎(chǔ)代謝(Y)和體重(X)有線性關(guān)系,可以考慮做線性回歸分析。圖11-114名健康中年婦女的基礎(chǔ)代謝與體重的散點(diǎn)圖1.3回歸參數(shù)的估計(jì)(二)回歸參數(shù)的估計(jì):讓所有點(diǎn)的的平方和最小用最小二乘法擬合直線,選擇a和b使其殘差(樣本點(diǎn)到直線的豎直距離)平方和達(dá)到最小。最小二乘法原則的文字描述:回歸參數(shù)的估計(jì)方法:按照最小二乘法原則,可得到:回歸方程:例10-1:對(duì)14名40-60歲健康婦女的基礎(chǔ)代謝(Y)與體重(X)的相關(guān)系數(shù)r=0.964,現(xiàn)問基礎(chǔ)代謝(Y)是如何依存體重(X)變化而變化的?編號(hào)基礎(chǔ)代謝(kg/d)體重(kg)編號(hào)基礎(chǔ)代謝(kg/d)體重(kg)14175.650.783970.648.624435.053.793983.244.633460.237.1105050.158.644020.851.7115355.571.053987.447.8124560.659.764970.662.8134874.462.175359.767.3145029.261.5表10-114名健康中年婦女的基礎(chǔ)代謝與體重的測(cè)量值解:回歸方程的兩個(gè)參數(shù)分別為得回歸方程:作回歸直線圖回歸系數(shù)β的意義:1.由總體回歸方程可知μ
Y∣X=α+
x,參數(shù)β的意義:若自變量X增加1個(gè)單位,反應(yīng)變量Y的平均值便增加β個(gè)單位。。2.由于是μ
Y∣X=α+βX的估計(jì)表達(dá)式,所以(樣本)回歸系數(shù)b表示X增加一個(gè)單位,樣本觀察值Y平均增加b個(gè)單位。假設(shè)檢驗(yàn)回歸模型的假設(shè)檢驗(yàn)(modeltest):回歸系數(shù)的假設(shè)檢驗(yàn):目的:檢驗(yàn)求得的回歸方程在總體中是否成立;方法:?jiǎn)我蛩胤讲罘治觥D康模杭礄z驗(yàn)總體回歸體系數(shù)β是否為0(β=0);方法:t檢驗(yàn)。1.4總體回歸系數(shù)β的統(tǒng)計(jì)推斷:1)回歸模型的假設(shè)檢驗(yàn)—方差分析SS總SS殘SS回SS總=SS回歸+SS殘差SS總(總平方和)v總=n-1{SS回歸(回歸平方和)v回歸=1{SS殘差(殘差平方和)v殘差=n-2{v總=v回歸+v殘差lyyblxy=lxy2/lxxlyy-lxy2/lxx變異的分解:變異的種類產(chǎn)生原因解釋SS總:Y的離均差平方和沒有利用X的信息時(shí),Y觀察值的變異反映因變量Y的總變異SS回歸:(回歸平方和)當(dāng)自變量X引入模型后所引起的變異反映在Y的總變異中,可用Y與X的線性關(guān)系解釋的那部分變異。SS回歸越大,說明回歸效果越好。SS殘差:(殘差平方和)總變異中無法用X和Y的回歸關(guān)系解釋的那部分變異反應(yīng)自變量X以外因素對(duì)Y的變異的影響。表示考慮回歸之后,Y的隨機(jī)誤差?;貧w方程假設(shè)檢驗(yàn)的基本思想:如果總體中自變量X對(duì)因變量Y沒有貢獻(xiàn),則由樣本所得的回歸均方與殘差均方應(yīng)相近;反之,如果總體中自變量X對(duì)因變量Y有貢獻(xiàn),回歸平方和反應(yīng)的就不僅僅是隨機(jī)誤差,即回歸均方必然要遠(yuǎn)大于殘差均方;依此,可計(jì)算檢驗(yàn)統(tǒng)計(jì)量F值作出判斷。問:所求得的回歸方程在總體中是否成立?查F界值表(P572),確定單側(cè)臨界值Fa(v回歸,v殘差),求概率值P,下結(jié)論均方:MS=SS/v回歸均方:MS回歸=SS回歸/v回歸殘差均方:
MS殘差=SS殘差/v殘差檢驗(yàn)統(tǒng)計(jì)量:1.建立假設(shè),確定檢驗(yàn)水準(zhǔn)
H0:總體回歸方程不成立,即總體中自變量X對(duì)因變量Y沒有貢獻(xiàn);
H1:總體回歸方程成立,即總體中自變量X對(duì)因變量Y有貢獻(xiàn)。
=0.05(單側(cè))查F界值表(P468):a=0.05,v回歸=1、v殘差=n-2=12得:F(k-1,n-k)=F(1,12)=4.753.確定P值,作出推斷結(jié)論:
由于F=158.36>4.75,則P<0.05,故拒絕H0,接受H1,可認(rèn)為體重與基礎(chǔ)代謝之間有線性回歸關(guān)系。2.計(jì)算檢驗(yàn)統(tǒng)計(jì)量F值:2)回歸系數(shù)的假設(shè)檢驗(yàn)—t檢驗(yàn)
β=0,說明Y與X之間并不存在線性關(guān)系
β≠0,說明Y與X之間存在線性關(guān)系由總體回歸方程μ
Y∣X=α+
x
當(dāng)
=0時(shí),μ
Y∣X=α
即:對(duì)于X的任何值,總體均數(shù)μ
Y∣X沒有任何改變,故建立Y與X的直線回歸方程就沒有任何意義了故
是否為0,涉及到所建立的回歸方程是否有意義的問題。然而從β=0的總體抽得樣本,計(jì)算出的回歸系數(shù)b很可能不為零,需要對(duì)
是否等于0進(jìn)行假設(shè)檢驗(yàn)—t檢驗(yàn)t檢驗(yàn):檢驗(yàn)過程:注意:1.在簡(jiǎn)單線性回歸模型中,對(duì)回歸模型的方差分析等價(jià)于對(duì)回歸系數(shù)的t檢驗(yàn),即有:2.對(duì)于服從雙變量正態(tài)分布的同樣一組資料,同時(shí)作相關(guān)分析和回歸分析,則相關(guān)系數(shù)的t檢驗(yàn)與回歸系數(shù)的t檢驗(yàn)等價(jià),即有:3)總體回歸系數(shù)β的區(qū)間估計(jì):已知b為回歸系數(shù)的樣本估計(jì)值,Sb為樣本回歸系數(shù)的標(biāo)準(zhǔn)誤,則總體回歸系數(shù)β的雙側(cè)1-α置信區(qū)間為:上例題中b=61.4229,Sb=4.8810,v=12,查t界值表得:t0.05/2,12=2.179;則其總體回歸系數(shù)β的雙側(cè)95置信區(qū)間為:b±tα/2,vSb61.4229±2.179×4.881=(50.787,72.059)4)回歸方程的解釋:
——體重對(duì)基礎(chǔ)代謝的影響有多大?決定系數(shù):回歸平方和與總平方和之比。
0≤R2≤1反映了自變量X對(duì)回歸效果的貢獻(xiàn),即Y的總變異中回歸關(guān)系所能解釋的百分比(varianceaccountformula,VAF);反映了回歸模型的擬合效果,可作為反應(yīng)擬合優(yōu)度(goodnessoffit)的指標(biāo)。上例題:SS總=4645447.0121,SS回歸=4318227.7159R2=SS回歸/SS總=0.964=96.4%解釋:說明基礎(chǔ)代謝總變異的96.4%與體重有關(guān)。1.5回歸方程的統(tǒng)計(jì)應(yīng)用:定量描述兩變量之間的依存關(guān)系。利用回歸方程進(jìn)行統(tǒng)計(jì)預(yù)測(cè)。利用回歸方程進(jìn)行統(tǒng)計(jì)控制。1)統(tǒng)計(jì)預(yù)測(cè):將X值作預(yù)報(bào)因子,固定總體中X為某定值Xi時(shí),估計(jì)個(gè)體Y值的容許區(qū)間,即Y值的波動(dòng)范圍。例:第一觀測(cè)點(diǎn)數(shù)據(jù)(X1=50.7)為例,預(yù)測(cè)第一數(shù)據(jù)點(diǎn)Y值的95%預(yù)測(cè)區(qū)間答:已知回歸方程故基礎(chǔ)代謝的95%容許區(qū)間為:均數(shù)置信區(qū)間:當(dāng)X值為某定值,并給定置信度1-α,考察Y的總體均數(shù)的分布時(shí),可估計(jì)Y的總體均數(shù)μ
Y∣X的1-α置信區(qū)間。答:已知回歸方程故基礎(chǔ)代謝的95%容許區(qū)間為:例:第一觀測(cè)點(diǎn)數(shù)據(jù)(X1=50.7)為例,預(yù)測(cè)Y的總體均數(shù)值的95%預(yù)測(cè)區(qū)間。2)統(tǒng)計(jì)控制:例:在硝酸鈉的溶解試驗(yàn)中,測(cè)得在不同溫度X下,溶解于100份水中的硝酸鈉份數(shù)Y的數(shù)據(jù)見表。若要求溶解于100份水中的硝酸鈉份數(shù)在80份以上,溫度應(yīng)如何控制?由原始數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度百貨商場(chǎng)停車場(chǎng)管理合同樣本3篇
- 二零二五版員工股權(quán)激勵(lì)與管理合同模板3篇
- 二零二五年防盜門研發(fā)、生產(chǎn)、銷售一體化合作協(xié)議3篇
- 2024版家具經(jīng)銷商合作協(xié)議范本
- 二零二五年度音樂器材行業(yè)標(biāo)準(zhǔn)制定與執(zhí)行合同3篇
- 2024版云計(jì)算服務(wù)租賃合同
- 二零二五版?zhèn)€人子女教育還借款合同3篇
- 2024版前期物業(yè)服務(wù)管理協(xié)議
- 二零二五版體育健身器材研發(fā)與銷售合同3篇
- 二零二五年航空航天單位企業(yè)勞務(wù)派遣及技術(shù)研發(fā)合同
- 內(nèi)鏡下粘膜剝離術(shù)(ESD)護(hù)理要點(diǎn)及健康教育課件
- 2024年民族宗教理論政策知識(shí)競(jìng)賽考試題庫及答案
- 項(xiàng)目七電子商務(wù)消費(fèi)者權(quán)益保護(hù)的法律法規(guī)
- 品質(zhì)經(jīng)理工作總結(jié)
- 供電搶修述職報(bào)告
- 集成電路設(shè)計(jì)工藝節(jié)點(diǎn)演進(jìn)趨勢(shì)
- 新型電力系統(tǒng)簡(jiǎn)介演示
- 特種設(shè)備行業(yè)團(tuán)隊(duì)建設(shè)工作方案
- 眼內(nèi)炎患者護(hù)理查房課件
- 肯德基經(jīng)營策略分析報(bào)告總結(jié)
- 買賣合同簽訂和履行風(fēng)險(xiǎn)控制
評(píng)論
0/150
提交評(píng)論