第八講 簡(jiǎn)單回歸分析課件_第1頁(yè)
第八講 簡(jiǎn)單回歸分析課件_第2頁(yè)
第八講 簡(jiǎn)單回歸分析課件_第3頁(yè)
第八講 簡(jiǎn)單回歸分析課件_第4頁(yè)
第八講 簡(jiǎn)單回歸分析課件_第5頁(yè)
已閱讀5頁(yè),還剩55頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第十二章簡(jiǎn)單回歸分析第八講簡(jiǎn)單回歸分析本章內(nèi)容第一節(jié)簡(jiǎn)單線性回歸第二節(jié)線性回歸的應(yīng)用

第八講簡(jiǎn)單回歸分析

雙變量計(jì)量資料:每個(gè)個(gè)體有兩個(gè)變量值

總體:無(wú)限或有限對(duì)變量值

樣本:從總體隨機(jī)抽取的n對(duì)變量值

(X1,Y1),(X2,Y2),…,(Xn,Yn)

目的:研究X和Y的數(shù)量關(guān)系

方法:回歸與相關(guān)

簡(jiǎn)單、基本——直線回歸、直線相關(guān)第一節(jié)簡(jiǎn)單線性回歸第八講簡(jiǎn)單回歸分析

英國(guó)人類學(xué)家F.Galton首次在《自然遺傳》一書(shū)中,提出并闡明了“相關(guān)”和“相關(guān)系數(shù)”兩個(gè)概念,為相關(guān)論奠定了基礎(chǔ)。其后,他和英國(guó)統(tǒng)計(jì)學(xué)家KarlPearson對(duì)上千個(gè)家庭的身高、臂長(zhǎng)、拃長(zhǎng)(伸開(kāi)大拇指與中指兩端的最大長(zhǎng)度)做了測(cè)量,發(fā)現(xiàn):歷史背景:第八講簡(jiǎn)單回歸分析

兒子身高(Y,英寸)與父親身高(X,英寸)存在線性關(guān)系:

也即高個(gè)子父代的子代在成年之后的身高平均來(lái)說(shuō)不是更高,而是稍矮于其父代水平,而矮個(gè)子父代的子代的平均身高不是更矮,而是稍高于其父代水平。Galton將這種趨向于種族穩(wěn)定的現(xiàn)象稱之“回歸”第八講簡(jiǎn)單回歸分析

“回歸”已成為表示變量之間某種數(shù)量依存關(guān)系的統(tǒng)計(jì)學(xué)術(shù)語(yǔ),相關(guān)并且衍生出“回歸方程”“回歸系數(shù)”等統(tǒng)計(jì)學(xué)概念。如研究糖尿病人血糖與其胰島素水平的關(guān)系,研究?jī)和挲g與體重的關(guān)系等。第八講簡(jiǎn)單回歸分析一、線性回歸的概念及其統(tǒng)計(jì)描述第一節(jié)簡(jiǎn)單線性回歸

直線回歸的概念目的:研究應(yīng)變量Y對(duì)自變量X的數(shù)量依存關(guān)系。特點(diǎn):統(tǒng)計(jì)關(guān)系。X值和Y的均數(shù)的關(guān)系,不同于一般數(shù)學(xué)上的X和Y的函數(shù)關(guān)系第八講簡(jiǎn)單回歸分析

為了直觀地說(shuō)明直線回歸的概念,以15名健康人凝血酶濃度(X)與凝血時(shí)間(Y)數(shù)據(jù)(表12-1)進(jìn)行回歸分析,得到圖12-1所示散點(diǎn)圖(scatterplot)

第八講簡(jiǎn)單回歸分析

在定量描述健康人凝血酶濃度(X)與凝血時(shí)間(Y)數(shù)據(jù)的數(shù)量上的依存關(guān)系時(shí),將凝血酶濃度稱為自變量(independentvariable),用

X表示;凝血時(shí)間稱為應(yīng)變量(dependentvariable),用

Y表示第八講簡(jiǎn)單回歸分析圖12-1凝血酶濃度(X)與凝血時(shí)間(Y)的散點(diǎn)分布第八講簡(jiǎn)單回歸分析

由圖12-1可見(jiàn),凝血時(shí)間隨凝血酶濃度的增加而減低且呈直線趨勢(shì),但并非所有點(diǎn)子恰好全都在一直線上,此與兩變量間嚴(yán)格的直線函數(shù)關(guān)系不同,稱為直線回歸(linearregression),其方程叫直線回歸方程,以區(qū)別嚴(yán)格意義的直線方程。回歸是回歸分析中最基本、最簡(jiǎn)單的一種,故又稱簡(jiǎn)單回歸。第八講簡(jiǎn)單回歸分析

為各X處Y的總體均數(shù)的估計(jì)。樣本線回歸方程簡(jiǎn)單線性回歸模型

第八講簡(jiǎn)單回歸分析1.a(chǎn)

為回歸直線在

Y

軸上的截距(1)a>0,表示直線與縱軸的交點(diǎn)在原點(diǎn)的上方;(2)a<0,則交點(diǎn)在原點(diǎn)的下方;(3)a=0,則回歸直線通過(guò)原點(diǎn)。第八講簡(jiǎn)單回歸分析2.b為回歸系數(shù),即直線的斜率(1)b>0,直線從左下方走向右上方,Y隨X增大而增大;(2)b<0,直線從左上方走向右下方,Y隨X增大而減小;(3)b=0,表示直線與X軸平行,X與Y無(wú)直線關(guān)系。b的統(tǒng)計(jì)學(xué)意義是:X

每增加(減)一個(gè)單位,Y

平均改變b個(gè)單位

第八講簡(jiǎn)單回歸分析二、回歸模型的前提假設(shè)線性回歸模型的前提條件是:線性(linear)

獨(dú)立(independent)

正態(tài)(normal)

等方差(equalvariance)第八講簡(jiǎn)單回歸分析

第八講簡(jiǎn)單回歸分析圖12-2回歸模型前提假設(shè)示意圖第八講簡(jiǎn)單回歸分析殘差(residual)或剩余值,即實(shí)測(cè)值Y與假定回歸線上的估計(jì)值

的縱向距離

。求解a、b實(shí)際上就是“合理地”找到一條能最好地代表數(shù)據(jù)點(diǎn)分布趨勢(shì)的直線。原則:最小二乘法(leastsumofsquares),即可保證各實(shí)測(cè)點(diǎn)至直線的縱向距離的平方和最小三、回歸參數(shù)的估計(jì)

(一)回歸參數(shù)估計(jì)的最小二乘原則

第八講簡(jiǎn)單回歸分析

(二)回歸參數(shù)的估計(jì)方法

第八講簡(jiǎn)單回歸分析本例:n=15ΣX=14.7ΣX2=14.81ΣY=224ΣXY=216.7ΣY2=3368第八講簡(jiǎn)單回歸分析圖12-3凝血酶濃度(X)與凝血時(shí)間(Y)的散點(diǎn)分布及擬合直線第八講簡(jiǎn)單回歸分析第八講簡(jiǎn)單回歸分析例題分析步驟第八講簡(jiǎn)單回歸分析3、計(jì)算有關(guān)指標(biāo)的值4、計(jì)算回歸系數(shù)和截距5、列出回歸方程第八講簡(jiǎn)單回歸分析

此直線必然通過(guò)點(diǎn)(,)且與縱坐標(biāo)軸相交于截距a。如果散點(diǎn)圖沒(méi)有從坐標(biāo)系原點(diǎn)開(kāi)始,可在自變量實(shí)測(cè)范圍內(nèi)遠(yuǎn)端取易于讀數(shù)的值代入回歸方程得到一個(gè)點(diǎn)的坐標(biāo),連接此點(diǎn)與點(diǎn)(,)也可繪出回歸直線。繪制回歸直線第八講簡(jiǎn)單回歸分析為的標(biāo)準(zhǔn)誤四、總體回歸系數(shù)β的的統(tǒng)計(jì)推斷(一)樣本回歸系數(shù)b的標(biāo)準(zhǔn)誤(12-10)第八講簡(jiǎn)單回歸分析(二)回歸方程的假設(shè)檢驗(yàn)

建立樣本直線回歸方程,只是完成了統(tǒng)計(jì)分析中兩變量關(guān)系的統(tǒng)計(jì)描述,研究者還須回答它所來(lái)自的總體的直線回歸關(guān)系是否確實(shí)存在,即是否對(duì)總體有?第八講簡(jiǎn)單回歸分析第八講簡(jiǎn)單回歸分析第八講簡(jiǎn)單回歸分析1.方差分析

第八講簡(jiǎn)單回歸分析Y的離均差,總變異殘差回歸的變異第八講簡(jiǎn)單回歸分析數(shù)理統(tǒng)計(jì)可證明:第八講簡(jiǎn)單回歸分析上式用符號(hào)表示為

式中

第八講簡(jiǎn)單回歸分析第八講簡(jiǎn)單回歸分析上述三個(gè)平方和,各有其相應(yīng)的自由度,并有如下的關(guān)系:

第八講簡(jiǎn)單回歸分析第八講簡(jiǎn)單回歸分析式中第八講簡(jiǎn)單回歸分析2、t檢驗(yàn)

(12-6)第八講簡(jiǎn)單回歸分析

檢驗(yàn)例12-1數(shù)據(jù)得到的直線回歸方程是否成立?

第八講簡(jiǎn)單回歸分析

方法1:方差分析第八講簡(jiǎn)單回歸分析方差分析表

第八講簡(jiǎn)單回歸分析方法2:t檢驗(yàn)參數(shù)β的意義是:若自變量X增加一個(gè)單位,反應(yīng)變量Y的平均值便增加β

(12-6)第八講簡(jiǎn)單回歸分析提示:第八講簡(jiǎn)單回歸分析(三)總體回歸系數(shù)的可信區(qū)間

利用上述對(duì)回歸系數(shù)的t檢驗(yàn),可以得到β的1-α雙側(cè)可信區(qū)間為(12-7)第八講簡(jiǎn)單回歸分析

本例b=-6.9802,自由度=13,t0.05,13=2.16,Sb=0.78655,代入公式(12-7)得參數(shù)β的95%置信區(qū)間為

=(-8.6791~-5.2813)第八講簡(jiǎn)單回歸分析第八講簡(jiǎn)單回歸分析第二節(jié)線性回歸的應(yīng)用(估計(jì)和預(yù)測(cè))

第八講簡(jiǎn)單回歸分析反映其抽樣誤差大小的標(biāo)準(zhǔn)誤為第八講簡(jiǎn)單回歸分析

例12-1中,第一觀測(cè)值X1=1.1,

0.4994,0.404,代入(12.8)式獲得第一觀測(cè)點(diǎn)X1對(duì)應(yīng)的的標(biāo)準(zhǔn)誤為

0.1599Y的總體均數(shù)的95%置信區(qū)間為

14.0957±(2.16)(0.1599)=(13.7502,14.4412)第八講簡(jiǎn)單回歸分析實(shí)測(cè)值實(shí)測(cè)值預(yù)測(cè)Y的均值Y的均值的標(biāo)準(zhǔn)誤Y的均值的95%置信區(qū)間Y值的95%預(yù)測(cè)區(qū)間殘差對(duì)象實(shí)測(cè)值

X實(shí)測(cè)值Y預(yù)測(cè)值均值均值的標(biāo)準(zhǔn)誤Y均值的95%CIY值的95%預(yù)測(cè)區(qū)間殘差下限上限下限上限11.11414.09570.159913.750214.441212.961815.2297-0.095721.21313.39770.215912.931313.864112.221214.5741-0.397731.01514.79370.130014.512815.074713.677715.90970.206340.91515.49170.143615.181515.802014.368016.6155-0.491751.21313.39770.215912.931313.864112.221214.5741-0.397761.11414.09570.159913.750214.441212.961815.2297-0.095770.91615.49170.143615.181515.802014.368016.61550.508380.61717.58580.325616.882518.289216.296918.8747-0.585891.01414.79370.130014.512815.074713.677715.9097-0.7937100.91615.49170.143615.181515.802014.368016.61550.5083111.11514.09570.159913.750214.441212.961815.22970.9043120.91615.49170.143615.181515.802014.368016.61550.5083131.11414.09570.159913.750214.441212.961815.2297-0.0957141.01514.79370.130014.512815.074713.677715.90970.2063150.71716.88780.255316.336317.439315.675118.10050.1122表12-2血凝數(shù)據(jù)的預(yù)測(cè)值、殘差、置信區(qū)間與預(yù)測(cè)區(qū)間第八講簡(jiǎn)單回歸分析以上是給定某一X值時(shí)所對(duì)應(yīng)的總體均數(shù)的置信區(qū)間。當(dāng)同時(shí)考慮X的所有可能取值時(shí),總體均數(shù)的點(diǎn)估計(jì)就是根據(jù)樣本算得的回歸直線(1-α)置信區(qū)間的上下限連起來(lái)形成一個(gè)弧形區(qū)帶,稱為回歸直線的(1-α)置信帶(confidenceband)。同樣,因?yàn)槠錁?biāo)準(zhǔn)誤是X的函數(shù),所以在均數(shù)()點(diǎn)處置信帶寬度最小,越遠(yuǎn)離該均數(shù)點(diǎn),置信帶寬度越大。

第八講簡(jiǎn)單回歸分析圖12-4中,左圖顯示位于最小二乘回歸線上下兩側(cè)的兩條弧形虛線為總體回歸線的(1-α)置信區(qū)帶。右圖的實(shí)線表示可能的總體回歸線,它們落在弧形虛線所確定的置信帶內(nèi)。(1-α)置信帶的意義是:在滿足線性回歸的假設(shè)條件下,可以認(rèn)為真實(shí)的回歸直線落在兩條弧形曲線所形成的區(qū)帶內(nèi),置信度為(1-α)

第八講簡(jiǎn)單回歸分析二、個(gè)體Y預(yù)測(cè)值的區(qū)間估計(jì)

(12-10)(12-11)第八講簡(jiǎn)單回歸分析以第一觀測(cè)點(diǎn)數(shù)據(jù)(X1=1.1)點(diǎn)為例,該點(diǎn)預(yù)測(cè)值的標(biāo)準(zhǔn)差為

=0.52489182第一數(shù)據(jù)點(diǎn)的預(yù)測(cè)區(qū)間為:14.0957±(2.16)(0.0.5249)=12.9618~15.2297當(dāng)同時(shí)考慮X的所有可能取值時(shí),個(gè)體Y值的95%預(yù)測(cè)區(qū)間形

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論