統(tǒng)計(jì)學(xué):簡(jiǎn)單回歸分析_第1頁
統(tǒng)計(jì)學(xué):簡(jiǎn)單回歸分析_第2頁
統(tǒng)計(jì)學(xué):簡(jiǎn)單回歸分析_第3頁
統(tǒng)計(jì)學(xué):簡(jiǎn)單回歸分析_第4頁
統(tǒng)計(jì)學(xué):簡(jiǎn)單回歸分析_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

簡(jiǎn)單回歸分析(twovariableregressionanalysis)要求:1.掌握回歸的應(yīng)用條件和算法2.掌握回歸方程的應(yīng)用3.會(huì)用計(jì)算器處理回歸問題第一節(jié)簡(jiǎn)單線性回歸一、線性回歸的概念及其統(tǒng)計(jì)描述二、回歸模型的前提假設(shè)自變量

x

是精確可測(cè)的,因變量y是服從正態(tài)分布的隨機(jī)變量且:1.線性性(x與y呈線性關(guān)系)2.獨(dú)立性(n個(gè)觀測(cè)值是獨(dú)立的)3.正態(tài)性(誤差項(xiàng)εi是正態(tài)的,εi

~N(0,σ2)4.等方差性(無論x在什么范圍取值,y都具有相同的方差)見圖12-2回歸模型前提假設(shè)x1x2x3xyμ1μ2μ3圖12-2三、回歸參數(shù)的估計(jì)—最小二乘估計(jì)求法:利用最小二乘法原理(leastsquaremethod)—回歸殘差平方和最小離差參數(shù)而可在計(jì)算器上實(shí)現(xiàn)例12-1濃度x1.11.21.0…………0.7時(shí)間Y141315…………17開機(jī)mode→2→shift→AC→1.1→xD,yD→14→DATA1.2→xD,yD→13→DATA→…→…→…例12-1

估計(jì)血液的凝血酶濃度(單位/毫升)x與凝固時(shí)間y的回歸方程結(jié)果四、總體回歸系數(shù)β的統(tǒng)計(jì)推斷

(一)回歸系數(shù)b的標(biāo)準(zhǔn)誤Sb(二)回歸系數(shù)β的假設(shè)檢驗(yàn)理論上,tb=tr(

見第十一章第一節(jié),P210)(三)直線回歸系數(shù)β的可信區(qū)間回歸系數(shù)的區(qū)間估計(jì)為:在例12-1中,估計(jì)總體回歸系數(shù)的95%可信區(qū)間

第二節(jié)線性回歸的應(yīng)用在例12-1中第一觀測(cè)點(diǎn)x1=1.1,求y的均數(shù)的95%可信區(qū)間1.當(dāng)x=x0固定時(shí),對(duì)估計(jì)值y的均數(shù)的區(qū)間估計(jì)2.當(dāng)x=x0固定時(shí),對(duì)個(gè)體y的區(qū)間估計(jì)在例12-1中第一觀測(cè)點(diǎn)x1=1.1,求y的個(gè)體值的95%可信區(qū)間詳見表12-2利用回歸方程進(jìn)行預(yù)測(cè)例某地衛(wèi)生防疫站研究10年來乙腦發(fā)病率(1/10萬,預(yù)報(bào)量Y)與相應(yīng)前一年7月份日照時(shí)間(小時(shí),預(yù)報(bào)因子X)之間的數(shù)量關(guān)系,先將乙腦發(fā)病率作平方根反正弦變換:1990年7月份日照時(shí)間X0=260小時(shí),試估計(jì)1991年該地乙腦發(fā)病率(設(shè)α=0.05)解:利用個(gè)體值的預(yù)測(cè)范圍估計(jì)乙腦發(fā)病率利用回歸方程進(jìn)行統(tǒng)計(jì)控制在一定y值的前提下,確定自變量x值的取值,方法同上。例某市環(huán)境監(jiān)測(cè)站在某交通點(diǎn)連續(xù)測(cè)定30天,每天定時(shí)采樣3次,測(cè)得大氣中NO2濃度y(mg/m3)與當(dāng)時(shí)汽車流量x(輛/小時(shí)),共90對(duì)數(shù)據(jù),求得回歸方程若NO2的最大容許濃度為0.15mg/m3,則汽車流量應(yīng)如何控制?(α=0.05)解:求單側(cè)區(qū)間上限(四)應(yīng)用直線回歸應(yīng)注意問題1.作回歸分析要有實(shí)際意義;2.在回歸分析之前,應(yīng)先繪制散點(diǎn)圖,觀察點(diǎn)趨勢(shì);3.當(dāng)樣本含量較大時(shí),統(tǒng)計(jì)學(xué)檢驗(yàn)的作用減弱;4.應(yīng)用時(shí),應(yīng)以內(nèi)插為主,適當(dāng)外延;5.自變量的選擇:原因型容易測(cè)量的變異小的

如:年齡、身高、體重、體表面積直線回歸與直線相關(guān)的區(qū)別區(qū)別r

沒有單位,b有單位;所以,相關(guān)系數(shù)與單位無關(guān),回歸系數(shù)與單位有關(guān),且不能根據(jù)

b

的大小判斷回歸關(guān)系的密切程度;相關(guān)表示相互關(guān)系,沒有依存關(guān)系;而回歸有依存關(guān)系;對(duì)資料的要求不同:當(dāng)x和y都是隨機(jī)的,可以進(jìn)行相關(guān)和回歸分析;當(dāng)y是隨機(jī)的(x是控制的),理論上只能作回歸而不能作相關(guān)分析;直線回歸與直線相關(guān)的聯(lián)系

聯(lián)系均表示線性關(guān)系;符號(hào)相同:共變方向一致;假設(shè)檢驗(yàn)結(jié)果相同:是否存在共變關(guān)系;殘差均方MSE和決定系數(shù)r2E(MSE)=σ2扣除x影響后y的變異因變量總變異的分解YXP(X,Y)回歸貢獻(xiàn)殘差(隨機(jī)的)總變異y的個(gè)體值和均值的可信區(qū)間個(gè)體值可信區(qū)間均值可信區(qū)間第四節(jié)非線性回歸一、對(duì)自變量實(shí)施變換實(shí)現(xiàn)線性化二、變換自變量實(shí)現(xiàn)線性回歸的步驟1.將觀察數(shù)據(jù)(xi,yi)作散點(diǎn)圖,觀察點(diǎn)分布變化特點(diǎn)2.選定恰當(dāng)?shù)淖儞Q公式3.對(duì)變換后的數(shù)據(jù)用常規(guī)最小二乘法估計(jì)線性參數(shù)4.一般擬合多個(gè)相近的模型,然后通過對(duì)各個(gè)模型的擬合優(yōu)度評(píng)價(jià)挑選合適的模型。例12-2藥物劑量(mg)對(duì)腎上腺素釋放量(pg/ml)影響的試驗(yàn)數(shù)據(jù)藥物劑量x腎上腺素釋放量y因變量y均值1519.2614.2917.6018.3616.5317.212021.2021.7820.7720.6523.3821.562521.7722.6122.7021.1721.6521.983023.4723.2221.7424.0224.0523.303523.8825.3222.9024.8423.7024.134025.2724.6924.6724.4825.2424.874524.2024.9425.5225.0227.4325.425027.9825.8826.6726.3125.9426.565527.4224.9126.4228.2425.4926.506028.4127.0929.0428.8527.8928.26X與因變量均值擬合不同回歸模型的結(jié)果模型名稱回歸方程殘差均方

MSEF值P

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論