版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
RegressionAnalsys
回歸分析
童新元
中國(guó)人民解放軍總醫(yī)院名人格言縱使世界給我珍寶和榮譽(yù),我也不愿意離開(kāi)我的祖國(guó),因?yàn)榭v使我的祖國(guó)在恥辱之中,我還是喜歡,熱愛(ài),祝福我的祖國(guó)。
---裴多菲(匈牙利詩(shī)人,1823—1849)問(wèn)題能否由脂肪的含量推出熱量的多少?知道父代身高,可否推測(cè)子代身高?回歸方程解決由一個(gè)量變化推斷另一量變化的問(wèn)題。1)“回歸”概念的來(lái)源“香港回歸”,“澳門回歸”….“回歸”這一名詞起源于19世紀(jì)生物學(xué)家和統(tǒng)計(jì)學(xué)家F·Galton的遺傳學(xué)研究。問(wèn)題:現(xiàn)實(shí)直觀經(jīng)驗(yàn):“通常都認(rèn)為子女比父母的身高要高”。這是人身的客觀規(guī)律還是一種假象?如果這個(gè)趨勢(shì)是客觀規(guī)律話,人身高應(yīng)該是越來(lái)越高,早就超過(guò)了現(xiàn)在的水平。觀察研究英國(guó)生物遺傳學(xué)家Galton觀察了1078對(duì)夫婦與子女,分析他們的身高關(guān)系。以每對(duì)夫婦的平均身高作為x,取他們的一個(gè)成年兒子的身高作為y,將結(jié)果在平面直角坐標(biāo)系上繪成散點(diǎn)圖,發(fā)現(xiàn)趨勢(shì)近乎一條直線。計(jì)算出的回歸直線方程為:Y^=33.73+0.516x這種趨勢(shì)及回歸方程表明父母平均身高x每增加一個(gè)單位時(shí),其成年兒子的身高y也平均增加0.516個(gè)單位。結(jié)果表明,雖然高個(gè)子父輩確實(shí)有生高個(gè)子兒子的趨勢(shì),但父輩身高增加一個(gè)單位,兒子身高僅增加半個(gè)單位左右。平均說(shuō)來(lái),一群高個(gè)子父輩的兒子們的平均高度要低于他們父輩的平均高度,他們兒子的身高沒(méi)有比他們更高,高個(gè)子父輩偏離其父輩平均身高的一部分被其子代拉回來(lái)了,即子代的平均身高向中心回歸。低個(gè)子父輩的兒子們雖然仍為低個(gè)子,平均身高卻比他們的父輩增加了,即父輩偏離中心的部分在子代被拉回來(lái)一些。說(shuō)明子代的平均身高沒(méi)有比他們的父輩更低。正因?yàn)樽哟纳砀哂谢氐礁篙吰骄砀叩内厔?shì),才使人類的身高在一定時(shí)間內(nèi)相對(duì)穩(wěn)定,沒(méi)有出現(xiàn)父輩個(gè)子高其子女更高,父輩個(gè)子矮其子女更矮的兩極分化現(xiàn)象。這個(gè)例子說(shuō)明了生物學(xué)中“種”的概念的穩(wěn)定性。正是為了描述這種有趣的現(xiàn)象,Galton引進(jìn)了“回歸”這個(gè)名詞來(lái)描述父輩身高與子代身高的關(guān)系。大自然界很多物種都有
“回歸”現(xiàn)象:大象、螞蟻后代體重回歸到其平均水平人類社會(huì)的“回歸”.少小離家,老大歸。。。社會(huì)學(xué)…葉落歸根和諧社會(huì)穩(wěn)定--發(fā)展貧富分化嚴(yán)重社會(huì)不穩(wěn)定中國(guó)改革開(kāi)放中國(guó)經(jīng)濟(jì)體制改革“中國(guó)經(jīng)濟(jì)進(jìn)入中等發(fā)達(dá)國(guó)家水平”中國(guó)政治體制改革“我深知改革的難度,主要是任何一項(xiàng)改革必須有人民的覺(jué)醒、人民的支持、人民的積極性和創(chuàng)造精神?!?/p>
--溫家寶中國(guó)半數(shù)人還處于文革狀態(tài),要么是缺乏理性的文革戰(zhàn)士,要么是逆來(lái)順從的奴隸狀態(tài),基本不懂現(xiàn)代社會(huì)的處事原則。—茅于軾“權(quán)利回歸于人民,人民真正當(dāng)家作主””沒(méi)有獨(dú)裁專制,才有新中國(guó)“由父高推測(cè)子女身高的設(shè)想影響子女身高y的因素:基本生長(zhǎng)規(guī)律、父母的身高x
個(gè)體差異(隨機(jī)誤差)問(wèn)題的模型化:回歸分析模型子高=基本生長(zhǎng)+父母高作用+個(gè)體差異2)回歸方程回歸分析研究目的是由自變量的信息去推斷因變量,并用直線方程來(lái)表示它們的線性關(guān)系。直線回歸方程的一般表達(dá)式為
回歸分析的數(shù)據(jù)基本格式變量x變量yx1y1x2y2
......xnyn相關(guān)問(wèn)題回歸分析的任務(wù):
在平面上怎么找最佳的直線?實(shí)現(xiàn)的類似問(wèn)題:
某地區(qū)有若干個(gè)房子,現(xiàn)要修建一條直的公路,怎樣讓大家都滿意?3)參數(shù)的估計(jì)回歸方程:采用最小二乘法原理:所有實(shí)測(cè)點(diǎn)到回歸直線的縱向距離平方之和最小.求解線性方程組,而得到最小二乘估計(jì)系數(shù)b和a
參數(shù)的計(jì)算公式β的估計(jì):
α
的估計(jì):
計(jì)算結(jié)果a=33.73,b=0.516回歸方程:y^=33.73+0.516x例12-1
測(cè)定16種食物中的熱量(卡路里)和脂肪含量(克).試建立食物熱量與脂肪含量之間的回歸方程.計(jì)算結(jié)果a=36.0727,b=15.2584回歸方程:y^=36.0727+15.2584x回歸方程的基本含義回歸方程在坐標(biāo)軸上的含義
a:截距b:斜率稱為回歸系數(shù)?;貧w系數(shù)b的意義:回歸系數(shù)b反映的是x每增加1個(gè)單位時(shí)y的增加幅度;b越大,x對(duì)y的影響幅度越大。回歸直線與散點(diǎn)圖的關(guān)系b>0b<0b=0b=0b=0b=04)回歸方程的檢驗(yàn)回歸方程的抽樣誤差:回歸方程來(lái)自樣本,存在抽樣誤差回歸方程的假設(shè)檢驗(yàn)步驟:1建立假設(shè):
H0:回歸方程無(wú)統(tǒng)計(jì)學(xué)意義
H1:回歸方程有統(tǒng)計(jì)學(xué)意義α=0.05
2變異的分解:方差分析思想
yi-y=(yi-y^)+(y^-y)
∑(yi-y)2=∑(yi-y^)2+∑(y^-y)2
變異分解示意圖F值的構(gòu)造SS總=SS殘差
+SS回歸df總=df殘差
+df回歸MS回歸=SS回歸/df回歸MS殘差
=SS殘差
/df殘差F=
MS回歸/MS殘差
F值越大,越不利H0假設(shè)的成立。
方差分析表
----------------------------------------------------------
y的變異來(lái)源
SSDFMS
F值P
----------------------------------------------------------
回歸方程SS回歸
1MS回歸
F=MS回歸/Mse
殘差
SSe
n-2Mse
總變異SSTn-1
---------------------------------------------------------3統(tǒng)計(jì)推斷與決策
p<α,拒絕H0;回歸方程有統(tǒng)計(jì)學(xué)意義
p>α,不拒絕H0。回歸方程無(wú)統(tǒng)計(jì)學(xué)意義5)回歸系數(shù)的假設(shè)檢驗(yàn):建立假設(shè)
H0:β=0
H1:β≠0α=0.05
回歸系數(shù)的標(biāo)準(zhǔn)誤與t統(tǒng)計(jì)量
得到P,做出推斷
p<α,拒絕H0;p>α,不拒絕H0。6)回歸方程價(jià)值的評(píng)價(jià)回歸方程評(píng)價(jià):方程的假設(shè)檢驗(yàn)回歸價(jià)值的評(píng)價(jià):確定系數(shù)確定系數(shù)反映回歸方程對(duì)因變量y的影響程度。決定系數(shù)的意義決定系數(shù)越大,回歸方程價(jià)值越高.實(shí)際中,決定系數(shù)大于0.5時(shí)才有好的應(yīng)用價(jià)值.本實(shí)例回歸方程的評(píng)價(jià)回歸模型的方差分析:
F=67.923P=0.000回歸系數(shù)的t檢驗(yàn):
tb=8.2416,P=0.000R2=0.82917)直線回歸圖若兩變量間存在直線關(guān)系,在散點(diǎn)圖上繪上回歸直線,形成直線回歸圖.直線回歸圖的CHISS實(shí)現(xiàn)1、進(jìn)入數(shù)據(jù)模塊
點(diǎn)擊
數(shù)據(jù)→文件→打開(kāi)數(shù)據(jù)庫(kù)表
打開(kāi)文件名為:b12-1.DBF→確認(rèn)2、進(jìn)入圖形模塊
進(jìn)行繪圖
點(diǎn)擊
圖形→統(tǒng)計(jì)圖→曲線擬合
→確認(rèn)橫軸:X脂肪縱軸:Y熱量8)回歸分析的應(yīng)用---預(yù)測(cè)
若回歸方程有意義時(shí),可以通過(guò)自變量X的值來(lái)預(yù)測(cè)因變量Y的值.
通過(guò)知道父代身高推測(cè)子代平均身高例12-1中,脂肪含量與熱量值建立的回歸方程有意義P<0.05,且決定系數(shù)0.8291較大,我們可以通過(guò)食物中的脂肪含量來(lái)預(yù)測(cè)熱量值.
問(wèn):已知脂肪為10g,試求其對(duì)應(yīng)熱量值.
解:已求得回歸方程為:
y^=36.0727+15.2584x
當(dāng)x=10g時(shí),代入回歸方程求得:y^=188.6567cal9)回歸分析的條件線性獨(dú)立正態(tài)等方差10)相關(guān)與回歸的注意事項(xiàng)1.相關(guān)與回歸的關(guān)系二者反映的是一個(gè)問(wèn)題的兩個(gè)角度相關(guān):關(guān)聯(lián)程度回歸:數(shù)量關(guān)系二者的基本結(jié)論一致相關(guān)系數(shù)的假設(shè)檢驗(yàn)與回歸系數(shù)的假設(shè)檢驗(yàn)等價(jià)2.相關(guān)與回歸應(yīng)有實(shí)際意義經(jīng)典統(tǒng)計(jì)案例1冰淇淋與犯罪率的關(guān)系美國(guó)一小鎮(zhèn)警察局長(zhǎng)發(fā)現(xiàn)該鎮(zhèn)的冰淇淋銷量越多,犯罪率越高,呈正相關(guān)。1)能否限制冰淇淋銷量來(lái)降低犯罪率。2)試討論該問(wèn)題。經(jīng)典統(tǒng)計(jì)案例2小孩的身高同小樹(shù)的高關(guān)系呈正相關(guān)。試討論該問(wèn)題。3.異常點(diǎn)的診斷y。。。。。。
x4.線性與非線性關(guān)系脈搏與測(cè)量時(shí)間人體的身高與年齡
注意:局部線性與整體非線性.4.伴隨關(guān)系與因果關(guān)系(1)兩相關(guān)變量間的關(guān)系伴隨關(guān)系因果關(guān)系(2)相關(guān)與因果關(guān)系相關(guān)分析泛指兩個(gè)變量間的關(guān)聯(lián)程度的分析。相關(guān)并不一定表示一個(gè)變量的改變是引起另一變化的原因,而可能受另一因素的影響。因此,相關(guān)關(guān)系并不一定是因果關(guān)系。回歸反映的僅僅是兩變的數(shù)量關(guān)系,不能證明‘因果’,只可以作為‘因果’的證據(jù)之一。(3)因果關(guān)系的判斷判斷因果關(guān)系至少需要以下證據(jù):數(shù)量方面的關(guān)系;時(shí)間上的先后關(guān)系;條件消失,結(jié)果消失;條件重現(xiàn),結(jié)果重現(xiàn)。。。生物學(xué)中因果關(guān)系還需要?jiǎng)游锬P头矫娴淖C據(jù),生物學(xué)理論依據(jù)等。(4)關(guān)于‘相關(guān)’的若干提法及其關(guān)系*A與B是否有關(guān)A與B是否獨(dú)立不同A下B是否相等A對(duì)B是否有影響A與B的結(jié)果是否一致(配對(duì))有關(guān)=不獨(dú)立=不相等=有影響=一致無(wú)關(guān)=獨(dú)立=相等=無(wú)影響=不一致(5)相關(guān)性與差異性*空腹血糖與餐后血糖
---有相關(guān)性,有差異性空腹身高與餐后身高
---有相關(guān)性,無(wú)差異性空腹答題得分與視力得分
---無(wú)相關(guān)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基坑降水施工合同:有線電視網(wǎng)絡(luò)
- 2024年健身房設(shè)備采購(gòu)合同
- 自行車管理辦法
- 2024年倉(cāng)儲(chǔ)場(chǎng)地租賃協(xié)議
- 咨詢公司法定代表人招聘書
- 廣播電視信號(hào)傳輸供用電管理辦法
- 建筑電學(xué)承攬施工合同范本
- 物流公司貨車司機(jī)招聘合同范本
- 城市廣場(chǎng)環(huán)境長(zhǎng)效管理考核辦法
- 學(xué)前班住校生社交技能訓(xùn)練
- 河北省地圖介紹模板
- 全國(guó)職業(yè)英語(yǔ)技能大賽選拔賽職場(chǎng)應(yīng)用樣題
- 設(shè)備安全運(yùn)行檢查評(píng)分表
- 倉(cāng)庫(kù)收貨臺(tái)賬
- 小學(xué)音樂(lè)人音四年級(jí)上冊(cè)(2023年新編)第5課童心-《蕩秋千》教學(xué)設(shè)計(jì)
- 四年級(jí)數(shù)學(xué)上冊(cè)課件-8. 沏茶 -人教版(共14張PPT)
- 計(jì)算書水泵耗電輸冷比
- 基坑換填土壓實(shí)施工記錄
- 高壓氧應(yīng)急救援預(yù)案
- 露天煤礦土方剝離施工安全管理制度
- 小型展覽館建筑設(shè)計(jì)精品ppt
評(píng)論
0/150
提交評(píng)論