版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1第九章相關(guān)與回歸分析經(jīng)濟管理類核心課程《統(tǒng)計學(xué)》19.1
相關(guān)分析9.3
多元線性回歸分析9.2
一元線性回歸分析主要內(nèi)容2全球吃死的人比餓死的人多
據(jù)世界衛(wèi)生組織統(tǒng)計,全球肥胖癥患者達3億人,其中兒童占2200萬人,11億人體重過重。肥胖癥和體重超常早已不是發(fā)達國家的“專利”,已遍及五大洲。目前,全球因“吃”致病乃至死亡的人數(shù)已高于因饑餓死亡的人數(shù)。
(引自《光明日報》劉軍/文)
問題:肥胖癥和體重超常與死亡人數(shù)有顯著的數(shù)量關(guān)系嗎?
解決:用相關(guān)分析與回歸分析的方法來驗證。3
美國印第安納州的地區(qū)教會想要籌款興建新教堂,提出教堂能潔凈人們的心靈,減少犯罪,降低監(jiān)獄服刑人數(shù)的口號。為了增進民眾參與的熱誠和信心,教會的神父收集了近15年的教堂數(shù)與在監(jiān)獄服刑的人數(shù)進行統(tǒng)計分析。
結(jié)果卻令教會大吃一驚!教堂數(shù)與監(jiān)獄服刑人數(shù)同步增長4相關(guān)分析結(jié)論
最近15年教堂數(shù)與監(jiān)獄服刑人數(shù)呈顯著的正相關(guān)。那么是否可以由此得出,教堂建得越多,就可能帶來更多的犯罪呢?經(jīng)過統(tǒng)計學(xué)家和教會神父深入討論,并進一步收集近15年的當?shù)厝丝谧儎淤Y料和犯罪率等資料作進一步分析,發(fā)現(xiàn)監(jiān)獄服刑人數(shù)的增加和教堂數(shù)的增加都與人口的增加有關(guān)。
結(jié)論:教堂數(shù)的增加并非監(jiān)獄服刑人數(shù)增加的原因。至此,教會人士總算松了一口氣。數(shù)據(jù)來源:《現(xiàn)代統(tǒng)計學(xué)及其應(yīng)用》,吳柏林、曹立人著,浙江教育出版社2007年版。5相關(guān)分析的意義第一節(jié)相關(guān)分析社會經(jīng)濟現(xiàn)象中,一些現(xiàn)象與另一些現(xiàn)象之間往往存在著依存關(guān)系,當我們用變量來反映這些現(xiàn)象的的特征時,便表現(xiàn)為變量之間的依存關(guān)系。
在分析變量的依存關(guān)系時,我們把變量分為兩種:自變量因變量引起其他變量發(fā)生變化的量受自變量的影響發(fā)生對應(yīng)變化的量6現(xiàn)象之間的相互關(guān)系,可以概括為兩種不同的類型:(一)函數(shù)關(guān)系
家庭收入決定消費支出,收入的變化必然引起消費支出的變化,這兩個變量中收入是,而消費支出則是。舉例
自變量
因變量(二)相關(guān)關(guān)系7函數(shù)關(guān)系指變量之間存在著確定性依存關(guān)系。即當一個或一組變量每取一個值時,相應(yīng)的另一個變量必然有一個確定值與之對應(yīng)。函數(shù)關(guān)系可以用一個確定的公式,即函數(shù)式
來表示。
或:Y=F(X)1.函數(shù)關(guān)系8相關(guān)關(guān)系指變量之間存在著非確定性依存關(guān)系。即當一個或一組變量每取一個值時,相應(yīng)的另一個變量可能有多個不同值與之對應(yīng)。
如:根據(jù)消費理論,商品需求量Q與商品價格P、居民收入I之間具有相關(guān)關(guān)系:
或:Y=F(X)+ε或用統(tǒng)計模型表示:2.相關(guān)關(guān)系9現(xiàn)實生活中存在大量相關(guān)關(guān)系人的身高與年齡;產(chǎn)品的成本與生產(chǎn)數(shù)量;商品的銷售額與廣告費;家庭的支出與收入。等等10單相關(guān)
是兩個變量之間存在的相關(guān)關(guān)系,即一個因變量與一個自變量之間的依存關(guān)系。因此也稱為一元相關(guān)。復(fù)相關(guān)
也稱多元相關(guān),是指三個或三個以上變量之間存在的相關(guān)關(guān)系,通常涉及一個因變量與兩個或更多個自變量,也稱多元相關(guān)。1、按相關(guān)關(guān)系涉及變量的多少可分為:相關(guān)關(guān)系的種類11直線相關(guān)當自變量X值每變動一個單位,因變量Y值則隨著發(fā)生大致均等的變動,這就是直線相關(guān)。亦稱為簡單相關(guān)或一元線性相關(guān)。曲線相關(guān)當自變量X值每變動一個單位,因變量Y值則隨之發(fā)生不均等的變化,這就曲線相關(guān)?;蛞辉蔷€性相關(guān)。2、按相關(guān)關(guān)系形式可分為12正相關(guān)當自變量X值增加(或減少)時,因變量Y值也隨之增加(或減少),這樣的相關(guān)關(guān)系就是正相關(guān),也叫同向相關(guān)。負相關(guān)當自變量X的值增加(或減少)時,因變量Y的值隨之而減少(或增加),這樣的相關(guān)關(guān)系就是負相關(guān),也叫異向相關(guān)。3、按相關(guān)的方向可分為134、按相關(guān)關(guān)系的密切程度分為完全相關(guān)因變量完全隨自變量變動而變動,存在著嚴格的依存關(guān)系。即變量間的關(guān)系為函數(shù)關(guān)系。不完全相關(guān)變量之間存在著不嚴格的依存關(guān)系,即因變量的變動除了受自變量變動的影響外,還受其他因素的影響。它是相關(guān)關(guān)系的主要表現(xiàn)形式。完全不相關(guān)自變量與因變量彼此獨立,互不影響,其數(shù)量變化毫無聯(lián)系。。14(1)確定現(xiàn)象之間有無相關(guān)關(guān)系,以及相關(guān)關(guān)系的表現(xiàn)形態(tài)。(2)確定相關(guān)關(guān)系的密切程度。(3)確定相關(guān)關(guān)系的數(shù)字模型,并進行參數(shù)估計和擬合優(yōu)度檢驗。(4)回歸預(yù)測,并分析估計標準誤差。
相關(guān)關(guān)系的主要內(nèi)容15相關(guān)關(guān)系的測定定性分析是依據(jù)研究者的理論知識和實踐經(jīng)驗,對客觀現(xiàn)象之間是否存在相關(guān)關(guān)系,以及何種關(guān)系作出判斷定量分析在定性分析的基礎(chǔ)上,通過編制相關(guān)表、繪制相關(guān)圖、計算相關(guān)系數(shù)與判定系數(shù)等方法,來判斷現(xiàn)象之間相關(guān)的方向、形態(tài)及密切程度16產(chǎn)量與生產(chǎn)費用情況表相關(guān)分析表17正相關(guān)負相關(guān)曲線相關(guān)不相關(guān)xyxyxyxy
用直角坐標系的x軸代表自變量,y軸代表因變量,將兩個變量間相對應(yīng)的變量值用坐標點的形式描繪出來,用以表明相關(guān)點分布狀況的圖形。相關(guān)圖的種類18產(chǎn)品產(chǎn)量與生產(chǎn)費用相關(guān)圖19在直線相關(guān)的條件下,用以反映兩變量間線性相關(guān)密切程度的統(tǒng)計指標,用r表示相關(guān)系數(shù)其基本算法是英國統(tǒng)計學(xué)家皮爾遜所創(chuàng)的乘積動差法(發(fā)現(xiàn):x、y是對等關(guān)系)。20相關(guān)系數(shù)的取值范圍0<|r|<1表示存在不同程度線性相關(guān):
|r|
<
0.5為低度線性相關(guān);
0.5≤|r|<0.8為中度性線性相關(guān);
0.8≤|r|為高度顯著性線性相關(guān)。r>0為正相關(guān),r<0為負相關(guān);|r|=0表示不存在線性關(guān)系;|r|=1表示完全線性相關(guān);21相關(guān)系數(shù)取值及其意義-1.0+1.00-0.5+0.5完全負相關(guān)無線性相關(guān)完全正相關(guān)負相關(guān)程度增加r正相關(guān)程度增加22回歸:退回regression1877年弗朗西斯?高爾頓爵士遺傳學(xué)研究回歸線。平均身高第二節(jié)一元線性回歸模型231889年F.Gallton和他的朋友K.Pearson收集了上千個家庭的身高、臂長和腿長的記錄企圖尋找出兒子們身高與父親們身高之間關(guān)系的具體表現(xiàn)形式下圖是根據(jù)1078個家庭的調(diào)查所作的散點圖回歸分析法產(chǎn)生的歷史24160165170175180185140150160170180190200YX兒子們身高向著平均身高“回歸”25回歸形式回歸分析通過一個變量x或一些變量(x1,x2,x3…)的變化解釋另一變量y的變化.即根據(jù)相關(guān)關(guān)系的數(shù)量表達式(回歸方程式)與給定的自變量x,揭示因變量y在數(shù)量上的平均變化和求得因變量的預(yù)測值的統(tǒng)計分析方法回歸方程回歸模型反映自變量和因變量之間數(shù)學(xué)聯(lián)系的表達式。某一類回歸方程的總稱。26回歸分析的內(nèi)容和步驟1、根據(jù)理論和對問題的分析判斷,區(qū)分自變量和因變量;2、設(shè)法找出適合的數(shù)學(xué)方程式(即:回歸模型)描述變量間的關(guān)系;3、對回歸模型進行統(tǒng)計檢驗;
4、統(tǒng)計檢驗通過后,利用回歸模型,根據(jù)自變量去估計,預(yù)測因變量。27回歸分析的分類根據(jù)變量的多少分為:簡單回歸多元回歸只有一個自變量和一個因變量的回歸自變量數(shù)目在兩個或兩個以上根據(jù)建立的回歸模型形式分為:線性回歸非線性回歸從所擬合的回歸模型來看,一變量表現(xiàn)為其它變量的線性組合。從所擬合的回歸模型來看,一變量表現(xiàn)為其它變量的非線性組合。28回歸分析與相關(guān)分析理論和方法具有一致性;無相關(guān)就無回歸,相關(guān)程度越高,回歸越好;
相關(guān)系數(shù)和回歸系數(shù)方向一致,可以互相推算。聯(lián)系:區(qū)別:相關(guān)分析中x與y對等,回歸分析中x與y要確定自變量和因變量;相關(guān)分析中x、y均為隨機變量,回歸分析中只有y為隨機變量;相關(guān)分析測定相關(guān)程度和方向,回歸分析用回歸模型進行預(yù)測和控制。29一元線性回歸模型其中:yi表示因變量y在樣本中某一個具體的觀察值;xi表示在研究樣本中自變量x的具體觀察數(shù)值;a與b是參數(shù),b稱為回歸系數(shù);εi是一個隨機變量,其平均數(shù)為0,方差為σ2。30一元線性回歸模型圖解31樣本一元線性回歸方程:以樣本統(tǒng)計量估計總體參數(shù)斜率(回歸系數(shù))截距(估計的回歸方程)總體一元線性回歸模型32殘差(Residual)散點圖33最小平方法基本數(shù)學(xué)要求34標準方程3536回歸模型的檢驗1、擬合優(yōu)度檢驗確定回歸直線后,需要評價這一直線方程是否有效地反映了這兩變量之間的關(guān)系。評價回歸方程配合好壞的一個主要指標是可決系數(shù)(或稱判定系數(shù))是相關(guān)系數(shù)的平方,用表示;用來衡量回歸方程對y的解釋程度。可決系數(shù)取值范圍:越接近于1,表明x與y之間的相關(guān)性越強;越接近于0,表明兩個變量之間幾乎沒有直線相關(guān)關(guān)系??蓻Q系數(shù)37誤差平方和回歸平方和總離差平方和平方和關(guān)系(教材P237)38總偏差=回歸偏差+剩余偏差
r2表示全部偏差中有百分之幾的偏差可由x與y的回歸關(guān)系來解釋。r的符號同b數(shù)量關(guān)系及意義3940判定系數(shù)與相關(guān)系數(shù)的區(qū)別判定系數(shù)無方向性,相關(guān)系數(shù)則有方向,其方向與樣本回歸系數(shù)b相同;判定系數(shù)說明變量值的總離差平方和中可以用回歸線來解釋的比例,相關(guān)系數(shù)只說明兩變量間關(guān)聯(lián)程度及方向;相關(guān)系數(shù)有夸大變量間相關(guān)程度的傾向,因而判定系數(shù)是更好的度量值。412、顯著性檢驗(例9-3)42被害棉花紅鈴蟲喜高溫高濕,適宜各蟲態(tài)發(fā)育的溫度為25℃—32℃,相對濕度為80%一100%,低于20℃和高于35℃卵不能孵化,相對濕度60%以下成蟲不產(chǎn)卵。冬季月平均氣溫低于一4.8℃時,紅鈴蟲就不能越冬而被凍死。
1953年,18省發(fā)生紅鈴蟲大災(zāi)害,受災(zāi)面積300萬公頃,損失皮棉約二十萬噸。
案例分析43溫度xoC21232527293235產(chǎn)卵數(shù)y/個711212466115325收集一只紅鈴蟲的產(chǎn)卵數(shù)y和溫度xoC之間的7組觀測數(shù)據(jù)列于下表:(1)試建立產(chǎn)卵數(shù)y與溫度x之間的回歸方程;并預(yù)測溫度為28oC時產(chǎn)卵數(shù)目。(2)你所建立的模型中溫度在多大程度上解釋了產(chǎn)卵數(shù)的變化?問題呈現(xiàn):44畫散點圖假設(shè)線性回歸方程為:選模型分析和預(yù)測當x=28時,y=19.87×28-463.73≈93選變量解:選取氣溫為解釋變量x,產(chǎn)卵數(shù)為預(yù)報變量y。050100150200250300350036912151821242730333639當x=28時,y=19.87×28-463.73≈93估計參數(shù)由Excel得:線性回歸方程為探析1—擬合直線45殘差編號12345671020304050607080-10-20-30-40-50-6090100題解153.4617.72-12.02-48.76-46.5-57.1193.28
R2≈0.7464所以,一次函數(shù)模型中溫度解釋了74.64%的產(chǎn)卵數(shù)變化。46
y=bx2+a變換y=bx+a非線性關(guān)系線性關(guān)系問題2產(chǎn)卵數(shù)氣溫問題1如何求a、b?
t=x2探析2—拋物線擬合47溫度xoC21232527293235產(chǎn)卵數(shù)y/個711212466115325作散點圖,并由Excel計算得:y=0.367x2-202.54tt當x=28時,y=0.367×282-202.54≈85題解248編號12345671020304050607080-10-20-30-40-50-60拋物線模型47.69619.400-5.832-41.000-40.104-58.26577.968R2=0.802,拋物線模型中溫度解釋了80.2%的產(chǎn)卵數(shù)變化。49問題2變換y=bx+a非線性關(guān)系線性關(guān)系問題1如何選取指數(shù)函數(shù)的底?產(chǎn)卵數(shù)氣溫對數(shù)探析3—指數(shù)函數(shù)模型50xz當x=28oC時,y≈44溫度xoC21232527293235產(chǎn)卵數(shù)y/個711212466115325題解351殘差編號12345671020304050607080-10-20-30-40-50-6090指數(shù)函數(shù)模型-0.19441.7248-9.18948.8521-14.121933.2573指數(shù)回歸模型中溫度解釋了98.5%的產(chǎn)卵數(shù)的變化0
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新媒體運營活動策劃方案
- 內(nèi)部控制成果培訓(xùn)
- 腹部外科術(shù)后早期活動
- 食藥局餐飲監(jiān)管培訓(xùn)
- 數(shù)控車削加工技術(shù) 課件 項目八 內(nèi)孔切削工藝及編程
- 山東省青島第十九中學(xué)2024-2025學(xué)年高一上學(xué)期10月月考地理試題(含答案)
- 河北省保定市唐縣2024-2025學(xué)年一年級上學(xué)期期中數(shù)學(xué)試題
- 2024-2025學(xué)年黑龍江省哈爾濱市道里區(qū)松南學(xué)校九年級(上)月考物理試卷(10月份)(含答案)
- 高中語文第2單元良知與悲憫群文閱讀二良知與悲憫課件新人教版必修下冊
- 高中語文第1單元論語蚜第7課好仁不好學(xué)其蔽也愚課件新人教版選修先秦諸子蚜
- 風(fēng)險分級管控課件
- 頂管施工的始發(fā) 接收施工前驗收條件
- 建筑專業(yè)大學(xué)畢業(yè)生個人事跡6篇
- 初中數(shù)學(xué)北師大七年級上冊(2023年修訂) 整式及其加減魏來《探索與表達規(guī)律二》教學(xué)設(shè)計
- 危險化學(xué)品物質(zhì)安全告知卡 (硝酸)
- DBJ∕T 15-197-2020 高大模板支撐系統(tǒng)實時安全監(jiān)測技術(shù)規(guī)范
- 材料成型與工藝
- 精通版五年級英語上冊全冊單元測試卷(含聽力材料及答案)
- 三維建模收費標準
- 戰(zhàn)略解碼的方法-魚骨圖 魚骨圖分析-工具圖
- 河西煤礦2022年度防治水一礦一策的礦井災(zāi)害治理方案
評論
0/150
提交評論