![統(tǒng)計(jì)學(xué)第九章相關(guān)與回歸.ppt_第1頁](http://file.renrendoc.com/FileRoot1/2019-1/14/f3c2ea00-21f9-47e7-abf3-19389277b561/f3c2ea00-21f9-47e7-abf3-19389277b5611.gif)
![統(tǒng)計(jì)學(xué)第九章相關(guān)與回歸.ppt_第2頁](http://file.renrendoc.com/FileRoot1/2019-1/14/f3c2ea00-21f9-47e7-abf3-19389277b561/f3c2ea00-21f9-47e7-abf3-19389277b5612.gif)
![統(tǒng)計(jì)學(xué)第九章相關(guān)與回歸.ppt_第3頁](http://file.renrendoc.com/FileRoot1/2019-1/14/f3c2ea00-21f9-47e7-abf3-19389277b561/f3c2ea00-21f9-47e7-abf3-19389277b5613.gif)
![統(tǒng)計(jì)學(xué)第九章相關(guān)與回歸.ppt_第4頁](http://file.renrendoc.com/FileRoot1/2019-1/14/f3c2ea00-21f9-47e7-abf3-19389277b561/f3c2ea00-21f9-47e7-abf3-19389277b5614.gif)
![統(tǒng)計(jì)學(xué)第九章相關(guān)與回歸.ppt_第5頁](http://file.renrendoc.com/FileRoot1/2019-1/14/f3c2ea00-21f9-47e7-abf3-19389277b561/f3c2ea00-21f9-47e7-abf3-19389277b5615.gif)
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第一節(jié) 相關(guān)分析概述,第二節(jié) 簡單線性回歸模型,第九章 相關(guān)與回歸,聯(lián)系與相互影響是普遍的現(xiàn)象,事物相互間關(guān)系的質(zhì)的解釋:自然的、社會的、經(jīng)濟(jì)的、心理的,事物相互間關(guān)系的量的分析:兩變量或多變量間的數(shù)量關(guān)系。在可以解釋的質(zhì)的關(guān)系基礎(chǔ)上進(jìn)行相關(guān)分析和回歸分析,統(tǒng)計(jì)學(xué)第九章 相關(guān)與回歸,第九章 相關(guān)與回歸,相關(guān)分析的意義,第一節(jié) 相關(guān)分析概述,社會經(jīng)濟(jì)現(xiàn)象中,一些現(xiàn)象與另一些現(xiàn)象之間往往存在著依存關(guān)系,當(dāng)我們用變量來反映這些現(xiàn)象的的特征時(shí),便表現(xiàn)為變量之間的依存關(guān)系。,在分析變量的依存關(guān)系時(shí),我們把變量分為兩種:,自變量,因變量,引起其他變量發(fā)生變化的量。,受自變量的影響發(fā)生對應(yīng)變化的量,現(xiàn)象之間的相互關(guān)系,可以概括為兩種不同的類型:,(一)函數(shù)關(guān)系 (二)相關(guān)關(guān)系,例如:家庭收入決定消費(fèi)支出,收入的變化必然引起消費(fèi)支出的變化,這兩個(gè)變量中收入是自變量,而消費(fèi)支出則是因變量。,相關(guān)分析的意義,函數(shù)關(guān)系可以用一個(gè)確定的公式,即函數(shù)式,來表示。,或:Y=F(X),例2、根據(jù)消費(fèi)理論,商品需求量Q與商品價(jià)格P、居民收入I之間具有相關(guān)關(guān)系:,相關(guān)關(guān)系可用統(tǒng)計(jì)模型:,或:Y=F(X)+,式中,為影響Y的除X外的其他隨機(jī)因素。,相關(guān)關(guān)系的種類:,1、按相關(guān)關(guān)系涉及的影響變量多少可分為:,相關(guān)關(guān)系的種類:,2、按相關(guān)關(guān)系的表現(xiàn)形式可分為:,相關(guān)關(guān)系的種類:,3、按線形相關(guān)的變動(dòng)方向可分為:,線性正相關(guān),統(tǒng)計(jì)學(xué)第九章 相關(guān)與回歸,線性負(fù)相關(guān),非線性相關(guān),時(shí)間,無(不)相關(guān),相關(guān)關(guān)系的種類:,4、按相關(guān)關(guān)系的密切程度分為:,完全相關(guān),因變量完全隨自變量變動(dòng)而變動(dòng),存在著嚴(yán)格的依存關(guān)系。即變量間的關(guān)系為函數(shù)關(guān)系。,不完全相關(guān),變量之間存在著不嚴(yán)格的依存關(guān)系,即因變量的變動(dòng)除了受自變量變動(dòng)的影響外,還受其他因素的影響。它是相關(guān)關(guān)系的主要表現(xiàn)形式。,完全不相關(guān),自變量與因變量彼此獨(dú)立,互不影響,其數(shù)量變化毫無聯(lián)系。,(1)確定現(xiàn)象之間有無相關(guān)關(guān)系,以及相關(guān)關(guān)系的表現(xiàn)形態(tài)。 (2)確定相關(guān)關(guān)系的密切程度。 (3)確定相關(guān)關(guān)系的數(shù)字模型,并進(jìn)行參數(shù)估計(jì)和擬合優(yōu)度檢驗(yàn)。 (4)回歸預(yù)測,并分析估計(jì)標(biāo)準(zhǔn)誤差。,相關(guān)分析的主要內(nèi)容包括:,相關(guān)關(guān)系的測定,定性分析,是依據(jù)研究者的理論知識和實(shí)踐經(jīng)驗(yàn),對客觀現(xiàn)象之間是否存在相關(guān)關(guān)系,以及何種關(guān)系作出判斷,定量分析,在定性分析的基礎(chǔ)上,通過編制相關(guān)表、繪制相關(guān)圖、計(jì)算相關(guān)系數(shù)與判定系數(shù)等方法,來判斷現(xiàn)象之間相關(guān)的方向、形態(tài)及密切程度,在直線相關(guān)的條件下,用以反映兩變量間線性相關(guān)密切程度的統(tǒng)計(jì)指標(biāo),用r表示,相關(guān)系數(shù),其基本算法是英國統(tǒng)計(jì)學(xué)家皮爾遜所創(chuàng)的乘積動(dòng)差法,簡稱積差法。,相關(guān)關(guān)系的定量測定,相關(guān)系數(shù)r的取值范圍:-1r1,0|r|1表示存在不同程度線性相關(guān): |r| 0.3為弱相關(guān); 0.3 |r| 0.5為低度線性相關(guān); 0.5 |r| 0.8為顯著線性相關(guān); 0.8|r| 1.0為高度線性相關(guān)。,r0 為正相關(guān),r 0 為負(fù)相關(guān); |r|=0 表示不存在線性關(guān)系; |r|1 表示完全線性相關(guān);,【例】計(jì)算工業(yè)總產(chǎn)值與能源消耗量之間的相關(guān)系數(shù) 資料,結(jié)論:工業(yè)總產(chǎn)值與能源消耗量之間存在高度的正相關(guān)關(guān)系,能源消耗量x的變化能夠解釋工業(yè)總產(chǎn)值y變化的95.2。,相關(guān)系數(shù)的計(jì)算,相關(guān)關(guān)系不等于因果關(guān)系; 相關(guān)系數(shù)只度量變量間的線性關(guān)系,因此,弱相關(guān)不一定表明變量間沒有關(guān)系; 極端值可能影響相關(guān)系數(shù)。 注意相關(guān)關(guān)系成立的數(shù)據(jù)范圍。 警惕虛假相關(guān),使用相關(guān)系數(shù)時(shí)應(yīng)注意的問題:,統(tǒng)計(jì)學(xué)第九章 相關(guān)與回歸,回歸:退回regression,1877年 弗朗西斯高爾頓爵士 遺傳學(xué)研究 回歸線,統(tǒng)計(jì)學(xué)第九章 相關(guān)與回歸,第二節(jié) 簡單線性回歸模型,回歸分析法產(chǎn)生的歷史,回歸分析法。由著名的英國生物學(xué)家、統(tǒng)計(jì)學(xué)家高爾頓(F.Gallton)達(dá)爾文的表弟所創(chuàng)。 早年,高爾頓致力于化學(xué)和遺傳學(xué)領(lǐng)域的研究。 他研究父親們的身高與兒子們的身高之間的關(guān)系時(shí),建立了回歸分析法。,父親們的身高與兒子們的身高之間 關(guān)系的研究,1889年F.Gallton和他的朋友K.Pearson收集了上千個(gè)家庭的身高、臂長和腿長的記錄 企圖尋找出兒子們身高與父親們身高之間關(guān)系的具體表現(xiàn)形式 下圖是根據(jù)1078個(gè)家庭的調(diào)查所作的散點(diǎn)圖(略圖),回歸分析法產(chǎn)生的歷史,回歸分析法產(chǎn)生的歷史,從圖上雖可看出,個(gè)子高的父親確有生出個(gè)子高的兒子的傾向,同樣地,個(gè)子低的父親確有生出個(gè)子低的兒子的傾向。得到的具體規(guī)律如下: 如此以來,高的伸進(jìn)了天,低的縮入了地。他百思不得其解,同時(shí)又發(fā)現(xiàn)某人種的平均身高是相當(dāng)穩(wěn)定的。最后得到結(jié)論:兒子們的身高回復(fù)于全體男子的平均身高,即“回歸”見1889年F.Gallton的論文普用回歸定律。 后人將此種方法普遍用于尋找變量之間的規(guī)律,回歸分析法產(chǎn)生的歷史,第二節(jié) 簡單線性回歸模型,回歸分析,通過一個(gè)變量x或一些變量(x1,x2,x3)的變化解釋另一變量y的變化.即根據(jù)相關(guān)關(guān)系的數(shù)量表達(dá)式(回歸方程式)與給定的自變量x,揭示因變量y在數(shù)量上的平均變化和求得因變量的預(yù)測值的統(tǒng)計(jì)分析方法,回歸:退回regression,回歸方程,回歸模型,反映自變量和因變量之間數(shù)學(xué)聯(lián)系的表達(dá)式。,某一類回歸方程的總稱。,自變量(independent variable):解釋變量,給定的或可以控制的、用來解釋、預(yù)測應(yīng)變量的變量。 因變量(dependent variable):響應(yīng)變量,由自變量來解釋其變化的變量。,X,Y,統(tǒng)計(jì)學(xué)第九章 相關(guān)與回歸,回歸分析的內(nèi)容和步驟,1、根據(jù)理論和對問題的分析判斷, 區(qū)分自變量和因變量;,2、設(shè)法找出適合的數(shù)學(xué)方程式(即 回歸模型)描述變量間的關(guān)系,3、對回歸模型進(jìn)行統(tǒng)計(jì)檢驗(yàn);,4、統(tǒng)計(jì)檢驗(yàn)通過后,利用回歸模型,根據(jù)解釋變量去估計(jì),預(yù)測 因變量。,回歸分析的分類,根據(jù)變量的多少分為:,簡單回歸,多元回歸,只有一個(gè)自變量和一個(gè)因變量的回歸,自變量數(shù)目在兩個(gè)或兩個(gè)以上,根據(jù)建立的回歸模型形式分為:,線性回歸,非線性回歸,從所擬合的回歸模型來看,一變量表現(xiàn)為其它變量的線性組合。,從所擬合的回歸模型來看,一變量表現(xiàn)為其它變量的非線性組合,回歸分析與相關(guān)分析,理論和方法具有一致性; 無相關(guān)就無回歸,相關(guān)程度越高,回歸越好; 相關(guān)系數(shù)和回歸系數(shù)方向一致,可以互相推算。,聯(lián)系:,相關(guān)分析中x與y對等,回歸分析中x與y要確定自變量和因變量; 相關(guān)分析中x、y均為隨機(jī)變量,回歸分析中只有y為隨機(jī)變量; 相關(guān)分析測定相關(guān)程度和方向,回歸分析用回歸模型進(jìn)行預(yù)測和控制。,回歸分析與相關(guān)分析,區(qū)別:,總體一元線性回歸模型:,誤差項(xiàng),假定: E()=0,總體一元線性回歸方程:,統(tǒng)計(jì)學(xué)第九章 相關(guān)與回歸,簡單線性回歸模型,指根據(jù)成對的兩個(gè)變量的數(shù)值,配合直線方程式,根據(jù)自變量的變動(dòng),來推算因變量發(fā)展變動(dòng)趨勢的方法,其模型為:,其中:Yi表示因變量Y在總體中某一個(gè)具體的觀察值;Xi表示在研究總體中自變量X的具體觀察數(shù)值;A與B是參數(shù),稱為回歸系數(shù);i是一個(gè)隨機(jī)變量,其平均數(shù)為0,方差為2.,總體回歸模型,在實(shí)際應(yīng)用中,我們對X和Y所代表的總體往往不可能全面的觀察和了解,而只能從中抽取部分資料作為樣本,并通過樣本提供的信息來認(rèn)識總體,找出總體回歸模型的估計(jì)式,其估計(jì)式的方程式可寫為:,簡單線性回歸模型,其中:a,b和ei分別為A、B及i的估計(jì)量。,由于抽樣的隨機(jī)性,使樣本回歸線不可能與總體回歸完全重合,從而會出現(xiàn)樣本回歸函數(shù)高估或低估總體回歸函數(shù)的情況,我們能做的就是設(shè)法使樣本回歸函數(shù)盡可能接近總體回歸函數(shù),也就是說要使回歸方程參數(shù)的估計(jì)值a、b盡量接近總體真實(shí)參數(shù)A、B。,樣本回歸模型,一元線性回歸方程的幾何意義,回歸直線的擬合,總體一元線性 回歸方程:,樣本一元線性回歸方程:,以樣本統(tǒng)計(jì)量估計(jì)總體參數(shù),斜率(回歸系數(shù)),截距a 表示在沒有自變量x的影響時(shí),其它各種因素對因變量y的平均影響;回歸系數(shù)b 表明自變量x每變動(dòng)一個(gè)單位,因變量y平均變動(dòng)b個(gè)單位。,一元線性回歸方程 中參數(shù)a、b的確定:,最小平方法,整理得到由兩個(gè)關(guān)于a、b的二元一次方程組成的方程組:,進(jìn)一步整理,有:,【分析】因?yàn)楣I(yè)總產(chǎn)值與能源消耗量之間存在高度正相關(guān)關(guān)系( ),所以可以擬合工業(yè)總產(chǎn)值對能源消耗量的線性回歸方程。,【例】建立工業(yè)總產(chǎn)值對能源消耗量的線性回歸方程 資料,即線性回歸方程為:,計(jì)算結(jié)果表明,在其他條件不變時(shí),能源消耗量每增加一個(gè)單位(十萬噸),工業(yè)總產(chǎn)值將增加0.7961個(gè)單位(億元)。,回歸方程的估計(jì)與預(yù)測,估計(jì)的前提:回歸方程經(jīng)過檢驗(yàn),證明 X 和 Y 的關(guān)系在統(tǒng)計(jì)上是顯著相關(guān)的。,對于給定的 X 值,求出 Y 平均值的一個(gè)估計(jì)值或 Y 的一個(gè)個(gè)別值的預(yù)測值。,對于給定的 X 值,求出 Y 的平均值的置信區(qū)間或 Y 的一個(gè)個(gè)別值的預(yù)測區(qū)間。,點(diǎn)估計(jì),區(qū)間估計(jì),點(diǎn)估計(jì),若 x = 80(十萬噸),則:,估計(jì)的前提:回歸方程經(jīng)過檢驗(yàn),證明 X 和 Y 的關(guān)系在統(tǒng)計(jì)上是顯著的。,回歸分析的點(diǎn)估計(jì):對于給定的 X 值,求出 Y 平均值的一個(gè)估計(jì)值或 Y 的一個(gè)個(gè)別值。,若 x = 169,則:,統(tǒng)計(jì)學(xué)第九章 相關(guān)與回歸,利用點(diǎn)估計(jì)得到的Y平均值的點(diǎn)估計(jì)值和Y的一個(gè)個(gè)別值其結(jié)果是相同的。 點(diǎn)估計(jì)不能提供估計(jì)量的精確度。 在樣本自變量取值范圍之外進(jìn)行預(yù)測要特別謹(jǐn)慎。,統(tǒng)計(jì)學(xué)第九章 相關(guān)與回歸,使用點(diǎn)估計(jì)應(yīng)注意的問題:,課后練習(xí):,1若按影響因素的多少劃分,相關(guān)關(guān)系分為 相關(guān)和 相關(guān)。 2當(dāng)變量x值增加,變量y 值也增加,這是 相關(guān)關(guān)系;當(dāng)變量x值減少,變量y 值也減少,這是 相關(guān)關(guān)系。 3直觀而形象地顯示現(xiàn)象間的相關(guān)關(guān)系的方法有 和 。 4現(xiàn)象的單相關(guān)關(guān)系從形式看有 和 兩種。 5. 相關(guān)系數(shù)是測定變量之間 和 的代表性指標(biāo)。 6. 相關(guān)系數(shù)是在 相關(guān)條件下用來說明兩個(gè)變量相關(guān) 的統(tǒng)計(jì)分析指標(biāo)。 7. 完全相關(guān)的關(guān)系即 關(guān)系,其相關(guān)系數(shù)為 。 8.相關(guān)系數(shù)絕對值的大小反映相關(guān)的 ,相關(guān)系數(shù)的正負(fù)反映相關(guān)的 。 9. 計(jì)算相關(guān)系數(shù)的兩個(gè)變量都是 變量,相關(guān)系數(shù)的取值范圍是 。,10當(dāng)變量x 值增加時(shí),變量y 值隨之下降,那么變量x 與變量y 之間存在著( ) A.直線相關(guān)關(guān)系 B.正相關(guān)關(guān)系 C.負(fù)相關(guān)關(guān)系 D.曲線相關(guān)關(guān)系 11. 下列哪兩個(gè)變量之間的相關(guān)程度最高( ) A.商品銷售額和商品銷售量的相關(guān)系數(shù)是0.9 B.商品銷售額與商業(yè)利潤率的相關(guān)系數(shù)是0.84 C.平均流通費(fèi)用率與商業(yè)利潤率的相關(guān)系數(shù)是-0.94 D.商品銷售價(jià)格與銷售量的相關(guān)系數(shù)是-0.91 12. 在回歸分析中,對于沒有明顯因果關(guān)系的兩變量( ) A.可給定自變量數(shù)值估計(jì)因變量的可能值 B.可給定因變量值推出自變量值 C可以都是隨機(jī)變量 D可以都是非隨機(jī)變量 13. 配合回歸直線方程對資料的要求是( ) A.因變量是給定的數(shù)值,自變量是隨機(jī)的 B.自變量是給定的數(shù)值,因變量是隨機(jī)的 C.自變量和因變量都是隨機(jī)的 D.自變量和因變量都不是隨機(jī)的,1. 單,復(fù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 更換廚房用品合同(2篇)
- 服務(wù)記錄協(xié)議書(2篇)
- 2025年蘇教新版八年級歷史下冊月考試卷
- 2025年粵教滬科版選修歷史上冊階段測試試卷
- 2025年廣西交通職業(yè)技術(shù)學(xué)院高職單招語文2018-2024歷年參考題庫頻考點(diǎn)含答案解析
- 2025年廣東科學(xué)技術(shù)職業(yè)學(xué)院高職單招高職單招英語2016-2024歷年頻考點(diǎn)試題含答案解析
- 2025年山西藝術(shù)職業(yè)學(xué)院高職單招語文2018-2024歷年參考題庫頻考點(diǎn)含答案解析
- 2025年平?jīng)雎殬I(yè)技術(shù)學(xué)院高職單招語文2018-2024歷年參考題庫頻考點(diǎn)含答案解析
- 2025年山西國際商務(wù)職業(yè)學(xué)院高職單招高職單招英語2016-2024歷年頻考點(diǎn)試題含答案解析
- 2025年山東醫(yī)學(xué)高等專科學(xué)校高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 2024年度-美團(tuán)新騎手入門培訓(xùn)
- 駕照體檢表完整版本
- 高一數(shù)學(xué)寒假講義(新人教A專用)【復(fù)習(xí)】第05講 三角函數(shù)(學(xué)生卷)
- 農(nóng)村高中思想政治課時(shí)政教育研究的中期報(bào)告
- 醫(yī)院定崗定編方案文檔
- 4-熔化焊與熱切割作業(yè)基礎(chǔ)知識(一)
- 2023年200MW儲能電站儲能系統(tǒng)設(shè)計(jì)方案
- 個(gè)人安全與社會責(zé)任的基本知識概述
- 簡易勞務(wù)合同電子版
- 明代文學(xué)緒論
- 體育賽事的策劃、組織與實(shí)施 體育賽事利益相關(guān)者
評論
0/150
提交評論