第七章相關(guān)與回歸分析_第1頁(yè)
第七章相關(guān)與回歸分析_第2頁(yè)
第七章相關(guān)與回歸分析_第3頁(yè)
第七章相關(guān)與回歸分析_第4頁(yè)
第七章相關(guān)與回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩68頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第七章相關(guān)與回歸分析本章內(nèi)容:理解相關(guān)關(guān)系概念、分類(lèi),相關(guān)分析與回歸分析的區(qū)別聯(lián)系;掌握單相關(guān)關(guān)系分析,學(xué)會(huì)相關(guān)系數(shù)的計(jì)算;掌握一元線(xiàn)性回歸分析,學(xué)會(huì)用最小二乘法估計(jì)回歸參數(shù),學(xué)會(huì)計(jì)算估計(jì)標(biāo)準(zhǔn)誤差、可決系數(shù)。7/12/2023第七章相關(guān)與回歸分析1實(shí)例1

中國(guó)婦女生育水平的決定因素是什么?婦女生育水平除了受計(jì)劃生育政策影響以外,還可能與社會(huì)、經(jīng)濟(jì)、文化等多種因素有關(guān)。1.影響中國(guó)婦女生育率變動(dòng)的因素有哪些?2.各種因素對(duì)生育率的作用方向和作用程度如何?3.哪些因素是影響婦女生育率主要的決定性因素?4.如何評(píng)價(jià)計(jì)劃生育政策在生育水平變動(dòng)中的作用?5.計(jì)劃生育政策與經(jīng)濟(jì)因素比較,什么是影響生育率的決定因素?6.如果某些地區(qū)的計(jì)劃生育政策及社會(huì)、經(jīng)濟(jì)、文化等因素發(fā)生重大變化,預(yù)期對(duì)這些地區(qū)的婦女生育水平會(huì)產(chǎn)生怎樣的影響?7/12/2023第七章相關(guān)與回歸分析2

據(jù)世界衛(wèi)生組織統(tǒng)計(jì),全球肥胖癥患者達(dá)3億人,其中兒童占2200萬(wàn)人,11億人體重過(guò)重。肥胖癥和體重超常早已不是發(fā)達(dá)國(guó)家的“專(zhuān)利”,已遍及五大洲。目前,全球因”吃”致病乃至死亡的人數(shù)已高于因饑餓死亡的人數(shù)。

(引自《光明日?qǐng)?bào)》劉軍/文)問(wèn)題:肥胖癥和體重超常與死亡人數(shù)真有顯著的數(shù)量關(guān)系嗎?這些類(lèi)型的問(wèn)題可以運(yùn)用相關(guān)分析與回歸分析的方法去解決。實(shí)例2全球吃死的人比餓死的人多?7/12/2023第七章相關(guān)與回歸分析3第一節(jié)相關(guān)與回歸分析

的基本概念本節(jié)需要把握四個(gè)問(wèn)題:一、函數(shù)關(guān)系與相關(guān)關(guān)系;二、相關(guān)關(guān)系的種類(lèi);三、相關(guān)分析與回歸分析;四、相關(guān)表和相關(guān)圖。7/12/2023第七章相關(guān)與回歸分析4一、函數(shù)關(guān)系與相關(guān)關(guān)系客觀(guān)現(xiàn)象總是普遍聯(lián)系和相互依存的,客觀(guān)現(xiàn)象間的數(shù)量聯(lián)系存在兩種不同類(lèi)型:函數(shù)關(guān)系和相關(guān)關(guān)系。把握三個(gè)問(wèn)題:1、函數(shù)關(guān)系;2、相關(guān)關(guān)系;3、二者關(guān)系。7/12/2023第七章相關(guān)與回歸分析51、函數(shù)關(guān)系函數(shù)關(guān)系是指變量之間存在著嚴(yán)格確定的依存關(guān)系,在這種關(guān)系中,當(dāng)一個(gè)或幾個(gè)變量取一定量的值時(shí),另一變量有確定值與之相對(duì)應(yīng),并且這種關(guān)系可以用一個(gè)數(shù)學(xué)表達(dá)式反映出來(lái)。如:某種產(chǎn)品的總成本S與該產(chǎn)品的產(chǎn)量Q以及該產(chǎn)品的單位成本P之間的關(guān)系可用S=PQ表達(dá),這就是一種函數(shù)關(guān)系。通常把作為影響因素的變量稱(chēng)為自變量,把發(fā)生相應(yīng)變化的變量稱(chēng)為因變量。在本例中,S是因變量,P與Q則是自變量。7/12/2023第七章相關(guān)與回歸分析62、相關(guān)關(guān)系相關(guān)關(guān)系是指變量之間存在一定的相依關(guān)系,但又不是確定的和嚴(yán)格依存的。這類(lèi)關(guān)系中,當(dāng)一個(gè)或幾個(gè)相互聯(lián)系的變量取一定數(shù)值時(shí),與之相對(duì)應(yīng)的變量就會(huì)有若干個(gè)數(shù)值與之相對(duì)應(yīng),從而表現(xiàn)出一定的波動(dòng)性。例如商品流轉(zhuǎn)規(guī)模與流通費(fèi)用的關(guān)系,家庭收入與消費(fèi)支出的關(guān)系,工業(yè)勞動(dòng)生產(chǎn)率與產(chǎn)品成本的關(guān)系等都屬于相關(guān)關(guān)系。在統(tǒng)計(jì)中所研究的就是這種相關(guān)關(guān)系。7/12/2023第七章相關(guān)與回歸分析7函數(shù)關(guān)系和相關(guān)關(guān)系之間并不存在嚴(yán)格的界限,一定條件下可以轉(zhuǎn)化。由于有測(cè)量誤差等原因,函數(shù)關(guān)系在實(shí)際中往往通過(guò)相關(guān)關(guān)系表現(xiàn)出來(lái);反之當(dāng)對(duì)現(xiàn)象之間的內(nèi)在聯(lián)系和規(guī)律性了解得更清楚深刻的時(shí)候,相關(guān)關(guān)系也可能轉(zhuǎn)化為函數(shù)關(guān)系。因此,相關(guān)關(guān)系通??梢杂靡欢ǖ暮瘮?shù)關(guān)系表達(dá)式去近似地描述。3、二者關(guān)系7/12/2023第七章相關(guān)與回歸分析8二、相關(guān)關(guān)系的種類(lèi)把握以下問(wèn)題:1、按相關(guān)程度劃分;2、按相關(guān)方向劃分;3、按相關(guān)形式劃分;4、按變量多少劃分。7/12/2023第七章相關(guān)與回歸分析91、按相關(guān)程度劃分可分為完全相關(guān)、不完全相關(guān)和不相關(guān)(1)完全相關(guān):當(dāng)一種現(xiàn)象的數(shù)量變化完全由另一個(gè)現(xiàn)象的數(shù)量變化所確定時(shí),稱(chēng)這兩種現(xiàn)象之間的關(guān)系為完全相關(guān),例如圓的周長(zhǎng)L決定于它的半徑R,即L=2πR;如銷(xiāo)售額與銷(xiāo)售量之間的關(guān)系(價(jià)格不變)。在這種情況下,相關(guān)關(guān)系即為函數(shù)關(guān)系,也可以說(shuō)函數(shù)關(guān)系是相關(guān)關(guān)系的一種特例。7/12/2023第七章相關(guān)與回歸分析101、按相關(guān)程度劃分(2)不相關(guān):當(dāng)兩個(gè)現(xiàn)象彼此互不影響,其數(shù)量變化各自獨(dú)立時(shí),稱(chēng)這兩個(gè)現(xiàn)象之間的關(guān)系為不相關(guān)或零相關(guān)。例如:學(xué)生的學(xué)習(xí)成績(jī)與其身高、天氣與股票價(jià)格的關(guān)系等一般認(rèn)為是不相關(guān)的。(3)不完全相關(guān):若兩個(gè)現(xiàn)象之間的關(guān)系介于完全相關(guān)和不相關(guān)之間,就稱(chēng)為不完全相關(guān),如居民的收入與支出水平。一般的相關(guān)現(xiàn)象都是指這種不完全相關(guān),這是相關(guān)分析的研究對(duì)象。7/12/2023第七章相關(guān)與回歸分析11可分為正相關(guān)和負(fù)相關(guān)(1)兩個(gè)相關(guān)現(xiàn)象間,當(dāng)一個(gè)變量的數(shù)值增加(或減少)時(shí),另一個(gè)變量的數(shù)值也隨之增加(或減少),這種相關(guān)稱(chēng)為正相關(guān)。如工人工資與勞動(dòng)生產(chǎn)率;人均消費(fèi)水平與人均收入水平等。(2)當(dāng)一個(gè)變量的數(shù)值增加(或減少)時(shí),而另一個(gè)變量的數(shù)值相反地呈減少(或增加)趨勢(shì)變化,稱(chēng)為負(fù)相關(guān)。例如勞動(dòng)生產(chǎn)率愈高,單位產(chǎn)品成本愈低。2、按相關(guān)方向劃分7/12/2023第七章相關(guān)與回歸分析123、按相關(guān)形式劃分可以分為線(xiàn)性相關(guān)和非線(xiàn)性相關(guān)(1)線(xiàn)性相關(guān):當(dāng)一個(gè)變量發(fā)生變動(dòng),另一個(gè)變量隨之發(fā)生大致均等的變動(dòng)(增加或減少),從圖形上看,其觀(guān)測(cè)點(diǎn)的分布近似地表現(xiàn)為直線(xiàn)形式,就是線(xiàn)性相關(guān)。(2)非線(xiàn)性相關(guān):而當(dāng)一個(gè)變量發(fā)生變動(dòng),另一個(gè)變量也隨之發(fā)生變動(dòng)(增加或減少),但是這種變動(dòng)不是均等的,從圖形上看,其觀(guān)察點(diǎn)的分布表現(xiàn)為各種不同的曲線(xiàn)形式,這種相關(guān)關(guān)系稱(chēng)為非線(xiàn)性相關(guān)。7/12/2023第七章相關(guān)與回歸分析134、按變量多少劃分可分為單相關(guān)、復(fù)相關(guān)和偏相關(guān)(1)單相關(guān):又稱(chēng)一元相關(guān),是指兩個(gè)變量之間的相關(guān)關(guān)系,即僅限于一個(gè)變量與另一個(gè)變量之間的依存關(guān)系。如只研究農(nóng)物產(chǎn)量與施肥量間的關(guān)系。(2)復(fù)相關(guān):又稱(chēng)多元相關(guān),是指三個(gè)或三個(gè)以上變量之間的相關(guān)關(guān)系。例如家庭的消費(fèi)支出與家庭收入水平及市場(chǎng)價(jià)格水平之間的關(guān)系便是一種復(fù)相關(guān)。如研究農(nóng)物產(chǎn)量與施肥量、降雨量間的關(guān)系。7/12/2023第七章相關(guān)與回歸分析144、按變量多少劃分(3)偏相關(guān):在某一變量與多個(gè)變量相關(guān)時(shí),當(dāng)假定其他變量不變,其中兩個(gè)變量的相關(guān)關(guān)系稱(chēng)為偏相關(guān)。例如在假定家庭收入水平不變的條件下,市場(chǎng)價(jià)格水平與家庭的消費(fèi)支出的關(guān)系就是一種偏相關(guān)。7/12/2023第七章相關(guān)與回歸分析15三、相關(guān)分析與回歸分析把握以下問(wèn)題:1、相關(guān)分析與回歸分析的概念;2、二者的聯(lián)系;3、二者的區(qū)別;4、應(yīng)用中注意局限性。7/12/2023第七章相關(guān)與回歸分析161、相關(guān)分析與回歸分析的概念二者是研究現(xiàn)象間相關(guān)關(guān)系的基本方法。(1)相關(guān)分析(狹義):指用一個(gè)指標(biāo)表明現(xiàn)象間相互依存關(guān)系的密切程度。不過(guò)相關(guān)分析并不能說(shuō)明變量間相關(guān)關(guān)系的具體形式,也不能從一個(gè)變量的變化去推測(cè)另一個(gè)變量的具體變化。7/12/2023第七章相關(guān)與回歸分析17相關(guān)分析與回歸分析回歸的古典意義:

高爾頓遺傳學(xué)的回歸概念

父母身高與子女身高的關(guān)系:

無(wú)論高個(gè)子或低個(gè)子的子女都有向人的平均身高回歸的趨勢(shì)7/12/2023第七章相關(guān)與回歸分析18

回歸的現(xiàn)代意義一個(gè)因變量對(duì)若干解釋變量依存關(guān)系的研究回歸的目的(實(shí)質(zhì)):由固定的自變量去估計(jì)因變量的平均值樣本總體自變量固定值估計(jì)因變量平均值7/12/2023第七章相關(guān)與回歸分析191、相關(guān)分析與回歸分析的概念(2)回歸分析:根據(jù)相關(guān)關(guān)系的具體形態(tài),選擇一個(gè)合適的數(shù)學(xué)模型來(lái)近似表達(dá)變量間的平均變化關(guān)系,其目的是要根據(jù)已知的或固定的自變量的數(shù)值去估計(jì)因變量的總體平均值。7/12/2023第七章相關(guān)與回歸分析202、二者的聯(lián)系二者有著密切的聯(lián)系,它們具有共同的研究對(duì)象,在具體運(yùn)用時(shí)需要互相補(bǔ)充。具體:(1)相關(guān)分析需要依靠回歸分析表明現(xiàn)象數(shù)量相關(guān)的具體形式;(2)回歸分析需要依靠相關(guān)分析來(lái)表明現(xiàn)象數(shù)量變化的相關(guān)程度,只有變量之間存在著高度相關(guān)時(shí),進(jìn)行回歸分析尋求其相關(guān)的具體形式才有意義。因此,回歸分析和相關(guān)分析也合并稱(chēng)為相關(guān)關(guān)系分析或廣義的相關(guān)分析。7/12/2023第七章相關(guān)與回歸分析213、二者的區(qū)別在研究目的和具體的研究方法上是有明顯區(qū)別的,兩者的主要區(qū)別在于:(1)從研究目的上看,相關(guān)分析是用一定的數(shù)量指標(biāo)(相關(guān)系數(shù))度量變量間相互聯(lián)系的方向和程度;回歸分析卻是要尋求變量間聯(lián)系的具體數(shù)學(xué)形式,是要根據(jù)自變量的固定值去估計(jì)和預(yù)測(cè)因變量的值。7/12/2023第七章相關(guān)與回歸分析223、二者的區(qū)別(2)從對(duì)變量的處理上看,相關(guān)分析對(duì)稱(chēng)地對(duì)待相互聯(lián)系的變量,不考慮二者的因果關(guān)系,也就是不區(qū)分自變量和因變量,相關(guān)的變量不一定具有因果關(guān)系,均視為隨機(jī)變量。回歸分析是在變量因果關(guān)系分析的基礎(chǔ)上研究其中的自變量的變動(dòng)對(duì)因變量的具體影響,必須明確劃分自變量和因變量,回歸分析中對(duì)變量的處理是不對(duì)稱(chēng)的,在回歸分析中通常假定自變量在重復(fù)抽樣中是取固定值的非隨機(jī)變量,只有因變量是具有一定概率分布的隨機(jī)變量。7/12/2023第七章相關(guān)與回歸分析234、應(yīng)用中注意局限性相關(guān)和回歸分析是對(duì)現(xiàn)象間相關(guān)關(guān)系進(jìn)行分析的有效的科學(xué)方法,但是它們有一定的局限性。在確定應(yīng)用相關(guān)和回歸分析之前,必須進(jìn)行定性分析,運(yùn)用足夠的理論知識(shí)、專(zhuān)業(yè)知識(shí)和必要的經(jīng)驗(yàn)來(lái)判斷現(xiàn)象之間是否具有真正的相關(guān),是具有實(shí)質(zhì)性的內(nèi)在聯(lián)系還是表面上的聯(lián)系,還是一種偶然的巧合。因此在應(yīng)用相關(guān)和回歸分析對(duì)客面現(xiàn)象進(jìn)行研究時(shí),一定要注意把定性分析和定量分析結(jié)合起來(lái),在定性分析基礎(chǔ)上開(kāi)展相關(guān)和回歸的定量分析。7/12/2023第七章相關(guān)與回歸分析24四、相關(guān)表和相關(guān)圖相關(guān)分析中,通過(guò)繪制相關(guān)圖和相關(guān)表,可以對(duì)現(xiàn)象之間存在的相關(guān)關(guān)系的方向、形式和密切程度作直觀(guān)的、大致的判斷。把握以下問(wèn)題:1、相關(guān)表;2、相關(guān)圖。7/12/2023第七章相關(guān)與回歸分析251、相關(guān)表(1)相關(guān)表是一種反映變量間相關(guān)關(guān)系的統(tǒng)計(jì)表。研究現(xiàn)象之間的依存關(guān)系,首先要通過(guò)實(shí)際調(diào)查取得一系列成對(duì)的數(shù)據(jù),作為相關(guān)分析的原始資料。將某一變量按其數(shù)值的大小順序排列,然后再將與其相關(guān)的另一變量的對(duì)應(yīng)值平行排列,便可得到簡(jiǎn)單的相關(guān)表。

7/12/2023第七章相關(guān)與回歸分析261、相關(guān)表(2)例如假設(shè)對(duì)10戶(hù)居民家庭的月可支配收入和消費(fèi)指出進(jìn)行調(diào)查,得到原始資料如表

表1居民收入和消費(fèi)的原始資料單位:百元根據(jù)原始資料,將消費(fèi)支出從小到大排序,得到表2居民家庭編號(hào)12345678910

消費(fèi)支出20154030426065705378可支配收入251860456288929975987/12/2023第七章相關(guān)與回歸分析271、相關(guān)表(2)表2居民消費(fèi)和收入的相關(guān)表單位:百元從表中看出,隨著可支配收入的提高,居民的消費(fèi)支出也有相應(yīng)提高的趨勢(shì),二者存在明顯的正相關(guān)關(guān)系。消費(fèi)支出15203040425360657078可支配收入182545606275889299987/12/2023第七章相關(guān)與回歸分析282、相關(guān)圖相關(guān)圖又稱(chēng)散點(diǎn)圖或散布圖,是以直角坐標(biāo)系的橫軸代表變量X,縱軸代表變量Y,將兩變量相對(duì)應(yīng)的成對(duì)的數(shù)據(jù)用坐標(biāo)點(diǎn)的形式描繪出來(lái),用于反映兩變量之間相關(guān)關(guān)系的圖形。由表2的資料繪制的相關(guān)圖如圖1所示。7/12/2023第七章相關(guān)與回歸分析29圖1從圖看出,居民的消費(fèi)支出與可支配收入之間呈現(xiàn)正線(xiàn)性相關(guān)關(guān)系7/12/2023第七章相關(guān)與回歸分析30

第二節(jié)簡(jiǎn)單線(xiàn)性相關(guān)分析把握以下問(wèn)題:一、相關(guān)系數(shù)概念;二、相關(guān)系數(shù)的特點(diǎn);三、例子。7/12/2023第七章相關(guān)與回歸分析31一、相關(guān)系數(shù)概念把握以下問(wèn)題:1、相關(guān)系數(shù)的定義;2、總體相關(guān)系數(shù)的定義式;3、樣本相關(guān)系數(shù)的定義公式。7/12/2023第七章相關(guān)與回歸分析321、相關(guān)系數(shù)的定義單相關(guān)分析是對(duì)兩個(gè)變量間的相關(guān)程度進(jìn)行分析。單相關(guān)分析所用的指標(biāo)稱(chēng)為單相關(guān)系數(shù)簡(jiǎn)稱(chēng)相關(guān)系數(shù)。通常用表示總體的相關(guān)系數(shù),以r表示樣本的相關(guān)系數(shù)。7/12/2023第七章相關(guān)與回歸分析33

對(duì)于所研究的總體,表示兩個(gè)相互聯(lián)系變量相關(guān)程度的總體相關(guān)系數(shù)為:式中,Cov(X,Y)是變量X和Y的協(xié)方差;Var(X)、Var(Y)分別為變量X和Y的方差。2、總體相關(guān)系數(shù)的定義式7/12/2023第七章相關(guān)與回歸分析34

總體相關(guān)系數(shù)反映總體兩個(gè)變量X和Y的線(xiàn)性相關(guān)程度。特點(diǎn):對(duì)于特定的總體來(lái)說(shuō),X和Y的數(shù)值是既定的,總體相關(guān)系數(shù)是客觀(guān)存在的特定數(shù)值。2、總體相關(guān)系數(shù)的定義式7/12/2023第七章相關(guān)與回歸分析353、樣本相關(guān)系數(shù)的定義公式通過(guò)X和Y的樣本觀(guān)測(cè)值去估計(jì)樣本相關(guān)系數(shù),變量X和Y的樣本相關(guān)系數(shù)通常用表示特點(diǎn):樣本相關(guān)系數(shù)是根據(jù)從總體中抽取的隨機(jī)樣本的觀(guān)測(cè)值計(jì)算出來(lái)的,是對(duì)總體相關(guān)系數(shù)的估計(jì),它是個(gè)隨機(jī)變量。7/12/2023第七章相關(guān)與回歸分析363、樣本相關(guān)系數(shù)的定義公式可以證明:7/12/2023第七章相關(guān)與回歸分析373、樣本相關(guān)系數(shù)的定義公式證明:設(shè):7/12/2023第七章相關(guān)與回歸分析383、樣本相關(guān)系數(shù)的定義公式得到:簡(jiǎn)便公式:7/12/2023第七章相關(guān)與回歸分析393、樣本相關(guān)系數(shù)的定義公式樣本相關(guān)系數(shù)是根據(jù)樣本觀(guān)測(cè)值計(jì)算的,抽取的樣本不同,其具體數(shù)值有差異,它是總體相關(guān)系數(shù)的一致估計(jì)量。7/12/2023第七章相關(guān)與回歸分析40二、相關(guān)系數(shù)的特點(diǎn)(1)相關(guān)系數(shù)的取值在-1與1之間。(2)當(dāng)r=0時(shí),表明X與Y沒(méi)有線(xiàn)性相關(guān)關(guān)系。7/12/2023第七章相關(guān)與回歸分析41二、相關(guān)系數(shù)的特點(diǎn)判斷兩變量X與Y線(xiàn)性相關(guān)密切程度的具體標(biāo)準(zhǔn)為:

7/12/2023第七章相關(guān)與回歸分析42使用相關(guān)系數(shù)的注意事項(xiàng)X和Y都是相互對(duì)稱(chēng)的隨機(jī)變量,所以相關(guān)系數(shù)只反映變量間的線(xiàn)性相關(guān)程度,不能說(shuō)明非線(xiàn)性相關(guān)關(guān)系。相關(guān)系數(shù)不能確定變量的因果關(guān)系,也不能說(shuō)明相關(guān)關(guān)系具體接近于哪條直線(xiàn)。7/12/2023第七章相關(guān)與回歸分析43例子根據(jù)15個(gè)居民家庭的人均月食品支出與人均月收入水平的數(shù)值計(jì)算二者的相關(guān)系數(shù)。先列出簡(jiǎn)單線(xiàn)性相關(guān)系數(shù)計(jì)算表(如下表)單位:元7/12/2023第七章相關(guān)與回歸分析44編號(hào)XYXYX2Y211022727541040472929626249692166763972524259409625410228285610404784591272457828172961583656882496412967541910262916361883262158688967691233138131512996110106313286112369611112934438616641115612138385244190441444138127218765617291492282576846478415642012804096400合計(jì)151642344632163654123117/12/2023第七章相關(guān)與回歸分析45例子利用例8-1中給出的數(shù)據(jù)和上表計(jì)算的結(jié)果分別從兩個(gè)角度計(jì)算食品支出與收入水平的樣本相關(guān)系數(shù)。解:(1)將有關(guān)數(shù)據(jù)代入定義公式得:或7/12/2023第七章相關(guān)與回歸分析46

第三節(jié)一元線(xiàn)性回歸分析把握以下問(wèn)題:一、標(biāo)準(zhǔn)的一元線(xiàn)性回歸模型;二、一元線(xiàn)性回歸模型的估計(jì);7/12/2023第七章相關(guān)與回歸分析47一、標(biāo)準(zhǔn)的一元線(xiàn)性回歸模型把握以下問(wèn)題:1、總體回歸函數(shù);2、樣本回歸函數(shù);3、樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系;4、誤差項(xiàng)的標(biāo)準(zhǔn)假定。7/12/2023第七章相關(guān)與回歸分析48總體回歸函數(shù)與樣本回歸函數(shù)

若干基本概念

Y的條件分布:Y在X取某固定值條件下的分布?!駥?duì)于X的每一個(gè)取值,都有Y的條件期望與之對(duì)應(yīng),在坐標(biāo)圖上Y的條件期望的點(diǎn)隨X而變化的軌跡所形成的直線(xiàn)或曲線(xiàn),稱(chēng)為回歸線(xiàn)?!袢绻裏的條件期望表示為X的某種函數(shù):

,這個(gè)函數(shù)稱(chēng)為回歸函數(shù)?!袢绻浜瘮?shù)形式是只有一個(gè)自變量的線(xiàn)性函數(shù),如,稱(chēng)為簡(jiǎn)單線(xiàn)性回歸函數(shù)。7/12/2023第七章相關(guān)與回歸分析491、總體回歸函數(shù)(PRF)

概念:將總體因變量Y的條件均值表現(xiàn)為自變量X的某種函數(shù),這個(gè)函數(shù)稱(chēng)為總體回歸函數(shù)(簡(jiǎn)記為PRF)。表現(xiàn)形式:(1)條件均值表現(xiàn)形式(2)個(gè)別值表現(xiàn)形式(隨機(jī)設(shè)定形式)7/12/2023第七章相關(guān)與回歸分析50

1、總體回歸函數(shù)(PRF)假定因變量Y主要受自變量X的影響,二者間存在近似的線(xiàn)性函數(shù)關(guān)系有該式被稱(chēng)為總體回歸函數(shù),式中是未知的參數(shù),又叫回歸系數(shù)。Yi和Xi分別是Y和X的第i次觀(guān)測(cè)值。ui

是隨機(jī)誤差項(xiàng),又叫隨機(jī)干擾項(xiàng),它是一個(gè)特殊的隨機(jī)變量,反映未列入方程式的其他各種因素的影響。7/12/2023第七章相關(guān)與回歸分析51

1、總體回歸函數(shù)(PRF)(2)舉例說(shuō)明:消費(fèi)函數(shù)式中Yt表示消費(fèi)支出,Xt表示可支配收入。為基礎(chǔ)消費(fèi)水平的支出,不受可支配收入的影響,為邊際消費(fèi)傾向,表明可支配收入每增加一個(gè)單位,消費(fèi)支出增加的數(shù)量。此處,可支配收入是決定消費(fèi)支出的主要因素,圖中可表示為一條直線(xiàn),但現(xiàn)實(shí)中確定型的消費(fèi)函數(shù)很難成立,原因是除收入外還有各種因素影響消費(fèi)支出。7/12/2023第七章相關(guān)與回歸分析522、樣本回歸函數(shù)(SRF)概念:

●Y的樣本觀(guān)測(cè)值的條件均值隨自變量X而變動(dòng)的軌跡,稱(chēng)為樣本回歸線(xiàn)。●如果把因變量Y的樣本條件均值表示為自變量X的某種函數(shù),這個(gè)函數(shù)稱(chēng)為樣本回歸函數(shù)簡(jiǎn)記為SRF)。表現(xiàn)形式:線(xiàn)性樣本回歸函數(shù)可表示為或者7/12/2023第七章相關(guān)與回歸分析53

3、樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系

——相互聯(lián)系

●樣本回歸函數(shù)的函數(shù)形式應(yīng)與設(shè)定的總體回歸函數(shù)的函數(shù)形式一致?!窈褪菍?duì)總體回歸函數(shù)參數(shù)的估計(jì)?!袷菍?duì)總體條件期望的估計(jì)●殘差e在概念上類(lèi)似總體回歸函數(shù)中的隨機(jī)誤差u。回歸分析的目的:用樣本回歸函數(shù)去估計(jì)總體回歸函數(shù)。7/12/2023第七章相關(guān)與回歸分析543、樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系

——相互區(qū)別

●總體回歸函數(shù)雖然未知,但它是確定的;樣本回歸線(xiàn)隨抽樣波動(dòng)而變化,可以有許多條?!駱颖净貧w線(xiàn)還不是總體回歸線(xiàn),至多只是未知總體回歸線(xiàn)的近似表現(xiàn)?!窨傮w回歸函數(shù)的參數(shù)雖未知,但是確定的常數(shù);樣本回歸函數(shù)的參數(shù)可估計(jì),但是隨抽樣而變化的隨機(jī)變量?!窨傮w回歸函數(shù)中的是不可直接觀(guān)測(cè)的;而樣本回歸函數(shù)中的是只要估計(jì)出樣本回歸的參數(shù)就可以計(jì)算的數(shù)值。

7/12/2023第七章相關(guān)與回歸分析554、誤差項(xiàng)的基本假定隨機(jī)誤差項(xiàng)是無(wú)法直接觀(guān)測(cè)的。為了進(jìn)行回歸分析,對(duì)其概率分布提出假定:假定1:零均值假定,即誤差項(xiàng)的期望值為0。假定2:同方差假定,即誤差項(xiàng)的方差為常數(shù)。假定3:無(wú)自相關(guān)假定,即誤差項(xiàng)之間不存在序列相關(guān)關(guān)系,其協(xié)方差為0。

7/12/2023第七章相關(guān)與回歸分析564、誤差項(xiàng)的基本假定假定4:隨機(jī)擾動(dòng)與自變量不相關(guān),即自變量是給定的變量,與隨機(jī)誤差項(xiàng)線(xiàn)性無(wú)關(guān)。假定5:正態(tài)性假定,隨機(jī)誤差項(xiàng)服從正態(tài)分布以上假定是德國(guó)數(shù)學(xué)家高斯最早提出,又稱(chēng)高斯假定。滿(mǎn)足以上標(biāo)準(zhǔn)假定的一元線(xiàn)性回歸模型,稱(chēng)為標(biāo)準(zhǔn)的一元線(xiàn)性回歸模型。7/12/2023第七章相關(guān)與回歸分析57二、一元線(xiàn)性回歸模型的估計(jì)把握以下問(wèn)題:1、回歸系數(shù)的估計(jì);2、擬合優(yōu)度的度量3、可決系數(shù)與相關(guān)系數(shù)的關(guān)系7/12/2023第七章相關(guān)與回歸分析581、回歸系數(shù)的估計(jì)(1)根據(jù)樣本資料確定樣本回歸方程時(shí),一般希望Y的估計(jì)值盡可能接近其真實(shí)值,即ei的總量越小越好,但有正負(fù),代數(shù)和為0(∑ei=0),通常用∑ei2作為衡量總偏差的尺度。所謂最小二乘法根據(jù)這一思路,使殘差平方和最小來(lái)估計(jì)回歸系數(shù)。(2)設(shè)為使Q最小,對(duì)求偏導(dǎo)數(shù),令其為0,得:7/12/2023第七章相關(guān)與回歸分析591、回歸系數(shù)的估計(jì)(2)整理后有:稱(chēng)為標(biāo)準(zhǔn)方程組,n為樣本容量,解方程組得:7/12/2023第七章相關(guān)與回歸分析601、回歸系數(shù)的估計(jì)(3)可以證明:證明:設(shè)得到:7/12/2023第七章相關(guān)與回歸分析61例子根據(jù)15個(gè)居民家庭的人均月食品支出與人均月收入水平的數(shù)據(jù),估計(jì)食品支出的恩格爾函數(shù)。解:最簡(jiǎn)單的恩格爾函數(shù)假定在商品價(jià)格不變的條件下,實(shí)際的食品支出Y與實(shí)際的收入水平X間的關(guān)系可以用一元線(xiàn)性回歸模型反映。根據(jù)Y和X的數(shù)據(jù)計(jì)算有關(guān)統(tǒng)計(jì)量,列在表中,7/12/2023第七章相關(guān)與回歸分析62編號(hào)XYXYX2Y211022727541040472929626249692166763972524259409625410228285610404784591272457828172961583656882496412967541910262916361883262158688967691233138131512996110106313286112369611112934438616641115612138385244190441444138127218765617291492282576846478415642012804096400合計(jì)151642344632163654123117/12/2023第七章相關(guān)與回歸分析63例8-2解:將有關(guān)合計(jì)數(shù)代入公式得:或得

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論