第七章相關(guān)與回歸分析_第1頁
第七章相關(guān)與回歸分析_第2頁
第七章相關(guān)與回歸分析_第3頁
第七章相關(guān)與回歸分析_第4頁
第七章相關(guān)與回歸分析_第5頁
已閱讀5頁,還剩68頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、 本章內(nèi)容:理解相關(guān)關(guān)系概念、分類,相本章內(nèi)容:理解相關(guān)關(guān)系概念、分類,相關(guān)分析與回歸分析的區(qū)別聯(lián)系;掌握單相關(guān)分析與回歸分析的區(qū)別聯(lián)系;掌握單相關(guān)關(guān)系分析,學(xué)會相關(guān)系數(shù)的計算;掌握關(guān)關(guān)系分析,學(xué)會相關(guān)系數(shù)的計算;掌握一元線性回歸分析,學(xué)會用最小二乘法估一元線性回歸分析,學(xué)會用最小二乘法估計回歸參數(shù),學(xué)會計算估計標(biāo)準(zhǔn)誤差、可計回歸參數(shù),學(xué)會計算估計標(biāo)準(zhǔn)誤差、可決系數(shù)。決系數(shù)。3/19/2022第七章 相關(guān)與回歸分析1婦女生育水平除了受計劃生育政策影響以外,還可能婦女生育水平除了受計劃生育政策影響以外,還可能與社會、經(jīng)濟(jì)、文化等多種因素有關(guān)。與社會、經(jīng)濟(jì)、文化等多種因素有關(guān)。1. 1. 影響中國

2、婦女生育率變動的因素有哪些?影響中國婦女生育率變動的因素有哪些?2. 2. 各種因素對生育率的作用方向和作用程度如何?各種因素對生育率的作用方向和作用程度如何?3. 3. 哪些因素是影響婦女生育率主要的決定性因素?哪些因素是影響婦女生育率主要的決定性因素?4. 4. 如何評價計劃生育政策在生育水平變動中的作用?如何評價計劃生育政策在生育水平變動中的作用?5. 5. 計劃生育政策與經(jīng)濟(jì)因素比較計劃生育政策與經(jīng)濟(jì)因素比較, ,什么是影響生育率什么是影響生育率的決定因素?的決定因素?6. 6. 如果某些地區(qū)的計劃生育政策及社會、經(jīng)濟(jì)、文化如果某些地區(qū)的計劃生育政策及社會、經(jīng)濟(jì)、文化 等因素發(fā)生重大變

3、化,預(yù)期對這些地區(qū)的婦女生育等因素發(fā)生重大變化,預(yù)期對這些地區(qū)的婦女生育水平會產(chǎn)生怎樣的影響?水平會產(chǎn)生怎樣的影響?3/19/2022第七章 相關(guān)與回歸分析2 據(jù)世界衛(wèi)生組織統(tǒng)計,全球肥胖癥患者達(dá)據(jù)世界衛(wèi)生組織統(tǒng)計,全球肥胖癥患者達(dá)3 3億人,其中兒童占億人,其中兒童占22002200萬人,萬人,1111億人體重過重。億人體重過重。肥胖癥和體重超常早已不是發(fā)達(dá)國家的肥胖癥和體重超常早已不是發(fā)達(dá)國家的“專專利利”,已遍及五大洲。目前,全球因,已遍及五大洲。目前,全球因”吃吃”致致病乃至死亡的人數(shù)已高于因饑餓死亡的人數(shù)。病乃至死亡的人數(shù)已高于因饑餓死亡的人數(shù)。 ( (引自引自光明日報光明日報劉軍劉

4、軍/ /文)文)問題問題: : 肥胖癥和體重超常與死亡人數(shù)真有顯著肥胖癥和體重超常與死亡人數(shù)真有顯著 的數(shù)量關(guān)系嗎的數(shù)量關(guān)系嗎? ?這些類型的問題可以運(yùn)用相關(guān)分析與回歸分析這些類型的問題可以運(yùn)用相關(guān)分析與回歸分析的方法去解決。的方法去解決。實例實例2 2 全球吃死的人比餓死的人多全球吃死的人比餓死的人多? ?3/19/2022第七章 相關(guān)與回歸分析3 本節(jié)需要把握四個問題:本節(jié)需要把握四個問題: 一、函數(shù)關(guān)系與相關(guān)關(guān)系;一、函數(shù)關(guān)系與相關(guān)關(guān)系; 二、相關(guān)關(guān)系的種類;二、相關(guān)關(guān)系的種類; 三、相關(guān)分析與回歸分析;三、相關(guān)分析與回歸分析; 四、相關(guān)表和相關(guān)圖。四、相關(guān)表和相關(guān)圖。3/19/2022

5、第七章 相關(guān)與回歸分析4 客觀現(xiàn)象總是普遍聯(lián)系和相互依存的,客觀現(xiàn)象總是普遍聯(lián)系和相互依存的,客觀現(xiàn)象間的數(shù)量聯(lián)系存在兩種不同客觀現(xiàn)象間的數(shù)量聯(lián)系存在兩種不同類型:函數(shù)關(guān)系和相關(guān)關(guān)系。類型:函數(shù)關(guān)系和相關(guān)關(guān)系。 把握三個問題:把握三個問題: 1、函數(shù)關(guān)系;、函數(shù)關(guān)系; 2、相關(guān)關(guān)系;、相關(guān)關(guān)系; 3、二者關(guān)系。、二者關(guān)系。3/19/2022第七章 相關(guān)與回歸分析5 函數(shù)關(guān)系是指變量之間存在著嚴(yán)格確定的依存函數(shù)關(guān)系是指變量之間存在著嚴(yán)格確定的依存關(guān)系,在這種關(guān)系中,當(dāng)一個或幾個變量取一關(guān)系,在這種關(guān)系中,當(dāng)一個或幾個變量取一定量的值時,另一變量有確定值與之相對應(yīng),定量的值時,另一變量有確定值與之

6、相對應(yīng),并且這種關(guān)系可以用一個數(shù)學(xué)表達(dá)式反映出來。并且這種關(guān)系可以用一個數(shù)學(xué)表達(dá)式反映出來。 如:某種產(chǎn)品的總成本如:某種產(chǎn)品的總成本S與該產(chǎn)品的產(chǎn)量與該產(chǎn)品的產(chǎn)量Q以及以及該產(chǎn)品的單位成本該產(chǎn)品的單位成本P之間的關(guān)系可用之間的關(guān)系可用S=PQ表達(dá),表達(dá),這就是一種函數(shù)關(guān)系。通常把作為影響因素的這就是一種函數(shù)關(guān)系。通常把作為影響因素的變量稱為自變量,把發(fā)生相應(yīng)變化的變量稱為變量稱為自變量,把發(fā)生相應(yīng)變化的變量稱為因變量。在本例中,因變量。在本例中,S是因變量,是因變量,P與與Q則是自則是自變量。變量。 3/19/2022第七章 相關(guān)與回歸分析6 相關(guān)關(guān)系是指變量之間存在一定的相依關(guān)系,相關(guān)關(guān)系

7、是指變量之間存在一定的相依關(guān)系,但又不是確定的和嚴(yán)格依存的。這類關(guān)系中,但又不是確定的和嚴(yán)格依存的。這類關(guān)系中,當(dāng)一個或幾個相互聯(lián)系的變量取一定數(shù)值時,當(dāng)一個或幾個相互聯(lián)系的變量取一定數(shù)值時,與之相對應(yīng)的變量就會有若干個數(shù)值與之相與之相對應(yīng)的變量就會有若干個數(shù)值與之相對應(yīng),從而表現(xiàn)出一定的波動性。對應(yīng),從而表現(xiàn)出一定的波動性。 例如商品流轉(zhuǎn)規(guī)模與流通費(fèi)用的關(guān)系,家庭例如商品流轉(zhuǎn)規(guī)模與流通費(fèi)用的關(guān)系,家庭收入與消費(fèi)支出的關(guān)系,工業(yè)勞動生產(chǎn)率與收入與消費(fèi)支出的關(guān)系,工業(yè)勞動生產(chǎn)率與產(chǎn)品成本的關(guān)系等都屬于相關(guān)關(guān)系。在統(tǒng)計產(chǎn)品成本的關(guān)系等都屬于相關(guān)關(guān)系。在統(tǒng)計中所研究的就是這種相關(guān)關(guān)系。中所研究的就是

8、這種相關(guān)關(guān)系。3/19/2022第七章 相關(guān)與回歸分析7 函數(shù)關(guān)系和相關(guān)關(guān)系之間并不存在嚴(yán)格的界函數(shù)關(guān)系和相關(guān)關(guān)系之間并不存在嚴(yán)格的界限,一定條件下可以轉(zhuǎn)化。限,一定條件下可以轉(zhuǎn)化。 由于有測量誤差等原因,函數(shù)關(guān)系在實際中由于有測量誤差等原因,函數(shù)關(guān)系在實際中往往通過相關(guān)關(guān)系表現(xiàn)出來;反之當(dāng)對現(xiàn)象往往通過相關(guān)關(guān)系表現(xiàn)出來;反之當(dāng)對現(xiàn)象之間的內(nèi)在聯(lián)系和規(guī)律性了解得更清楚深刻之間的內(nèi)在聯(lián)系和規(guī)律性了解得更清楚深刻的時候,相關(guān)關(guān)系也可能轉(zhuǎn)化為函數(shù)關(guān)系。的時候,相關(guān)關(guān)系也可能轉(zhuǎn)化為函數(shù)關(guān)系。 因此,相關(guān)關(guān)系通??梢杂靡欢ǖ暮瘮?shù)關(guān)系因此,相關(guān)關(guān)系通??梢杂靡欢ǖ暮瘮?shù)關(guān)系表達(dá)式去近似地描述。表達(dá)式去近似地

9、描述。3/19/2022第七章 相關(guān)與回歸分析8把握以下問題:把握以下問題:1、按相關(guān)程度劃分;、按相關(guān)程度劃分;2、按相關(guān)方向劃分;、按相關(guān)方向劃分;3、按相關(guān)形式劃分;、按相關(guān)形式劃分;4、按變量多少劃分。、按變量多少劃分。3/19/2022第七章 相關(guān)與回歸分析9 可分為完全相關(guān)、不完全相關(guān)和不相關(guān)可分為完全相關(guān)、不完全相關(guān)和不相關(guān)(1)完全相關(guān):當(dāng)一種現(xiàn)象的數(shù)量變化完全)完全相關(guān):當(dāng)一種現(xiàn)象的數(shù)量變化完全由另一個現(xiàn)象的數(shù)量變化所確定時,稱這兩由另一個現(xiàn)象的數(shù)量變化所確定時,稱這兩種現(xiàn)象之間的關(guān)系為完全相關(guān),例如圓的周種現(xiàn)象之間的關(guān)系為完全相關(guān),例如圓的周長長L決定于它的半徑?jīng)Q定于它的半

10、徑R,即,即L=2R;如銷售如銷售額與銷售量之間的關(guān)系(價格不變)。額與銷售量之間的關(guān)系(價格不變)。在這在這種情況下,相關(guān)關(guān)系即為函數(shù)關(guān)系,也可以種情況下,相關(guān)關(guān)系即為函數(shù)關(guān)系,也可以說函數(shù)關(guān)系是相關(guān)關(guān)系的一種特例。說函數(shù)關(guān)系是相關(guān)關(guān)系的一種特例。3/19/2022第七章 相關(guān)與回歸分析10(2)不相關(guān):當(dāng)兩個現(xiàn)象彼此互不影響,其數(shù))不相關(guān):當(dāng)兩個現(xiàn)象彼此互不影響,其數(shù)量變化各自獨(dú)立時,稱這兩個現(xiàn)象之間的關(guān)系量變化各自獨(dú)立時,稱這兩個現(xiàn)象之間的關(guān)系為不相關(guān)或零相關(guān)。例如:學(xué)生的學(xué)習(xí)成績與為不相關(guān)或零相關(guān)。例如:學(xué)生的學(xué)習(xí)成績與其身高、其身高、天氣與股票價格的關(guān)系等天氣與股票價格的關(guān)系等一般認(rèn)

11、為是一般認(rèn)為是不相關(guān)的。不相關(guān)的。(3)不完全相關(guān):若兩個現(xiàn)象之間的關(guān)系介于)不完全相關(guān):若兩個現(xiàn)象之間的關(guān)系介于完全相關(guān)和不相關(guān)之間,就稱為不完全相關(guān),完全相關(guān)和不相關(guān)之間,就稱為不完全相關(guān),如如居民的收入與支出水平。居民的收入與支出水平。一般的相關(guān)現(xiàn)象都一般的相關(guān)現(xiàn)象都是指這種不完全相關(guān),這是相關(guān)分析的研究對是指這種不完全相關(guān),這是相關(guān)分析的研究對象。象。3/19/2022第七章 相關(guān)與回歸分析113/19/2022第七章 相關(guān)與回歸分析12 可以分為線性相關(guān)和非線性相關(guān)可以分為線性相關(guān)和非線性相關(guān) (1)線性相關(guān):當(dāng)一個變量發(fā)生變動,另一個)線性相關(guān):當(dāng)一個變量發(fā)生變動,另一個變量隨之發(fā)

12、生大致均等的變動變量隨之發(fā)生大致均等的變動(增加或減少增加或減少),從,從圖形上看,其觀測點的分布近似地表現(xiàn)為直線形圖形上看,其觀測點的分布近似地表現(xiàn)為直線形式,就是線性相關(guān)。式,就是線性相關(guān)。 (2)非線性相關(guān):而當(dāng)一個變量發(fā)生變動,另)非線性相關(guān):而當(dāng)一個變量發(fā)生變動,另一個變量也隨之發(fā)生變動一個變量也隨之發(fā)生變動(增加或減少增加或減少),但是這,但是這種變動不是均等的,從圖形上看,其觀察點的分種變動不是均等的,從圖形上看,其觀察點的分布表現(xiàn)為各種不同的曲線形式,這種相關(guān)關(guān)系稱布表現(xiàn)為各種不同的曲線形式,這種相關(guān)關(guān)系稱為非線性相關(guān)。為非線性相關(guān)。3/19/2022第七章 相關(guān)與回歸分析13

13、3/19/2022第七章 相關(guān)與回歸分析143/19/2022第七章 相關(guān)與回歸分析153/19/2022第七章 相關(guān)與回歸分析16 二者是研究現(xiàn)象間相關(guān)關(guān)系的基本方法。二者是研究現(xiàn)象間相關(guān)關(guān)系的基本方法。 (1)相關(guān)分析(狹義):指用一個指)相關(guān)分析(狹義):指用一個指標(biāo)表明現(xiàn)象間相互依存關(guān)系的密切程度。標(biāo)表明現(xiàn)象間相互依存關(guān)系的密切程度。不過相關(guān)分析并不能說明變量間相關(guān)關(guān)不過相關(guān)分析并不能說明變量間相關(guān)關(guān)系的具體形式,也不能從一個變量的變系的具體形式,也不能從一個變量的變化去推測另一個變量的具體變化。化去推測另一個變量的具體變化。3/19/2022第七章 相關(guān)與回歸分析17回歸的回歸的古典

14、意義古典意義: 高爾頓遺傳學(xué)的回歸概念高爾頓遺傳學(xué)的回歸概念 父母身高與子女身高的關(guān)系父母身高與子女身高的關(guān)系: : 無論高個子或低個子的子女無論高個子或低個子的子女 都有向人的平均身高回歸的都有向人的平均身高回歸的 趨勢趨勢 3/19/2022第七章 相關(guān)與回歸分析18一個因變量對若干解釋變量依存關(guān)系的研究一個因變量對若干解釋變量依存關(guān)系的研究回歸的目的回歸的目的(實質(zhì))(實質(zhì)): 由固定的自變量去估計因變量的平均值由固定的自變量去估計因變量的平均值估計因變估計因變量平均值量平均值3/19/2022第七章 相關(guān)與回歸分析19 (2)回歸分析:根據(jù)相關(guān)關(guān)系的具體)回歸分析:根據(jù)相關(guān)關(guān)系的具體形

15、態(tài),選擇一個合適的數(shù)學(xué)模型來近似形態(tài),選擇一個合適的數(shù)學(xué)模型來近似表達(dá)變量間的平均變化關(guān)系,其目的是表達(dá)變量間的平均變化關(guān)系,其目的是要根據(jù)已知的或固定的自變量的數(shù)值去要根據(jù)已知的或固定的自變量的數(shù)值去估計因變量的總體平均值。估計因變量的總體平均值。3/19/2022第七章 相關(guān)與回歸分析20 二者有著密切的聯(lián)系,它們具有共同的研二者有著密切的聯(lián)系,它們具有共同的研究對象,在具體運(yùn)用時需要互相補(bǔ)充。具究對象,在具體運(yùn)用時需要互相補(bǔ)充。具體:(體:(1)相關(guān)分析需要依靠回歸分析表明)相關(guān)分析需要依靠回歸分析表明現(xiàn)象數(shù)量相關(guān)的具體形式;(現(xiàn)象數(shù)量相關(guān)的具體形式;(2)回歸分析)回歸分析需要依靠相關(guān)

16、分析來表明現(xiàn)象數(shù)量變化的需要依靠相關(guān)分析來表明現(xiàn)象數(shù)量變化的相關(guān)程度,只有變量之間存在著高度相關(guān)相關(guān)程度,只有變量之間存在著高度相關(guān)時,進(jìn)行回歸分析尋求其相關(guān)的具體形式時,進(jìn)行回歸分析尋求其相關(guān)的具體形式才有意義。因此,回歸分析和相關(guān)分析也才有意義。因此,回歸分析和相關(guān)分析也合并稱為相關(guān)關(guān)系分析或廣義的相關(guān)分析。合并稱為相關(guān)關(guān)系分析或廣義的相關(guān)分析。 3/19/2022第七章 相關(guān)與回歸分析213/19/2022第七章 相關(guān)與回歸分析223/19/2022第七章 相關(guān)與回歸分析23 相關(guān)和回歸分析是對現(xiàn)象間相關(guān)關(guān)系進(jìn)行分析的相關(guān)和回歸分析是對現(xiàn)象間相關(guān)關(guān)系進(jìn)行分析的有效的科學(xué)方法,但是它們有一

17、定的局限性。在有效的科學(xué)方法,但是它們有一定的局限性。在確定應(yīng)用相關(guān)和回歸分析之前,必須進(jìn)行定性分確定應(yīng)用相關(guān)和回歸分析之前,必須進(jìn)行定性分析,運(yùn)用足夠的理論知識、專業(yè)知識和必要的經(jīng)析,運(yùn)用足夠的理論知識、專業(yè)知識和必要的經(jīng)驗來判斷現(xiàn)象之間是否具有真正的相關(guān),是具有驗來判斷現(xiàn)象之間是否具有真正的相關(guān),是具有實質(zhì)性的內(nèi)在聯(lián)系還是表面上的聯(lián)系,還是一種實質(zhì)性的內(nèi)在聯(lián)系還是表面上的聯(lián)系,還是一種偶然的巧合。偶然的巧合。 因此在應(yīng)用相關(guān)和回歸分析對客面現(xiàn)象進(jìn)行研究因此在應(yīng)用相關(guān)和回歸分析對客面現(xiàn)象進(jìn)行研究時,一定要注意把定性分析和定量分析結(jié)合起來,時,一定要注意把定性分析和定量分析結(jié)合起來,在定性分析

18、基礎(chǔ)上開展相關(guān)和回歸的定量分析。在定性分析基礎(chǔ)上開展相關(guān)和回歸的定量分析。 3/19/2022第七章 相關(guān)與回歸分析243/19/2022第七章 相關(guān)與回歸分析25 (1)相關(guān)表是一種反映變量間相關(guān)關(guān)系的)相關(guān)表是一種反映變量間相關(guān)關(guān)系的統(tǒng)計表。統(tǒng)計表。 研究現(xiàn)象之間的依存關(guān)系,首先要通過實際研究現(xiàn)象之間的依存關(guān)系,首先要通過實際調(diào)查取得一系列成對的數(shù)據(jù),作為相關(guān)分析調(diào)查取得一系列成對的數(shù)據(jù),作為相關(guān)分析的原始資料。將某一變量按其數(shù)值的大小順的原始資料。將某一變量按其數(shù)值的大小順序排列,然后再將與其相關(guān)的另一變量的對序排列,然后再將與其相關(guān)的另一變量的對應(yīng)值平行排列,便可得到簡單的相關(guān)表。應(yīng)值

19、平行排列,便可得到簡單的相關(guān)表。 3/19/2022第七章 相關(guān)與回歸分析26 (2)例如假設(shè)對)例如假設(shè)對10戶居民家庭的月可支配收戶居民家庭的月可支配收入和消費(fèi)指出進(jìn)行調(diào)查,得到原始資料如表入和消費(fèi)指出進(jìn)行調(diào)查,得到原始資料如表 表表1 居民收入和消費(fèi)的原始資料居民收入和消費(fèi)的原始資料 單位:百元單位:百元 根據(jù)原始資料,將消費(fèi)支出從小到大排序,根據(jù)原始資料,將消費(fèi)支出從小到大排序,得到表得到表2居民家庭編號 1 2 3 4 5 6 7 8 9 10 消費(fèi)支出 20 15 40 30 42 60 65 70 53 78可支配收入 25 18 60 45 62 88 92 99 75 983

20、/19/2022第七章 相關(guān)與回歸分析27 (2)表)表2 居民消費(fèi)和收入的相關(guān)表居民消費(fèi)和收入的相關(guān)表 單位:單位:百元百元 從表中看出,隨著可支配收入的提高,居民從表中看出,隨著可支配收入的提高,居民的消費(fèi)支出也有相應(yīng)提高的趨勢,二者存在的消費(fèi)支出也有相應(yīng)提高的趨勢,二者存在明顯的正相關(guān)關(guān)系。明顯的正相關(guān)關(guān)系。消費(fèi)支出 15 20 30 40 42 53 60 65 70 78可支配收入 18 25 45 60 62 75 88 92 99 983/19/2022第七章 相關(guān)與回歸分析283/19/2022第七章 相關(guān)與回歸分析29圖8 -1 居 民消費(fèi)和收入的相關(guān)圖01020304050

21、60708090020406080100120可支配收入消費(fèi)支出z從圖看出,居民的消費(fèi)支出與可支配收入之從圖看出,居民的消費(fèi)支出與可支配收入之間呈現(xiàn)正線性相關(guān)關(guān)系間呈現(xiàn)正線性相關(guān)關(guān)系3/19/2022第七章 相關(guān)與回歸分析30 把握以下問題把握以下問題: 一、相關(guān)系數(shù)概念;一、相關(guān)系數(shù)概念; 二、相關(guān)系數(shù)的特點;二、相關(guān)系數(shù)的特點; 三、例子。三、例子。3/19/2022第七章 相關(guān)與回歸分析31 把握以下問題:把握以下問題: 1、相關(guān)系數(shù)的定義;、相關(guān)系數(shù)的定義; 2、總體相關(guān)系數(shù)的定義式;、總體相關(guān)系數(shù)的定義式; 3、樣本相關(guān)系數(shù)的定義公式。、樣本相關(guān)系數(shù)的定義公式。3/19/2022第七

22、章 相關(guān)與回歸分析32 單相關(guān)分析是對兩個變量間的相關(guān)程單相關(guān)分析是對兩個變量間的相關(guān)程度進(jìn)行分析。單相關(guān)分析所用的指標(biāo)度進(jìn)行分析。單相關(guān)分析所用的指標(biāo)稱為單相關(guān)系數(shù)簡稱相關(guān)系數(shù)。稱為單相關(guān)系數(shù)簡稱相關(guān)系數(shù)。 通常用通常用 表示總體的相關(guān)系數(shù),以表示總體的相關(guān)系數(shù),以r表表示樣本的相關(guān)系數(shù)。示樣本的相關(guān)系數(shù)。3/19/2022第七章 相關(guān)與回歸分析33 對于所研究的總體,表示兩個相互聯(lián)系變對于所研究的總體,表示兩個相互聯(lián)系變量相關(guān)程度的總體相關(guān)系數(shù)為:量相關(guān)程度的總體相關(guān)系數(shù)為: 式中,式中,CovCov(X X,Y Y)是變量是變量X X和和Y Y的協(xié)方差;的協(xié)方差;VarVar(X X)、

23、)、VarVar(Y Y)分別為變量分別為變量X X和和Y Y的方的方差。差。(, )()( )Cov X YVar X Var Y3/19/2022第七章 相關(guān)與回歸分析34 總體相關(guān)系數(shù)反映總體兩個變量總體相關(guān)系數(shù)反映總體兩個變量X X和和Y Y的的線性相關(guān)程度。線性相關(guān)程度。 特點:特點:對于特定的總體來說,對于特定的總體來說,X X和和Y Y的數(shù)的數(shù)值是既定的,總體相關(guān)系數(shù)是客觀存在值是既定的,總體相關(guān)系數(shù)是客觀存在的特定數(shù)值。的特定數(shù)值。 3/19/2022第七章 相關(guān)與回歸分析35 通過通過X X和和Y Y 的樣本觀測值去估計樣本相關(guān)系數(shù),的樣本觀測值去估計樣本相關(guān)系數(shù),變量變量X

24、 X和和Y Y的樣本相關(guān)系數(shù)通常用的樣本相關(guān)系數(shù)通常用 表示表示 特點:特點:樣本相關(guān)系數(shù)是根據(jù)從總體中抽取的隨機(jī)樣樣本相關(guān)系數(shù)是根據(jù)從總體中抽取的隨機(jī)樣本的觀測值計算出來的,是對總體相關(guān)系數(shù)的估本的觀測值計算出來的,是對總體相關(guān)系數(shù)的估 計,它是個隨機(jī)變量。計,它是個隨機(jī)變量。XYrXYrXYr_22()()()()iiXYiiXXYYrXXYY3/19/2022第七章 相關(guān)與回歸分析36 可以證明:可以證明:yyxxxyiiiixyLLLYYXXYYXXr2_2_)()()(222_)(1)(iiiXnXXX3/19/2022第七章 相關(guān)與回歸分析37 證明: 設(shè):222222_22_22

25、_22_)(1)()()(2)(2)(iiiiiiiiiXnXnXnXXnXXnXnXXXnXXXXXiiiiiixyiiiyyiiixxYXnYXYYXXLYnYYYLXnXXXL1)()(1)()(1)(_222_222_3/19/2022第七章 相關(guān)與回歸分析38 得到:得到: 簡便公式:簡便公式:yyxxxyiiiiLLLYYXXYYXXr2_2_)()()( 2222iiiiiiiiyynxxnyxyxnr3/19/2022第七章 相關(guān)與回歸分析39 樣本相關(guān)系數(shù)是根據(jù)樣本觀測值計算的,樣本相關(guān)系數(shù)是根據(jù)樣本觀測值計算的,抽取的樣本不同,其具體數(shù)值有差異,它抽取的樣本不同,其具體數(shù)值

26、有差異,它是總體相關(guān)系數(shù)的一致估計量。是總體相關(guān)系數(shù)的一致估計量。3/19/2022第七章 相關(guān)與回歸分析40(1)(1)相關(guān)系數(shù)的取值在相關(guān)系數(shù)的取值在-1 -1與與1 1之間。之間。(2)(2)當(dāng)當(dāng)r r=0=0時,表明時,表明X X與與Y Y沒有線性相關(guān)關(guān)系。沒有線性相關(guān)關(guān)系。為負(fù)相關(guān)。和,表明若為正相關(guān),和表明若系。存在一定的線性相關(guān)關(guān)和時,表明)當(dāng)(YXrYXrYXr0, 0103為完全負(fù)相關(guān)。和,表明若為完全正相關(guān),和表明若完全線性相關(guān)。和時,表明)當(dāng)(YXrYXrYXr1, 1143/19/2022第七章 相關(guān)與回歸分析41判斷兩變量判斷兩變量X X與與Y Y線性相關(guān)密切程度的具

27、體線性相關(guān)密切程度的具體標(biāo)準(zhǔn)為:標(biāo)準(zhǔn)為: 微弱相關(guān)。和時,表明當(dāng)YXr3 . 00低度相關(guān)。和時,表明當(dāng)YXr5 . 03 . 0顯著相關(guān)。和時,表明當(dāng)YXr8 . 05 . 0高度相關(guān)。和時,表明當(dāng)YXr18 . 03/19/2022第七章 相關(guān)與回歸分析42 X X和和Y Y 都是相互對稱的隨機(jī)變量,所以都是相互對稱的隨機(jī)變量,所以 相關(guān)系數(shù)只反映變量間的線性相關(guān)程度,相關(guān)系數(shù)只反映變量間的線性相關(guān)程度,不能說明非線性相關(guān)關(guān)系。不能說明非線性相關(guān)關(guān)系。 相關(guān)系數(shù)不能確定變量的因果關(guān)系,也相關(guān)系數(shù)不能確定變量的因果關(guān)系,也不能說明相關(guān)關(guān)系具體接近于哪條直線。不能說明相關(guān)關(guān)系具體接近于哪條直線

28、。XYYX3/19/2022第七章 相關(guān)與回歸分析43根據(jù)根據(jù)1515個居民家庭的人均月食品支個居民家庭的人均月食品支出與人均月收入水平的數(shù)值計算二出與人均月收入水平的數(shù)值計算二者的相關(guān)系數(shù)。者的相關(guān)系數(shù)。先列出簡單線性相關(guān)系數(shù)計算表先列出簡單線性相關(guān)系數(shù)計算表(如下表)(如下表) 單位:元單位:元3/19/2022第七章 相關(guān)與回歸分析44編號編號XYXYX2Y211022727541040472929626249692166763972524259409625410228285610404784591272457828172961583656882496412967541910262916

29、361883262158688967691233138131512996110106313286112369611112934438616641115612138385244190441444138127218765617291492282576846478415642012804096400合計合計151642344632163654123113/19/2022第七章 相關(guān)與回歸分析45利用例利用例8-1中給出的數(shù)據(jù)和上表計算的結(jié)果分中給出的數(shù)據(jù)和上表計算的結(jié)果分別從兩個角度計算食品支出與收入水平的樣別從兩個角度計算食品支出與收入水平的樣本相關(guān)系數(shù)。本相關(guān)系數(shù)。解解:(:(1)將有關(guān)數(shù)據(jù)代入

30、定義公式得:)將有關(guān)數(shù)據(jù)代入定義公式得:或或9414. 0)4231231115)(151616365415(4231516446321522r9414. 040.38293.1043680.1880yyxxxyLLLr3/19/2022第七章 相關(guān)與回歸分析46 把握以下問題:把握以下問題: 一、標(biāo)準(zhǔn)的一元線性回歸模型;一、標(biāo)準(zhǔn)的一元線性回歸模型; 二、一元線性回歸模型的估計;二、一元線性回歸模型的估計;3/19/2022第七章 相關(guān)與回歸分析47把握以下問題:把握以下問題:1 1、總體回歸函數(shù);、總體回歸函數(shù);2 2、樣本回歸函數(shù);、樣本回歸函數(shù);3 3、樣本回歸函數(shù)與總體回歸函數(shù)的、樣本

31、回歸函數(shù)與總體回歸函數(shù)的關(guān)系;關(guān)系;4 4、誤差項的標(biāo)準(zhǔn)假定。、誤差項的標(biāo)準(zhǔn)假定。3/19/2022第七章 相關(guān)與回歸分析48 若干基本概念若干基本概念 Y Y的條件分布的條件分布: Y: Y在在X X取某固定值條件下的分布。取某固定值條件下的分布。 對于對于X X的每一個取值,都有的每一個取值,都有Y Y的條件期望與之對的條件期望與之對應(yīng),在坐標(biāo)圖上應(yīng),在坐標(biāo)圖上 Y Y的條件期望的點隨的條件期望的點隨X X而變化的而變化的軌跡所形成的直線或曲線,稱為回歸線。軌跡所形成的直線或曲線,稱為回歸線。 如果把如果把Y Y的條件期望的條件期望 表示為表示為X X的某種函的某種函數(shù):數(shù): ,這個函數(shù)稱

32、為回歸函數(shù)。,這個函數(shù)稱為回歸函數(shù)。 如果其函數(shù)形式是只有一個自變量的線性函數(shù)如果其函數(shù)形式是只有一個自變量的線性函數(shù), ,如如 , ,稱為簡單線性回歸函數(shù)。稱為簡單線性回歸函數(shù)。 ()iE Y X()()iiE Y Xf X()iiE Y XX3/19/2022第七章 相關(guān)與回歸分析49()iiE Y XXiiiYXu3/19/2022第七章 相關(guān)與回歸分析50 假定因變量假定因變量Y主要受自變量主要受自變量X的影響,二者的影響,二者間存在近似的線性函數(shù)關(guān)系有間存在近似的線性函數(shù)關(guān)系有 該式被稱為總體回歸函數(shù),式中該式被稱為總體回歸函數(shù),式中 是未是未知的參數(shù),又叫回歸系數(shù)。知的參數(shù),又叫回

33、歸系數(shù)。Yi和和Xi分別是分別是Y和和X的第的第i次觀測值。次觀測值。ui 是隨機(jī)誤差項,又是隨機(jī)誤差項,又叫隨機(jī)干擾項,它是一個特殊的隨機(jī)變量,叫隨機(jī)干擾項,它是一個特殊的隨機(jī)變量,反映未列入方程式的其他各種因素的影響。反映未列入方程式的其他各種因素的影響。,iiiYXu3/19/2022第七章 相關(guān)與回歸分析51 (2)舉例說明:消費(fèi)函數(shù))舉例說明:消費(fèi)函數(shù) 式中式中Yt表示消費(fèi)支出,表示消費(fèi)支出, Xt表示可支配收入。表示可支配收入。 為基礎(chǔ)消費(fèi)水平的支出,不受可支配收入為基礎(chǔ)消費(fèi)水平的支出,不受可支配收入的影響,的影響, 為邊際消費(fèi)傾向,表明可支配收為邊際消費(fèi)傾向,表明可支配收入每增加

34、一個單位,消費(fèi)支出增加的數(shù)量。入每增加一個單位,消費(fèi)支出增加的數(shù)量。此處,可支配收入是決定消費(fèi)支出的主要因此處,可支配收入是決定消費(fèi)支出的主要因素,圖中可表示為一條直線,但現(xiàn)實中確定素,圖中可表示為一條直線,但現(xiàn)實中確定型的消費(fèi)函數(shù)很難成立,原因是除收入外還型的消費(fèi)函數(shù)很難成立,原因是除收入外還有各種因素影響消費(fèi)支出。有各種因素影響消費(fèi)支出。ttXY3/19/2022第七章 相關(guān)與回歸分析52概念:概念: Y Y的樣本觀測值的條件均值隨自變量的樣本觀測值的條件均值隨自變量X X而變而變動的軌跡,稱為樣本回歸線。動的軌跡,稱為樣本回歸線。 如果把因變量如果把因變量Y Y的樣本條件均值表示為自變的

35、樣本條件均值表示為自變量量X X的某種函數(shù),這個函數(shù)稱為樣本回歸函數(shù)的某種函數(shù),這個函數(shù)稱為樣本回歸函數(shù)簡記為簡記為SRFSRF)。)。表現(xiàn)形式:線性樣本回歸函數(shù)可表示為表現(xiàn)形式:線性樣本回歸函數(shù)可表示為 或者或者iiiYXeiiYX3/19/2022第七章 相關(guān)與回歸分析53 樣本回歸函數(shù)的函數(shù)形式應(yīng)與設(shè)定的總體回樣本回歸函數(shù)的函數(shù)形式應(yīng)與設(shè)定的總體回歸函數(shù)的函數(shù)形式一致歸函數(shù)的函數(shù)形式一致 。 和和 是對總體回歸函數(shù)參數(shù)的估計。是對總體回歸函數(shù)參數(shù)的估計。 是對總體條件期望是對總體條件期望 的估計的估計 殘差殘差 e e 在概念上類似總體回歸函數(shù)中的隨機(jī)在概念上類似總體回歸函數(shù)中的隨機(jī)誤差

36、誤差u u?;貧w分析的目的:回歸分析的目的: 用樣本回歸函數(shù)去估計總體回歸函數(shù)。用樣本回歸函數(shù)去估計總體回歸函數(shù)。iY()iE Y X3/19/2022第七章 相關(guān)與回歸分析54總體回歸函數(shù)雖然未知,但它是確定的;總體回歸函數(shù)雖然未知,但它是確定的; 樣本回歸線隨抽樣波動而變化,可以有許多條。樣本回歸線隨抽樣波動而變化,可以有許多條。 樣本回歸線還不是總體回歸線,至多只是未知總樣本回歸線還不是總體回歸線,至多只是未知總體回歸線的近似表現(xiàn)。體回歸線的近似表現(xiàn)。 總體回歸函數(shù)的參數(shù)雖未知,但是確定的常數(shù);總體回歸函數(shù)的參數(shù)雖未知,但是確定的常數(shù); 樣本回歸函數(shù)的參數(shù)可估計,但是隨抽樣而變化樣本回歸

37、函數(shù)的參數(shù)可估計,但是隨抽樣而變化的隨機(jī)變量。的隨機(jī)變量。 總體回歸函數(shù)中的總體回歸函數(shù)中的 是不可直接觀測的;是不可直接觀測的; 而樣本回歸函數(shù)中的而樣本回歸函數(shù)中的 是只要估計出樣本回歸是只要估計出樣本回歸的參數(shù)就可以計算的數(shù)值。的參數(shù)就可以計算的數(shù)值。 iuie3/19/2022第七章 相關(guān)與回歸分析55 隨機(jī)誤差項隨機(jī)誤差項 是無法直接觀測的。為了進(jìn)行回是無法直接觀測的。為了進(jìn)行回歸分析,對其概率分布提出假定:歸分析,對其概率分布提出假定: 假定假定1 1:零均值假定,即誤差項的期望值為零均值假定,即誤差項的期望值為0 0 。 假定假定2 2:同方差假定,即誤差項的方差為常數(shù)。同方差假

38、定,即誤差項的方差為常數(shù)。 假定假定3 3:無自相關(guān)假定,即誤差項之間不存在序無自相關(guān)假定,即誤差項之間不存在序列相關(guān)關(guān)系,其協(xié)方差為列相關(guān)關(guān)系,其協(xié)方差為0 0。 ()0iiE u X222()()()iiiiiiVar u XE uE u XE u (,)()()(,)0ijiijjijCov u uE uE uuE uE u uiu3/19/2022第七章 相關(guān)與回歸分析56 假定假定4 4:隨機(jī)擾動隨機(jī)擾動 與自變量與自變量 不相關(guān),即不相關(guān),即自變量是給定的變量,與隨機(jī)誤差項線性無關(guān)。自變量是給定的變量,與隨機(jī)誤差項線性無關(guān)。 假定假定5 5:正態(tài)性假定,隨機(jī)誤差項服從正態(tài)分布正態(tài)性

39、假定,隨機(jī)誤差項服從正態(tài)分布 以上假定是德國數(shù)學(xué)家高斯最早提出,又稱高斯以上假定是德國數(shù)學(xué)家高斯最早提出,又稱高斯假定。假定。 滿足以上標(biāo)準(zhǔn)假定的一元線性回歸模型,稱為標(biāo)滿足以上標(biāo)準(zhǔn)假定的一元線性回歸模型,稱為標(biāo)準(zhǔn)的一元線性回歸模型。準(zhǔn)的一元線性回歸模型。iuiX2(0,)iuN( ,)( )()0iiiiiiCov u XE uE uXE X3/19/2022第七章 相關(guān)與回歸分析57 把握以下問題:把握以下問題: 1 1、回歸系數(shù)的估計;、回歸系數(shù)的估計; 2 2、擬合優(yōu)度的度量、擬合優(yōu)度的度量 3 3、可決系數(shù)與相關(guān)系數(shù)的關(guān)系、可決系數(shù)與相關(guān)系數(shù)的關(guān)系3/19/2022第七章 相關(guān)與回歸

40、分析58 (1)根據(jù)樣本資料確定樣本回歸方程時,)根據(jù)樣本資料確定樣本回歸方程時,一般希望一般希望Y的估計值盡可能接近其真實值,的估計值盡可能接近其真實值,即即e ei i的總量越小越好,但有正負(fù),代數(shù)和的總量越小越好,但有正負(fù),代數(shù)和為為0( e ei i =0),通常用),通常用 e ei i2 2作為衡量總偏作為衡量總偏差的尺度。所謂最小二乘法根據(jù)這一思路,差的尺度。所謂最小二乘法根據(jù)這一思路,使殘差平方和最小來估計回歸系數(shù)。使殘差平方和最小來估計回歸系數(shù)。 (2)設(shè))設(shè) 為使為使Q最小,對最小,對 求偏導(dǎo)數(shù),令其為求偏導(dǎo)數(shù),令其為0,得:得:222)()(iiiiiXYYYeQ3/19

41、/2022第七章 相關(guān)與回歸分析59(2)整理后有:整理后有:稱為標(biāo)準(zhǔn)方程組,稱為標(biāo)準(zhǔn)方程組,n為樣本容量,解方程組得:為樣本容量,解方程組得:00)(200)(2iiiiiiiieXXYXQeXYQ即即2iiiiiiXXYXXnY_2222/)(11)(XYnXnYXnXYXnYXXXnYXYXniiiiiiiiiiiiii3/19/2022第七章 相關(guān)與回歸分析60 (3)可以證明:)可以證明: 證明:證明: 設(shè)設(shè) 得到:得到:222_)(1)(iiiXnXXX222222_22_22_22_)(1)()()(2)(2)(iiiiiiiiiXnXnXnXXnXXnXnXXXnXXXXXii

42、iiiixyiiiyyiiixxYXnYXYYXXLYnYYYLXnXXXL1)()(1)()(1)(_222_222_xxxyLL3/19/2022第七章 相關(guān)與回歸分析61 根據(jù)根據(jù)15個居民家庭的人均月食品支出與人均個居民家庭的人均月食品支出與人均月收入水平的數(shù)據(jù),估計食品支出的恩格爾月收入水平的數(shù)據(jù),估計食品支出的恩格爾函數(shù)。函數(shù)。 解:最簡單的恩格爾函數(shù)假定在商品價格不解:最簡單的恩格爾函數(shù)假定在商品價格不變的條件下,實際的食品支出變的條件下,實際的食品支出Y與實際的收入與實際的收入水平水平X間的關(guān)系可以用一元線性回歸模型反映。間的關(guān)系可以用一元線性回歸模型反映。根據(jù)根據(jù)Y和和X的數(shù)

43、據(jù)計算有關(guān)統(tǒng)計量,列在表中,的數(shù)據(jù)計算有關(guān)統(tǒng)計量,列在表中,3/19/2022第七章 相關(guān)與回歸分析62編號編號XYXYX2Y211022727541040472929626249692166763972524259409625410228285610404784591272457828172961583656882496412967541910262916361883262158688967691233138131512996110106313286112369611112934438616641115612138385244190441444138127218765617291492282

44、576846478415642012804096400合計合計151642344632163654123113/19/2022第七章 相關(guān)與回歸分析63 解:解:將有關(guān)合計數(shù)代入公式得:將有關(guān)合計數(shù)代入公式得: 或或 得得 同理同理 樣本回歸方程為:樣本回歸方程為:iiXY1802.099.980.1880423151615144632140.38242315112311)(193.10436151615163654)(1222222iiiixyiiyyiixxYXnYXLYnYLXnXL1802.093.1043680.1880 xxxyLL9878.99878.91515161802.015423180

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論