第五講相關(guān)分析與回歸分析_第1頁(yè)
第五講相關(guān)分析與回歸分析_第2頁(yè)
第五講相關(guān)分析與回歸分析_第3頁(yè)
第五講相關(guān)分析與回歸分析_第4頁(yè)
第五講相關(guān)分析與回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩78頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

相關(guān)分析與回歸分析

-相關(guān)與回歸分析是研究具有非確定性依存關(guān)系的現(xiàn)象之間相互關(guān)系的統(tǒng)計(jì)方法

相關(guān)分析一、相關(guān)關(guān)系概念客觀現(xiàn)象之間是普遍聯(lián)系相互依存的??陀^現(xiàn)象之間的數(shù)量聯(lián)系可分為兩類:(一)確定性的函數(shù)關(guān)系(二)不確定性的統(tǒng)計(jì)關(guān)系—相關(guān)關(guān)系(三)變量間關(guān)系的圖形描述:坐標(biāo)圖(散點(diǎn)圖)(一)確定性的函數(shù)關(guān)系1.函數(shù)關(guān)系當(dāng)一個(gè)或幾個(gè)變量取一定的值時(shí),另一個(gè)變量有確定值與之相對(duì)應(yīng),我們稱這種關(guān)系為確定性的函數(shù)關(guān)系。2.函數(shù)關(guān)系特點(diǎn)(1)是一一對(duì)應(yīng)的確定關(guān)系;(2)設(shè)有兩個(gè)變量x和y,變量y隨變量x一起變化,并完全依賴于x,當(dāng)變量x取某個(gè)數(shù)值時(shí),

y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量(3)各觀測(cè)點(diǎn)(x,y)落在一條線上x(chóng)y3.函數(shù)關(guān)系舉例某種商品的銷售額(y)與銷售量(x)之間的關(guān)系可表示為y=px(p為單價(jià))圓的面積與半徑之間的關(guān)系可表示為S=r2

企業(yè)的原材料消耗額(y)與產(chǎn)量(x1)、單位產(chǎn)量消耗(x2)、原材料價(jià)格(x3)之間的關(guān)系可表示為y=x1x2x3

定義:當(dāng)一個(gè)或幾個(gè)相互聯(lián)系的變量取一定數(shù)值時(shí),與之相對(duì)應(yīng)的另一變量的值雖然不確定,但它仍按某種規(guī)律在一定的范圍內(nèi)變化。變量間的這種關(guān)系稱為具有不確定性的相關(guān)關(guān)系?,F(xiàn)象之間客觀存在的不嚴(yán)格、不確定的數(shù)量依存關(guān)系。

(二)相關(guān)關(guān)系2.相關(guān)關(guān)系特點(diǎn)(1)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá);(2)一個(gè)變量的取值不能由另一個(gè)變量唯一確定;當(dāng)變量x取某個(gè)值的時(shí)候,變量y的取值可能有幾個(gè);(3)各觀測(cè)點(diǎn)(x,y)分布在某條線的周圍。xy商品的消費(fèi)量(y)與居民收入(x)之間的關(guān)系商品的消費(fèi)量(y)與物價(jià)(x)之間的關(guān)系商品銷售額(y)與廣告費(fèi)支出(x)之間的關(guān)系糧食畝產(chǎn)量(y)與施肥量(x1)、降雨量(x2)、溫度(x3)之間的關(guān)系收入水平(y)與受教育程度(x)之間的關(guān)系青少年犯罪率(y)與冰淇淋消費(fèi)量(x)之間的關(guān)系公務(wù)員考試成績(jī)(y)與受教育程度(x)之間的關(guān)系3.相關(guān)關(guān)系舉例思考題(判斷自變量與因變量)警局負(fù)責(zé)人認(rèn)為增加警務(wù)支出將降低犯罪率。圖書(shū)管理員認(rèn)為圖書(shū)的流通速度與廣告有關(guān)。志愿者人數(shù)受天氣條件影響。?二、相關(guān)關(guān)系的種類相關(guān)關(guān)系按相關(guān)程度分類按相關(guān)方向分類按相關(guān)形式分類按所研究變量多少分類(1)完全相關(guān):當(dāng)一種現(xiàn)象的數(shù)量變化完全由另一種現(xiàn)象的數(shù)量變化所確定時(shí),稱這兩種現(xiàn)象間的關(guān)系為完全相關(guān)。(2)不相關(guān):當(dāng)兩種現(xiàn)象互不影響,其數(shù)量變化各自獨(dú)立時(shí),稱為不相關(guān)現(xiàn)象。(3)兩種現(xiàn)象之間的關(guān)系介于完全相關(guān)和不相關(guān)之間,稱為不完全相關(guān)。1.按相關(guān)的程度可劃分為:完全相關(guān),不完全相關(guān)和不相關(guān)(1)當(dāng)兩種相關(guān)現(xiàn)象之間的關(guān)系大致呈現(xiàn)為線性關(guān)系時(shí),稱之為線性相關(guān)。(2)當(dāng)兩種相關(guān)現(xiàn)象之間的關(guān)系不表現(xiàn)為直線關(guān)系,而是近似于某種曲線方程的關(guān)系,則這種相關(guān)關(guān)系稱為非線性相關(guān)。2.按相關(guān)的形式可劃分為:

線性相關(guān),非線性相關(guān)(1)正相關(guān):兩個(gè)相關(guān)現(xiàn)象間,當(dāng)一個(gè)變量的數(shù)值增加(或減少)時(shí),另一個(gè)變量的數(shù)值也隨之增加(或減少),即同方向變化。收入與消費(fèi)的關(guān)系。(2)負(fù)相關(guān):當(dāng)一個(gè)變量的數(shù)值增加(或減少)時(shí),而另一個(gè)變量的數(shù)值相反地呈減少(或增加)趨勢(shì)變化,即反方向變化。物價(jià)與消費(fèi)的關(guān)系。3.按相關(guān)的方向可劃分為:

正相關(guān),負(fù)相關(guān)(1)當(dāng)只研究?jī)蓚€(gè)變量時(shí),它們之間的相關(guān),稱為單相關(guān)。(2)當(dāng)所研究的是一個(gè)變量對(duì)兩個(gè)或兩個(gè)以上其他變量的相關(guān)關(guān)系時(shí),稱為復(fù)相關(guān)。某種商品的需求與其價(jià)格水平以及收入水平之間的相關(guān)關(guān)系便是一種復(fù)相關(guān)。4.按相關(guān)關(guān)系涉及的變量多少可劃分為:

單相關(guān),復(fù)相關(guān)和偏相關(guān)(3)在某一現(xiàn)象與多種現(xiàn)象相關(guān)的場(chǎng)合,假定其他變量不變,只考察其中兩個(gè)變量的相關(guān)關(guān)系稱為偏相關(guān)。在假定人們的收入水平不變的條件下,某種商品的需求與其價(jià)格水平的關(guān)系就是一種偏相關(guān)。4.按相關(guān)關(guān)系涉及的變量多少可劃分為:

單相關(guān),復(fù)相關(guān)和偏相關(guān)相關(guān)關(guān)系的種類小結(jié)從變量相關(guān)關(guān)系變化的方向看正相關(guān)——變量同方向變化A同增同減(A)負(fù)相關(guān)——變量反方向變化一增一減(B)

B從變量相關(guān)的程度看完全相關(guān)(B)不完全相關(guān)(A)不相關(guān)(C)C

從涉及的變量數(shù)量看簡(jiǎn)單相關(guān)多重相關(guān)(復(fù)相關(guān))從變量相關(guān)關(guān)系的表現(xiàn)形式看線性相關(guān)——散布圖接近一條直線(左圖)非線性相關(guān)——散布圖接近一條曲線(右圖)相關(guān)關(guān)系的圖示:不相關(guān)負(fù)線性相關(guān)正線性相關(guān)非線性相關(guān)完全負(fù)線性相關(guān)完全正線性相關(guān)三、相關(guān)分析相關(guān)分析是描述和測(cè)度變量間相關(guān)關(guān)系類型和相關(guān)程度的分析方法。在相關(guān)分析中,所有變量都假定是隨機(jī)變量,它們之間不存在解釋變量和被解釋變量的關(guān)系,即不考慮因果關(guān)系。就是用一個(gè)指標(biāo)來(lái)表明現(xiàn)象間相互依存關(guān)系的密切程度。(一)相關(guān)關(guān)系的判斷(二)相關(guān)系數(shù)的測(cè)定及其應(yīng)用定性分析是依據(jù)研究者的理論知識(shí)和實(shí)踐經(jīng)驗(yàn),對(duì)客觀現(xiàn)象之間是否存在相關(guān)關(guān)系,以及何種關(guān)系作出判斷。定量分析在定性分析的基礎(chǔ)上,通過(guò)編制相關(guān)表、繪制相關(guān)圖、計(jì)算相關(guān)系數(shù)等方法,來(lái)判斷現(xiàn)象之間相關(guān)的方向、形態(tài)及密切程度。(一)相關(guān)關(guān)系的判斷1.相關(guān)表相關(guān)表是一種反映變量之間相關(guān)關(guān)系的統(tǒng)計(jì)表。

將自變量x的數(shù)值按照從小到大的順序排列,然后再將與其相關(guān)的因變量y的對(duì)應(yīng)數(shù)值平行排列,便可形成簡(jiǎn)單的相關(guān)表。簡(jiǎn)單相關(guān)表例:居民消費(fèi)支出和收入的相關(guān)表(單位:百元)

根據(jù)以上資料繪制坐標(biāo)圖便得到相關(guān)圖家庭編號(hào)

12345678910消費(fèi)支出y可支配收入x1520304042536065707818254560627588929998單變量分組表產(chǎn)量(千件)x企業(yè)數(shù)平均單位成本(元/件)y20304050809556516.815.615.014.814.2合計(jì)30例:30家企業(yè)按產(chǎn)品產(chǎn)量分組的平均單位產(chǎn)品成本雙變量分組表

例:30家企業(yè)按產(chǎn)品產(chǎn)量和單位產(chǎn)品成本分組

單位成本(元/件)y產(chǎn)量(千件)x合計(jì)203040508018161514441--32--131-132--1449107合計(jì)9556530

2.相關(guān)圖相關(guān)圖也稱散點(diǎn)圖,是在平面直角坐標(biāo)系中,以橫軸表示變量x,縱軸表示變量y,將兩者對(duì)應(yīng)的數(shù)值形成的坐標(biāo)點(diǎn)(x,y)在圖中標(biāo)出,即可看出變量之間關(guān)系密切程度。如下圖(銷售收入與廣告費(fèi)相關(guān)圖)銷售收入與廣告費(fèi)相關(guān)圖相關(guān)關(guān)系的圖示(散點(diǎn)圖scatterdiagram)不相關(guān)負(fù)線性相關(guān)正線性相關(guān)非線性相關(guān)完全負(fù)線性相關(guān)完全正線性相關(guān)散點(diǎn)圖(例題分析)例:一家大型商業(yè)銀行在多個(gè)地區(qū)設(shè)有分行,其業(yè)務(wù)主要是進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國(guó)家重點(diǎn)項(xiàng)目建設(shè)、固定資產(chǎn)投資等項(xiàng)目的貸款。近年該銀行貸款額平穩(wěn)增長(zhǎng),但不良貸款額也有較大提高,給銀行業(yè)務(wù)發(fā)展帶來(lái)較大壓力。為弄清不良貸款形成的原因,以便找出控制不良貸款的辦法,現(xiàn)利用銀行有關(guān)業(yè)務(wù)數(shù)據(jù)進(jìn)行相關(guān)分析。下面是該銀行所屬25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù)。散點(diǎn)圖的重要性下圖是新英格蘭地區(qū)六個(gè)州的謀殺率和自殺率(每10萬(wàn)人口)的數(shù)據(jù):州謀殺率自殺率緬因3.214.3新罕布什爾2.911.3佛蒙特4.317.8馬薩諸塞3.68.9羅德島4.212.3康涅狄格5.48.6散點(diǎn)圖的重要性(續(xù))相關(guān)系數(shù)為-0.17,代表弱相關(guān)關(guān)系,似乎支持一些社會(huì)學(xué)家的觀點(diǎn):這兩種形式的暴力是彼此消減的,當(dāng)一個(gè)升高時(shí),另一個(gè)就降低。從散點(diǎn)圖中看出康涅狄格州在新英格蘭諸州中有最高的謀殺率和最低的自殺率,導(dǎo)致實(shí)際的相關(guān)關(guān)系降低,只考慮其他5個(gè)州的數(shù)據(jù),相關(guān)系數(shù)為0.44.(二)相關(guān)系數(shù)的測(cè)定及其應(yīng)用1.相關(guān)系數(shù)是對(duì)變量之間關(guān)系密切程度的度量2.對(duì)兩個(gè)變量之間線性相關(guān)程度的度量稱為簡(jiǎn)單相關(guān)系數(shù)(簡(jiǎn)稱相關(guān)系數(shù))3.若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù),記為4.若相關(guān)系數(shù)是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),記為r在此僅討論兩變量間相關(guān)關(guān)系問(wèn)題。對(duì)于隨機(jī)變量x和y,總體相關(guān)系數(shù)一般是未知的,只能根據(jù)樣本觀測(cè)值給出一個(gè)估計(jì)量即樣本相關(guān)系數(shù)r。樣本相關(guān)系數(shù)r的計(jì)算公式:

或化簡(jiǎn)為

表1我國(guó)人均國(guó)民收入與人均消費(fèi)金額數(shù)據(jù)

單位:元年份人均國(guó)民收入人均消費(fèi)金額年份人均國(guó)民收入人均消費(fèi)金額1981198219831984198519861987393.8419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.56436907138039471148例:在研究我國(guó)人均消費(fèi)水平的問(wèn)題中,把全國(guó)人均消費(fèi)額記為y,把人均國(guó)民收入記為x。收集到1981~1993年的樣本數(shù)據(jù)(xi

,yi),i=1,2,…,13,計(jì)算相關(guān)系數(shù)。年份序號(hào)人均國(guó)民收入x人均消費(fèi)金額yx2y2xy123∶∶∶∶13393.8419.14460.86∶∶∶∶2099.5249267289∶∶∶∶1148155078.44175678.34212391.94∶∶∶∶4407900.25620017128983521∶∶∶∶131790498056.20111910.38133188.54∶∶∶∶2410226合計(jì)12827.5745716073323.7752263399156173.99解:根據(jù)樣本相關(guān)系數(shù)的計(jì)算公式有人均國(guó)民收入與人均消費(fèi)金額之間的相關(guān)系數(shù)為0.9987,顯示人均國(guó)民收入與人均消費(fèi)金額之間高度正相關(guān)。2.相關(guān)系數(shù)取值及其意義r

的取值范圍是[-1,1]|r|=1,表明x與y完全線性相關(guān)r=1,為完全正線性相關(guān)r=-1,為完全負(fù)線性相關(guān)

r=0,表明x與y不存在線性相關(guān)關(guān)系-1r<0,為負(fù)線性相關(guān)0<r1,為正線性相關(guān)|r|越趨于1表示x與y線性關(guān)系越密切|r|越趨于0表示x與y線性關(guān)系越不密切相關(guān)系數(shù)(取值及其意義)-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無(wú)線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加3.相關(guān)程度評(píng)價(jià)標(biāo)準(zhǔn)

樣本容量適中時(shí)相關(guān)關(guān)系程度一般判斷標(biāo)準(zhǔn):無(wú)相關(guān)或微弱相關(guān)低度相關(guān)中度相關(guān)(顯著相關(guān))高度相關(guān)這種判斷必須建立在對(duì)相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn)的基礎(chǔ)上。習(xí)題:某企業(yè)10名工人的工齡和年工資資料如下:職工編號(hào)12345678910工齡X(年)44567889910工資Y(百元)42465060646874728084要求:計(jì)算相關(guān)系數(shù),已知條件如下:4.相關(guān)系數(shù)的顯著性檢驗(yàn)根據(jù)樣本計(jì)算的相關(guān)系數(shù)r能否代表總體相關(guān)系數(shù),只有對(duì)其檢驗(yàn)以后才能下結(jié)論。因其具有一定的隨機(jī)性,樣本容量越小其可信程度越差。相關(guān)系數(shù)的顯著性檢驗(yàn)問(wèn)題可分為兩類:一是對(duì)總體相關(guān)系數(shù)是否等于0進(jìn)行檢驗(yàn);二是對(duì)總體相關(guān)系數(shù)是否等于某一給定的不為0的數(shù)值進(jìn)行檢驗(yàn)。這里只介紹第一類檢驗(yàn)。相關(guān)系數(shù)的顯著性檢驗(yàn)(方法與步驟)數(shù)學(xué)上可以證明,在X與Y都服從正態(tài)分布且的條件下,可以采用t檢驗(yàn)來(lái)確定r

的顯著性。檢驗(yàn)統(tǒng)計(jì)量t服從自由度為n-2的t分布,即:檢驗(yàn)的步驟為:提出假設(shè):假設(shè)樣本是從一個(gè)不相關(guān)的總體中抽出的,即H0:;H1:0計(jì)算檢驗(yàn)統(tǒng)計(jì)量:根據(jù)給定的顯著性水平和自由度df=n-2查t分布表得t(n-2)的臨界值,并作出決策:若t>t(n-2),拒絕H0,表明r在統(tǒng)計(jì)上是顯著的,兩變量之間存在顯著線性關(guān)系;若t<t(n-2),接受H0,表明r在統(tǒng)計(jì)上是不顯著的。

我國(guó)人均國(guó)民收入與人均消費(fèi)金額數(shù)據(jù)單位:元年份人均國(guó)民收入人均消費(fèi)金額年份人均國(guó)民收入人均消費(fèi)金額1981198219831984198519861987393.8419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.56436907138039471148相關(guān)系數(shù)的顯著性檢驗(yàn)【例】在我國(guó)居民消費(fèi)水平研究中,將人均消費(fèi)額記為y,人均國(guó)民收入記為x。收集到1981~1993年的樣本數(shù)據(jù)(xi

,yi,i=1,2,…,13)見(jiàn)下表,計(jì)算相關(guān)系數(shù)。并對(duì)人均消費(fèi)額與人均國(guó)民收入相關(guān)系數(shù)進(jìn)行顯著性檢(0.05)解:根據(jù)樣本相關(guān)系數(shù)的計(jì)算公式有:人均國(guó)民收入與人均消費(fèi)金額之間的相關(guān)系數(shù)為0.9987。顯示人均國(guó)民收入與人均消費(fèi)金額之間高度正相關(guān)。相關(guān)系數(shù)的顯著性檢驗(yàn)提出假設(shè):H0:;H1:0計(jì)算檢驗(yàn)統(tǒng)計(jì)量根據(jù)顯著性水平=0.05,查t分布表得臨界值

t(n-2)=t0.025(13-2)=2.201

由于t=64.9809>t0.025(13-2)=2.201,所以拒絕H0,接受H1,即說(shuō)明人均消費(fèi)金額與人均國(guó)民收入之間的相關(guān)關(guān)系顯著。相關(guān)分析小結(jié)相關(guān)分析就是對(duì)總體中確實(shí)具有聯(lián)系的標(biāo)志進(jìn)行分析,其主體是對(duì)總體中具有因果關(guān)系標(biāo)志的分析。它是描述客觀事物相互間關(guān)系的密切程度并用適當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)表示出來(lái)的過(guò)程。在一段時(shí)期內(nèi)出生率隨經(jīng)濟(jì)水平上升而上升,這說(shuō)明兩指標(biāo)間是正相關(guān)關(guān)系;而在另一時(shí)期,隨著經(jīng)濟(jì)水平進(jìn)一步發(fā)展,出現(xiàn)出生率下降的現(xiàn)象,兩指標(biāo)間就是負(fù)相關(guān)關(guān)系。為了確定相關(guān)變量之間的關(guān)系,首先應(yīng)該收集一些數(shù)據(jù),這些數(shù)據(jù)應(yīng)該是成對(duì)的。例如,每人的身高和體重。然后在直角坐標(biāo)系上描述這些點(diǎn),這一組點(diǎn)集稱為“散點(diǎn)圖”。

相關(guān)分析小結(jié)(續(xù))根據(jù)散點(diǎn)圖,當(dāng)自變量取某一值時(shí),因變量對(duì)應(yīng)為一概率分布,如果對(duì)于所有的自變量取值的概率分布都相同,則說(shuō)明因變量和自變量是沒(méi)有相關(guān)關(guān)系的。反之,如果,自變量的取值不同,因變量的分布也不同,則說(shuō)明兩者是存在相關(guān)關(guān)系的。兩個(gè)變量之間的相關(guān)程度通過(guò)相關(guān)系數(shù)r來(lái)表示。相關(guān)系數(shù)r的值在-1和1之間,但可以是此范圍內(nèi)的任何值。正相關(guān)時(shí),r值在0和1之間,散點(diǎn)圖是斜向上的,這時(shí)一個(gè)變量增加,另一個(gè)變量也增加;負(fù)相關(guān)時(shí),r值在-1和0之間,散點(diǎn)圖是斜向下的,此時(shí)一個(gè)變量增加,另一個(gè)變量將減少。r的絕對(duì)值越接近1,兩變量的關(guān)聯(lián)程度越強(qiáng),r的絕對(duì)值越接近0,兩變量的關(guān)聯(lián)程度越弱。

回歸分析

一、回歸分析的概念1.什么是回歸回歸是由英國(guó)著名統(tǒng)計(jì)學(xué)家FrancisGalton在19世紀(jì)末期研究孩子及其父母的身高時(shí)提出來(lái)的。Galton發(fā)現(xiàn)身材高的父母,他們的孩子也高。但這些孩子平均起來(lái)并不像他們父母那樣高。比較矮的父母情形也類似:他們的孩子比較矮,但這些孩子的平均身高要比他們父母的平均身高高。Galton把這種孩子的身高向中間值靠近的趨勢(shì)稱之為一種回歸效應(yīng),而他發(fā)展的研究?jī)蓚€(gè)數(shù)值變量之間數(shù)量關(guān)系的方法稱為回歸分析。2.什么是回歸分析回歸分析是對(duì)具有相關(guān)關(guān)系的變量擬合數(shù)學(xué)方程,通過(guò)一個(gè)或一些變量的變化解釋另一變量變化的方法。二、回歸分析的內(nèi)容和步驟根據(jù)理論和對(duì)問(wèn)題的分析判斷,區(qū)分自變量(即解釋變量)和因變量(即被解釋變量);從一組樣本數(shù)據(jù)出發(fā),設(shè)法確定合適的數(shù)學(xué)方程式(即回歸模型regressionmodel)描述變量間的關(guān)系;對(duì)數(shù)學(xué)方程式(回歸模型)的可信程度進(jìn)行統(tǒng)計(jì)檢驗(yàn),并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著;利用數(shù)學(xué)方程式(回歸模型),根據(jù)一個(gè)或幾個(gè)自變量的取值來(lái)估計(jì)或預(yù)測(cè)因變量的取值,并給出這種估計(jì)或預(yù)測(cè)的精確程度。三、回歸模型的類型按涉及變量多少分為:一元回歸和多元回歸按變量相關(guān)的形式分:線性回歸和非線性回歸(僅討論一元回歸分析問(wèn)題)一個(gè)自變量?jī)蓚€(gè)及以上自變量回歸模型多元回歸一元回歸線性回歸非線性回歸線性回歸非線性回歸四、一元線性回歸方程

1.一元線性回歸方程的設(shè)定對(duì)于只涉及一個(gè)自變量的回歸分析,若因變量y與自變量x之間為線性關(guān)系,可以用一個(gè)線性方程來(lái)表示二者之間的關(guān)系,此方程為一元線性回歸模型。通常先要收集若干(n)組樣本數(shù)據(jù)(xi,yi,i=1,2,…,n),然后將數(shù)據(jù)繪制散點(diǎn)圖,若圖中顯示x和y之間大致呈線性關(guān)系,就可以用一元線性回歸方程來(lái)描述這種關(guān)系。2.簡(jiǎn)單線性回歸分析:因?yàn)榫哂酗@著相關(guān)關(guān)系y不僅受x影響,還受其它因素影響,因此,x、y形成的點(diǎn)不在一直線上,而是分在直線上下變動(dòng),呈現(xiàn)線性相關(guān)的趨勢(shì),簡(jiǎn)單線性回歸方程分析任務(wù)就是設(shè)法在這些分散的具有線性關(guān)系的相關(guān)點(diǎn)之間配合一條最優(yōu)的直線,以表明兩面變量之間具體的變動(dòng)關(guān)系

3.一元線性回歸分析的特點(diǎn)必須確定自變量(x)和因變量(y)。

y依x和x依y的兩個(gè)回歸方程相互獨(dú)立的,不能互換。給出自變量的數(shù)值來(lái)估計(jì)因變量的數(shù)值。計(jì)算相關(guān)系數(shù)時(shí),要求相關(guān)的兩個(gè)變量都是隨機(jī)的變量;但是,確定回歸方程時(shí),盡管兩個(gè)變量也都是隨機(jī)變量,但要求自變量是給定的,因變量是隨機(jī)的。

4.回歸方程一元線性回歸方程是用于分析兩個(gè)變量(一個(gè)自變量與一個(gè)因變量)線性關(guān)系的數(shù)學(xué)表達(dá)式,一元線性回歸方程的一般形式為:

式中,x是自變量的實(shí)際觀測(cè)值。是因變量的估計(jì)值(又稱理論值),是當(dāng)自變量給定一個(gè)值時(shí),對(duì)應(yīng)的因變量的許多可能值的平均值。a和b為回歸方程參數(shù),其中b也叫回歸系數(shù)。其幾何意義是:a是直線方程的截距,b是斜率。其經(jīng)濟(jì)意義是:a是當(dāng)x為零時(shí)y的起點(diǎn)值,b是當(dāng)x每增加一個(gè)單位時(shí),y平均增加(或減少)的數(shù)量,它的符號(hào)同相關(guān)系數(shù)r的符號(hào)是一致的。返回

4.回歸方程一元線性回歸方程式的確定,實(shí)際上是根據(jù)抽樣取得的若干對(duì)x和y的觀測(cè)值,對(duì)方程中兩個(gè)未知參數(shù)a和b的確定。根據(jù)最小平方法可的求解a、b兩個(gè)參數(shù)的標(biāo)準(zhǔn)方程式為:正規(guī)方程解正規(guī)方程得:

例:某地區(qū)歷年人均收入與商品銷售額資料如下要求建立人均收入與商品銷售額的直線回歸方程.年份人均收入(百元)x商品銷售額(百萬(wàn)元)y

xy

x2

y219981999200020012002

2430323438

1115141620

264450448544760

576900102411561444121225196256400合計(jì)158

76246651001198解:將前面計(jì)算表中的有關(guān)數(shù)據(jù)代入求參數(shù)a、b的標(biāo)準(zhǔn)方程,得:人均收入與商品銷售額的直線回歸方程為:五、回歸分析與相關(guān)分析的區(qū)別相關(guān)分析中,變量x

與y處于平等地位;回歸分析中具有相關(guān)關(guān)系的變量之間地位是非對(duì)等的,變量y稱為因變量,處在被解釋的地位,x稱為自變量,用于預(yù)測(cè)因變量的變化相關(guān)分析中所涉及的變量x和y都是隨機(jī)變量;回歸分析中,因變量y是隨機(jī)變量,自變量x

可以是隨機(jī)變量,也可以是非隨機(jī)的確定變量相關(guān)分析主要描述變量之間相關(guān)關(guān)系的密切程度;回歸分析不僅可以揭示變量x對(duì)變量y的影響大小,還可以由回歸方程進(jìn)行估計(jì)和預(yù)測(cè)六、回歸估計(jì)標(biāo)準(zhǔn)誤差建立了回歸方程以后,通常要用方程估計(jì)值Yc來(lái)推斷或預(yù)測(cè)實(shí)際值Y。為了分析用Yc去估計(jì)Y是否準(zhǔn)確可靠,常采用反映回歸直線代表性好壞的統(tǒng)計(jì)分析指標(biāo),檢驗(yàn)方程回歸系數(shù)的擬合優(yōu)劣程度。為此需要進(jìn)行變差分析。六、回歸估計(jì)標(biāo)準(zhǔn)誤差六、回歸估計(jì)標(biāo)準(zhǔn)誤差1.直線回歸的變差因變量y的取值是不同的,y取值的這種波動(dòng)稱為變差。變差來(lái)源于兩個(gè)方面:由于自變量x的取值不同造成的;除x以外的其他因素(如x對(duì)y的非線性影響、測(cè)量誤差等)的影響。對(duì)一個(gè)具體的觀測(cè)值來(lái)說(shuō),變差的大小可以通過(guò)該實(shí)際觀測(cè)值與其均值之差(離差)來(lái)表示。n個(gè)觀察值的總變差()的計(jì)算公式為:(總離差平方和)回歸平方和(回歸變差)殘差平方和(剩余變差或隨機(jī)變差)

檢驗(yàn)統(tǒng)計(jì)量三個(gè)平方和的意義1.總平方和反映因變量的n個(gè)觀察值與其均值的總離差2.回歸平方和反映自變量x的變化對(duì)因變量y取值變化的影

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論