第7章相關(guān)與回歸分析_第1頁(yè)
第7章相關(guān)與回歸分析_第2頁(yè)
第7章相關(guān)與回歸分析_第3頁(yè)
第7章相關(guān)與回歸分析_第4頁(yè)
第7章相關(guān)與回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩55頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第7章相關(guān)與回歸分析弗朗西斯﹒高爾頓先生被譽(yù)為現(xiàn)代相關(guān)和回歸的創(chuàng)始人1875年,他利用豌豆試驗(yàn)來(lái)確定尺寸的遺傳規(guī)律。他挑選7組不同尺寸的豌豆,說(shuō)服他的朋友每一組種植10粒種子,最后把原始的豌豆種子與新長(zhǎng)的豌豆種子進(jìn)行尺寸比較當(dāng)結(jié)果被繪制出來(lái)之后,他發(fā)現(xiàn)并非每一個(gè)子代都與父代一樣,相同的是,尺寸小的豌豆會(huì)得到更大的子代,而尺寸大的豌豆卻得到較小的子代高爾頓將此方法用到人類(lèi)身上,他將父母和孩子的身高轉(zhuǎn)換成z值,對(duì)比父母的身高與他們孩子的身高。他并發(fā)現(xiàn)孩子們的z值偏離均值的程度小于父母的偏離程度,即非常矮小的父母傾向于有偏高的孩子;而非常高大的父母則傾向于有偏矮的孩子。它把這叫做對(duì)均值的“回歸”,這一發(fā)現(xiàn)構(gòu)成了回歸分析的基礎(chǔ)7.1相關(guān)分析變量間的關(guān)系及分類(lèi)統(tǒng)計(jì)變量之間的關(guān)系,存在著兩種不同的類(lèi)型,一種是函數(shù)關(guān)系,另一種是相關(guān)關(guān)系函數(shù)關(guān)系是指變量之間存在著的一種固定的、嚴(yán)格的數(shù)量依存關(guān)系,即一個(gè)變量數(shù)值的變動(dòng),都會(huì)有另一個(gè)變量的數(shù)值與之完全對(duì)應(yīng)相關(guān)關(guān)系是指變量之間存在著的一種非確定性的數(shù)量依存關(guān)系,即一個(gè)變量發(fā)生數(shù)值變化時(shí),另一變量也相應(yīng)地發(fā)生數(shù)值變化,但其數(shù)值是不固定的太陽(yáng)和地球的運(yùn)動(dòng)就是函數(shù)你和你父親之間就是相關(guān)不可能是函數(shù),如是函數(shù),他動(dòng)一下胳膊,你就要?jiǎng)右幌峦认嚓P(guān)分析是研究?jī)蓚€(gè)或兩個(gè)以上的變量之間相關(guān)程度及大小的一種統(tǒng)計(jì)方法其主要內(nèi)容包括:1.確定現(xiàn)象之間是否存在相關(guān)關(guān)系,以及相關(guān)關(guān)系呈現(xiàn)的形態(tài)2.確定相關(guān)關(guān)系的密切程度3.相關(guān)系數(shù)的檢驗(yàn)回歸分析是尋找存在相關(guān)關(guān)系的變量間的數(shù)學(xué)表達(dá)式,并進(jìn)行統(tǒng)計(jì)推斷的一種統(tǒng)計(jì)方法主要內(nèi)容包括:1.進(jìn)行參數(shù)估計(jì)。即如何根據(jù)樣本數(shù)據(jù)對(duì)回歸模型的參數(shù)進(jìn)行估計(jì),求出具體的回歸方程2.進(jìn)行顯著性檢驗(yàn)。即對(duì)回歸方程、參數(shù)估計(jì)值進(jìn)行顯著性檢驗(yàn)與校正,以便使回歸方程或參數(shù)更加優(yōu)良3.進(jìn)行預(yù)測(cè)和控制四、相關(guān)與回歸相關(guān)僅判定變量之間是否存在關(guān)系(存在性)這關(guān)系的大小、正確與否都是回歸分析的內(nèi)容(關(guān)系的具體表現(xiàn))相關(guān)關(guān)系的種類(lèi)1.按相關(guān)關(guān)系涉及變量(因素)的多少單相關(guān)與復(fù)相關(guān)2.按相關(guān)關(guān)系的表現(xiàn)形式線(xiàn)性相關(guān)和非線(xiàn)性相關(guān)3.按相關(guān)的方向正相關(guān)和負(fù)相關(guān)4.按相關(guān)程度來(lái)分完全相關(guān)、不完全相關(guān)和不相關(guān)(完全不相關(guān))對(duì)立、反義詞相關(guān)關(guān)系的度量在進(jìn)行相關(guān)分析時(shí),可通過(guò)相關(guān)表P205散點(diǎn)圖計(jì)算相關(guān)系數(shù)散點(diǎn)圖,是利用坐標(biāo)系,將兩變量相對(duì)應(yīng)的變量值用坐標(biāo)點(diǎn)形式描繪出來(lái)的二維數(shù)據(jù)圖相關(guān)系數(shù)相關(guān)表與散點(diǎn)圖只能粗略的反映變量間相關(guān)關(guān)系的方向、形式和密切程度,要確切地反映相關(guān)關(guān)系的密切程度,還需計(jì)算相關(guān)系數(shù)相關(guān)系數(shù)有很多種形式,常用由卡爾.皮爾遜提出的相關(guān)系數(shù)相關(guān)系數(shù)的計(jì)算相關(guān)系數(shù)用來(lái)度量的兩個(gè)變量,設(shè)為x與y根據(jù)總體數(shù)據(jù)計(jì)算的兩個(gè)變量之間線(xiàn)性相關(guān)強(qiáng)度的統(tǒng)計(jì)量,叫做總體相關(guān)系數(shù),用ρ表示根據(jù)樣本計(jì)算的兩個(gè)變量之間線(xiàn)性相關(guān)強(qiáng)度的統(tǒng)計(jì)量,叫做樣本相關(guān)系數(shù),簡(jiǎn)稱(chēng)相關(guān)系數(shù),用r表示相關(guān)系數(shù)r的測(cè)定方法有兩種,第一種稱(chēng)積差法,第二種稱(chēng)簡(jiǎn)捷法r是ρ的一個(gè)估計(jì)量,得到ρ是不可能的,需要用r來(lái)估計(jì)ρ。另外,估計(jì)得到的值需要進(jìn)行檢驗(yàn)---略例題(表7.1)2012年各地區(qū)農(nóng)村居民家庭人均純收入與人均消費(fèi)支出地區(qū)人均純收入x人均消費(fèi)支出y甘肅4506.74146.2貴州47533961.7青海53645338.9云南5416.54561.3………北京16475.711878.9上海17803.711971.5性質(zhì)與特點(diǎn)相關(guān)系數(shù)介于-1到+1之間r=0,說(shuō)明xy沒(méi)有線(xiàn)性相關(guān)關(guān)系r>0,正相關(guān);r<0,負(fù)相關(guān)r絕對(duì)值=1,函數(shù)(完全相關(guān));r=1,完全正相關(guān);r=-1,完全負(fù)相關(guān)r具有對(duì)稱(chēng)性,x與y的相關(guān)系數(shù)和y與x的相關(guān)系數(shù)相等r只能測(cè)量線(xiàn)性r只說(shuō)明線(xiàn)性程度,不能說(shuō)明具體變化關(guān)系—-回歸r的數(shù)值大小與x和y的原點(diǎn)及尺度無(wú)關(guān)課堂練習(xí)根據(jù)抽樣知,某企業(yè)銷(xiāo)售額與流通費(fèi)用的相關(guān)情況,如表,根據(jù)積差法與簡(jiǎn)捷法分別計(jì)算相關(guān)系數(shù)r。年份(年)銷(xiāo)售額(萬(wàn)元)流通費(fèi)用(萬(wàn)元)19981999200020012002200320042005200610163240741201972463451.83.15.27.710.413.318.821.228.3回歸分析回歸分析的分類(lèi)回歸分析分類(lèi),主要有兩種第一,根據(jù)變量的數(shù)目,可以分類(lèi)一元回歸、多元回歸第二,根據(jù)自變量與因變量的表現(xiàn)形式,分為線(xiàn)性與非線(xiàn)性回歸分析包括四個(gè)方向:一元線(xiàn)性回歸分析、多元線(xiàn)性回歸分析、一元非線(xiàn)性回歸分析、多元非線(xiàn)性回歸分析一元非線(xiàn)性回歸分析、多元非線(xiàn)性回歸分析合并為曲線(xiàn)回歸分析---略一元線(xiàn)性回歸分析一元線(xiàn)性回歸模型

(回歸函數(shù))回歸模型的一般形式對(duì)于具有線(xiàn)性關(guān)系的兩個(gè)變量,可以用一個(gè)方程來(lái)表示它們之間的線(xiàn)性關(guān)系描述因變量y如何依賴(lài)于自變量x和誤差項(xiàng)ε的方程稱(chēng)為回歸模型。對(duì)于只涉及一個(gè)自變量的一元線(xiàn)性回歸模型可表示為回歸方程描述因變量y的期望值如何依賴(lài)于自變量x的方程稱(chēng)為回歸方程。根據(jù)對(duì)一元線(xiàn)性回歸模型的假設(shè),可以得到它的回歸方程為估計(jì)的回歸方程(樣本函數(shù))如果回歸方程中的參數(shù)已知,對(duì)于一個(gè)給定的x值,利用回歸方程就能計(jì)算出y的期望值用樣本統(tǒng)計(jì)量代替回歸方程中的未知參數(shù),就得到估計(jì)的回歸方程,簡(jiǎn)稱(chēng)回歸直線(xiàn)、樣本函數(shù)參數(shù)估計(jì)與預(yù)測(cè)參數(shù)的最小二乘法估計(jì)對(duì)于回歸直線(xiàn),關(guān)鍵在于求解參數(shù)常用高斯提出的最小二乘法,也叫做最小平方法,它是使因變量的觀察值y與估計(jì)值之間的離差平方和達(dá)到最小來(lái)求解給出給地區(qū)財(cái)政稅收收入與地區(qū)生產(chǎn)總值的關(guān)系,求回歸直線(xiàn)地區(qū)財(cái)政稅收收入y生產(chǎn)總值x北京3124.7517879.4天津1105.5612893.88河北1560.5926575.01山西1045.2212112.83………寧夏207.022341.29新疆698.937505.31課堂練習(xí)根據(jù)統(tǒng)計(jì),70年代世界制造業(yè)總產(chǎn)量與世界制成品總出口量的變化關(guān)系如表。求回歸直線(xiàn)年度總產(chǎn)量年增長(zhǎng)率(%)x總出口量年增長(zhǎng)率(%)y19704.08.519714.08.019728.510.519739.515.519743.08.51975-1.0-4.519768.013.519775.05.019785.06.019794.07.0擬合優(yōu)度擬合優(yōu)度,主要是用來(lái)說(shuō)明回歸直線(xiàn)是不是更好的擬合所有的散點(diǎn)判定系數(shù)因變量y的取值是不同的,y取值的這種波動(dòng)稱(chēng)為變差。因變量y取值的變差來(lái)源于兩個(gè)方面:一是由于自變量x的取值不同造成的,二是除x以外的其他因素的影響總平方和可以分解為回歸平方和、殘差平方和兩部分回歸平方和SSR反映了y的總變差中,由于x與y之間的線(xiàn)性關(guān)系引起的y的變化部分殘差平方和SSE反映了除了x對(duì)y的線(xiàn)性影響之外的其他因素對(duì)y變差的作用,是不能由回歸直線(xiàn)來(lái)解釋的y的變差部分可以看出,回歸直線(xiàn)擬合的好壞取決于SSR及SSE的根據(jù)WTO的統(tǒng)計(jì)數(shù)字,70年代世界制造業(yè)總產(chǎn)量與世界制成品總出口量的變化關(guān)系如表,求判定系數(shù)年度總產(chǎn)量年增長(zhǎng)率(%)x總出口量年增長(zhǎng)率(%)y19704.08.519714.08.019728.510.519739.515.519743.08.51975-1.0-4.519768.013.519775.05.019785.06.019794.07.0的計(jì)算太復(fù)雜,在一元線(xiàn)性回歸中,判定系數(shù)在數(shù)值上等于相關(guān)系數(shù)的平方7.3顯著性檢驗(yàn)與回歸預(yù)測(cè)回歸直線(xiàn)求出后,還不可以直接進(jìn)行預(yù)測(cè)等應(yīng)用根據(jù)樣本做出的方程并不一定真,需要檢驗(yàn)檢驗(yàn):回歸方程的檢驗(yàn)、回歸系數(shù)的檢驗(yàn)可否使用線(xiàn)性去描述F每一個(gè)回歸參數(shù)計(jì)算值是否為真t一元線(xiàn)性回歸,兩檢驗(yàn)重合例題Excel2003版:工具-加載宏-加載…工具-數(shù)據(jù)分析-回歸2007版:菜單旁右鍵-自定義快速訪(fǎng)問(wèn)工具欄-加載項(xiàng)-分析工具庫(kù)…數(shù)據(jù)-數(shù)據(jù)分析見(jiàn)Excel利用回歸直線(xiàn)進(jìn)行估計(jì)和預(yù)測(cè)(1)點(diǎn)估計(jì)利用估計(jì)的回歸方程,對(duì)于x的某一個(gè)特定的值,求出y的一個(gè)估計(jì)值就是點(diǎn)估計(jì)點(diǎn)估計(jì)分兩種:一個(gè)是平均值的點(diǎn)估計(jì),一個(gè)是個(gè)別值的點(diǎn)估計(jì)點(diǎn)估計(jì)的條件下,對(duì)于同一個(gè)特定的,平均值的點(diǎn)估計(jì)和個(gè)別值的點(diǎn)估計(jì)的結(jié)果是一樣的(2)區(qū)間估計(jì)利用估計(jì)的回歸方程,對(duì)于x的一個(gè)特定值,求出y的一個(gè)估計(jì)值的區(qū)間就是區(qū)間估計(jì)某企業(yè)從有關(guān)資料中發(fā)現(xiàn)廣告投入和產(chǎn)品銷(xiāo)售有較密切的關(guān)系。近年該企業(yè)廣告費(fèi)和銷(xiāo)售額資料見(jiàn)表10-3,若2003年廣告費(fèi)為120萬(wàn)元,請(qǐng)用一元線(xiàn)性回歸求2003年產(chǎn)品銷(xiāo)售額的預(yù)測(cè)區(qū)間(α=0.05)年份廣告費(fèi)x(萬(wàn)元)銷(xiāo)售額y(百萬(wàn)元)199419951996199719981999200020012002355260728580951001051825303841444952607.4多元線(xiàn)性回歸分析一、模型概述與假設(shè)1.模型概述經(jīng)濟(jì)活動(dòng)中,經(jīng)常會(huì)遇到某一現(xiàn)象的發(fā)展和變化取決于幾個(gè)影響因素的情況,也就是一個(gè)因變量和幾個(gè)自變量有依存關(guān)系的情況,這時(shí)需用多元線(xiàn)性回歸分析多元線(xiàn)性回歸分析預(yù)測(cè)法,是指通過(guò)對(duì)兩上或兩個(gè)以上的自變量與一個(gè)因變量的相關(guān)分析,建立預(yù)測(cè)模型進(jìn)行預(yù)測(cè)和控制的方法多元線(xiàn)性回歸預(yù)測(cè)模型一般式為二、參數(shù)估計(jì)與預(yù)測(cè)1.回歸方程描述因變量y的期望值如何依賴(lài)于多個(gè)自變量x的方程稱(chēng)為多元線(xiàn)性回歸方程多元線(xiàn)性回歸方程為用樣本統(tǒng)計(jì)量代替回歸方程中的未知參數(shù),就得到估計(jì)的多元線(xiàn)性回歸方程2.參數(shù)的最小二乘法估計(jì)課堂練習(xí)某地區(qū)通過(guò)市場(chǎng)調(diào)查發(fā)現(xiàn)電冰箱銷(xiāo)售量同居民新結(jié)婚戶(hù)數(shù)、居民戶(hù)均收入水平相關(guān)。該地區(qū)近年電冰箱銷(xiāo)售量、新結(jié)婚戶(hù)數(shù)和居民戶(hù)均收入水平資料見(jiàn)教材表。以電冰箱銷(xiāo)售量(千臺(tái))為因變量y,以新結(jié)婚戶(hù)數(shù)(千戶(hù))為自變量,以居民戶(hù)均收入(千元)為自變量。若預(yù)計(jì)2010年該地區(qū)居民新婚戶(hù)數(shù)為30.2千戶(hù),居民戶(hù)均收入62.5千元。用二元線(xiàn)性回歸預(yù)測(cè)該地區(qū)2003年電冰箱需求量年份冰箱銷(xiāo)量y新結(jié)婚數(shù)x1居民戶(hù)均收入x22002202228.520032622.53420043023.138.620053423.4402006402442.520074424.5462008492650.22095528.554.8回歸直線(xiàn)的擬合優(yōu)度多元線(xiàn)性回歸分析,一般用于判斷回歸直線(xiàn)擬合優(yōu)度的指標(biāo)有多重判定系數(shù)修正多重判定系數(shù)估計(jì)標(biāo)準(zhǔn)誤差多重判定系數(shù)對(duì)多元線(xiàn)性回歸方程而言,總平方和SST同樣可以分解為回歸平方和SSR及殘差平方和SSE兩部分SST=SSR+SSE多重判定系數(shù),也稱(chēng)為復(fù)判定系數(shù),是指在多元線(xiàn)性回歸分析中,回歸平方和占總平方和的比重曲線(xiàn)回歸分析曲線(xiàn)回歸概述直線(xiàn)關(guān)系是兩變量間最簡(jiǎn)單的一種關(guān)系曲線(xiàn)回歸分析的基本任務(wù)是通過(guò)兩個(gè)相關(guān)變量x與y的實(shí)際觀測(cè)數(shù)據(jù)建立曲線(xiàn)回歸方程,以揭示x與y間的曲線(xiàn)聯(lián)系的形式曲線(xiàn)回歸分析最困難和首要的工作是確定自變量與因變量間的曲線(xiàn)關(guān)系的類(lèi)型曲線(xiàn)回歸分析的基本過(guò)程先將x或y進(jìn)行變量轉(zhuǎn)換對(duì)新變量進(jìn)行直線(xiàn)回歸分析、建立直線(xiàn)回歸方程并進(jìn)行顯著性檢驗(yàn)和區(qū)間估計(jì)將新變量還原為原變量,由新變量的直線(xiàn)回歸方程和置信區(qū)間得出原變量的曲線(xiàn)回歸方程和置信區(qū)間

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論