第7章相關(guān)與回歸分析_第1頁(yè)
第7章相關(guān)與回歸分析_第2頁(yè)
第7章相關(guān)與回歸分析_第3頁(yè)
第7章相關(guān)與回歸分析_第4頁(yè)
第7章相關(guān)與回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩55頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第7章相關(guān)與回歸分析弗朗西斯﹒高爾頓先生被譽(yù)為現(xiàn)代相關(guān)和回歸的創(chuàng)始人1875年,他利用豌豆試驗(yàn)來(lái)確定尺寸的遺傳規(guī)律。他挑選7組不同尺寸的豌豆,說(shuō)服他的朋友每一組種植10粒種子,最后把原始的豌豆種子與新長(zhǎng)的豌豆種子進(jìn)行尺寸比較當(dāng)結(jié)果被繪制出來(lái)之后,他發(fā)現(xiàn)并非每一個(gè)子代都與父代一樣,相同的是,尺寸小的豌豆會(huì)得到更大的子代,而尺寸大的豌豆卻得到較小的子代高爾頓將此方法用到人類身上,他將父母和孩子的身高轉(zhuǎn)換成z值,對(duì)比父母的身高與他們孩子的身高。他并發(fā)現(xiàn)孩子們的z值偏離均值的程度小于父母的偏離程度,即非常矮小的父母傾向于有偏高的孩子;而非常高大的父母則傾向于有偏矮的孩子。它把這叫做對(duì)均值的“回歸”,這一發(fā)現(xiàn)構(gòu)成了回歸分析的基礎(chǔ)7.1相關(guān)分析變量間的關(guān)系及分類統(tǒng)計(jì)變量之間的關(guān)系,存在著兩種不同的類型,一種是函數(shù)關(guān)系,另一種是相關(guān)關(guān)系函數(shù)關(guān)系是指變量之間存在著的一種固定的、嚴(yán)格的數(shù)量依存關(guān)系,即一個(gè)變量數(shù)值的變動(dòng),都會(huì)有另一個(gè)變量的數(shù)值與之完全對(duì)應(yīng)相關(guān)關(guān)系是指變量之間存在著的一種非確定性的數(shù)量依存關(guān)系,即一個(gè)變量發(fā)生數(shù)值變化時(shí),另一變量也相應(yīng)地發(fā)生數(shù)值變化,但其數(shù)值是不固定的太陽(yáng)和地球的運(yùn)動(dòng)就是函數(shù)你和你父親之間就是相關(guān)不可能是函數(shù),如是函數(shù),他動(dòng)一下胳膊,你就要?jiǎng)右幌峦认嚓P(guān)分析是研究?jī)蓚€(gè)或兩個(gè)以上的變量之間相關(guān)程度及大小的一種統(tǒng)計(jì)方法其主要內(nèi)容包括:1.確定現(xiàn)象之間是否存在相關(guān)關(guān)系,以及相關(guān)關(guān)系呈現(xiàn)的形態(tài)2.確定相關(guān)關(guān)系的密切程度3.相關(guān)系數(shù)的檢驗(yàn)回歸分析是尋找存在相關(guān)關(guān)系的變量間的數(shù)學(xué)表達(dá)式,并進(jìn)行統(tǒng)計(jì)推斷的一種統(tǒng)計(jì)方法主要內(nèi)容包括:1.進(jìn)行參數(shù)估計(jì)。即如何根據(jù)樣本數(shù)據(jù)對(duì)回歸模型的參數(shù)進(jìn)行估計(jì),求出具體的回歸方程2.進(jìn)行顯著性檢驗(yàn)。即對(duì)回歸方程、參數(shù)估計(jì)值進(jìn)行顯著性檢驗(yàn)與校正,以便使回歸方程或參數(shù)更加優(yōu)良3.進(jìn)行預(yù)測(cè)和控制四、相關(guān)與回歸相關(guān)僅判定變量之間是否存在關(guān)系(存在性)這關(guān)系的大小、正確與否都是回歸分析的內(nèi)容(關(guān)系的具體表現(xiàn))相關(guān)關(guān)系的種類1.按相關(guān)關(guān)系涉及變量(因素)的多少單相關(guān)與復(fù)相關(guān)2.按相關(guān)關(guān)系的表現(xiàn)形式線性相關(guān)和非線性相關(guān)3.按相關(guān)的方向正相關(guān)和負(fù)相關(guān)4.按相關(guān)程度來(lái)分完全相關(guān)、不完全相關(guān)和不相關(guān)(完全不相關(guān))對(duì)立、反義詞相關(guān)關(guān)系的度量在進(jìn)行相關(guān)分析時(shí),可通過(guò)相關(guān)表P205散點(diǎn)圖計(jì)算相關(guān)系數(shù)散點(diǎn)圖,是利用坐標(biāo)系,將兩變量相對(duì)應(yīng)的變量值用坐標(biāo)點(diǎn)形式描繪出來(lái)的二維數(shù)據(jù)圖相關(guān)系數(shù)相關(guān)表與散點(diǎn)圖只能粗略的反映變量間相關(guān)關(guān)系的方向、形式和密切程度,要確切地反映相關(guān)關(guān)系的密切程度,還需計(jì)算相關(guān)系數(shù)相關(guān)系數(shù)有很多種形式,常用由卡爾.皮爾遜提出的相關(guān)系數(shù)相關(guān)系數(shù)的計(jì)算相關(guān)系數(shù)用來(lái)度量的兩個(gè)變量,設(shè)為x與y根據(jù)總體數(shù)據(jù)計(jì)算的兩個(gè)變量之間線性相關(guān)強(qiáng)度的統(tǒng)計(jì)量,叫做總體相關(guān)系數(shù),用ρ表示根據(jù)樣本計(jì)算的兩個(gè)變量之間線性相關(guān)強(qiáng)度的統(tǒng)計(jì)量,叫做樣本相關(guān)系數(shù),簡(jiǎn)稱相關(guān)系數(shù),用r表示相關(guān)系數(shù)r的測(cè)定方法有兩種,第一種稱積差法,第二種稱簡(jiǎn)捷法r是ρ的一個(gè)估計(jì)量,得到ρ是不可能的,需要用r來(lái)估計(jì)ρ。另外,估計(jì)得到的值需要進(jìn)行檢驗(yàn)---略例題(表7.1)2012年各地區(qū)農(nóng)村居民家庭人均純收入與人均消費(fèi)支出地區(qū)人均純收入x人均消費(fèi)支出y甘肅4506.74146.2貴州47533961.7青海53645338.9云南5416.54561.3………北京16475.711878.9上海17803.711971.5性質(zhì)與特點(diǎn)相關(guān)系數(shù)介于-1到+1之間r=0,說(shuō)明xy沒(méi)有線性相關(guān)關(guān)系r>0,正相關(guān);r<0,負(fù)相關(guān)r絕對(duì)值=1,函數(shù)(完全相關(guān));r=1,完全正相關(guān);r=-1,完全負(fù)相關(guān)r具有對(duì)稱性,x與y的相關(guān)系數(shù)和y與x的相關(guān)系數(shù)相等r只能測(cè)量線性r只說(shuō)明線性程度,不能說(shuō)明具體變化關(guān)系—-回歸r的數(shù)值大小與x和y的原點(diǎn)及尺度無(wú)關(guān)課堂練習(xí)根據(jù)抽樣知,某企業(yè)銷售額與流通費(fèi)用的相關(guān)情況,如表,根據(jù)積差法與簡(jiǎn)捷法分別計(jì)算相關(guān)系數(shù)r。年份(年)銷售額(萬(wàn)元)流通費(fèi)用(萬(wàn)元)19981999200020012002200320042005200610163240741201972463451.83.15.27.710.413.318.821.228.3回歸分析回歸分析的分類回歸分析分類,主要有兩種第一,根據(jù)變量的數(shù)目,可以分類一元回歸、多元回歸第二,根據(jù)自變量與因變量的表現(xiàn)形式,分為線性與非線性回歸分析包括四個(gè)方向:一元線性回歸分析、多元線性回歸分析、一元非線性回歸分析、多元非線性回歸分析一元非線性回歸分析、多元非線性回歸分析合并為曲線回歸分析---略一元線性回歸分析一元線性回歸模型

(回歸函數(shù))回歸模型的一般形式對(duì)于具有線性關(guān)系的兩個(gè)變量,可以用一個(gè)方程來(lái)表示它們之間的線性關(guān)系描述因變量y如何依賴于自變量x和誤差項(xiàng)ε的方程稱為回歸模型。對(duì)于只涉及一個(gè)自變量的一元線性回歸模型可表示為回歸方程描述因變量y的期望值如何依賴于自變量x的方程稱為回歸方程。根據(jù)對(duì)一元線性回歸模型的假設(shè),可以得到它的回歸方程為估計(jì)的回歸方程(樣本函數(shù))如果回歸方程中的參數(shù)已知,對(duì)于一個(gè)給定的x值,利用回歸方程就能計(jì)算出y的期望值用樣本統(tǒng)計(jì)量代替回歸方程中的未知參數(shù),就得到估計(jì)的回歸方程,簡(jiǎn)稱回歸直線、樣本函數(shù)參數(shù)估計(jì)與預(yù)測(cè)參數(shù)的最小二乘法估計(jì)對(duì)于回歸直線,關(guān)鍵在于求解參數(shù)常用高斯提出的最小二乘法,也叫做最小平方法,它是使因變量的觀察值y與估計(jì)值之間的離差平方和達(dá)到最小來(lái)求解給出給地區(qū)財(cái)政稅收收入與地區(qū)生產(chǎn)總值的關(guān)系,求回歸直線地區(qū)財(cái)政稅收收入y生產(chǎn)總值x北京3124.7517879.4天津1105.5612893.88河北1560.5926575.01山西1045.2212112.83………寧夏207.022341.29新疆698.937505.31課堂練習(xí)根據(jù)統(tǒng)計(jì),70年代世界制造業(yè)總產(chǎn)量與世界制成品總出口量的變化關(guān)系如表。求回歸直線年度總產(chǎn)量年增長(zhǎng)率(%)x總出口量年增長(zhǎng)率(%)y19704.08.519714.08.019728.510.519739.515.519743.08.51975-1.0-4.519768.013.519775.05.019785.06.019794.07.0擬合優(yōu)度擬合優(yōu)度,主要是用來(lái)說(shuō)明回歸直線是不是更好的擬合所有的散點(diǎn)判定系數(shù)因變量y的取值是不同的,y取值的這種波動(dòng)稱為變差。因變量y取值的變差來(lái)源于兩個(gè)方面:一是由于自變量x的取值不同造成的,二是除x以外的其他因素的影響總平方和可以分解為回歸平方和、殘差平方和兩部分回歸平方和SSR反映了y的總變差中,由于x與y之間的線性關(guān)系引起的y的變化部分殘差平方和SSE反映了除了x對(duì)y的線性影響之外的其他因素對(duì)y變差的作用,是不能由回歸直線來(lái)解釋的y的變差部分可以看出,回歸直線擬合的好壞取決于SSR及SSE的根據(jù)WTO的統(tǒng)計(jì)數(shù)字,70年代世界制造業(yè)總產(chǎn)量與世界制成品總出口量的變化關(guān)系如表,求判定系數(shù)年度總產(chǎn)量年增長(zhǎng)率(%)x總出口量年增長(zhǎng)率(%)y19704.08.519714.08.019728.510.519739.515.519743.08.51975-1.0-4.519768.013.519775.05.019785.06.019794.07.0的計(jì)算太復(fù)雜,在一元線性回歸中,判定系數(shù)在數(shù)值上等于相關(guān)系數(shù)的平方7.3顯著性檢驗(yàn)與回歸預(yù)測(cè)回歸直線求出后,還不可以直接進(jìn)行預(yù)測(cè)等應(yīng)用根據(jù)樣本做出的方程并不一定真,需要檢驗(yàn)檢驗(yàn):回歸方程的檢驗(yàn)、回歸系數(shù)的檢驗(yàn)可否使用線性去描述F每一個(gè)回歸參數(shù)計(jì)算值是否為真t一元線性回歸,兩檢驗(yàn)重合例題Excel2003版:工具-加載宏-加載…工具-數(shù)據(jù)分析-回歸2007版:菜單旁右鍵-自定義快速訪問(wèn)工具欄-加載項(xiàng)-分析工具庫(kù)…數(shù)據(jù)-數(shù)據(jù)分析見Excel利用回歸直線進(jìn)行估計(jì)和預(yù)測(cè)(1)點(diǎn)估計(jì)利用估計(jì)的回歸方程,對(duì)于x的某一個(gè)特定的值,求出y的一個(gè)估計(jì)值就是點(diǎn)估計(jì)點(diǎn)估計(jì)分兩種:一個(gè)是平均值的點(diǎn)估計(jì),一個(gè)是個(gè)別值的點(diǎn)估計(jì)點(diǎn)估計(jì)的條件下,對(duì)于同一個(gè)特定的,平均值的點(diǎn)估計(jì)和個(gè)別值的點(diǎn)估計(jì)的結(jié)果是一樣的(2)區(qū)間估計(jì)利用估計(jì)的回歸方程,對(duì)于x的一個(gè)特定值,求出y的一個(gè)估計(jì)值的區(qū)間就是區(qū)間估計(jì)某企業(yè)從有關(guān)資料中發(fā)現(xiàn)廣告投入和產(chǎn)品銷售有較密切的關(guān)系。近年該企業(yè)廣告費(fèi)和銷售額資料見表10-3,若2003年廣告費(fèi)為120萬(wàn)元,請(qǐng)用一元線性回歸求2003年產(chǎn)品銷售額的預(yù)測(cè)區(qū)間(α=0.05)年份廣告費(fèi)x(萬(wàn)元)銷售額y(百萬(wàn)元)199419951996199719981999200020012002355260728580951001051825303841444952607.4多元線性回歸分析一、模型概述與假設(shè)1.模型概述經(jīng)濟(jì)活動(dòng)中,經(jīng)常會(huì)遇到某一現(xiàn)象的發(fā)展和變化取決于幾個(gè)影響因素的情況,也就是一個(gè)因變量和幾個(gè)自變量有依存關(guān)系的情況,這時(shí)需用多元線性回歸分析多元線性回歸分析預(yù)測(cè)法,是指通過(guò)對(duì)兩上或兩個(gè)以上的自變量與一個(gè)因變量的相關(guān)分析,建立預(yù)測(cè)模型進(jìn)行預(yù)測(cè)和控制的方法多元線性回歸預(yù)測(cè)模型一般式為二、參數(shù)估計(jì)與預(yù)測(cè)1.回歸方程描述因變量y的期望值如何依賴于多個(gè)自變量x的方程稱為多元線性回歸方程多元線性回歸方程為用樣本統(tǒng)計(jì)量代替回歸方程中的未知參數(shù),就得到估計(jì)的多元線性回歸方程2.參數(shù)的最小二乘法估計(jì)課堂練習(xí)某地區(qū)通過(guò)市場(chǎng)調(diào)查發(fā)現(xiàn)電冰箱銷售量同居民新結(jié)婚戶數(shù)、居民戶均收入水平相關(guān)。該地區(qū)近年電冰箱銷售量、新結(jié)婚戶數(shù)和居民戶均收入水平資料見教材表。以電冰箱銷售量(千臺(tái))為因變量y,以新結(jié)婚戶數(shù)(千戶)為自變量,以居民戶均收入(千元)為自變量。若預(yù)計(jì)2010年該地區(qū)居民新婚戶數(shù)為30.2千戶,居民戶均收入62.5千元。用二元線性回歸預(yù)測(cè)該地區(qū)2003年電冰箱需求量年份冰箱銷量y新結(jié)婚數(shù)x1居民戶均收入x22002202228.520032622.53420043023.138.620053423.4402006402442.520074424.5462008492650.22095528.554.8回歸直線的擬合優(yōu)度多元線性回歸分析,一般用于判斷回歸直線擬合優(yōu)度的指標(biāo)有多重判定系數(shù)修正多重判定系數(shù)估計(jì)標(biāo)準(zhǔn)誤差多重判定系數(shù)對(duì)多元線性回歸方程而言,總平方和SST同樣可以分解為回歸平方和SSR及殘差平方和SSE兩部分SST=SSR+SSE多重判定系數(shù),也稱為復(fù)判定系數(shù),是指在多元線性回歸分析中,回歸平方和占總平方和的比重曲線回歸分析曲線回歸概述直線關(guān)系是兩變量間最簡(jiǎn)單的一種關(guān)系曲線回歸分析的基本任務(wù)是通過(guò)兩個(gè)相關(guān)變量x與y的實(shí)際觀測(cè)數(shù)據(jù)建立曲線回歸方程,以揭示x與y間的曲線聯(lián)系的形式曲線回歸分析最困難和首要的工作是確定自變量與因變量間的曲線關(guān)系的類型曲線回歸分析的基本過(guò)程先將x或y進(jìn)行變量轉(zhuǎn)換對(duì)新變量進(jìn)行直線回歸分析、建立直線回歸方程并進(jìn)行顯著性檢驗(yàn)和區(qū)間估計(jì)將新變量還原為原變量,由新變量的直線回歸方程和置信區(qū)間得出原變量的曲線回歸方程和置信區(qū)間

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論