![統(tǒng)計(jì)學(xué)第七章相關(guān)與回歸分析_第1頁(yè)](http://file4.renrendoc.com/view/80c65fead03bd81242a2b96a1a32f13d/80c65fead03bd81242a2b96a1a32f13d1.gif)
![統(tǒng)計(jì)學(xué)第七章相關(guān)與回歸分析_第2頁(yè)](http://file4.renrendoc.com/view/80c65fead03bd81242a2b96a1a32f13d/80c65fead03bd81242a2b96a1a32f13d2.gif)
![統(tǒng)計(jì)學(xué)第七章相關(guān)與回歸分析_第3頁(yè)](http://file4.renrendoc.com/view/80c65fead03bd81242a2b96a1a32f13d/80c65fead03bd81242a2b96a1a32f13d3.gif)
![統(tǒng)計(jì)學(xué)第七章相關(guān)與回歸分析_第4頁(yè)](http://file4.renrendoc.com/view/80c65fead03bd81242a2b96a1a32f13d/80c65fead03bd81242a2b96a1a32f13d4.gif)
![統(tǒng)計(jì)學(xué)第七章相關(guān)與回歸分析_第5頁(yè)](http://file4.renrendoc.com/view/80c65fead03bd81242a2b96a1a32f13d/80c65fead03bd81242a2b96a1a32f13d5.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
統(tǒng)計(jì)學(xué)第七章相關(guān)與回歸分析第1頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月消費(fèi)者應(yīng)該留下多少小費(fèi)?在西方國(guó)家餐飲等服務(wù)行業(yè)有一條不成文的規(guī)定,即發(fā)生餐飲等服務(wù)項(xiàng)目消費(fèi)時(shí),必須給服務(wù)員一定數(shù)額的小費(fèi),許多人都聽(tīng)說(shuō)小費(fèi)應(yīng)該是賬單的16%左右,是否真的如此呢?讓我們來(lái)考察下表,表中的數(shù)據(jù)是經(jīng)過(guò)調(diào)查所得的樣本數(shù)據(jù),通過(guò)對(duì)這幾組數(shù)據(jù)的分析與觀察,我們能發(fā)現(xiàn)兩者之間的數(shù)量關(guān)系。第2頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月問(wèn)題是:1、是否有足夠的證據(jù)斷定:在賬單與小費(fèi)數(shù)額之間存在某種聯(lián)系?2、如果存在某種聯(lián)系,怎樣使用這種聯(lián)系來(lái)確定應(yīng)該留下多少小費(fèi)?如上例,我們想要確定賬單與小費(fèi)數(shù)額之間是否存在某種聯(lián)系,如果存在,我們就想用一個(gè)公式描述它,這樣就能找出人們留小費(fèi)時(shí)遵循的規(guī)則。類似這樣的問(wèn)題還有很多,如:(1)犯罪率與偷竊率;(2)香煙消費(fèi)與患癌癥率;(3)個(gè)人收入水平與受教育年限;(4)血壓與年齡;(5)父母身高與子女身高;(6)薪金與酒價(jià);(7)人的手掌生命線的長(zhǎng)度與人的壽命長(zhǎng)短。第3頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月第一節(jié)相關(guān)與回歸分析的基本概念一、函數(shù)關(guān)系與相關(guān)關(guān)系1.函數(shù)關(guān)系當(dāng)一個(gè)或幾個(gè)變量取一定的值時(shí),另一個(gè)變量有確定值與之相對(duì)應(yīng),這種確定性的數(shù)量依存關(guān)系稱為函數(shù)關(guān)系。第4頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月(函數(shù)關(guān)系)(1)是一一對(duì)應(yīng)的確定關(guān)系(2)設(shè)有兩個(gè)變量x和y,變量y隨變量x一起變化,并完全依賴于x
,當(dāng)變量x取某個(gè)數(shù)值時(shí),
y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量(3)各觀測(cè)點(diǎn)落在一條線上
xy第5頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月2.相關(guān)關(guān)系:當(dāng)一個(gè)或幾個(gè)相互聯(lián)系的變量取一定數(shù)值時(shí),與之相對(duì)應(yīng)的另一變量的值雖然不確定,但它仍按某種規(guī)律在一定的范圍內(nèi)變化。
現(xiàn)象之間客觀存在的不嚴(yán)格、不確定的數(shù)量依存關(guān)系稱為相關(guān)關(guān)系。第6頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月變量間的關(guān)系
(相關(guān)關(guān)系)(1)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá);(2)一個(gè)變量的取值不能由另一個(gè)變量唯一確定;(3)當(dāng)變量x取某個(gè)值時(shí),變量y的取值可能有幾個(gè);(4)各觀測(cè)點(diǎn)分布在直線周圍。xy第7頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月(相關(guān)關(guān)系)相關(guān)關(guān)系的例子商品的消費(fèi)量(y)與居民收入(x)之間的關(guān)系商品銷售額(y)與廣告費(fèi)支出(x)之間的關(guān)系糧食畝產(chǎn)量(y)與施肥量(x1)、降雨量(x2)、溫度(x3)之間的關(guān)系收入水平(y)與受教育程度(x)之間的關(guān)系父親身高(y)與子女身高(x)之間的關(guān)系第8頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月3、相關(guān)關(guān)系與函數(shù)關(guān)系的區(qū)別與聯(lián)系
(1)都可用函數(shù)式加以描述,但表達(dá)式不同(2)相關(guān)分析需要利用函數(shù)關(guān)系數(shù)學(xué)表達(dá)式來(lái)研究(3)相關(guān)關(guān)系是相關(guān)分析的研究對(duì)象,函數(shù)關(guān)系是相關(guān)分析的工具第9頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月二、相關(guān)關(guān)系的種類
相關(guān)關(guān)系自變量個(gè)數(shù)的多少相關(guān)的密切程度一元相關(guān)學(xué)習(xí)成績(jī)與學(xué)習(xí)時(shí)間;血壓與年齡;畝產(chǎn)量與施肥量多元相關(guān)經(jīng)濟(jì)增長(zhǎng)與人口增長(zhǎng)、科技水平、自然資源、管理水平等之間的關(guān)系;相關(guān)的方向相關(guān)的形式線性相關(guān)收入與支出非線性相關(guān)施肥量與農(nóng)產(chǎn)量完全相關(guān)不完全相關(guān)不相關(guān)正相關(guān)同增同減負(fù)相關(guān)一增一減第10頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月三、相關(guān)分析與回歸分析(一)概念:1.相關(guān)分析就是用一個(gè)指標(biāo)來(lái)表明現(xiàn)象間相互依存關(guān)系的密切程度。廣義的相關(guān)分析包括相關(guān)關(guān)系的分析(狹義的相關(guān)分析)和回歸分析。2.回歸分析是指對(duì)具有相關(guān)關(guān)系的現(xiàn)象,根據(jù)其相關(guān)關(guān)系的具體形態(tài),選擇一個(gè)合適的數(shù)學(xué)模型(稱為回歸方程式),用來(lái)近似地表達(dá)變量間的數(shù)量變化關(guān)系的一種統(tǒng)計(jì)分析方法。第11頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月(二)相關(guān)分析與回歸分析的區(qū)別
1.在相關(guān)分析中,不必確定自變量和因變量;而在回歸分析中,必須事先確定哪個(gè)為自變量,哪個(gè)為因變量,而且只能從自變量去推測(cè)因變量,而不能從因變量去推斷自變量。2.相關(guān)分析不能指出變量間相互關(guān)系的數(shù)量具體形式;而回歸分析能確切的指出變量之間相互關(guān)系的數(shù)量具體形式,它可根據(jù)回歸模型從已知量估計(jì)和預(yù)測(cè)未知量。3.相關(guān)分析所涉及的變量一般都是隨機(jī)變量,而回歸分析中因變量是隨機(jī)的,自變量則作為研究時(shí)給定的非隨機(jī)變量。第12頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月(三)相關(guān)分析與回歸分析的聯(lián)系相關(guān)分析和回歸分析有著密切的聯(lián)系,它們不僅具有共同的研究對(duì)象,而且在具體應(yīng)用時(shí),常常必須互相補(bǔ)充。相關(guān)分析需要依靠回歸分析來(lái)表明現(xiàn)象數(shù)量相關(guān)的具體形式,而回歸分析則需要依靠相關(guān)分析來(lái)表明現(xiàn)象數(shù)量變化的相關(guān)程度。只有當(dāng)變量之間存在著高度相關(guān)時(shí),進(jìn)行回歸分析尋求其相關(guān)的具體形式才有意義。簡(jiǎn)單說(shuō):1、相關(guān)分析是回歸分析的基礎(chǔ)和前提;2、回歸分析是相關(guān)分析的深入和繼續(xù)。第13頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月定性分析是依據(jù)研究者的理論知識(shí)和實(shí)踐經(jīng)驗(yàn),對(duì)客觀現(xiàn)象之間是否存在相關(guān)關(guān)系,以及何種關(guān)系作出判斷。定量分析在定性分析的基礎(chǔ)上,通過(guò)編制相關(guān)表、繪制相關(guān)圖、計(jì)算相關(guān)系數(shù)等方法,來(lái)判斷現(xiàn)象之間相關(guān)的方向、形態(tài)及密切程度。第二節(jié)相關(guān)分析的方法一、相關(guān)關(guān)系的判斷第14頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月相關(guān)表判斷
1.簡(jiǎn)單相關(guān)表:未分組資料(對(duì)自變量數(shù)列有序排列后觀察相應(yīng)的因變量數(shù)值的變化,以判斷是否相關(guān),方向如何?)
2.分組相關(guān)表:(1)單變量分組相關(guān)表(對(duì)自變量分組并計(jì)算次數(shù),對(duì)應(yīng)的因變量不分組,計(jì)算平均值,進(jìn)行比較判斷。)(2)雙變量分組相關(guān)表(對(duì)自變量因變量都進(jìn)行分組后制成的相關(guān)表。注意:自變量放在縱欄,因變量放在橫欄。第15頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月單變量分組相關(guān)表:自變量分組且計(jì)算次數(shù),因變量只計(jì)算平均數(shù)。第16頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月2、雙變量分組相關(guān)表:對(duì)自變量與因變量均進(jìn)行分組。注:自變量X軸;因變量Y軸。
第17頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月(三)利用散點(diǎn)圖判斷
(scatterdiagram)不相關(guān)負(fù)線性相關(guān)正線性相關(guān)非線性相關(guān)完全負(fù)線性相關(guān)完全正線性相關(guān)第18頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月(四)、通過(guò)計(jì)算相關(guān)系數(shù)進(jìn)行判斷這是利用有關(guān)的兩變量的具體數(shù)值,采用一定的方法計(jì)算出能反映變量之間相互關(guān)系的統(tǒng)計(jì)數(shù)字(相關(guān)系數(shù)),以說(shuō)明變量之間相關(guān)的密切程度。常用的有皮爾遜線性相關(guān)系數(shù)。第19頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月二、相關(guān)系數(shù)的計(jì)算1、含義說(shuō)明兩變量之間線性相關(guān)密切程度的統(tǒng)計(jì)分析指標(biāo)。用r表示。絕對(duì)值r界于0與1之間
當(dāng)r<0,表示負(fù)相關(guān);r>0,表示正相關(guān)絕對(duì)值r越接近1,線性相關(guān)越密切絕對(duì)值r越接近0,相關(guān)程度越弱數(shù)值說(shuō)明(一)、皮爾遜線性相關(guān)系數(shù)r第20頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無(wú)線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加第21頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月通常:當(dāng)相關(guān)系數(shù)的絕對(duì)值:小于0.3時(shí),表示不相關(guān)或微弱相關(guān)介于0.3至0.5,表示低度相關(guān)介于0.5至0.8,表示顯著(中度)相關(guān)大于0.8時(shí),表示高度相關(guān)第22頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月2、直線單相關(guān)系數(shù)r的計(jì)算公式(過(guò)程)
(1)計(jì)算自變量數(shù)列的標(biāo)準(zhǔn)差
(2)計(jì)算因變量的標(biāo)準(zhǔn)差
(3)計(jì)算兩者的協(xié)方差
協(xié)方差表示X和Y兩變量相對(duì)與各自均值所造成的共同平均離差
(4)計(jì)算相關(guān)系數(shù)
第23頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月3.相關(guān)系數(shù)的其他公式(1)積差法公式:
(2)積差法簡(jiǎn)化式:
(3)簡(jiǎn)捷公式:
第24頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月第25頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月xy的作用1、顯示x與y之間的相關(guān)方向[正相關(guān)]第26頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月[負(fù)相關(guān)]第27頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月2、顯示x與y之間的相關(guān)程度。第28頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月[負(fù)相關(guān)]第29頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月[不相關(guān)]第30頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月[歸納]xy的作用第一、顯示x與y之間的相關(guān)方向第二、顯示x與y之間的相關(guān)密切程度第31頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月x、y的作用1、使不同變量的協(xié)方差標(biāo)準(zhǔn)化直接對(duì)比。第32頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月試根據(jù)下列資料計(jì)算直線相關(guān)系數(shù):
第33頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月
第34頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月例如:某企業(yè)某種產(chǎn)品產(chǎn)量與單位成本的資料如下:計(jì)算直線相關(guān)系數(shù)產(chǎn)量(千件)單位成本(元/件)273372471373469568理論上可以先通過(guò)定性判斷、畫(huà)散點(diǎn)圖等確定兩個(gè)變量間是否有關(guān)系,在此基礎(chǔ)上可以直接用公式計(jì)算相關(guān)系數(shù)。公式的選擇可以根據(jù)實(shí)際的資料和計(jì)算條件來(lái)確定。注意:在計(jì)算相關(guān)系數(shù)時(shí),無(wú)需確定自變量和因變量,所以x,y的確定是任意的。第35頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月相關(guān)系數(shù)計(jì)算表產(chǎn)量x(千件)單位成本y(元/件)xyx2y2273146453293722169518447128416504137321995329469276164761568340254624合計(jì)2135514817930268r=-0.9091即單位成本與產(chǎn)量間存在著高度的線性負(fù)相關(guān)關(guān)系。第36頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月[解]答:即賬單消費(fèi)額與小費(fèi)之間存在著高度的正線性相關(guān)關(guān)系。第37頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月關(guān)于相關(guān)系數(shù)的解釋
1、相關(guān)并不一定意味著因果關(guān)系。如:一項(xiàng)研究表明,統(tǒng)計(jì)學(xué)教授的薪金與每人的啤酒消費(fèi)量之間有很強(qiáng)的正相關(guān)關(guān)系,但這兩個(gè)變量都受經(jīng)濟(jì)形勢(shì)的影響。(隱藏變量)2、相關(guān)系數(shù)為0,不一定不相關(guān),只能說(shuō)明不存在線性相關(guān)。3、基于平均數(shù)進(jìn)行相關(guān)分析與基于個(gè)體數(shù)據(jù)進(jìn)行相關(guān)分析,其相關(guān)程度不一樣。如:一項(xiàng)研究中,關(guān)于個(gè)人收入和教育的成對(duì)數(shù)據(jù)產(chǎn)生了一個(gè)0.4的線性相關(guān)系數(shù),但當(dāng)使用區(qū)域平均時(shí),線性相關(guān)系數(shù)變?yōu)?.7。4、相關(guān)系數(shù)具有對(duì)稱性。5、相關(guān)系數(shù)數(shù)值大小與X和Y變量的原點(diǎn)及尺度無(wú)關(guān)。第38頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月一些人相信他們的手掌生命線的長(zhǎng)度可以來(lái)預(yù)測(cè)他們的壽命。M.E.Wilson和L.E.Mather在《美國(guó)醫(yī)學(xué)協(xié)會(huì)學(xué)報(bào)上》發(fā)表的一封信中,通過(guò)對(duì)尸體的研究對(duì)此給予了駁斥。死亡時(shí)的年齡與手掌生命線的長(zhǎng)度被一起記錄下來(lái)。作者得出死亡時(shí)的年齡與生命線的長(zhǎng)度不存在顯著相關(guān)的結(jié)論。手相術(shù)失傳了,手也就放下了。看手相:第39頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月4、相關(guān)系數(shù)的顯著性檢驗(yàn)一般情況下,總體相關(guān)系數(shù)是未知的,通常有樣本相關(guān)系數(shù)r作為近似的估計(jì)值。樣本不同,r的值不同,是隨機(jī)變量,能否用r說(shuō)明總體的相關(guān)程度,就需要考察樣本r的可靠程度,也就是進(jìn)行顯著性檢驗(yàn)。如r的抽樣分布服從正態(tài)分布的假設(shè)成立,用正態(tài)分布來(lái)檢驗(yàn)。但對(duì)r抽樣分布的討論可知,這種假設(shè)的風(fēng)險(xiǎn)很大,所以通常對(duì)r用t分布檢驗(yàn),該檢驗(yàn)可用于小樣本也可用大樣本。檢驗(yàn)步驟(1)(2)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量(3)進(jìn)行判斷第40頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月例:下表是有關(guān)15個(gè)地區(qū)某種食物需求量和地區(qū)人口增加量的資料。第41頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月第42頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月相關(guān)系數(shù)的顯著性檢驗(yàn)(實(shí)例)
對(duì)相關(guān)系數(shù)進(jìn)行顯著性檢(0.05)提出假設(shè):H0:;H1:0計(jì)算檢驗(yàn)的統(tǒng)計(jì)量根據(jù)顯著性水平=0.05,查t分布表得
t(n-2)=2.160由于t=48.385>t(15-2)=2.160,拒絕H0,該種食物需求量和地區(qū)人口增加量之間的相關(guān)關(guān)系顯著。第43頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月(三)斯皮爾曼等級(jí)相關(guān)系數(shù)的計(jì)算1.等級(jí)相關(guān)的含義就是把有關(guān)聯(lián)的數(shù)量標(biāo)志或品質(zhì)標(biāo)志的具體表現(xiàn)按等級(jí)次序排列,形成X和Y這兩個(gè)序列,再測(cè)定這兩個(gè)序列之間的相關(guān)程度,得到的相關(guān)系數(shù)即為等級(jí)相關(guān)系數(shù)。常用的有斯皮爾曼相關(guān)系數(shù)、肯特爾相關(guān)系數(shù)等。2.等級(jí)相關(guān)的優(yōu)缺點(diǎn)優(yōu)點(diǎn):簡(jiǎn)單易行、應(yīng)用廣泛,適用于不便精確計(jì)量的標(biāo)志(即定序尺度衡量的現(xiàn)象)缺點(diǎn):精確度稍差于按積差法計(jì)算的相關(guān)系數(shù)
第44頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月3.斯皮爾曼等級(jí)相關(guān)系數(shù)的計(jì)算計(jì)算步驟定等級(jí)依此計(jì)算每對(duì)觀察值相應(yīng)的等級(jí)差D計(jì)算D2代入公式第45頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月例:以下是兩組消費(fèi)者對(duì)十種商品的評(píng)分資料,據(jù)此計(jì)算兩組資料間的等級(jí)相關(guān)系數(shù)編號(hào)甲組評(píng)分乙組評(píng)分183782808438584490805797567273777868687097075108173合計(jì)計(jì)算等級(jí)相關(guān)系數(shù),首先應(yīng)將原數(shù)據(jù)轉(zhuǎn)化為等級(jí),本例中甲組最低分是68分,則可將它的等級(jí)數(shù)定為1,70分的等級(jí)數(shù)就是2,72分的為3,依次類推,如果兩個(gè)數(shù)值相等,則值以平均位置數(shù)代替。第46頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月等級(jí)相關(guān)系數(shù)計(jì)算表編號(hào)甲組評(píng)分乙組評(píng)分等級(jí)x等級(jí)yD2183788642808468.56.253858498.50.254908010795797554.50.256727332.50.257778641036868701109707524.56.2510817372.520.25合計(jì)82.25第47頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月第48頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月第三節(jié)回歸分析的基本問(wèn)題
“回歸”一詞最早源于生物學(xué)。英國(guó)生物學(xué)家高爾頓,根據(jù)1078對(duì)父子身高的散點(diǎn)圖發(fā)現(xiàn),雖然身材高的父母比身材矮的父母傾向有高的孩子。但平均而言,身材高大的其子要矮些,身材矮小的其子要高些。這種遺傳上身高區(qū)域一般,退化到平均的現(xiàn)象,高爾頓稱為回歸。一、回歸分析的含義(一)回歸分析的目的:探求變量間的不確定性數(shù)量關(guān)系。(二)回歸分析的概念及實(shí)質(zhì)
1.回歸分析概念:是對(duì)具有相關(guān)關(guān)系的兩個(gè)或兩個(gè)以上變量之間的數(shù)量變化進(jìn)行數(shù)量測(cè)定,配合一定的模型,以便給出自變量的值對(duì)因變量進(jìn)行估計(jì)或預(yù)測(cè)的一種統(tǒng)計(jì)分析方法。
2.回歸分析的實(shí)質(zhì):是在相關(guān)分析的基礎(chǔ)上,研究現(xiàn)象間的數(shù)量變化規(guī)律。第49頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月二、回歸分析與相關(guān)分析的區(qū)別(1)相關(guān)分析中,變量x變量y處于平等的地位,毋需確定自變量、因變量,而回歸分析必須區(qū)別。變量之間有前后因果關(guān)系時(shí),確定較為容易;變量之間互為因果關(guān)系或沒(méi)有明顯因果關(guān)系時(shí),根據(jù)研究目的確定。(2)相關(guān)分析中所涉及的變量x和y都是隨機(jī)變量;回歸分析中,因變量y是隨機(jī)變量,自變量x則是給定的。(3)相關(guān)分析主要是描述變量之間有無(wú)關(guān)系?密切程度如何?回歸分析則進(jìn)一步揭示變量x對(duì)變量y的影響大小,并可以由回歸方程進(jìn)行預(yù)測(cè)或估計(jì),具有較強(qiáng)的應(yīng)用性.(4)在沒(méi)有明顯因果關(guān)系的兩個(gè)變量x和y中可求得兩個(gè)回歸方程,也就是回歸方程不具有對(duì)等性。而相關(guān)系數(shù)卻只有一個(gè),也就是相關(guān)系數(shù)具有對(duì)等性。(5)在線性回歸方程中,自變量的系數(shù)稱為回歸系數(shù),它相關(guān)相關(guān)系數(shù)同號(hào),也能表明相關(guān)的方向。第50頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月三、回歸分析的內(nèi)容(一)根據(jù)研究目的和變量間的內(nèi)在聯(lián)系,確定自變量和因變量[例]
糧食產(chǎn)量(y)施肥量(x);消費(fèi)支出(y)國(guó)民收入(x);火災(zāi)損失額(y)火災(zāi)發(fā)生地與最近一個(gè)消防站之間的距離(x)。(二)確定回歸分析模型的類型及數(shù)學(xué)表達(dá)式(三)建立模型(解參數(shù))(四)對(duì)回歸分析模型進(jìn)行評(píng)價(jià)(五)預(yù)測(cè)[例]消費(fèi)與收入的回歸方程:y=a+bx=200+0.15x已知x確定y:估計(jì)或預(yù)測(cè)
第51頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月四、回歸模型的種類第52頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月(一)簡(jiǎn)單回歸與多元回歸:根據(jù)變量個(gè)數(shù)劃分
1.簡(jiǎn)單回歸分析模型是指只有一個(gè)自變量和一個(gè)因變量的回歸分析模型;
2.多元回歸分析模型是指多個(gè)自變量與一個(gè)因變量組成的回歸分析模型。(增加了自變量的個(gè)數(shù))(二)線性回歸與非線性回歸:按變量間相互關(guān)系的形態(tài)分
1.線性回歸模型是指變量間的關(guān)系為直線趨勢(shì)的模型形態(tài);
2.非線性回歸模型是指變量間的關(guān)系為曲線趨勢(shì)的模型形態(tài)上述四種情況交叉結(jié)合為簡(jiǎn)單線性回歸和簡(jiǎn)單非線性回歸,多元線性回歸和多元非線性回歸等不同類型第53頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月五、一元(簡(jiǎn)單)線性回歸模型(一)描述因變量Y如何依賴于自變量X和誤差項(xiàng)
的方程稱為回歸模型(二)一元線性回歸模型可表示為
Y=+X+
Y是X的線性函數(shù)部分加上誤差項(xiàng)
線性部分反映了由于X的變化而引起的Y的變化誤差項(xiàng)
是隨機(jī)變量,反映了除X和Y之間的線性關(guān)系之外的隨機(jī)因素對(duì)Y的影響,是不能由X和Y之間的線性關(guān)系所解釋的變異性。由于的值是非固定的,從而使X和Y呈現(xiàn)非確定性關(guān)系
和稱為模型的參數(shù)誤差項(xiàng)是一個(gè)服從正態(tài)分布的隨機(jī)變量,且獨(dú)立.即_N(0,)。第54頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月回歸估計(jì)方程
在回歸模型中,X是自變量,是可控的,Y是隨機(jī)變量,對(duì)上述的一元線性回歸模型兩端取數(shù)學(xué)期望,即得一元線性回歸方程:E(Y)=
+X這一模型表明Y的期望值是X的線性函數(shù)。其中:
和是待定系數(shù),是回歸系數(shù),它表示自變量x每變動(dòng)一個(gè)單位時(shí),因變量Y的平均變動(dòng)值。
由于總體回歸參數(shù)和
是未知的,必需利用樣本數(shù)據(jù)去估計(jì)。得一元回歸估計(jì)方程第55頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月(六)方程的參數(shù)的估計(jì)方法---最小二乘法
要使所擬合的直線最理想,必須使實(shí)際值與估計(jì)值的偏差最小,如果用作圖法和目測(cè)法,很難達(dá)到上述的要求,因此需數(shù)學(xué)的方法,即是離差平方和最小。第56頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月根據(jù)上述的論述,最小平方法滿足的條件是:
和把回歸方程代入對(duì)a、b參數(shù)求導(dǎo)得:第57頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月整理得兩個(gè)方程求得
b回歸系數(shù),反映自變量變動(dòng)一個(gè)單位時(shí)因變量的平均變動(dòng)量。第58頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月如果x和y互為因果關(guān)系,還可求出x依y的回歸方程中的參數(shù)第59頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月(七)回歸分析的應(yīng)用在計(jì)算相關(guān)系數(shù)時(shí),我們?cè)谐隽艘粋€(gè)企業(yè)的產(chǎn)量和單位成本的兩組數(shù)據(jù),通過(guò)計(jì)算,我們得出了這兩個(gè)變量呈現(xiàn)高度負(fù)相關(guān)的結(jié)論。那么進(jìn)一步研究,來(lái)看看它們之間到底呈現(xiàn)怎樣的數(shù)量關(guān)系呢?產(chǎn)量的變動(dòng)對(duì)成本的具體影響又是如何呢?我們可以用最小二乘法來(lái)求解參數(shù),作出判斷和預(yù)測(cè)。第60頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月例3回歸分析計(jì)算表產(chǎn)量x(千件)單位成本y(元/件)xyx2273146437221694712841637321994692761656834025合計(jì)21426148179由于是進(jìn)行回歸分析,所以必須確定自變量和因變量,在無(wú)明顯因果關(guān)系時(shí),理論上可以擬合兩條回歸方程,視要求選擇。而如果變量間有明顯因果關(guān)系時(shí),必須將“因”作為自變量,“果”作為因變量。本例中我們研究產(chǎn)量變動(dòng)對(duì)成本的影響,故以產(chǎn)量為x,成本為y。第61頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月解得:則成本依產(chǎn)量回歸的方程為:yc=77.37-1.82x回歸系數(shù)b=-1.82說(shuō)明當(dāng)產(chǎn)量每增加1千件時(shí),單位成本平均下降1.82元。兩者呈負(fù)相關(guān)。同時(shí),用回歸方程還可以進(jìn)行預(yù)測(cè),例:當(dāng)產(chǎn)量達(dá)到10千件時(shí),單位成本會(huì)降到66.55元。第62頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月[例]為研究用餐消費(fèi)與小費(fèi)支出的關(guān)系,隨機(jī)抽取了10位用餐顧客,得樣本數(shù)據(jù)如下(用EXCEL軟件生成的散點(diǎn)圖)請(qǐng)擬合樣本回歸方程第63頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月解:通過(guò)散點(diǎn)圖可近似看出呈線性關(guān)系,故設(shè)兩者有關(guān)系經(jīng)濟(jì)意義:用餐消費(fèi)每增加100美元,小費(fèi)支出平均增加16.6美元。第64頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月(八)回歸系數(shù)與相關(guān)系數(shù)的關(guān)系第65頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月(1)兩者是同向的;(2)r反映變量的相關(guān)方向與密切程度;
b反映某一變量變動(dòng)一個(gè)單位時(shí)另一變量的平均變動(dòng)b量。第66頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月1.已知變量y依x的直線回歸方程的斜率為b,又知變量y和x之間的相關(guān)系數(shù)是r,那么x變量依y變量的直線回歸方程斜率是多少?2.已知直線回歸方程yc=1.35+4.2x,=6,r=0.9試求第67頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月(九)回歸估計(jì)標(biāo)準(zhǔn)誤差說(shuō)明了回歸直線的擬合程度的指標(biāo)。是對(duì)回歸直線的代表性大小的衡量.實(shí)際觀察值與回歸估計(jì)值離差平方和的均方根。反映實(shí)際觀察值在回歸直線周圍的分散狀況。計(jì)算公式為由樣本資料計(jì)算在統(tǒng)計(jì)學(xué)中,自由度指的是計(jì)算某一統(tǒng)計(jì)量時(shí),取值不受限制的變量個(gè)數(shù)。通常df=n-k。其中n為樣本含量,k為被限制的條件數(shù)或變量個(gè)數(shù),或計(jì)算某一統(tǒng)計(jì)量時(shí)用到其它獨(dú)立統(tǒng)計(jì)量的個(gè)數(shù)。第68頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月計(jì)算例子下表是有關(guān)15個(gè)地區(qū)某種食物需求量和地區(qū)人口增加量的資料。第69頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月3.回歸估計(jì)標(biāo)準(zhǔn)誤的簡(jiǎn)化計(jì)算公式(利用
可推導(dǎo)出上述公式)
第70頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月七、判定系數(shù)(回歸模型擬合程度的評(píng)價(jià))
(一)離差平方和(總變差)的分解因變量y的取值是不同的,y取值的這種波動(dòng)稱為總變差。變差來(lái)源于兩個(gè)方面:由于自變量x的取值不同造成的;除x以外的其他隨機(jī)因素的影響。對(duì)一個(gè)具體的觀測(cè)值來(lái)說(shuō),總變差的大小可以通過(guò)該實(shí)際觀測(cè)值與其均值之差來(lái)表示。判定系數(shù)是從另一角度說(shuō)明回歸直線擬合程度的又一度量值。它的引入是從離差平方和的分解入手的。第71頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月xyy{}}總變差構(gòu)成圖解:第72頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月4、變差的分解
SST=SSR+SSE總平方和(SST){回歸平方和(SSR)殘差平方和(SSE){{從圖中我們可將總變差分解第73頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月(1)總平方和(SST)反映因變量的n個(gè)觀察值與其均值的總離差(2)回歸平方和(SSR)反映由于x與y之間的線性關(guān)系引起的y的取值變化,也稱可解釋的平方和。說(shuō)明自變量x的變化對(duì)因變量y取值變化的影響。(3)殘差平方和(SSE)反映除x以外的其他因素對(duì)y取值的影響,也稱為不可解釋的平方和或剩余平方和。第74頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月(二)判定系數(shù)判定系數(shù):也稱決定系數(shù)或確定系數(shù)。是指回歸變差占總變差的比重是反映回歸直線的擬合優(yōu)度的統(tǒng)計(jì)指標(biāo)。第75頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月在直線相關(guān)中,判定系數(shù)就是相關(guān)系數(shù)的平方.第76頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月[判定系數(shù)的作用]此外,判定系數(shù)就測(cè)量變量之間的相關(guān)關(guān)系而言,具有獨(dú)立的意義。它不僅適用線性相關(guān),也適用非線性相關(guān)。第77頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月4、方差法相關(guān)系數(shù)第78頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月`[例]已知下列資料,試計(jì)算判定系數(shù)與估計(jì)標(biāo)準(zhǔn)誤。第79頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月答:觀察值與回歸值之間的平均離差為0.73,總離差中的88.03%是因?yàn)閤的變動(dòng)所引起的。或者說(shuō)支出數(shù)值的變動(dòng)中,有88.03%是由收入的變動(dòng)所決定的.可見(jiàn)支出和收入之間有較強(qiáng)的相關(guān)關(guān)系.第80頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月已知回歸直線的斜率是0.8,自變量的方差是200,樣本容量是20,那么回歸離差平方和是多少。第81頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月八、回歸方程的統(tǒng)計(jì)檢驗(yàn)
檢驗(yàn)自變量和因變量之間的線性關(guān)系是否顯著具體方法是將回歸離差平方和(SSR)同剩余離差平方和(SSE)加以比較,我們知道對(duì)于一個(gè)具體的實(shí)驗(yàn)來(lái)說(shuō),SST是一個(gè)定值,如果SSR遠(yuǎn)大于SSE,則表明因變量和自變量之間的線性關(guān)系顯著,否則,便認(rèn)為不顯著。F統(tǒng)計(jì)量就是這樣構(gòu)造來(lái)分析二者之間的差別是否顯著如果是顯著的,兩個(gè)變量之間存在線性關(guān)系如果不顯著,兩個(gè)變量之間不存在線性關(guān)系回歸方程的顯著性檢驗(yàn)—F檢驗(yàn)
模型整體擬合效果的顯著性檢驗(yàn)對(duì)于所擬合的回歸模型需要檢驗(yàn)其合理性.檢驗(yàn)的內(nèi)容包括模型整體的擬合效果是否理想,模型的參數(shù)在統(tǒng)計(jì)意義上是否顯著.第82頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月回歸方程的顯著性檢驗(yàn)
(檢驗(yàn)的步驟)提出假設(shè)H0:線性關(guān)系不顯著
H1:線性關(guān)系顯著2.計(jì)算檢驗(yàn)統(tǒng)計(jì)量F確定顯著性水平,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F作出決策:若FF,拒絕H0;若F<F,接受H0第83頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月回歸系數(shù)的顯著性檢驗(yàn)—t檢驗(yàn)
(要點(diǎn))在一元線性回歸中,等價(jià)于回歸方程的顯著性檢驗(yàn)回歸系數(shù)的顯著性檢驗(yàn)是進(jìn)一步檢驗(yàn)自變量x對(duì)因變量y的影響是否顯著。如果總體回歸系數(shù)b=0,總體回歸直線是一條水平線,表明自變量的變化對(duì)因變量沒(méi)有影響,因此回歸系數(shù)的檢驗(yàn)就是檢驗(yàn)回歸系數(shù)b與0之間是否有顯著差異。(具體步驟見(jiàn)書(shū)P190)理論基礎(chǔ)是回歸系數(shù)b
的抽樣分布第84頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月九、因變量的置信區(qū)間估計(jì) p190前曾給出利用回歸方程對(duì)y進(jìn)行估計(jì)或預(yù)測(cè),但回歸方程給出的只是所預(yù)測(cè)的y均值,是y的點(diǎn)估計(jì)值,所以還需求出y的區(qū)間估計(jì)值.概念:在一定的概率保證下對(duì)總體估計(jì)值作出置信區(qū)間估計(jì)。公式:
第85頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月總結(jié):1、相關(guān)系數(shù)的計(jì)算2、簡(jiǎn)單線性回歸模型的建立3、相關(guān)系數(shù)和回歸系數(shù)的關(guān)系4、回歸估計(jì)標(biāo)準(zhǔn)誤的計(jì)算第86頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月第四節(jié)
多元線性回歸模型的建立
一、概念:在線性相關(guān)條件下,兩個(gè)或兩個(gè)以上自變量對(duì)一個(gè)因變量的數(shù)量變化關(guān)系的分析模型。二、多元線性回歸模型表達(dá)式
三、多元線性回歸模型建立(以兩個(gè)自變量為例)第87頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月得方程第88頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月例如增加值y萬(wàn)元新增固定資產(chǎn)(萬(wàn)元)x1職工人數(shù)(百人)x2
54181.162221.270251.4104302.1130362.5160403.0170473.2200504.1合計(jì)95026818.6
第89頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月=4.63=-36.82第90頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月yx1x1x2yx1x2yx2合計(jì)95026818.6709.6362762679.2993851.32第91頁(yè),課件共100頁(yè),創(chuàng)作于2023年2月簡(jiǎn)單相關(guān)系數(shù)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 浙教版數(shù)學(xué)七年級(jí)下冊(cè)2.1《二元一次方程》(第2課時(shí))聽(tīng)評(píng)課記錄
- 五年級(jí)分?jǐn)?shù)乘法口算練習(xí)
- 湘教版數(shù)學(xué)七年級(jí)下冊(cè)2.1.2《冪的乘方與積的乘方》聽(tīng)評(píng)課記錄1
- 蘇教版小學(xué)四年級(jí)上冊(cè)數(shù)學(xué)口算題
- 人教版數(shù)學(xué)九年級(jí)下冊(cè)27.3《位似》聽(tīng)評(píng)課記錄(一)
- 營(yíng)業(yè)場(chǎng)所租賃合同范本
- 核心員工高層管理人員各崗位保密協(xié)議書(shū)范本
- 辦公樓加固改造工程施工合同范本
- 合作開(kāi)店合同范本
- 三人合伙合作協(xié)議書(shū)范本
- 期末 (試題) -2024-2025學(xué)年教科版(廣州)英語(yǔ)四年級(jí)上冊(cè)
- 解讀國(guó)有企業(yè)管理人員處分條例課件
- 湖南省長(zhǎng)沙市一中2024-2025學(xué)年高一生物上學(xué)期期末考試試題含解析
- 碳纖維增強(qiáng)復(fù)合材料在海洋工程中的應(yīng)用情況
- 小孩使用手機(jī)協(xié)議書(shū)范本
- 公司市場(chǎng)分析管理制度
- 焊接材料制造工-國(guó)家職業(yè)標(biāo)準(zhǔn)(2024版)
- 江西省2024年中考數(shù)學(xué)試卷(含答案)
- 榆神礦區(qū)郭家灘煤礦(700 萬(wàn)噸-年)項(xiàng)目環(huán)評(píng)
- 2024年200MW-400MWh電化學(xué)儲(chǔ)能電站設(shè)計(jì)方案
- 余土外運(yùn)施工方案
評(píng)論
0/150
提交評(píng)論