金融數(shù)據(jù)統(tǒng)計分析 課件 項目七 相關(guān)與回歸分析-68P_第1頁
金融數(shù)據(jù)統(tǒng)計分析 課件 項目七 相關(guān)與回歸分析-68P_第2頁
金融數(shù)據(jù)統(tǒng)計分析 課件 項目七 相關(guān)與回歸分析-68P_第3頁
金融數(shù)據(jù)統(tǒng)計分析 課件 項目七 相關(guān)與回歸分析-68P_第4頁
金融數(shù)據(jù)統(tǒng)計分析 課件 項目七 相關(guān)與回歸分析-68P_第5頁
已閱讀5頁,還剩63頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

金融數(shù)據(jù)統(tǒng)計分析項目七相關(guān)與回歸分析01學(xué)習(xí)目標目錄CONTENT一知識目標(1)了解金融數(shù)據(jù)分析中相關(guān)關(guān)系和回歸分析的基本概念、目的以及流程。(2)掌握相關(guān)分析中相關(guān)系數(shù)的計算與意義。(3)明確相關(guān)分析與回歸分析的區(qū)別與聯(lián)系(4)掌握回歸分析的基本理論與方法(5)掌握一元線性回歸方程的求解與應(yīng)用。(6)了解多元線性回歸方程的構(gòu)建原理和分析方法。二能力目標(1)能夠表述金融數(shù)據(jù)分析中相關(guān)關(guān)系的一般流程,能夠區(qū)分相關(guān)系數(shù)來辨別變量間的相關(guān)關(guān)系程度。(2)能夠區(qū)分相關(guān)關(guān)系和回歸關(guān)系的原理與意義。(3)能夠建立一元線性回歸模型,通過模型結(jié)果進行數(shù)據(jù)分析。(4)能夠明確構(gòu)建多元線性回歸模型的條件和適用范圍。三思政素養(yǎng)目標(1)培養(yǎng)學(xué)生團結(jié)協(xié)作、集思廣益的團隊精神。(2)引導(dǎo)學(xué)生從數(shù)據(jù)之間的關(guān)系,發(fā)現(xiàn)其中隱含的意義,培養(yǎng)學(xué)生自我探索、思考的創(chuàng)新精神。02案例導(dǎo)讀目錄CONTENT如何采集2020年的宏觀經(jīng)濟指標?案例導(dǎo)入

2020年全球經(jīng)濟遭遇了嚴重沖擊,尤其是二季度多國GDP跌幅創(chuàng)下歷史記錄。在全球經(jīng)濟形勢嚴峻的背景下,想要了解我國的經(jīng)濟發(fā)展形勢,需要知道以下指標數(shù)據(jù):(1)國內(nèi)生產(chǎn)總值(GDP)及第一、第二、第三產(chǎn)業(yè)的生產(chǎn)總值;(2)全社會固定資產(chǎn)投資額、社會消費品零售總額、進出口總額(包括出口和進口);(3)居民人均消費支出、居民消費價格指數(shù)、工業(yè)生產(chǎn)者出廠價格指數(shù),工業(yè)生產(chǎn)者購進價格指數(shù);(4)財政收入和支出、城鎮(zhèn)登記失業(yè)率、居民人均可支配收入;(5)廣義貨幣M2供應(yīng)量、狹義貨幣M1供應(yīng)量、流通中的貨幣M0供應(yīng)量、社會融資規(guī)模、金融機構(gòu)本外幣貸款余額、貸款市場報價利率(LPR)。在教材案例中,寶麗來公司的科學(xué)家們描繪出了膠卷保存時間與感光速率變動之間的關(guān)系,并建立起回歸方程來說明兩變量之間的相關(guān)關(guān)系。那么如何描繪兩變量之間的關(guān)系,依據(jù)什么來建立回歸方程進行測度呢?03新課教學(xué)目錄CONTENT一、相關(guān)的意義和種類二、簡單線性相關(guān)分析三、回歸分析任務(wù)一相關(guān)的意義和種類客觀現(xiàn)象之間確實存在的數(shù)量上的依存關(guān)系稱為相關(guān)關(guān)系。現(xiàn)象之間相關(guān)關(guān)系密切程度的研究則稱為相關(guān)分析。一、相關(guān)的意義客觀現(xiàn)象之間的數(shù)量依存關(guān)系可以區(qū)分為兩種不同的類型:函數(shù)關(guān)系和相關(guān)關(guān)系。一、相關(guān)的意義(一)函數(shù)關(guān)系二一假設(shè)有兩個變量x和y,函數(shù)關(guān)系就是指這兩個變量一一對應(yīng)的關(guān)系,即一個變量的數(shù)值完全由另外一個變量的數(shù)值所決定。函數(shù)關(guān)系指現(xiàn)象之間在數(shù)量上存在著嚴格的、確定性的依存關(guān)系。

商品的銷售額與銷售量之間的關(guān)系圓面積與圓半徑的關(guān)系相關(guān)關(guān)系是指變量之間存在一種不確定的數(shù)量關(guān)系,即一個變量發(fā)生變另一個變量也會發(fā)生變化,但具體變化的數(shù)量不是確定的,只是在一定的范圍內(nèi)而已。日活中,相關(guān)關(guān)系是非常普遍的:如父母身高與子女身高的關(guān)系商品消費量與居民收入的關(guān)系一、相關(guān)的意義(二)相關(guān)關(guān)系一、相關(guān)的意義二一

一、相關(guān)的意義理解相關(guān)關(guān)系要把握兩個要點(1)相關(guān)關(guān)系是指現(xiàn)象之間確實存在數(shù)量上的相互依存關(guān)系。(2)現(xiàn)象之間數(shù)量依存關(guān)系的具體關(guān)系值是不固定的。例如,勞動生產(chǎn)率提高,相應(yīng)地會使成本降低、利潤增加等。例如,生育率與人均GDP之間就屬于典型的相關(guān)關(guān)系,人均GDP高的國家生育率往往較低,但二者沒有唯一確定的關(guān)系,這是因為除了經(jīng)濟因素外,生育率還受教育水平、城市化水平以及不易測量的民族風(fēng)俗、宗教和其他隨機因素的共同影響。區(qū)別聯(lián)系函數(shù)關(guān)系反映確定性的數(shù)量關(guān)系,而相關(guān)關(guān)系表明的是非確定性的數(shù)量關(guān)系。函數(shù)關(guān)系是相關(guān)關(guān)系的特例。相關(guān)關(guān)系是相關(guān)分析的研究對象,而函數(shù)關(guān)系是相關(guān)分析的工具。一、相關(guān)的意義按相關(guān)的密切程度不同劃分兩種現(xiàn)象中一種現(xiàn)象的數(shù)量變化隨另一現(xiàn)象的數(shù)量變化而確定,這兩種現(xiàn)象之間的依存關(guān)系就稱為完全相關(guān)。兩種現(xiàn)象之間的關(guān)系介于完全相關(guān)和不相關(guān)之間,稱為不完全相關(guān)。兩種現(xiàn)象的數(shù)量表現(xiàn)各自獨立、互不影響,稱為不相關(guān)。完全相關(guān)不完全相關(guān)不相關(guān)

企業(yè)生產(chǎn)成本和工人年齡之間、證券市場上股票的價格和降雨量之間一般是不相關(guān)的。二、相關(guān)的種類(一)按相關(guān)的密切程度不同劃分二、相關(guān)的種類(二)按相關(guān)的表現(xiàn)形態(tài)不同劃分1.直線相關(guān)相關(guān)關(guān)系是一種數(shù)量上不嚴格的相互依存關(guān)系,如果這種關(guān)系近似地表現(xiàn)為一條直線,則稱為直線相關(guān),也稱線性相關(guān)。直線正相關(guān)直線負相關(guān)二、相關(guān)的種類2.曲線相關(guān)如果相關(guān)關(guān)系近似地表現(xiàn)為一條曲線,則稱為曲線相關(guān),也稱非線性相關(guān),如圖所示。曲線相關(guān)又分為不同的種類,如拋物線、指數(shù)曲線和雙曲線等。曲線相關(guān)(三)按直線相關(guān)的方向不同劃分按直線相關(guān)的方向不同劃分正相關(guān)負相關(guān)例如,施肥量增加,畝產(chǎn)量也隨之增加;居民的收入增加,購買力也隨之增加。例如,產(chǎn)量越高,生產(chǎn)成本就越低;商品價格越低,銷售量就越高。若自變量x的數(shù)值增加,因變量y的數(shù)值也相應(yīng)地增加,則稱為正相關(guān)。若自變量x的數(shù)值增加(減少),因變量y的數(shù)值相應(yīng)減少(增加),則稱為負相關(guān)。二、相關(guān)的種類二、相關(guān)的種類1.單相關(guān):只涉及兩個現(xiàn)象(變量)之間的相關(guān)稱為單相關(guān),也稱簡單相關(guān)或一元相關(guān),即研究時只涉及一個自變量和一個因變量。2.多元相關(guān):涉及三個或三個以上現(xiàn)象(變量)之間的相關(guān)稱為多元相關(guān),即一個現(xiàn)象的數(shù)量變化是由其他兩個或兩個以上現(xiàn)象的數(shù)量變化的協(xié)同作用引起的。在多元相關(guān)中,若研究某一變量與其余全部變量之間的總相關(guān)程度,稱為復(fù)相關(guān);若研究其中兩個變量的相關(guān)程度并假定其余變量是固定的,則稱為偏相關(guān)。(四)按相關(guān)的影響因素多少劃分三、相關(guān)分析的主要內(nèi)容(一)(二)(三)(四)確定現(xiàn)象間有無關(guān)系及其表現(xiàn)形式。確定相關(guān)關(guān)系的密切程度。選擇合適的數(shù)學(xué)模型。測定因變量估計值的準確程度。(五)進行顯著性檢驗。任務(wù)二簡單線性相關(guān)分析①利用相關(guān)表、相關(guān)圖判斷相關(guān)關(guān)系的有無。②計算相關(guān)系數(shù)確定關(guān)系的密切程度。進行簡單線性相關(guān)分析需要分為兩個步驟:一、相關(guān)表和相關(guān)圖相關(guān)表就是根據(jù)所掌握的有關(guān)變量一定數(shù)量的原始對應(yīng)資料編制的統(tǒng)計表,該表可以直觀地表明因變量和自變量的關(guān)系。根據(jù)給定資料是否分組,相關(guān)表分為簡單相關(guān)表和分組相關(guān)表兩種。(一)相關(guān)表1.簡單相關(guān)表確定自變量和因變量;其次,將兩個變量的變量值一一對應(yīng)按自變量的變量值從小到大順序排列。簡單相關(guān)表是指利用未分組的原始資料,將兩個變量的值一一對應(yīng)地填列在同一張表格上而形成的相關(guān)表。其編制程序是:一、相關(guān)表和相關(guān)圖例如,為了研究固定資產(chǎn)和工業(yè)產(chǎn)值的關(guān)系,通過調(diào)查資料可編制相關(guān)表(為方便只列舉10個企業(yè)有關(guān)的原始對應(yīng)資料),見表7-1。表7-1 10個企業(yè)固定資產(chǎn)和工業(yè)產(chǎn)值資料(單位:十萬元)企業(yè)編號固定資產(chǎn)工業(yè)產(chǎn)值1204023055340704509057010068011071001258110140912014010130160從表7-1中可看出,隨著固定資產(chǎn)的提高,工業(yè)產(chǎn)值有相應(yīng)增加的趨勢,盡管存在不同固定資產(chǎn)對應(yīng)的工業(yè)產(chǎn)值表現(xiàn)相同的情況,但是兩者之間仍然存在一定的依存關(guān)系。簡單相關(guān)表簡單相關(guān)表僅在總體單位數(shù)比較少的情況下適用。如果總體單位數(shù)比較多,則編制的簡單相關(guān)表會很長,使用起來不方便,在這種情況下應(yīng)編制分組相關(guān)表。一、相關(guān)表和相關(guān)圖一、相關(guān)表和相關(guān)圖2.分組相關(guān)表分組相關(guān)表就是將原始資料進行分組而編制的相關(guān)表。根據(jù)分組的情況不同,分組相關(guān)表又分為以下兩種:(1)單變量分組表。它是將自變量分組并計算頻數(shù),而對應(yīng)的因變量不分組,只計算其平均值。其編制程序是:將自變量分為若干組(資料情況可以是單項式,也可以是組距式)計算各組頻數(shù)計算各組對應(yīng)的因變量的平均值一、相關(guān)表和相關(guān)圖例如,200個女大學(xué)生身高和體重相關(guān)表見表7-2。表7-2 200個女大學(xué)生身高和體重相關(guān)表體重(千克)學(xué)生數(shù)(人)平均身高(厘米)45以下115145~47.51215447.5~504615550~52.56515852.5~554316055~57.51916257.5~601116360~62.5216762.5及以上1170合計200—這種單變量分組表是實際工作中使用最多的一種,它能使資料簡化,更直接、更清晰地反映出兩變量之間的相關(guān)關(guān)系。一、相關(guān)表和相關(guān)圖(2)雙變量分組表。它是將自變量和因變量都進行分組而制成的相關(guān)表。這種表的形狀如同盤,故又稱棋盤式表。其編制程序是:分別對自變量和因變量進行分組按兩個變量的組數(shù)設(shè)計表格計算各組頻數(shù),并將其填入表格相應(yīng)的位置一、相關(guān)表和相關(guān)圖例如,根據(jù)表7-2資料編制的雙變量分組表見表7-3。表7-3 200個女大學(xué)生身高和體重相關(guān)表體重(千克)身高(厘米)學(xué)生數(shù)(人)150~154154~158158~162162~166166~170合計

1160~62.5

2257.5~60

13341155~57.5

8741952.5~55

1410141224350~52.5121221236

6547.5~50

21514105

4645~47.51

6

5

12

1

1合計263746633313200相關(guān)圖又稱散點圖,是將相關(guān)表中的原始對應(yīng)數(shù)值在平面直角坐標系用坐標點描繪出來。以橫軸代表自變量,縱軸代表因變量,在坐標系中將相關(guān)表中兩個變量的對應(yīng)數(shù)值畫出坐標點,每個坐標點在這里稱為相關(guān)點,所有相關(guān)點組成的圖形就叫相關(guān)圖或散點圖。一、相關(guān)表和相關(guān)圖(二)相關(guān)圖一、相關(guān)表和相關(guān)圖通過相關(guān)圖中所有點的分布情況,可以直觀地、大致地看出兩個現(xiàn)象間相關(guān)的形態(tài)和方向。例如,根據(jù)表7-1中的資料繪制的相關(guān)圖如圖7-5所示。從圖7-5中可以看出,工業(yè)產(chǎn)值隨著固定資產(chǎn)的增加而增加,并且散點圖的分布近似地表現(xiàn)為一條直線由此可判決固定資產(chǎn)與工業(yè)產(chǎn)值兩個變量之間存在著直線正相關(guān)關(guān)系。二、相關(guān)系數(shù)(一)相關(guān)系數(shù)的意義根據(jù)相關(guān)表和相關(guān)圖可以直觀判斷兩個現(xiàn)象是否相關(guān)及相關(guān)的形態(tài),但不能準確判斷相關(guān)的密切程度,因此還需運用數(shù)學(xué)解析方法,構(gòu)建一個恰當?shù)臄?shù)學(xué)模型來顯示現(xiàn)象之間相關(guān)關(guān)系及其密切程度。相關(guān)分析首先需要判斷變量之間是否存在相關(guān)關(guān)系,如果存在,還需要分析相關(guān)關(guān)系的形態(tài)、方向和程度。解決這些問題,最常使用的就是散點圖和相關(guān)系數(shù)這兩種工具。二、相關(guān)系數(shù)(二)相關(guān)系數(shù)的計算積差法

二、相關(guān)系數(shù)(三)相關(guān)系數(shù)的性質(zhì)實際上,并不是只能通過散點圖才能發(fā)現(xiàn)變量之間的相關(guān)關(guān)系,通過相關(guān)系數(shù)的取值,更能準確說明相關(guān)關(guān)系的具體情況。(1)計算相關(guān)系數(shù)時,不需要區(qū)分自變量和因變量,兩變量是對等關(guān)系。(2)相關(guān)系數(shù)的數(shù)值范圍在-1和+1之間,即-1≤r≤1。(3)相關(guān)系數(shù)有正負號,分別表示正相關(guān)和負相關(guān)。二、相關(guān)系數(shù)(4)相關(guān)系數(shù)的值越接近于-1或+1(即絕對值越接近于1),表示相關(guān)關(guān)系越強;越接近于0,表示相關(guān)關(guān)系越弱。若相關(guān)系數(shù)等于±1,則表示兩個變量完全相關(guān);若相關(guān)系數(shù)等0,則表示兩個變量之間不存在線性相關(guān)關(guān)系(但并不意味著不存在非線性關(guān)系)。

二、相關(guān)系數(shù)需要指出的是,有時兩變量之間并不存在相關(guān)關(guān)系,但卻可能出現(xiàn)較高的相關(guān)系數(shù),這就是虛假相關(guān),導(dǎo)致這種現(xiàn)象發(fā)生的原因往往是存在另一個共同影響兩變量的因素,如果利用該結(jié)果就會得出錯誤的結(jié)論。圖7-6相關(guān)系數(shù)的取值范圍任務(wù)三回歸分析一、回歸分析的概念和特點(一)回歸分析的概念回歸分析就是對具有相關(guān)關(guān)系的兩個或兩個以上的變量之間數(shù)量變化的一般關(guān)系進行測定,確定一個相應(yīng)的數(shù)學(xué)表達式,以便進行估計或預(yù)測的統(tǒng)計方法。其所建立的數(shù)學(xué)表達式稱為回歸方程,而代表現(xiàn)象之間一般數(shù)量關(guān)系的直線或曲線稱為回歸直線或回歸曲線。一、回歸分析的概念和特點(二)回歸分析的特點(1)在相關(guān)分析中,各變量之間是對等關(guān)系;而回歸分析是通過建立回歸方程來反映變量之間數(shù)值的變化關(guān)系,必須區(qū)分哪個是自變量,哪個是因變量。(2)在兩個變量互為根據(jù)的情況下,回歸分析需要建立兩個不同的回歸方程,一個是以x為自變量,y為因變量的“y依x的回歸方程”;另一個是以y為自變量,x為因變量的“x依y的回歸方程”。當然,如果兩個變量是單向因果關(guān)系,則回歸分析就只能建立一個回歸方程。一、回歸分析的概念和特點(二)回歸分析的特點(3)在相關(guān)分析中,各變量都是隨機變量;而回歸分析中,因變量是隨機變量,自變量不是隨機變量,而是一系列給定的值。(4)利用回歸方程,可以根據(jù)自變量的數(shù)值估計和預(yù)測因變量的可能值,一個回歸方程對同一自變量數(shù)值只能做一次推算。一、回歸分析的概念和特點按不同的標準分類從變量間回歸關(guān)系的表現(xiàn)形式看線性回歸分析非線性回歸分析按回歸分析所涉及的自變量的多少一元回歸分析多元回歸分析把兩者結(jié)合起來一元線性回歸分析多元線性回歸分析二、一元線性回歸分析(一)構(gòu)建回歸方程應(yīng)具備的條件現(xiàn)象間確實存在著相互依存關(guān)系010203具備條件現(xiàn)象間存在著直線相關(guān)關(guān)系具備一定數(shù)量的變量觀測值二、一元線性回歸分析(二)一元線性回歸模型

二、一元線性回歸分析

二、一元線性回歸分析

二、一元線性回歸分析(三)最小二乘估計最小二乘估計是指采用最小二乘法使因變量x的觀察值與估計值之間的離差平方和達到最小,以此來求得參數(shù)a和b的方法。

二、一元線性回歸分析下圖所示即為最小二乘法的計算示意,即散點圖中的點與該直線之間的距離的平方和,小于散點圖中的點與任何其他擬合直線之間距離的平方和。

建立回歸方程后,只能通過給定的自變量的值來計算因變量的估計值,而不能反過來計算。對由樣本數(shù)據(jù)求出的回歸方程,應(yīng)進行一系列的統(tǒng)計檢驗,以檢查方程對資料的擬合是否有效,是否顯著。(1)(4)(2)(3)

回歸系數(shù)b的值有正負號,正回歸系數(shù)表示兩個變量為正相關(guān)關(guān)系,在圖形上表現(xiàn)為一條上升直線;負回歸系數(shù)表示負相關(guān),在圖形上表現(xiàn)為一條下降直線。二、一元線性回歸分析(四)建立回歸方程的相關(guān)注意事項二、一元線性回歸分析(五)一元線性回歸檢驗1.擬合優(yōu)度檢驗如果觀測點越靠近直線,則說明回歸直線對數(shù)據(jù)的擬合度越好;如果觀測點越遠離直線,則說明回歸直線對數(shù)據(jù)的擬合度越差?;貧w直線與各觀測點的接近程度稱為回歸直線對數(shù)據(jù)的擬合優(yōu)度。

二、一元線性回歸分析(1)判定系數(shù)估計標準誤差

二、一元線性回歸分析(2)估計標準誤差二、一元線性回歸分析2.顯著性檢驗一元線性回歸方程的顯著性檢驗包括回歸方程的F檢驗和回歸系數(shù)的t檢驗。(1)F檢驗(2)t檢驗F檢驗是通過構(gòu)建F統(tǒng)計量,檢驗自變量x和因變量y之間的線性關(guān)系是否顯著,通過了F檢驗則表明變量之間的線性關(guān)系顯著。t檢驗是通過構(gòu)建t統(tǒng)計量,檢驗自變量x和因變量y的影響是否顯著,通過了t檢驗則表明自變量x對因變量y的影響顯著,就可以用自變量x來解釋因變量y的變化。這里可以利用Excel的數(shù)據(jù)分析功能,直接對比顯著性水平α來判斷因變量與自變量的關(guān)系。三、多元線性回歸分析與檢驗(一)多元線性回歸模型多元線性回歸模型可表示如下:

三、多元線性回歸分析與檢驗(二)多元線性回歸方程一元線性回歸方程只反映一個因變量受一個自變量影響的情況,現(xiàn)實中往往一個因變量會受多個自變量的影響。糧食畝產(chǎn)量會受播種量、降雨量以及施肥量等因素的影響。產(chǎn)品的利潤會受產(chǎn)品銷售額、產(chǎn)品成本等因素的影響。因此應(yīng)將影響因變量的多個因素綜合起來進行分析,建立一個更符合實際的模型,來揭示現(xiàn)象內(nèi)在的規(guī)律。多元線性回歸分析三、多元線性回歸分析與檢驗

三、多元線性回歸分析與檢驗二元線性回歸方程是最典型的多元線性回歸方程。

三、多元線性回歸分析與檢驗(三)擬合優(yōu)度檢驗

三、多元線性回歸分析與檢驗2.估計標準誤差

三、多元線性回歸分析與檢驗3.顯著性檢驗多元

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論