決策與預測課件_第1頁
決策與預測課件_第2頁
決策與預測課件_第3頁
決策與預測課件_第4頁
決策與預測課件_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

決策與預測課件第1頁,課件共54頁,創(chuàng)作于2023年2月一、回歸的由來1889年F.Gallton和他的朋友K.Pearson收集了上千個家庭的身高、臂長和腿長的記錄企圖尋找出兒子們身高與父親們身高之間關(guān)系的具體表現(xiàn)形式下圖是根據(jù)1078個家庭的調(diào)查所作的散點圖(略圖)第2頁,課件共54頁,創(chuàng)作于2023年2月160165170175180185140150160170180190200YX兒子們身高向著平均身高“回歸”,以保持種族的穩(wěn)定第3頁,課件共54頁,創(chuàng)作于2023年2月“回歸”一詞的由來從圖上雖可看出,個子高的父親確有生出個子高的兒子的傾向,同樣地,個子低的父親確有生出個子低的兒子的傾向。得到的具體規(guī)律如下:如此以來,高的越來越高,矮的越來越矮。他百思不得其解,同時又發(fā)現(xiàn)某人種的平均身高是相當穩(wěn)定的。最后得到結(jié)論:兒子們的身高回復于全體男子的平均身高,即“回歸”——見1889年F.Gallton的論文《普用回歸定律》。后人將此種方法普遍用于尋找變量之間的規(guī)律

第4頁,課件共54頁,創(chuàng)作于2023年2月二、回歸的定義回歸是研究自變量與因變量之間的關(guān)系形式的分析方法,其目的在于根據(jù)已知自變量值來估計因變量的總體平均值。在研究某一社會經(jīng)濟現(xiàn)象的發(fā)展變化規(guī)律時,經(jīng)過分析可以找到影響這一現(xiàn)象變化的原因。在回歸分析中,把某一現(xiàn)象稱為因變量,它是預測的對象,把引起這一現(xiàn)象變化的因素稱為自變量,它是引起這一現(xiàn)象變化的原因。而因變量則反映了自變量變化的結(jié)果。第5頁,課件共54頁,創(chuàng)作于2023年2月回歸自變量與因變量之間的因果關(guān)系可以通過函數(shù)形式來表現(xiàn),用數(shù)學模型來體現(xiàn)兩者之間的數(shù)量關(guān)系。自變量的值是確定的,而因變量的值是隨機的?;貧w函數(shù)中,確定的自變量值所對應的是隨機的因變量值的總體平均值。第6頁,課件共54頁,創(chuàng)作于2023年2月三、回歸模型的分類1.按模型中自變量的多少,分為一元回歸模型和多元回歸模型。一元回歸模型是指只包含一個自變量的回歸模型;多元回歸模型是指包含兩個或兩個以上自變量的回歸模型。第7頁,課件共54頁,創(chuàng)作于2023年2月2.按模型中自變量與因變量之間是否線性分為線性回歸模型和非線性回歸模型。線性回歸模型是指自變量與因變量之間呈線性關(guān)系;非線性回歸模型是指自變量與因變量之間呈非線性關(guān)系。第8頁,課件共54頁,創(chuàng)作于2023年2月3.按模型中方程數(shù)目的多少分為單一方程模型和聯(lián)立方程模型。單一方程模型是指只包含一個方程的回歸模型;聯(lián)立方程模型是指包含兩個或兩個以上方程的回歸模型。單一方程的一元線性回歸分析是其它回歸分析的基礎(chǔ),本章將主要介紹一元線性回歸預測法。第9頁,課件共54頁,創(chuàng)作于2023年2月第二節(jié)一元線性回歸預測法一元線性回歸預測法是根據(jù)一元線性回歸模型中單一自變量的變動來預測因變量平均發(fā)展趨勢的方法。第10頁,課件共54頁,創(chuàng)作于2023年2月一、一元線性回歸模型若用X代表自變量,Y代表因變量。則給定一個自變量的值Xi時,對于一元線性回歸模型就有一個因變量的總體平均值E(Yi)與它對應,其函數(shù)關(guān)系可寫成E(Yi)=f(Xi),它表明Y的總體平均值是隨著X的變化而變化的。該函數(shù)亦稱為總體回歸函數(shù)。第11頁,課件共54頁,創(chuàng)作于2023年2月一元線性回歸模型的基本形式為:E(Yi)=β0+1Xi(3-1)

或Yi=E(Yi)+ui=β0+1Xi+ui(3-2)

其中β0、1是未知而固定的參數(shù),稱為回歸系數(shù),ui稱為隨機擾動項。在回歸分析中,我們要根據(jù)Y和X的觀測值來估計未知的β0和1的值,進而建立回歸模型。第12頁,課件共54頁,創(chuàng)作于2023年2月回歸模型通常我們是通過Y和X的樣本觀測值建立樣本回歸函數(shù)來估計參數(shù)的。第13頁,課件共54頁,創(chuàng)作于2023年2月一元線性回歸樣本函數(shù)第14頁,課件共54頁,創(chuàng)作于2023年2月回歸模型對于樣本中每一個與Xi相對的觀測值Yi與由樣本回歸函數(shù)得到的估計值有一隨機偏差,這個偏差稱為樣本剩余,記為ei。

第15頁,課件共54頁,創(chuàng)作于2023年2月樣本回歸函數(shù)第16頁,課件共54頁,創(chuàng)作于2023年2月回歸模型回歸分析就是要根據(jù)樣本回歸函數(shù)來估計總體回歸函數(shù)。在這里需要解決的問題主要有兩個:其一是估計參數(shù);其二是“接近”的程度有多大。第17頁,課件共54頁,創(chuàng)作于2023年2月二、最小二乘估計建立樣本回歸函數(shù)的方法有許多,其中最流行的是最小二乘法(OLS)。1.最小二乘準則2.最小二乘估計式第18頁,課件共54頁,創(chuàng)作于2023年2月1.最小二乘準則.當給定樣本X和Y的N對觀測值時,我們希望據(jù)此建立的樣本回歸函數(shù)值應盡可能接近觀測值Yi,使其樣本剩余的平方和盡可能地小,即ei2min。這一準則就是最小二乘準則。第19頁,課件共54頁,創(chuàng)作于2023年2月Y

Yi

e....

0XiX

第20頁,課件共54頁,創(chuàng)作于2023年2月2.最小二乘估計式根據(jù)最小二乘準則建立樣本回歸函數(shù)的過程為最小二乘估計,簡記OLS估計。由此得到的估計值得計算式稱為最小二乘估計式。第21頁,課件共54頁,創(chuàng)作于2023年2月雙變量線性回歸模型的最小二乘估計第22頁,課件共54頁,創(chuàng)作于2023年2月雙變量線性回歸模型的最小二乘估計由最小二乘準則:ei2min有:第23頁,課件共54頁,創(chuàng)作于2023年2月第24頁,課件共54頁,創(chuàng)作于2023年2月雙變量線性回歸模型的最小二乘估計式第25頁,課件共54頁,創(chuàng)作于2023年2月記X,Y的平均數(shù)則得第26頁,課件共54頁,創(chuàng)作于2023年2月或

記:三、相關(guān)系數(shù)

1.離差平方和的分解在一元線性回歸模型中,觀察值yi的取值大小是上下波動的,這種波動現(xiàn)象稱為變差。變差的產(chǎn)生是由兩方面原因引起的:(1)受自變量變動的影響,即x取值的不同;(2)其他因素(包括觀察和實踐中產(chǎn)生的誤差)影響。為了分析這兩方面的影響,需要對總變差進行分解。第27頁,課件共54頁,創(chuàng)作于2023年2月三、相關(guān)系數(shù)一、總離差平方和分解回歸直線=+X

=回歸直線解釋的部分

Yi=ei

實際與回歸值之殘差Yi

=(Yi)+()越大,ei越小說明回歸直線與樣本點擬合得好。YYiiY?Y

OXiXie?=來自殘差(Yi-Y)=總離差來自回歸第28頁,課件共54頁,創(chuàng)作于2023年2月三、相關(guān)系數(shù)對每一個觀察值來說,變差的大小可以通過該觀察值yi與其算術(shù)平均數(shù)y-的離差yi-y-來表示,而全部n次觀察值的總變差可由這些離差的平方和來表示:即:總變差=剩余變差+回歸變差(可記為TSS=RSS+ESS)等式右邊的第二項Q2稱為回歸變差(或稱回歸平方和),它是通過x與y的線性關(guān)系由自變量x的變動而引起的;等式右邊的第一項Q1稱為剩余變差(或稱殘差平方和),它是由觀察和實驗中產(chǎn)生的誤差以及其他未加控制的因素引起的。第29頁,課件共54頁,創(chuàng)作于2023年2月2.可決系數(shù)R2=ESS/TSS

可決系數(shù)護的大小表明了在Y的總變差中由自變量x變動所引起的百分比,它是評價兩個變量之間線性相關(guān)關(guān)系強弱的一個重要指標。根據(jù)上述定義,有:第30頁,課件共54頁,創(chuàng)作于2023年2月3.相關(guān)系數(shù)R相關(guān)系數(shù)是可決系數(shù)的平方根,它是一元線性回歸模型中用來衡量兩個變量之間相關(guān)程度的重要指標。相關(guān)系數(shù)有兩種定義方法:(1)根據(jù)總變差定義:(2)根據(jù)積差法定義:所以,根據(jù)積差法定義的相關(guān)系數(shù)為第31頁,課件共54頁,創(chuàng)作于2023年2月3.相關(guān)系數(shù)R由于根據(jù)積差法定義的相關(guān)系數(shù)不需要先求回歸模型的剩余變差,可以直接從樣本數(shù)據(jù)中計算得到,所以在實際工作中用得較為廣泛。用積差法計算相關(guān)系數(shù)計算量比較大,因此,根據(jù)平均數(shù)的數(shù)學性質(zhì)可將其簡化為:從上述定義可以看出,相關(guān)系數(shù)的取值范圍為一1≤R≤1,相關(guān)系數(shù)為正值表示兩變量之間為正相關(guān);相關(guān)系數(shù)為負值表示兩變量之間為負相關(guān)。相關(guān)系數(shù)R的絕對值的大小表示相關(guān)程度的高低。①當R=0時,說明回歸變差為0,自變量x的變動對總變差毫無影響,這種情況稱為零相關(guān)。②當∣R∣=1時,說明回歸變差等于總變差,總變差的變化完全由自變量x的變化所引起,這種情況稱為完全相關(guān)。這時自變量x與因變量y的關(guān)系已轉(zhuǎn)化為函數(shù)關(guān)系。③當0<∣R∣<1時,說明自變量x的變動對總變差有部分影響,這種情況稱為普通相關(guān)。其中,R的絕對值愈大,表示相關(guān)程度愈高。一般情況下,當∣R∣≥0.7,即R2≥0.49時,說明自變量x的變動對總變差的影響占一半以上,故稱為高度相關(guān);當∣R∣<0.3,即R2<0.09時,說明自變量x的變動對總變差的影響少于9%,故稱為低度相關(guān);當0.3R2<∣R∣<0.7時,說明自變量x的變動對總變差的影響程度在9%一50%之間,故稱為中度相關(guān)。第32頁,課件共54頁,創(chuàng)作于2023年2月例1:某地區(qū)某企業(yè)近8年產(chǎn)品廣告投入費和月平均銷售額相關(guān)情況如表1所示

表1廣告投入費和月平均銷售額相關(guān)表年份

199719981999200020012002200320041.22.03.13.85.06.17.28.062086080011001150132013501600第33頁,課件共54頁,創(chuàng)作于2023年2月

Iwishyouallhaveahappyeveryday!Blog地址:/用途:重要通知通告;作業(yè)布置;學習交流留言;考試輔導等。第34頁,課件共54頁,創(chuàng)作于2023年2月解:(1)畫散點圖第35頁,課件共54頁,創(chuàng)作于2023年2月(2)計算相關(guān)系數(shù)

年份

199719981999200020012002200320041.223.13.856.17.28620860800110011501320135016001.4449.6114.442537.2151.84643844007396006400001210000132250017424001822500256000074417202480418057508052972012800合計36.48800207.541042140045446第36頁,課件共54頁,創(chuàng)作于2023年2月于是:

(3)計算回歸方程=0.9697128.9599=513.2323一元線性回歸模型為:第37頁,課件共54頁,創(chuàng)作于2023年2月四、顯著性檢驗

建立的一元線性回歸模型,是否符合變量之間的客觀規(guī)律性,兩變量之間是否具有顯著的線性相關(guān)關(guān)系?這就需要對回歸模型進行顯著性檢驗。在一元線性回歸模型中最常用的顯著性檢驗法是相關(guān)系數(shù)檢驗法。相關(guān)系數(shù)是一元線性回歸模型中用來衡量兩個變量之間相關(guān)程度的指標。一般說來,相關(guān)系數(shù)愈大說明兩個變量之間的相關(guān)關(guān)系愈密切。但相關(guān)系數(shù)的絕對值大到什么程度時,才能認為兩變量之間的相關(guān)關(guān)系是顯著的,回歸模型用來預測是有意義的?對于不同組數(shù)的觀察值,不同數(shù)值的顯著性水平,衡量的標準是不同的。這一數(shù)量界線的確定只有根據(jù)具體的條件和要求,通過相關(guān)系數(shù)檢驗法的檢驗才能加以判別。相關(guān)系數(shù)檢驗法的步驟如下:第一步,按公式(3一10)、(3一11)或(3一12)計算相關(guān)系數(shù)R;第二步,根據(jù)回歸模型的自由度(n-2)和給定的顯著性水平a值,從相關(guān)系數(shù)臨界值表中查出臨界值Ra(n一2);第三步,判別。若|R|≥Ra(n一2)

,表明兩變量之間線性相關(guān)關(guān)系顯著,檢驗通過,這時回歸模型可以用來預測;若|R|<Ra(n一2),表明兩變量之間線性相關(guān)關(guān)系不顯著,檢驗通不過,這時的回歸模型就不能用來預測,應分析其原因,對回歸模型重新加以處理。第38頁,課件共54頁,創(chuàng)作于2023年2月五、預測區(qū)間1、點預測對于自變量:的一個給定值x。,對應回歸模型的點估計值為:。2、預測區(qū)間就是指在一定的顯著性水平上,依據(jù)數(shù)理統(tǒng)計方法計算出的包含預測目標未來真實值的某一區(qū)間范圍。第39頁,課件共54頁,創(chuàng)作于2023年2月區(qū)間預測公式≤≤第40頁,課件共54頁,創(chuàng)作于2023年2月其中:代表估計標準誤差(也稱剩余標準差)??傋儾?剩余變差+回歸變差計標準誤差公式:實際計算時可用其簡捷式:第41頁,課件共54頁,創(chuàng)作于2023年2月六、應用舉例

某省1978-1989年國內(nèi)生產(chǎn)總值和固定資產(chǎn)投資完成額資料如3一1表:表3-1一元線性回歸模型計算表單位:億元年份國內(nèi)生產(chǎn)總值Y固定資產(chǎn)投資完成額xxYx2Y219781952039004003802519792102042004004410019802442663446765953619812643592401225696961982294521528827048643619833145617584313698596198436081291606561129600198543213156592171611866241986481149716692220123136119875671639242126569321489198865523215196053824429025198970420214220840804495616合計472011676005661756612190104第42頁,課件共54頁,創(chuàng)作于2023年2月六、應用舉例試配合適當?shù)幕貧w模型并進行顯著性檢驗;若1990年該省固定資產(chǎn)投資完成額為249億元,當顯著性水平α=0.05時,試估計1990年國內(nèi)生產(chǎn)總值的預測區(qū)間:解:1.繪制散點圖設國內(nèi)生產(chǎn)總值為y,固定資產(chǎn)投資完成額為x,繪制散點圖(圖略),由散點圖形看出兩者為線性關(guān)系,可以配合一元線形回歸模型。2.建立一元線形回歸模型y∧=a+bx

回歸模型y∧=171.9243+2.2767x第43頁,課件共54頁,創(chuàng)作于2023年2月3、計算回歸系數(shù)和顯著性檢驗計算回歸系數(shù):

當顯著性水平a=0.05,自由度=n-2=12-2=10時,查相關(guān)系數(shù)臨界值表,得Ro.o5(10)=0.567,因R=0.9829>0.576=Ro.o5(10)故在a=0.05顯著性水平上,檢驗通過,說明兩變量之間相關(guān)關(guān)系顯著。第44頁,課件共54頁,創(chuàng)作于2023年2月5.預測(1)計算估計標準誤差。(2)當顯著性水平a=0.05,自由度二n-2=10時,查t分布表得:t0.025(10)=2.228。(3)當xo=249億元時,代人回歸模型得y的點估計值為:y。=171.9243+2.2767x249=738.8226(億元)預測區(qū)間為:即:當1990年全省固定資產(chǎn)投資完成額為249億元時,在a=0.05的顯著性水平上,國內(nèi)生產(chǎn)總值的預測區(qū)間為:648.4708~829.1744億元之間。第45頁,課件共54頁,創(chuàng)作于2023年2月課堂練習已知1984年的收入為213億元,試預測1984年的消費支出額。已知sy=0.9117,a=0.5.年個人收入x消費支出yXyx2y2y∧Y-y∧1974645635844096313655.30.7…………………………………………1983189155292953572124025154.40.6∑111492911655714058296669第46頁,課件共54頁,創(chuàng)作于2023年2月答案提示回歸方程:y^=4.593+0.7927xR=0.9997S=0.9117Ta/2=2.306預測區(qū)間為[170.5,176.3]第47頁,課件共54頁,創(chuàng)作于2023年2月第三節(jié)非線性回歸預測法一、非線性回歸模型的概念及其分類非線性回歸模型,是指用于經(jīng)濟預測的模型是曲線型的。常見的非線性回歸模型有下列幾種:(1)雙曲線模型:第48頁,課件共54頁,創(chuàng)作于2023年2月第三節(jié)非線性回歸預測法根據(jù)非線性回歸模型線性化的不同性質(zhì),上述模型一般可細分成三種類型。第一類:直接換元型。這類非線性回歸模型通過簡單的變量換元可直接化為線性回歸模型,如:(3一59)、(3一60)、(3-61)、(3-62)式。由于這類模型的因變量沒有變形,所以可以直接采用最小平方法估計回歸系數(shù)并進行檢驗和預測。第二類:間接代換型。這類非線性回歸模型經(jīng)常通過對數(shù)變形的代換間接地化為線性回歸模型,如:(3一63)、(3一64)、(3一65)式。由于這類模型在對數(shù)變形代換過程中改變了因變量的形態(tài),使得變形后模型的最小平方估計失去了原模型的殘差平方和為最小的意義,從而估計不到原模型的最佳回歸系數(shù),造成回歸模型與原數(shù)列之間的較大偏差。第三類:非線性型。這類非線性回歸模型屬于不可線性化的非線性回歸模型。第一類和第二類非線性回歸模型相對于第三類,又稱為可線性化的非線性回歸模型。本節(jié)重點研究第一類和第二類即可線性化的非線性回歸模型。第49頁,課件共54頁,創(chuàng)作于2023年2月二、可線性化的非線性回歸模型直接換元法例設某商店1981-1990年的商品流通費用率和商品零售額資料如下表:年份商品流通費用率%商品零售額(萬元)YixiXi︳=1/xix'iYix'i2Yi219811982198319841985198619871988198919907.06.25.85.35.04.64.54.44.24.010.211.713.015.016.519.022.025.028.532.00.09800.08550.07690.06670.06060.05

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論