概率論與數(shù)理統(tǒng)計_第1頁
概率論與數(shù)理統(tǒng)計_第2頁
概率論與數(shù)理統(tǒng)計_第3頁
概率論與數(shù)理統(tǒng)計_第4頁
概率論與數(shù)理統(tǒng)計_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第十一章回歸分析§11.1回歸概念§11.2一元線性回歸方程§11.3可線性化的回歸方程概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第1頁!1.理解變量間的相關(guān)關(guān)系以及回歸分析的主要任務(wù)2.會用最小二乘法建立回歸直線方程一元線性回歸方程的建立回歸直線方程的有效性檢驗教學要求重點概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第2頁!

回歸分析的任務(wù)是:根據(jù)試驗數(shù)據(jù)取估計回歸函數(shù),討論有關(guān)的點估計、區(qū)間估計、假設(shè)檢驗等問題。特別重要的是對隨機變量Y的觀察值做出點預測和區(qū)間預測。概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第3頁!確定性關(guān)系是指變量之間的關(guān)系可以用函數(shù)關(guān)系來表達的;§11.1回歸概念自然界和生產(chǎn)實踐中的許多現(xiàn)象之間存在著相互依賴、相互制約的關(guān)系。一、現(xiàn)象二、關(guān)系非確定性關(guān)系即所謂相關(guān)關(guān)系?;貧w分析是研究相關(guān)關(guān)系的一種數(shù)學工具。它能幫助我們從一個變量取得的值去估計另一個變量所取得值。概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第4頁!

例1居民按人口計算的平均收入與某種商品(如糖果)的消費量之間,有著一定的聯(lián)系。一般說來平均收入高的,消費量大,但平均收入相同時,這種商品的消費量卻不一定是完全相同的。例2森林中的同一種樹木,其斷面直徑與高度之間是有聯(lián)系的。一般說來,較粗的樹較高,但直徑相同的樹,其高度也不完全是相同的。

概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第5頁!如果這個模型是線性的就稱為線性回歸分析。這種方法是處理變量間相關(guān)關(guān)系的有力工具,是數(shù)理統(tǒng)計中一種常用的方法。它不僅告訴人們怎樣建立變量間的數(shù)學表達式,即經(jīng)驗公式,而且還利用概率統(tǒng)計知識進行分析討論,判斷出所建立的經(jīng)驗公式的有效性,從而可以進行預測或估計。這在實際中是很有用的。本章主要介紹如何建立經(jīng)驗公式,以及建立的經(jīng)驗公式其有效性的判斷。由一個或一組非隨機變量來估計或預測某一個隨機變量的觀察值時,所建立的數(shù)學模型及所進行的統(tǒng)計分析,稱為回歸分析。概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第6頁!我們對普通變量x取定一組不完全相同的值:分別是在處對Y的獨立觀察結(jié)果稱是一個樣本,對應的樣本值記為如何利用樣本來估計Y關(guān)于x的回歸函數(shù)首先需要推測f(x)的形式,可將每對觀察值在直角坐標系中描繪出它的相應的點,這種圖稱為散點圖。通過散點圖可以粗略的看出f(x)的形式。概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第7頁!(一)回歸直線方程例1以家庭為單位,某種商品年需求量與該商品價格之間的一組調(diào)查數(shù)據(jù)如表11-1所示:統(tǒng)計結(jié)果表明,盡管價格不變,需求仍可能變化,價格改變需求也可能不變。但是,總的趨勢是家庭對該商品的年需求量隨著價格的上升而減少,它們之間存在著密切的聯(lián)系。我們要找出近似地描述它們關(guān)系的回歸函數(shù),也就是求出d對于p的回歸方程。價格Pi(xi)需求量di(yi)1523.5232.32.72.52.42.62.52.8231.53.31.23.51.2概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第8頁!要求出回歸直線方程L,就是要找出a與b的估計量因而可以決定該種商品的需求量y對價格x的回歸函數(shù)為直線型。我們把y對x的回歸函數(shù)記為b稱為回歸系數(shù)y對x的回歸直線方程達到最小。使直線L總的看來與所有的散點最接近。通常是固定x使得散點的縱坐標回歸直線上點的縱坐標概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第9頁!定量地描述了直線L與n個觀察點總的接近程度。Q的大小隨直線L的位置變化而變化。也就是說,Q的值隨著a和b的不同而變化。它是a和b的二元函數(shù)。稱它們?yōu)閍及b的最小二乘估計。要找一條總的看來最接近這n個點的直線,就要找出使得Q達到最小值的求法可以利用微積分中的極值求法:概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第10頁!由(1)得:代入(2)得(11.8)(11.9)于是所求的回歸直線方程為(11.10)概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第11頁!所求回歸方程應為繼續(xù)計算:解:設(shè)回歸直線方程為概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第12頁!(二)相關(guān)性檢驗說明x值的變化對y沒有影響,因而變量x不能控制變量y,用回歸直線方程(11.10)不能描述兩個變量y與x之間的關(guān)系。用最小二乘法求出的回歸直線并不需要事先假定y與x一定具有線性相關(guān)的關(guān)系。就方法——最小二乘法——本身而言,對任意一組數(shù)據(jù)都可以用(11.8)及(11.9)式給它們配一條直線,描述y與x間的關(guān)系。因此,需要判斷y對x的回歸函數(shù)的類型是否為線性的,也就是這兩個變量間是否真的存在著近似線性的關(guān)系。如果在中的b=0因此,在相關(guān)性檢驗時首先提出待檢假設(shè):概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第13頁!對于任意n組數(shù)據(jù):總的離差平方和總和Syy余和Q回歸和U概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第14頁!=0∴概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第15頁!(3)證明:是回歸直線上的點說明也是樣本值的均值點概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第16頁!可更清楚地看出x對y的線性影響與U的關(guān)系。概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第17頁!在平方和分解公式中如果U的值大,說明U起主導作用,建立的回歸方程回歸效果顯著。如果Q的值大,說明Q起主導作用,建立的回歸方程回歸效果不顯著。則建立的回歸方程無效可以證明:回歸直線方程若建立的回歸直線方程無效,則b=0概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第18頁!為了檢驗相關(guān)性,有時選用樣本相關(guān)系數(shù)為統(tǒng)計量,并把R的臨界值列成相關(guān)系數(shù)表(附表七)。不過這兩種檢驗方法是一致的。這是由于因此,F(xiàn)的值較大等價于|R|較大,可以用概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第19頁!可以用(11.9)與(11.8)式分別計算為了清楚起見,可先列出回歸計算表如表11-3:例1以家庭為單位,某種商品年需求量與該商品價格之間的一組調(diào)查數(shù)據(jù)如表11-1所示:Pi(xi)di(yi)1523.5232.32.72.52.42.62.52.8231.53.31.23.51.25174646.215.2966.256.56.765.67.844.593.9610.894.212.25∑252554.9767.2874.68解:設(shè)回歸直線方程為2512.2597.295.766.2542.251.441.44相關(guān)性檢驗的一般步驟概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第20頁!方差來源回歸和余和總和離差平方和U≈11.86Q≈0.32Syy=12.18自由度189F的值F≈296.5F的臨界值顯著性在顯著性一欄內(nèi)畫一個※在顯著性一欄內(nèi)再畫一個※4.結(jié)論:拒絕假設(shè)H0認為b≠0變量x對y有極其顯著的線性影響。概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第21頁!§11.3可線性化的回歸方程

如果由觀察數(shù)據(jù)畫出的散點圖或由經(jīng)驗認為兩個變量之間不能用線性關(guān)系近似描述,但是其中有些回歸方程仍可化為線性回歸方程,那么只要進行變量替換,就能直接利用線性回歸方程的結(jié)果。在經(jīng)濟領(lǐng)域中常用的有下面幾種形式:(一)雙曲線型概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第22頁!(三)冪函數(shù)型(四)S曲線型概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第23頁!

試利用下列資料(見表11-5),求出y對x的回歸曲線方程。例同一生產(chǎn)面積上某作物單位產(chǎn)品的成本與產(chǎn)量間近似滿足雙曲線型關(guān)系:5.6717.74.4518.53.8418.93.8418.83.7218.32.1819.1解:得回歸方程為列出回歸計算表概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第24頁!故該作物單位產(chǎn)品的成本與產(chǎn)量之間的回歸方程為概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第25頁!

另一類是統(tǒng)計關(guān)系或稱相關(guān)關(guān)系。即變量之間雖然存在著密切的關(guān)系,但從一個(或一組)變量的每一確定的值,不能求出另一變量的確定的值。可是在大量試驗中,這種不確定的關(guān)系,具有統(tǒng)計規(guī)律性,這種聯(lián)系使稱為統(tǒng)計相關(guān)。二、關(guān)系一類是函數(shù)關(guān)系,即變量之間有著確定的關(guān)系。例如已知圓的半徑R,則圓面積可以用公式S=πR2

來計算。這里S與R之間有著確定的關(guān)系。這些關(guān)系表現(xiàn)在量上主要有兩種類型:概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第26頁!例3消費者對某種商品(比如西紅柿)的月需求量與該種商品的價格有很密切的關(guān)系。一般說來,價格低時需求量大,價格高時需求量小,但同一種價格,月需求量也不完全相同。例4農(nóng)作物的產(chǎn)量與施肥量、氣候、農(nóng)藥也有這種不確定的關(guān)系。即便是具有確定關(guān)系的變量,由于試驗誤差的影響,其表現(xiàn)形式也具有某種程度的不確定性。概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第27頁!§11.2一元線性回歸方程

具有相關(guān)關(guān)系的變量間雖然不具有確定的函數(shù)關(guān)系,但是可以借助函數(shù)關(guān)系表達它們之間的統(tǒng)計規(guī)律性。用以近似地描述具有相關(guān)關(guān)系的變量間聯(lián)系的函數(shù)稱為回歸函數(shù)。

在實際中最簡單的情況是由兩個變量組成的關(guān)系,比如:在經(jīng)濟關(guān)系中,對某種商品的需求量隨價格的升降而變化;居民消費隨收入的增減而改變等等。首先考察兩量間的模型即概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第28頁!

由于兩個變量之間不存在完全確定的函數(shù)關(guān)系,因此必須把隨機波動產(chǎn)生的影響引入方程:

其中,y是隨機變量,x是普通變量,ε是隨機項。隨機變量yi表示對應于給定變量x的值xi的試驗結(jié)果:

首先一個問題是如何根據(jù)已經(jīng)試驗的結(jié)果以及以往的經(jīng)驗來確定回歸函數(shù)的類型以及求出函數(shù)中的未知參數(shù)的估計,得到經(jīng)驗公式。概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第29頁!的類型,先把10對數(shù)據(jù)作為直角坐標平面上點的坐標,并把這些點畫在直角坐標平面上。這樣得到的圖稱為散點圖(如圖11-1)。為了確定回歸函數(shù)可以看出,所有的點大體上分布在一條直線的周圍。即需求量與價格大致成線性關(guān)系。概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第30頁!

一般地,兩個變量的線性回歸模型為取一個容量為n的樣本并且假定:平面上任意一條直線L的方程記為用數(shù)值描述點與它沿平行縱軸方向到L的遠近距離。概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第31頁!整理后得:概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第32頁!可以用(11.9)與(11.8)式分別計算為了清楚起見,可先列出回歸計算表如表11-2:可以證明,確實使平方和Q達到最小。例1以家庭為單位,某種商品年需求量與該商品價格之間的一組調(diào)查數(shù)據(jù)如表11-1所示:Pi(xi)di(yi)1523.5232.32.72.52.42.62.52.8231.53.31.23.51.2比如求例子1中的回歸方程5174646.215.2966.256.56.765.67.844.593.9610.894.212.25∑252554.9767.28概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第33頁!EX

P2231、2、3、4

概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第34頁!(二)相關(guān)性檢驗因此,在相關(guān)性檢驗時首先提出待檢假設(shè):若H0成立,則x與y之間無線性關(guān)系,由此建立的回歸直線方程就無效。若拒絕H0,則x與y之間存在線性關(guān)系,由此建立的回歸直線方程就有效。用方差分析的方法進行檢驗。為此先介紹平方和分解公式,將x對y的線性影響與隨機波動引起的變差分開??偟碾x差平方和概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第35頁!在平方和分解公式中須證明成立帶入上式左端得=a=0(1)概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第36頁!(2)證明:概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第37頁!在平方和分解公式中其中U是對于其平均值的離差平方和它反映了的分散程度。而這一分散性是由于在回歸直線上它們所對應的橫坐標,的變化引起的,并且通過x對于y的線性影響表現(xiàn)出來,稱它為回歸平方和。(11.1)概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第38頁!至于Q,它是對應于變量x的每一個取值xi

,變量y的實際觀察值yi與回歸函數(shù)值的離差平方和,是由總誤差中分離出x對y的線性影響之外的其余因素而產(chǎn)生的誤差。在(11.2)式假定下,Q完全是隨機項ε引起的,稱為殘差平方和或剩余平方和。概率論與數(shù)理統(tǒng)計》共47頁,您現(xiàn)在瀏覽的是第39頁!認為x與y之間存在線性相關(guān)關(guān)系。1.首先提出待檢假設(shè)2.根據(jù)假設(shè)選取統(tǒng)計量在H。成立的條件下所選統(tǒng)計量3.對于給定的檢驗水平α,構(gòu)造小概率事件(4)根據(jù)樣本觀察值計算統(tǒng)計量F的值并與臨界值Fα比較;

(5)下結(jié)論:如果F>Fα

,則否定假設(shè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論