概率論與數(shù)理統(tǒng)計》ppt課件_第1頁
概率論與數(shù)理統(tǒng)計》ppt課件_第2頁
概率論與數(shù)理統(tǒng)計》ppt課件_第3頁
概率論與數(shù)理統(tǒng)計》ppt課件_第4頁
概率論與數(shù)理統(tǒng)計》ppt課件_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第十一章 回歸分析,11.1回歸概念 11.2一元線性回歸方程 11.3可線性化的回歸方程,1.理解變量間的相關(guān)關(guān)系以及回歸分析的主要任務(wù),2.會用最小二乘法建立回歸直線方程,一元線性回歸方程的建立,回歸直線方程的有效性檢驗,教學(xué)要求,重點,回歸分析的任務(wù)是:根據(jù)試驗數(shù)據(jù)取估計回歸函數(shù),討論有關(guān)的點估計、區(qū)間估計、假設(shè)檢驗等問題,特別重要的是對隨機(jī)變量Y的觀察值做出點預(yù)測和區(qū)間預(yù)測,確定性關(guān)系是指變量之間的關(guān)系可以用函數(shù)關(guān)系來表達(dá)的,11.1 回歸概念,自然界和生產(chǎn)實踐中的許多現(xiàn)象之間存在著 相互依賴、相互制約的關(guān)系,一、現(xiàn)象,二、關(guān)系,非確定性關(guān)系即所謂相關(guān)關(guān)系,回歸分析是研究相關(guān)關(guān)系的一種

2、數(shù)學(xué)工具。它能幫助我們從一個變量取得的值去估計另一個變量所取得值,另一類是統(tǒng)計關(guān)系或稱相關(guān)關(guān)系。即變量之間雖然存在著密切的關(guān)系,但從一個(或一組)變量的每一確定的值,不能求出另一變量的確定的值??墒窃诖罅吭囼炛校@種不確定的關(guān)系,具有統(tǒng)計規(guī)律性,這種聯(lián)系使稱為統(tǒng)計相關(guān),二、關(guān)系,一類是函數(shù)關(guān)系,即變量之間有著確定的關(guān)系。例如已知圓的半徑R,則圓面積可以用公式S= R2 來計算。這里S與R之間有著確定的關(guān)系,這些關(guān)系表現(xiàn)在量上主要有兩種類型,例 1 居民按人口計算的平均收入與某種商品(如糖果)的消費量之間,有著一定的聯(lián)系。一般說來平均收入高的,消費量大,但平均收入相同時,這種商品的消費量卻不一定

3、是完全相同的,例 2 森林中的同一種樹木,其斷面直徑與高度之間是有聯(lián)系的。一般說來,較粗的樹較高,但直徑相同的樹,其高度也不完全是相同的,例 3 消費者對某種商品(比如西紅柿)的月需求量與該種商品的價格有很密切的關(guān)系。一般說來,價格低時需求量大,價格高時需求量小,但同一種價格,月需求量也不完全相同,例 4 農(nóng)作物的產(chǎn)量與施肥量、氣候、農(nóng)藥 也有這種不確定的關(guān)系,即便是具有確定關(guān)系的變量,由于試驗誤差的影響,其表現(xiàn)形式也具有某種程度的不確定性,如果這個模型是線性的就稱為線性回歸分析。這種方法是處理變量間相關(guān)關(guān)系的有力工具,是數(shù)理統(tǒng)計中一種常用的方法。它不僅告訴人們怎樣建立變量間的數(shù)學(xué)表達(dá)式,即經(jīng)

4、驗公式,而且還利用概率統(tǒng)計知識進(jìn)行分析討論,判斷出所建立的經(jīng)驗公式的有效性,從而可以進(jìn)行預(yù)測或估計。這在實際中是很有用的。本章主要介紹如何建立經(jīng)驗公式,以及建立的經(jīng)驗公式其有效性的判斷,由一個或一組非隨機(jī)變量來估計或預(yù)測某一個 隨機(jī)變量的觀察值時,所建立的數(shù)學(xué)模型及所 進(jìn)行的統(tǒng)計分析,稱為回歸分析,11.2 一元線性回歸方程,具有相關(guān)關(guān)系的變量間雖然不具有確定的函數(shù)關(guān)系,但是可以借助函數(shù)關(guān)系表達(dá)它們之間的統(tǒng)計規(guī)律性。用以近似地描述具有相關(guān)關(guān)系的變量間聯(lián)系的函數(shù)稱為回歸函數(shù),在實際中最簡單的情況是由兩個變量組成的關(guān)系,比如:在經(jīng)濟(jì)關(guān)系中,對某種商品的需求量隨價格的升降而變化;居民消費隨收入的增減

5、而改變等等,首先考察兩量間的模型即,我們對普通變量x取定一組不完全相同的值,分別是在,處對Y的獨立觀察結(jié)果,稱,是一個樣本,對應(yīng)的樣本值記為,如何利用樣本來估計Y關(guān)于x的回歸函數(shù),首先需要推測f (x)的形式,可將每對觀察值,在直角坐標(biāo)系中描繪出它的相應(yīng)的點,這種圖稱為散點圖。通過散點圖可以粗略的看出f (x)的形式,由于兩個變量之間不存在完全確定的函數(shù)關(guān)系,因此必須把隨機(jī)波動產(chǎn)生的影響引入方程,其中,y是隨機(jī)變量,x是普通變量,是隨機(jī)項。隨機(jī)變量yi表示對應(yīng)于給定變量x的值xi的試驗結(jié)果,首先一個問題是如何根據(jù)已經(jīng)試驗的結(jié)果以及以往的經(jīng)驗來確定回歸函數(shù)的類型以及求出函數(shù)中的未知參數(shù)的估計,得

6、到經(jīng)驗公式,一) 回歸直線方程,例1 以家庭為單位,某種商品年需求量與該商品價格之間的一組調(diào)查數(shù)據(jù)如表11-1所示,統(tǒng)計結(jié)果表明,盡管價格不變,需求仍可能變化,價格改變需求也可能不變。但是,總的趨勢是家庭對該商品的年需求量隨著價格的上升而減少,它們之間存在著密切的聯(lián)系。我們要找出近似地描述它們關(guān)系的回歸函數(shù),也就是求出d對于p的回歸方程,的類型,先把10對數(shù)據(jù)作為直角坐標(biāo)平面上點的 坐標(biāo),并把這些點畫在直角坐標(biāo)平面上。這樣得到的圖稱為散點圖(如圖11-1,為了確定回歸函數(shù),可以看出,所有的點大體上分布在一條直線的周圍。即需求量與價格大致成線性關(guān)系,要求出回歸直線方程L,就是要找出a與b的估計量

7、,因而可以決定該種商品的需求量y對價格x的回歸 函數(shù)為直線型。我們把y對x的回歸函數(shù)記為,b稱為回歸系數(shù),y 對x的回歸直線方程,達(dá)到最小,使直線 L 總的看來與所有的散點最接近,通常是固定x使得,一般地,兩個變量的線性回歸模型為,取一個容量為n的樣本,并且假定,平面上任意一條直線L的方程記為,用數(shù)值,描述點,與它沿平行縱軸方向到L的遠(yuǎn)近距離,定量地描述了直線L與n個觀察點總的接近程度。Q的大小隨直線L的位置變化而變化。也就是說,Q 的值隨著 a和 b的不同而變化。它是 a和b的二元函數(shù),稱它們?yōu)閍及 b的最小二乘估計,要找一條總的看來最接近這n個點的直線, 就要找出使得Q達(dá)到最小值的,求法可

8、以利用微積分中的極值求法,整理后得,由(1)得,代入(2)得,11.8,11.9,于是所求的回歸直線方程為,11.10,可以用(11.9)與(11.8)式分別計算 為了清楚起見,可先列出回歸計算表如表11-2,可以證明, 確實使平方和Q達(dá)到最小,例1 以家庭為單位,某種商品年需求量與該商品價格之間的一組調(diào)查數(shù)據(jù)如表11-1所示,比如求例子1中的回歸方程,所求回歸方程應(yīng)為,繼續(xù)計算,解:設(shè)回歸直線方程為,21,EX,P223 1、2、3、4,二) 相關(guān)性檢驗,說明x值的變化對y沒有影響,因而變量x不能控制變量y,用回歸直線方程(11.10)不能描述兩個變量y與x之間的關(guān)系,用最小二乘法求出的回歸

9、直線并不需要事先假定y與x一定具有線性相關(guān)的關(guān)系,就方法最小二乘法本身而言,對任意一組數(shù)據(jù)都可以用(11.8)及(11.9)式給它們配一條直線,描述y與x間的關(guān)系,因此,需要判斷y對x的回歸函數(shù)的類型是否為線性的,也就是這兩個變量間是否真的存在著近似線性的關(guān)系。如果在,中的b=0,因此,在相關(guān)性檢驗時首先提出待檢假設(shè),二) 相關(guān)性檢驗,因此,在相關(guān)性檢驗時首先提出待檢假設(shè),若H0成立,則x與y之間無線性關(guān)系,由此建立的回歸直線方程就無效,若拒絕H0,則x與y之間存在線性關(guān)系,由此建立的回歸直線方程就有效,用方差分析的方法進(jìn)行檢驗,為此先介紹平方和分解公式,將x對y的線性影響與隨機(jī)波動引起的變差

10、分開,總的離差平方和,對于任意n組數(shù)據(jù),總的離差平方和,總和Syy,余和Q,回歸和U,在平方和分解公式中,須證明,成立,帶入上式左端得,a,0,1,0,2,證明,3,證明,是回歸直線上的點,說明,也是樣本值的均值點,在平方和分解公式中,其中U是 對于其平均值 的離差平方和,它反映了 的分散程度。而這一分散性是由于在回歸直線上它們所對應(yīng)的橫坐標(biāo) ,的變化引起的,并且通過x對于y的線性影響表現(xiàn)出來,稱它為回歸平方和,11.1,可更清楚地看出x對y的線性影響與U的關(guān)系,至于Q,它是對應(yīng)于變量x的每一個取值 xi ,變量y的實際觀察值yi與回歸函數(shù)值 的離差平方和,是由總誤差中分離出x對y的線性影響之

11、外的其余因素而產(chǎn)生的誤差,在(11.2)式假定下,Q完全是隨機(jī)項 引起的,稱為殘差平方和或剩余平方和,在平方和分解公式中,如果 U的值大,說明U起主導(dǎo)作用,建立的回歸方程回歸效果顯著,如果 Q的值大,說明Q起主導(dǎo)作用,建立的回歸方程回歸效果不顯著,則建立的回歸方程無效,可以證明,回歸直線方程,若建立的回歸直線方程無效,則b=0,認(rèn)為x與y之間存在線性相關(guān)關(guān)系,1.首先提出待檢假設(shè),2.根據(jù)假設(shè)選取統(tǒng)計量,在H。成立的條件下所選統(tǒng)計量,3.對于給定的檢驗水平 ,構(gòu)造小概率事件,4)根據(jù)樣本觀察值計算統(tǒng)計量F的值并與臨界值F比較,5)下結(jié)論,如果F F , 則否定假設(shè)H0,只有存在線性相關(guān)關(guān)系的變

12、量之間建立回歸直線方程才是有意義的,為了檢驗相關(guān)性,有時選用樣本相關(guān)系數(shù),為統(tǒng)計量,并把R的臨界值列成相關(guān)系數(shù)表(附表七,不過這兩種檢驗方法是一致的,這是由于,因此,F(xiàn)的值較大等價于|R|較大,可以用,以例1為例,說明相關(guān)性檢驗的步驟,可以用(11.9)與(11.8)式分別計算 為了清楚起見,可先列出回歸計算表如表11-3,例1 以家庭為單位,某種商品年需求量與該商品價格之間的一組調(diào)查數(shù)據(jù)如表11-1所示,解:設(shè)回歸直線方程為,相關(guān)性檢驗的一般步驟,1.提出待檢假設(shè),2.列出方差計算表(如表113,根據(jù)表中結(jié)果繼續(xù)計算,3.列出方差分析表,4.78,12.18,7.53,11.86,0.32,在顯著性一欄內(nèi)畫一個,在顯著性一欄內(nèi)再畫一個,4.結(jié)論:拒絕假設(shè)H0,認(rèn)為b0,變量x對y有極其顯著的線性影響,所求回歸方程應(yīng)為,繼續(xù)計算,11.3 可線性化的回歸方程,如果由觀察數(shù)據(jù)畫出的散點圖或由經(jīng)驗認(rèn)為兩個變量之間不能用線性關(guān)系近似描述,但是其中有些回歸方程仍可化為線性回歸方程,那么只要進(jìn)行變量替換,就能直接利用線性回歸方程的結(jié)果。 在經(jīng)濟(jì)領(lǐng)域中常用的有下面幾種形

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論