統(tǒng)計學10相關(guān)與回歸分析講課教案_第1頁
統(tǒng)計學10相關(guān)與回歸分析講課教案_第2頁
統(tǒng)計學10相關(guān)與回歸分析講課教案_第3頁
統(tǒng)計學10相關(guān)與回歸分析講課教案_第4頁
統(tǒng)計學10相關(guān)與回歸分析講課教案_第5頁
已閱讀5頁,還剩72頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、統(tǒng)計學10相關(guān)與回歸分析二、相關(guān)關(guān)系的種類按相關(guān)關(guān)系的程度劃分 完全相關(guān): 當一個現(xiàn)象的數(shù)量變化完全由另一個現(xiàn)象的數(shù)量變化所確 定時,稱這兩種現(xiàn)象間的關(guān)系為完全相關(guān)。不相關(guān): 當兩種現(xiàn)象彼此互不影響,其數(shù)量變化各自獨立時,稱為 不相關(guān)現(xiàn)象。不完全相關(guān): 兩個現(xiàn)象之間的關(guān)系介于相關(guān)和不相關(guān)之間,稱為不完全 相關(guān)。按相關(guān)形式劃分線性相關(guān):當兩種相關(guān)現(xiàn)象之間的關(guān)系大致呈現(xiàn)為線性關(guān)系 時,稱之為線性關(guān)關(guān)。非線性相關(guān):如果兩種相關(guān)現(xiàn)象之間,并不表現(xiàn)為直線的關(guān)系 ,而是近似于某種曲線方程的關(guān)系,則這種相關(guān) 關(guān)系稱為非線性相關(guān)。按相關(guān)的方向劃分正相關(guān): 兩個相關(guān)現(xiàn)象間,當一個變量的數(shù)值增加(或減少)時,另一

2、 個變量的數(shù)值也隨之增加(或減少),即同方向變化。負相關(guān): 當一個變量的數(shù)值增加(或減少)時,而另一個變量的數(shù)值相 反地呈減少(或增加)趨勢變化,即反方向變化。按研究的變量劃分單相關(guān): 兩個變量之間的相關(guān),稱為單相關(guān)復(fù)相關(guān): 當所研究的是一個變量對兩個或兩個以上其他變量的相關(guān)關(guān)系 時,稱為復(fù)相關(guān)。偏相關(guān): 在某一現(xiàn)象與多種現(xiàn)象相關(guān)的場合,假定其他變量不變,專門 考察其中兩個變量的相關(guān)關(guān)系稱為偏相關(guān)。5三、相關(guān)分析與回歸分析()概念:相關(guān)分析:就是用一個指標來表明現(xiàn)象間相互依存關(guān)系的密切程度?;貧w分析:是指對具有相關(guān)關(guān)系的現(xiàn)象,根據(jù)其相關(guān)關(guān)系的具體形態(tài),選擇 一個合適的數(shù)學模型(稱為回歸方程式)

3、,用來近似地表達變量 間的平均變化關(guān)系的一種統(tǒng)計分析方法。(二)相關(guān)分析與回歸分析的區(qū)別-在相關(guān)分析中,不必確定自變量和因變量;而在回歸分析中,必 須事先確定哪個為自變量,哪個為因變量,而且只能從自變量去 推測因變量,而不能從因變量去推斷自變量。-相關(guān)分析不能指岀變量間相互關(guān)系的具體形式;而回歸分析能確 切的指出變量之間相互關(guān)系的具體形式,它可根據(jù)回歸模型從已 知量估計和預(yù)測未知量。-相關(guān)分析所涉及的變量一般都是隨機變量,而回歸分析中因變量 是隨機的,自變量則作為研究時給定的非隨機變量。(三)相關(guān)分析與回歸分析的聯(lián)系相關(guān)分析和回歸分析有著密切的聯(lián)系,它們不僅具有 共同的研究對象,而且在具體應(yīng)用

4、時,常常必須互相 補充。相關(guān)分析需要依靠回歸分析來表明現(xiàn)象數(shù)量相 關(guān)的具體形式,而回歸分析則需要依靠相關(guān)分析來表 明現(xiàn)象數(shù)量變化的相關(guān)程度。只有當變量之間存在著 高度相關(guān)時,進行回歸分析尋求其相關(guān)的具體形式才 有意義。簡單說: 1、相關(guān)分析是回歸分析的基礎(chǔ)和前提; 2、回歸分析是相關(guān)分析的深入和繼續(xù)。第二節(jié)線性相關(guān)分析定性分析依據(jù)研究者的理論知識和實踐經(jīng)驗,對客觀現(xiàn)象之間 是否存在相關(guān)關(guān)系,以及何種關(guān)系作出判斷。定量分析在定性分析的基礎(chǔ)上,通過編制相關(guān)表、繪制相關(guān)圖、 計算相關(guān)系數(shù)等方法,來判斷現(xiàn)象之間相關(guān)的方向、 形態(tài)及密切程度。一、相關(guān)表相關(guān)表:將自變量X的數(shù)值按照從小到大的順序,并配合

5、因變量y的數(shù)值一一對應(yīng)而平行排列的表。例:為了研究分析某種勞務(wù)產(chǎn)品完成量與其單位產(chǎn)品成本之間的關(guān)系,調(diào)查30個同類服務(wù)公司得到的原始數(shù)據(jù)如表。完成量(小時)20 50 20 30 50 20 50 40 20 80 40 20 50 80 30單位成本(元/小時)16 16 18 16 15 18 15 14 16 14 15 16 14 15 15整理后完成量(小時)20 20 20 20 20 20 20 20 20 30 30 30單位成本(元/小時)15 16 16 16 16 18 18 18 18 15 15 15完成量(小時) 40 40 40 40 50 50 50 50 50

6、 50 80 80 80 80 80單位成本(元/小時)15 15 15 16 14 14 15 15 15 16 14 14 14 14 1513二、相關(guān)圖相關(guān)圖/散點圖:以直角坐標系的橫軸代表變量X,縱軸代表變量y,將兩個變量間相對應(yīng)的變量值 用坐標點的形式描繪出來,用來反映兩變量之間 的相關(guān)關(guān)系的圖形。例:III40200相關(guān)圖13三、相關(guān)系數(shù))相關(guān)系數(shù)的定義:在線性條件下說明兩個變量之間相關(guān)關(guān)系密切程度的統(tǒng) 計分析指標。 總體相關(guān)系數(shù):相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計算的,記為P樣本相關(guān)系數(shù):根據(jù)樣本數(shù)據(jù)計算的,記為(三)相關(guān)系數(shù)的計算37021221例:下表是有關(guān)15個地區(qū)某種食物需求量

7、和地區(qū)人口增 加量的資料。274曹長量(千人)X89101112131415375205862659833019553430372236157120223131671698119211655252234144103人口增長年需求量(千人)量(十噸)編號合計 362622611067614y239503964785115x647851-3626x2261J 15x106761436262|15x395049-22612=0.995(四)相關(guān)系數(shù)的顯著性檢驗檢驗兩個變量之間是否存在線性相關(guān)關(guān)系采用Z檢驗檢驗的步驟為 提出假設(shè):Ho: p= 0 ; H: 工0 計算檢驗的統(tǒng)計量:確定顯著性水平并作出

8、決策若I t I ta/2拒絕Ho若出V./2,接受H例:對前例計算的相關(guān)系數(shù)進行顯著性檢驗(a=0.05)1. 提出假設(shè):Hf p = 0 ; H、:工02. 計算檢驗的統(tǒng)計量:=/=二 43._8jwl-J.)9503.a=0. 05,查表得a/2(/?-2)=2. 160V|=48. 385:/2(15-2)二2. 160,拒絕,該種食物需求量和地區(qū)人口增加量之間的相 關(guān)關(guān)系顯著。第三節(jié)一元線性回歸、回歸函數(shù)總體回歸函數(shù):Yt=Po+PXt+ut u七是隨機誤差項,又稱隨機干擾項,它是一個特殊 的隨機變量,反映未列入方程式的其他各種因素對 Y的影響。樣本回歸函數(shù): et稱為殘差,在概念上

9、,e上與總體誤差項片相互對 應(yīng);n是樣本的容量。樣本回歸函數(shù)與總體回歸函數(shù)區(qū)別1. 總體回歸線是未知的,只有一條。樣本回歸線是根據(jù)樣本數(shù)據(jù)擬合的,每抽取一 組樣本,便可以擬合一條樣本回歸線。2. 總體回歸函數(shù)中的pi和是未知的參數(shù),表現(xiàn)為常數(shù)。而樣本回歸函數(shù)中的 是隨機變量,其具體數(shù)值隨所抽取的樣本觀測值不同而變動。3. 總體回歸函數(shù)中的I、是丫與未知的總體回歸線之間的縱向距離,它是不可直接觀 測的。而樣本回歸函數(shù)中的J是丫上與樣本回歸線之間的縱向距離,當根據(jù)樣本觀 測值擬合出樣本回歸線之后,可以計算出J的具體數(shù)值。綜上所述,樣本回歸函數(shù)是對總體回歸函數(shù)的近似反應(yīng)。回歸分析的主要 任務(wù)就是要采

10、用適當?shù)姆椒ǎ浞掷脴颖舅峁┑男畔?,使得樣本回歸 函數(shù)盡可能地接近于真實的總體回歸函數(shù)。2733原理:最小二乘法擬合回歸方程使殘差平方和最小加以整理后有:n例:現(xiàn)以前例的資料配合回歸直線,計算如下:編號人口增長量(千人)X年需求量(十噸)y1274162218012033752234205131586676265169798818330亠19291951161053匚.5511430252123722341323614414157.103?15370212編號人口增長 量(千人)X年需求 量(十噸)y %2 y2xy合計3626226110676143950396478512涉1阪挪防闕販

11、洌詈215537=222S95上式中 表示人口每增加(或減少) 1千人,該種食品的年需求量平均來說增 加(或減少)0.5301十噸即5.301噸。一元線性回歸方程的檢驗回歸模型檢驗的種類回歸方程的擬合程度的評價顯著性檢驗(一)回歸模型檢驗的種類回歸模型的檢驗包括理論意義檢驗、一級檢驗和二級檢驗。理論意義檢驗主要涉及參數(shù)估計值的符號和取值區(qū)間,如果它們與實 質(zhì)性科學的理論以及人們的實踐經(jīng)驗不相符,就說明模型不能很好的 解釋現(xiàn)實的現(xiàn)象。 一級檢驗/統(tǒng)計學檢驗:它是利用統(tǒng)計學中的抽樣理論來檢驗樣本回 歸方程的可靠性。具體又分為擬合程度評價和顯著性檢驗。-二級檢驗/經(jīng)濟計量學檢驗:它是對標準線性回歸模

12、型的假定條件能 否得到滿足進行檢驗。具體包括序列相關(guān)檢驗、異方差性檢驗、多重 共線性檢驗等。(二)回歸模型的擬合程度的評價所謂擬合程度,是指樣本觀測值聚集在樣本回歸 線周圍的緊密程度。因變量J的取值是不同的,J取值的這種波動 稱為離差。變差來源于兩個方面:由于自變量X的取值不同造成的;除X以外的其他因素(如乂對的非線性影響、測量 誤差等)的影響。 對一個具體的觀測值來說,變差的大小可以通 過該實際觀測值與其均值之差來表示。三個平方和的關(guān)系1從圖上看有回歸平方和 (SSR)殘差平方和 (SSE)2.兩端平方后求和有總變差平方和(SST)SST = SSR + SSE三個平方和的意義總平方和(SS

13、I)反映因變量的個觀察值與其均值的總離差回歸平方和(SSR)打反映自變量*的變化對因變量7取值變化的影響,或者說,是 由于與丿之間的線性關(guān)系引起的丿的取值變化,也稱為可解釋 的平方和。殘差平方和(SSE) I C /反映除x以外的其他因素對丿取值的影響,也稱為不可解釋的 平方和或剩余平方和。判定系數(shù)K2將上式兩邊同除以SST,得:顯而易見,各個樣本觀測點與樣本回歸直線靠得越 緊,SSR在SST中所占的比例就越大。因此,可定義 這一比例為判定系數(shù),即有:判定系數(shù)R2的特征判定系數(shù)R2具有非負性;判定系數(shù)取值范圍0 R2 ta/2=2.201,拒絕H,表明人口增長與年均需求量之間有線性關(guān)系2、回歸

14、方程的顯著性檢驗(1) 提出假設(shè)(2) 計算檢驗統(tǒng)計量F(3)決策如前例拒絕原假設(shè),表明所建立的回歸方程是顯著的, 即該食品需求量與地區(qū)人口增長量之間的線性關(guān)系是顯著的。五、一元線性回歸模型預(yù)測點預(yù)測給定一個X值,預(yù)測y的取值區(qū)間預(yù)測平均值的區(qū)間預(yù)測/置信區(qū)間對于X的一個給定值X。,求出y的平均值的區(qū)間估計特定值的區(qū)間預(yù)測/預(yù)測區(qū)間對于X的一個給定值X。,求出y的特定值的區(qū)間估計(一)點預(yù)測點預(yù)測的基本公式:前例中,當人口增長量為400千人時,可預(yù)測該食品的年需求量為:(二)區(qū)間預(yù)測 1、y的平均值的置信區(qū)間為例:假定已知人口增長量為200千人,要求利用上例中擬合的樣本回歸方程與有關(guān)數(shù)據(jù),計算

15、置信度為95%的該食品年平均需求量的置信區(qū)間O查t分布表可知:顯著性水平為5%,自由度為13的雙側(cè)t檢 驗的臨界值是2.16。因此,當人口增長量為200千人時,置 信度為95%的該食品年需求量的預(yù)測區(qū)間如下:當人口增長量為200千人時,有95%的概率保證該食品的年平均需求量在1247.9到1324.3噸之間。(三)區(qū)間預(yù)測 2、y的特定值的預(yù)測區(qū)間為0 allxS例:假定已知人口增長量為200千人,要求利用上例中擬合的樣本回歸方程與有關(guān)數(shù)據(jù),計算置信度為95%的該食品年需求量的置信區(qū)間。解:將有關(guān)數(shù)據(jù)代入擬好的樣本回歸方程,可得: = 22.5905 + 0.5301x200 = 128.6105(十噸)已知:3 =6.4215 刃= 15, x = 362d=1067614Y(x-x)2 = Yx2 -(Yx)2 =1067614 3626/I5 = 191088.9

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論