![若因變量y與自變量x之間為線性關(guān)系時稱為一元線性回歸對于具有課件_第1頁](http://file4.renrendoc.com/view/ab3c76004cf3963546c5a7498a35197b/ab3c76004cf3963546c5a7498a35197b1.gif)
![若因變量y與自變量x之間為線性關(guān)系時稱為一元線性回歸對于具有課件_第2頁](http://file4.renrendoc.com/view/ab3c76004cf3963546c5a7498a35197b/ab3c76004cf3963546c5a7498a35197b2.gif)
![若因變量y與自變量x之間為線性關(guān)系時稱為一元線性回歸對于具有課件_第3頁](http://file4.renrendoc.com/view/ab3c76004cf3963546c5a7498a35197b/ab3c76004cf3963546c5a7498a35197b3.gif)
![若因變量y與自變量x之間為線性關(guān)系時稱為一元線性回歸對于具有課件_第4頁](http://file4.renrendoc.com/view/ab3c76004cf3963546c5a7498a35197b/ab3c76004cf3963546c5a7498a35197b4.gif)
![若因變量y與自變量x之間為線性關(guān)系時稱為一元線性回歸對于具有課件_第5頁](http://file4.renrendoc.com/view/ab3c76004cf3963546c5a7498a35197b/ab3c76004cf3963546c5a7498a35197b5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、 第一節(jié) 變量間的相關(guān)關(guān)系一)相關(guān)關(guān)系的概念二)相關(guān)關(guān)系的種類新課導(dǎo)入 :某車間工人的基本情況:在這里,在這個車間的所有9名工人(總體)中,我們一方面可以了解職工工資總額、生活支出總數(shù)、平均工時數(shù)等,現(xiàn)在我們要分析的是工資、一周工時及生活支出和食用支出比例等方面的關(guān)系,有沒有什么關(guān)聯(lián)。 序號工資 一周工時 生活支出 食用支出比例 年齡 123456789850840830820810800795790785 494847464544434241 600590590587585570562560590 20%22%22.5%23%23.5%24%26%26.5%27% 3029452622485
2、22324 現(xiàn)象間的依存關(guān)系大致可以分成兩種類型:函數(shù)關(guān)系指現(xiàn)象間所具有的嚴格的確定性的依存關(guān)系相關(guān)關(guān)系指客觀現(xiàn)象間確實存在,但數(shù)量上不是嚴格對應(yīng)的依存關(guān)系一)相關(guān)分析的概念相關(guān)分析的概念1)函數(shù)關(guān)系1. 定義當(dāng)一個或幾個變量取一定的值時,另一個變量有確定值與之相對應(yīng),我們稱這種關(guān)系為確定性的函數(shù)關(guān)系。2.函數(shù)關(guān)系特點(1)是一一對應(yīng)的確定關(guān)系;(2)設(shè)有兩個變量 x 和 y ,變量 y 隨變量 x 一起變化,并完全依賴于 x ,當(dāng)變量 x 取某個數(shù)值時, y 依確定的關(guān)系取相應(yīng)的值,則稱 y 是 x 的函數(shù),記為 y = f (x),其中 x 稱為自變量,y 稱為因變量xy 3.函數(shù)關(guān)系的例
3、子某種商品的銷售額(y)與銷售量(x)之間的關(guān)系可表示為 y = p x (p 為單價)圓的面積與半徑之間的關(guān)系可表示為S = r2 企業(yè)的原材料消耗額(y)與產(chǎn)量(x1) 、單位產(chǎn)量消耗(x2) 、原材料價格(x3)之間的關(guān)系可表示為y = x1 x2 x3 2)相關(guān)關(guān)系 相關(guān)關(guān)系的例子商品的消費量(y)與居民收入(x)之間的關(guān)系商品銷售額(y)與廣告費支出(x)之間的關(guān)系糧食畝產(chǎn)量(y)與施肥量(x1) 、降雨量(x2) 、溫度(x3)之間的關(guān)系收入水平(y)與受教育程度(x)之間的關(guān)系父親身高(y)與子女身高(x)之間的關(guān)系1. 定義: 當(dāng)一個或幾個相互聯(lián)系的變量取一定數(shù)值時,與之相對應(yīng)
4、的另一變量的值雖然不確定,但它仍按某種規(guī)律在一定的范圍內(nèi)變化。變量間的這種關(guān)系稱為具有不確定性的相關(guān)關(guān)系?,F(xiàn)象之間客觀存在的不嚴格、不確定的數(shù)量依存關(guān)系。相關(guān)關(guān)系的概念相關(guān)關(guān)系的特點:變量間關(guān)系不能用函數(shù)關(guān)系精確表達一個變量的取值不能由另一個變量唯一確定當(dāng)變量 x 取某個值時,變量 y 的取值可能有幾個各觀測點分布不同. xy 相關(guān)關(guān)系和函數(shù)關(guān)系的區(qū)別和聯(lián)系 1.區(qū)別: (1)相關(guān)關(guān)系與函數(shù)關(guān)系的根本區(qū)別在于相依變量間的關(guān)系值是否確定. (2)相關(guān)關(guān)系的研究中各變量的地位是對等,函數(shù)關(guān)系時自變量和因變量必須是明確. (3)相關(guān)關(guān)系所涉及的變量均為隨機變量,而函數(shù)關(guān)系的自變量和因變量都是確定性變
5、量 2.聯(lián)系: (1)由于存在觀察或測量誤差,函數(shù)關(guān)系所具有的確定性對應(yīng)關(guān)系在實際中往往通過相關(guān)關(guān)系表現(xiàn)出來. (2)為了更好地研究相關(guān)變量間的內(nèi)在聯(lián)系和數(shù)量變動比例關(guān)系,往往借助函數(shù)關(guān)系表達式對相關(guān)關(guān)系作近似描述. (3)有時,函數(shù)關(guān)系也可看作是相關(guān)關(guān)系的特例.即完全相關(guān).二)相關(guān)關(guān)系的種類相關(guān)關(guān)系按相關(guān)程度分類按相關(guān)方向分類按相關(guān)形式分類按所研究變量多少分類(1)正相關(guān):兩個相關(guān)現(xiàn)象間,當(dāng)一個變量的數(shù)值增加(或減少)時,另一個變量的數(shù)值也隨之增加(或減少),即同方向變化。 例如收入與消費的關(guān)系。(2)負相關(guān):當(dāng)一個變量的數(shù)值增加(或減少)時,而另一個變量的數(shù)值相反地呈減少(或增加)趨勢變化
6、,即反方向變化。 例如物價與消費的關(guān)系。1)按相關(guān)的方向可劃分為:正相關(guān),負相關(guān)(1)當(dāng)兩種相關(guān)現(xiàn)象之間的關(guān)系大致呈現(xiàn)為線性關(guān)系時,稱之為線性相關(guān)。(2)當(dāng)兩種相關(guān)現(xiàn)象之間的關(guān)系不表現(xiàn)為直線關(guān)系,而是近似于某種曲線方程的關(guān)系,則這種相關(guān)關(guān)系稱為非線性相關(guān)。2)按相關(guān)的形式可劃分為: 線性相關(guān),非線性相關(guān)(1)當(dāng)只研究兩個變量時,它們之間的相關(guān),稱為單相關(guān)。(2)當(dāng)所研究的是一個變量對兩個或兩個以上其他變量的相關(guān)關(guān)系時,稱為復(fù)相關(guān)。例如,某種商品的需求與其價格水平以及收入水平之間的相關(guān)關(guān)系便是一種復(fù)相關(guān)。(3)在某一現(xiàn)象與多種現(xiàn)象相關(guān)的場合,假定其他變量不變,只考察其中兩個變量的相關(guān)關(guān)系稱為偏相
7、關(guān)。例如,在假定人們的收入水平不變的條件下,某種商品的需求與其價格水平的關(guān)系就是一種偏相關(guān)。3)按相關(guān)關(guān)系涉及的變量多少可劃分為: 單相關(guān),復(fù)相關(guān)和偏相關(guān)相關(guān)關(guān)系的圖示不相關(guān)負線性相關(guān)正線性相關(guān)非線性相關(guān)完全負線性相關(guān)完全正線性相關(guān) 第二節(jié) 簡單線性相關(guān)分析一)相關(guān)表與相關(guān)圖二)相關(guān)系數(shù)一)相關(guān)表與相關(guān)圖1)相關(guān)表 一種統(tǒng)計表,它是直接根據(jù)現(xiàn)象之間的原始資料,將一變量的若干變量值按從小到大的順序排列,并將另一變量的值與之對應(yīng)排列形成的統(tǒng)計表。 將自變量x的數(shù)值按照從小到大的順序,并配合因變量y的數(shù)值一一對應(yīng)而平行排列的表。簡單相關(guān)表分組相關(guān)表單變量分組相關(guān)表雙變量分組相關(guān)表 某市1996年 2
8、003年的工資性現(xiàn)金支出與城鎮(zhèn)儲蓄存款余額的資料,說明簡單相關(guān)表和相關(guān)圖的編制方法。 從表可看出,隨著工資性現(xiàn)金支出的增加,城鎮(zhèn)儲蓄存款余額有明顯的增長趨勢。所以,資料表明(如圖)有明顯的直線相關(guān)趨勢。序號年份工資性現(xiàn)金支出(萬元)x城鎮(zhèn)儲蓄存款余額(萬元)y11996 50012021997 54014031998 62015041999 73020052000 90028062001 97035072002 105045082003 1170510 (1)簡單相關(guān)表單變量分組相關(guān)表自變量分組并計算次數(shù),而對應(yīng)的因變量不分組,只計算其平均值。單變量分組相關(guān)表的特點:使冗長的資料簡化,能夠更清
9、晰地反映出兩變量之間相關(guān)關(guān)系。雙變量分組相關(guān)表:自變量和因變量都進行分組而制成的相關(guān)表,這種表形似棋盤,故又稱棋盤式相關(guān)表。(2)分組相關(guān)表分組相關(guān)表就是將原始數(shù)據(jù)進行分組而編制的相關(guān)表。根據(jù)分組的情況不同,分組表有兩種: 1、單變量分組表:只根據(jù)一個變量進行分組,另一個變量不進行分組,只是計算出次數(shù)和平均數(shù),這種表叫做單變量分組表。 按體重分組(千克)人數(shù)(人)每組平均身高(厘米)62.5以上217060-62.5316757.5-602516355-57.53816252.5-558716050-52.512915847.5-509115545-47.52415445以下1151合計400
10、-企業(yè)按銷售額分組(萬元)流通費用率(%)4以下9.654 87.688 127.2512 167.0016 206.8620 246.7324 286.6428 326.6032 366.58 例: 簡單分組相關(guān)表雙變量分組表概念:是對自變量和因變量都進行分組而編制的相關(guān)表。例如: 400個大學(xué)生身高和體重相關(guān)表按體重分組(千克)按身高分組(厘米)150以下150154154158158-16216216616617017及以上合計62.5以上226062.53357.5604678255557.5161483852.555282028254875052.5332442451212947.5
11、50330282010914547.5212102445以下1合計59749412568254002)相關(guān)圖1、相關(guān)圖:利用直角坐標(biāo)系第一象限,把自變量置于橫軸上,因變量置于縱軸上,而將兩變量相對應(yīng)的變量值用坐標(biāo)點形式描繪出來,用以表明相關(guān)點分布狀況的圖形。2、相關(guān)圖被形象地稱為相關(guān)散點圖3、因素標(biāo)志分了組,結(jié)果標(biāo)志表現(xiàn)為組平均數(shù),所繪制的相關(guān)圖就是一條折線,這種折線又叫相關(guān)曲線。散點圖 二)相關(guān)系數(shù) 1.相關(guān)系數(shù)的概念: 是指在線性相關(guān)的條件下,用以反映兩變量間線性相關(guān)程度和相關(guān)方向的統(tǒng)計分析指標(biāo).用r表示 2)相關(guān)系數(shù)的計算 樣本相關(guān)系數(shù)的計算公式或化簡為關(guān)于相關(guān)系數(shù)的幾點說明(1) r
12、的取值范圍是 -1,1(2)|r|=1,為完全相關(guān)r =1,為完全正相關(guān)r =-1,為完全負正相關(guān)(3) r = 0,不存在線性相關(guān)關(guān)系(4)-1r0,為負相關(guān);0r1,為正相關(guān)(5)|r|越趨于1表示關(guān)系越密切;|r|越趨于0表示關(guān)系越不密切相關(guān)程度評價標(biāo)準0| r |0.3為微弱相關(guān)0.3| r |0.5為低度相關(guān)0.5| r |0.8為顯著相關(guān)0.8| r |1為高度相關(guān)相關(guān)系數(shù)的計算計算公式:序號產(chǎn)品產(chǎn)量(千噸)生產(chǎn)費用(萬元)11.2621.44384474.422.0864.00739617233.1809.61640024843.811014.441210041855.01152
13、5.001322557566.113237.2117424805.277.213551.841822597288.016064.00256001280合計36.4880207.541042144544.6相關(guān)系數(shù)計算表根據(jù)上表計算: 例:下表是有關(guān)15個地區(qū)某種食物需求量和地區(qū)人口增加量的資料。 第三節(jié) 一元線性回歸分析一)回歸分析的概念二)回歸分析的方法三)估計標(biāo)準差四)可化為線性回歸的非線性回歸五)相關(guān)分析與回歸分析的特點一)回歸分析的概念 “回歸”這個統(tǒng)計學(xué)術(shù)語,最早采用者是英國遺傳學(xué)家高爾登,他把這種統(tǒng)計分析方法應(yīng)用于研究生物學(xué)的遺傳問題,指出生物后代有回復(fù)或回歸到其上代原有特性的傾向
14、。高爾登的學(xué)生皮爾遜繼續(xù)研究,把回歸與數(shù)學(xué)方法聯(lián)系起來,把代表現(xiàn)象之間一般數(shù)量關(guān)系的直線或曲線稱為回歸直線或回歸曲線。從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式對這些關(guān)系式的可信程度進行各種統(tǒng)計檢驗,并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著利用所求的關(guān)系式,根據(jù)一個或幾個變量的取值來預(yù)測或控制另一個特定變量的取值,并給出這種預(yù)測或控制的精確程度回歸方程一詞是怎么來的二)回歸分析的方法回答“變量之間是什么樣的關(guān)系?”方程中運用1 個數(shù)字的因變量(響應(yīng)變量)被預(yù)測的變量1 個或多個數(shù)字的或分類的自變量 (解釋變量)用于預(yù)測的變量3.主要用于預(yù)測和估計當(dāng)只涉及一個自變量時
15、稱為一元回歸,若因變量 y 與自變量 x 之間為線性關(guān)系時稱為一元線性回歸對于具有線性關(guān)系的兩個變量,可以用一條線性方程來表示它們之間的關(guān)系描述因變量 y 如何依賴于自變量 x 和誤差項 的方程稱為回歸模型 對于只涉及一個自變量的簡單線性回歸模型可表示為 y = a + x + e模型中,y 是 x 的線性函數(shù)(部分)加上誤差項線性部分反映了由于 x 的變化而引起的 y 的變化誤差項 是隨機變量反映了除 x 和 y 之間的線性關(guān)系之外的隨機因素對 y 的影響是不能由 x 和 y 之間的線性關(guān)系所解釋的變異性和 稱為模型的參數(shù)一元線性回歸模型對于經(jīng)判斷具有線性關(guān)系的兩個變量y與x,構(gòu)造一元線性回
16、歸模型為:假定E()=0,有總體一元線性回歸方程:建立回歸直線模型最小平方法基本數(shù)學(xué)要求:整理得到由兩個關(guān)于a、b的二元一次方程組成的方程組:進一步整理,有:例:根據(jù)表人均銷售額與利潤率資料,求其一元線性回歸方程。 人均銷售額與利潤率資料 解:首先,根據(jù)表中合計欄的資料求出標(biāo)準方程組中所需數(shù)據(jù);其次,將求出的數(shù)據(jù)代入公式,求出a、b的值:再次,將a、b的值代入回歸方程得:最后,由回歸方程可得相應(yīng)的回歸估計值, 如表所示。直線回歸方程的計算序號產(chǎn)品產(chǎn)量(千噸)生產(chǎn)費用(萬元)11.2621.44384474.422.0864.00739617233.1809.61640024843.811014
17、.441210041855.011525.001322557566.113237.2117424805.277.213551.841822597288.016064.00256001280合計36.4880207.541042144544.6已知n=13,可求代入公式有:回歸方程為 y =54.22286 + 0.52638 x 結(jié)果表明人均國民收入每增加1元,人均消費金額平均增加0.53元。三)估計標(biāo)準誤差(1)根據(jù)因變量實際值和估計值的離差計算計算公式 計算公式又可寫為: 估計標(biāo)準誤 根據(jù)回歸方程得出因變量的估計值。這個數(shù)值和實際數(shù)值之間就可能會產(chǎn)生誤差額,這就是估計值對于實際值的誤差,在
18、統(tǒng)計學(xué)當(dāng)中,我們用標(biāo)準差指標(biāo)來反映誤差值在這一章中,我們也用這樣的計算原理來計算:(2)根據(jù)a、b兩個參數(shù)值計算估計標(biāo)準誤差 第一種計算方法含義很明顯,計算公式和過程都表明了估計標(biāo)準誤差是用平均誤差來表現(xiàn)的。但是計算比較麻煩,需要計算出所有的估計值。如果已經(jīng)有了直線回歸方程的參數(shù)值,可用一個比較簡單的計算公式,即:1999年伊春林區(qū)16個林業(yè)局木材剩余物和年木材采伐量資料第二步:模型估計已知n=16,可求代入公式有:回歸方程為 結(jié)果表明伊春林區(qū)年采伐量每增加1萬立方米,將平均產(chǎn)生0.404萬立方米的剩余物。第三步:預(yù)測假設(shè)烏伊嶺林業(yè)局2004年計劃采伐木材20萬m3,求木材剩余物的點預(yù)測值。估計標(biāo)準差四)可化為線性回歸的非線性回歸當(dāng)因變量和自變量間的關(guān)系是指數(shù)曲線型時,通常采用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年臨街店鋪門面租賃合同范文(2篇)
- 2025年二手房轉(zhuǎn)讓協(xié)議參考樣本(三篇)
- 2025年倉儲設(shè)施的租賃合同(2篇)
- 2025年企業(yè)公司員工保密合同(2篇)
- 2025年度安全保衛(wèi)人員招聘與培訓(xùn)合同
- 工廠搬遷運輸服務(wù)協(xié)議
- 廢品回收運輸合同
- 展覽館裝修居間協(xié)議
- 城市公交燃油供應(yīng)協(xié)議
- 機械設(shè)備搬遷居間協(xié)議
- 證券公司信用風(fēng)險和操作風(fēng)險管理理論和實踐中金公司
- 一級建造師繼續(xù)教育最全題庫及答案(新)
- 2022年高考湖南卷生物試題(含答案解析)
- GB/T 20909-2007鋼門窗
- GB/T 17854-1999埋弧焊用不銹鋼焊絲和焊劑
- GB/T 15593-2020輸血(液)器具用聚氯乙烯塑料
- 直線加速器專項施工方案
- 儲能設(shè)備項目采購供應(yīng)質(zhì)量管理方案
- 2022年全國卷高考語文答題卡格式
- 復(fù)旦大學(xué)簡介 (課堂PPT)
- CKD馬達使用說明
評論
0/150
提交評論