兩個(gè)變量的線性相關(guān)_第1頁(yè)
兩個(gè)變量的線性相關(guān)_第2頁(yè)
兩個(gè)變量的線性相關(guān)_第3頁(yè)
兩個(gè)變量的線性相關(guān)_第4頁(yè)
兩個(gè)變量的線性相關(guān)_第5頁(yè)
已閱讀5頁(yè),還剩16頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

兩個(gè)變量的線性相關(guān)在一次對(duì)人體脂肪含量和年齡關(guān)系的研究中,研究人員獲得了一組樣本數(shù)據(jù):年齡23273941454950脂肪9.517.821.225.927.526.328.2年齡53545657586061脂肪29.630.231.430.833.535.234.6根據(jù)上述數(shù)據(jù),人體的脂肪含量與年齡之間有怎樣的關(guān)系?散點(diǎn)圖:兩個(gè)變量的散點(diǎn)圖中點(diǎn)的分布的位置是從左下角到右上角的區(qū)域,即一個(gè)變量值由小變大,另一個(gè)變量值也由小變大,我們稱這種相關(guān)關(guān)系為正相關(guān)。二、兩個(gè)變量的線性相關(guān)思考:1、兩個(gè)變量成負(fù)相關(guān)關(guān)系時(shí),散點(diǎn)圖有什么特點(diǎn)??jī)蓚€(gè)變量的散點(diǎn)圖中點(diǎn)的分布的位置是從左上角到右下角的區(qū)域,即一個(gè)變量值由小變大,而另一個(gè)變量值由大變小,我們稱這種相關(guān)關(guān)系為負(fù)相關(guān)。2、你能舉出一些生活中的變量成正相關(guān)或者負(fù)相關(guān)的例子嗎?3、若兩個(gè)變量散點(diǎn)圖呈下圖,它們之間是否具有相關(guān)關(guān)系?散點(diǎn)圖回歸直線:如果散點(diǎn)圖中點(diǎn)的分布從整體上看大致在一條直線附近,我們就稱這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線就叫做回歸直線。這條回歸直線的方程,簡(jiǎn)稱為回歸方程。方案一:采用測(cè)量的方法:先畫一條直線,測(cè)量出各點(diǎn)到它的距離,然后移動(dòng)直線,到達(dá)一個(gè)使距離之和最小的位置,測(cè)量出此時(shí)直線的斜率和截距,就得到回歸方程。如何具體的求出回歸方程?方案二、在圖中選取兩點(diǎn)畫直線,使得直線兩側(cè)的點(diǎn)的個(gè)數(shù)基本相同。我們應(yīng)該如何具體的求出這個(gè)回歸方程呢?方案三、在散點(diǎn)圖中多取幾組點(diǎn),確定幾條直線的方程,分別求出各條直線的斜率和截距的平均數(shù),將這兩個(gè)平均數(shù)作為回歸方程的斜率和截距。我們應(yīng)該如何具體的求出這個(gè)回歸方程呢?上述三種方案均有一定的道理,但可靠性不強(qiáng),我們回到回歸直線的定義。求回歸方程的關(guān)鍵是如何用數(shù)學(xué)的方法來(lái)刻畫“從整體上看,各點(diǎn)與直線的偏差最小”。計(jì)算回歸方程的斜率和截距的一般公式:其中,b是回歸方程的斜率,a是截距。最小二乘法的公式的探索過(guò)程如下:設(shè)已經(jīng)得到具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù):(x1,y1),(x2,y2),…,(xn,yn)設(shè)所求的回歸直線方程為Y=bx+a,其中a,b是待定的系數(shù)。當(dāng)變量x取x1,x2,…,xn時(shí),可以得到

Yi=bxi+a(i=1,2,…,n)它與實(shí)際收集得到的yi之間偏差是

yi-Yi=yi-(bxi+a)(i=1,2,…,n)(x1,y1)(x2,y2)(xi,yi)yi-Yiy

x這樣,用這n個(gè)偏差的和來(lái)刻畫“各點(diǎn)與此直線的整體偏差”是比較合適的。我們可以用計(jì)算機(jī)來(lái)求回歸方程。人體脂肪含量與年齡之間的規(guī)律,由此回歸直線來(lái)反映。將年齡作為x代入上述回歸方程,看看得出數(shù)值與真實(shí)值之間有何關(guān)系?年齡23273941454950脂肪9.517.821.225.927.526.328.2回歸值12.815.122.023.225.527.828.4年齡53545657586061脂肪29.630.231.430.833.535.234.6回歸值30.130.731.832.433.034.134.7若某人65歲,可預(yù)測(cè)他體內(nèi)脂肪含量在37.1%(0.577×65-0.448=37.1%)附近的可能性比較大。但不能說(shuō)他體內(nèi)脂肪含量一定是37.1%。例、假設(shè)關(guān)于某設(shè)備的使用年限x(年)和所支出的維修費(fèi)用y(萬(wàn)元),有如下的統(tǒng)計(jì)資料:使用年限x(年)23456維修費(fèi)用y(萬(wàn)元)2.23.85.56.57.0若資料知y,x呈線性相關(guān)關(guān)系,試求:(1)線性回歸方程Y=bx+a的回歸系數(shù)a、b;(2)估計(jì)使用年限為10年時(shí),維修費(fèi)用是多少?iˉˉ解:(1)于是有b=(112.3-5*4*5)/(90-5*4^2)=1.23,a=5-1.23*4=0.08(2)回歸方程為Y=1.23x+0.08,當(dāng)x=10時(shí),Y=12.38(萬(wàn)元),即估計(jì)使用10年時(shí)維護(hù)費(fèi)用是12.38萬(wàn)元。小結(jié)1.求樣本數(shù)據(jù)的線性回歸方程,可按下列步驟進(jìn)行:第一步,計(jì)算平均數(shù),第二步,求和,第三步,計(jì)算第四步,寫出回歸方程2.回歸方程被樣本數(shù)據(jù)惟一確定,各樣本點(diǎn)大致分布在回歸直線附近.對(duì)同一個(gè)總體,不同的樣本數(shù)據(jù)對(duì)應(yīng)不同的回歸直線,所以回歸直線也具有隨機(jī)性.3.對(duì)于任意一組樣本數(shù)據(jù),利用上述公式都可求得“回歸方程”,如果這組數(shù)據(jù)不具有線性相關(guān)關(guān)系,即不存在回歸直線,那么所得的“回歸方程”是沒(méi)有實(shí)際意義的.因此,對(duì)一組樣本數(shù)據(jù),應(yīng)先作散點(diǎn)圖,在具有線性相關(guān)關(guān)系的前提下再求回歸方程.例1:有一個(gè)同學(xué)家開了一個(gè)小賣部,他為了研究氣溫對(duì)熱飲銷售的影響,經(jīng)過(guò)統(tǒng)計(jì),得到一個(gè)賣出的熱飲杯數(shù)與當(dāng)天氣溫的對(duì)比表:1、畫出散點(diǎn)圖;2、從散點(diǎn)圖中發(fā)現(xiàn)氣溫與熱飲銷售杯數(shù)之間關(guān)系的一般規(guī)律;3、求回歸方程;4、如果某天的氣溫是2攝氏度,預(yù)測(cè)這天賣出的熱飲杯數(shù)。1、散點(diǎn)圖2、從圖3-1看到,各點(diǎn)散布在從左上角到由下角的區(qū)域里,因此,氣溫與熱飲銷售杯數(shù)之間成負(fù)相關(guān),即氣溫越高,賣出去的熱飲

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論