概率論與數(shù)理統(tǒng)計(jì)(相關(guān)分析)_第1頁(yè)
概率論與數(shù)理統(tǒng)計(jì)(相關(guān)分析)_第2頁(yè)
概率論與數(shù)理統(tǒng)計(jì)(相關(guān)分析)_第3頁(yè)
概率論與數(shù)理統(tǒng)計(jì)(相關(guān)分析)_第4頁(yè)
概率論與數(shù)理統(tǒng)計(jì)(相關(guān)分析)_第5頁(yè)
已閱讀5頁(yè),還剩25頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第9章相關(guān)分析與一元回歸分析9.1相關(guān)分析9.2回歸分析第9章相關(guān)分析與一元回歸分析變量之間的關(guān)系可以分為函數(shù)關(guān)系和相關(guān)關(guān)系兩類(lèi),函數(shù)關(guān)系表示變量間確定的對(duì)應(yīng)關(guān)系,而相關(guān)關(guān)系則是變量間的某種非確定的依賴(lài)關(guān)系.相關(guān)分析主要是研究隨機(jī)變量間相關(guān)關(guān)系的形式和程度,在相關(guān)關(guān)系的討論中,兩個(gè)變量的地位是同等的,所使用的測(cè)度工具是相關(guān)系數(shù);而回歸分析則側(cè)重考察變量之間的數(shù)量伴隨關(guān)系,并通過(guò)一定的數(shù)學(xué)表達(dá)式將這種數(shù)量關(guān)系描述出來(lái),用于解決預(yù)測(cè)和控制等實(shí)際問(wèn)題.本章主要學(xué)習(xí)相關(guān)分析和一元回歸分析的有關(guān)概念、理論和方法.第9章相關(guān)分析與一元回歸分析【回歸名稱(chēng)的來(lái)歷】

“回歸”這一詞最早出現(xiàn)在1885年,英國(guó)生物學(xué)家兼統(tǒng)計(jì)學(xué)家—弗朗西斯

高爾頓(FrancisGalton)在研究遺傳現(xiàn)象時(shí)引進(jìn)了這一名詞.他研究分析了孩子和父母身高關(guān)系后發(fā)現(xiàn):雖然高個(gè)子的父母會(huì)有高個(gè)子的后代,但后代的增高并不與父母的增高等量.他稱(chēng)這一現(xiàn)象為“向平常高度的回歸”.第9章相關(guān)分析與一元回歸分析【回歸名稱(chēng)的來(lái)歷】

雖然高個(gè)子的父母會(huì)有高個(gè)子的后代,但后代的增高并不與父母的增高等量.他稱(chēng)這一現(xiàn)象為“向平常高度的回歸”.爾后,他的朋友麥爾遜等人搜集了上千個(gè)家庭成員的身高數(shù)據(jù),分析出兒子的平均身高和父親的身高x大致為如下關(guān)系:

(英寸)【回歸名稱(chēng)的來(lái)歷】這表明:(1)父親身高增加1英寸,其兒子的身高平均增加0.516英寸.(2)高個(gè)子父輩有生高個(gè)子兒子的趨勢(shì),但兒子的平均身高要比于父輩低一些.如x=80,那么低于父輩的平均身高.(3)低個(gè)子父輩的兒子們雖為低個(gè)子,但其平均身高要比于父輩高一些.如x=60,那么,高于父輩的平均身高.【回歸名稱(chēng)的來(lái)歷】可見(jiàn)兒子的高度趨向于“回歸”到平均值而不是更極端,這就是“回歸”一詞的最初含義.誠(chéng)然,如今對(duì)回歸這一概念的理解并不是高爾頓的原意,但這一名詞卻一直沿用下來(lái),成為數(shù)理統(tǒng)計(jì)中最常用的概念之一.回歸分析的思想早已滲透到數(shù)理統(tǒng)計(jì)學(xué)科的其他分支,隨著計(jì)算機(jī)的發(fā)展和各種統(tǒng)計(jì)軟件的出現(xiàn),回歸分析的應(yīng)用越來(lái)越廣泛.第9章相關(guān)分析與一元回歸分析9.1相關(guān)分析在大量的實(shí)際問(wèn)題中,隨機(jī)變量之間雖有某種關(guān)系,但這種關(guān)系很難找到一種精確的表示方法來(lái)描述.例如,人的身高與體重之間有一定的關(guān)系,知道一個(gè)人的身高可以大致估計(jì)出他的體重,但并不能算出體重的精確值.其原因在于人有較大的個(gè)體差異,因而身高和體重的關(guān)系,是既密切但又不能完全確定的關(guān)系.隨機(jī)變量間類(lèi)似的這種關(guān)系在大自然和社會(huì)中屢見(jiàn)不鮮.第9章相關(guān)分析與一元回歸分析9.1相關(guān)分析例如,農(nóng)作物產(chǎn)量與施肥量的關(guān)系商業(yè)活動(dòng)中銷(xiāo)售量與廣告投入的關(guān)系人的年齡與血壓的關(guān)系每種股票的收益與整個(gè)市場(chǎng)收益的關(guān)系家庭收入與支出的關(guān)系等等.9.1相關(guān)分析這種大量存在于隨機(jī)變量間既互相聯(lián)系,但又不是完全確定的關(guān)系,稱(chēng)為相關(guān)關(guān)系.

從數(shù)量的角度去研究這種關(guān)系,是數(shù)理統(tǒng)計(jì)的一個(gè)任務(wù).這包括通過(guò)觀察試驗(yàn)數(shù)據(jù)去判斷隨機(jī)變量之間有無(wú)關(guān)系,對(duì)其關(guān)系大小作出數(shù)量上的估計(jì),我們把這種統(tǒng)計(jì)分析方法稱(chēng)為相關(guān)分析.相關(guān)分析通常包括考察隨機(jī)變量觀測(cè)數(shù)據(jù)的散點(diǎn)圖、計(jì)算樣本相關(guān)系數(shù)以及對(duì)總體相關(guān)系數(shù)的顯著性檢驗(yàn)等內(nèi)容.9.1.1散點(diǎn)圖散點(diǎn)圖是描述變量之間關(guān)系的一種直觀方法.用坐標(biāo)的橫軸代表自變量X,縱軸代表因變量Y,每組觀測(cè)數(shù)據(jù)(xi,yi)在坐標(biāo)系中用一個(gè)點(diǎn)表示,由這些點(diǎn)形成的散點(diǎn)圖描述了兩個(gè)變量之間的大致關(guān)系,從中可以直觀地看出變量之間的關(guān)系形態(tài)及關(guān)系強(qiáng)度.圖9.1是不同形態(tài)的散點(diǎn)圖.

(a)(b)(c)(d)

(a)(b)(c)(d)從散點(diǎn)圖可以看出,變量間相關(guān)關(guān)系的表現(xiàn)形態(tài)大體上可分為線(xiàn)性相關(guān)、非線(xiàn)性相關(guān)、不相關(guān)等幾種.9.1.1散點(diǎn)圖

(a)(b)(c)(d)就兩個(gè)變量而言,如果變量之間的關(guān)系近似地表現(xiàn)為一條直線(xiàn),則稱(chēng)為線(xiàn)性相關(guān),如圖9.1(a)和(b);如果變量之間的關(guān)系近似地表現(xiàn)為一條曲線(xiàn),則稱(chēng)為非線(xiàn)性相關(guān)或曲線(xiàn)相關(guān),如圖9.1(c);如果兩個(gè)變量的觀測(cè)點(diǎn)很分散,無(wú)任何規(guī)律,則表示變量之間沒(méi)有相關(guān)關(guān)系,如圖9.1(d).9.1.1散點(diǎn)圖通過(guò)散點(diǎn)圖可以判斷兩個(gè)變量之間有無(wú)相關(guān)關(guān)系,并對(duì)變量間的關(guān)系形態(tài)做出大致的描述但散點(diǎn)圖不能準(zhǔn)確反映變量之間的關(guān)系密切程度.因此,為準(zhǔn)確度量?jī)蓚€(gè)變量之間的關(guān)系密切程度,需要計(jì)算相關(guān)系數(shù).9.1.1散點(diǎn)圖9.1相關(guān)分析9.1.2相關(guān)系數(shù)相關(guān)系數(shù)是對(duì)兩個(gè)隨機(jī)變量之間線(xiàn)性關(guān)系密切程度的度量.若相關(guān)系數(shù)是根據(jù)兩個(gè)變量全部數(shù)據(jù)計(jì)算的,稱(chēng)為總體相關(guān)系數(shù).設(shè)X,Y為兩個(gè)隨機(jī)變量,由定義4.5知,當(dāng)D(X)D(Y)

0時(shí),總體相關(guān)系數(shù)的計(jì)算公式為:其中Cov(X,Y)為變量X和Y的協(xié)方差,D(X)和D(Y)分別為X和Y的方差.9.1.2相關(guān)系數(shù)設(shè)(xi,yi),i=1,2,…,n,為(X,Y)的樣本,記定義9.1若sxsy

0,稱(chēng)為{xi}和{yi}的相關(guān)系數(shù)(也可簡(jiǎn)稱(chēng)為樣本相關(guān)系數(shù)).rxy常簡(jiǎn)記為r.9.1.2相關(guān)系數(shù)可以證明rxy具有下面兩條性質(zhì):(1)|rxy|

1(2)|rxy|=1時(shí),(xi,yi),i=1,2,…,n在一條直線(xiàn)上.定義9.2當(dāng)rxy>0時(shí),稱(chēng){xi}和{yi}正相關(guān)當(dāng)rxy<0時(shí),稱(chēng){xi}和{yi}負(fù)相關(guān)當(dāng)rxy=0時(shí),稱(chēng){xi}和{yi}不相關(guān).

9.1.2相關(guān)系數(shù)在實(shí)際應(yīng)用中,為了說(shuō)明{xi}和{yi}的相關(guān)程度,通常將相關(guān)程度分為以下幾種情況:當(dāng)|rxy|≥0.8時(shí),可視{xi}與{yi}為高度線(xiàn)性相關(guān);0.5≤|rxy|<0.8時(shí),可視{xi}與{yi}為中度線(xiàn)性相關(guān);0.3≤|rxy|<0.5時(shí),視{xi}與{yi}為低度線(xiàn)性相關(guān);當(dāng)|rxy|<0.3時(shí),說(shuō)明{xi}與{yi}的線(xiàn)性相關(guān)程度極弱.9.1.2相關(guān)系數(shù)說(shuō)明:(1)有時(shí)個(gè)別極端數(shù)據(jù)可能影響樣本相關(guān)系數(shù),應(yīng)用中要多加注意.(2)rxy=0,只能說(shuō)明{xi}與{yi}之間不存在線(xiàn)性關(guān)系,并不能說(shuō)明{xi}與{yi}之間無(wú)其他關(guān)系.(3)一般情況下,總體相關(guān)系數(shù)ρXY是未知的,通常是將樣本相關(guān)系數(shù)rxy作為ρXY的估計(jì)值,于是常用樣本相關(guān)系數(shù)推斷兩變量間的相關(guān)關(guān)系.這一點(diǎn)要和相關(guān)系數(shù)的顯著性檢驗(yàn)結(jié)合起來(lái)應(yīng)用.【例9.1】用來(lái)評(píng)價(jià)商業(yè)中心經(jīng)營(yíng)好壞的一個(gè)綜合指標(biāo)是單位面積的營(yíng)業(yè)額,它是單位時(shí)間內(nèi)(通常為一年)的營(yíng)業(yè)額與經(jīng)營(yíng)面積的比值.對(duì)單位面積營(yíng)業(yè)額的影響因素的指標(biāo)有單位小時(shí)車(chē)流量、日人流量、居民年平均消費(fèi)額、消費(fèi)者對(duì)商場(chǎng)的環(huán)境、設(shè)施及商品的豐富程度的滿(mǎn)意度

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論