




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
8.1.2樣本相關(guān)系數(shù)一、知識(shí)回顧1.正相關(guān)和負(fù)相關(guān):
2.線性相關(guān):
3.非線性相關(guān)或曲線相關(guān):
如果從整體上看,當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的
相應(yīng)值也呈現(xiàn)增加的趨勢(shì),我們就稱這兩個(gè)變量正相關(guān);如果當(dāng)
一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值呈現(xiàn)減少的趨勢(shì),
則稱這兩個(gè)變量負(fù)相關(guān).
一般地,如果兩個(gè)變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且
散點(diǎn)落在一條直線附近,我們就稱這兩個(gè)變量線性相關(guān).
一般地,如果兩個(gè)變量具有相關(guān)性,但不是線性相關(guān),那么
我們就稱這兩個(gè)變量非線性相關(guān)或曲線相關(guān).
通過觀察散點(diǎn)圖中成對(duì)樣本數(shù)據(jù)的分布規(guī)律,我們可以大致推斷兩個(gè)變量是否存在相關(guān)關(guān)系、是正相關(guān)還是負(fù)相關(guān)、是線性相關(guān)還是非線性相關(guān)等.散點(diǎn)圖雖然直觀,但無法確切地反映成對(duì)樣本數(shù)據(jù)的相關(guān)程度,也就無法量化兩個(gè)變量之間相關(guān)程度的大小.能否像引入平均值、方差等數(shù)字特征對(duì)單個(gè)變量數(shù)據(jù)進(jìn)行分析那樣,引入一個(gè)適當(dāng)?shù)摹皵?shù)字特征”,對(duì)成對(duì)樣本數(shù)據(jù)的相關(guān)程度進(jìn)行定量分析呢?二、探究新知
對(duì)于變量x和變量y,設(shè)經(jīng)過隨機(jī)抽樣獲得的成對(duì)樣本數(shù)據(jù)為(x1,y1)、(x2,y2)、…、(xn,yn),其中x1、x2、…、xn和y1、y2、…、yn的均值分別為
和
.將數(shù)據(jù)以(
,
)為零點(diǎn)進(jìn)行平移,得到平移后的成對(duì)數(shù)據(jù)為(x1-,y1-)、(x2-,y2-)、…、(xn-,yn-),并繪制散點(diǎn)圖.二、探究新知
利用上述方法處理下表中的數(shù)據(jù),得到下右圖(左圖是沒處理的數(shù)據(jù)的散點(diǎn)圖).我們發(fā)現(xiàn),這時(shí)的散點(diǎn)大多數(shù)分布在第一象限、第三象限,大多數(shù)散點(diǎn)的橫、縱坐標(biāo)同號(hào).顯然,這樣的規(guī)律是由人體脂肪含量與年齡正相關(guān)所決定的.編號(hào)1234567年齡/歲23273941454950脂肪含量/%9.517.821.225.927.526.328.2編號(hào)891011121314年齡/歲53545657586061脂肪含量/%29.630.231.430.833.535.234.6二、探究新知
一般地,如果變量x和y正相關(guān),那么關(guān)于均值平移后的大多數(shù)散點(diǎn)將分布在第一象限、第三象限,對(duì)應(yīng)的成對(duì)數(shù)據(jù)同號(hào)的居多,如下左圖所示;如果變量x和y負(fù)相關(guān),那么關(guān)于均值平移后的大多數(shù)散點(diǎn)將分布在第二象限、第四象限,對(duì)應(yīng)的成對(duì)數(shù)據(jù)異號(hào)的居多,如下右圖所示.
根據(jù)上述分析,你能利用正相關(guān)變量和負(fù)相關(guān)變量的成對(duì)樣本數(shù)據(jù)平移后呈現(xiàn)的規(guī)律,構(gòu)造一個(gè)度量成對(duì)樣本數(shù)據(jù)是正相關(guān)還是負(fù)相關(guān)的數(shù)字特征嗎?
從上述討論得到啟發(fā),利用散點(diǎn)(xi-,yi-)(i=1,2,…,n)的橫、縱坐標(biāo)是否同號(hào),可以構(gòu)造一個(gè)量
一般情形下,Lxy>0表明成對(duì)樣本數(shù)據(jù)正相關(guān);Lxy<0表明成對(duì)樣本數(shù)據(jù)負(fù)相關(guān).二、探究新知
因?yàn)長(zhǎng)xy的大小與數(shù)據(jù)的度量單位有關(guān),所以不宜直接用它度量成對(duì)樣本數(shù)據(jù)相關(guān)程度的大小.例如,在研究體重與身高之間的相關(guān)程度時(shí),如果體重的單位不變,把身高的單位由米改為厘米,則相應(yīng)的Lxy將變?yōu)樵瓉淼?00倍,但單位的改變并不會(huì)導(dǎo)致體重與身高之間相關(guān)程度的改變.
你認(rèn)為L(zhǎng)xy的大小一定能度量出成對(duì)樣本數(shù)據(jù)的相關(guān)程度嗎?
為了消除度量單位的影響,需要對(duì)數(shù)據(jù)作進(jìn)一步的“標(biāo)準(zhǔn)化”處理.我們用分別除xi-和yi-(i=1,2,…,n),得二、探究新知
仿照Lxy的構(gòu)造,可以得到
為簡(jiǎn)單起見,把上述“標(biāo)準(zhǔn)化”處理后的成對(duì)數(shù)據(jù)分別記為(x'1,y'1),(x'2,y'2),…,(x'n,y'n).二、探究新知
r為變量x和變量y的樣本相關(guān)系數(shù):三、樣本相關(guān)系數(shù)
這樣,我們利用成對(duì)樣本數(shù)據(jù)構(gòu)造了樣本相關(guān)系數(shù)r,樣本相關(guān)系數(shù)r是一個(gè)描述成對(duì)樣本數(shù)據(jù)的數(shù)字特征,它的正負(fù)性和絕對(duì)值的大小可以反映成對(duì)樣本數(shù)據(jù)的變化特征:
當(dāng)r>0時(shí),稱成對(duì)樣本數(shù)據(jù)正相關(guān).這時(shí),當(dāng)其中一個(gè)數(shù)據(jù)的值變小時(shí),另一個(gè)數(shù)據(jù)的值通常也變小;當(dāng)其中一個(gè)數(shù)據(jù)的值變大時(shí),另一個(gè)數(shù)據(jù)的值通常也變大.
當(dāng)r<0時(shí),稱成對(duì)樣本數(shù)據(jù)負(fù)相關(guān).這時(shí),當(dāng)其中一個(gè)數(shù)據(jù)的值變小時(shí),另一個(gè)數(shù)據(jù)的值通常會(huì)變大;當(dāng)其中一個(gè)數(shù)據(jù)的值變大時(shí),另一個(gè)數(shù)據(jù)的值通常會(huì)變小.
那么,樣本相關(guān)系數(shù)r的大小與成對(duì)樣本數(shù)據(jù)的相關(guān)程度有什么內(nèi)在聯(lián)系呢?為此,我們先考察一下r的取值范圍.
觀察r的結(jié)構(gòu),聯(lián)想到二維(平面)向量、三維(空間)向量數(shù)量積的坐標(biāo)表示,我們將向量的維數(shù)推廣到n維,n維向量
的數(shù)量積仍然定義為
其中θ為向量
的夾角.類似于平面或空間向量的坐標(biāo)表示,對(duì)于向量
=(a1,a2,…,an)和
=(b1,b2,…,bn),我們有=a1b1+a2b2+…+anbn三、樣本相關(guān)系數(shù)
設(shè)“標(biāo)準(zhǔn)化”處理后的成對(duì)數(shù)據(jù)(x'1,y'1),(x'2,y'2),…,(x'n,y'n)的第一分量構(gòu)成n維向量第二分量構(gòu)成n維向量則有r=cosθ(θ為向量
的夾角)由-1≤cosθ≤1,可知-1≤r≤1=(x'1,x'2,…,x'n)=(y'1,y'2,…,y'n)r==cosθ
因?yàn)?/p>
=
,所以樣本相關(guān)系數(shù)三、樣本相關(guān)系數(shù)
當(dāng)|r|=1時(shí),成對(duì)樣本數(shù)據(jù)之間具有怎樣的關(guān)系呢?
當(dāng)|r|=1時(shí),r=cosθ中的θ=0或π,向量
共線.由向量的知識(shí)可知,存在實(shí)數(shù)入,使得
,即(i=1,2,…,n)
這時(shí),成對(duì)樣本數(shù)據(jù)的兩個(gè)分量之間滿足一種線性關(guān)系.
這表明成對(duì)樣本數(shù)據(jù)(xi,yi)都落在直線上.三、樣本相關(guān)系數(shù)
由此可見,樣本相關(guān)系數(shù)r的取值范圍為[-1,1]樣本相關(guān)系數(shù)r的絕對(duì)值大小可以反映成對(duì)樣本數(shù)據(jù)之間線性相關(guān)的程度:
當(dāng)|r|越接近1時(shí),成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng);
當(dāng)|r|越接近0時(shí),成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越弱.
樣本相關(guān)系數(shù)r有時(shí)也稱樣本線性相關(guān)系數(shù),
|r|刻畫了樣本點(diǎn)集中于某條直線的程度,當(dāng)r=0時(shí),只表明成對(duì)樣本數(shù)據(jù)間沒有線性相關(guān)關(guān)系,但不排除它們之間有其他相關(guān)關(guān)系.三、樣本相關(guān)系數(shù)
下圖是不同成對(duì)樣本數(shù)據(jù)的散點(diǎn)圖和相應(yīng)的樣本相關(guān)系數(shù).圖(1)中的散點(diǎn)有明顯的從左下角到右上角沿直線分布的趨勢(shì),說明成對(duì)樣本數(shù)據(jù)呈現(xiàn)出線性相關(guān)關(guān)系;樣本相關(guān)系數(shù)r=0.97,表明成對(duì)樣本數(shù)據(jù)的正線性相關(guān)程度很強(qiáng).圖(2)中的散點(diǎn)有明顯的從左上角到右下角沿直線分布的趨勢(shì),說明成對(duì)樣本數(shù)據(jù)也呈現(xiàn)出線性相關(guān)關(guān)系;樣本相關(guān)系數(shù)r=-0.85,表明成對(duì)樣本數(shù)據(jù)的負(fù)線性相關(guān)程度比較強(qiáng).從樣本相關(guān)系數(shù)來看,圖(1)中成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度要比圖(2)中強(qiáng)一些;圖(3)和圖(4)中的成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度很弱,其中圖(4)中成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度極弱.三、樣本相關(guān)系數(shù)
綜上可知,兩個(gè)隨機(jī)變量的相關(guān)性可以通過成對(duì)樣本數(shù)據(jù)進(jìn)行分析,而樣本相關(guān)系數(shù)r可以反映兩個(gè)隨機(jī)變量之間的線性相關(guān)程度:r的符號(hào)反映了相關(guān)關(guān)系的正負(fù)性;|r|的大小反映了兩個(gè)變量線性相關(guān)的程度,即散點(diǎn)集中于一條直線的程度.
在有限總體中,若要確切地了解兩個(gè)變量之間相關(guān)關(guān)系的正負(fù)性及線性相關(guān)的程度,我們可以利用這兩個(gè)變量取值的所有成對(duì)數(shù)據(jù),通過相關(guān)系數(shù)公式就可以計(jì)算出兩個(gè)變量的相關(guān)系數(shù).例如,要確切了解脂肪含量y與年齡x的線性相關(guān)程度,需要調(diào)查所有人的年齡及其脂肪含量,再將得到的成對(duì)數(shù)據(jù)代入相關(guān)系數(shù)公式,計(jì)算出相關(guān)系數(shù).這個(gè)相關(guān)系數(shù)就能確切反映變量之間的相關(guān)程度.
不過,在實(shí)際中,獲得總體中所有的成對(duì)數(shù)據(jù)往往是不容易的.因此,我們還是要用樣本估計(jì)總體的思想來解決問題,也就是說,我們先要通過抽樣獲取兩個(gè)變量的一些成對(duì)樣本數(shù)據(jù),再計(jì)算出樣本相關(guān)系數(shù),通過樣本相關(guān)系數(shù)去估計(jì)總體相關(guān)系數(shù),從而了解兩個(gè)變量之間的相關(guān)程度.對(duì)于簡(jiǎn)單隨機(jī)樣本而言,樣本具有隨機(jī)性,因此樣本相關(guān)系數(shù)r也具有隨機(jī)性.一般地,樣本容量越大,用樣本相關(guān)系數(shù)估計(jì)兩個(gè)變量的相關(guān)系數(shù)的效果越好.三、樣本相關(guān)系數(shù)例1根據(jù)下表中脂肪含量和年齡的樣本數(shù)據(jù),推斷兩個(gè)變量是否線
性相關(guān),計(jì)算樣本相關(guān)系數(shù),并推斷它們的相關(guān)程度.四、精典例題編號(hào)1234567年齡/歲23273941454950脂肪含量/%9.517.821.225.927.526.328.2編號(hào)891011121314年齡/歲53545657586061脂肪含量/%29.630.231.430.833.535.234.6例2有人收集了某城市居民年收入(所有居民在一年內(nèi)收入的總和)
與A商品銷售額的10年數(shù)據(jù),如下表所示.畫出散點(diǎn)圖,推斷成
對(duì)樣本數(shù)據(jù)是否線性相關(guān),并通過樣本相關(guān)系數(shù)推斷居民年收
人與A商品銷售額的相關(guān)程度和變化趨勢(shì)的異同.四、精典例題第n年12345678910居民年收入/億元32.231.132.935.837.138.039.043.044.646.0A商品銷售額/萬元25.030.034.037.039.041.042.044.048.051.0例3在某校高一年級(jí)中隨機(jī)抽取25名男生,測(cè)得他們的身高、體重、
臂展等數(shù)據(jù),如下表所示.
體重與身高、臂展與身高分別具有
怎樣的相關(guān)性?四、精典例題編號(hào)身高/cm體重/cm臂展/cm編號(hào)身高/cm體重/cm臂展/cm117355169141666616121797117015176611663175521721617649165417962177171756017351828217418169481626173631661918486189718055174201695816481708116921182541709169541662217158164101775417623177611
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 農(nóng)民致富種植策略方案
- 農(nóng)業(yè)技術(shù)推廣區(qū)域合作方案
- 中國(guó)污水處理行業(yè)報(bào)告
- 制藥行業(yè)生物制藥工藝優(yōu)化方案
- 辦公室裝修風(fēng)險(xiǎn)免責(zé)協(xié)議
- 垃圾焚燒發(fā)電股
- 電信行業(yè)網(wǎng)絡(luò)優(yōu)化與安全防護(hù)策略方案
- 項(xiàng)目可行性研究報(bào)告指南
- 季度營(yíng)銷活動(dòng)策劃方案
- 汽車銷售與服務(wù)營(yíng)銷策略試題
- 煤礦機(jī)電維護(hù)工職業(yè)技能理論考試題庫(kù)150題(含答案)
- 《黑格爾哲學(xué)思想》課件
- 2025年華能銅川照金煤電有限公司招聘筆試參考題庫(kù)含答案解析
- GB 17681-2024危險(xiǎn)化學(xué)品重大危險(xiǎn)源安全監(jiān)控技術(shù)規(guī)范
- 標(biāo)準(zhǔn)化考場(chǎng)建設(shè)投標(biāo)方案
- 安徽財(cái)經(jīng)大學(xué)2023年計(jì)算機(jī)C語(yǔ)言考試試卷(含六卷)含答案解析
- 2024-2024年上海市高考英語(yǔ)試題及答案
- 智研咨詢發(fā)布:中國(guó)智能檢測(cè)裝備行業(yè)發(fā)展現(xiàn)狀、產(chǎn)業(yè)全景概覽及投資方向分析報(bào)告
- 大數(shù)據(jù)可視化智慧樹知到答案2024年浙江大學(xué)
- 【完整版】2020-2025年中國(guó)大語(yǔ)文培訓(xùn)行業(yè)發(fā)展戰(zhàn)略制定與實(shí)施研究報(bào)告
- 專題11 電磁感應(yīng)-2024物理高考真題及模考題分類匯編
評(píng)論
0/150
提交評(píng)論