【數(shù)學(xué)】樣本相關(guān)系數(shù)課件-2023-2024學(xué)年高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)_第1頁(yè)
【數(shù)學(xué)】樣本相關(guān)系數(shù)課件-2023-2024學(xué)年高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)_第2頁(yè)
【數(shù)學(xué)】樣本相關(guān)系數(shù)課件-2023-2024學(xué)年高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)_第3頁(yè)
【數(shù)學(xué)】樣本相關(guān)系數(shù)課件-2023-2024學(xué)年高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)_第4頁(yè)
【數(shù)學(xué)】樣本相關(guān)系數(shù)課件-2023-2024學(xué)年高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

8.1.2樣本相關(guān)系數(shù)一、知識(shí)回顧1.正相關(guān)和負(fù)相關(guān):

2.線性相關(guān):

3.非線性相關(guān)或曲線相關(guān):

如果從整體上看,當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的

相應(yīng)值也呈現(xiàn)增加的趨勢(shì),我們就稱這兩個(gè)變量正相關(guān);如果當(dāng)

一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值呈現(xiàn)減少的趨勢(shì),

則稱這兩個(gè)變量負(fù)相關(guān).

一般地,如果兩個(gè)變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且

散點(diǎn)落在一條直線附近,我們就稱這兩個(gè)變量線性相關(guān).

一般地,如果兩個(gè)變量具有相關(guān)性,但不是線性相關(guān),那么

我們就稱這兩個(gè)變量非線性相關(guān)或曲線相關(guān).

通過觀察散點(diǎn)圖中成對(duì)樣本數(shù)據(jù)的分布規(guī)律,我們可以大致推斷兩個(gè)變量是否存在相關(guān)關(guān)系、是正相關(guān)還是負(fù)相關(guān)、是線性相關(guān)還是非線性相關(guān)等.散點(diǎn)圖雖然直觀,但無法確切地反映成對(duì)樣本數(shù)據(jù)的相關(guān)程度,也就無法量化兩個(gè)變量之間相關(guān)程度的大小.能否像引入平均值、方差等數(shù)字特征對(duì)單個(gè)變量數(shù)據(jù)進(jìn)行分析那樣,引入一個(gè)適當(dāng)?shù)摹皵?shù)字特征”,對(duì)成對(duì)樣本數(shù)據(jù)的相關(guān)程度進(jìn)行定量分析呢?二、探究新知

對(duì)于變量x和變量y,設(shè)經(jīng)過隨機(jī)抽樣獲得的成對(duì)樣本數(shù)據(jù)為(x1,y1)、(x2,y2)、…、(xn,yn),其中x1、x2、…、xn和y1、y2、…、yn的均值分別為

.將數(shù)據(jù)以(

,

)為零點(diǎn)進(jìn)行平移,得到平移后的成對(duì)數(shù)據(jù)為(x1-,y1-)、(x2-,y2-)、…、(xn-,yn-),并繪制散點(diǎn)圖.二、探究新知

利用上述方法處理下表中的數(shù)據(jù),得到下右圖(左圖是沒處理的數(shù)據(jù)的散點(diǎn)圖).我們發(fā)現(xiàn),這時(shí)的散點(diǎn)大多數(shù)分布在第一象限、第三象限,大多數(shù)散點(diǎn)的橫、縱坐標(biāo)同號(hào).顯然,這樣的規(guī)律是由人體脂肪含量與年齡正相關(guān)所決定的.編號(hào)1234567年齡/歲23273941454950脂肪含量/%9.517.821.225.927.526.328.2編號(hào)891011121314年齡/歲53545657586061脂肪含量/%29.630.231.430.833.535.234.6二、探究新知

一般地,如果變量x和y正相關(guān),那么關(guān)于均值平移后的大多數(shù)散點(diǎn)將分布在第一象限、第三象限,對(duì)應(yīng)的成對(duì)數(shù)據(jù)同號(hào)的居多,如下左圖所示;如果變量x和y負(fù)相關(guān),那么關(guān)于均值平移后的大多數(shù)散點(diǎn)將分布在第二象限、第四象限,對(duì)應(yīng)的成對(duì)數(shù)據(jù)異號(hào)的居多,如下右圖所示.

根據(jù)上述分析,你能利用正相關(guān)變量和負(fù)相關(guān)變量的成對(duì)樣本數(shù)據(jù)平移后呈現(xiàn)的規(guī)律,構(gòu)造一個(gè)度量成對(duì)樣本數(shù)據(jù)是正相關(guān)還是負(fù)相關(guān)的數(shù)字特征嗎?

從上述討論得到啟發(fā),利用散點(diǎn)(xi-,yi-)(i=1,2,…,n)的橫、縱坐標(biāo)是否同號(hào),可以構(gòu)造一個(gè)量

一般情形下,Lxy>0表明成對(duì)樣本數(shù)據(jù)正相關(guān);Lxy<0表明成對(duì)樣本數(shù)據(jù)負(fù)相關(guān).二、探究新知

因?yàn)長(zhǎng)xy的大小與數(shù)據(jù)的度量單位有關(guān),所以不宜直接用它度量成對(duì)樣本數(shù)據(jù)相關(guān)程度的大小.例如,在研究體重與身高之間的相關(guān)程度時(shí),如果體重的單位不變,把身高的單位由米改為厘米,則相應(yīng)的Lxy將變?yōu)樵瓉淼?00倍,但單位的改變并不會(huì)導(dǎo)致體重與身高之間相關(guān)程度的改變.

你認(rèn)為L(zhǎng)xy的大小一定能度量出成對(duì)樣本數(shù)據(jù)的相關(guān)程度嗎?

為了消除度量單位的影響,需要對(duì)數(shù)據(jù)作進(jìn)一步的“標(biāo)準(zhǔn)化”處理.我們用分別除xi-和yi-(i=1,2,…,n),得二、探究新知

仿照Lxy的構(gòu)造,可以得到

為簡(jiǎn)單起見,把上述“標(biāo)準(zhǔn)化”處理后的成對(duì)數(shù)據(jù)分別記為(x'1,y'1),(x'2,y'2),…,(x'n,y'n).二、探究新知

r為變量x和變量y的樣本相關(guān)系數(shù):三、樣本相關(guān)系數(shù)

這樣,我們利用成對(duì)樣本數(shù)據(jù)構(gòu)造了樣本相關(guān)系數(shù)r,樣本相關(guān)系數(shù)r是一個(gè)描述成對(duì)樣本數(shù)據(jù)的數(shù)字特征,它的正負(fù)性和絕對(duì)值的大小可以反映成對(duì)樣本數(shù)據(jù)的變化特征:

當(dāng)r>0時(shí),稱成對(duì)樣本數(shù)據(jù)正相關(guān).這時(shí),當(dāng)其中一個(gè)數(shù)據(jù)的值變小時(shí),另一個(gè)數(shù)據(jù)的值通常也變小;當(dāng)其中一個(gè)數(shù)據(jù)的值變大時(shí),另一個(gè)數(shù)據(jù)的值通常也變大.

當(dāng)r<0時(shí),稱成對(duì)樣本數(shù)據(jù)負(fù)相關(guān).這時(shí),當(dāng)其中一個(gè)數(shù)據(jù)的值變小時(shí),另一個(gè)數(shù)據(jù)的值通常會(huì)變大;當(dāng)其中一個(gè)數(shù)據(jù)的值變大時(shí),另一個(gè)數(shù)據(jù)的值通常會(huì)變小.

那么,樣本相關(guān)系數(shù)r的大小與成對(duì)樣本數(shù)據(jù)的相關(guān)程度有什么內(nèi)在聯(lián)系呢?為此,我們先考察一下r的取值范圍.

觀察r的結(jié)構(gòu),聯(lián)想到二維(平面)向量、三維(空間)向量數(shù)量積的坐標(biāo)表示,我們將向量的維數(shù)推廣到n維,n維向量

的數(shù)量積仍然定義為

其中θ為向量

的夾角.類似于平面或空間向量的坐標(biāo)表示,對(duì)于向量

=(a1,a2,…,an)和

=(b1,b2,…,bn),我們有=a1b1+a2b2+…+anbn三、樣本相關(guān)系數(shù)

設(shè)“標(biāo)準(zhǔn)化”處理后的成對(duì)數(shù)據(jù)(x'1,y'1),(x'2,y'2),…,(x'n,y'n)的第一分量構(gòu)成n維向量第二分量構(gòu)成n維向量則有r=cosθ(θ為向量

的夾角)由-1≤cosθ≤1,可知-1≤r≤1=(x'1,x'2,…,x'n)=(y'1,y'2,…,y'n)r==cosθ

因?yàn)?/p>

=

,所以樣本相關(guān)系數(shù)三、樣本相關(guān)系數(shù)

當(dāng)|r|=1時(shí),成對(duì)樣本數(shù)據(jù)之間具有怎樣的關(guān)系呢?

當(dāng)|r|=1時(shí),r=cosθ中的θ=0或π,向量

共線.由向量的知識(shí)可知,存在實(shí)數(shù)入,使得

,即(i=1,2,…,n)

這時(shí),成對(duì)樣本數(shù)據(jù)的兩個(gè)分量之間滿足一種線性關(guān)系.

這表明成對(duì)樣本數(shù)據(jù)(xi,yi)都落在直線上.三、樣本相關(guān)系數(shù)

由此可見,樣本相關(guān)系數(shù)r的取值范圍為[-1,1]樣本相關(guān)系數(shù)r的絕對(duì)值大小可以反映成對(duì)樣本數(shù)據(jù)之間線性相關(guān)的程度:

當(dāng)|r|越接近1時(shí),成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng);

當(dāng)|r|越接近0時(shí),成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越弱.

樣本相關(guān)系數(shù)r有時(shí)也稱樣本線性相關(guān)系數(shù),

|r|刻畫了樣本點(diǎn)集中于某條直線的程度,當(dāng)r=0時(shí),只表明成對(duì)樣本數(shù)據(jù)間沒有線性相關(guān)關(guān)系,但不排除它們之間有其他相關(guān)關(guān)系.三、樣本相關(guān)系數(shù)

下圖是不同成對(duì)樣本數(shù)據(jù)的散點(diǎn)圖和相應(yīng)的樣本相關(guān)系數(shù).圖(1)中的散點(diǎn)有明顯的從左下角到右上角沿直線分布的趨勢(shì),說明成對(duì)樣本數(shù)據(jù)呈現(xiàn)出線性相關(guān)關(guān)系;樣本相關(guān)系數(shù)r=0.97,表明成對(duì)樣本數(shù)據(jù)的正線性相關(guān)程度很強(qiáng).圖(2)中的散點(diǎn)有明顯的從左上角到右下角沿直線分布的趨勢(shì),說明成對(duì)樣本數(shù)據(jù)也呈現(xiàn)出線性相關(guān)關(guān)系;樣本相關(guān)系數(shù)r=-0.85,表明成對(duì)樣本數(shù)據(jù)的負(fù)線性相關(guān)程度比較強(qiáng).從樣本相關(guān)系數(shù)來看,圖(1)中成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度要比圖(2)中強(qiáng)一些;圖(3)和圖(4)中的成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度很弱,其中圖(4)中成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度極弱.三、樣本相關(guān)系數(shù)

綜上可知,兩個(gè)隨機(jī)變量的相關(guān)性可以通過成對(duì)樣本數(shù)據(jù)進(jìn)行分析,而樣本相關(guān)系數(shù)r可以反映兩個(gè)隨機(jī)變量之間的線性相關(guān)程度:r的符號(hào)反映了相關(guān)關(guān)系的正負(fù)性;|r|的大小反映了兩個(gè)變量線性相關(guān)的程度,即散點(diǎn)集中于一條直線的程度.

在有限總體中,若要確切地了解兩個(gè)變量之間相關(guān)關(guān)系的正負(fù)性及線性相關(guān)的程度,我們可以利用這兩個(gè)變量取值的所有成對(duì)數(shù)據(jù),通過相關(guān)系數(shù)公式就可以計(jì)算出兩個(gè)變量的相關(guān)系數(shù).例如,要確切了解脂肪含量y與年齡x的線性相關(guān)程度,需要調(diào)查所有人的年齡及其脂肪含量,再將得到的成對(duì)數(shù)據(jù)代入相關(guān)系數(shù)公式,計(jì)算出相關(guān)系數(shù).這個(gè)相關(guān)系數(shù)就能確切反映變量之間的相關(guān)程度.

不過,在實(shí)際中,獲得總體中所有的成對(duì)數(shù)據(jù)往往是不容易的.因此,我們還是要用樣本估計(jì)總體的思想來解決問題,也就是說,我們先要通過抽樣獲取兩個(gè)變量的一些成對(duì)樣本數(shù)據(jù),再計(jì)算出樣本相關(guān)系數(shù),通過樣本相關(guān)系數(shù)去估計(jì)總體相關(guān)系數(shù),從而了解兩個(gè)變量之間的相關(guān)程度.對(duì)于簡(jiǎn)單隨機(jī)樣本而言,樣本具有隨機(jī)性,因此樣本相關(guān)系數(shù)r也具有隨機(jī)性.一般地,樣本容量越大,用樣本相關(guān)系數(shù)估計(jì)兩個(gè)變量的相關(guān)系數(shù)的效果越好.三、樣本相關(guān)系數(shù)例1根據(jù)下表中脂肪含量和年齡的樣本數(shù)據(jù),推斷兩個(gè)變量是否線

性相關(guān),計(jì)算樣本相關(guān)系數(shù),并推斷它們的相關(guān)程度.四、精典例題編號(hào)1234567年齡/歲23273941454950脂肪含量/%9.517.821.225.927.526.328.2編號(hào)891011121314年齡/歲53545657586061脂肪含量/%29.630.231.430.833.535.234.6例2有人收集了某城市居民年收入(所有居民在一年內(nèi)收入的總和)

與A商品銷售額的10年數(shù)據(jù),如下表所示.畫出散點(diǎn)圖,推斷成

對(duì)樣本數(shù)據(jù)是否線性相關(guān),并通過樣本相關(guān)系數(shù)推斷居民年收

人與A商品銷售額的相關(guān)程度和變化趨勢(shì)的異同.四、精典例題第n年12345678910居民年收入/億元32.231.132.935.837.138.039.043.044.646.0A商品銷售額/萬元25.030.034.037.039.041.042.044.048.051.0例3在某校高一年級(jí)中隨機(jī)抽取25名男生,測(cè)得他們的身高、體重、

臂展等數(shù)據(jù),如下表所示.

體重與身高、臂展與身高分別具有

怎樣的相關(guān)性?四、精典例題編號(hào)身高/cm體重/cm臂展/cm編號(hào)身高/cm體重/cm臂展/cm117355169141666616121797117015176611663175521721617649165417962177171756017351828217418169481626173631661918486189718055174201695816481708116921182541709169541662217158164101775417623177611

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論