第八章 成對數(shù)據(jù)的統(tǒng)計分析(公式、定理、結(jié)論圖表)-2023年高考數(shù)學(xué)知識手冊(新教材)_第1頁
第八章 成對數(shù)據(jù)的統(tǒng)計分析(公式、定理、結(jié)論圖表)-2023年高考數(shù)學(xué)知識手冊(新教材)_第2頁
第八章 成對數(shù)據(jù)的統(tǒng)計分析(公式、定理、結(jié)論圖表)-2023年高考數(shù)學(xué)知識手冊(新教材)_第3頁
第八章 成對數(shù)據(jù)的統(tǒng)計分析(公式、定理、結(jié)論圖表)-2023年高考數(shù)學(xué)知識手冊(新教材)_第4頁
第八章 成對數(shù)據(jù)的統(tǒng)計分析(公式、定理、結(jié)論圖表)-2023年高考數(shù)學(xué)知識手冊(新教材)_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第八章成對數(shù)據(jù)的統(tǒng)計分析(公式、定理、結(jié)論圖表)

I、思維導(dǎo)圖

樣本相關(guān)系數(shù)

數(shù)值變量

相關(guān)性

一元線性回歸模型

成對數(shù)據(jù)

分類變量

2X2列聯(lián)表獨立性檢粉

I、知識梳理

一、成對數(shù)據(jù)的統(tǒng)計相關(guān)性

1.變量的相關(guān)關(guān)系

(1)函數(shù)關(guān)系

函數(shù)關(guān)系是一種確定性關(guān)系,常用解析式來表示.

(2)相關(guān)關(guān)系

兩個變量有關(guān)系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關(guān)系稱為相關(guān)關(guān)

系.與函數(shù)關(guān)系不同,相關(guān)關(guān)系是一種非確定性關(guān)系.

2.散點圖

⑴散點圖

成對樣本數(shù)據(jù)都可用直角坐標(biāo)系中的點表示出來,由這些點組成的統(tǒng)計圖叫做散點圖.

(2)正相關(guān)和負(fù)相關(guān)

如果從整體上看,

當(dāng)一個變量的值增加時.,另一個變量的相應(yīng)值也呈現(xiàn)增加的趨勢,我們就稱這兩個變量正相關(guān);

如果當(dāng)一個變量的值增加時,另一個變量的相應(yīng)值呈現(xiàn)減少的趨勢,則稱這兩個變量負(fù)相關(guān).

y↑

°正相關(guān)X0負(fù)相關(guān)X

3.線性相關(guān)

一般地,如果兩個變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點落在一條直線附近,則稱這兩個變量線性相關(guān).

4.樣本相關(guān)系數(shù)

(1)對于變量X和變量y,設(shè)經(jīng)過隨機(jī)抽樣獲得的成對樣本數(shù)據(jù)為(汨,“),(X2,g),…,(x,,%),利用相關(guān)

系數(shù),?來衡量兩個變量之間線性關(guān)系的強(qiáng)弱,相關(guān)系數(shù)r的計算公式:

C(X,-x)(%-?)52%%~nx-y

r=/廠==/'7----(其中M,了2,…,X“和

aL丁卮…2√∑^2--2)∑k-^2)

yl,y2>…,%的均值分別為X和夕).

①當(dāng),>0時,稱成對樣本數(shù)據(jù)正相關(guān).這時,當(dāng)其中一個數(shù)據(jù)的值變小時,另一個數(shù)據(jù)的值通常也變小;當(dāng)

其中一個數(shù)據(jù)的值變大時,另一個數(shù)據(jù)的值通常也變大.

②當(dāng)xθ時,稱成對樣本數(shù)據(jù)負(fù)相關(guān).這時,當(dāng)其中一個數(shù)據(jù)的值變小時,另一個數(shù)據(jù)的值通常會變大;當(dāng)

其中一個數(shù)據(jù)的值變大時,另一個數(shù)據(jù)的值通常會變小.

二、一元線性回歸模型及其應(yīng)用

1.線性回歸方程:

(1)最小二乘法:使得樣本數(shù)據(jù)的點到回歸直線的距離的平方和最小的方法叫做最小二乘法.

(2)回歸方程:兩個具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù):(χ∣,χ),(χ2,%),?,(x,,,K),其回歸方程

__

Yjxiyj-nxy

b-^-

為y=bx+α則《£尤;-〃:注意:線性回歸直線經(jīng)過定點缶5).

/=1

a=y-bx.

(3)相關(guān)系數(shù):

【方法歸納】

(1)利用散點圖判斷兩個變量是否有相關(guān)關(guān)系是比較直觀簡便的方法.如果所有的樣本點都落在某一函數(shù)

的曲線附近,變量之間就有相關(guān)關(guān)系.如果所有的樣本點都落在某一直線附近,變量之間就有線性相關(guān)關(guān)

系.若點散布在從左下角到右上角的區(qū)域,則正相關(guān).

(2)利用相關(guān)系數(shù)判定,當(dāng)M越趨近于1相關(guān)性越強(qiáng).當(dāng)殘差平方和越小,相關(guān)指數(shù)R?越大,相關(guān)性越

強(qiáng).

(3)在分析實際中兩個變量的相關(guān)關(guān)系時,可根據(jù)樣本數(shù)據(jù)作出散點圖來確定兩個變量之間是否具有相關(guān)

關(guān)系,也可計算相關(guān)系數(shù)r進(jìn)行判斷.若具有線性相關(guān)關(guān)系,則可通過線性回歸方程估計和預(yù)測變量的值.

(4)正確運(yùn)用計算b,a的公式和準(zhǔn)確的計算,是求線性回歸方程的關(guān)鍵.并充分利用回歸直線y=Λx+α

過樣本點的中心G,亍)進(jìn)行求值.

2、回歸分析:對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析的一種常用方法。

建立回歸模型的基本步驟是:

(1)確定研究對象,明確兩個變量即解釋變量和預(yù)報變量;

(2)畫出散點圖,觀察它們之間的關(guān)系;

(3)由經(jīng)驗確定回歸方程類型(若呈線性關(guān)系,選用線性回歸方程);

(4)按一定規(guī)則估計回歸方程中的參數(shù)(如最小二乘法);

(5)得出結(jié)果后分析殘差圖是否有異常(個別數(shù)據(jù)對應(yīng)殘差過大,或殘差出現(xiàn)不隨機(jī)的規(guī)律性,等等),若

存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等。

三、列寐表與獨立性檢驗

1.2x2列聯(lián)表

設(shè)X,y為兩個變量,它們的取值分別為{芯,々}和{必,%},其樣本頻數(shù)列聯(lián)表(2x2列聯(lián)表)如下:

??總計

y2

?laba+b

X2cdc+d

總計a+ch+da+b+c+d

2.獨立性檢驗

利用隨機(jī)變量K2(也可表示為/)?-~〃(叱Tc)_(其中〃=a+。+。+]為樣本容量)來

(a+b)(c+d)(a+c)(b+d)

判斷“兩個變量有關(guān)系''的方法稱為獨立性檢驗.

3.獨立性檢驗的一般步驟

⑴根據(jù)樣本數(shù)據(jù)列出2x2列聯(lián)表;

(2)計算隨機(jī)變量K2的觀測值k,查下表確定臨界值履:

pN≥k°)0.500.400.250.150.1000.0500.0250.0100.0050.001

ko0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828

(3)如果k≥z°,就推斷“X與Y有關(guān)系”,這種推斷犯錯誤的概率不超過p(κ2≥%o);否則,就認(rèn)為在犯錯

誤的概率不超過P(K2≥ZO)的前提下不能推斷“X與Y有關(guān)系”.

典例1;研究某灌溉渠道水的流速y與水深X之間的關(guān)系,測得一組數(shù)據(jù)如下:

水深%/加1.40L501.601.701.801.902.002.10

流速y∕(m?s~i)1.701.791.881.952.032.102.162.21

(1)求y對X的回歸直線方程;

(2)預(yù)測水深為1.95加時水的流速是多少?

分析:本題考查如何求回歸直線的方程,可先把有關(guān)數(shù)據(jù)用散點圖表示出來,若這些點大致分布在通過散點

圖中心的一條直線附近,說明這兩個變量線性相關(guān),從而可利用我們學(xué)過的最小二乘估計思想及計算公式求

得線性回歸直線方程。

【解析】(I)由于問題中要求根據(jù)水深預(yù)報水的流速,

因此選取水深為解釋變量,流速為預(yù)報變量,作散點圖:

由圖容易看出,X與y之間有近似的線性關(guān)系,

或者說,可以用一個回歸直線方程a=晟+a來反映這種關(guān)系,

A11

由計算可求得力=Ua0.733、a≈0.694,

15

對X的回歸直線方程為9=0.733x+0.694:

(2)由(1)中求出的回歸直線方程,把X=L95代入,易得:

?=0.733×1.95+0.694≈2.12(ΛΠ∕5),

計算結(jié)果表示,當(dāng)水深為1.95m時可以預(yù)測渠水的流速為2.12m/s。

典例2:電容器充電后,電壓達(dá)到IOOV,然后開始放電,由經(jīng)驗知道,此后電壓U隨時間f變化的規(guī)律公

式U=A?e"(b<0)表示,觀測得時間f(s)時的電壓U(V)如下表所示:

t0]2345678910

~u~100^^5^3T~4(Γ^30^20∏5^"?^κΓ虧~τ~

試求電壓U對時間f的回歸方程。

【分析】由于兩個變量不呈線性相關(guān)關(guān)系,所以不能直接利用線性回歸方程來建立兩個變量之間的關(guān)

系,我們可通過對數(shù)變換把指數(shù)關(guān)系變?yōu)榫€性關(guān)系,通過線性回歸模型來建立U與t之間的非線性回歸方程。

【解析】對U=A?e”兩邊取自然對數(shù)得:InU=InA+9,令y=lnU,α=lnA,即y=bf+α,

由所給數(shù)據(jù)可得:

t01_2345678910

4.64.3403.93.42.92.72.32.31.61.6

其散點圖為:

ιp129494t?9IO

由散點圖可知y與f具有線性相關(guān)關(guān)系,可用夕=自+力來表示,

經(jīng)計算得:f=5、?=3.1,b≈0.3,a≈4.6,

+

.?.?=-0.3z+4.6,即Inu=-0.3f+4.6,:.U=e^'^

【評注】一般地,有些非線性回歸模型通過變換可以轉(zhuǎn)化為線性回歸模型,即借助于線性回歸模型研究

呈非線性回歸關(guān)系的兩個變量之間的關(guān)系:

(1)如果散點圖中的點分布在一個直線狀帶形區(qū)域,可以選用線性回歸模型來建模:

(2)如果散點圖中的點的分布在一個曲線狀帶形區(qū)域,要先對變量作適當(dāng)?shù)淖儞Q,再利用線性回歸模型來

建模。

典例3:為了探究患慢性氣管炎是否與吸煙有關(guān),調(diào)查了339名50歲以上的人,調(diào)查結(jié)果如下表所示:

患病不患病合計

吸煙43162205

不吸煙13121134

合計56283339

試問:50歲以上的人患慢性氣管炎與吸煙習(xí)慣有關(guān)嗎?

【分析】最理想的解決辦法是向所有50歲以上的人作調(diào)查,然后對所得到的數(shù)據(jù)進(jìn)行統(tǒng)計處理,但這

花費的代價太大,實際上是行不通的,339人相對于全體50歲以上的人,只是一個小部分,已學(xué)過總體和

樣本的關(guān)系,當(dāng)用樣本平均數(shù),樣本方差去估計總體相應(yīng)的數(shù)字特征時,由于抽樣的隨機(jī)性,結(jié)果并不唯一。

現(xiàn)在情況類似,我們用部分對全體作推斷,推斷可能正確,也可能錯誤。如果抽取的339個調(diào)查對象中很多

人是吸煙但沒患慢性氣管炎,而雖不吸煙因身體體質(zhì)差而患慢性氣管炎,能夠得出什么結(jié)論呢?我們有95%

(或99%)的把握說事件A與事件8有關(guān),是指推斷犯錯誤的可能性為5%(或1%),這也常常說成是“以

95%(或99%)的概率”是一樣的。

【解析】根據(jù)列聯(lián)表中的數(shù)據(jù),得K?=339X(43XI2I62*13)~=7469,

205×134×56×283

V7.469>6.635,二我們有99%的把握說50歲以上的人患慢性氣管炎與吸煙習(xí)慣有關(guān)。

【評注】對兩個分類變量進(jìn)行獨立性檢驗,要對樣本的選取背景、時間等因素進(jìn)行分析。

典例4:為考察某種藥物預(yù)防疾病的效果,進(jìn)行動物試驗,得到如下的列聯(lián)列表:

藥物效果與動物試驗列聯(lián)表

患病未患病總計

服用藥104555

沒服用藥203050

總計3075105

請問能有多大把握認(rèn)為藥物有效?

【解析】假設(shè)“服藥情況與是否患病之間沒有關(guān)系”,則K?的值應(yīng)比較小,

如果K2的值很大,則說明很可能“服藥情況與是否患病之間有關(guān)系”,

由題目中所給數(shù)據(jù)計算,得K2的觀測值為?≈6.110,

而P(∕f2>5.024)≈0.025,二有97.5%的把握認(rèn)為“服藥情況與是否患病之間有關(guān)系”,

即大約有97.5%的把握認(rèn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論