成對數(shù)據(jù)的統(tǒng)計分析 高三數(shù)學(xué)一輪復(fù)習(xí)_第1頁
成對數(shù)據(jù)的統(tǒng)計分析 高三數(shù)學(xué)一輪復(fù)習(xí)_第2頁
成對數(shù)據(jù)的統(tǒng)計分析 高三數(shù)學(xué)一輪復(fù)習(xí)_第3頁
成對數(shù)據(jù)的統(tǒng)計分析 高三數(shù)學(xué)一輪復(fù)習(xí)_第4頁
成對數(shù)據(jù)的統(tǒng)計分析 高三數(shù)學(xué)一輪復(fù)習(xí)_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

成對數(shù)據(jù)的統(tǒng)計分析一輪復(fù)習(xí)專題概率與統(tǒng)計高考

數(shù)學(xué)考點清單題型清單目錄考點1變量間的相關(guān)關(guān)系考點2列聯(lián)表和獨立性檢驗題型1變量間的相關(guān)關(guān)系及回歸方程題型2獨立性檢驗考點1變量間的相關(guān)關(guān)系1.相關(guān)關(guān)系兩個變量有關(guān)系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種

關(guān)系稱為相關(guān)關(guān)系.溫馨提示

相關(guān)關(guān)系與函數(shù)關(guān)系均是指兩個變量的關(guān)系,但函數(shù)關(guān)系是一種確定的關(guān)系,相

關(guān)關(guān)系是一種非確定的關(guān)系.2.散點圖將各數(shù)據(jù)在平面直角坐標系中的對應(yīng)點畫出來,得到表示兩個變量的一組數(shù)據(jù)的圖

形,這樣的圖形叫做散點圖.利用散點圖,可以判斷兩個變量是否相關(guān),相關(guān)時是正相關(guān)

還是負相關(guān).3.正相關(guān)和負相關(guān)(1)正相關(guān):從整體上看,當一個變量的值增加時,另一個變量的相應(yīng)值也呈現(xiàn)增加的趨

勢,我們就稱這兩個變量正相關(guān).(2)負相關(guān):從整體上看,當一個變量的值增加時,另一個變量的相應(yīng)值呈現(xiàn)減少的趨勢,

則稱這兩個變量負相關(guān).4.線性相關(guān)和非線性相關(guān)(1)一般地,如果兩個變量的取值呈現(xiàn)正相關(guān)或負相關(guān),而且散點落在一條直線附近,我

們就稱這兩個變量線性相關(guān).(2)一般地,如果兩個變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個變量非線

性相關(guān)或曲線相關(guān).5.樣本相關(guān)系數(shù)(1)r=

=

,稱r為變量x和變量y的樣本相關(guān)系數(shù).(2)樣本相關(guān)系數(shù)r是一個描述成對樣本數(shù)據(jù)的數(shù)字特征,它的正負性和絕對值的大小

可以反映成對樣本數(shù)據(jù)的變化特征:①當r>0時,稱成對樣本數(shù)據(jù)正相關(guān);②當r<0時,稱成對樣本數(shù)據(jù)負相關(guān).(3)樣本相關(guān)系數(shù)r的取值范圍為[-1,1],樣本相關(guān)系數(shù)r的絕對值大小可以反映成對數(shù)據(jù)

之間線性相關(guān)的程度:①當|r|越接近1時,成對數(shù)據(jù)的線性相關(guān)程度越強;②當|r|越接近0時,成對數(shù)據(jù)的線性相關(guān)程度越弱.6.經(jīng)驗回歸方程我們將

=

x+

稱為Y關(guān)于x的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公式,其圖形稱為經(jīng)驗回歸直線,其中

溫馨提示1.經(jīng)驗回歸方程不一定都有實際意義.回歸分析是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)

計分析的方法,只有在散點圖大致呈線性時,求出的經(jīng)驗回歸方程才有實際意義.2.根據(jù)經(jīng)驗回歸方程進行預(yù)測,得到的僅是一個估計值,而不一定是真實發(fā)生的值.3.經(jīng)驗回歸直線一定過樣本點的中心,即必過點(

,

).7.利用決定系數(shù)R2刻畫回歸效果R2的計算公式為R2=1-

,其意義是R2越大,殘差平方和

(yi-

)2越小,即模型的擬合效果越好;R2越小,殘差平方和

(yi-

)2越大,即模型的擬合效果越差.考點2列聯(lián)表和獨立性檢驗1.2×2列聯(lián)表假設(shè)兩個分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其2×2列聯(lián)表為XY合計y1y2x1aba+bx2cdc+d合計a+cb+da+b+c+d2×2列聯(lián)表給出了成對分類變量數(shù)據(jù)的交叉分類頻數(shù).可構(gòu)造一個隨機變量χ2=

,其中n=a+b+c+d為樣本容量.2.獨立性檢驗利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ2獨立性檢驗,讀作“卡方獨立

性檢驗”,簡稱獨立性檢驗.即練即清1.判斷正誤(對的打“√”,錯的打“?”)(1)散點圖是判斷兩個變量是否相關(guān)的一種重要方法和手段.

(

)(2)殘差平方和越大,模型的擬合效果越好.

(

)(3)經(jīng)驗回歸方程

=

x+

中,若

<0,則變量x和y負相關(guān).

(

)(4)2×2列聯(lián)表是借助兩個分類變量之間頻率大小差異說明兩個變量之間是否有關(guān)聯(lián).

(

)(5)若分類變量X,Y關(guān)系越密切,則由觀測數(shù)據(jù)計算得到的χ2的觀測值越小.

(

)√××√×2.甲、乙、丙、丁四位同學(xué)在建立變量x,y的回歸模型時,分別選擇了4種不同模型,計

算可得它們的R2分別如下表:

甲乙丙丁R20.980.780.500.85建立的回歸模型擬合效果最好的是

.甲題型1變量間的相關(guān)關(guān)系及回歸方程1.兩個變量是否相關(guān)的判斷方法(1)畫散點圖:點的分布從左下角到右上角,兩個變量正相關(guān);點的分布從左上角到右下

角,兩個變量負相關(guān).(2)樣本相關(guān)系數(shù);當r>0時,正相關(guān);當r<0時,負相關(guān);|r|越接近于1,相關(guān)性越強.(3)決定系數(shù)法:利用決定系數(shù)判斷,R2越接近1,模型的擬合效果越好,相關(guān)性越強.2.求經(jīng)驗回歸方程的步驟(1)計算出

、

+

+…+

、x1y1+x2y2+…+xnyn;(2)計算

、

;(3)寫出經(jīng)驗回歸方程

=

x+

.3.經(jīng)驗回歸方程的應(yīng)用(1)若已知經(jīng)驗回歸方程(方程中無參數(shù)),則把自變量代入經(jīng)驗回歸方程即可對因變量

進行預(yù)測.(2)若經(jīng)驗回歸方程中有參數(shù),則根據(jù)經(jīng)驗回歸直線一定經(jīng)過點(

,

)求出參數(shù)值,得到經(jīng)驗回歸方程,進而完成預(yù)測.例1

(2023四川成都石室中學(xué)三模,17)“城市公交”泛指城市范圍內(nèi)定線運營的公共

汽車及軌道交通等交通方式,也是人們?nèi)粘3鲂械闹饕绞?某城市的公交公司為了

方便市民出行,科學(xué)規(guī)劃車輛投放,在一個人員密集流動地段增設(shè)一個起點站,為了研

究車輛發(fā)車間隔時間x與乘客等候人數(shù)y之間的關(guān)系,經(jīng)過調(diào)查得到如下數(shù)據(jù):間隔時間(x分

鐘)68101214等候人數(shù)(y人)1518202423(1)根據(jù)以上數(shù)據(jù)作出散點圖,易知可用線性回歸模型擬合y與x的關(guān)系,請用相關(guān)系數(shù)

加以說明;(2)建立y關(guān)于x的經(jīng)驗回歸方程,并預(yù)測車輛發(fā)車間隔時間為20分鐘時乘客的等候人

數(shù).附:對于一組數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其經(jīng)驗回歸直線

=

x+

的斜率和截距的最小二乘估計公式分別為

=

=

,

=

-

;相關(guān)系數(shù)r=

;3

≈11.62.

解析

(1)由題意,知

=10,

=20,

(1分)

(xi-

)(yi-

)=(6-10)×(15-20)+(8-10)×(18-20)+(10-10)×(20-20)+(12-10)×(24-20)+(14-10)×(23-20)=20+4+0+8+12=44,

(3分)

(xi-

)2=16+4+0+4+16=40,

(yi-

)2=25+4+0+16+9=54,

(5分)所以r=

=

,又3

≈11.62,則r≈0.95.因為相關(guān)系數(shù)近似為0.95,說明y與x的線性相關(guān)性非常高,所以可以用線性回歸模型擬合y與x的關(guān)系.

(7分)(2)由(1)可得,

=

=

=1.1,則

=

-

=20-1.1×10=9,所以y關(guān)于x的經(jīng)驗回歸方程為

=1.1x+9,

(10分)當x=20時,

=1.1×20+9=31,所以預(yù)測車輛發(fā)車間隔時間為20分鐘時乘客的等候人數(shù)為31.

(12分)即練即清1.某工廠生產(chǎn)一種產(chǎn)品測得數(shù)據(jù)如下:尺寸x(mm)384858687888質(zhì)量y(g)16.818.820.722.42425.5(1)若按照檢測標準,合格產(chǎn)品的質(zhì)量y(g)與尺寸x(mm)之間近似滿足關(guān)系式y(tǒng)=c·xd(c,d

為大于0的常數(shù)),求y關(guān)于x的經(jīng)驗回歸方程;(2)已知產(chǎn)品的收益z(單位:千元)與產(chǎn)品尺寸和質(zhì)量的關(guān)系為z=2y-0.32x,根據(jù)(1)中經(jīng)驗

回歸方程分析,當產(chǎn)品的尺寸x約為何值時(結(jié)果用整數(shù)表示),收益z的預(yù)報值最大?附:①參考數(shù)據(jù):

(lnxi·lnyi)≈75.3,

lnxi≈24.6,

lnyi≈18.3,

(lnxi)2≈101.4.②參考公式:對于樣本數(shù)據(jù)(vi,ui)(i=1,2,…,n),其經(jīng)驗回歸直線

=

v+

的斜率和截距的最小二乘估計公式分別為

=

=

,

=

-

,e≈2.7182.解析

(1)第一步:兩邊取自然對數(shù),將非線性關(guān)系轉(zhuǎn)化為線性關(guān)系.對y=c·xd(c,d>0)兩邊取自然對數(shù)得lny=lnc+dlnx.令vi=lnxi,ui=lnyi,則

=

v+

,其中

=lnc.第二步:利用公式求出經(jīng)驗回歸方程.根據(jù)所給統(tǒng)計量及最小二乘估計公式得

=

=

=

=

,

=

-

=

-

·

-

×

=1,又

=lnc=1,所以c=e,所以y關(guān)于x的經(jīng)驗回歸方程為

=e·

.(2)由(1)得y=e·

,所以z=2e

-0.32x=-0.32(

)2+2e

.令t=

,則當t=

時,z取得最大值,此時x=t2≈72,所以當產(chǎn)品的尺寸x約為72mm時,收益z的預(yù)報值最大.名師點睛

求非線性回歸模型的步驟題型2獨立性檢驗應(yīng)用獨立性檢驗解決實際問題的基本步驟1.提出零假設(shè)H0:X和Y相互獨立,并給出在問題中的解釋;2.根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計算χ2的值;3.查表確定臨界值xα;α0.100.050.0100.0050.001xα2.7063.8416.6357.87910.8284.得出推斷結(jié)論.當χ2≥xα?xí)r,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α;當χ2<xα?xí)r,我們沒有充分證據(jù)推斷H0不成立,可以認為X和Y獨立.例2

(2024屆江蘇泰州中學(xué)月考,21)某高校男、女學(xué)生人數(shù)基本相當,為了解該校英

語四級考試情況,隨機抽取了該校首次參加英語四級考試的男、女各50名學(xué)生的成

績,情況如下表:

合格不合格男生3515女生455(1)依據(jù)α=0.01的獨立性檢驗,能否認為該校首次參加英語四級考試的學(xué)生合格與性別

有關(guān)?(2)從這50名男生中任意選2人,求這2人中合格人數(shù)的分布列及數(shù)學(xué)期望;(3)將抽取的這100名學(xué)生合格的頻率視為該校首次參加英語四級考試的每位學(xué)生合

格的概率.若學(xué)生首次考試不合格,則經(jīng)過一段時間的努力,第二次參加考試合格的概

率會增加0.1.現(xiàn)從該校學(xué)生中任意抽取2名學(xué)生,求至多兩次英語四級考試后,這兩人

全部合格的概率.附:χ2=

,α0.0500.0100.001xα3.8416.63510.828

解析

(1)零假設(shè)為H0:該校首次參加英語四級考試合格與性別無關(guān).根據(jù)表中數(shù)據(jù),計算得到χ2=

=6.25<6.635=x0.01,根據(jù)小概率值α=0.01的獨立性檢驗,沒有充分證據(jù)推斷H0不成立,因此可以認為H0成

立,即認為該校首次參加英語四級考試的學(xué)生合格與性別無關(guān).(2)設(shè)2人中合格人數(shù)為ξ,則ξ的所有可能取值為0,1,2,P(ξ=0)=

=

,P(ξ=1)=

=

,

P(ξ=2)=

=

,所以ξ的分布列為ξ012P

所以E(ξ)=0×

+1×

+2×

=

.(3)由已知得該校學(xué)生首次參加英語四級考試成績合格的概率為

,首次不合格第二次合格的概率為

,所以兩位同學(xué)都首次參加英語四級考試成績合格的概率為

×

=

,兩位同學(xué)其中一位首次合格,另一位同學(xué)首次不合格,第二次合格的概率為2×

×

×

=

,兩位同學(xué)都首次不合格,第二次都合格的概率為

×

×

×

=

,所以至多兩次英語四級考試后,這兩人全部合格的概率為

+

+

=

=0.9604.

即練即清2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論