統(tǒng)計案例復(fù)習(xí)_第1頁
統(tǒng)計案例復(fù)習(xí)_第2頁
統(tǒng)計案例復(fù)習(xí)_第3頁
統(tǒng)計案例復(fù)習(xí)_第4頁
統(tǒng)計案例復(fù)習(xí)_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第一章統(tǒng)計案例復(fù)習(xí)稿件授課教師: 王宏 郭懿一、復(fù)習(xí)導(dǎo)言本章主要內(nèi)容獨立性檢驗的思想與回歸分析的應(yīng)用,主要通過案例體會運用統(tǒng)計方法解決實際問題的思想與方法。統(tǒng)計案例是實用性很強的知識,以統(tǒng)計案例為背景命題應(yīng)用性試題,考查基礎(chǔ)知識和基本方法的同時,考查運用所學(xué)知識解決實際問題的能力,還體現(xiàn)以知識為依托,突出對思想方法的考查。所以高考要注意統(tǒng)計應(yīng)用問題的考查。二、要求1、通過對典型案例的探究,進一步了解回歸的基本思想、方法及初步應(yīng)用,會用判斷線性回歸模型的擬合效果。2、理解獨立性檢驗的基本思想,掌握假設(shè)檢驗的思想在獨立性檢驗中的應(yīng)用,能解決一些統(tǒng)計案例。三、要點精析(一)回歸分析1、回歸分析是處理

2、變量之間_的一種統(tǒng)計方法,若兩個變量之間具有線性相關(guān)關(guān)系,則稱相應(yīng)的回歸分析為線性回歸分析。2、線性回歸方程_,其中,稱為回歸系數(shù),_稱為樣本的中心點,回歸直線經(jīng)過樣本點的中心?!敬鸢浮?.相關(guān)關(guān)系; 2.; (二)相關(guān)關(guān)系與相關(guān)檢驗1、相關(guān)關(guān)系是非隨機變量與隨機變量之間的關(guān)系,如人的身高與年齡,商品的銷售額與廣告費等關(guān)系都是相關(guān)關(guān)系,它是一種_,而不是函數(shù)關(guān)系。2、樣本相關(guān)系數(shù):用來對變量x與Y作相關(guān)性檢驗的統(tǒng)計量,用r來表示。r=_.3、r的性質(zhì):具有相關(guān)關(guān)系的兩個變量之間關(guān)系的強弱是通過相關(guān)系數(shù)來衡量的,當(dāng)r>0時,表明兩個變量_;當(dāng)r<0時,表明兩個變量_。越接近于1,表明

3、兩個變量的線性相關(guān)性越強;越接近于0,表明兩個變量之間幾乎不存在線性相關(guān)關(guān)系;通常當(dāng)大于_時,我們認為兩個變量之間存在著很強的線性相關(guān)關(guān)系;當(dāng)小于0.75時尋求直線沒有意義。4.相關(guān)性檢驗:對變量x與Y是否線性相關(guān)進行的檢驗稱為_。其步驟如下:作統(tǒng)計假設(shè):假設(shè)x與Y不具有線性相關(guān)關(guān)系;根據(jù)小概率0.05與n-2在附表中查出r的一個臨界值;計算r的值;作統(tǒng)計推斷:若,則有_的把握認為x與Y具有線性相關(guān)關(guān)系,即拒絕假設(shè);若,則接受假設(shè)?!敬鸢浮浚?. 非確定性關(guān)系;2.;3. 正相關(guān); 負相關(guān); 0.75; 4. 相關(guān)性檢驗; 95%.(三)回歸效果三個統(tǒng)計量1、總偏差平方和_,它是所有單個樣本值

4、與樣本均值的差的平方和,表示的是總的效應(yīng)。2、殘差平方和:數(shù)據(jù)點與它在回歸直線上的相應(yīng)位置的差異稱為殘差,將所得的殘差值平方相加得_,稱之為殘差平方和,代表了隨機誤差的效應(yīng)。3、回歸平方和:_,它是解釋變量的效應(yīng)。【答案】:1. ;2.; 3. 。(四)殘差分析的方法1、相關(guān)指數(shù)法,可以用相關(guān)指數(shù)來刻畫回歸效果,其計算公式:=_,的值越大 ,說明殘差平方和越小,模型的擬合效果越好。2、作殘差圖,如果殘差點比較均勻地落在_中,說明選用的模型比較合適,這樣的帶狀區(qū)域越窄,說明選用模型的擬合精確度越高。由于誤差e受許多條件的影響,也受我們所選用的線性模型的影響,因此線性模型往往只是一種近似的模型?!?/p>

5、答案】1. 1- ; 2. 水平帶狀區(qū)域;(五)2×2列聯(lián)表1、含義:用于檢驗2×2列聯(lián)表中的兩個事件A與B是否獨立的一種統(tǒng)計學(xué)中常用的檢驗方法,稱為_。一般地,假設(shè)有兩個分類變量X和Y,它們的取值分別為和,其樣本的頻數(shù)列聯(lián)表(2×2列聯(lián)表)為: 總計 a b a+b c d c+d 總計 a+c b+da+b+c+d若要推斷的論述為:“X與Y有關(guān)系”,可以按如下步驟判斷產(chǎn)量的可能性:(1)通過_可以粗略地判斷兩個分類變量是否有關(guān)系,但是這種判斷無法精確地給出所得結(jié)論的可靠程度。在三維柱形圖中,主對角線上兩個柱形高的乘積ad與副對角線上兩個柱形高的乘積bc相乘越大

6、,成立的可能性就越大。在二維條形圖中,可以估計圖形滿足X=的個體中具有Y=的個體所占的比例_,也可以估計滿足條件X=的個體中具有Y=的個體所占的比例,兩個比例相差越大,成立的可能性就越大。(2)用獨立性檢驗來考察兩個分類變量是否有關(guān)系,并且能較精確地給出這種判斷的可靠程度,具體步驟為:假設(shè)兩個分類變量X與Y無關(guān);統(tǒng)計學(xué)中一個非常有用的統(tǒng)計量,讀作:卡方,計算出隨機變量的觀測值K=_;把k的值與臨界值比較確定X與Y有關(guān)系的程度。(3)步驟:統(tǒng)計假設(shè):假設(shè)事件A與B獨立,即事件A與B無關(guān);計算的值;統(tǒng)計決斷:若>3.841,則有_的把握說事件A與B有關(guān);若>6.635,則有_的把握說事

7、件A與B有關(guān);若,認為事件A與B無關(guān)?!敬鸢浮浚?. 獨立性檢驗;三維柱形圖和二維條形圖;2. 3. 95%;99%。四、題型解析類型一線性回歸方程的實際應(yīng)用例1 在某化學(xué)試驗中,測得如下表所示的6組數(shù)據(jù),其中x(min)表示化學(xué)反應(yīng)進行的時間,y(mg)表示未轉(zhuǎn)化的物質(zhì)的量x/min 1 2 3 4 5 6y/mg 39.8 32.2 25.4 20.3 16.2 13.3 (1)設(shè)y與x之間具有關(guān)系,試根據(jù)測量數(shù)據(jù)估計c和d的值;(2)估計化學(xué)反應(yīng)進行到10min時未轉(zhuǎn)化的物質(zhì)的量。解:(1)在的兩邊取自然對數(shù),可以得到lny=lnc+xlnd,設(shè)lny=z,lnc=a,lnd=b,則z=

8、a+bx,又由已知數(shù)據(jù)可以得到下表:x/min 1 2 3 4 5 6y/mg 39.8 32.2 25.4 20.3 16.2 13.3z=lny 3.684 3.472 3.235 3.011 2.785 2.588由公式得,z關(guān)于x的線性回歸方程為,即,所以,根據(jù)測量數(shù)據(jù)估計c=49.6898,d=0.8010.(2)由(1)知y與x之間的關(guān)系為,當(dāng)x=10時,所以當(dāng)化學(xué)反應(yīng)進行到10min時,未轉(zhuǎn)化的物質(zhì)的量為5.4mg. 點評:在實際問題中,有時兩個變量之間并不是線性相關(guān)關(guān)系,這就需要我們根據(jù)已有的知識或散點圖選擇適當(dāng)?shù)那€方程,然后通過適當(dāng)?shù)淖兞看鷵Q,把非線性問題轉(zhuǎn)化為線性回歸問題

9、,從而確定未知參數(shù),建立相應(yīng)的回歸方程。類型二獨立性檢驗的應(yīng)用例2 在國家實施西部開發(fā)戰(zhàn)略前,一新聞單位在應(yīng)屆大學(xué)畢業(yè)生中隨機抽取1000人作問卷調(diào)查,只有80人志愿加入西部建設(shè),而國家公布實施西部開發(fā)戰(zhàn)略后,隨機抽取1200名應(yīng)屆大學(xué)畢業(yè)生作問卷調(diào)查,有400人志愿加入國家西部建設(shè)。問實施西部開發(fā)戰(zhàn)略的公布是否對應(yīng)屆大學(xué)畢業(yè)生的選擇產(chǎn)生影響?分析:本題是一道信息題,獨立性檢驗在應(yīng)用于很大領(lǐng)域時需要通過建立模型實現(xiàn)信息遷移,即將信息轉(zhuǎn)化為2×2列聯(lián)表形式,再通過計算統(tǒng)計量得出相應(yīng)的結(jié)論。解:根據(jù)題意,列出2×2列聯(lián)表,如下: 自愿者 非志愿者 總計西部開發(fā)戰(zhàn)略公布前 80

10、920 1000西部開發(fā)戰(zhàn)略公布后 400 800 1200總計 480 1720 2200由公式計算統(tǒng)計量得:,因為205.22>6.635,所以有99%的把握認為實數(shù)西部開發(fā)戰(zhàn)略的公布對應(yīng)屆大學(xué)畢業(yè)生的選擇產(chǎn)生了影響。點評:即使不進行獨立性檢驗,我們也能正確判斷出“開發(fā)戰(zhàn)略“起了作用,但利用統(tǒng)計量所得結(jié)果更具有說服力,還可以說明西部開發(fā)戰(zhàn)略具有很大的帶動作用。例3、某同學(xué)對一些人進行了喜愛運動與身體健康的關(guān)系的調(diào)查,在填寫列聯(lián)表時,不慎寫錯了幾個數(shù)據(jù),他一氣之下將寫錯的數(shù)全都涂掉了,殘表如下: 喜愛運動 不喜愛運動 總計 身體健康 30 A 50 身體不健康 B 10 60 總計 C

11、 D E請問借助這個殘表能判斷出運動與身體健康有關(guān)嗎?解:根據(jù)列聯(lián)表的特點,由30+A=50得A=20,B+10=60得B=50,30+B=C因此C=80,A+10=D得D=30,又C+D=E,得E=110. 即完整的列聯(lián)表如下: 喜愛運動 不喜愛運動 總計 身體健康 30 20 50 身體不健康 50 10 60 總計 80 30 110由于,所以借助這個列表我們有99%的把握認為喜愛運河與身體健康有關(guān)。 點評:本題考查列聯(lián)表的性質(zhì)(即列聯(lián)表中各數(shù)據(jù)之間的關(guān)系),雖然本題不難,但考查的方式及命題角度值得我們重視。類型三創(chuàng)新探索性問題例4、有兩個分類變量X與Y,其一組觀測值如下面的2×

12、;2列聯(lián)表所示: a 20-a 15-a 30+a其中,a,15-a均為大于5的整數(shù),則a取何值時,有90%的把握認為“X與Y之間有關(guān)系”?分析:要有90%的把握認為“X與Y之間有關(guān)系“,需要檢測隨機變量的觀測值大于2.706,故所求得的觀測值后解不等式即可。 解:要有90%的把握認為“X與Y之間有關(guān)系“,需要隨機變量的觀測值大于2.706,因為a+(20-a)=20,(15-a)+(30+a)=45,a+(15-a)=15,(20-a)+(30+a)=50,a+(20-a)+(15-a)+(30+a)=65,則,解之可得a>7.19或a<2.04,而由原題知a>5且15-a

13、>5,即a=6,7,8,9故當(dāng)a=8或9時,有90%的把握認為X與Y之間有關(guān)系。 點評:本題是已知的范圍逆向求a,注意還要考慮a的可能取值,也可以先得出a的四個可能取值,再代入求來驗證找出滿足要求的a的值。類型四綜合交匯以及圖表信息題例5.某學(xué)校課題組為了研究學(xué)生的數(shù)學(xué)成績與物理成績之間的關(guān)系,隨機抽取高二年級20名學(xué)生某次考試成績(滿分100分)如下表所示: 若單科成績85分以上(含85分),則該科成績?yōu)閮?yōu)秀(1)根據(jù)上表完成下面的2×2列聯(lián)表(譯位:人): (2)根據(jù)題(1)中表格的數(shù)據(jù)計算,有多大的把握,認為學(xué)生的數(shù)學(xué)成績與物理成績 之間有關(guān)系?分析:通過認識圖表、填寫圖

14、表,把問題轉(zhuǎn)化為2×2列聯(lián)表獨立性檢驗問題。利用已知條件來判斷兩個分類變量是否具有關(guān)系,可以先假設(shè)兩個變量之間沒有關(guān)系,再計算的值,如果的值越大,說明兩個變量之間有關(guān)系的可能性也就越大,再參考臨界值,從而判斷兩個變量有關(guān)系的可信程度。解析:(1):2列聯(lián)表為(單位:人)(2)解:提出假設(shè)H:學(xué)生數(shù)學(xué)成績與物理成績之間沒有關(guān)系:根據(jù)列聯(lián)表可以求得:,當(dāng)H成立時,P(K,所以我們有99.5%的把握認為:學(xué)生的數(shù)學(xué)成績與物理成績之間有關(guān)系。 點評:在利用統(tǒng)計變量進行獨立性檢驗時,應(yīng)該注意準確代數(shù)和正確計算,再把計算的結(jié)果與有關(guān)臨界值相比較,正確下結(jié)論。 例6.某體育訓(xùn)練隊共有隊員40人,下

15、表為跳高、跳遠成績的分布表,成績分為15個檔次,例如表中所示跳高成績?yōu)?分,跳遠成績?yōu)?分的隊員有5人。將全部隊員的姓名卡混合在一起,任取一張,該卡隊員的跳高成績?yōu)閤,跳遠成績?yōu)閥,設(shè)x,y為隨機變量(注:沒有相同姓名的隊員)y x 跳 遠 5 4 3 2 1 跳 高 5 1 3 1 0 1 4 1 0 2 5 1 3 2 1 0 4 3 2 1 1 6 0 3 1 0 0 1 1 3(1)求x4的概率及x4且的概率;(2)若跳遠、跳高成績相等時的人數(shù)分別為c,d,試問:c,d是否具有線性相關(guān)關(guān)系?若有,求出回歸直線方程;若沒有,請說明理由。 分析:本題是圖表信息題,通過閱讀圖表、繪制圖表解決

16、實際問題,能夠體現(xiàn)統(tǒng)計的重要思想,即數(shù)據(jù)處理能力。解:(1)由于隊員總數(shù)為40,當(dāng)x4時,即跳高成績?yōu)?分時的隊員共9人,于是,x4的概率為;x4且時,即跳高成績?yōu)?分,跳遠成績不低于3分的隊員共有3人,于是,x4且的概率為(2)將跳遠、跳高成績及人數(shù)整理如下表: 成績 5 4 3 2 1 跳遠c 5 5 10 10 10 跳高d 6 9 10 10 5易得,那么,可見變量d與c不具有線性相關(guān)性。點評:本題的第一問是古典概型,第二問是線性回歸。本題將這兩個內(nèi)容恰到好處的融為一體。五、備考策略1.統(tǒng)計的基本思維模式是歸納的,它的特征之一是通過部分數(shù)據(jù)來推測全體數(shù)據(jù)的性質(zhì),因此,統(tǒng)計推斷是可能犯錯誤的,也就是說,我們從數(shù)據(jù)上體現(xiàn)的只是統(tǒng)計上的關(guān)系,而不是因果關(guān)系。獨立性檢驗的基本思想類似于反證法,為了探求事件A與B是否有關(guān),首先列出事件A與B的2×2列聯(lián)表,利用公式計算出統(tǒng)計量,將的數(shù)值與兩個臨界值3.841與6.635進行對比,然后作出統(tǒng)計推斷。利用2×2列聯(lián)表,不僅能考查兩個變量之間是否有關(guān),而且還能較精確地給出這種判斷的可靠性程度。因此,獨立性檢驗在生物統(tǒng)計、醫(yī)學(xué)統(tǒng)計、處理社會問

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論