回歸分析的基本思想及其初步應(yīng)用課件_第1頁(yè)
回歸分析的基本思想及其初步應(yīng)用課件_第2頁(yè)
回歸分析的基本思想及其初步應(yīng)用課件_第3頁(yè)
回歸分析的基本思想及其初步應(yīng)用課件_第4頁(yè)
回歸分析的基本思想及其初步應(yīng)用課件_第5頁(yè)
已閱讀5頁(yè),還剩75頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

3.1

回歸分析的基本思想及其初步應(yīng)用(第一課時(shí))1.通過(guò)典型案例的探究,進(jìn)一步了解回歸分析的基本思想、方法及其初步應(yīng)用.2.讓學(xué)生經(jīng)歷數(shù)據(jù)處理的過(guò)程,培養(yǎng)他們對(duì)數(shù)據(jù)的直觀感覺(jué),體會(huì)統(tǒng)計(jì)方法的特點(diǎn),認(rèn)識(shí)統(tǒng)計(jì)方法的應(yīng)用,通過(guò)使用轉(zhuǎn)化后的數(shù)據(jù),求相關(guān)指數(shù),運(yùn)用相關(guān)指數(shù)進(jìn)行數(shù)據(jù)分析、處理的方法.3.從實(shí)際問(wèn)題中發(fā)現(xiàn)已有知識(shí)的不足,激發(fā)好奇心,求知欲,通過(guò)尋求有效的數(shù)據(jù)處理方法,開拓學(xué)生的思路,培養(yǎng)學(xué)生的探索精神和轉(zhuǎn)化能力,通過(guò)案例的分析使學(xué)生了解回歸分析在實(shí)際生活中的應(yīng)用,增強(qiáng)數(shù)學(xué)取之生活,用于生活的意識(shí),提高學(xué)習(xí)興趣.

本節(jié)課通過(guò)必修3熟悉有例題回顧線性相關(guān)關(guān)系知識(shí),通過(guò)實(shí)際問(wèn)題中發(fā)現(xiàn)已有知識(shí)的不足,引出隨機(jī)誤差、殘差、殘差分析的概念,進(jìn)而運(yùn)用殘差來(lái)進(jìn)行數(shù)據(jù)分析,通過(guò)例題講解掌握用殘差分析判斷線性回歸模型的擬合效果。掌握建立回歸模型的步驟。本節(jié)內(nèi)容學(xué)生內(nèi)容不易掌握,通過(guò)知識(shí)整理與比較引導(dǎo)學(xué)生進(jìn)行區(qū)分、理解。通過(guò)對(duì)典型案例的探究,練習(xí)進(jìn)行鞏固了解回歸分析的基本思想方法和初步應(yīng)用.從某大學(xué)中隨機(jī)選取8名女大學(xué)生,其身高和體重?cái)?shù)據(jù)如下表所示:

怎樣根據(jù)一名女大學(xué)生的身高預(yù)報(bào)她的體重,并預(yù)報(bào)一名身高為172cm的女大學(xué)生的體重?編號(hào)12345678身高/cm165165157170175165155170體重/kg4857505464614359根據(jù)必修32.3變量相關(guān)關(guān)系解決這個(gè)問(wèn)題的方法:1.先判斷是兩個(gè)變量是否具有線性相關(guān)關(guān)系(1)作散點(diǎn)圖,如圖所示(見課本P82:圖3.1-1)2.根據(jù)線性回歸的系數(shù)公式,求回歸直線方程=0.849x-85.7123.由線性回歸方程可以估計(jì)其位置值為=60.316(千克)左右。具有較好的線性相關(guān)關(guān)系性質(zhì):回歸直線一定過(guò)樣本中心點(diǎn)(2)計(jì)算相關(guān)系數(shù)這些點(diǎn)并不都在同一條直線上,上述直線并不能精確地反映x與y之間的關(guān)系,y的值不能完全由x確定,它們之間是統(tǒng)計(jì)相關(guān)關(guān)系,y的實(shí)際值與估計(jì)值之間存在著誤差.因此,在統(tǒng)計(jì)學(xué)中設(shè)它們的線性回歸模型為:其中a,b為模型的未知參數(shù),e為y與bx+a之間的誤差,稱它為隨機(jī)誤差,它是隨機(jī)變量。且線性回歸模型完整表達(dá)式為x稱為_____變量,y稱為_____變量.解釋預(yù)報(bào)線性回歸模型中隨機(jī)誤差的主要來(lái)源①線性回歸模型中的預(yù)報(bào)值與真實(shí)情況y引起的誤差;②觀測(cè)與計(jì)算(用代替ba)產(chǎn)生的誤差;③省略了一些因素的影響(如生活習(xí)慣等)產(chǎn)生的誤差.在線性回歸模型中,e為用bx+a的預(yù)報(bào)真實(shí)值y的隨機(jī)誤差,它是一個(gè)不可觀測(cè)的量,那么應(yīng)該怎樣研究隨機(jī)誤差?在實(shí)際應(yīng)用中,我們用估計(jì)bx+a所以的估計(jì)量為對(duì)于樣本點(diǎn)它們的隨機(jī)誤差為估計(jì)值為稱相應(yīng)于點(diǎn)的殘差坐標(biāo)縱軸為殘差變量,橫軸可以有不同的選擇;若模型選擇的正確,殘差圖中的點(diǎn)應(yīng)該分布在以橫軸為中心的帶形區(qū)域;對(duì)于遠(yuǎn)離橫軸的點(diǎn),要特別注意。錯(cuò)誤數(shù)據(jù)模型問(wèn)題身高與體重殘差圖異常點(diǎn)殘差的作用1.通過(guò)殘差表或殘差圖發(fā)現(xiàn)原始數(shù)據(jù)中的可疑數(shù)據(jù)通過(guò)殘差來(lái)判斷模型擬合的效果這種分析工作稱為殘差分析通過(guò)殘差表或殘差圖判斷模型擬合的效果是直觀判斷,如何精確判斷模型擬合的效果?引入?yún)?shù)R2來(lái)精確該畫模型擬合效果對(duì)于己獲取的樣本數(shù)據(jù),在上式子中是定值,越小,即殘差平方和越小,R2越大,說(shuō)明模型擬合效果越好。引入例中參數(shù)R2計(jì)算得約為0.64說(shuō)明女大學(xué)生體重差異有百分之六十四是由身高引起的.知識(shí)點(diǎn)線性回歸分析1.對(duì)線性回歸模型的三點(diǎn)說(shuō)明(1)非確定性關(guān)系:線性回歸模型y=bx+a+e與確定性函數(shù)y=bx+a相比,它表示y與x之間是統(tǒng)計(jì)相關(guān)關(guān)系(非確定性關(guān)系),其中的隨機(jī)誤差e提供了選擇模型的準(zhǔn)則以及在模型合理的情況下探求最佳估計(jì)值a,b的工具.(2)線性回歸方程中,的意義是:以為基數(shù),x每增加1個(gè)單位,y相應(yīng)地平均增加個(gè)單位.(3)線性回歸模型中隨機(jī)誤差的主要來(lái)源①線性回歸模型與真實(shí)情況引起的誤差;②觀測(cè)與計(jì)算產(chǎn)生的誤差;③省略了一些因素的影響產(chǎn)生的誤差.2.線性回歸模型的模擬效果(1)殘差圖法:觀察殘差圖,如果殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說(shuō)明選用的模型比較合適,這樣的帶狀區(qū)域的寬度越窄,說(shuō)明模型擬合精度越高,回歸方程的預(yù)報(bào)精度越高.(2)殘差的平方和法:一般情況下,比較兩個(gè)模型的殘差比較困難(某些樣本點(diǎn)上一個(gè)模型的殘差的絕對(duì)值比另一個(gè)模型的小,而另一些樣本點(diǎn)的情況則相反),故通過(guò)比較兩個(gè)模型的殘差的平方和的大小來(lái)判斷模型的擬合效果.殘差平方和越小的模型,擬合的效果越好.(3)R2法:R2的值越大,說(shuō)明殘差平方和越小,也就是說(shuō)模型擬合的效果越好.3.相關(guān)系數(shù)與R2(1)R2是相關(guān)系數(shù)的平方,其變化范圍為[0,1],而相關(guān)系數(shù)的變化范圍為[-1,1].(2)相關(guān)系數(shù)可較好地反映變量的相關(guān)性及正相關(guān)或負(fù)相關(guān),而R2反映了回歸模型擬合數(shù)據(jù)的效果.(3)當(dāng)|r|接近于1時(shí)說(shuō)明兩變量的相關(guān)性較強(qiáng),當(dāng)|r|接近于0時(shí)說(shuō)明兩變量的相關(guān)性較弱,而當(dāng)R2接近于1時(shí),說(shuō)明線性回歸方程的擬合效果較好.【微思考】(1)殘差與我們平時(shí)說(shuō)的誤差是一回事兒?jiǎn)?提示:這兩個(gè)概念在某程度上具有很大的相似性,都是衡量不確定性的指標(biāo),二者的區(qū)別是:誤差與測(cè)量有關(guān),誤差可以衡量測(cè)量的準(zhǔn)確性,誤差越大表示測(cè)量越不準(zhǔn)確;殘差與預(yù)測(cè)有關(guān),殘差大小可以衡量預(yù)測(cè)的準(zhǔn)確性,殘差越大表示預(yù)測(cè)越不準(zhǔn)確.(2)R2與原來(lái)學(xué)過(guò)的相關(guān)系數(shù)r有區(qū)別嗎?提示:它們都是刻畫兩個(gè)變量之間的的相關(guān)關(guān)系的,區(qū)別是R2表示解釋變量對(duì)預(yù)報(bào)變量變化的貢獻(xiàn)率,其表達(dá)式為R2=1-;相關(guān)系數(shù)r是檢驗(yàn)兩個(gè)變量相關(guān)性的強(qiáng)弱程度,其表達(dá)式為

建立回歸模型的基本步驟(1)確定研究對(duì)象,明確哪個(gè)變量是解釋變量,哪個(gè)變量是預(yù)報(bào)變量.(2)畫出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等).(3)由經(jīng)驗(yàn)確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方程).(4)按一定規(guī)則(如最小二乘法)估計(jì)回歸方程中的參數(shù).(5)得出結(jié)果后分析殘差圖是否有異常(如個(gè)別數(shù)據(jù)對(duì)應(yīng)殘差過(guò)大,或殘差呈現(xiàn)不隨機(jī)的規(guī)律性等).若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.

為研究重量x(單位:克)對(duì)彈簧長(zhǎng)度y(單位:厘米)的影響,對(duì)不同重量的6個(gè)物體進(jìn)行測(cè)量,數(shù)據(jù)如下表所示:x51015202530y7.258.128.959.9010.911.8(1)作出散點(diǎn)圖并求線性回歸方程;(2)求出R2;(3)進(jìn)行殘差分析.作殘差分析時(shí),一般從以下幾個(gè)方面予以說(shuō)明:(1)散點(diǎn)圖;(2)相關(guān)指數(shù);(3)殘差圖中的異常點(diǎn)和樣本點(diǎn)的帶狀分布區(qū)域的寬窄.解答(1)散點(diǎn)圖如圖0.050.005-0.08-0.0450.040.025-2.24-1.37-0.540.411.412.31(3)由殘差表中的數(shù)值可以看出第3個(gè)樣本點(diǎn)的殘差比較大,需要確認(rèn)在采集這個(gè)數(shù)據(jù)的時(shí)候是否有人為的錯(cuò)誤,如果有的話,需要糾正數(shù)據(jù),重新建立回歸模型;由表中數(shù)據(jù)可以看出殘差點(diǎn)比較均勻地落在不超過(guò)0.15的狹窄的水平帶狀區(qū)域中,說(shuō)明選用的線性回歸模型的精度較高,由以上分析可知,彈簧長(zhǎng)度與拉力成線性關(guān)系.規(guī)律方法當(dāng)資料點(diǎn)較少時(shí),也可以利用殘差表進(jìn)行殘差分析,注意計(jì)算數(shù)據(jù)要認(rèn)真細(xì)心,殘差分析要全面.1.判一判(正確的打“√”,錯(cuò)誤的打“×”)(1)殘差平方和越小,線性回歸方程擬合效果越好.(

)(2)在畫兩個(gè)變量的散點(diǎn)圖時(shí),預(yù)報(bào)變量在x軸上,解釋變量在y軸上.

(

)(3)R2越接近于1,線性回歸方程的擬合效果越好.(

)√×√2.做一做(請(qǐng)把正確的答案寫在橫線上)(1)從散點(diǎn)圖上看,點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),兩個(gè)變量的這種相關(guān)關(guān)系為

.(2)在殘差分析中,殘差圖的縱坐標(biāo)為

.(3)如果發(fā)現(xiàn)散點(diǎn)圖中所有的樣本點(diǎn)都在一條直線上,則殘差平方和等于

,解釋變量和預(yù)報(bào)變量之間的相關(guān)系數(shù)R等于

.正相關(guān)殘差01或-13.已知某種商品的價(jià)格x(元)與需求量y(件)之間的關(guān)系有如下一組數(shù)據(jù):x1416182022y1210753求y對(duì)x的回歸直線方程,并說(shuō)明回歸模型擬合效果的好壞.00.3-0.4-0.10.24.62.6-0.4-2.4-4.4再見敬請(qǐng)指導(dǎo).3.1

回歸分析的基本思想及其初步應(yīng)用(第二課時(shí))1.通過(guò)典型案例的探究,進(jìn)一步了解回歸分析的基本思想、方法及其初步應(yīng)用.2.讓學(xué)生經(jīng)歷數(shù)據(jù)處理的過(guò)程,培養(yǎng)他們對(duì)數(shù)據(jù)的直觀感覺(jué),體會(huì)統(tǒng)計(jì)方法的特點(diǎn),認(rèn)識(shí)統(tǒng)計(jì)方法的應(yīng)用,通過(guò)使用轉(zhuǎn)化后的數(shù)據(jù),求相關(guān)指數(shù),運(yùn)用相關(guān)指數(shù)進(jìn)行數(shù)據(jù)分析、處理的方法.3.從實(shí)際問(wèn)題中發(fā)現(xiàn)已有知識(shí)的不足,激發(fā)好奇心,求知欲,通過(guò)尋求有效的數(shù)據(jù)處理方法,開拓學(xué)生的思路,培養(yǎng)學(xué)生的探索精神和轉(zhuǎn)化能力,通過(guò)案例的分析使學(xué)生了解回歸分析在實(shí)際生活中的應(yīng)用,增強(qiáng)數(shù)學(xué)取之生活,用于生活的意識(shí),提高學(xué)習(xí)興趣.

本節(jié)課通過(guò)例題線性相關(guān)關(guān)系知識(shí),通過(guò)實(shí)際問(wèn)題中發(fā)現(xiàn)已有知識(shí)的不足,引導(dǎo)學(xué)生尋找解決非線性回歸問(wèn)題思想與方法,培養(yǎng)學(xué)生化歸數(shù)學(xué)思想。通過(guò)知識(shí)的整理,通過(guò)例題講解掌握解決非線性回歸問(wèn)題。本節(jié)內(nèi)容學(xué)生內(nèi)容不易掌握,通過(guò)知識(shí)整理與比較引導(dǎo)學(xué)生進(jìn)行區(qū)分、理解。通過(guò)對(duì)典型案例的探究,練習(xí)進(jìn)行鞏固解決非線性回歸基本思想方法及初步應(yīng)用.建立回歸模型的基本步驟(1)確定研究對(duì)象,明確哪個(gè)變量是解釋變量,哪個(gè)變量是預(yù)報(bào)變量.(2)畫出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等).(3)由經(jīng)驗(yàn)確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方程).(4)按一定規(guī)則(如最小二乘法)估計(jì)回歸方程中的參數(shù).(5)得出結(jié)果后分析殘差圖是否有異常(如個(gè)別數(shù)據(jù)對(duì)應(yīng)殘差過(guò)大,或殘差呈現(xiàn)不隨機(jī)的規(guī)律性等).若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.(6)參數(shù)R2與相關(guān)系數(shù)r提示:它們都是刻畫兩個(gè)變量之間的的相關(guān)關(guān)系的,區(qū)別是R2表示解釋變量對(duì)預(yù)報(bào)變量變化的貢獻(xiàn)率,其表達(dá)式為R2=1-;相關(guān)系數(shù)r是檢驗(yàn)兩個(gè)變量相關(guān)性的強(qiáng)弱程度,其表達(dá)式為

(7)相關(guān)系數(shù)r與R2(1)R2是相關(guān)系數(shù)的平方,其變化范圍為[0,1],而相關(guān)系數(shù)的變化范圍為[-1,1].(2)相關(guān)系數(shù)可較好地反映變量的相關(guān)性及正相關(guān)或負(fù)相關(guān),而R2反映了回歸模型擬合數(shù)據(jù)的效果.(3)當(dāng)|r|接近于1時(shí)說(shuō)明兩變量的相關(guān)性較強(qiáng),當(dāng)|r|接近于0時(shí)說(shuō)明兩變量的相關(guān)性較弱,而當(dāng)R2接近于1時(shí),說(shuō)明線性回歸方程的擬合效果較好.例:一只紅鈴蟲產(chǎn)卵數(shù)y和溫度x有關(guān),現(xiàn)收集到的一組數(shù)據(jù)如下表1-3表,試建立y與x之間的回歸方程。畫出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系.(1)是否存在線性關(guān)系?(2)散點(diǎn)圖具有哪種函數(shù)特征?(3)以指數(shù)函數(shù)模型為例,如何設(shè)模型函數(shù)?非線性關(guān)系指數(shù)函數(shù)、二次函數(shù)、三次函數(shù)cc21設(shè)指數(shù)函數(shù)曲線其中和是待定參數(shù)。ecyxc12=我們可以通過(guò)對(duì)數(shù)變換把指數(shù)關(guān)系變?yōu)榫€性關(guān)系()這樣就可以利用線性回歸模型來(lái)建立z與x回歸模型,進(jìn)而找到y(tǒng)與x的非線性回歸方程。*則變換后樣本點(diǎn)分布在直線的周圍。令)cb,clna(abxz21==+=ylnz=現(xiàn)在問(wèn)題變?yōu)槿绾喂烙?jì)待定參數(shù)和?cc21非線性回歸模型(6)ey?0.272x-3.843(1)=另一方面,可以認(rèn)為圖11-4中樣本點(diǎn)集中在某二次曲線因此可以對(duì)溫度變量做變換,即令然后建立y與t之間的線性回歸方程,從而得到y(tǒng)與x之間的排線性回歸方程。,2xt=的附近,其中和為待定參數(shù).43cc423cxcy+=表1-5是紅鈴蟲的產(chǎn)卵數(shù)和對(duì)應(yīng)的溫度的平方,圖1.1-6是相應(yīng)的散點(diǎn)圖.()()()(),b,xgy~a,xfy~21==和對(duì)于給定的樣本點(diǎn),兩個(gè)含有未知數(shù)的模型其中a和b都是未知參數(shù),可以按如下的步驟來(lái)比較它們的擬合效果.b?a?其中和分別是參數(shù)a、b的估計(jì)值(1)分別建立對(duì)應(yīng)于兩個(gè)模型的回歸方程()(),b?,xgy?2=()()a?,xfy?1=()()();y?yQ?n1i22ii2?=-=()Q?1()()y?yn1i21ii?=-=與(2)分別計(jì)算兩個(gè)回歸方程的殘差平方和()()()()()()()()()().b?,xgy?a?,xfy?,;b?,xgy?a?,xfy?,Q?Q?212121的好的效果不如反之的好的效果比則(3)若====<非線性回歸問(wèn)題的處理方法(1)兩個(gè)變量不呈線性關(guān)系,不能直接利用線性回歸方程建立兩個(gè)變量的關(guān)系,可以通過(guò)變換的方法轉(zhuǎn)化為線性回歸模型,如y=,我們可以通過(guò)對(duì)數(shù)變換把指數(shù)關(guān)系變?yōu)榫€性關(guān)系.令z=lny,則變換后樣本點(diǎn)應(yīng)該分布在直線z=bx+a(a=lnc1,b=c2)的周圍.(2)非線性回歸方程的求法①根據(jù)原始數(shù)據(jù)(x,y)作出散點(diǎn)圖;②根據(jù)散點(diǎn)圖,選擇恰當(dāng)?shù)臄M合函數(shù);③作恰當(dāng)?shù)淖儞Q,將其轉(zhuǎn)化成線性函數(shù),求線性回歸方程;④在③的基礎(chǔ)上通過(guò)相應(yīng)的變換,即可得非線性回歸方程.(3)非線性相關(guān)問(wèn)題中常見的幾種線性變換在實(shí)際問(wèn)題中,常常要根據(jù)一批實(shí)驗(yàn)數(shù)據(jù)繪出曲線,當(dāng)曲線類型不具備線性相關(guān)關(guān)系時(shí),可以根據(jù)散點(diǎn)分布的形狀與已知函數(shù)的圖象進(jìn)行比較,確定曲線的類型,再作變量替換,將曲線改為直線.下面是幾種容易通過(guò)變量替換轉(zhuǎn)化為直線的函數(shù)模型:①y=a+,令t=,則有y=a+bt;②y=axb,令z=lny,t=lnx,m=lna,則有z=m+bt;③y=aebx,令z=lny,m=lna,則有z=m+bt;④y=,令z=lny,t=,m=lna,則有z=m+bt;⑤y=a+blnx,令t=lnx,則有z=a+bt;⑥y=bx2+a,令t=x2,則有y=bt+a.例某種食品每公斤的生產(chǎn)成本y(元)與該食品生產(chǎn)的重量x(公斤)有關(guān),經(jīng)生產(chǎn)統(tǒng)計(jì)得到以下數(shù)據(jù):x123510203050100200y10.155.524.082.852.111.621.411.301.211.15通過(guò)以上數(shù)據(jù)判斷該食品的成本y(元)與生產(chǎn)的重量x(公斤)的倒數(shù)1/x之間是否具有線性相關(guān)關(guān)系?若有,求出y關(guān)于1/x的回歸直線方程,并借此估計(jì)一下生產(chǎn)該食品500公斤時(shí)每公斤的生產(chǎn)成本是多少?(精確到0.01)

于是y與1x的回歸方程為y^=8.973x+1.125.

當(dāng)x=500(公斤)時(shí),y^=8.973500+1.125≈1.14.即估計(jì)生產(chǎn)該食品500公斤時(shí)每公斤的生產(chǎn)成本是1.14元.

Xx2.為了解兒子身高與其父親身高的關(guān)系,隨機(jī)抽取5對(duì)父子的身高數(shù)據(jù)如下:則y關(guān)于x的線性回歸方程為(

).A.y=x-1

B.y=x+1C.y=88+12x D.y=176父親身高x(cm)174176176176178兒子身高y(cm)175175176177177答案:C解析:方法一:由線性回歸直線方程過(guò)樣本中心(176,176),排除A,B答案,結(jié)合選項(xiàng)可得C為正確答案.方法二:將表中的五組數(shù)值分別代入選項(xiàng)驗(yàn)證,可知y=88+12x最適合.xxxx

非線性回歸問(wèn)題有時(shí)并不給出經(jīng)驗(yàn)公式,這時(shí)我們可以畫出已知數(shù)據(jù)的散點(diǎn)圖,把它與學(xué)過(guò)的各種函數(shù)(冪函數(shù)、指數(shù)函數(shù)、對(duì)數(shù)函數(shù))等圖象作比較,挑選一種跟這些散點(diǎn)擬合得最好的函數(shù),然后采用適當(dāng)?shù)淖兞恐脫Q,把問(wèn)題化為線性回歸分析問(wèn)題,使之得到解決.再見敬請(qǐng)指導(dǎo).3.1獨(dú)立性檢驗(yàn)的基本思想及初步應(yīng)用1.(1)了解獨(dú)立性檢驗(yàn)的基本思想、方法及初步應(yīng)用.(2)會(huì)從列聯(lián)表(只要求2×2列聯(lián)表)、等高條形圖直觀分析兩個(gè)分類變量是否有關(guān).(3)會(huì)用K2公式判斷兩個(gè)分類變量在某種可信程度上的相關(guān)性.2.運(yùn)用數(shù)形結(jié)合的方法,借助對(duì)典型案例的探究,來(lái)了解獨(dú)立性檢驗(yàn)的基本思想,總結(jié)獨(dú)立性檢驗(yàn)的基本步驟.3.(1)通過(guò)本節(jié)課的學(xué)習(xí),讓學(xué)生感受數(shù)學(xué)與現(xiàn)實(shí)生活的聯(lián)系,體會(huì)獨(dú)立性檢驗(yàn)的基本思想在解決日常生活問(wèn)題中的作用.(2)培養(yǎng)學(xué)生運(yùn)用所學(xué)知識(shí),依據(jù)獨(dú)立性檢驗(yàn)的思想作出合理推斷的實(shí)事求是的好習(xí)慣.本課主要學(xué)習(xí)獨(dú)立性檢驗(yàn)的基本思想及初步應(yīng)用。以吸煙是否對(duì)肺癌有影響引入新課,通過(guò)數(shù)據(jù)和圖表分析,得到結(jié)論是:吸煙與患肺癌有關(guān)初步判斷兩分類變量具有相關(guān)性。通過(guò)結(jié)論的可靠程度如何?引出如何通過(guò)量化來(lái)進(jìn)行研究判斷兩分類變量是否具有相關(guān)性,相關(guān)程度有多大?通過(guò)假設(shè)兩分類變量沒(méi)有相關(guān)性,也就是是相互獨(dú)立的,得到判斷兩分類變量相關(guān)性檢驗(yàn)方法。再通過(guò)例1例2講解引導(dǎo)學(xué)生掌握獨(dú)立性檢驗(yàn)的基本思想及初步應(yīng)用。吸煙與肺癌列聯(lián)表不患肺癌患肺癌總計(jì)不吸煙7775427817吸煙2099492148總計(jì)9874919965為了調(diào)查吸煙是否對(duì)肺癌有影響,某腫瘤研究所隨機(jī)地調(diào)查了9965人,得到如下結(jié)果(單位:人)列聯(lián)表在不吸煙者中患肺癌的比重是

在吸煙者中患肺癌的比重是

說(shuō)明:吸煙者和不吸煙者患肺癌的可能性存在差異,吸煙者患肺癌的可能性大0.54%2.28%1)通過(guò)圖形直觀判斷兩個(gè)分類變量是否相關(guān):三維柱狀圖2)通過(guò)圖形直觀判斷兩個(gè)分類變量是否相關(guān):二維條形圖3)通過(guò)圖形直觀判斷兩個(gè)分類變量是否相關(guān):患肺癌比例不患肺癌比例等高條形圖獨(dú)立性檢驗(yàn)H0:吸煙和患肺癌之間沒(méi)有關(guān)系←→H1:吸煙和患肺癌之間有關(guān)系通過(guò)數(shù)據(jù)和圖表分析,得到結(jié)論是:吸煙與患肺癌有關(guān)結(jié)論的可靠程度如何?用A表示“不吸煙”,B表示“不患肺癌”則

H0:吸煙和患肺癌之間沒(méi)有關(guān)系“吸煙”與“患肺癌”獨(dú)立,即A與B獨(dú)立等價(jià)于等價(jià)于吸煙與肺癌列聯(lián)表不患肺癌患肺癌總計(jì)不吸煙aba+b吸煙cdc+d總計(jì)a+cb+da+b+c+d獨(dú)立性檢驗(yàn)引入一個(gè)隨機(jī)變量作為檢驗(yàn)在多大程度上可以認(rèn)為“兩個(gè)變量有關(guān)系”的標(biāo)準(zhǔn)。1)如果P(m>10.828)=0.001表示有99.9%的把握認(rèn)為”X與Y”有關(guān)系;2)如果P(m>7.879)=0.005表示有99.5%的把握認(rèn)為”X與Y”有關(guān)系;3)如果P(m>6.635)=0.01表示有99%的把握認(rèn)為”X與Y”有關(guān)系;4)如果P(m>5.024)=0.025表示有97.5%的把握認(rèn)為”X與Y”有關(guān)系;5)如果P(m>3.841)=0.05表示有95%的把握認(rèn)為”X與Y”有關(guān)系;6)如果P(m>2.706)=0.010表示有90%的把握認(rèn)為”X與Y”有關(guān)系;7)如果m≤2.706),就認(rèn)為沒(méi)有充分的證據(jù)顯示”X與Y”有關(guān)系;設(shè)有兩個(gè)分類變量X和Y它們的值域分別為{x1,x2}和{y1,y2}其樣本頻數(shù)列表(稱為2×2列聯(lián)表)為

y1y2總計(jì)x1aba+bx2cdc+d總計(jì)a+cb+da+b+c+d2×2列聯(lián)表適用觀測(cè)數(shù)據(jù)a、b、c、d不小于5P

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論