




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
PAGE1-第三章統(tǒng)計(jì)案例學(xué)問系統(tǒng)整合規(guī)律方法保藏1.兩個(gè)基本思想(1)回來分析的基本思想回來分析包括線性回來分析和非線性回來分析兩種,而非線性回來分析往往可以通過變量代換轉(zhuǎn)化為線性回來分析,因此,回來分析的思想主要是指線性回來分析的思想.留意理解以下幾點(diǎn):①確定線性相關(guān)關(guān)系線性相關(guān)關(guān)系有兩層含義:一是具有相關(guān)關(guān)系,如廣告費(fèi)用與銷售量的關(guān)系等在肯定條件下具有相關(guān)關(guān)系,而氣球的體積與半徑的關(guān)系是函數(shù)關(guān)系,而不是相關(guān)關(guān)系;二是具有線性相關(guān)關(guān)系.推斷是否線性相關(guān)的依據(jù)是樣本點(diǎn)的散點(diǎn)圖.②引起預(yù)報(bào)誤差的因素對于線性回來模型y=bx+a+e,引起預(yù)報(bào)變量y的誤差的因素有兩個(gè):一個(gè)是說明變量x,另一個(gè)是隨機(jī)誤差e.③回來方程的預(yù)報(bào)精度推斷回來方程的預(yù)報(bào)精度是通過計(jì)算殘差平方和來進(jìn)行的,殘差平方和越小,方程的預(yù)報(bào)精度越高.簡潔來說,線性回來分析就是通過建立回來直線方程對變量進(jìn)行預(yù)報(bào),用回來方程預(yù)報(bào)時(shí),需對函數(shù)值明確理解,它表示當(dāng)x取值時(shí),真實(shí)值在函數(shù)值旁邊或平均值在函數(shù)值旁邊,不能認(rèn)為就是真實(shí)值.④回來模型的擬合效果推斷回來模型的擬合效果的過程也叫殘差分析,殘差分析的方法有兩種,一是通過殘差圖直觀推斷,二是通過計(jì)算相關(guān)指數(shù)R2的大小推斷.(2)獨(dú)立性檢驗(yàn)的基本思想獨(dú)立性檢驗(yàn)的基本思想類似于反證法.要確認(rèn)兩個(gè)分類變量有關(guān)系的可信程度,先假設(shè)兩個(gè)分類變量沒有關(guān)系,再計(jì)算隨機(jī)變量K2的觀測值,最終由K2的觀測值很大在肯定程度上說明兩個(gè)分類變量有關(guān)系.進(jìn)行獨(dú)立性檢驗(yàn)要留意理解以下三個(gè)問題:①獨(dú)立性檢驗(yàn)適用于兩個(gè)分類變量.②兩個(gè)分類變量是否有關(guān)系的直觀推斷:一是依據(jù)2×2列聯(lián)表計(jì)算|ad-bc|,值越大關(guān)系越強(qiáng);二是視察等高條形圖,兩個(gè)深色條的高度相差越大關(guān)系越強(qiáng).③獨(dú)立性檢驗(yàn)是對兩個(gè)分類變量有關(guān)系的可信程度的推斷,而不是對其是否有關(guān)系的推斷.獨(dú)立性檢驗(yàn)的結(jié)論只能是有多大的把握確認(rèn)兩個(gè)分類變量有關(guān)系,而不能是兩個(gè)分類變量肯定有關(guān)系或沒有關(guān)系.2.兩個(gè)重要參數(shù)(1)相關(guān)指數(shù)R2相關(guān)指數(shù)R2是用來刻畫回來模型的回來效果的,其值越大,殘差平方和越小,模型的擬合效果越好.(2)隨機(jī)變量K2隨機(jī)變量K2是用來推斷兩個(gè)分類變量在多大程度上相關(guān)的變量.獨(dú)立性檢驗(yàn)就是通過計(jì)算K2的觀測值,并與教材中所給表格中的數(shù)值進(jìn)行比較,從而得到兩個(gè)分類變量在多大程度上相關(guān).3.兩種重要圖形(1)散點(diǎn)圖散點(diǎn)圖是進(jìn)行線性回來分析的主要手段,其作用如下:一是推斷兩個(gè)變量是否具有線性相關(guān)關(guān)系,假如樣本點(diǎn)呈條狀分布,那么可以斷定兩個(gè)變量有較好的線性相關(guān)關(guān)系;二是推斷樣本中是否存在異樣.(2)殘差圖殘差圖可以用來推斷模型的擬合效果,其作用如下:一是推斷模型的精度,殘差點(diǎn)所分布的帶狀區(qū)域越窄,說明模型的擬合精度越高,回來方程的預(yù)報(bào)精度越高.二是確認(rèn)樣本點(diǎn)在采集過程中是否有人為的錯(cuò)誤.學(xué)科思想培優(yōu)一線性回來分析對所抽取的樣本的數(shù)據(jù)進(jìn)行分析,分析兩個(gè)變量之間的關(guān)系——線性關(guān)系或非線性關(guān)系,并由一個(gè)變量的改變?nèi)ネ葡肓硪粋€(gè)變量的改變,這就是對樣本進(jìn)行回來分析.回來分析的過程就是建立回來模型的過程.詳細(xì)步驟是:①確定探討對象,明確哪個(gè)變量是說明變量,哪個(gè)變量是預(yù)報(bào)變量;②畫出散點(diǎn)圖,視察它們是線性相關(guān)的,還是符合哪一種函數(shù)模型;③由閱歷確定回來方程的類型(如線性回來方程,反比例函數(shù)模型,指數(shù)函數(shù)模型,對數(shù)函數(shù)模型等);④用最小二乘法求回來方程的參數(shù);⑤檢查回來模型的擬合程度,如分析殘差圖,求相關(guān)指數(shù)R2等.例1一個(gè)車間為了規(guī)定工時(shí)定額,需確定加工零件所花費(fèi)的時(shí)間,為此進(jìn)行了10次試驗(yàn),測得的數(shù)據(jù)如下表:零件數(shù)x/個(gè)102030405060708090100加工時(shí)間y/min627275818595103108112127(1)畫出散點(diǎn)圖,并初步推斷是否線性相關(guān);(2)若線性相關(guān),求回來直線方程;(3)求出相關(guān)指數(shù);(4)作出殘差圖;(5)進(jìn)行殘差分析.[解](1)散點(diǎn)圖,如圖所示.由圖可知,x,y線性相關(guān).(2)x與y的關(guān)系可以用線性回來模型來擬合,不妨設(shè)回來模型為eq\o(\a\vs4\al(y),\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))x.將數(shù)據(jù)代入相應(yīng)公式可得數(shù)據(jù)表:∴eq\o(x,\s\up6(-))=55,eq\o(y,\s\up6(-))=92,∴eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(10),\s\do4(i=1))xiyi-10\o(x,\s\up6(-))\o(y,\s\up6(-)),\o(∑,\s\up6(10),\s\do4(i=1))x\o\al(2,i)-10\o(x,\s\up6(-))2)=eq\f(56130-10×55×92,38500-10×552)=eq\f(553,825)≈0.670,eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))=92-eq\f(553,825)×55=eq\f(827,15)≈55.133,∴回來直線方程為eq\o(y,\s\up6(^))=0.670x+55.133.(3)利用所求回來方程求出下列數(shù)據(jù).∴R2=1-eq\f(\o(∑,\s\up6(10),\s\do4(i=1))yi-\o(y,\s\up6(^))i2,\o(∑,\s\up6(10),\s\do4(i=1))yi-\o(y,\s\up6(-))2)≈0.983.(4)∵eq\o(e,\s\up6(^))i=y(tǒng)i-eq\o(y,\s\up6(^))i,利用上表中數(shù)據(jù)作出殘差圖,如圖所示.(5)由散點(diǎn)圖可以看出x與y有很強(qiáng)的線性相關(guān)性,由R2的值可以看出回來效果很好.由殘差圖也可視察到,第2,5,9,10個(gè)樣本點(diǎn)的殘差比較大,須要確認(rèn)在采集這些樣本點(diǎn)的過程中是否有人為的錯(cuò)誤.拓展提升作殘差分析時(shí),一般從以下幾個(gè)方面予以說明:(1)散點(diǎn)圖;(2)相關(guān)指數(shù);(3)殘差圖中的異樣點(diǎn)和樣本點(diǎn)的帶狀分布區(qū)域的寬窄.二獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn)的基本思想:獨(dú)立性檢驗(yàn)的基本思想類似于反證法,要確認(rèn)“兩個(gè)分類變量有關(guān)系”這一結(jié)論成立的可信程度,首先假設(shè)該結(jié)論不成立,即假設(shè)結(jié)論“兩個(gè)分類變量沒有關(guān)系”成立,在該假設(shè)下構(gòu)造的隨機(jī)變量K2應(yīng)當(dāng)很小,假如由觀測數(shù)據(jù)計(jì)算得到的K2的觀測值k很大,則在肯定程度上說明假設(shè)不合理,依據(jù)隨機(jī)變量K2的含義,與有關(guān)的臨界值相比較,以確定可信程度.例2隨著生活水平的提高,人們患肝病的越來越多,為了解中年人患肝病與常常飲酒是否有關(guān),現(xiàn)對30名中年人進(jìn)行了問卷調(diào)查得到如下列聯(lián)表:常飲酒不常飲酒合計(jì)患肝病2不患肝病18合計(jì)30已知在全部30人中隨機(jī)抽取1人,抽到肝病患者的概率為eq\f(4,15).(1)請將上面的列聯(lián)表補(bǔ)充完整,并推斷是否有99.5%的把握認(rèn)為患肝病與常飲酒有關(guān)?說明你的理由;(2)現(xiàn)從常飲酒且患肝病的中年人(恰有2名女性)中,抽取2人參與電視節(jié)目,則正好抽到一男一女的概率是多少?參考數(shù)據(jù):P(K2≥k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828[解](1)設(shè)患肝病中常飲酒的人有x人,eq\f(x+2,30)=eq\f(4,15),x=6.常飲酒不常飲酒合計(jì)患肝病628不患肝病41822合計(jì)102030由已知數(shù)據(jù)可求得K2=eq\f(30×6×18-2×42,10×20×8×22)≈8.523>7.879,因此有99.5%的把握認(rèn)為患肝病與常飲酒有關(guān).(2)設(shè)常飲酒且患肝病的男性為A,B,C,D,女性為E,F(xiàn),則任取兩人有(A,B),(A,C),(A,D),(A,E),(A,F(xiàn)),(B,C),(B,D),(B,E),(B,F(xiàn)),(C,D),(C,E),(C,F(xiàn)),(D,E),(D,F(xiàn)),(E,F(xiàn)),共15種,且每種發(fā)生的概率是相等的.其中一男一女有(A,E),(A,F(xiàn)),(B,E),(B,F(xiàn)),(C,E),(C,F(xiàn)),(D,E),(D,F(xiàn)),共8種.故抽出一男一女的概率是P=eq\f(8,15).拓展提升近幾年高考中獨(dú)立性檢驗(yàn)與統(tǒng)計(jì)學(xué)問的綜合考查已出現(xiàn)了多次,一般須要依據(jù)統(tǒng)計(jì)學(xué)問完成2×2列聯(lián)表,然后考查利用獨(dú)立性檢驗(yàn)的方法解決問題,題目難度不大,但有肯定的綜合性.三數(shù)形結(jié)合思想在獨(dú)立性檢驗(yàn)中的應(yīng)用例3某機(jī)構(gòu)為了了解患色盲是否與性別有關(guān),隨機(jī)抽取了1000名成年人進(jìn)行調(diào)查.在調(diào)查的480名男人中有38名患色盲,520名女人中有6名患色盲,分別利用圖形和獨(dú)立性檢驗(yàn)的方法來推斷患色盲與性別是否有關(guān).[解]依據(jù)題目所給的數(shù)據(jù)作出如下的列聯(lián)表:患色盲未患色盲總計(jì)男38442480女6514520總計(jì)449561000依據(jù)列聯(lián)表作出相應(yīng)的等高條形圖,如圖所示:圖中兩個(gè)深色條的高分別表示男人和女人中患色盲的頻率.從圖中可以看出,男人中患色盲的頻率明顯高于女人中患色盲的頻率.因此我們可以認(rèn)為患色盲與性別有關(guān).依據(jù)列聯(lián)表中所給的數(shù)據(jù),得K2的觀測值k=eq\f(1000×38×514-6×4422,480×520×44×956)≈27.139.因?yàn)?7.139>10.828,所以我們有99.9%的把握認(rèn)為患色盲與性別有關(guān)系.拓展提升“數(shù)缺形時(shí)少直觀,形缺數(shù)時(shí)難入微”恰當(dāng)?shù)貞?yīng)用數(shù)形是提高解題速度、優(yōu)化解題過程的一種重要方法.四化歸與轉(zhuǎn)化思想在非線性回來分析中的應(yīng)用例4下表為收集到的一組數(shù)據(jù):x21232527293235y711212466115325(1)作出x與y的散點(diǎn)圖,并揣測x與y之間的關(guān)系;(2)建立x與y的關(guān)系,預(yù)報(bào)回來模型并計(jì)算殘差;(3)利用所得模型,預(yù)報(bào)x=40時(shí)y的值.[解](1)作出散點(diǎn)圖如圖,從散點(diǎn)圖可以看出x與y不具有線性相關(guān)關(guān)系,依據(jù)已有學(xué)問可以發(fā)覺樣本點(diǎn)分布在某一條指數(shù)型函數(shù)曲線y=c1ec2x的四周,其中c1,c2為待定的參數(shù).(2)對兩邊取對數(shù)把指數(shù)關(guān)系變?yōu)榫€性關(guān)系,令z=lny,則有變換后的樣本點(diǎn)應(yīng)分布在直線z=bx+a,a=lnc1,b=c2的四周,這樣就可以利用線性回來模型來建立y與x之間的非線性回來方程,數(shù)據(jù)可以轉(zhuǎn)化為:x21232527293235z1.9462.3983.0453.1784.1904.7455.784求得回來直線方程為eq\o(z,\s\up6(^))=0.272x-3.849,∴eq\o(y,\s\up6(^))=e0.272x-3.849.殘差列
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國錦綸切片行業(yè)競爭格局規(guī)劃研究報(bào)告
- 2025-2030年中國銅礦采選行業(yè)發(fā)展?fàn)顩r及營銷戰(zhàn)略研究報(bào)告
- 2025-2030年中國蜂窩紙板市場運(yùn)營狀況及投資戰(zhàn)略研究報(bào)告
- 2025-2030年中國藥學(xué)教育發(fā)展模式及未來投資戰(zhàn)略分析報(bào)告
- 2025-2030年中國聚碳酸酯pc行業(yè)運(yùn)行狀況規(guī)劃分析報(bào)告
- 2025-2030年中國粗雜糧行業(yè)競爭格局及發(fā)展前景分析報(bào)告
- 2025-2030年中國空氣污染治理設(shè)備市場經(jīng)營狀況及發(fā)展趨勢分析報(bào)告
- 2025-2030年中國碼垛機(jī)器人市場運(yùn)行動(dòng)態(tài)及發(fā)展前景分析報(bào)告
- 幼兒健康有營養(yǎng)的蔬菜教案(12篇)
- 中國傳媒大學(xué)《電子與電工技術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 北師大版二年級數(shù)學(xué)下冊全冊10套試卷(附答案)
- GB/T 2423.17-2024環(huán)境試驗(yàn)第2部分:試驗(yàn)方法試驗(yàn)Ka:鹽霧
- 數(shù)字出版概論 課件 第六章 數(shù)字內(nèi)容加工、管理技術(shù)
- 糖尿病并發(fā)癥的早期篩查
- 2019年山東省職業(yè)院校技能大賽中職組“沙盤模擬企業(yè)經(jīng)營”賽項(xiàng)規(guī)程
- GB/T 32399-2024信息技術(shù)云計(jì)算參考架構(gòu)
- 初中體育與健康 初二 水平四(八年級)田徑大單元教學(xué)設(shè)計(jì)+快速跑教案
- 2024年西南大學(xué)附中初升高選拔測試語文試卷真題(精校打?。?/a>
- 2024-2025學(xué)年華東師大版數(shù)學(xué)七年級上冊計(jì)算題專項(xiàng)訓(xùn)練
- 移動(dòng)通信運(yùn)營商倉庫安全管理制度
- DL∕T 5452-2012 變電工程初步設(shè)計(jì)內(nèi)容深度規(guī)定
評論
0/150
提交評論