版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、專題精講【知識(shí)點(diǎn)】1. 事例分析 例 1 從某大學(xué)中隨機(jī)選取 8 名女大學(xué)生,其身高和體重?cái)?shù)據(jù)如下表所示:編身號(hào) 1高 1652165315741705175616571558170/cm體/kg重 48 57 50 54 64 61 43 59求根據(jù)一名女大學(xué)生的身高預(yù)報(bào)她的體重的回歸方程并預(yù)報(bào)一名身高為 的女大學(xué)生的體重. (分析思 教師演 學(xué)生整理) 回歸分:第一步作散點(diǎn)圖第二步求回歸方程第三步代值計(jì)算 提問:身高為 172cm 的女大學(xué)生的體重一定是 嗎? 不一定,但一般可以認(rèn)為她的體重在 左右. 解釋線性回歸模型與一次函數(shù)的不同事實(shí)上,觀察上述散點(diǎn)圖,我們可以發(fā)現(xiàn)女大學(xué)生的體重 和身
2、高 x之間的關(guān)系并不能用一次函數(shù) 來格 畫(因?yàn)樗械臉颖军c(diǎn)不共線,所以線性模型只能近似地刻畫身高和體重的關(guān)系. 在數(shù)據(jù)表中身高為 165cm 3 名女大學(xué)生的體重分別為 48kg、57kg 61kg如果能用一次函1n n n n n n n n 數(shù)來描述體重與身高的關(guān)系,那么身高為 165cm 的 3 名女在學(xué)生的體重應(yīng)相同. 這就說明體重不僅 受身高的影響還受其他因素的影響把這種影響的結(jié) e (即殘差變量或隨機(jī)變量引入到線性函數(shù)模型中,得到線性回歸模型 y bx ,其中殘差變量 e中包含體重不能由身高的線性函數(shù)解釋的所有部分. 當(dāng)殘差變量恒等于 0 ,線性回歸模型就變成一次函數(shù)模型 因此,
3、一次函數(shù)模型線 性回歸型的特殊形,線性歸模型是一函數(shù)模的一般形式 .2. 相關(guān)系數(shù):相關(guān)系數(shù)的絕對(duì)值越接近 1,兩個(gè)變量的線性相關(guān)關(guān)系越強(qiáng),它們的散點(diǎn)圖越接近 一條直線,這時(shí)用線性回歸模型擬合這組數(shù)據(jù)就越好,此時(shí)建立的線性回歸模型是有意義3.偏差平方、殘差方和、回歸方和:)總偏差平和 :所有單個(gè)樣本與樣本均值差的平方和, ii .殘差平和: 歸值與樣本值差的平方和, SSE y y )i ii .回歸平和: 應(yīng)回歸值與樣本均值差的平方和,即 y y ii .)學(xué)習(xí)要領(lǐng)注意 i、 i、 的區(qū)別;預(yù)報(bào)變量的變化程度可以分解為由解釋變量引起的變化程度與殘差變量的變化程度之和,即 y ) 2 y y
4、) y i i i ii i i 2 ;當(dāng)總偏差平方和相對(duì)固定時(shí),殘差平方和越小,則回歸平方和越大,此時(shí)模型的擬合效果越好;對(duì)于多個(gè)不同的模型,我們還可以引入相關(guān)指數(shù) 2 y ) 2 i ii ) ii 來刻畫回歸的效果,它表示解釋變量對(duì)預(yù)報(bào)變量變化的貢獻(xiàn)率. R 的值越大,說明殘差平方和越小,也就是說模型擬合的效果越好【例題1 關(guān)于 x 有如下數(shù)據(jù):230440560650870為了對(duì) x 兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析,現(xiàn)有以下兩種線性模型 y y ,試比較哪一個(gè)模型擬合的效果更好 2, , 分析:可分別求出兩種模型下的總偏差平方和、殘差平方和、回歸平方和,也可分別求出兩種模 型下的相關(guān)指數(shù),然后再
5、進(jìn)行比較,從而得出結(jié)論(答案 : ii iy ) iy ) 0.845 ii iy ) iy ) 82%,所以甲選用的模型擬合i i效果較好.)4. 非線性回方程的確定 如果散點(diǎn)圖中的點(diǎn)分布在一個(gè)直線狀帶形區(qū)域,可以選線性回歸模型來建模;如果散點(diǎn)圖中的點(diǎn) 分布在一個(gè)曲線狀帶形區(qū)域,就需選擇非線性回歸模型來建模 根據(jù)已有的函數(shù)知識(shí),可以發(fā)現(xiàn)樣本點(diǎn)分布在某一條指數(shù)函數(shù)曲線 y=C e1C x 的周圍(其 , c1 是待定的參數(shù)故可用指數(shù)函數(shù)模型來擬合這兩個(gè)變量 得 ln ln c2 1 令 y,則 c ,而 與 x 的關(guān)系如下: 2 z X 21 23 25 27 29 32 35z 1.94 2
6、.39 3.046 8 53.1784.1904.7455.784觀察 合.與 x的散點(diǎn)圖,可以發(fā)現(xiàn)變換后樣本點(diǎn)分布在一條直線的附近,因此可以用線性回歸方程來擬 利用計(jì)算器算得 3.843, , 與 x間的線性回歸方程為 0.272 ,因此紅鈴蟲的產(chǎn)卵數(shù)對(duì)溫度的非線性回歸方程為 y 3.843 . 利用回歸方程探究非線性回歸問題,可按“作散點(diǎn) 建 確定方程”這三個(gè)步驟進(jìn)行 其關(guān)鍵在于如何通過適當(dāng)?shù)淖儞Q,將非線性回歸問題轉(zhuǎn)化成線性回歸問題【例題1、為了研究某種細(xì)菌隨時(shí)間 x 變化,繁殖的個(gè)數(shù),收集據(jù)如下:3天數(shù) x/天 1 繁殖個(gè)數(shù) / 62123254495956190個(gè)(1)用天數(shù)作解釋變量
7、,繁殖個(gè)數(shù)作預(yù)報(bào)變量,作出這些數(shù)據(jù)的散點(diǎn)圖;(2)試求出預(yù)報(bào)變量對(duì)解釋變量的回歸方程(答案:求非線性回歸方程 =e0.69 x 1.112 .)5. 教學(xué)殘差析: 殘差:樣本值與回歸值的差叫殘差, e y yi ii. 殘差分 通過殘差來判斷模型擬合的效果,判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù),這方面的分析 工作稱為殘差分析. 殘差圖以殘差為橫坐標(biāo),以樣本編號(hào),或身高數(shù)據(jù),或體重估計(jì)值等為橫坐標(biāo),作出的圖形稱 為殘差圖. 觀察殘差圖,如果殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適, 這樣的帶狀區(qū)域的寬度越窄,模型擬合精度越高,回歸方程的預(yù)報(bào)精度越高【注】一般情況下,比較兩個(gè)模型的殘
8、差比較困難(某些樣本點(diǎn)上一個(gè)模型的殘差的絕對(duì)值比另一 個(gè)模型的小,而另一些樣本點(diǎn)的情況則相反通過比較兩個(gè)模型的殘差的平方和的大小來判斷模 型的擬合效果. 殘差方和越小的型,擬的效越好 .6. 與列聯(lián)表關(guān)的概念: 分類變量:變量的不同“值”表示個(gè)體所屬的不同類別的變量稱為分類變. 分類量的取值一 定是離散的,而且不同的取值僅表示個(gè)體所屬的類別,如性別變量,只取男、女兩個(gè)值,商品的等 級(jí)變量只取一級(jí)、二級(jí)、三級(jí),等 . 分類變量的取值有時(shí)可用數(shù)字來表示,但這時(shí)的數(shù)字除了分 類以外沒有其他的含義. 如用“0”表示“男“1”表示“女”. 列聯(lián)表分類變量的匯總統(tǒng)計(jì)(頻數(shù)表. 一般我們只研不 患 肺 患
9、肺 總計(jì)究每個(gè)分類變量只取兩個(gè)值,這樣的列聯(lián)表稱 . 如吸煙癌癌與患肺癌的列聯(lián)表:不吸煙 7775427817吸總煙 2099計(jì) 987449912148996547. 教學(xué)三維形圖和二維形圖的念:由列聯(lián)表可以粗略估計(jì)出吸煙者和不吸煙者患肺癌的可能性存在差異(師在課上用 EXCEL 件 演示三柱形圖和二條形圖引導(dǎo)學(xué)生觀這兩類形的特征,分析由形得出的結(jié)) 8. 獨(dú)立性檢的基本思想 獨(dú)立性檢驗(yàn)的必要性(為什么中能只憑列聯(lián)表的數(shù)據(jù)和圖形下結(jié)論?:列聯(lián)表中的數(shù)據(jù)是樣本 數(shù)據(jù),它只是總體的代表,具有隨機(jī)性,故需要用列聯(lián)表檢驗(yàn)的方法確認(rèn)所得結(jié)論在多大程度上適 用于總體. 獨(dú)立性檢驗(yàn)的步驟(略)及原理(與反
10、證法類似反證法假設(shè)檢驗(yàn)要證明結(jié)論 A備擇假設(shè) H1在 A 不成立的前提下進(jìn)行 在 H 不成立的條件下,即 H 成立的條件下進(jìn)行推理10推理推出矛盾,意味著結(jié)論 A 推出有利于 H 成立的小概率事件(概率不超 的事1成立件發(fā)生味著 H 成立的可能可能性 1很大沒有找到矛盾,不能對(duì) A 推出有利于 H 成立的小概率事件不發(fā)生,接受原假設(shè)1下任何結(jié)論反證法不成功 上例的解決步驟第一步:提出假設(shè)檢驗(yàn)問題 H :吸煙與患肺癌沒有關(guān) H :吸煙與患肺癌有關(guān)系0 1第二步:選擇檢驗(yàn)的指標(biāo)K 2 n( ) 2( )( )(a )(它越小,原假設(shè)“ :吸煙與患肺癌沒0有關(guān)系”成立的可能性越大;它越大,備擇假設(shè)“
11、 :吸煙與患肺癌有關(guān)系”成立的可能性越大.1第三步:查表得出結(jié)論P(yáng)( k)0.50 0.400.25 0.15 0.10 0.05 0.0250.0100.0050.001k0.45 0.75 081.3232.0722.7063.84 5.0246.6357.87910.835【例題例 1 在某醫(yī)院,因?yàn)榛夹呐K病而住院的 男性病人中,有 214 禿頂;而另外 名不是因?yàn)?患心臟病而住院的男性病人中有 175 禿頂. 分別利用圖形和獨(dú)立性檢驗(yàn)方法判斷禿頂與患心臟病 是否有關(guān)系?你所得的結(jié)論在什么范圍內(nèi)有效? 第一步教師引導(dǎo)學(xué)生作出列聯(lián)表,并分析列聯(lián)表,引導(dǎo)學(xué)生得出“禿頂與患心臟病有關(guān)”的結(jié) 論
12、;第二步 師演示三維柱形圖和二維條形圖,進(jìn)一步向?qū)W生解釋所得到的統(tǒng)計(jì)結(jié)果;第三步 學(xué)生計(jì)算 K2 的值;第四步 釋結(jié)果的含義 通過第 2 個(gè)問題,向?qū)W生強(qiáng)調(diào)“樣本只能代表相應(yīng)總體里的數(shù)據(jù)來自于醫(yī)院的住院病人, 因此題目中的結(jié)論能夠很好地適用于住院的病人群體,而把這個(gè)結(jié)論推廣到其他群體則可能會(huì)出現(xiàn) 錯(cuò)誤,除非有其它的證據(jù)表明可以進(jìn)行這種推廣例 為考察高中生的性別與是否喜歡數(shù)學(xué)課程之間的關(guān)系,在某城市的某校高中生中隨機(jī)抽取 300 名學(xué)生,得到如下列聯(lián)表:總男女計(jì)喜歡數(shù)學(xué)課程373572不喜歡數(shù)學(xué)課程 85143228總計(jì)122178300由表中數(shù)據(jù)計(jì)算得到 間有關(guān)系?為什么?2 的觀察值 4.513. 在
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 房產(chǎn)發(fā)展項(xiàng)目廣告代理委托協(xié)議
- 二零二五版?zhèn)€人土地抵押借款合同簽訂流程指南2篇
- 集裝箱買賣合同
- 快遞驛站房屋租賃合同模板
- 水庫承包合同書
- 商鋪?zhàn)赓U協(xié)議書合同模板范本下載年
- 二零二五年度能源結(jié)構(gòu)調(diào)整項(xiàng)目驗(yàn)收委托書3篇
- 二零二五年度鋼材買賣合同:老梁talks說的市場(chǎng)動(dòng)態(tài)
- 二零二五年度工業(yè)園區(qū)雨水排放系統(tǒng)檢測(cè)與清理合同3篇
- 倉單質(zhì)押擔(dān)保合同
- JJG 692-2010無創(chuàng)自動(dòng)測(cè)量血壓計(jì)
- 三年級(jí)下冊(cè)口算天天100題(A4打印版)
- 徐州市2023-2024學(xué)年八年級(jí)上學(xué)期期末地理試卷(含答案解析)
- CSSD職業(yè)暴露與防護(hù)
- 飲料對(duì)人體的危害1
- 數(shù)字經(jīng)濟(jì)學(xué)導(dǎo)論-全套課件
- 移動(dòng)商務(wù)內(nèi)容運(yùn)營(吳洪貴)項(xiàng)目三 移動(dòng)商務(wù)運(yùn)營內(nèi)容的策劃和生產(chǎn)
- 中考記敘文閱讀
- 產(chǎn)科溝通模板
- 2023-2024學(xué)年四川省成都市小學(xué)數(shù)學(xué)一年級(jí)下冊(cè)期末提升試題
- GB/T 2462-1996硫鐵礦和硫精礦中有效硫含量的測(cè)定燃燒中和法
評(píng)論
0/150
提交評(píng)論