版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第八章成對數(shù)據(jù)的統(tǒng)計分析知識點一、變量間的相關(guān)關(guān)系1.變量與變量間的兩種關(guān)系:(1)函數(shù)關(guān)系:這是一種確定性的關(guān)系,即一個變量能被另一個變量按照某種對應(yīng)法則唯一確定.例如圓的面積.S與半徑r之間的關(guān)系S=πr2為函數(shù)關(guān)系.(2)相關(guān)關(guān)系:這是一種非確定性關(guān)系.當(dāng)一個變量取值一定時,另一個變量的取值帶有一定的隨機性,這兩個變量之間的關(guān)系叫做相關(guān)關(guān)系。例如人的身高不能確定體重,但一般來說“身高者,體重也重”,我們說身高與體重這兩個變量具有相關(guān)關(guān)系.2.相關(guān)關(guān)系的分類:(1)在兩個變量中,一個變量是可控制變量,另一個變量是隨機變量,如施肥量與水稻產(chǎn)量;(2)兩個變量均為隨機變量,如某學(xué)生的語文成績與化學(xué)成績.3.散點圖:將兩個變量的各對數(shù)據(jù)在直角坐標(biāo)系中描點而得到的圖形叫做散點圖.它直觀地描述了兩個變量之間有沒有相關(guān)關(guān)系.這是我們判斷的一種依據(jù).4.回歸分析:與函數(shù)關(guān)系不同,相關(guān)關(guān)系是一種非確定性關(guān)系,對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的方法叫做回歸分析。知識點二、線性回歸方程:1.回歸直線如果散點圖中點的分布從整體上看大致在一條直線附近,我們就稱這兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫作回歸直線。2.回歸直線方程對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù),,……,,其回歸直線的截距和斜率的最小二乘法估計公式分別為:,其中表示數(shù)據(jù)xi(i=1,2,…,n)的均值,表示數(shù)據(jù)yi(i=1,2,…,n)的均值,表示數(shù)據(jù)xiyi(i=1,2,…,n)的均值.、的意義是:以為基數(shù),x每增加一個單位,y相應(yīng)地平均變化個單位.3.求回歸直線方程的一般步驟:①作出散點圖由樣本點是否呈條狀分布來判斷兩個量是否具有線性相關(guān)關(guān)系,若存在線性相關(guān)關(guān)系,進行第二步。②求回歸系數(shù)、計算,,,,利用公式求出,再由求出的值;③寫出回歸直線方程;④利用回歸直線方程預(yù)報在x取某一個值時y的估計值。知識點三、相關(guān)性檢驗(1)相關(guān)系數(shù)r的定義對于變量x與y隨機抽取到的n對數(shù)據(jù),,……,,稱為x與y的樣本相關(guān)系數(shù)。(2)相關(guān)系數(shù)r的作用樣本相關(guān)系數(shù)r用于衡量兩個變量之間是否具有線性相關(guān)關(guān)系,描述線性相關(guān)關(guān)系的強弱:①越接近1,表明兩個變量之間的線性相關(guān)程度越強;越接近0,表明兩個變量之間的線性相關(guān)程度越弱。②當(dāng)r>0時,表明兩個變量正相關(guān),即x增加,y隨之相應(yīng)地增加,若x減少,y隨之相應(yīng)地減少.當(dāng)r<0時,表明兩個變量負相關(guān),即x增加,y隨之相應(yīng)地減少;若x減少,y隨之相應(yīng)地增加.若r=0,則稱x與y不相關(guān)。③當(dāng),認為x與y之間具有很強的線性相關(guān)關(guān)系。④當(dāng)大于時,表明有95%的把握認為x與y之間具有線性相關(guān)關(guān)系,這時求回歸直線方程有必要也有意義,當(dāng)時,尋找回歸直線方程就沒有意義。(3)利用相關(guān)系數(shù)r檢驗的一般步驟:法一:①作統(tǒng)計假設(shè):x與y不具有線性相關(guān)關(guān)系。②根據(jù)樣本相關(guān)系數(shù)計算公式算出r的值。③比較與0.75的大小關(guān)系,得出統(tǒng)計結(jié)論。如果,認為x與y之間具有很強的線性相關(guān)關(guān)系。法二:①作統(tǒng)計假設(shè):x與y不具有線性相關(guān)關(guān)系。②根據(jù)樣本相關(guān)系數(shù)計算公式算出r的值。③根據(jù)小概率0.05與n2在相關(guān)性檢驗的臨界值表中查出r的一個臨界值(n未數(shù)據(jù)的對數(shù))。④比較與,作統(tǒng)計推斷,如果,表明有95%的把握認為x與y之間具有線性相關(guān)關(guān)系。如果,我們沒有理由拒絕原來的假設(shè),即不認為x與y之間具有線性相關(guān)關(guān)系。這時尋找回歸直線方程是毫無意義的。知識點四、線性回歸分析與非線性回歸分析1.線性回歸分析對于回歸分析問題,在解題時應(yīng)首先利用散點圖或相關(guān)性檢驗判斷x與y是否具有線性相關(guān)關(guān)系,如果線性相關(guān),才能求解后面的問題.否則求線性回歸方程沒有實際意義,它不能反映變量x與y,之間的變化規(guī)律.只有在x與y之間具有相關(guān)關(guān)系時,求線性回歸方程才有實際意義.相關(guān)性檢驗的依據(jù):主要利用檢驗統(tǒng)計量(其中化簡式容易記也好用)求出檢驗統(tǒng)計量的樣本相關(guān)系數(shù),再利用r的性質(zhì)確定x和y是否具有線性相關(guān)關(guān)系,r具有的性質(zhì)為:|r|≤1且|r|越接近于1,線性相關(guān)程度越強;|r|越接近于0,線性相關(guān)程度越弱.2.線性回歸分析的一般步驟(1)確定研究對象,明確哪個變量是解釋變量,哪個變量是預(yù)報變量;(2)判斷兩變量是否具有線性相關(guān)關(guān)系①作散點圖由樣本點是否呈條狀分布來判斷兩個量是否具有線性相關(guān)關(guān)系。②求相關(guān)系數(shù)r當(dāng),認為x與y之間具有很強的線性相關(guān)關(guān)系。(3)若兩變量存在線性相關(guān)關(guān)系,設(shè)所求的線性回歸方程為,求回歸系數(shù)、。(4)寫出回歸直線方程;(5)利用回歸直線方程預(yù)報在x取某一個值時y的估計值。3.非線性回歸分析(1)對于非線性回歸分析問題,如果給出了經(jīng)驗公式可直接利用換元,使新元與y具有線性相關(guān)關(guān)系,進一步求出,,對新元的線性回歸方程,換回x即可得y對x的回歸曲線方程.(2)非線性回歸問題有時并不給出經(jīng)驗公式,這時按以下步驟求回歸方程:①畫出已知數(shù)據(jù)的散點圖,看是否是線性回歸分析問題,如果不是,把它與必修數(shù)學(xué)中學(xué)過的函數(shù)(冪函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)等)圖像作比較,挑選一種跟這些散點擬合得最好的函數(shù),采用適當(dāng)?shù)淖兞恐脫Q,把非線性回歸分析問題化為線性回歸分析問題.②作相關(guān)性檢驗,即判斷尋找線性回歸方程是否有意義.③當(dāng)尋找線性回歸方程有意義時,計算系數(shù),,得到線性回歸方程.④代回x得y對x的回歸曲線方程.知識點五列聯(lián)表1.列聯(lián)表用表格列出的分類變量的頻數(shù)表,叫做列聯(lián)表。2.2×2列聯(lián)表對于兩個事件A,B,列出兩個事件在兩種狀態(tài)下的數(shù)據(jù),如下表所示:事件B事件合計事件Aaba+b事件cdc+d合計a+cb+da+b+c+d這樣的表格稱為2×2列聯(lián)表。知識點六卡方統(tǒng)計量公式為了研究分類變量X與Y的關(guān)系,經(jīng)調(diào)查得到一張2×2列聯(lián)表,如下表所示Y1Y2合計X1aba+bX2cdc+d合計a+cb+dn=a+b+c+d統(tǒng)計中有一個有用的(讀做“卡方”)統(tǒng)計量,它的表達式是:(為樣本容量)。知識點七獨立性檢驗1.獨立性檢驗通過2×2列聯(lián)表,再通過卡方統(tǒng)計量公式計算的值,利用隨機變量來確定在多大程度上可以認為“兩個分類變量有關(guān)系”的方法稱為兩個分類變量的獨立性檢驗。2.變量獨立性的判斷通過對統(tǒng)計量分布的研究,已經(jīng)得到兩個臨界值:3.841和6.635。當(dāng)數(shù)據(jù)量較大時,在統(tǒng)計中,用以下結(jié)果對變量的獨立性進行判斷:①如果≤3.841時,認為事件A與B是無關(guān)的。②如果>3.841時,有95%的把握說事件A與事件B有關(guān);③如果>6.635時,有99%的把握說事件A與事件B有關(guān);3.獨立性檢驗的基本步驟及簡單應(yīng)用獨立性檢驗的步驟:要推斷“A與B是否有關(guān)”,可按下面步驟進行:(1)提出統(tǒng)計假設(shè)H0:事件A與B無關(guān)(相互獨立);(2)抽取樣本(樣本容量不要太小,每個數(shù)據(jù)都要大于5);(3)列出2×2列聯(lián)表;(4)根據(jù)2×2列聯(lián)表,利用公式:,計算出的值;(5)統(tǒng)計推斷:當(dāng)>3.841時,有95%的把握說事件A與B有關(guān);當(dāng)>6.635時,有99%的把握說事件A與B有關(guān);當(dāng)>10.828時,有99.9%的把握說事件A與B有關(guān);當(dāng)≤3.841時,認為事件A與B是無關(guān)的.類型一回歸分析及相關(guān)檢驗例1根據(jù)如下樣本數(shù)據(jù)3456784.02.50.5得到的回歸方程為,則()A. B. C. D.解析:樣本點的散點圖如圖31.由散點圖可知,.答案:B規(guī)律總結(jié):由散點圖不僅可以直觀地看出兩個變量是否相關(guān),而且可以判斷兩個線性相關(guān)的變量是正相關(guān)還是負相關(guān).當(dāng)兩個變量正相關(guān)時,;當(dāng)兩個變量負相關(guān)時,.例2假設(shè)某農(nóng)作物基本苗數(shù)與有效穗數(shù)之間存在相關(guān)關(guān)系,今測得5組數(shù)據(jù)如下:15.025.830.036.644.439.442.942.943.149.2(1)以為解釋變量,為預(yù)報變童,畫出散點圖;(2)求與之間的回歸方程,對于基本苗數(shù)56.7預(yù)報有效穗數(shù);(3)計算各組殘差;(4)求,并說明隨機誤差對有效穗數(shù)的影響占百分之幾?解:(1)散點圖如圖32所示.(2)由圖看出,樣本點呈條狀分布,有比較好的線性相關(guān)關(guān)系因此可以用線性回歸方程來建立兩個變量之間的關(guān)系.設(shè)線性回歸方程為,由表中數(shù)據(jù)可得,,.故與之間的回歸方程為.當(dāng)時,.估計有效穗數(shù)為.(3)各組數(shù)據(jù)的殘差分別為e:二0.39,(4)故解釋變量(農(nóng)作物基本苗數(shù))對有效穗數(shù)的影響約占了83.2%所以隨機誤差對有效穗數(shù)的影響約占.規(guī)律總結(jié):進行線性回歸分析的關(guān)鍵是先畫出樣本點的散點圖,確定出變量具有線性相關(guān)關(guān)系,再求出線性回歸方程.如果,的線性相關(guān)關(guān)系具有統(tǒng)計意義,就可以用線性回歸方程作出預(yù)測和控制.預(yù)測是指對于的取值范圍內(nèi)的任一個,取相應(yīng)值的估計;控制是指通過控制的值把的值控制在指定范圍內(nèi).類型二獨立性檢驗例3某工廠有25周歲以上(含25周歲)工人300名,25周歲以下工人200名.為研究工人的日平均生產(chǎn)量是否與年齡有關(guān),現(xiàn)采用分層抽樣的方法,從中抽取了100名工人,先統(tǒng)計了他們某月的日平均生產(chǎn)件數(shù),然后按工人年齡在“25周歲以上(含25周歲)”和“25周歲以下”分為兩組,再將兩組工人的日平均生產(chǎn)件數(shù)分成5組:[50,60),[60,70),[70,80),[80,90),[90,100]分別加以統(tǒng)計,得到如圖所示的頻率分布直方圖.(1)從樣本中日平均生產(chǎn)件數(shù)不足60件的工人中隨機抽取2人,求至少抽到一名“25周歲以下組”工人的概率;(2)規(guī)定日平均生產(chǎn)件數(shù)不少于80件者為“生產(chǎn)能手”,請你根據(jù)已知條件完成列聯(lián)表,并判斷能否在犯錯誤的概率不超過0.1的前提下認為“生產(chǎn)能手與工人所在的年齡組有關(guān)”分析:(1)利用列舉法列出基本事件,結(jié)合古典概型求解;(2)利用獨立性檢驗公式計算求解.解:(1)由已知可得,樣本中有25周歲以上組工人60名,25周歲以下組工人40名,所以樣本中日平均生產(chǎn)件數(shù)不足60件的工人中,25周歲以上組工人有(人),記為;25周歲以下組工人有(人),記為.從中隨機抽取2名工人,所有的可能結(jié)果共有10種,分別是其中,至少有一名“25周歲以下組”工人的可能結(jié)果共有7種,分別是故所求的概率.(2)由頻率分布直方圖可知,在抽取的100名工人中,“25周歲以上組”中的生產(chǎn)能手有(人),“25周歲以下組”中的生產(chǎn)能手有(人),據(jù)此可得列聯(lián)表如下:生產(chǎn)能手非生產(chǎn)能手總計25周歲以上組15456025周歲以下組152540總計3070100所以代入公式,得的觀測值為因為,所以不能在犯錯誤的概率不超過0.1的前提下認為“生產(chǎn)能手與工人所在的年齡組有關(guān)”解后反思:解決獨立性檢驗問題的基本步驟:(1)找出相關(guān)數(shù)據(jù),作列聯(lián)表;(2)求隨機變量的觀測值;(3)判斷可能性,注意與臨界值進行比較,得出事件有關(guān)的可信度.例4為了比較注射A,B兩種藥物后產(chǎn)生的皮膚皰疹的面積,選200只家兔做試驗.將這200只家兔隨機地分成兩組,每組100只,其中一組注射藥物A,另一組注射藥物B.(1)甲、乙是200只家兔中的2只,求甲、乙分在不同組的概率;(2)下表1和表2分別表示注射藥物A和B后的試驗結(jié)果(皰疹面積單位:).表1:注射藥物A后皮膚皰疹面積的頻數(shù)分布表皰疹面積[60,65)[65,70)[70,75)[75,80)頻數(shù)30402010表2:注射藥物B后皮膚皰疹面積的頻數(shù)分布表皰疹面積[60,65)[65,70)[70,75)[75,80)[80,85)頻數(shù)1025203015①完成下面頻率分布直方圖(圖34和圖35),并比較注射兩種藥物后皰疹面積的中位數(shù)大小;注射藥物A后皮膚皰疹面積的頻率分布直方圖注射藥物B后皮膚皰疹面積的頻率分布直方圖②完成下面列聯(lián)表,并回答能否在犯錯誤的概率不超過的前提下認為“注射藥物A后的皰疹面積與注射藥物B后的皰疹面積有差異”.表3:皰疹面積小于皰疹面積不小于總計注射藥物A注射藥物B總計分析:(1)利用排列組合知識及古典概型求解;(2)先根據(jù)頻數(shù)分布表完成頻率分布直方圖和列聯(lián)表,再計算的觀測值,并與臨界值比較后進行判斷.解析:(1)甲、乙兩只家兔分在不同組的概率為.(2)①頻率分布直方圖如圖所示.注射藥物A后皮膚皰疹面積的頻率分布直方圖注射藥物B后皮膚皰疹面積的頻率分布直方圖可以看出注射藥物A后的皰疹面枳的中位數(shù)在6
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 第二十四章 相似三角形(11個知識歸納)
- 1-3單元古詩文默寫訓(xùn)練-2022-2023學(xué)年七年級語文上冊知識梳理與能力訓(xùn)練
- 臨高縣新盈中學(xué)2024-2025學(xué)年高三上學(xué)期期中考試試卷
- 黑龍江省齊齊哈爾市富??h益海學(xué)校2024-2025學(xué)年八年級上學(xué)期期中地理試題(含答案)
- 廣東省深圳市盟校聯(lián)盟2024-2025學(xué)年高一上學(xué)期11月期中物理試題(含解析)
- 一元二次不等式中的含參問題(原卷版)-2024-2025學(xué)年人教版高一數(shù)學(xué)壓軸題攻略
- 2024年四川省公務(wù)員考試《行測》真題及答案解析
- 工廠整體轉(zhuǎn)讓合同樣本
- 2024高考物理一輪復(fù)習(xí):受力分析共點力平衡(練習(xí))(學(xué)生版+解析)
- 有關(guān)產(chǎn)品銷售合同模板匯編
- 走近湖湘紅色人物智慧樹知到答案2024年湖南工商大學(xué)
- 高考數(shù)學(xué)小題狂練:每題都附有詳細解析
- Poka-Yoke防錯技術(shù)(完整版)
- 保安交接班記錄表(2)
- 神明—EZflame火焰檢測系統(tǒng)
- 個人簡歷求職簡歷課件.ppt
- 2018年江蘇高考滿分作文:在母語的屋檐下
- 新青島版五四制2021-2022四年級科學(xué)上冊實驗指導(dǎo)
- 小學(xué)四年級音樂課程標(biāo)準(zhǔn)
- 雙向細目表和單元測試卷及組卷說明
- 離子色譜法測定空氣中二氧化硫
評論
0/150
提交評論