成對數(shù)據(jù)的統(tǒng)計分析講義-2024屆高三數(shù)學一輪復習_第1頁
成對數(shù)據(jù)的統(tǒng)計分析講義-2024屆高三數(shù)學一輪復習_第2頁
成對數(shù)據(jù)的統(tǒng)計分析講義-2024屆高三數(shù)學一輪復習_第3頁
成對數(shù)據(jù)的統(tǒng)計分析講義-2024屆高三數(shù)學一輪復習_第4頁
成對數(shù)據(jù)的統(tǒng)計分析講義-2024屆高三數(shù)學一輪復習_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

PAGE1第02講成對數(shù)據(jù)的統(tǒng)計分析【必備知識】1、變量的相關關系(1)相關關系:兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系.(2)相關關系的分類:正相關和負相關.(3)線性相關:一般地,如果兩個變量的取值呈現(xiàn)正相關或負相關,而且散點落在一條直線附近,稱這兩個變量線性相關.2、樣本相關系數(shù)(1)樣本相關系數(shù)(2)當,成對樣本數(shù)據(jù)正相關;當時,成對樣本數(shù)據(jù)負相關.(3)當越接近1時,成對樣本數(shù)據(jù)的線性相關程度越強;當越接近0時,成對樣本數(shù)據(jù)的線性相關程度越弱.3、一元線性回歸模型(1)經(jīng)驗回歸方程為,其中.(2)殘差分析①觀測值:通過觀測得到的數(shù)據(jù).②預測值:通過經(jīng)驗回歸方程得到的.③殘差:觀測值減去預測值的差.④殘差分析:通過對殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等.這方面的工作稱為殘差分析.XY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+dn=a+b+c+d4.獨立性檢驗(1)假定通過簡單隨機抽樣得到了X和Y的抽樣數(shù)據(jù)列聯(lián)表,如表所示.則.(2)獨立性檢驗當時,推斷不成立,即認為和不獨立,該推斷犯錯誤的概率不超過α;當時,沒有充分證據(jù)推斷不成立,可以認為和獨立.利用χ2的取值推斷分類變量和是否獨立的方法稱為獨立性檢驗,簡稱獨立性檢驗.考點04相關關系的判斷【常見方法】判斷相關關系的方法:(1)回歸方程法:利用回歸方程中的系數(shù)的正負判斷.(2)散點圖法:如果所有的樣本點都落在某一曲線附近,那么變量之間就有相關關系;如果所有的樣本點都落在某一直線附近,那么變量之間就有線性相關關系.(3)相關系數(shù)法:利用相關系數(shù)判斷,|r|越趨近于1,相關性越強.【典例分析04】1、為了對變量x與y的線性相關進行檢驗,由樣本點(x1,y1)、(x2,y2)、…、(x10,y10)求得兩個變量的樣本相關系數(shù)為r,那么下面說法中正確的是()A.若所有樣本點都在直線y=-2x+1上,則r=1B.若所有樣本點都在直線y=-2x+1上,則r=-2C.若越大,則變量x與y的線性相關性越強D.若越小,則變量x與y的線性相關性越強2、下列命題中正確的為()A.線性相關系數(shù)r越大,兩個變量的線性相關性越強B.線性相關系數(shù)r越小,兩個變量的線性相關性越弱C.殘差平方和越小的模型,模型擬合的效果越好D.用相關指數(shù)R2來刻畫回歸效果,R2越小,說明模型的擬合效果越好3、某校一個課外學習小組為研究某作物種子的發(fā)芽率y和溫度x(單位:℃)的關系,在20個不同的溫度條件下進行種子發(fā)芽實驗,由實驗數(shù)據(jù)(xi,yi)(i=1,2,…,20)得到下面的散點圖:由此散點圖,在10℃至40℃之間,下面四個回歸方程類型中最適宜作為發(fā)芽率y和溫度x的回歸方程類型的是()A.y=a+bxB.y=a+bx2C.y=a+bexD.y=a+blnx考點05線性回歸方程角度01線性回歸方程及其應用【常見方法】求線性回歸方程的基本步驟(1)先把數(shù)據(jù)制成表,從表中計算出x、y,xeq\o\al(\s\up1(2),\s\do1(1))+xeq\o\al(\s\up1(2),\s\do1(2))+…+xeq\o\al(\s\up1(2),\s\do1(n))、x1y1+x2y2+…+xnyn的值;(2)計算回歸系數(shù);(3)寫出線性回歸方程.注意:回歸方程一定過點(x,y).【典例分析05】1、某食品廠2020年2月至6月的某款飲料生產(chǎn)產(chǎn)量(單位:萬件)的數(shù)據(jù)如下表:月份x23456生產(chǎn)產(chǎn)量y/萬件356.5810.5(1)根據(jù)以上數(shù)據(jù),求y關于x的線性回歸方程;(2)調(diào)查顯示該年7月份的實際市場需求量為13.5萬件,求該年7月份所得回歸方程預測的生產(chǎn)產(chǎn)量與實際市場需求量的誤差.參考公式:,.角度02相關系數(shù)及其應用【常見方法】1.模型擬合效果的判斷(1)殘差平方和越小,模型的擬合效果越好;(2)決定系數(shù)R2越大,模型的擬合效果越好;(3)回歸方程的擬合效果,可以利用相關系數(shù)判斷.當|r|越趨近于1時,兩變量的線性相關程度越強.2.確定殘差系數(shù).其中是殘差平方和,其值越小,則越大(接近1),模型的擬合效果越好.2、某沙漠地區(qū)經(jīng)過治理,生態(tài)系統(tǒng)得到很大改善,野生動物數(shù)量有所增加.為調(diào)查該地區(qū)某種野生動物的數(shù)量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區(qū),調(diào)查得到樣本數(shù)據(jù)(xi,yi)(i=1,2,…,20),其中xi和yi分別表示第i個樣區(qū)的植物覆蓋面積(單位:公頃)和這種野生動物的數(shù)量,并計算得,,,,.(1)求該地區(qū)這種野生動物數(shù)量的估計值(這種野生動物數(shù)量的估計值等于樣區(qū)這種野生動物數(shù)量的平均數(shù)乘以地塊數(shù));(2)求樣本(xi,yi)(i=1,2,…,20)的相關系數(shù)(精確到0.01);(3)根據(jù)現(xiàn)有統(tǒng)計資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性以獲得該地區(qū)這種野生動物數(shù)量更準確的估計,請給出一種你認為更合理的抽樣方法,并說明理由.附:相關系數(shù),eq\r(2)≈1.414.角度03非線性回歸分析【常見方法】非線性回歸方程的求法(1)根據(jù)原始數(shù)據(jù)(x,y)作出散點圖.(2)根據(jù)散點圖選擇恰當?shù)臄M合函數(shù).(3)作恰當?shù)淖儞Q,將其轉化成線性函數(shù),求線性回歸方程.(4)在(3)的基礎上通過相應變換,即可得到非線性回歸方程.3、某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費(單位:千元)對年銷售量(單位:)和年利潤(單位:千元)的影響,對近8年的年宣傳費和年銷售量i(i=1,2,…,8)數(shù)據(jù)作了初步處理,得到如圖所示的散點圖及一些統(tǒng)計量的值.46.65636.8289.81.61.469108.8表中,.(1)根據(jù)散點圖判斷,與哪一個適宜作為年銷售量y關于年宣傳費x的回歸方程類型(給出判斷即可,不必說明理由)?(2)根據(jù)(1)的判斷結果及表中數(shù)據(jù),建立y關于x的回歸方程.考點06獨立性檢驗【常見方法】獨立性檢驗的一般步驟(1)根據(jù)樣本數(shù)據(jù)制成2×2列聯(lián)表;(2)根據(jù)公式計算.(3)如果,則“X與Y有關系”這種推斷犯錯誤的概率不超過a;否則,就認為在犯錯誤的概率不超過α的前提下不能推斷“X與Y有關系”,或者在樣本數(shù)據(jù)中沒有發(fā)現(xiàn)足夠的證據(jù)支持結論“X與Y有關系”.【典例分析06】1、甲、乙兩臺機床生產(chǎn)同種產(chǎn)品,產(chǎn)品按質量分為一級品和二級品,為了比較兩臺機床產(chǎn)品的質量,分別用兩臺機床各生產(chǎn)了200件產(chǎn)品,產(chǎn)品的質

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論