




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第九章統(tǒng)計成對數據的統(tǒng)計分析第三講成對數據的統(tǒng)計分析知識梳理雙基自測考點突破互動探究名師講壇素養(yǎng)提升知識梳理雙基自測知識點一變量的相關關系(1)相關關系兩個變量有關系,但又沒有確切到可由其中的一個_另一個的程度,這種關系稱為相關關系(2)散點圖每一個序號下的成對樣本數據都可用直角坐標系中的_表示出來,由這些點組成的統(tǒng)計圖稱為散點圖去精確地決定點(3)正相關、負相關如果從整體上看,當一個變量的值增加時,另一個變量的相應值也呈現_的趨勢,我們就稱這兩個變量正相關;如果當一個變量的值增加時,另一個變量的相應值呈現_的趨勢,則稱這兩個變量負相關(4)變量的線性相關如果兩個變量的取值呈現_,而且散點落在
2、_附近,我們就稱這兩個變量線性相關一般地,如果兩個變量具有相關性,但不是線性相關,那么我們就稱這兩個變量_.增加減小正相關或負相關一條直線非線性相關或曲線相關(5)樣本相關系數稱r_為變量x和變量y的相關系數r1,1,當r0時,成對樣本數據_;當r0時,成對樣本數據_;當|r|接近1時,成對樣本數據的線性相關程度_;當|r|接近0時,成對樣本數據的線性相關程度_.正相關負相關越強越弱bxae02因變量或響應變量自變量或解釋變量經驗回歸直線最小二乘法最小二乘估計觀測值預測值殘差殘差是隨機誤差的估計結果,通過對殘差的分析可以判斷模型刻畫數據的效果,以及判斷原始數據中是否存在可疑數據等,這方面工作稱
3、為_.殘差的散點圖殘差比較均勻地集中分布在以橫軸為對稱軸的水平帶狀區(qū)域內,則滿足一元線性回歸模型對隨機誤差的假設殘差分析小好大差知識點三獨立性檢驗(1)分類變量:用以區(qū)別不同的現象或性質的隨機變量(2)22列聯表設X,Y為兩個分類變量,它們的取值分別為x1,x2和y1,y2,其樣本頻數列聯表(22列聯表)如下:abbdabcd(3)獨立性檢驗零假設(或原假設)以為樣本空間的古典概型設X和Y為定義在上,取值于0,1的成對分類變量H0:_稱為零假設臨界值2_.P(Y1|X0)P(Y1|X1)臨界值對于任何小概率值,可以找到相應的正實數x,使得下面關系成立:P(2x).稱x為的_,這個臨界值就可作為
4、判斷2大小的標準概率值越小,臨界值x越大獨立性檢驗基于小概率值的檢驗規(guī)則是:當2xa時,我們就推斷H0不成立,即認為X和Y_,該推斷犯錯誤的概率不_;不獨立超過當2x時,我們沒有充分證據推斷H0不成立,可以認為X和Y _.這種利用2的取值推斷分類變量X和Y是否獨立的方法稱為2獨立性檢驗,讀作“卡方獨立性檢驗”,簡稱獨立性檢驗獨立(4)獨立性檢驗解決實際問題的一般步驟:提出零假設H0:X與Y相互獨立,并給出在問題中的解釋根據抽樣數據整理出22列聯表,計算2值,并與臨界值x比較根據經驗規(guī)則得出推斷結論在X和Y不獨立的情況下,根據需要,通過比較相應的頻率,分析X和Y間的影響規(guī)律1回歸分析是對具有相關
5、關系的兩個變量進行統(tǒng)計分析的方法,只有在散點圖大致呈線性分布時,求出的經驗回歸方程才有實際意義,否則,求出的經驗回歸方程毫無意義根據經驗回歸方程進行預報,僅是一個預報值,而不是真實發(fā)生的值題組一走出誤區(qū)1判斷下列結論是否正確(請在括號中打“”或“”)(1)“名師出高徒”可以解釋為教師的教學水平與學生的水平成正相關關系()(2)兩個隨機變量的線性相關性越強,相關系數的絕對值越接近于0.()(3)只有兩個變量有相關關系,所得到的回歸模型才有預測價值()BD3(選擇性必修3P132例3)某兒童醫(yī)院用甲、乙兩種療法治療小兒消化不良采用有放回簡單隨機抽樣的方法對治療情況進行檢查,得到了如下數據:抽到接受
6、甲種療法的患兒67名,其中未治愈15名、治愈52名;抽到接受乙種療法的患兒69名,其中未治愈6名,治愈63名試根據小概率值0.005的獨立性檢驗,分析甲、乙兩種療法的效果,結論為_.附:兩種療法效果沒有差異C5(2019高考全國卷)某商場為提高服務質量,隨機調查了50名男顧客和50名女顧客,每位顧客對該商場的服務給出滿意或不滿意的評價,得到下面列聯表:滿意不滿意男顧客4010女顧客3020(1)分別估計男、女顧客對該商場服務滿意的概率;(2)能否有95%的把握認為男、女顧客對該商場服務的評價有差異?考點突破互動探究(1)(2021江西省南昌二中高二期末)如圖是具有相關關系的兩個變量的一組數據的
7、散點圖的回歸直線,若去掉一個點使得余下的5個點所對應的數據的相關系數最大,則應當去掉的點是_.例1E考點一相關關系的判斷自主練透(2)對四組數據進行統(tǒng)計,獲得以下關于其相關系數的比較,正確的是()Ar2r40r3r1Br4r20r1r3Cr4r20r3r1Dr2r40r1r3解析(1)由于點越靠近回歸直線,則相關性越強,相關系數越大,又由于點E到回歸直線的距離最大,所以要去掉點E.(2)由相關系數的定義及散點圖所表達的含義,可知r2r40r30,d0)對兩個變量的關系進行擬合,請問哪個模型更適宜作為投放量x與年使用人次y的經驗回歸方程類型(給出判斷即可,不必說明理由),并求出y關于x的經驗回歸
8、方程;(2)已知每輛單車的購入成本為200元,年調度費以及維修等的使用成本為每人次0.2元,按用戶每使用一次,收費1元計算,若投入8 000輛單車,則幾年后可實現盈利?(2)投入8千輛單車,則年使用人次為3.47100.258347千人次,每年的收益為347(10.2)277.6(千元),總投資8 0002001 600 0001 600千元,假設需要n年開始盈利,則n277.61 600,即n5.76,故需要6年才能開始盈利非線性相關問題一般通過換元法轉化為線性相關(線性回歸分析)問題解決變式訓練2(2020課標)某校一個課外學習小組為研究某作物種子的發(fā)芽率y和溫度x(單位:)的關系,在20
9、個不同的溫度條件下進行種子發(fā)芽實驗,由實驗數據(xi,yi)(i1,2,20)得到下面的散點圖:由此散點圖,在10 至40 之間,下面四個回歸方程類型中最適宜作為發(fā)芽率y和溫度x的經驗回歸方程類型的是()AyabxByabx2CyabexDyabln x解析觀察題中散點圖可知,散點圖用光滑曲線連接起來比較接近對數型函數的圖象,故選DD(1)(2021全國高考)甲、乙兩臺機床生產同種產品,產品按質量分為一級品和二級品,為了比較兩臺機床產品的質量,分別用兩臺機床各生產了200件產品,產品的質量情況統(tǒng)計如下表:例4考點四獨立性檢驗師生共研一級品二級品合計甲機床15050200乙機床12080200合
10、計270130400(2) (2021四川大學附中期中)2020年,全球爆發(fā)了新冠肺炎疫情,為了預防疫情蔓延,某校推遲2020年的春季線下開學,并采取了“停課不停學”的線上授課措施為了解學生對線上課程的滿意程度,隨機抽取了該校的100名學生(男生與女生的人數之比為32)對線上課程進行評價打分,若評分不低于80分視為滿意,其得分情況的頻率分布直方圖如圖所示,若根據頻率分布直方圖得到的評分不低于70分的頻率為0.85.估計100名學生對線上課程評分的平均值;(每組數據用該組的區(qū)間中點值為代表)結合頻率分布直方圖,請完成以下22列聯表,并回答能否有99%的把握認為對“線上教學是否滿意與性別有關”;(
11、2)由已知得(0.015b0.03)100.85,解得b0.04,又(0.005a)1010.85,解得a0.01,評分的平均值為550.05650.1750.3850.4950.1580.完成22列聯表如下表:態(tài)度性別滿意不滿意合計男生253560女生301040合計5545100解獨立性檢驗的應用問題的關注點(1)兩個明確:明確兩類主體明確研究的兩個問題(2)兩個關鍵:準確列出22列聯表:準確理解2.注意:查表時不是查最大允許值,而是先根據題目要求的百分比找到第一行對應的數值,再將該數值對應的x值與求得的2相比較另外,表中第一行數據表示兩個變量沒有關聯的可能性p,所以其有關聯的可能性為1p
12、.變式訓練3(2021廣西欽州、崇左質檢)某出租汽車公司決定更換一批新的小汽車以代替原來的報廢的出租車,現有A,B兩款車型,根據以往這兩種出租車車型的數據,得到兩款出租車型使用壽命頻數表如下:使用壽命年數4年5年6年7年總計A型出租車(輛)10204525100B型出租車(輛1)填寫下表,并判斷是否有99%的把握認為出租車的使用壽命年數與汽車車型有關?使用壽命不高于5年使用壽命不低于6年總計A型B型總計P(2x)0.050.0100.001x3.8416.63510.828解析(1)根據題目所給數據得到如下22的列聯考:使用壽命不高于5年使用壽命不低于6年總計A型30
13、70100B型5050100總計80120200名師講壇素養(yǎng)提升重溫高考(2020全國)某沙漠地區(qū)經過治理,生態(tài)系統(tǒng)得到很大改善,野生動物數量有所增加為調查該地區(qū)某種野生動物的數量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區(qū),調查得到樣本數據(xi,yi)(i1,2,20),其中xi和yi分別表示第i個樣區(qū)的植物覆蓋面積(單位:公頃)和這種野生動物的數量,例5(1)求該地區(qū)這種野生動物數量的估計值(這種野生動物數量的估計值等于樣區(qū)這種野生動物數量的平均數乘以地塊數);(2)求樣本(xi,yi)(i1,2,20)的相關系數(精確到0.01);(3)根據現有
14、統(tǒng)計資料,各地塊間植物覆蓋面積差異很大為提高樣本的代表性以獲得該地區(qū)這種野生動物數量更準確的估計,請給出一種你認為更合理的抽樣方法,并說明理由(3)由于各地塊間植物覆蓋面積差異較大,為提高樣本數據的代表性,應采用分層抽樣,先將植物覆蓋面積按優(yōu)中差分成三層,在各層內按比例抽取樣本,在每層內用簡單隨機抽樣方法抽取樣本即可(2020課標全國)某學生興趣小組隨機調查了某市100天中每天的空氣質量等級和當天到某公園鍛煉的人次,整理數據得到下表(單位:天):例6(1)分別估計該市一天的空氣質量等級為1,2,3,4的概率;(2)求一天中到該公園鍛煉的平均人次的估計值(同一組中的數據用該組區(qū)間的中點值為代表);(3)若某天的空氣質量等級為1或2,則稱這
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 西方國家福利制度變革的歷史考察試題及答案
- 環(huán)境保護與公共政策的互動機制研究試題及答案
- 西方國家的基層治理模式探討試題及答案
- 關于公共政策的理論框架分析試題及答案
- 對話性公共政策的案例研究與評估試題及答案
- 分析西方政治制度中的不同利益關系試題及答案
- 激發(fā)潛能的軟件設計師考試試題及答案
- 探討西方政治制度對民主的影響試題及答案
- 項目管理中的績效考核與評價試題及答案
- 機電系統(tǒng)故障分析題及答案
- 2025屆湖北省武漢市高三五月模擬訓練物理(含答案)
- 秀場內外-走進服裝表演藝術知到智慧樹期末考試答案題庫2025年武漢紡織大學
- 醫(yī)美公司保密協(xié)議書
- 2025屆浙江省嘉興市高三9月基礎測試-數學(含答案)
- 藝術基金授課協(xié)議書
- 2025年入團考試時事熱點及試題與答案
- 醫(yī)務科工作制度
- 人流綜合征試題及答案
- 中華人民共和國民營經濟促進法
- 武漢大學研究生畢業(yè)論文模板
- 代建管理制度安徽省
評論
0/150
提交評論