




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1人教A版2019選擇性必修第三冊第八章《成對數(shù)據(jù)的統(tǒng)計分析》
在必修課程中,我們學習了單個變量的觀察數(shù)據(jù)的直觀表示和統(tǒng)計特征的刻畫等知識與方法.例如,用直方圖描述樣本數(shù)據(jù)的分布規(guī)律,用均值刻畫樣本數(shù)據(jù)的集中趨勢,用方差刻畫樣本數(shù)據(jù)的離散程度等.這些方法主要適用于通過樣本認識單個變量的統(tǒng)計規(guī)律.
在現(xiàn)實中,我們還經(jīng)常需要了解兩個或兩個以上變量之間的關系.例如,教育部門為掌握學生身體健康狀況,需要了解身高變量和體重變量之間的關系;醫(yī)療衛(wèi)生部門要制定預防青少年近視的措施,需要了解有哪些因素會影響視力,以及這些因素是如何影響視力的;商家要根據(jù)顧客的意見改進服務水平,希望了解哪些因素影響服務水平,以及這些因素是如何起作用的;等等.
為此,我們需要進一步學習通過樣本推斷變量之間關系的知識和方法.
本章的學習內(nèi)容有成對數(shù)據(jù)的統(tǒng)計相關性、一元線性回歸模型和2×2列聯(lián)表等,這些知識與方法在解決實際問題中非常有用.可以發(fā)現(xiàn),兩個隨機變量的相關性可以通過成對樣本數(shù)據(jù)進行分析;利用一元線性回歸模型可以研究變量之間的隨機關系,進行預測;利用2×2列聯(lián)表可以檢驗兩個隨機變量的獨立性.
本章的學習對于提高我們解決實際問題的能力,提升數(shù)據(jù)分析、數(shù)學建模等素養(yǎng)都是非常有幫助的.
如果變量y是變量x的函數(shù),那么由x就可以唯一確定y.然而,現(xiàn)實世界中還存在這樣的情況:兩個變量之間有關系,但密切程度又達不到函數(shù)關系的程度.例如,人的體重與身高存在關系,但由一個人的身高值并不能確定他的體重值.那么,該如何刻畫這兩個變量之間的關系呢?下面我們就來研究這個問題.8.1成對數(shù)據(jù)的統(tǒng)計相關性
我們知道,一個人的體重與他的身高有關系.一般而言,個子高的人往往體重值較大,個子矮的人往往體重值較小.但身高并不是決定體重的唯一因素.
例如生活中的飲食習慣、體育鍛煉、睡眠時間以及遺傳因素等也是影響體重的重要因素.像這樣,兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系.1.相關關系:8.1.1變量的相關關系
兩個變量具有相關關系的事例在現(xiàn)實中大量存在.例如:1.子女身高y與父親身高x之間的關系.一般來說,父親的個子高,其子女的個子也會比較高;父親個子矮,其子女的個子也會比較矮.但影響子女身高的因素,除父親身高外還有其他因素,例如母親身高、飲食結構、體育鍛煉等,因此父親身高又不能完全決定子女身高.2.商品銷售收入y與廣告支出x之間的關系.一般來說,廣告支出越多,商品銷售收人越高.但廣告支出并不是決定商品銷售收入的唯一因素,商品銷售收入還與商品質量、居民收入等因素有關.
兩個變量具有相關關系的事例在現(xiàn)實中大量存在.例如:3.空氣污染指數(shù)y與汽車保有量x之間的關系.一般來說,汽車保有量增加,空氣污染指數(shù)會上升.但汽車保有量并不是造成空氣污染的唯一因素,氣象條件、工業(yè)生產(chǎn)排放、居民生活和取暖、垃圾焚燒等都是影響空氣污染指數(shù)的因素.4.糧食畝產(chǎn)量y與施肥量x之間的關系.在一定范圍內(nèi),施肥量越大,糧食畝產(chǎn)量就越高.但施肥量并不是決定糧食畝產(chǎn)量的唯一因素,糧食畝產(chǎn)量還要受到土壤質量、降水量、田間管理水平等因素的影響.
因為在相關關系中,變量y的值不能隨變量x的值的確定而唯一確定,所以我們無法直接用函數(shù)去描述變量之間的這種關系.對上述各例中兩個變量之間的相關關系,我們往往會根據(jù)自己以往積累的經(jīng)驗作出推斷.“經(jīng)驗之中有規(guī)律”,經(jīng)驗的確可以為我們的決策提供一定的依據(jù),但僅憑經(jīng)驗推斷又有不足.例如,不同經(jīng)驗的人對同一情形可能會得出不同結論,不是所有的情形都有經(jīng)驗可循等.因此,在研究兩個變量之間的相關關系時,我們需要借助數(shù)據(jù)說話,即通過樣本數(shù)據(jù)分析,從數(shù)據(jù)中提取信息,并構建適當?shù)哪P?,再利用模型進行估計或推斷.
變量的相關關系與函數(shù)關系的區(qū)別和聯(lián)系:相同點:兩者均是兩個變量之間的關系;不同點:①函數(shù)關系是一種確定的關系,如勻速直線運動中時間t與路程s的關系,相關關系是一種非確定的關系,如一塊農(nóng)田的小麥產(chǎn)量與施肥量之間的關系;②函數(shù)關系是兩個隨機變量之間的關系,而相關關系是非隨機變量與隨機變量之間的關系;③函數(shù)關系是一種因果關系,而相關關系不一定是因果關系,也可能是伴隨關系.練習:下列關系中,屬于相關關系的是__________①正方形的邊長與面積之間的關系②農(nóng)作物的產(chǎn)量與施肥量之間的關系③出租車打車費與行駛的里程④降雪量與交通事故的發(fā)生率之間的關系②④兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系.相關關系:探究:在對人體的脂肪含量和年齡之間關系的研究中,科研人員獲得了一些年齡和脂肪含量的簡單隨機樣本數(shù)據(jù),如下表所示.表中每個編號下的年齡和脂肪含量數(shù)據(jù)都是對同一個體的觀測結果,它們構成了成對數(shù)據(jù).編號1234567年齡/歲23273941454950脂肪含量/%9.517.821.225.927.526.328.2編號891011121314年齡/歲53545657586061脂肪含量/%29.630.231.430.833.535.234.6根據(jù)以上數(shù)據(jù),你能推斷人體的脂肪含量與年齡之間存在怎樣的關系嗎?
為了更加直觀地描述上述成對樣本數(shù)據(jù)中脂肪含量與年齡之間的關系,我們用圖形展示成對樣本數(shù)據(jù)的變化特征、用橫軸表示年齡,縱軸表示脂肪含量,則表中每個編號下的成對樣本數(shù)據(jù)都可用直角坐標系中的點表示出來,由這些點組成了如下圖所示的統(tǒng)計圖.我們把這樣的統(tǒng)計圖叫做散點圖.
觀察圖形,可以發(fā)現(xiàn),這些散點大致落在一條從左下角到右上角的直線附近,表明隨年齡值的增加,相應的脂肪含量值呈現(xiàn)增加的趨勢.這樣,由成對樣本數(shù)據(jù)的分布規(guī)律,我們可以推斷脂肪含量變量和年齡變量之間存在著相關關系.
如果從整體上看,當一個變量的值增加時,另一個變量的相應值也呈現(xiàn)增加的趨勢,我們就稱這兩個變量正相關;如果當一個變量的值增加時,另一個變量的相應值呈現(xiàn)減小的趨勢,則稱這兩個變量負相關.
由圖可推斷脂肪含量與年齡這兩個變量正相關.思考:(1)兩個變量負相關時,成對樣本數(shù)據(jù)的散點圖有什么特點?(2)你能舉出生活中兩個變量正相關或負相關的一些例子嗎?
散點圖是描述成對數(shù)據(jù)之間關系的一種直觀方法.觀察下面的散點圖,從中我們不僅可以大致看出脂肪含量和年齡呈現(xiàn)正相關性,而且從整體上可以看出散點落在某條直線附近.一般地,如果兩個變量的取值呈現(xiàn)正相關或負相關,而且散點落在一條直線附近,我們就稱這兩個變量線性相關.年齡/歲脂肪含量/%
觀察散點圖8.1-2,我們發(fā)現(xiàn):圖(1)中的散點落在某條曲線附近,而不是落在一條直線附近,說明這兩個變量具有相關性,但不是線性相關;類似地,圖(2)中的散點落在一條折線附近,這兩個變量也具有相關性,但它們既不是正相關,也不是負相關;圖(3)中的散點雜亂無章,無規(guī)律可言,看不出兩個變量有什么相關性.
一般地,如果兩個變量具有相關性,但不是線性相關,那么我們就稱這兩個變量非線性相關或曲線相關.
課堂小結:兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系.1.相關關系把成對樣本數(shù)據(jù)用直角坐標系中的點表示出來,由這些點組成的統(tǒng)計圖叫做散點圖.2.散點圖3.正相關與負相關一個變量隨另一個變量的增加呈現(xiàn)減小的趨勢.正相關:一個變量隨另一個變量的增加呈現(xiàn)增加的趨勢.負相關:1.舉例說明什么叫相關關系.相關關系與函數(shù)關系有什么區(qū)別?例如,身高與腳長的關系,一般來說,身高較高的人腳長也會較長,但身高相同的人腳長末必相同;
受教育程度和收人水平的關系,一般來說,受教育程度高的人收入也較高,但受教育程度相同的人收入未必相同.
相關關系是指從總的變化趨勢來看,變量之間存在著某種關系,但這種關系又不能用函數(shù)關系完全表達出來.相關關系是不確定性的數(shù)量關系,對其中一個變量的每個取值,另一個變量可能有多個不同的取值;而函數(shù)關系是確定性的數(shù)量關系,對自變量的每個取值,因變量有唯一確定的值與之對應.相同點:均是指兩個變量的關系.不同點:函數(shù)關系是一種確定的關系,因果關系;而相關關系是一種非確定性關系,也可能是伴隨關系.
請看課本P95:練習12.根據(jù)下面的散點圖,判斷圖中的兩個變量是否存在相關關系.負相關非線性相關不相關正相關
請看課本P95:練習23.下表給出了一些地區(qū)的鳥的種類數(shù)與該地區(qū)的海拔高度的數(shù)據(jù),鳥的種類數(shù)與海拔高度是否存在相關關系?如果是,那么這種相關關系有什么特點?地區(qū)ABCDEFGHIJK海拔/m1250115810674577017316106701493762549鳥的種類/種363037111113171329415海拔高度/m解:從散點圖中散點的分布看,鳥的種類數(shù)與海拔高度正相關,鳥的種類數(shù)在海拔高度1000m以上的明顯多于在海拔高度1000m以下的.但從局部看,不管是在海拔高度1000m以上,還是在海拔高度1000m以下,鳥的種類數(shù)和海拔高度正相關都不明顯
請看課本P95:練習3例:以下是某地不同樓盤新房的銷售價格y(單位:萬元)和面積x(單位:m2)的數(shù)據(jù)解:面積x(m2)11511080135105銷售價格y(萬元)24.821.619.429.222(1)畫出數(shù)據(jù)對應的散點圖;(2)判斷新房的銷售價格和面積之間是否具有相關關系.如果有相關關系,是正相關還是負相關?(1)數(shù)據(jù)對應的散點圖如圖所示.(2)通過以上數(shù)據(jù)對應的散點圖可以判斷,新房的銷售價格和面積之間具有相關關系,且是正相關.1.下列所給出的兩個變量之間存在相關關系的為(
)A.學生的座號
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廈門美術聯(lián)考試題及答案
- 日語高考試題及答案
- 酒店中餐宴會擺臺培訓
- 圓明園的毀滅
- 2025年中國噴泉泵行業(yè)市場全景分析及前景機遇研判報告
- ICU臨床思維與病例演練
- 腫瘤科患者便秘預防與管理
- 偏癱病人的臀部護理
- 綜合外科常規(guī)護理
- 直腸癌術后的護理
- 2025至2030中國汽車微電機行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報告
- 2025年內(nèi)蒙古能源集團煤電板塊所屬單位招聘筆試參考題庫含答案解析
- 山東省菏澤市2023-2024學年高一下學期7月期末教學質量檢測政治試卷(含答案)
- 安全文明施工專項方案及保證措施
- 圓桶養(yǎng)殖水質管理制度
- 經(jīng)營管理崗考試題及答案
- T/CI 312-2024風力發(fā)電機組塔架主體用高強鋼焊接性評價方法
- 2025年農(nóng)作物種植技術員(初級)職業(yè)技能鑒定考試題庫(含答案)
- 2025-2030中國汽車涂料行業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報告
- 訂房定金協(xié)議書
- 汛期安全教育知識培訓
評論
0/150
提交評論