




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、 高中數(shù)學(xué)必修3知識點總結(jié)第二章 統(tǒng)計2.1.1 簡單隨機(jī)抽樣1簡單隨機(jī)抽樣,也叫純隨機(jī)抽樣。就是從總體中不加任何分組、劃類、排隊等,完全隨機(jī)地抽取調(diào)查單位。特點是:每個樣本單位被抽中的可能性一樣(概率相等),樣本的每個單位完全獨立,彼此間無一定的關(guān)聯(lián)性和排斥性。簡單隨機(jī)抽樣是其它各種抽樣形式的基礎(chǔ)。通常只是在總體單位之間差異程度較小和數(shù)目較少時,才采用這種方法。2簡單隨機(jī)抽樣常用的方法: (1)抽簽法;隨機(jī)數(shù)表法;計算機(jī)模擬法;使用統(tǒng)計軟件直接抽取。在簡單隨機(jī)抽樣的樣本容量設(shè)計中,主要考慮:總體變異情況;允許誤差圍;概率保證程度。3抽簽法: (1)給調(diào)查對象群體中的每一個對象編號; (2)準(zhǔn)
2、備抽簽的工具,實施抽簽 (3)對樣本中的每一個個體進(jìn)行測量或調(diào)查 例:請調(diào)查你所在的學(xué)校的學(xué)生做喜歡的體育活動情況。4隨機(jī)數(shù)表法: 例:利用隨機(jī)數(shù)表在所在的班級中抽取10位同學(xué)參加某項活動。2.1.2系統(tǒng)抽樣1系統(tǒng)抽樣(等距抽樣或機(jī)械抽樣):把總體的單位進(jìn)行排序,再計算出抽樣距離,然后按照這一固定的抽樣距離抽取樣本。第一個樣本采用簡單隨機(jī)抽樣的辦法抽取。K(抽樣距離)=N(總體規(guī)模)/n(樣本規(guī)模)前提條件:總體中個體的排列對于研究的變量來說,應(yīng)是隨機(jī)的,即不存在某種與研究變量相關(guān)的規(guī)則分布??梢栽谡{(diào)查允許的條件下,從不同的樣本開始抽樣,對比幾次樣本的特點。如果有明顯差別,說明樣本在總體中的分
3、布承某種循環(huán)性規(guī)律,且這種循環(huán)和抽樣距離重合。2系統(tǒng)抽樣,即等距抽樣是實際中最為常用的抽樣方法之一。因為它對抽樣框的要求較低,實施也比較簡單。更為重要的是,如果有某種與調(diào)查指標(biāo)相關(guān)的輔助變量可供使用,總體單元按輔助變量的大小順序排隊的話,使用系統(tǒng)抽樣可以大大提高估計精度。2.1.3分層抽樣1分層抽樣(類型抽樣):先將總體中的所有單位按照某種特征或標(biāo)志(性別、年齡等)劃分成若干類型或?qū)哟?,然后再在各個類型或?qū)哟沃胁捎煤唵坞S機(jī)抽樣或系用抽樣的辦法抽取一個子樣本,最后,將這些子樣本合起來構(gòu)成總體的樣本。兩種方法:1先以分層變量將總體劃分為若干層,再按照各層在總體中的比例從各層中抽取。2先以分層變量將
4、總體劃分為若干層,再將各層中的元素按分層的順序整齊排列,最后用系統(tǒng)抽樣的方法抽取樣本。2分層抽樣是把異質(zhì)性較強的總體分成一個個同質(zhì)性較強的子總體,再抽取不同的子總體中的樣本分別代表該子總體,所有的樣本進(jìn)而代表總體。分層標(biāo)準(zhǔn):(1)以調(diào)查所要分析和研究的主要變量或相關(guān)的變量作為分層的標(biāo)準(zhǔn)。(2)以保證各層部同質(zhì)性強、各層之間異質(zhì)性強、突出總體在結(jié)構(gòu)的變量作為分層變量。(3)以那些有明顯分層區(qū)分的變量作為分層變量。3分層的比例問題: (1)按比例分層抽樣:根據(jù)各種類型或?qū)哟沃械膯挝粩?shù)目占總體單位數(shù)目的比重來抽取子樣本的方法。 (2)不按比例分層抽樣:有的層次在總體中的比重太小,其樣本量就會非常少,
5、此時采用該方法,主要是便于對不同層次的子總體進(jìn)行專門研究或進(jìn)行相互比較。如果要用樣本資料推斷總體時,則需要先對各層的數(shù)據(jù)資料進(jìn)行加權(quán)處理,調(diào)整樣本中各層的比例,使數(shù)據(jù)恢復(fù)到總體中各層實際的比例結(jié)構(gòu)。例1 某大學(xué)為了支援我國西部教育事業(yè),決定從2007應(yīng)屆畢業(yè)生報名的18名志愿者中,選取6人組成志愿小組.請用抽簽法和隨機(jī)數(shù)表法設(shè)計抽樣方案.解 抽簽法:第一步:將18名志愿者編號,編號為1,2,3,18.第二步:將18個分別寫在18外形完全一樣的紙條上,并揉成團(tuán),制成號簽;第三步:將18個號簽放入一個不透明的盒子里,充分?jǐn)噭?;第四步:從盒子中逐個抽取6個號簽,并記錄上面的編號;第五步:所得對應(yīng)的志
6、愿者,就是志愿小組的成員.隨機(jī)數(shù)表法:第一步:將18名志愿者編號,編號為01,02,03,18.第二步:在隨機(jī)數(shù)表中任選一數(shù)作為開始,按任意方向讀數(shù),比如第8行第29列的數(shù)7開始,向右讀;第三步:從數(shù)7開始,向右讀,每次取兩位,凡不在0118中的數(shù),或已讀過的數(shù),都跳過去不作記錄,依次可得到12,07,15,13,02,09.第四步:找出以上對應(yīng)的志愿者,就是志愿小組的成員.例2 某工廠有1 003名工人,從中抽取10人參加體檢,試用系統(tǒng)抽樣進(jìn)行具體實施.解 (1)將每個人隨機(jī)編一個號由0001至1003.(2)利用隨機(jī)數(shù)法找到3個號將這3名工人剔除. (3)將剩余的1 000名工人重新隨機(jī)編
7、號由0001至1000.(4)分段,取間隔k=100將總體均分為10段,每段含100個工人.(5)從第一段即為0001號到0100號中隨機(jī)抽取一個號l.(6)按編號將l,100+l,200+l,,900+l共10個選出,這10個所對應(yīng)的工人組成樣本.例3 (14分)某一個地區(qū)共有5個鄉(xiāng)鎮(zhèn),人口3萬人,其中人口比例為32523,從3萬人中抽取一個300人 的樣本,分析某種疾病的發(fā)病率,已知這種疾病與不同的地理位置與水土有關(guān),問應(yīng)采取什么樣的方法?并寫出具體過程.解 應(yīng)采取分層抽樣的方法.過程如下:(1)將3萬人分為五層,其中一個鄉(xiāng)鎮(zhèn)為一層.(2)按照樣本容量的比例隨機(jī)抽取各鄉(xiāng)鎮(zhèn)應(yīng)抽取的樣本.30
8、0=60(人);300=40(人);300=100(人);300=40(人);300=60(人),因此各鄉(xiāng)鎮(zhèn)抽取人數(shù)分別為60人,40人,100人,40人,60人.(3)將300人組到一起即得到一個樣本.2.2.2用樣本的數(shù)字特征估計總體的數(shù)字特征1、本均值:2、樣本標(biāo)準(zhǔn)差:3用樣本估計總體時,如果抽樣的方法比較合理,那么樣本可以反映總體的信息,但從樣本得到的信息會有偏差。在隨機(jī)抽樣中,這種偏差是不可避免的。雖然我們用樣本數(shù)據(jù)得到的分布、均值和標(biāo)準(zhǔn)差并不是總體的真正的分布、均值和標(biāo)準(zhǔn)差,而只是一個估計,但這種估計是合理的,特別是當(dāng)樣本量很大時,它們確實反映了總體的信息。4(1)如果把一組數(shù)據(jù)中
9、的每一個數(shù)據(jù)都加上或減去同一個共同的常數(shù),標(biāo)準(zhǔn)差不變.(2)如果把一組數(shù)據(jù)中的每一個數(shù)據(jù)乘以一個共同的常數(shù)k,標(biāo)準(zhǔn)差變?yōu)樵瓉淼膋倍.(3)一組數(shù)據(jù)中的最大值和最小值對標(biāo)準(zhǔn)差的影響,區(qū)間的應(yīng)用;“去掉一個最高分,去掉一個最低分”中的科學(xué)道理.例1 為了解A,B兩種輪胎的性能,某汽車制造廠分別從這兩種輪胎中隨機(jī)抽取了8個進(jìn)行測試,下面列出了每一個輪胎行駛的最遠(yuǎn)里程數(shù)(單位:1 000 km)輪胎A96,112,97,108,100,103,86,98輪胎B108,101,94,105,96,93,97,106(1)分別計算A,B兩種輪胎行駛的最遠(yuǎn)里程的平均數(shù),中位數(shù);(2)分別計算A,B兩種輪胎行
10、駛的最遠(yuǎn)里程的極差、標(biāo)準(zhǔn)差;(3)根據(jù)以上數(shù)據(jù)你認(rèn)為哪種型號的輪胎性能更加穩(wěn)定?解 (1)A輪胎行駛的最遠(yuǎn)里程的平均數(shù)為:=100,中位數(shù)為: =99;B輪胎行駛的最遠(yuǎn)里程的平均數(shù)為:=100,中位數(shù)為:=99.(2)A輪胎行駛的最遠(yuǎn)里程的極差為:112-86=26,標(biāo)準(zhǔn)差為:s=7.43;B輪胎行駛的最遠(yuǎn)里程的極差為:108-93=15,標(biāo)準(zhǔn)差為:s= =5.43.(3)由于A和B的最遠(yuǎn)行駛里程的平均數(shù)一樣,而B輪胎行駛的最遠(yuǎn)里程的極差和標(biāo)準(zhǔn)差較小,所以B輪胎性能更加穩(wěn)定.例2(14分)某化肥廠甲、乙兩個車間包裝肥料,在自動包裝傳送帶上每隔30 min抽取一包產(chǎn)品,稱其重量,分別記錄抽查數(shù)據(jù)
11、如下:甲:102,101,99,98,103,98,99;乙:110,115,90,85,75,115,110.(1)這種抽樣方法是哪一種?(2)將這兩組數(shù)據(jù)用莖葉圖表示;(3)將兩組數(shù)據(jù)比較,說明哪個車間產(chǎn)品較穩(wěn)定.解 (1)因為間隔時間一樣,故是系統(tǒng)抽樣.(2)莖葉圖如下:(3)甲車間:平均值:=(102+101+99+98+103+98+99)=100,方差:s12=(102-100)2+(101-100)2+(99-100)23.428 6.乙車間:平均值:=(110+115+90+85+75+115+110)=100,方差:s22=(110-100)2+(115-100)2+(110
12、-100)2228.571 4.=,s12s22,甲車間產(chǎn)品穩(wěn)定.2.3.2兩個變量的線性相關(guān)1、概念: (1)回歸直線方程 (2)回歸系數(shù)2最小二乘法3直線回歸方程的應(yīng)用 (1)描述兩變量之間的依存關(guān)系;利用直線回歸方程即可定量描述兩個變量間依存的數(shù)量關(guān)系 (2)利用回歸方程進(jìn)行預(yù)測;把預(yù)報因子(即自變量x)代入回歸方程對預(yù)報量(即因變量Y)進(jìn)行估計,即可得到個體Y值的容許區(qū)間。 (3)利用回歸方程進(jìn)行統(tǒng)計控制規(guī)定Y值的變化,通過控制x的圍來實現(xiàn)統(tǒng)計控制的目標(biāo)。如已經(jīng)得到了空氣中NO2的濃度和汽車流量間的回歸方程,即可通過控制汽車流量來控制空氣中NO2的濃度。4應(yīng)用直線回歸的注意事項 (1)
13、做回歸分析要有實際意義; (2)回歸分析前,最好先作出散點圖; (3)回歸直線不要外延。5. 回歸直線方程的推導(dǎo) 設(shè)x與y是具有線性相關(guān)關(guān)系的兩個變量,且相應(yīng)于樣本的一組觀測值的n個點的坐標(biāo)分別是:,下面給出回歸方程的推導(dǎo)。 設(shè)所求的回歸方程為,其中是待確定的參數(shù),那么:,(),樣本中各個點的偏差是 ,()顯然,上面的各個偏差的符號有正、有負(fù),如果將他們相加會相互抵消一部分,因此他們的和不能代表n個點與回歸直線在整體上的接近程度,而是采用n個偏差的平方和來表示n個點與相應(yīng)直線(回歸直線)在整體上的接近程度。即求出當(dāng)取最小值時的的值,就求出了回歸方程。 (一) 先證明兩個在變形中用到的公式:公式
14、(1) 其中 因為所以公式() 因為所以(二)推導(dǎo):將的表達(dá)式的各項先展開,再合并、變形 -展開 -以a,b為同類項,合并 -以a,b的次數(shù)為標(biāo)準(zhǔn)整理 -將數(shù)據(jù)轉(zhuǎn)化為平均數(shù) -配方法 -展開 -整理-用公式(一)、(二)變形 -配方 在上式中,共有四項,后兩項與a,b無關(guān),為常數(shù);前兩項是兩個非負(fù)數(shù)的和,因此要使得區(qū)的最小值,當(dāng)且僅當(dāng)前兩項的值都為0。所以 或 -用公式(一)、(二)變形得 (三)總結(jié)規(guī)律:上述推倒過程是圍繞著待定參數(shù)a,b進(jìn)行的,只含有的部分是常數(shù)或系數(shù),用到的方法有(1)配方法,有兩次配方,分別是a的二次三項式和b的二次三項式;(2)變形時,用到公式(一)、(二)和整體思想
15、;(3)用平方的非負(fù)性求最小值。(4)實際計算時,通常是分步計算:先求出,再分別計算, 或,的值,最后就可以計算出a,b的值。6相關(guān)系數(shù)r統(tǒng)計中常用相關(guān)系數(shù)r來衡量兩個變量之間的線性相關(guān)的強弱,當(dāng)不全為零,yi也不全為零時,則兩個變量的相關(guān)系數(shù)的計算公式是:r就叫做變量y與x的相關(guān)系數(shù)(簡稱相關(guān)系數(shù))說明:(1)對于相關(guān)系數(shù)r,首先值得注意的是它的符號,當(dāng)r為正數(shù)時,表示變量x,y正相關(guān);當(dāng)r為負(fù)數(shù)時,表示兩個變量x,y負(fù)相關(guān);(2)另外注意r的大小,如果,那么正相關(guān)很強;如果,那么負(fù)相關(guān)很強;如果或,那么相關(guān)性一般;如果,那么相關(guān)性較弱例1測得某國10對父子身高(單位:英寸)如下:父親身高()60626465666768707274兒子身高()63.565.26665.566.967.167.468.370.170(1)對變量y與x進(jìn)行相關(guān)性檢驗;(2)如果y與x之間具有線性相關(guān)關(guān)系,求回歸直線方程;(3)如果父親的身高為73英寸,估計兒子身高解:(1),所以,所以y與x之間具有線性相關(guān)關(guān)系(2)設(shè)回歸直線方程為,則, 故所求的回歸直線方程為(3)當(dāng)英寸時,所以當(dāng)父親身高為73英寸時,估計兒子的身高約為69.9英寸點評:回歸直線是對兩個變量線性相關(guān)關(guān)系的定量描述,利用回歸直線,可以對一些實際問題進(jìn)行分析、預(yù)測,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 網(wǎng)絡(luò)游戲虛擬物品交易安全認(rèn)證與技術(shù)支持協(xié)議
- 農(nóng)田水利設(shè)施灌溉用水權(quán)承包轉(zhuǎn)讓合同
- 生命科學(xué)企業(yè)細(xì)胞凍存服務(wù)及專用儲存盒租賃合同
- 保險退保金結(jié)算與客戶權(quán)益保障協(xié)議
- 微信小程序電商運營培訓(xùn)與客戶關(guān)系管理協(xié)議
- DB42-T 2018-2023 大水面漁業(yè)資源調(diào)查評價技術(shù)規(guī)范
- 上海電子信息職業(yè)技術(shù)學(xué)院《農(nóng)業(yè)相關(guān)政策培訓(xùn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 江西工業(yè)職業(yè)技術(shù)學(xué)院《中西醫(yī)結(jié)合重癥醫(yī)學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 四川省樂山市犍為縣2025年初三下學(xué)期強化選填專練(二)生物試題含解析
- 江西現(xiàn)代職業(yè)技術(shù)學(xué)院《建筑史綱》2023-2024學(xué)年第一學(xué)期期末試卷
- 大數(shù)據(jù)背景下企業(yè)財務(wù)風(fēng)險分析與防范-以比亞迪公司為例
- 延髓梗死護(hù)理查房課件
- 醫(yī)院產(chǎn)科培訓(xùn)課件:《地中海貧血的產(chǎn)前篩查》
- 8.1陶瓷器及宋代五大名窯(全國導(dǎo)游基礎(chǔ)知識-第五版-)
- 可愛卡通立冬手抄報
- 日本人的衣食住行課件
- 第9章-輔助技術(shù)與環(huán)境改造
- 產(chǎn)品思維到用戶思維
- 華為成本控制 論文
- 仿生原理與創(chuàng)新設(shè)計課件
- 【自考練習(xí)題】大連理工大學(xué)概率論與數(shù)理統(tǒng)計真題匯總(附答案解析)
評論
0/150
提交評論