版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、統(tǒng)計學(xué)案一隨機抽樣(一)總體、個體、樣本把所考察對象的某一數(shù)值指標的全體構(gòu)成的集合看成總體,構(gòu)成總體的每一個元素為個體從總體中隨機抽取若干個個體構(gòu)成的集合叫做總體的一個樣本(二)抽樣方法1簡單隨機抽樣(1)定義:設(shè)一個總體含有N個個體,從中不放回地抽取n個個體作為樣本(nN),如果每次抽取時,總體內(nèi)的各個個體被抽到的機會都相等,稱這種抽樣方法為簡單隨機抽樣(2)簡單隨機抽樣的特點如下:它要求被抽取樣本的總體中個體數(shù)有限它是從總體中逐個地進行抽取它是一種不放回抽樣它每一次抽取時,總體中的各個個體有相同的可能性被抽到(3)常用的簡單隨機抽樣方法抽簽法先將總體中的所有N個個體編號,并把號碼寫在形狀、
2、大小相同的號簽上,然后將這些號簽放在同一個容器里,攪拌均勻抽簽時,每次從中抽出1個號簽,連續(xù)抽取n次,就得到一個容量為n的樣本抽簽法的優(yōu)點是簡單易行缺點是當總體的容量非常大時,費時、費力又不方便況且,如果號簽攪拌得不均勻,可能導(dǎo)致抽樣的不公平隨機數(shù)表法a隨機數(shù)表:隨機數(shù)表是由0,1,2,9這10個數(shù)字組成的數(shù)表,并且表中的每一位置出現(xiàn)各個數(shù)字的可能性相同b用隨機數(shù)表抽樣的步驟:第一步:將總體中的個體編號為了保證抽取樣本有很好的代表性,編號時位數(shù)要相同第二步:選定開始的數(shù)字為了保證所選定數(shù)字的隨機性,應(yīng)在面對隨機數(shù)表之前就指出開始數(shù)字的縱橫位置第三步:獲取樣本號碼隨機確定一個讀數(shù)方向,讀數(shù)的方向
3、可以向右,也可以向左、向上、向下等,重復(fù)的號碼跳過2系統(tǒng)抽樣(1)定義:當總體元素個數(shù)很大時,可將總體分成均衡的若干部分,然后按照預(yù)先制定的規(guī)則,從每一部分抽取一個個體得到所需要的樣本,這種抽樣方法叫做系統(tǒng)抽樣,也稱作等距抽樣(2)系統(tǒng)抽樣的步驟:編號采用隨機的方式將總體中的個體編號分段先確定分段的間隔k.當(N為總體中的個體數(shù),n為樣本容量)是整數(shù)時,k;當不是整數(shù)時,通過從總體中隨機剔除一些個體使剩下的總體中個體總數(shù)N能被n整除,這時k.確定起始個體編號在第1段用簡單隨機抽樣確定起始的個體編號S.按照事先確定的規(guī)則抽取樣本通常是將S加上間隔k,得到第2個個體編號Sk,再將(Sk)加上k,得
4、到第3個個體編號S2k,這樣繼續(xù)下去,獲得容量為n的樣本其樣本編號依次是:S,Sk,S2k,S(n1)k.3分層抽樣(1)定義:當總體由有明顯差別的幾部分組成時,按某種特征在抽樣時將總體中的各個個體分成互不交叉的層,然后按照各層在總體中所占的比例,從各層獨立地抽取一定數(shù)量的個體合在一起作為樣本,這種抽樣的方法叫做分層抽樣分層抽樣使用的前提是總體可以分層,層與層之間有明顯區(qū)別,而層內(nèi)個體間差異較小,每層中所抽取的個體數(shù)可按各層個體數(shù)在總體中所占比例抽取分層抽樣要求對總體的內(nèi)容有一定的了解,明確分層的界限和數(shù)目,分層要恰當各層抽取時采用簡單隨機抽樣或系統(tǒng)抽樣(2)分層抽樣的步驟分層;按比例確定每層
5、抽取個體的個數(shù);各層抽樣(方法可以不同);匯合成樣本(3)分層抽樣的優(yōu)點分層抽樣充分利用了己知信息,充分考慮了保持樣本結(jié)構(gòu)與總體結(jié)構(gòu)的一致性使樣本具有較好的代表性,而且在各層抽樣時,可以根據(jù)具體情況采取不同的抽樣方法,因此分層抽樣在實踐中有著非常廣泛的應(yīng)用6三種抽樣方法的比較類別共同點各自特點相互聯(lián)系適用范圍簡單隨機抽樣抽樣過程中每個個體被抽取的機會均等從總體中逐個抽取總體中的個體數(shù)較少系統(tǒng)抽樣將總體均勻分成幾部分,按事先確定的規(guī)則在各部分抽取在起始部分抽樣時采用簡單隨機抽樣總體中的個體數(shù)較多分層抽樣將總體分成幾層,分層進行抽取各層抽樣時采用簡單隨機抽樣或系統(tǒng)抽樣總體由差異明顯的幾部分組成練1
6、.(2010安徽文,14)某地有居民100 000戶,其中普通家庭99 000戶,高收入家庭1 000戶從普遍家庭中以簡單隨機抽樣方式抽取990戶,從高收入家庭中以簡單隨機抽樣方式抽取100戶進行調(diào)查,發(fā)現(xiàn)共有120戶家庭擁有3套或3套以上住房,其中普通家庭50戶,高收入家庭70戶依據(jù)這些數(shù)據(jù)并結(jié)合所掌握的統(tǒng)計知識,你認為該地擁有3套或3套以上住房的家庭所占比例的合理估計是_練2.將一個總體為100的個體編號為0,1,2,3,99,并依次將其分為10個小組,組號為0,1,,9,要用系統(tǒng)抽樣的方法抽取一個容量為10的樣本,規(guī)定如果在第0組(號碼為09)隨機抽取的號碼為2,則所抽取的10個號碼為
7、.練3.2010年高考湖北卷將參加夏令營的600名學(xué)生編號為:001,002,600.采用系統(tǒng)抽樣方法抽取一個容量為50的樣本,且隨機抽得的號碼為003.這600名學(xué)生分住在三個營區(qū),從001到300在第營區(qū),從301到495在第營區(qū),從496到600在第營區(qū),三個營區(qū)被抽中的人數(shù)依次為 ( )A.26,16,8 B.25,17,8 C.25,16,9 D.24,17,9 練4.一個社會調(diào)查機構(gòu)就某地居民的月收入調(diào)查了10000人,并根據(jù)所得數(shù)據(jù)畫了樣本的頻率分布直方圖(如下圖),為了分析居民的收入與年齡、學(xué)歷、職業(yè)等方面的關(guān)系,要從這10000人中再用分層抽樣方法抽出100人作進一步調(diào)查,則
8、在(2500,3000)(元)月收入段應(yīng)抽出的人數(shù)為()A25 B30 C35 D40二用樣本估計總體1編制頻率分布直方圖的步驟如下:求極差:極差是一組數(shù)據(jù)的最大值與最小值的差決定組距和組數(shù):當樣本容量不超過100時,常分成512組組距.將數(shù)據(jù)分組:通常對組內(nèi)數(shù)值所在區(qū)間取左閉右開區(qū)間,最后一組取閉區(qū)間,也可以將樣本數(shù)據(jù)多取一位小數(shù)分組;列頻率分布表:登記頻數(shù),計算頻率,列出頻率分布表將樣本數(shù)據(jù)分成若干小組,每個小組內(nèi)的樣本個數(shù)稱作頻數(shù),頻數(shù)與樣本容量的比值叫做這一小組的頻率頻率反映數(shù)據(jù)在每組所占比例的大小繪制頻率分布直方圖:把橫軸分成若干段,每一段對應(yīng)一個組距,然后以線段為底作一矩形,它的高
9、等于該組的,這樣得出一系列的矩形,每個矩形的面積恰好是該組上的頻率這些矩形就構(gòu)成了頻率分布直方圖在頻率分布直方圖中,縱軸表示“頻率/組距”,數(shù)據(jù)落在各小組內(nèi)的頻率用小矩形的面積表示,各小矩形的面積總和等于1.2頻率分布折線圖(1)把頻率分布直方圖各個長方形上邊的中點用線段連接起來,就得到頻率分布折線圖(2)總體密度曲線如果樣本容量不斷增大,分組的組距不斷縮小,則頻率分布直方圖實際上越來越接近于總體的分布,它可以用一條光滑曲線yf(x)來描繪,這條光滑的曲線就叫總體密度曲線3莖葉圖:統(tǒng)計中還有一種被用來表示數(shù)據(jù)的圖叫做莖葉圖莖是指中間的一列數(shù),葉是從莖的旁邊生長出來的數(shù)在樣本數(shù)據(jù)較少、較為集中,
10、且位數(shù)不多時,用莖葉圖表示數(shù)據(jù)的效果較好,它較好的保留了原始數(shù)據(jù)信息,方便記錄與表示,但當樣本數(shù)據(jù)較多時,莖葉圖就不太方便4平均數(shù)、中位數(shù)和眾數(shù)(1)平均數(shù):一組數(shù)據(jù)的總和除以數(shù)據(jù)的個數(shù)所得的商就是平均數(shù)(2)中位數(shù):如果將一組數(shù)據(jù)按從小到大的順序依次排列,當數(shù)據(jù)有奇數(shù)個時,處在最中間的一個數(shù)是這組數(shù)據(jù)的中位數(shù);當數(shù)據(jù)有偶數(shù)個時,處在最中間兩個數(shù)的平均數(shù),是這組數(shù)據(jù)的中位數(shù)(3)眾數(shù):出現(xiàn)次數(shù)最多的數(shù)(若有兩個或幾個數(shù)據(jù)出現(xiàn)得最多,且出現(xiàn)的次數(shù)一樣,這些數(shù)據(jù)都是這組數(shù)據(jù)的眾數(shù);若一組數(shù)據(jù)中,每個數(shù)據(jù)出現(xiàn)的次數(shù)一樣多,則認為這組數(shù)據(jù)沒有眾數(shù))(4)在頻率分布直方圖中,最高小長方形的中點所對應(yīng)的數(shù)
11、據(jù)值即為這組數(shù)據(jù)的眾數(shù)而在頻率分布直方圖上的中位數(shù)左右兩側(cè)的直方圖面積應(yīng)該相等,因而可以估計其近似值平均數(shù)的估計值等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐標之和5方差、標準差設(shè)樣本數(shù)據(jù)為x1,x2,xn樣本平均數(shù)為,則s2(x1)2(x2)2(xn)2(x12x22xn2)n2叫做這組數(shù)據(jù)的方差,用來衡量這組數(shù)據(jù)的波動大小,一組數(shù)據(jù)方差越大,說明這組數(shù)據(jù)波動越大 把樣本方差的算術(shù)平方根叫做這組數(shù)據(jù)的樣本標準差 數(shù)據(jù)的離散程度可以通過極差、方差或標準差來描述,其中極差反映了一組數(shù)據(jù)變化的最大幅度方差則反映一組數(shù)據(jù)圍繞平均數(shù)波動的大小練5(2011青島)一組數(shù)據(jù)20,30,40
12、,50,50,60,70,80的平均數(shù)、中位數(shù)、眾數(shù)的大小關(guān)系是A平均數(shù)中位數(shù)眾數(shù) B平均數(shù)中位數(shù)眾數(shù)C中位數(shù)眾數(shù)r0.05,表明有95%的把握認為x與y之間具有線性相關(guān)關(guān)系;如果|r|r0.05,則沒有理由拒絕原來的假設(shè)(二)獨立性檢驗1.若變量的不同“值”表示個體所屬的不同類別,則這些變量稱為分類變量2.兩個分類變量X與Y的頻數(shù)表,稱作22列聯(lián)表.y1y2合計x1n11n12n1x2n21n22n2合計n1n2n在22列聯(lián)表中,隨機變量2,其中n為樣本容量,2的取值范圍可以判斷“X與Y有關(guān)系”的可信度,如表,用它的大小可以決定是否拒絕原來的統(tǒng)計假設(shè)H0 如果算出的2值較大,就拒絕H0,也就
13、是拒絕“事件A與B無關(guān)”,從而就認為它們是有關(guān)的.3.兩個臨界值:3.841與6.635經(jīng)過對2統(tǒng)計量分布的研究,已經(jīng)得到了兩個臨界值:3.841與6.635 .當根據(jù)具體的數(shù)據(jù)算出的23.841 時,有95%的把握說事件A與B有關(guān);當26.635 時,有99%的把握說事件A與B有關(guān);當23.841 時,認為事件A與B是無關(guān)的.(其中頻數(shù)n11、n12、n21、n22都不小于5)P(2k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828練10.(201
14、1山東理,7)某產(chǎn)品的廣告費用x與銷售額y的統(tǒng)計數(shù)據(jù)如下表 廣告費用x(萬元)4235銷售額y(萬元)49263954根據(jù)上表可得回歸方程x中的為9.4,據(jù)此模型預(yù)報廣告費用為6萬元時銷售額大約為()A63.6萬元 B65.5萬元 C67.7萬元 D72.0萬元練11. (2011湖南理,4)通過隨機詢問110名性別不同的大學(xué)生是否愛好某項運動,得到如下的列聯(lián)表:男女總計愛好402060不愛好203050總計6050110由K2算得, K27.8.附表:P(K2k)0.0500.0100.001k3.8416.63510.828參照附表,得到的正確結(jié)論是()A在犯錯誤的概率不超過0.1%的前提
15、下,認為“愛好該項運動與性別有關(guān)”B在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別無關(guān)”C有99%以上的把握認為“愛好該項運動與性別有關(guān)”D有99%以上的把握認為“愛好該項運動與性別無關(guān)”練12.(2011廣東理,13)某數(shù)學(xué)老師身高176cm,他爺爺、父親和兒子的身高分別是173cm、170cm和182cm.因兒子的身高與父親的身高有關(guān),該老師用線性回歸分析的方法預(yù)測他孫子的身高為_cm.練13.(2011鄭州二次質(zhì)檢)某中學(xué)對高二甲、乙兩個同類班級進行“加強語文閱讀理解訓(xùn)練對提高數(shù)學(xué)應(yīng)用題得分率作用”的試驗,其中甲班為試驗班(加強語文閱讀理解訓(xùn)練),乙班為對比班(常規(guī)教學(xué),
16、無額外訓(xùn)練),在試驗前的測試中,甲、乙兩班學(xué)生在數(shù)學(xué)應(yīng)用題上的得分率基本一致,試驗結(jié)束后,統(tǒng)計幾次數(shù)學(xué)應(yīng)用題測試的平均成績(均取整數(shù))如下表所示:60分以下6170分7180分8190分91100分甲班(人數(shù))36111812乙班(人數(shù))48131510現(xiàn)規(guī)定平均成績在80分以上(不含80分)的為優(yōu)秀(1)試分析估計兩個班級的優(yōu)秀率;(2)由以上統(tǒng)計數(shù)據(jù)填寫下面22列聯(lián)表,并問是否有75%的把握認為“加強語文閱讀理解訓(xùn)練對提高數(shù)學(xué)應(yīng)用題得分率”有幫助.優(yōu)秀人數(shù)非優(yōu)秀人數(shù)合計甲班乙班合計參考公式及數(shù)據(jù):K2,P(K2k0)0.500.400.250.150.10k00.4550.7081.323
17、2.0722.706P(K2k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828練14.為了比較注射A,B兩種藥物后產(chǎn)生的皮膚皰疹的面積,選200只家兔做實驗,將這200只家兔隨機地分成兩組,每組100只,其中一組注射藥物A,另一組注射藥物B.下表1和表2分別是注射藥物A和藥物B后的試驗結(jié)果(皰疹面積單位:mm2)表1:注射藥物A后皮膚皰疹面積的頻數(shù)分布表皰疹面積60,65)65,70)70,75)75,80)頻數(shù)30402010表2:注射藥物B后皮膚皰疹面積的頻數(shù)分布表皰疹面積60,65)65,70)70,75)75,80)80,85
18、)頻數(shù)1025203015(1) 完成下面頻率分布直方圖,并比較注射兩種藥物后皰疹面積的中位數(shù)大??; (2)完成下面22列聯(lián)表,并回答能否有99.9%的把握認為“注射藥物A后的皰疹面積與注射藥物B后的皰疹面積有差異”.皰疹面積小于70mm2皰疹面積不小于70mm2合計注射藥物Aab注射藥物Bcd合計n附:2P(2k)0.1000.0500.0250.0100.001k2.7063.8415.0246.63510.828練15.(2011九江模擬)某農(nóng)科所對冬季晝夜溫差大小與某反季節(jié)大豆新品種發(fā)芽多少之間的關(guān)系進行分析研究,他們分別記錄了12月1日至12月5日的每天晝夜溫差與實驗室每天每100顆種子中的發(fā)芽數(shù),得到如下資料:日期12月1日12月2日12月3日12月4日12月5日溫差x()101113128發(fā)芽數(shù)y(顆)2325302616該農(nóng)科所確定的研究方案是:先從這五組數(shù)據(jù)中選取2組,用剩下的3組數(shù)據(jù)求線性回歸方程,再對被選取的2組數(shù)據(jù)進行檢驗(1)求選取的2組數(shù)據(jù)恰好是不相鄰2天數(shù)據(jù)的概率;(2)若選取的是12月1日與12月5日的兩組數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度產(chǎn)學(xué)研合作項目研發(fā)成果轉(zhuǎn)化與知識產(chǎn)權(quán)保護協(xié)議4篇
- 2024版軟件源碼授權(quán)保密協(xié)議范本
- 二手房私人交易協(xié)議模板2024版B版
- 2025年度新能源電池研發(fā)與采購安裝合同范本3篇
- 2025年度廠房修建與綠色建筑節(jié)能檢測服務(wù)合同4篇
- 2025年度智慧城市建設(shè)規(guī)劃與實施合同4篇
- 2025年度地理信息數(shù)據(jù)庫建設(shè)測繪合同4篇
- 2025年度企業(yè)培訓(xùn)中心場地租賃及課程開發(fā)服務(wù)合同3篇
- 二零二五年度傳統(tǒng)煙酒品牌傳承保護協(xié)議
- 二零二五年度研學(xué)旅行安全保障及責(zé)任劃分合同
- 銀行2025年紀檢工作計劃
- 2024-2024年上海市高考英語試題及答案
- 注射泵管理規(guī)范及工作原理
- 山東省濟南市2023-2024學(xué)年高二上學(xué)期期末考試化學(xué)試題 附答案
- 大唐電廠采購合同范例
- 國潮風(fēng)中國風(fēng)2025蛇年大吉蛇年模板
- GB/T 18724-2024印刷技術(shù)印刷品與印刷油墨耐各種試劑性的測定
- IEC 62368-1標準解讀-中文
- 15J403-1-樓梯欄桿欄板(一)
- 2024年中考語文名句名篇默寫分類匯編(解析版全國)
- 新煤礦防治水細則解讀
評論
0/150
提交評論