




已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第二章 統(tǒng)計1教你學(xué)習(xí)系統(tǒng)抽樣在三種隨機抽樣中,系統(tǒng)抽樣是較為重要的一種當(dāng)總體中的個體數(shù)較多時,可將總體分成均衡的幾個部分,然后按預(yù)先定出的規(guī)則,從每一部分抽取一個個體,得到需要的樣本,這種抽樣方法叫做系統(tǒng)抽樣,又稱等距抽樣在抽樣調(diào)查中,由于系統(tǒng)抽樣簡便易行,所以應(yīng)用普遍下面舉例說明系統(tǒng)抽樣的常見題型一、系統(tǒng)抽樣的選取問題例1某商場想通過檢查部分發(fā)票及銷售記錄來快速估計每月的銷售金額,采用如下方法:從某本發(fā)票的存根中隨機抽一張,如15號,然后按順序?qū)?5號,115號,165號發(fā)票上的銷售金額組成一個調(diào)查樣本這種抽取樣本的方法是()A抽簽法B隨機數(shù)表法C系統(tǒng)抽樣 D分層抽樣分析上述抽樣方法是將發(fā)票平均分成若干組,每組50張,從第一組抽出了15號,以后各組抽1550n(nN)號,符合系統(tǒng)抽樣的特點答案C點評將總體分成均衡的幾部分,按照預(yù)先定出的規(guī)則在各部分中抽取是系統(tǒng)抽樣的常用步驟二、間隔問題例2為了解1 200名學(xué)生對學(xué)校某項教改試驗的意見,打算從中抽取一個容量為30的樣本,考慮采用系統(tǒng)抽樣,則分段的間隔k為_分析要抽取n個個體入樣,需將N個編號均分成n組(1)若為整數(shù),則抽樣間隔為;(2)若不是整數(shù),則先剔除多余個體,再均分成n組,此時抽樣間隔為解析根據(jù)樣本容量為30,將1 200名學(xué)生分為30段,每段人數(shù)即間隔k為40.答案40點評將總體號碼平均分組時,應(yīng)先考慮總體容量N是否能被樣本容量n整除三、抽取的個數(shù)問題例3為了了解參加一次知識競賽的1 252名學(xué)生的成績,決定采用系統(tǒng)抽樣的方法抽取一個容量為50的樣本,那么總體中應(yīng)隨機剔除的個體數(shù)目是()A2 B4 C5 D6分析因為1 25250252,所以應(yīng)隨機剔除2個個體答案A點評(1)用系統(tǒng)抽樣法抽取多少個個體就需將總體均分成多少組;(2)需要剔除個體時,原則上要剔除的個體數(shù)盡量少四、綜合問題例4一個總體中的1 000個個體編號為0,1,2,999,并依次將其分為10個小組,組號為0,1,2,9.要用系統(tǒng)抽樣法抽取一個容量為10的樣本,規(guī)定如果在第0組隨機抽取的號碼為x,那么依次錯位地得到后面各組的號碼(即在第k組中抽取的號碼的后兩位數(shù)為x33k的后兩位數(shù))(1)當(dāng)x24時,寫出所抽取樣本的10個號碼;(2)若所抽取的10個號碼中某個數(shù)的后兩位數(shù)是87,求x的取值范圍分析按系統(tǒng)抽樣的規(guī)則計算求解解(1)所分組為099,100199,900999共10組,從每組中抽一個,第0組取24,則第1組取100(24331)157,依次錯位地從每組中取出,所取的號碼為24,157,290,323,456,589,622,755,888,921.(2)若抽取的樣本為兩位數(shù),當(dāng)k0,取得號碼為87時,x87;若抽取的樣本為三位數(shù),則87為x33k(k1,2,9)的后兩位數(shù)如當(dāng)k5時,x33587,可以求出x22,這樣令k取不同的值可以求得x的值分別為:21,22,23,54,55,56,88,89,90.綜上:x21,22,23,54,55,56,87,88,89,90點評本題是系統(tǒng)抽樣法的逆向綜合問題,體現(xiàn)了知識間的聯(lián)系和數(shù)學(xué)思想的運用2例析分層抽樣的解題方法若總體由差異明顯的幾部分組成,抽樣時,先將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽取一定數(shù)量的個體,再將各層取出的個體合在一起作為樣本這種抽樣方法就是分層抽樣一、應(yīng)用分層抽樣應(yīng)遵循以下要求:(1)將相似的個體歸入一類,即為一層,分層抽樣中分多少層、如何分層要視具體情況而定,總的原則是,層內(nèi)樣本的差異要小,面層之間的樣本差異要大,且互不重疊即遵循不重復(fù)、不遺漏的原則(2)分層抽樣為保證每個個體等可能入樣,需遵循在各層中進行簡單隨機抽樣,每層樣本數(shù)量與每層個體數(shù)量的比與這層個體數(shù)量與總體容量的比相等即所有層應(yīng)采用同一抽樣比等可能抽樣(3)在每層抽樣時,應(yīng)采用簡單隨機抽樣或系統(tǒng)抽樣的方法進行抽樣二、一般地,分層抽樣的操作步驟是:第一步,計算樣本容量與總體的個體數(shù)之比第二步,將總體分成互不交叉的層,按比例確定各層要抽取的個體數(shù)第三步,用簡單隨機抽樣或系統(tǒng)抽樣在各層中抽取相應(yīng)數(shù)量的個體第四步,將各層抽取的個體合在一起,就得到所取樣本樣本容量與總體的個體數(shù)之比是分層抽樣的比例常數(shù),按這個比例可以確定各層應(yīng)抽取的個體數(shù),如果各層應(yīng)抽取的個體數(shù)不都是整數(shù)應(yīng)當(dāng)調(diào)節(jié)樣本容量,剔除個體三、分層抽樣的優(yōu)點是:使樣本具有較強的代表性,并且抽樣過程中可綜合選用各種抽樣方法,因此分層抽樣是一種實用、操作性強、應(yīng)用比較廣泛的抽樣方法下面舉例解析分層抽樣的方法例1某單位200名職工的年齡分布情況如圖,現(xiàn)要從中抽取40名職工作樣本,用系統(tǒng)抽樣法,將全體職工隨機按1200編號,并按編號順序平均分為40組(15號,610號,196200號)若第5組抽出的號碼為22,則第8組抽出的號碼應(yīng)是_若用分層抽樣方法,則40歲以下年齡段應(yīng)抽取_人解析由分組可知,抽號的間隔為5,又因為第5組抽出的號碼為22,所以第6組抽出的號碼為27,第7組抽出的號碼為32,第8組抽出的號碼為37.40歲以下年齡段的職工數(shù)為2000.5100,則應(yīng)抽取的人數(shù)為10020.答案3720點評簡單隨機抽樣是基礎(chǔ),系統(tǒng)抽樣與分層抽樣是補充和發(fā)展,三者相輔相成,對立統(tǒng)一保證每個個體等可能入樣是簡單隨機抽樣、系統(tǒng)抽樣、分層抽樣共同的特征,為了保證這一點,分層時用同一抽樣比是必不可少的例2某單位共有老、中、青職工430人,其中青年職工160人,中年職工人數(shù)是老年職工人數(shù)的2倍為了解職工身體狀況,現(xiàn)采用分層抽樣方法進行調(diào)查,在抽取的樣本中有青年職工32人,則該樣本中的老年職工人數(shù)為()A9B18C27D36解析設(shè)老年職工人數(shù)為x,則2xx160430,所以x90,因此,該單位老年職工共有90人,老年職工人數(shù)為9018,所以用分層抽樣的比例應(yīng)抽取該樣本中的老年職工人數(shù)為18.答案B點評分層抽樣要正確計算各層在總體中所占的比例,每層采用簡單隨機抽樣法分層抽樣利用了調(diào)查者對調(diào)查對象事先掌握的各種信息,考慮了保持樣本結(jié)構(gòu)與總體結(jié)構(gòu)的一致性,從而使樣本更具代表性,在實際調(diào)查中被廣泛應(yīng)用3辨析三種抽樣方法的合理選取一、簡單隨機宜少量例1 據(jù)報道,2009年7月22日的“日全食”較為理想的觀測地點有上海、重慶、蘇州、杭州、合肥、武漢、宜昌、成都、樂山、嘉興這10個城市某天文小組從這10個城市中隨機抽取4個城市進行觀測,宜采用的抽樣方法是_,每個城市被選中的可能性是_解析由于總體中個體數(shù)目較少,所以宜采用簡單隨機抽樣的方法進行抽樣每個城市被選中的可能性均相等,均為0.4.答案簡單隨機抽樣0.4點評本題中個體總數(shù)較少,使用簡單隨機抽樣中的抽簽法即可可以直接把10個城市名分別寫在10個大小相同的紙條上,將紙條放在一個盒子里搖勻,隨機抽出4個即可在整個抽樣過程中可以保證每個個體被抽到的可能性相等,也可以進一步計算出相應(yīng)的值二、差別明顯選分層例2 網(wǎng)絡(luò)上有一種“QQ農(nóng)場”游戲,這種游戲通過虛擬軟件模擬種植與收獲的過程為了解某小區(qū)不同年齡層次的居民對此游戲的態(tài)度(小區(qū)中居民的年齡具有一定的差別),現(xiàn)從中抽取100人進行調(diào)查,結(jié)果如下表:對游戲的態(tài)度喜歡不喜歡不了解人數(shù)353530請問隨機抽取這100人較合理的抽樣方法是_,調(diào)查結(jié)果得出后,若想從這100人中再選取20人進行座談,較合理的抽樣方法是_若這個小區(qū)共有2 000人,則每個人被抽到參加座談的可能性為_解析因為小區(qū)居民的年齡存在明顯差異,故抽取這100人宜采用分層抽樣根據(jù)調(diào)查結(jié)果,有三種明顯不同的態(tài)度,因此,選取20人參加座談,也宜采用分層抽樣在整個抽樣過程中,每個人被抽到的可能性是相同的,均為0.01.答案分層抽樣分層抽樣0.01點評分層抽樣的過程是先把有差別的個體進行分層,在每一層中可以采用簡單隨機抽樣或系統(tǒng)抽樣的方法,這樣也能保證每個個體被抽到的可能性相同三、大量抽取選系統(tǒng)例3 春節(jié)來臨之際,某超市進行促銷活動,為購買商品顧客分發(fā)了編號為00009999的獎券,超市計劃從中抽取100張作為中獎號碼,較合理的抽樣方法是_,每張獎券中獎的可能性為_解析由于獎券數(shù)量較大,有10 000張獎券,所以宜采用系統(tǒng)抽樣方法進行抽取在抽樣過程中,每張獎券被抽到的可能性是相等的,均為0.01.答案系統(tǒng)抽樣0.01點評當(dāng)總體中個體數(shù)目較多時,首先把個體編號,進行平均分組(若不能整除,則隨機剔除多余的個體),然后采用簡單隨機抽樣的方法從第一組中抽取一個個體,即可知道應(yīng)抽取的其他編號的個體4解讀用樣本估計總體一、用樣本的頻率分布估計總體分布1頻率分布表:反映具體數(shù)據(jù)落在各個區(qū)間的頻率,但不夠直觀、形象,不利于分析數(shù)據(jù)分布的總體態(tài)勢2頻率分布直方圖:能夠非常直觀地表明數(shù)據(jù)分布的形狀,很好地反映數(shù)據(jù)的變化趨勢,適用于樣本數(shù)據(jù)較多的情況,但是從直方圖本身得不到具體的數(shù)據(jù)內(nèi)容3頻率分布折線圖:連接頻率分布直方圖中各小長方形上端的中點,就可以得到相應(yīng)的頻率分布折線圖其優(yōu)點是能夠清晰地反映數(shù)據(jù)的變化趨勢如果樣本容量不斷增加,分組的組距不斷減小,那么折線圖便會趨近于總體密度曲線總體密度曲線精確地反映了總體在各個范圍內(nèi)取值的百分比4莖葉圖:適用于樣本中的數(shù)據(jù)較少的情況其優(yōu)點是(1)沒有原始數(shù)據(jù)的丟失,所有信息均可以從莖葉圖中得到,并能展示數(shù)據(jù)的分布情況;(2)便于記錄和表示缺點是當(dāng)樣本數(shù)據(jù)較多或數(shù)據(jù)位數(shù)較多時,就會顯得不太方便因為每一個數(shù)據(jù)都要在圖中占據(jù)一定的空間,如果數(shù)據(jù)很多,枝葉就會很長二、用樣本的數(shù)字特征估計總體的數(shù)字特征1眾數(shù):若一組數(shù)據(jù)中有一個或幾個數(shù)據(jù)出現(xiàn)得最多,且出現(xiàn)的次數(shù)一樣,那么這些數(shù)據(jù)都是這組數(shù)據(jù)的眾數(shù),因此一組數(shù)據(jù)的眾數(shù)可能不止一個若一組數(shù)據(jù)中,每個數(shù)據(jù)出現(xiàn)的次數(shù)一樣多,則認為這組數(shù)據(jù)沒有眾數(shù)2中位數(shù):將一組數(shù)據(jù)按大小順序依次排列,處在最中間位置的一個數(shù)據(jù)(或中間兩個數(shù)據(jù)的平均數(shù))是該組數(shù)據(jù)的中位數(shù)3平均數(shù):與樣本中的每一個數(shù)據(jù)都有關(guān)系,反映了更多關(guān)于數(shù)據(jù)總體的信息,比較可靠但受極端值的影響較大4極差:就是一組數(shù)據(jù)中最大數(shù)與最小數(shù)的差5方差:用來刻畫樣本數(shù)據(jù)的波動情況,充分利用了所有的數(shù)據(jù),但與原始數(shù)據(jù)的單位不一致方差具有非負性6標準差:方差的算術(shù)平方根,與原數(shù)據(jù)的單位一致,且標準差也具有非負性三、數(shù)字特征在頻率分布直方圖中的體現(xiàn)在頻率分布直方圖中,最高的小矩形的底邊中點的橫坐標即為樣本數(shù)據(jù)的眾數(shù)的估計值,中位數(shù)左邊和右邊的小矩形的面積和相等(注:這樣求出的中位數(shù)是近似值);平均數(shù)的估計值等于頻率分布直方圖中每個小矩形的面積與其底邊中點的橫坐標的乘積之和四、特別提示1兩類估計都具有隨機性,得出的結(jié)論不一定是總體的真正的分布、均值或方差樣本質(zhì)量的高低也是影響正確估計的重要因素2應(yīng)用莖葉圖進行統(tǒng)計時,注意重復(fù)出現(xiàn)的數(shù)據(jù)要重復(fù)記錄,不能遺漏3樣本水平的高低由其平均數(shù)決定,樣本數(shù)據(jù)的穩(wěn)定性與方差和標準差有關(guān)在平均數(shù)相差不大的情況下,可以進一步借助方差或標準差來比較優(yōu)劣4方差越小,說明數(shù)據(jù)越穩(wěn)定,但并不是方差越小越好5“三數(shù)、三差”話應(yīng)用從樣本數(shù)據(jù)中可以提取基本的數(shù)字特征,即“三數(shù)”(眾數(shù)、中位數(shù)、平均數(shù))與“三差”(極差、方差、標準差),并對它們進行分析,從而估計總體相應(yīng)的數(shù)字特征,這在日常生活中有著廣泛的應(yīng)用一、借“三數(shù)”看集中趨勢例1某公司的各層人員及工資數(shù)構(gòu)成如下:人員:經(jīng)理1人,周工資3 700元;高層管理人員6人,周工資均為1 200元;高級技工5人,周工資均為700元;工人10人,周工資均為600元;學(xué)徒1人,周工資為300元(1)計算該公司員工周工資的眾數(shù)、中位數(shù)、平均數(shù);(2)這個問題中,平均數(shù)能客觀地反映這個公司的工資水平嗎?解(1)眾數(shù)為600,中位數(shù)為700,平均數(shù)為900.(2)雖然平均數(shù)為900,但由給出的數(shù)據(jù)可見,只有經(jīng)理和高層管理人員的周工資在平均數(shù)以上,其余的都在平均數(shù)以下,故用平均數(shù)不能客觀地反映該公司的工資水平評注眾數(shù)、中位數(shù)、平均數(shù)都是反映數(shù)據(jù)的集中趨勢的量其中,平均數(shù)受數(shù)據(jù)中的極端值的影響較大,這時平均數(shù)對總體估計的可靠性反而不如眾數(shù)和中位數(shù)二、用“三差”判分散程度例2為了教學(xué)的需要,王老師經(jīng)常在網(wǎng)站A和網(wǎng)站B上下載資料某天中午,王老師分別在兩個網(wǎng)站上下載了五份資料,其下載的速率(單位:KB/s)如下:網(wǎng)站A:4862847170369網(wǎng)站B:7032824485478(1)試分別計算從這兩個網(wǎng)站上下載資料的速率的極差、方差和標準差;(2)你覺得從哪個網(wǎng)站上下載資料更快?哪個下載速率更穩(wěn)定?請說明理由解(1)對于網(wǎng)站A來說,下載速率最高為486,最低為70,極差為48670416;平均下載速率為1(4862847170369)256;方差為s(486256)2(284256)2(71256)2(70256)2(369256)227 054.8;標準差為s1164.5.同理可求得從網(wǎng)站B上下載資料的速率的極差為408,平均下載速率為2241,方差為s23 464.8,標準差為s2153.2.(2)從(1)可以看出,從網(wǎng)站A上下載資料的平均速率要比網(wǎng)站B快從極差來看,網(wǎng)站A下載速率變化范圍更大;另外,從網(wǎng)站A上下載資料的速率的方差(或標準差)也大于網(wǎng)站B,這說明網(wǎng)站A的下載速率的波動性更大,更不穩(wěn)定因此網(wǎng)站B下載的速率更穩(wěn)定評注極差、方差、標準差都是刻畫數(shù)據(jù)分散程度的量極差反映一組數(shù)據(jù)的變化范圍,極差大,則數(shù)據(jù)較分散,但它只考慮了兩個極端值,所以很多時候,極差只能作為數(shù)據(jù)的分散程度的估計量,可靠性較差判斷數(shù)據(jù)的波動情況通常采用標準差(或方差),標準差(或方差)越小,波動越小,則越穩(wěn)定6“變量間的相關(guān)關(guān)系”考點分析考點1判斷兩個變量是否具有相關(guān)關(guān)系兩個變量之間的關(guān)系中,函數(shù)關(guān)系是一種確定性關(guān)系如正方形的面積S與邊長x之間的關(guān)系兩個變量之間的關(guān)系還有另外一種情況:相關(guān)關(guān)系自變量取值一定時,因變量的取值帶有一定的隨機性的兩個變量之間的關(guān)系;或兩個變量都是隨機的,也稱它們之間的關(guān)系為相關(guān)關(guān)系例1下列關(guān)系中帶有隨機性相關(guān)關(guān)系的是_正方形的邊長與面積之間的關(guān)系;水稻產(chǎn)量與施肥之間的關(guān)系;作文水平與課外閱讀量之間的關(guān)系;降雪量與交通事故的發(fā)生率之間的關(guān)系;人的年齡與他(她)擁有的財富之間的關(guān)系解析兩變量之間的關(guān)系有兩種:函數(shù)關(guān)系與帶有隨機性的相關(guān)關(guān)系正方形的邊長與面積之間的關(guān)系是函數(shù)關(guān)系水稻產(chǎn)量與施肥之間不是嚴格的函數(shù)關(guān)系,但是具有相關(guān)性因而是相關(guān)關(guān)系作文水平與課外閱讀量之間的關(guān)系不是嚴格的函數(shù)關(guān)系,但是具有相關(guān)性,因而是相關(guān)關(guān)系降雪量與交通事故的發(fā)生率之間具有相關(guān)關(guān)系一般來說,人隨著年齡的增長,社會經(jīng)驗、處事能力等都相應(yīng)地豐富,擁有的財富也就容易增多,故人的年齡與他(她)擁有的財富之間的關(guān)系是相關(guān)關(guān)系答案考點2利用散點圖判斷兩個變量間的相關(guān)性判斷兩個變量之間有沒有相關(guān)關(guān)系,一種常用的簡便可行的方法是繪制散點圖散點圖是由數(shù)據(jù)點分布構(gòu)成的,它形象地體現(xiàn)了各對數(shù)據(jù)的密切程度,是分析研究兩個變量相關(guān)關(guān)系的重要手段各數(shù)據(jù)對應(yīng)點若呈上升趨勢,則稱為正相關(guān)反之,若呈下降趨勢,稱為負相關(guān)例2某品牌服裝的廣告費支出x與銷售額y(單位:萬元)之間有如下的對應(yīng)數(shù)據(jù):廣告費x246810銷售額y641382
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 金融科技產(chǎn)品創(chuàng)新與推廣服務(wù)協(xié)議
- 酒店與健身房合作健身服務(wù)協(xié)議
- 網(wǎng)絡(luò)系統(tǒng)安全維護合同
- 電商平臺跨境進口業(yè)務(wù)合同
- 自考行政管理本科自我學(xué)習(xí)計劃試題及答案探討
- 領(lǐng)導(dǎo)者的決策能力與團隊績效關(guān)系試題及答案
- 行政管理心理學(xué)解決方案試題及答案
- 2025年自考行政管理案例研究與試題答案
- 行政管理的多層次治理研究試題及答案
- 2025機械設(shè)備采購合同模板示例
- 浙江省寧波市三鋒教研聯(lián)盟2024-2025學(xué)年高一下學(xué)期4月期中化學(xué)試卷(含答案)
- GINA+2024哮喘防治指南修訂解讀
- 校醫(yī)招聘筆試試題及答案
- 奧特曼過關(guān)測試題及答案
- 學(xué)生營養(yǎng)與健康知識課件
- 注射抗凝藥物的觀察與護理
- 2025年廣州體育職業(yè)技術(shù)學(xué)院單招職業(yè)傾向性考試題庫及答案1套
- 蘇教版五年級數(shù)學(xué)下冊典型例題第五單元分數(shù)的加法和減法·單元復(fù)習(xí)篇(原卷版+解析)
- DBJ-T13-483-2025 預(yù)拌流態(tài)固化土技術(shù)標準
- 技術(shù)文件核查審核和審批制度
- 甘肅省歷年中考作文題(2003-2024)
評論
0/150
提交評論