




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第二章統(tǒng)計§2.1隨機抽樣【入門向導】2008年8月8日舉世矚目的北京奧運會開幕了!新華網(wǎng)北京8月10日電,國際奧委會新聞發(fā)言人吉賽爾·戴維斯今天說,8億4千萬中國電視觀眾收看了北京奧運會開幕式,這個收視率令人驚訝據(jù)CMS媒介研究所9日發(fā)布的數(shù)據(jù),北京奧運會開幕式收視觀眾規(guī)模占到全國電視總人口的68.8%,本屆奧運會開幕式收視率創(chuàng)下了自國內(nèi)有收視率調(diào)查以來的新紀錄,在李寧環(huán)繞鳥巢飛奔點火的這一刻,收視份額攀上90%.另據(jù)AGB尼爾森的統(tǒng)計顯示,超過9成中國家庭收看了奧運會開幕式電視直播,其中天津觀眾收看比例為97%,達到全國最高同學們有沒有考慮過收視率是如何統(tǒng)計出來的呢?可
2、行的方法之一是抽取一部分地區(qū)進行收視率調(diào)查如何抽取呢?機抽樣概念解讀1普查在實際應用中是不合適的一般地,如果檢驗對于個體具有破壞性,則需要通過抽樣來推斷總體的特性有很多檢驗具有破壞性,如對產(chǎn)品的壽命、合格率等問題的檢查因此,我們需要通過隨機抽樣抽取樣本來估計總體2抽樣時不能使用方便樣本方便樣本的代表性差,基于這種樣本得出的結論與事實不符的可能性大大增加3隨機抽樣時,每個個體被抽到的機會都相等在判斷一鍋湯的味道時,如果湯被充分攪拌了,我們只需品嘗一勺就可以了同樣,樣本數(shù)據(jù)也要來自“攪拌均勻”的總體在簡單隨機抽樣的定義中,“總體內(nèi)的各個個體被抽到的機會都相等”是“總體中的所有個體攪拌均勻”的統(tǒng)計描
3、述例1(1)為了了解某地參加計算機水平測試的5 000名學生的成績,從中抽取了200名學生的成績進行統(tǒng)計分析在這個問題中,5 000名學生成績的全體是()A總體 B個體C從總體中抽取的一個樣本 D樣本的容量解析5 000名學生的成績是我們所考查對象的全體,叫總體答案A(2)關于簡單隨機抽樣的特點,有以下幾種說法,其中不正確的是()A要求總體的個數(shù)有限B從總體中逐個抽取C它是一種不放回抽樣D每個個體被抽到的機會不一樣,與先后順序有關解析隨機抽樣最重要的特點就是每個個體被抽到的機會都相等,與先后順序無關答案D悟抽樣方法我們知道,三種抽樣方法的共同點是在抽樣過程中每個個體被抽到的機會相等且都為不放回
4、抽樣但是,在什么情況下使用簡單隨機抽樣、系統(tǒng)抽樣和分層抽樣呢?三種方法中哪一種更好?下面就讓我們通過對系統(tǒng)抽樣與分層抽樣的詳細分析,感悟一下它們?nèi)咧g的聯(lián)系與區(qū)別1系統(tǒng)抽樣系統(tǒng)抽樣適合總體中個體數(shù)較多,且個體之間無明顯差異的情況,其特點是等距抽取當(N為總體中個體數(shù)目,n為樣本容量)不是整數(shù)時,需先從總體中隨機剔除多余的個體在剔除多余的個體以及完成分段后,確定第一個個體編號時,使用的是簡單隨機抽樣例2某單位共有職工823人,為了調(diào)查工人上班時,從家到單位的平均所用時間,決定抽取10%的工人調(diào)查這一情況,問如何完成這一抽樣?分析由于總體的人數(shù)較多,且不考慮個體差異,因此需采用系統(tǒng)抽樣法解(1)
5、先將工人隨機編號為000,001,822;(2)用隨機數(shù)法,從編號000822中剔除3人,再把編號按順序補齊為000,001,819,從而確定分段間隔為10,分成82段,每段10人;(3)在第一段000,001,009中隨機確定一起始號k0(可以用抽簽法),則編號k0,k010,k0810為所取得的一個樣本點評使用系統(tǒng)抽樣進行編號時,也可利用學生證號,座位號等感悟(1)體會區(qū)別:簡單隨機抽樣和系統(tǒng)抽樣的共同特點是總體中的個體差異較小,此題從這一個角度看,兩種方法都適合但是,由于抽取的樣本容量較大,為了減少工作量,采用系統(tǒng)抽樣法較為簡捷(2)分析聯(lián)系:簡單隨機抽樣法是系統(tǒng)抽樣的基礎此題在剔除個體
6、時,由于總體個數(shù)較多,因此使用隨機數(shù)法剔除多余的個體;分段后的第一段個體數(shù)較少,因此可使用抽簽法2分層抽樣當總體中的個體差異較大時,一般采用分層抽樣法抽樣過程中,每層中所抽取的個體數(shù)可按各層在總體中所占比例抽??;在各層獨立抽取時,可使用簡單隨機抽樣或系統(tǒng)抽樣法例3某單位共有職工162人,其中老年人27人,中年人54人,青年人81人,為了調(diào)查他們的身體狀況,需要從他們中抽取一個容量為36的樣本,問應當采用怎樣的抽樣方法?應從老年人、中年人、青年人中分別抽取多少人?分析從實際問題思考,老年人、中年人、青年人的身體狀況有著較大的差異,因此應采用分層抽樣法解由于各部分之間的個體有較大的差別,所以應采用
7、分層抽樣因為275481123,設從老年人、中年人、青年人中各抽取個體數(shù)分別為x,2x,3x.則由6x36得x6,故應從老年人、中年人、青年人中分別抽取6人,12人,18人點評也可以按各部分所占總體的比進行計算,即×366,×3612,×3618.感悟(1)體會區(qū)別:分層抽樣適合總體中個體差異較大的情況,而系統(tǒng)抽樣適合總體中的個體數(shù)較多的情況;另一方面分層抽樣是按比例抽取,而系統(tǒng)抽樣是等距抽取(2)分析聯(lián)系:在分層抽樣中,當每一層中個體數(shù)目較大時,可使用系統(tǒng)抽樣,若數(shù)目較小時,使用簡單隨機抽樣法抽取即可種抽樣方法的比較類別共同點各自特點相互聯(lián)系適用范圍簡單隨機抽樣
8、抽樣過程中每個個體被抽取的機會相等從總體中逐個抽取總體中的個體數(shù)較少系統(tǒng)抽樣將總體均分成幾部分,按事先確定的規(guī)則在各部分抽取在起始部分抽樣時采用簡單隨機抽樣總體中的個體數(shù)較多分層抽樣將總體分成幾層,分層進行抽取在各層抽樣時采用簡單隨機抽樣或系統(tǒng)抽樣總體由差異明顯的幾部分組成簡單隨機抽樣、系統(tǒng)抽樣和分層抽樣關系密切,對抽取樣本來說,可謂異曲同工無論采取哪一種抽樣方法,必須保證在整個抽樣過程中每個個體被抽到的機會相等例4根據(jù)下列情況選擇合適的抽樣方法:(1)30臺電視機,其中甲廠生產(chǎn)的有21臺,乙廠生產(chǎn)的有9臺,抽取10臺入樣;(2)從甲廠生產(chǎn)的300臺電視機中,抽取10臺入樣;(3)從甲廠生產(chǎn)的
9、300臺電視機中,抽取100臺入樣分析應用三種抽樣方法時需搞清楚它們的使用原則:(1)當總體容量較小,樣本容量也較小時,制簽簡單,號簽容易攪勻,可采用抽簽法;(2)當總體容量較大,樣本容量較小時,可用隨機數(shù)法;(3)當總體容量較大,樣本容量也較大時,可用系統(tǒng)抽樣法解(1)總體由兩類差異明顯的個體組成,所以應采用分層抽樣,又因為每層中樣本容量較小,在每層中可采用抽簽法(2)總體容量較大,樣本容量較小,可用隨機數(shù)法(3)總體容量較大,樣本容量也較大,可用系統(tǒng)抽樣法析隨機抽樣中的典型陷阱1圍繞抽樣方法的概念設置的陷阱例5盒子中共有80個零件,從中任意拿出一個進行質量檢驗,然后把它放回盒子,再次從中拿
10、出一個進行質量檢驗,然后再把它放回盒子,照此方法,依次抽取5個進行質量檢驗這種抽樣方法是否屬于簡單隨機抽樣?說明理由錯解是簡單隨機抽樣,實質上就是從有限的80個零件中任意選出了5個進行質量檢驗正解不是簡單隨機抽樣,因為簡單隨機抽樣是不放回抽樣2圍繞“分層抽樣”與“系統(tǒng)抽樣”的選擇設置的陷阱例6某鄉(xiāng)鎮(zhèn)有12個行政村,共30 000人,現(xiàn)從中抽出300人進行樣本分析,考察其人口中癌癥的發(fā)病率,應該采取哪種抽樣方法?簡述抽樣過程錯解由于總體的個體相對較多,因此可采用系統(tǒng)抽樣法過程如下:用隨機方式將總體中的個體編號1,2,30 000;把總體分成300段,每段100人;在第一段中用簡單隨機抽樣確定起始
11、個體編號i;將i,i100,i200,i29 900分別抽出,從而獲得整個樣本正解上述解法只注意到了數(shù)量關系,忽略了個體差異一般情況下,每個村村民的健康狀況是有差異的,各村的人口數(shù)量又有差別,所以應采用分層抽樣具體實施過程是:將30 000人按12個村分成12層,然后從每村的人口中抽取該村人口的,然后把各村抽到的人合起來,就得到了一個容量為300的樣本3圍繞系統(tǒng)抽樣“均分”原理設置的陷阱例7要從某學校的10 013個學生中抽取100個進行健康檢驗,采用哪種抽樣方法較好?寫出抽樣過程錯解由于總體個數(shù)為10 013,數(shù)量較大,而且都是學生,差別不大,因而應采用系統(tǒng)抽樣法具體過程如下:由系統(tǒng)抽樣的步
12、驟先分為100段,其中前87段每段100人,后13段每段101人,再在第一段中用簡單隨機抽樣確定起始個體編號i;最后將i100,i200,i9 900分別抽出,從而獲得整個樣本正解先用簡單隨機抽樣從總體中剔除學生13人,再按如下步驟操作:采用隨機的方式將總體中的個體編號1,2,10 000;把整個的總體分成100段,每段100人;在第一段中用簡單隨機抽樣確定起始個體編號i;將i,i100,i200,i9 900分別抽出,從而獲得整個樣本.用隨機抽樣調(diào)查小區(qū)居民的用水量為調(diào)查小區(qū)平均每戶居民的月用水量,下面是3名學生設計的調(diào)查方案:學生A:我把這個用水量調(diào)查表放在互聯(lián)網(wǎng)上,只要登錄該網(wǎng)址的人就可
13、以看到這張表,他們填表的信息可以很快地反饋到我的電腦中這樣,我就可以很快估計出小區(qū)平均每戶居民的月用水量學生B:我給我們居民小區(qū)的每一個住戶發(fā)一個用水量調(diào)查表,只要一兩天就可以統(tǒng)計出小區(qū)平均每戶居民的月用水量學生C:我在小區(qū)的電話號碼本上隨機地選出一定數(shù)量的電話號碼,然后逐個給他們打電話,問一下他們的月用水量,然后就可以估計出小區(qū)平均每戶居民的月用水量我們對上述3種方案進行分析,看哪個方案更實用有效:學生A的方法得到的樣本不能夠反映不上網(wǎng)的居民情況,是一種方便樣本,所得的結果代表性差,不能很準確地獲得平均每戶居民的月用水量;學生B的方法實際上是普查,花費的人力物力要多一些,但是如果統(tǒng)計過程不出
14、錯,可以準確地得到平均每戶居民的月用水量;在小區(qū)的每戶居民都裝有電話的情況下,學生C的方法是一種隨機抽樣方法,所得的樣本具有代表性,可以比較準確地獲得平均每戶居民的月用水量在小區(qū)的每戶居民都裝有電話的情況下,建議用隨機抽樣的方法獲取數(shù)據(jù),即用學生C的方法,以節(jié)省人力物力,并且可以得到比較精確的結果.1(重慶高考)某地區(qū)有300家商店,其中大型商店有30家,中型商店有75家,小型商店有195家,為了掌握各商店的營業(yè)情況,要從中抽取一個容量為20的樣本若采用分層抽樣的方法,抽取的中型商店數(shù)是()A2B3C5D13解析設抽取的中型商店數(shù)為x,依據(jù)分層抽樣的原理,有,解得x5.答案C2(福建高考)一個
15、總體中共有100個個體,隨機編號0,1,2,99,依編號順序平均分成10個小組,組號依次為1,2,3,10.現(xiàn)用系統(tǒng)抽樣的方法抽取一個容量為10的樣本,規(guī)定如果在第1組隨機抽取的號碼為m,那么在第k組中抽取的號碼個位數(shù)字與mk的個位數(shù)字相同若m6,則在第7組中抽取的號碼是_解析根據(jù)題意,第七組中的號碼是60,69內(nèi)的正整數(shù)因為m6,k7,mk13,所抽取的號碼個位數(shù)為3,于是此號碼為63.答案633(重慶高考)某校高三年級有男生500人,女生400人,為了解該年級學生的健康情況,從男生中任意抽取25人,從女生中任意抽取20人進行調(diào)查,這種抽樣方法是_解析由分層抽樣的定義可知,該抽樣為按比例的抽
16、樣答案分層抽樣法4(湖北高考)一個公司共有1 000名員工,下設一些部門,要采用分層抽樣方式從全體員工中抽取一個容量為50的樣本,已知某部門有200名員工,那么從該部門抽取的員工人數(shù)是_. 解析從該部門抽取的員工人數(shù)是×20010.答案105(天津高考)某學院的A,B,C三個專業(yè)共有1 200名學生,為了調(diào)查這些學生勤工儉學的情況,擬采用分層抽樣的方法抽取一個容量為120的樣本,已知該學院的A專業(yè)有380名學生,B專業(yè)有420名學生,則在該學院的C專業(yè)應抽取_名學生解析C專業(yè)有學生1 200380420400(名),則C專業(yè)應抽取的學生數(shù)為×12040(名)答案40
17、7;2.2用樣本估計總體【入門向導】小明是班里的優(yōu)秀學生,他的歷次數(shù)學成績是96,98,95,93,但最近一次考試成績只有45分,原因是他帶病參加了考試期末評價時,計算他的平均分是83.5,只能給他一個“良好”你認為這種評價合理嗎?讀頻率分布直方圖頻率分布直方圖是用小長方形面積的大小來表示在各個區(qū)間內(nèi)取值的頻率,直角坐標系中的縱軸表示頻率與組距的比值,即小長方形面積組距×頻率頻率分布直方圖能夠很容易地表示大量數(shù)據(jù),非常直觀地表明分布的形狀,使我們能夠看到分布表中看不清楚的數(shù)據(jù)模式但從直方圖本身得不出原始的數(shù)據(jù)內(nèi)容,也就是說,把數(shù)據(jù)表示成直方圖后,原有的具體數(shù)據(jù)信息就被抹掉了例1某校高
18、三數(shù)學考試中,對90分以上的成績進行統(tǒng)計,其頻率分布直方圖如圖所示若130140分數(shù)段的人數(shù)為90,則90100分數(shù)段的人數(shù)為_解析由于90分以上的考試成績是總體,則圖中5個分數(shù)段的頻率之和等于1,設130140分數(shù)段的頻率為p,則(0.0450.0250.0150.010)×10p1,解得p0.05,所以可得總體容量為1 800,則90100分數(shù)段的人數(shù)為1 800×0.045×10810.答案810起來學莖葉圖莖葉圖是一種既能展示數(shù)據(jù)的分布狀況,又能保留每一個原始數(shù)據(jù)的一種數(shù)據(jù)表示方法,莖葉圖由“莖”和“葉”兩部分組成,通常以每一個數(shù)據(jù)的高位數(shù)作為莖,莖一經(jīng)確
19、定,葉就自然地“長”在相應的莖上為了方便分析數(shù)據(jù),我們將莖上的數(shù)字按從小到大的次序排成一列,葉上的數(shù)據(jù)按從大到小(從小到大)的次序寫在其莖左(右)側用莖葉圖表示數(shù)據(jù)沒有原始信息的損失,所有數(shù)據(jù)信息都可以從莖葉圖中得到,而且便于記錄與表示我們不僅要會畫莖葉圖,還要對數(shù)據(jù)進行簡單分析例2某籃球運動員在2009賽季各場比賽的得分情況如下:12,15,24,25,31,31,36,36,37,39,44,49,50試分析該運動員的整體水平及發(fā)揮的穩(wěn)定程度解畫出該運動員的得分莖葉圖如圖所示:從圖中可以看出,該運動員平均得分及中位數(shù)、眾數(shù)都在20到40之間,且分布較對稱,集中程度高,說明其發(fā)揮比較穩(wěn)定本數(shù)
20、據(jù)特征的解釋統(tǒng)計的思想是用數(shù)據(jù)說話,通過收集、整理、分析數(shù)據(jù)作出決策要從樣本數(shù)據(jù)中提取基本的數(shù)字特征(如平均數(shù)、標準差),并作出合理的解釋例3某校高一(1)、(2)班各有49名學生,兩班在一次數(shù)學測試中的成績統(tǒng)計如下表:班級平均分眾數(shù)中位數(shù)標準差高一(1)班79708719.8高一(2)班7970795.2(1)請你對下面的一段話給予簡要分析:高一(1)班的小剛回家對媽媽說:“昨天的數(shù)學測試中,全班的平均分為79分,得70分的人最多,我得了85分,在班里算是上游了”(2)請你根據(jù)表中的數(shù)據(jù)對兩班的測驗情況試做分析,并提出教學建議解(1)由中位數(shù)可知,85分排在25位以后,從位次上講不能說85分
21、是上游,但也不能從位次上來判斷學習的好壞,小剛得了85分,說明他對這階段的學習內(nèi)容掌握較好,從掌握的學習內(nèi)容上講也算是上游(2)高一(1)班成績的中位數(shù)是87,說明高于87分的人數(shù)占一半以上,而平均分為79分,標準差又很大,說明低分者也多,兩極分化嚴重,建議對學習困難的學生給予幫助高一(2)班成績的中位數(shù)和平均數(shù)都是79,標準差又較小,說明學生之間的差別也較小,學習很困難的學生少,但學習優(yōu)秀的學生也很少,建議采取措施提高優(yōu)秀學生人數(shù)錯點剖析1對頻率分布直方圖理解錯誤例4中小學生的視力狀況受到全社會的廣泛關注,某市有關部門從全市6萬名高一新生中隨機抽取了400名學生,對他們的視力狀況進行一次調(diào)查
22、統(tǒng)計,將所得到的有關數(shù)據(jù)繪制成如圖所示的頻率分布直方圖,從左至右五個小組的頻率之比依次是5712106.則全市高一新生視力在3.95,4.25范圍內(nèi)的學生約有多少人?錯解因為第五小組的頻率是0.5,所以第一小組的頻率為0.5×.所以全市6萬名高一新生中視力在3.95,4.25范圍內(nèi)的學生約有60 000×25 000人正解因為第五小組的頻率是0.5×0.30.15,所以第一小組的頻率為015×0.125.所以全市6萬名高一新生中視力在3.95,4.25范圍內(nèi)的學生約有60 000×0.1257 500人2相關聯(lián)的兩個樣本的數(shù)據(jù)特征搞錯例5一組數(shù)
23、據(jù)的方差是s2,將這組數(shù)據(jù)中的每一個數(shù)都乘以2,得到一組新數(shù)據(jù),其方差是()A.s2 B2s2 C4s2 Ds2錯解B解析設一組數(shù)據(jù)x1,x2,xn,則s2,將每一個數(shù)乘以2,則2.所以s2(x1)2(x2)2(xn)24s2.正解C何對數(shù)據(jù)進行分析通過對數(shù)據(jù)的分析,為合理的決策提供一些依據(jù),是統(tǒng)計思想的重要體現(xiàn);能根據(jù)實際問題的需求,合理的選取樣本,從中提取基本數(shù)字特征(如平均數(shù)、標準差等),并作出合理的分析,是解題的關鍵處理此類數(shù)據(jù)分析題一般來說有三種途徑1用莖葉圖提取有用數(shù)據(jù)進行分析例1某中學高一(2)班甲、乙兩名同學自上高中以來每場數(shù)學考試成績情況如下:甲的得分:95,81,75,91
24、,86,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.畫出兩人數(shù)學成績的莖葉圖,并根據(jù)莖葉圖對兩人的成績進行比較分析用中間的數(shù)字表示兩位同學得分的十位數(shù)和百位數(shù),兩邊的數(shù)字分別表示兩人每場數(shù)學考試成績的個位數(shù)作莖葉圖先確定中間數(shù)取數(shù)據(jù)的哪幾位,填寫數(shù)據(jù)時邊讀邊填比較時從數(shù)據(jù)分布的對稱性、中位數(shù)、穩(wěn)定性等幾方面來比較解甲、乙兩人數(shù)學成績的莖葉圖如圖所示:從這個莖葉圖上可以看出,乙同學的得分情況是大致對稱的,中位數(shù)是98;甲同學的得分情況除一個特殊得分外,也大致對稱,中位數(shù)是88.因此,乙同學發(fā)揮比較穩(wěn)定,總體
25、得分情況比甲同學好2通過計算提取有用數(shù)據(jù)進行分析數(shù)據(jù)收集后,要從中找到所需的信息,并將其轉化為可利用的形式,從而獲取信息如計算平均數(shù)、方差、標準差等是處理分析題的另一條途徑例2某工廠人員及工資構成如下表:人員經(jīng)理管理人員高級技工工人學徒合計周工資2 200250220200100人數(shù)16510123合計2 2001 5001 1002 0001006 900(1)指出這個問題中工資的眾數(shù)、中位數(shù)、平均數(shù);(2) 這個問題中,平均數(shù)能客觀地反映該工廠的工資水平嗎?為什么?哪個量更能反映這個公司員工的工資水平?解(1)由表格可知:眾數(shù)為200.中位數(shù)為220.平均數(shù)為300.(2)在這個問題中,中
26、位數(shù)或眾數(shù)均能反映該公司員工的工資水平因為公司中少數(shù)人的工資額與大多數(shù)人的工資額差別較大,這樣導致平均數(shù)與中位數(shù)偏差較大,所以平均數(shù)不能反映這個公司員工的工資水平點評平均數(shù)受數(shù)據(jù)中的極端值的影響較大,妨礙了對總體估計的可靠性,這時平均數(shù)反而不如眾數(shù)、中位數(shù)更客觀3通過條形圖提取數(shù)據(jù)進行分析例3某校為了了解學生的課外閱讀情況,隨機調(diào)查了50名學生,得到他們在某一天各自課外閱讀所用時間的數(shù)據(jù),結果用如圖的條形圖表示根據(jù)條形圖可得這50名學生這一天平均每人的課外閱讀時間為()A0.6小時 B0.9小時C1.0小時 D1.5小時分析本小題主要考查同學們借助圖形解決實際問題的能力解析由題意可知50人每人
27、一天的課外閱讀時間為×(5×020×0.510×1.010×1.55×2.0)0.9(小時)答案B點評注意靈活處理數(shù)學中的“圖形語言”,將之轉化為數(shù)學知識求解個運動員最穩(wěn)定例4甲、乙兩籃球運動員在本賽季前八場比賽中,每場的投籃得分如下:甲15,18,20,12,22,25,28,20乙26,15,21,14,17,23,19,25若你是一個籃球隊的主教練,請你對甲、乙兩名運動員作一下比較,看哪一位運動員的水平更高,發(fā)揮更穩(wěn)定解方法一利用方差來比較兩運動員投籃得分的穩(wěn)定性甲20,乙20,s23.25,s17.75,由于s>s,所以
28、乙運動員每場的投籃得分的發(fā)揮更具穩(wěn)定性方法二用莖葉圖來比較兩運動員投籃得分的穩(wěn)定性將所有兩位數(shù)的十位數(shù)字作為“莖”,個位數(shù)字作為“葉”,畫出兩個投籃得分的莖葉圖,如下圖:從莖葉圖中我們可以看出:甲運動員投籃得分主要分布在莖葉圖的下方,投籃得分集中分布在20多分的范圍內(nèi),而乙運動員投籃得分基本上是對稱的由此我們發(fā)現(xiàn)乙運動員投籃得分發(fā)揮的比較穩(wěn)定,總體得分情況要比甲運動員好點評本題方法一我們是利用了方差來比較兩運動員投籃得分的穩(wěn)定性而方差是刻畫一組數(shù)據(jù)離散與集中、波動與穩(wěn)定的一個統(tǒng)計量實際上方差描述了一組數(shù)據(jù)圍繞平均數(shù)的波動程度,對于不同的數(shù)據(jù)集合,當離散程度或波動程度大時,其方差的數(shù)值也就大平均
29、數(shù)是刻畫一組數(shù)據(jù)集中趨勢的統(tǒng)計量,它反映了這組數(shù)據(jù)的總體水平的高低在本題中甲、乙兩運動員投籃得分的平均數(shù)均為20分,總體水平相同,而當我們從另一角度方差上來分析甲、乙兩運動員投籃得分的穩(wěn)定性時,就能得出乙運動員投籃得分的穩(wěn)定性要比甲運動員的高,因而乙運動員每場的投籃發(fā)揮更穩(wěn)定,水平更高方法二用莖葉圖表示數(shù)據(jù)有兩個突出的特點:一是統(tǒng)計圖上沒有原始信息丟失,所有數(shù)據(jù)信息都可以從莖葉圖中得到;二是莖葉圖可以在比賽時隨時記錄,方便記錄與表示因此莖葉圖更能直觀、清晰的反映數(shù)據(jù)的原始信息,在本題中我們能從莖葉圖上一目了然地看出運動員投籃得分的實際情況,直觀地得出乙運動員投籃得分發(fā)揮的比較穩(wěn)定,水平更高感悟
30、從以上的方法我們可以知道:由樣本數(shù)據(jù)得到的平均數(shù)、方差、標準差雖然并不是總體的真正的平均數(shù)、方差、標準差,而只是對總體的一個估計,但是這種估計是合理的,當樣本的容量很大時,它們確實反映了總體的信息.1(山東高考)右圖是根據(jù)山東統(tǒng)計年鑒2007中的資料作成的1997年至2006年我省城鎮(zhèn)居民百戶家庭人口數(shù)的莖葉圖圖中左邊的數(shù)字從左到右分別表示城鎮(zhèn)居民百戶家庭人口數(shù)的百位數(shù)字和十位數(shù)字,右邊的數(shù)字表示城鎮(zhèn)居民百戶家庭人口數(shù)的個位數(shù)字從圖中可以得到1997年至2006年我省城鎮(zhèn)居民百戶家庭人口數(shù)的平均數(shù)為()A304.6 B303.6 C302.6 D301.6解析303.6.答案B2(江蘇高考)某
31、老師從星期一到星期五收到的信件數(shù)分別為10,6,8,5,6,則該組數(shù)據(jù)的方差s2_.解析7,s2(107)2(67)2(87)2(57)2(67)23.2.答案3.23(廣東高考)為了調(diào)查某廠工人生產(chǎn)某種產(chǎn)品的能力,隨機抽查了20位工人某天生產(chǎn)該產(chǎn)品的數(shù)量,產(chǎn)品數(shù)量的分組區(qū)間為45,55),55,65),65,75),75,85),85,95)由此得到頻率分布直方圖如圖所示,則這20名工人中一天生產(chǎn)該產(chǎn)品數(shù)量在55,75)的人數(shù)是_解析由頻率分布直方圖知55,75)之間的頻率為(0.0400.025)×100.65,故55,75)之間的人數(shù)為0.65×2013.答案134(
32、江蘇高考改編)某人5次上班途中所花的時間(單位:分鐘)分別為x,y,10,11,9.已知這組數(shù)據(jù)的平均數(shù)為10,方差為2,則|xy|的值為_解析由平均數(shù)為10,得(xy10119)×10,則xy20;又由于方差為2,則(x10)2(y10)2(1010)2(1110)2(910)2×2,得x2y2208,2xy192,所以有|xy|4.答案45(福建高考)某校開展“愛我海西、愛我家鄉(xiāng)”攝影比賽,9位評委為參賽作品A給出的分數(shù)如莖葉圖所示記分員在去掉一個最高分和一個最低分后,算得平均分為91,復核員在復核時,發(fā)現(xiàn)有一個數(shù)字(莖葉圖中的x)無法看清,若記分員計算無誤,則數(shù)字x應
33、該是_解析當x4時,91,x<4,91,解得x1.故x應該是1.答案1§2.3變量間的相關關系【入門向導】西方流傳的一首民謠丟失一個釘子,壞了一只蹄鐵;壞了一只蹄鐵,折了一匹戰(zhàn)馬;折了一匹戰(zhàn)馬,傷了一位騎士;傷了一位騎士,輸了一場戰(zhàn)斗;輸了一場戰(zhàn)斗,亡了一個帝國馬蹄鐵上一個釘子是否丟失與一個帝國存與亡關系有多大呢?顯然,這種關系不能用我們熟悉的函數(shù)關系來描述,那么這究竟是一種什么樣的關系?個變量間的相關關系解讀相關關系我們可以從以下三個方面加以認識:(1)相關關系與函數(shù)關系不同函數(shù)關系中的兩個變量間是一種確定性關系,相關關系是一種非確定性關系(2)函數(shù)關系是一種因果關系,而相關
34、關系不一定是因果關系,還可能是伴隨關系(3)函數(shù)關系與相關關系之間有著密切聯(lián)系,在一定的條件下可以相互轉化例1有下列關系:人的年齡與其擁有的財富之間的關系;曲線上的點與該點的坐標之間的關系;蘋果的產(chǎn)量與氣候之間的關系;森林中的同一樹木,其橫截面直徑與高度之間的關系;學生與其學號之間的關系其中是相關關系的是_解析中兩變量間的關系是函數(shù)關系;中兩變量的關系是非確定性關系,是相關關系答案回歸直線方程在觀察散點圖特征時,我們會發(fā)現(xiàn)有時各點大致分布在一條直線的附近,且可以畫出不止一條類似的直線,而最能代表變量x與y之間關系的直線的特征,即為n個偏差的平方和最小設所求直線方程abx,其中a,b是待定系數(shù),
35、則iabxi(i1,2,n)于是得到各個偏差yiiyi(bxia)(i1,2,n)顯然,偏差yii的符號有正有負,若將它們相加會造成相互抵消,故采用n個偏差的平方和Q (yibxia)2.采用最小二乘法可求出使Q為最小值時的a和b.,其中xi,yi.例2設對變量x、y有如下觀察數(shù)據(jù):x151152153154156157158160160162163164y40414141.54242.5434445454645.5(1)畫出散點圖;(2)如果變量x、y有線性關系,求出回歸直線方程. 解(1)畫出散點圖(2)由(1)得變量x、y具有線性相關關系用計算器求得回歸直線方程: 0.450x27.75
36、9.錯點剖析1混淆相關關系與函數(shù)關系的概念例3下列兩個變量之間的關系,哪個不是函數(shù)關系()A角度與它的余弦值B正方形的邊長與面積C正n邊形的邊數(shù)與各內(nèi)角的角度之和D人的年齡與身高錯解C正解D2散點圖及回歸直線方程在實際中的應用有誤例4有人統(tǒng)計了同一個省的6個城市某一年的人均國民生產(chǎn)總值(即人均GDP)和這一年各城市患白血病的兒童數(shù)量,如下表:人均GDP(萬元)1086431患白血病的兒童數(shù)351312207175132180(1)畫出散點圖,并判定兩個變量是否具有線性相關關系;(2)通過計算可得兩個變量的回歸直線方程為23.25x102.25,假如一個城市的人均GDP為12萬元,那么可以斷言,
37、這個城市患白血病的兒童一定超過380人,請問這個斷言是否正確?錯解(1)根據(jù)表中數(shù)據(jù)畫出散點圖,如圖所示,從圖可以看出,雖然后5個點大致分布在一條直線的附近,但第一個點離這條直線太遠,所以這兩個變量不具有線性相關關系(2)將x12代入23.25x102.25,得23.25×12102.25381.25>380,所以上述斷言是正確的正解(1)根據(jù)表中數(shù)據(jù)畫散點圖,如錯解圖所示,從圖可以看出,在6個點中,雖然第一個點離這條直線較遠,但其余5個點大致分布在這條直線的附近,所以這兩個變量具有線性相關關系(2)將x12代入23.25x102.25,得23.25×12102.25
38、381.25>380,即便如此,但因381.25只是一個估計值,會受其他情況的影響,所以不能斷言這個城市患白血病的兒童一定超過380人3忽略線性相關關系的判斷致誤例5假設關于某設備的使用年限x(年)和所支出的維修費用y(萬元)有如下的統(tǒng)計資料:x/年123456y/萬元5.00.80.56.57.01.2根據(jù)資料判斷y對x是否呈線性相關關系?若存在,借助回歸直線方程估計使用年限為10年時,維修費用大約是多少?若不存在,請根據(jù)資料,求出第二年到第五年維修費用總共是多少?錯解由于3.5,3.5,x9.1,xiyi76.3,0.16,3.50.16×3.52.94,于是回歸直線方程為
39、0.16x2.94,當x10(年)時,0.16×102.944.54(萬元)錯解辨析在學習本章內(nèi)容時,很多同學總是認為,只要是給出數(shù)據(jù),就一定存在線性相關關系,當然一定可以求回歸直線方程;其實不然,并非給出數(shù)據(jù),就有線性相關關系,即便是求出回歸直線也不一定有價值正解先畫出散點圖,如圖所示觀察這個散點圖,這些點沒有分布在一條直線附近,所以y對x不呈線性相關關系由于第二年到第五年的維修費用表中已經(jīng)給出,所以總費用W0.80.56.57.014.8(萬元),即第二年到第五年的維修費用為14.8萬元.計中的數(shù)形結合思想與轉化思想1數(shù)形結合的思想方法數(shù)形結合是統(tǒng)計內(nèi)容中一個很突出的特點獲取了一個科學樣本后,需要對樣本數(shù)據(jù)進行整理分析,為了使樣本的數(shù)據(jù)特征更直觀,我們經(jīng)常需要作圖將樣本中的n個數(shù)據(jù)點(xi,yi)(i1,2,n)描在平面直角坐標系中,就得到了散點圖根據(jù)散點圖中點的分布趨勢可直觀地判斷并得出兩個變量的關系散點圖定義在具有相關關系的兩個變量基礎上,借助散點圖,我們可以看兩個變量關系的密切程度,進行相關回歸分析如果散點圖中的點散布在從左下角到右上角的區(qū)域,對于兩個變量的這種相關關系,我們稱正相關;如果散點圖中的點散布在左上角到右下角的區(qū)域,我們稱為負
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 貨物運輸代理授權委托合同
- VR技術在教育培訓行業(yè)的創(chuàng)新應用
- 客戶往來商務信函管理規(guī)范
- 《歷史經(jīng)典著作〈紅樓夢〉閱讀教學設計》
- 產(chǎn)品采購及供應協(xié)議規(guī)范內(nèi)容
- 高考語文復習微專題之文言文閱讀之斷句
- 高考語文復習:文言文專題訓練《莊子》
- 人才培訓與招聘服務協(xié)議
- 中小學必讀經(jīng)典書目征文
- 古詩詞中情感與意象的探討
- 海洋工程裝備技術專業(yè)人才培養(yǎng)方案(高職)
- 天然氣培訓課件
- 浙江杭州余杭區(qū)余杭街道招考聘用編外人員16人(必考題)模擬卷及答案
- 腹腔穿刺術(僅供參考)課件
- 教學課件:《新能源材料技術》朱繼平
- 人教版部編七年級下冊語文必背古詩文言文
- 2022年七年級初一數(shù)學希望杯競賽模擬真題含答案27屆
- 自動駕駛數(shù)據(jù)安全白皮書
- 工期定額-民用建筑
- 2020新版?zhèn)€人征信報告模板
- 云南省實驗教材信息技術三年級第一冊第13課PPT課件
評論
0/150
提交評論