用樣本估計(jì)總體_第1頁
用樣本估計(jì)總體_第2頁
用樣本估計(jì)總體_第3頁
用樣本估計(jì)總體_第4頁
用樣本估計(jì)總體_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

§2.2用樣本估計(jì)總體現(xiàn)在是1頁\一共有36頁\編輯于星期五復(fù)習(xí)回顧前面我們研究了通過抽樣來收集數(shù)據(jù)的方法,了解了提高樣本代表性的一些具體方法,數(shù)據(jù)被收集后,必須從中尋找所包含的訊息,以便我們能通過樣本來估計(jì)總體樣本的特征直接反映了總體的特征,我們通常用樣本來頻率和素質(zhì)特征來評估總體的特征現(xiàn)在是2頁\一共有36頁\編輯于星期五聯(lián)合國報(bào)告曾經(jīng)預(yù)言,21世紀(jì)淡水將成為全世界最緊張的自然資源。我國是一個(gè)水資源相對匱乏的國家,同時(shí)由于經(jīng)濟(jì)發(fā)展所帶來的水污染和用水需矛盾的突顯,水危機(jī)已成為最嚴(yán)峻的現(xiàn)實(shí)問題,極大地阻礙了經(jīng)濟(jì)的發(fā)展。據(jù)統(tǒng)計(jì),由于供水不足,城市工業(yè)每年損失達(dá)到1200億元人民幣;由于城市水污染造成的經(jīng)濟(jì)損失估計(jì)相當(dāng)于國家當(dāng)年財(cái)政收入的6%;另一方面,飲用水的短缺和水污染也已危及居民的生活和健康,影響到社會的安定。因此,解決水危機(jī)已被政府提上日程,水價(jià)改革成為解決這一問題的手段之一2.2.1用樣本的頻率分布估計(jì)總體分布現(xiàn)在是3頁\一共有36頁\編輯于星期五現(xiàn)在是4頁\一共有36頁\編輯于星期五黃河斷流落后的洗車方式“滴水”成災(zāi)現(xiàn)在是5頁\一共有36頁\編輯于星期五2005年9月,廣州市市政園林局有關(guān)負(fù)責(zé)人在向省政協(xié)“創(chuàng)建節(jié)水型城市”視察團(tuán)匯報(bào)時(shí)表示,為實(shí)現(xiàn)居民生活用水階梯式計(jì)量水價(jià)管理,有關(guān)部門已編制了《廣州市居民自來水計(jì)量系統(tǒng)改造實(shí)施方案》和《階梯式計(jì)量水價(jià)實(shí)施方案》,明年開始對符合條件的居民實(shí)施階梯水價(jià),5年內(nèi)全部實(shí)施。同時(shí),為了改變廣州節(jié)水型用水器具使用率偏低的狀況,市節(jié)水辦計(jì)劃明年實(shí)施用水器具改造。階梯水價(jià)是指用水單位超出用水計(jì)劃或定額部分的水量,除按實(shí)用水量向城市供水企業(yè)繳納水費(fèi)外,超計(jì)劃用水部分,按以下標(biāo)準(zhǔn)另行向城市供水行政主管部門交納加價(jià)水費(fèi):(一)超計(jì)劃百分之二十以內(nèi)(含百分之二十,下同)水量,超用水量按現(xiàn)行水價(jià)加價(jià)兩倍收費(fèi)。(二)超計(jì)劃百分之二十以上百分之四十以內(nèi)水量,超用水量按現(xiàn)行水價(jià)加價(jià)四倍收費(fèi)。(三)超計(jì)劃百分之四十以上的,超用水量按現(xiàn)行水價(jià)加價(jià)五倍收費(fèi)現(xiàn)在是6頁\一共有36頁\編輯于星期五廣州2006年1月1日廣州市物價(jià)局1日公布,廣州市政府已批準(zhǔn)新水價(jià)從1日起正式實(shí)施。居民生活用水由原來的0.9元/立方米提升到1.32元/立方米,工業(yè)用水和經(jīng)營服務(wù)用水也分別由每立方米1.25元和1.85元漲至1.83元和2.71元,綜合水價(jià)達(dá)到1.69元/立方米,但暫時(shí)不實(shí)行階梯水價(jià)現(xiàn)在是7頁\一共有36頁\編輯于星期五針對這一情況,確定配額水量a為多少時(shí)比較合理?你認(rèn)為為了較為合理的確定這一標(biāo)準(zhǔn),你認(rèn)為需要做哪些工作?水價(jià)太高,影響居民日常生活,水價(jià)太低,不利于節(jié)約用水.為了確定這一配額a,必須首先了解全市日常用水量的分布情況現(xiàn)在是8頁\一共有36頁\編輯于星期五由于城市住戶較多,因此我們采用抽查的方式進(jìn)行,下面是對100戶進(jìn)行抽查的結(jié)果:樣本容量可以根據(jù)實(shí)際情況適當(dāng)選擇,并不一定越大越好.這100戶用水量在0.2~4.3之間,除此之外,我們很難得到其他信息,一次我們必須對數(shù)據(jù)的潛在信息進(jìn)行分析現(xiàn)在是9頁\一共有36頁\編輯于星期五在初中,我們學(xué)習(xí)了哪些分析數(shù)據(jù)的方法?人類辨識影像的能力要優(yōu)於辨識文字與數(shù)字的能力,因此我們采用圖形的方式來展現(xiàn)數(shù)據(jù)時(shí),常常不我們直接觀察數(shù)據(jù)要來的快。一幅好的圖勝過一千個(gè)字現(xiàn)在是10頁\一共有36頁\編輯于星期五下面我們將要學(xué)習(xí)到的是頻率分布表和頻率分布圖從比例的角度來分析數(shù)據(jù)頻率分布(frequencydistribution)的基本步驟是:1.求極差:最大數(shù)與最小數(shù)的差,反映了數(shù)據(jù)的變化范圍4.3-0.2=4.12.決定組距和組數(shù)組距和組數(shù)沒有固定的標(biāo)準(zhǔn),常常需要嘗試和選擇的過程,一般數(shù)據(jù)較少(100以內(nèi))時(shí),分成5~12組現(xiàn)在是11頁\一共有36頁\編輯于星期五3.數(shù)據(jù)分組:數(shù)據(jù)的分組也不是越多越好,為了方便,我們力求“取整”因此,分成9組較合適以0.5為組距分組時(shí)??梢苑殖?組:[0,0.5),[0.5,1.0),…,[4,4.5)當(dāng)樣本容量n很大時(shí),分組數(shù)k應(yīng)該在(1+3.3lgn)附近現(xiàn)在是12頁\一共有36頁\編輯于星期五4.列頻率分布表利用計(jì)算出各組數(shù)據(jù)的頻率(可以利用EXCEL來完成作圖)現(xiàn)在是13頁\一共有36頁\編輯于星期五5.作頻率分布直方圖因此所有小長方形的面積和為1現(xiàn)在是14頁\一共有36頁\編輯于星期五說明:1.隨機(jī)性:頻率分布直方圖是由樣本決定,它會隨著樣本的改變而變化2.規(guī)律性:根據(jù)頻率與概率的關(guān)系,若固定分組數(shù),隨著樣本用量的增加,各個(gè)頻率段會穩(wěn)定在總體的相應(yīng)頻率段上3.特別的,若按9組分組,則頻率直方圖穩(wěn)定于總體密度函數(shù),我們可以用頻率分布折線圖來表示現(xiàn)在是15頁\一共有36頁\編輯于星期五一般的,隨著樣本容量的增加,作圖時(shí)組數(shù)也相應(yīng)的變大,相應(yīng)的頻率分布折線圖會越來越接近一條光滑曲線——總體密度曲線總體密度曲線反映了總體在各個(gè)范圍內(nèi)取值的百分比,它比頻率分布直方圖提供更加精細(xì)的信息現(xiàn)在是16頁\一共有36頁\編輯于星期五例如圖中陰影部分的面積就表示總體在[a,b]內(nèi)的百分比現(xiàn)在是17頁\一共有36頁\編輯于星期五思考:1.任何一個(gè)總體,它的密度曲線是否一定存在?3.任何一個(gè)總體的密度曲線是否可以被非常精確的表示出來?2.任何一個(gè)總體的密度曲線,是否都可以利用函數(shù)來刻畫?實(shí)施上,任何一個(gè)總體的密度曲線雖然客觀存在,但是很難想函數(shù)圖像一樣被精確的畫出來,我們只能用樣本的頻率分布對它進(jìn)行估計(jì);一般來說,樣本的容量,估計(jì)就越精確.現(xiàn)在是18頁\一共有36頁\編輯于星期五除了上面的幾種處理方式外,我們還有一種用來表示數(shù)據(jù)的圖——莖葉圖(stem-and-leapdisplay)例某賽季甲、乙兩名籃球運(yùn)動員每場比賽得分情況如下。甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50。乙的得分:8,13,14,16,23,26,28,33,38,39,51。上述的數(shù)據(jù)可以用下圖來表示,中間數(shù)字表示得分的十位數(shù),兩邊數(shù)字分別表示兩個(gè)人各場比賽得分的個(gè)位數(shù)現(xiàn)在是19頁\一共有36頁\編輯于星期五從這個(gè)莖葉圖上可以看出,甲運(yùn)動員的得分情況是大致對稱的,中位數(shù)是36;乙運(yùn)動員的得分情況除一個(gè)特殊得分外,也大致對稱,中位數(shù)是26。因此甲運(yùn)動員發(fā)揮比較穩(wěn)定,總體得分情況比乙好十位數(shù)個(gè)位數(shù)個(gè)位數(shù)現(xiàn)在是20頁\一共有36頁\編輯于星期五用莖葉圖表示有兩個(gè)突出的優(yōu)點(diǎn):但莖葉圖只能表示兩位的整數(shù),雖然可以表示兩個(gè)人的比賽結(jié)果(或兩個(gè)以上的記錄),但沒有直方圖那么直觀、清晰。2.莖葉圖可以在比賽時(shí)隨時(shí)記錄,方便記錄與表示1.從統(tǒng)計(jì)圖上沒有信息的損失,所有的信息都可以從這個(gè)莖葉圖中得到現(xiàn)在是21頁\一共有36頁\編輯于星期五美容業(yè)作為一個(gè)新型的行業(yè),正在迅速的崛起,尤其受到女性的喜愛,請你設(shè)計(jì)一個(gè)方案調(diào)查女性美容的目的,作出頻率分布直方圖和折線圖,匯總并與同學(xué)們交流練習(xí)現(xiàn)在是22頁\一共有36頁\編輯于星期五2.2.2用樣本數(shù)字特征估計(jì)總體數(shù)字特征頻率分布直方圖和頻率分布折線圖雖然能夠很好的反映總體的分布情況,但為了更好的把握總體,我們還需要通過樣本的數(shù)據(jù)對總體的數(shù)字特征進(jìn)行研究我們通常用集中趨勢和離散程度來表示現(xiàn)在是23頁\一共有36頁\編輯于星期五①眾數(shù):就是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù).集中趨勢用什么表示比較好?離散程度呢?1°集中趨勢我們可以用眾數(shù)、中位數(shù)、平均數(shù)或加權(quán)平均數(shù)來反映由圖可以看出月均用水在2.25t(最高的矩形中點(diǎn))的用戶最多,但它沒有告訴我們多多少.現(xiàn)在是24頁\一共有36頁\編輯于星期五②中位數(shù):就是一組數(shù)據(jù)按照從小到大或從大到小的順序進(jìn)行排列時(shí),處于中間位置的數(shù).奇數(shù)個(gè)數(shù)時(shí),中位數(shù)有1個(gè)偶數(shù)個(gè)數(shù)時(shí),中位數(shù)有2個(gè)13579的中位數(shù)是5268459的中位數(shù)是5和6中位數(shù)不受個(gè)別極端數(shù)據(jù)的影響,在某種情況下,這是一個(gè)優(yōu)點(diǎn),但它對極值的不敏感有時(shí)也會成為缺點(diǎn),你能舉例說明嗎?現(xiàn)在是25頁\一共有36頁\編輯于星期五③平均數(shù):就是一組數(shù)據(jù)的平均,設(shè)有n個(gè)數(shù)據(jù),x1,x2,…,xn,這組數(shù)據(jù)的平均數(shù)為:特別地,如果上面n個(gè)數(shù)據(jù)中不同數(shù)據(jù)x1,x2,…,xn的個(gè)數(shù)分別為k1,k2,…,kn,那么它們的平均數(shù)為現(xiàn)在是26頁\一共有36頁\編輯于星期五④加權(quán)平均數(shù):就是一組數(shù)據(jù)的加權(quán)平均.設(shè)有n個(gè)數(shù)據(jù)x1,x2,…,xn,它們的權(quán)分別為l1,l2,…,ln,這組數(shù)據(jù)的加權(quán)平均數(shù)為:加權(quán)是一組數(shù)據(jù)中某一個(gè)數(shù)的頻數(shù)由此可以看出,平均數(shù)是加權(quán)平均數(shù)的一個(gè)特例,也就是說,它們的權(quán)都是1/n平均數(shù)受每個(gè)數(shù)據(jù)的影響,尤其是極端數(shù)據(jù)對平均數(shù)影響較大,因此在實(shí)際操作時(shí),常常想方設(shè)法較少誤差,你能舉出具體的例子嗎?現(xiàn)在是27頁\一共有36頁\編輯于星期五某公司員工的月工資情況如表:職員c工程師應(yīng)聘者職員D我的工資是2000我的工資是1500我的工資是4000我的可以拿到???實(shí)例分析如果你是應(yīng)聘者,你如何看待這些數(shù)據(jù)?現(xiàn)在是28頁\一共有36頁\編輯于星期五月工資/元80005000400020001000800700600500員工數(shù)/人12461282052(1)分別計(jì)算該公司員工月工資的平均數(shù)、中位數(shù)和眾數(shù)。(2)公司經(jīng)理會選取上面哪個(gè)來代表該公司員工的月工資情況,稅務(wù)官呢?工會領(lǐng)導(dǎo)呢?分析:1.根據(jù)平均數(shù)、中位數(shù)的計(jì)算公式,可以算出平均數(shù)為:1373元,中位數(shù)為:800元,眾數(shù)為:700元2.不同身份的人代表不同階層人的利益,對公司領(lǐng)導(dǎo)平均數(shù)好,對稅務(wù)官中位數(shù)比較好,對工會領(lǐng)導(dǎo)眾數(shù)即使他的選擇現(xiàn)在是29頁\一共有36頁\編輯于星期五①極差:就是一組數(shù)據(jù)中最大數(shù)與最小數(shù)之間的差.居民用水的極差就是:4.3-0.2=4.12°離散程度用極差和標(biāo)準(zhǔn)差或方差來反映②方差:就是一組數(shù)據(jù)中所有數(shù)與平均數(shù)的差的平方和的平均數(shù).設(shè)有n個(gè)數(shù)據(jù)x1,x2,…,xn,這組數(shù)據(jù)的方差為:現(xiàn)在是30頁\一共有36頁\編輯于星期五③標(biāo)準(zhǔn)差:樣本數(shù)據(jù)到平均數(shù)的一種平均距離,一般用s來表示.現(xiàn)在是31頁\一共有36頁\編輯于星期五例畫出下列樣本的直方圖,說明它們的異同點(diǎn)(1)5,5,5,5,5,5,5,5,5(2)4,4,4,5,5,5,6,6,6(3)3,3,4,4,5,6,6,7,7(4)2,2,2,2,5,8,8,8,8解四組樣本的直方圖為:現(xiàn)在是32頁\一共有36頁\編輯于星期五說明:1.平均數(shù)都是:2.標(biāo)準(zhǔn)差分別為:0.00,0.82,1.49,2.8353.平均數(shù)是總體的重心所在,標(biāo)均差表明總體的離散程度,其他的信息就丟失了,因此不能完全刻畫總體的全貌.現(xiàn)在是33頁\一共有36頁\編輯于星期五總體說明1.樣本眾數(shù)通常用來表示分類變量的中心,容易計(jì)算,但反映總體的信息較少2.中位數(shù)僅利用了中間數(shù)據(jù)的性質(zhì),當(dāng)樣本數(shù)據(jù)質(zhì)量較差時(shí),應(yīng)該用抗極端數(shù)據(jù)強(qiáng)的數(shù)據(jù)表示中心值.(例如利用計(jì)算機(jī)模擬樣本)3.平均數(shù)比中位數(shù)和眾數(shù)反映了更多的信息,但“極端數(shù)據(jù)”可能使它產(chǎn)生較大的誤差4.如果樣本平均數(shù)大于樣本中位數(shù),則表示數(shù)據(jù)中存在較多較大的極端數(shù),反之,存在較多較小的極端數(shù),它們一起可以反映樣本中極

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論