第五章數(shù)理統(tǒng)計(jì)_第1頁
第五章數(shù)理統(tǒng)計(jì)_第2頁
第五章數(shù)理統(tǒng)計(jì)_第3頁
第五章數(shù)理統(tǒng)計(jì)_第4頁
第五章數(shù)理統(tǒng)計(jì)_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

?

概率統(tǒng)計(jì)教研室

2012第5章

數(shù)理統(tǒng)計(jì)的基本概念總體、樣本、統(tǒng)計(jì)量抽樣分布數(shù)理統(tǒng)計(jì)一、數(shù)理統(tǒng)計(jì)及其任務(wù)數(shù)理統(tǒng)計(jì)是一門以概率論為基礎(chǔ)的應(yīng)用學(xué)科。它是探討如何有效地收集、整理、分析帶有隨機(jī)性的數(shù)據(jù),以便對所考察的問題作出推斷和預(yù)料,從而為決策供應(yīng)依據(jù)。數(shù)據(jù)的隨機(jī)性來源有二:一是由于種種緣由(如所涉及的探討對象數(shù)量很大),人們不行能對其全部進(jìn)行探討,而只能以確定方式選擇其中一部分考察,這一部分的選擇就必定帶有隨機(jī)性;二是試驗(yàn)的隨機(jī)誤差,這是指試驗(yàn)中無法限制或未加限制,甚至不了解的因素引起的誤差。數(shù)理統(tǒng)計(jì)的任務(wù)就是探討有效地收集數(shù)據(jù),科學(xué)地整理與分析所獲得的有限的資料,對所探討的問題,盡可能地作出精確而牢靠的結(jié)論。有效地收集數(shù)據(jù)有兩方面的含義:一是可以建立一個(gè)數(shù)學(xué)上可處理并盡可能簡潔便利的模型來描述所得到的數(shù)據(jù);二是要收集包含盡可能多的與所探討的問題有關(guān)的信息。數(shù)理統(tǒng)計(jì)探討問題的方式,不是對所探討對象的全體(稱為總體)進(jìn)行視察,而是抽取其中的部分(稱為樣本)進(jìn)行視察獲得數(shù)據(jù)(抽樣),并通過這些數(shù)據(jù)對總體進(jìn)行推斷。數(shù)理統(tǒng)計(jì)方法具有“部分推斷整體”的特征。二、數(shù)理統(tǒng)計(jì)探討問題的一般流程分析問題確定總體收集數(shù)據(jù)試驗(yàn)設(shè)計(jì)抽樣數(shù)據(jù)整理統(tǒng)計(jì)推斷參數(shù)估計(jì)假設(shè)檢驗(yàn)我們這門課所學(xué)的數(shù)理統(tǒng)計(jì)事實(shí)上是統(tǒng)計(jì)推斷及其應(yīng)用(方差分析與回來分析)的一部分內(nèi)容。為什么要用數(shù)理統(tǒng)計(jì)方法探討問題?隨機(jī)現(xiàn)象有它的規(guī)律性,隨機(jī)現(xiàn)象的特點(diǎn)注定了進(jìn)行足夠多次視察,其規(guī)律性才能清晰地呈現(xiàn)出來。但是,客觀上只允許對隨機(jī)現(xiàn)象進(jìn)行有限次視察試驗(yàn),只能獲得局部視察資料.三、概率論與數(shù)理統(tǒng)計(jì)的區(qū)分與聯(lián)系1、概率論與數(shù)理統(tǒng)計(jì)的聯(lián)系2、概率論與數(shù)理統(tǒng)計(jì)的區(qū)分主要體現(xiàn)在探討方法的差別上:概率論是在已知隨機(jī)變量聽從某種分布(概率函數(shù)、概率密度、分布函數(shù))的狀況下,探討隨機(jī)變量分布的性質(zhì),數(shù)字特征和它的應(yīng)用。例如:已知隨機(jī)變量的概率密度求它的分布函數(shù)、數(shù)學(xué)期望、方差;已知隨機(jī)變量的分布求其函數(shù)的分布等,而數(shù)理統(tǒng)計(jì)則是通過對樣本數(shù)據(jù)的統(tǒng)計(jì)分析,從中得到能夠描述探討對象的某個(gè)隨機(jī)變量的具體分布和數(shù)字特征,以此推斷對象整體所具有的規(guī)律。前者用的是演繹法,后者用的是歸納法。都以隨機(jī)現(xiàn)象為對象,探討其統(tǒng)計(jì)規(guī)律性。總體

(Population)在數(shù)理統(tǒng)計(jì)中,把探討對象的全體稱為總體(母體);組成總體的每個(gè)單元稱為個(gè)體;描述總體單元在某方面特性的名稱或記號(hào)稱為總體指標(biāo);每個(gè)總體單元對總體指標(biāo)的響應(yīng)稱為指標(biāo)值;總體中所包含的個(gè)體的個(gè)數(shù)稱為總體的容量。5.1總體、樣本、統(tǒng)計(jì)量總體與總體特征數(shù)總體指標(biāo)數(shù)量指標(biāo)屬性指標(biāo)總體有限總體無限總體1.基本定義?

概率統(tǒng)計(jì)教研室

2012個(gè)體總體探討大氣中的懸浮顆粒的大小總體

(Population)2.舉例考察某高校一年級學(xué)生的年齡個(gè)體總體?

概率統(tǒng)計(jì)教研室

2012總體指標(biāo)值全集指標(biāo)隨機(jī)變量總體可以用隨機(jī)變量及其分布來表示,探討總體等價(jià)于探討表達(dá)總體的隨機(jī)變量概率分布;在理論上可以把總體與概率分布等同起來,總體分布就是表達(dá)總體的隨機(jī)變量的分布。總體

(Population)3.總體與隨機(jī)變量的關(guān)系?

概率統(tǒng)計(jì)教研室

2012總體

(Population)設(shè)某高校一年級學(xué)生的年齡分布如右表年齡1819202122比例0.50.30.10.070.03若從該高校一年級學(xué)生中隨意抽查一個(gè)學(xué)生的年齡,所得結(jié)果為一隨機(jī)變量,記作XX的概率分布是:可見,X的概率分布反映了總體中各個(gè)值的分布狀況.很自然地,我們就用隨機(jī)變量X來表示所考察的總體.也就是說,總體可以用一個(gè)隨機(jī)變量及其分布來描述.3.總體與隨機(jī)變量的關(guān)系?

概率統(tǒng)計(jì)教研室

2012總體特征數(shù)總體方差總體均值1.基本概念?

概率統(tǒng)計(jì)教研室

2012總體頻率?

概率統(tǒng)計(jì)教研室

2012總體方差假如總體為無限總體,則其對應(yīng)的總體特征數(shù)如下總體均值?

概率統(tǒng)計(jì)教研室

2012樣本

(Sample)樣本與樣本的數(shù)字特征1.基本定義按確定規(guī)則從總體中抽取一部分總體單元進(jìn)行觀測或試驗(yàn),這一抽取過程稱為“抽樣”;所抽取的部分總體單元的整體稱為總體的一個(gè)樣本(子樣);樣本中所包含的總體單元稱為樣本單元;樣本中樣本單元的數(shù)目稱為樣本容量。抽定?

概率統(tǒng)計(jì)教研室

20122.樣本應(yīng)滿足的性質(zhì)(1)代表性;(2)隨機(jī)性。簡潔隨機(jī)樣本1.簡潔隨機(jī)樣本(Independenceidenticaldistribution)2.生產(chǎn)實(shí)踐中獲得簡潔隨機(jī)樣本的方法(1)有放回抽樣;(3)總體容量很大時(shí)無放回抽樣可近似看成隨機(jī)抽樣(2)農(nóng)業(yè)調(diào)研-對角線抽樣;?

概率統(tǒng)計(jì)教研室

20123.樣本分布留意:樣本分布反映樣本取不同實(shí)現(xiàn)的概率規(guī)律,其與總體分布相聯(lián)系,一般求算比較麻煩,但對于簡潔隨機(jī)樣本有下列結(jié)果。?

概率統(tǒng)計(jì)教研室

2012?

概率統(tǒng)計(jì)教研室

2012總體樣本實(shí)現(xiàn)樣本推斷4.總體、樣本、樣本實(shí)現(xiàn)的關(guān)系?

概率統(tǒng)計(jì)教研室

2012?

概率統(tǒng)計(jì)教研室

2012?

概率統(tǒng)計(jì)教研室

2012統(tǒng)計(jì)量(Statistic)

統(tǒng)計(jì)量的基本概念?

概率統(tǒng)計(jì)教研室

2012?

概率統(tǒng)計(jì)教研室

2012幾個(gè)常用的統(tǒng)計(jì)量樣本平均值它反映了總體均值的信息樣本方差它反映了總體方差的信息樣本標(biāo)準(zhǔn)差

1.均值、方差、矩?

概率統(tǒng)計(jì)教研室

2012公式推導(dǎo)?

概率統(tǒng)計(jì)教研室

2012它反映了總體k階中心矩的信息樣本k階原點(diǎn)矩樣本k階中心矩它反映了總體k階原點(diǎn)矩的信息?

概率統(tǒng)計(jì)教研室

2012?

概率統(tǒng)計(jì)教研室

20122.次序統(tǒng)計(jì)量樣本中位數(shù)定義5.1.7

設(shè)的依次序排列成,則稱為樣本的第統(tǒng)計(jì)量,特殊,稱為最小次序統(tǒng)計(jì)量,為最大次序統(tǒng)。為樣本,把樣本按其實(shí)現(xiàn)由小到大個(gè)次序計(jì)量.?

概率統(tǒng)計(jì)教研室

2012樣本極值樣本極差和樣本極值在某些關(guān)于災(zāi)難性現(xiàn)象與材料試驗(yàn)結(jié)果的統(tǒng)計(jì)分析中有用。如確定時(shí)期內(nèi)一條河的最大流量、地震的最大震級、材料斷裂強(qiáng)度、苗木受凍害的最低溫度等,都是極值性的量。在數(shù)理統(tǒng)計(jì)中有一個(gè)叫極值統(tǒng)計(jì)分析的專題處理這類問題,也可視為依次統(tǒng)計(jì)量的統(tǒng)計(jì)分析的一部分。和

分別稱為樣本的最大值和最小值.極差可用以估計(jì)總體分布的數(shù)量變動(dòng)的最大范圍。

四、樣本的頻率分布與直方圖由樣本可以推斷總體,其直觀想法是:樣原來自總體,自然帶有總體的信息,從這些信息動(dòng)身探討總體,總有可能得到總體的某些真實(shí)性質(zhì)。其次,由樣本探討總體,可以節(jié)約人力物力等。由樣本探討總體的可行性還可以從理論上得到證明。1.閱歷分布函數(shù)例5.4數(shù)據(jù)整理:將數(shù)據(jù)分組計(jì)算各組頻數(shù)作頻率分布表作頻率直方圖為了探討隨機(jī)現(xiàn)象,首要的工作是收集原始數(shù)據(jù).一般通過抽樣調(diào)查或試驗(yàn)得到的數(shù)據(jù)往往是雜亂無章的,須要通過整理后才能顯示出它們的分布狀況。數(shù)據(jù)的簡潔處理是以一種直觀明白方式加工數(shù)據(jù),它包括兩個(gè)方面:數(shù)據(jù)整理;計(jì)算樣本特征值。計(jì)算樣本特征值:樣本均值、樣本方差等。例5.5為對某小麥雜交組合F2代的株高X進(jìn)行探討,抽取容量為100的樣本,測試的原始數(shù)據(jù)記錄如下(單位:厘米),試依據(jù)以上數(shù)據(jù),畫出它的頻率直方圖,并以此說明隨機(jī)變量X的分布狀況。2.樣本頻率分布表與直方圖

87 88 111 91 73 70 92 98 1059499 91 98 110 98 97 90 83 928886 94 102 99 89 104 94 94 929687 94 92 86 102 88 75 90 908084 91 82 94 99 102 91 96 949485 88 80 83 81 69 95 80 979296 109 91 80 80 94 102 80 869190 83 84 91 87 95 76 90 9177103 89 88 85 95 92 104 92 958386 81 86 91 89 83 96 86 7592

整理原始數(shù)據(jù),加工為分組資料,作出頻率分布表,畫直方圖,提取樣本分布特征的信息。步驟如下:(1).找數(shù)據(jù)最小值m=69,最大值M=111,極差為M-m=42;(2).數(shù)據(jù)分組,依據(jù)樣本容量n的大小,確定分組數(shù)k;(3).確定組限和組中點(diǎn)值;(4).將數(shù)據(jù)分組,計(jì)算出各組頻數(shù),作頻數(shù)、頻率分布表;(5).作出頻率直方圖。留意:分組的一般原則為30≤n≤405≤k≤640≤n≤606≤k≤860≤n≤1008≤k≤10100≤n≤50010≤k≤20本例取k=9,一般實(shí)行等距分組(也可以不等距分組),組距等于比極差除以組數(shù)略大的測量單位的整數(shù)倍。本例測量單位為1厘米,組距為一般依據(jù)算式:各組中點(diǎn)值加減1/2組距=組的上限或下限,組的上限與下限應(yīng)比數(shù)據(jù)多一位小數(shù)。本例取a=67.5,b=112.49(a略小于m,b略大于M,且a和b都比數(shù)據(jù)多一位小數(shù)),分組如下:[67.5,72.5)[72.5,77.5)[77.5,82.5)[82.5,87.5)[87.5,92.5)[92.5,97.5)[97.5,102.5)[102.5,107.5)[107.5,112.5)組中值分別為:70,75,80,85,90,95,100,105,110以樣本值為橫坐標(biāo),頻率/組距為縱坐標(biāo);以分組區(qū)間為底,以為高作頻率直方圖,如圖所示。從頻率直方圖可看到:靠近兩個(gè)極端的數(shù)據(jù)出現(xiàn)比較少,而中間旁邊的數(shù)據(jù)比較多,即中間大兩頭小的分布趨勢(隨機(jī)變量分布狀況的最粗略的信息)。頻率直方圖中的小矩形的面積近似地反映了樣本數(shù)據(jù)落在某個(gè)區(qū)間內(nèi)的可能性大小,故它可近似描述X的分布狀況。

1.枝葉圖(莖葉圖)

將樣本的實(shí)現(xiàn)數(shù)據(jù)的每個(gè)數(shù)據(jù)分為兩部分,一部分作為枝,另一部分為葉,構(gòu)成的圖稱為枝葉圖。以例說明枝葉圖的做法:例5.6

64677072747676798081828283858688919192939393959595979799100100102104106106107108108112112114116118119119122123125126128133試作枝葉圖解:將數(shù)據(jù)的百位和十位作枝,個(gè)位作葉,用豎線將枝葉分開,形成圖。47024668012235681123335667790024667882246899235683

678910111213枝葉五.其他描述樣本特征的圖

2.五數(shù)概括與箱線圖車輛重量(磅)5.2抽樣分布正態(tài)總體的抽樣分布重要定理及推論2.一個(gè)重要定理1.基本概念統(tǒng)計(jì)量的分布稱為抽樣分布;?

概率統(tǒng)計(jì)教研室

2012?

概率統(tǒng)計(jì)教研室

20123.三個(gè)重要推論?

概率統(tǒng)計(jì)教研室

2012推論1:?

概率統(tǒng)計(jì)教研室

2012?

概率統(tǒng)計(jì)教研室

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論