平均數(shù)抽樣分布(正式.ppt_第1頁
平均數(shù)抽樣分布(正式.ppt_第2頁
平均數(shù)抽樣分布(正式.ppt_第3頁
平均數(shù)抽樣分布(正式.ppt_第4頁
平均數(shù)抽樣分布(正式.ppt_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第二章 概率與理論分布,第三節(jié) 平均數(shù)抽樣分布,研究總體與從中抽取的樣本之間的關系是統(tǒng)計學的中心內(nèi)容 。對這種關系的研究可從兩方面著手: (1)抽樣分布:從總體到樣本 ,這就是研究抽樣分布(sampling distribution)的問題,統(tǒng)計量的概率分布稱為抽樣分布; (2)統(tǒng)計推斷: 從樣本到總體,這就是統(tǒng)計推斷(statistical inference)問題。,統(tǒng)計推斷是以總體分布和樣本抽樣分布的理論關系為基礎的。為了能正確地利用樣本去推斷總體,并能正確地理解統(tǒng)計推斷的結論,須對樣本的抽樣分布有所了解。 我們知道,由總體中隨機地抽取若干個體組成樣本,即使每次抽取的樣本含量相等,其統(tǒng)計量(如,S)也將隨樣本的不同而有所不同,因而樣本統(tǒng)計量也是隨機變量, 也有其概率分布。我們把統(tǒng)計量的概率分布稱為抽樣分布。,由總體隨機抽樣(random sampling)的方法可分為有復置抽樣和不復置抽樣兩種。 復置抽樣:指每次抽出一個個體后,這個個體應返回原總體; 不復置抽樣:指每次抽出的個體不返回原總體。 對于無限總體,返回與否都可保證各個體被抽到的機會相等。 對于有限總體,就應該采取復置抽樣,否則各個體被抽到的機會就不相等。,一、抽樣的目的go 二、樣本平均數(shù)及其分布go 三、樣本平均數(shù)差數(shù)及其分布go 四、t分布go,導言,一、抽樣的目的 運用樣本推斷總體 試驗測定所得 樣本數(shù)據(jù); 試驗目的 獲得總體信息 因此要研究 樣本與總體關系 如何通過對樣本數(shù)據(jù)的分析獲得總體信息,總體 ,從總體抽取樣本,從樣本推斷總體,導言,總體 ,從總體抽取樣本,從樣本推斷總體,二、樣本平均數(shù)及其分布:,許多 Si 形成樣本標準差抽樣分布。,許多 形成樣本平均數(shù)抽樣分布。由樣本平均數(shù)構成的總體稱為樣本平均數(shù)的抽樣總體。,和一個標準差Si 。,每一個樣本有一個樣本平均數(shù),樣本平均數(shù) 抽樣分布,二、樣本平均數(shù)及其分布:,抽樣分布總體與原總體有什么關系? 與 ? 與 ? 抽樣分布總體與原總體關系如下: 1、樣本平均數(shù)分布的平均數(shù)等于原總體平 2、樣本平均數(shù)分布的標準差等于原總體標 即,(標準誤),準差除以,均數(shù),即,標 準 誤 標 準 誤(平均數(shù)抽樣總體的標準差) 的大小反映樣本平均數(shù) 的抽樣誤差的大小,即精確性的高低 。 標準誤大,說明各樣本平均數(shù) 間差異程度大,樣本平均數(shù)的精確性低。反之, 小,說明各樣本平均數(shù) 間的差異程度小 , 樣本平均數(shù)的精確性高。 的大小與原總體的標準差成正比,與樣本含量n的平方根成反比。從某特定總體抽樣 ,因為是一常數(shù) ,所以只有增大樣本含量才能降低樣本平均數(shù) 的抽樣誤差。,注意,樣本標準差與樣本標準誤是既有聯(lián)系又有區(qū)別的兩個統(tǒng)計量。二者的區(qū)別在于: 樣 本 標 準 差 S 是 反 映 樣 本中各 觀測值 x1 ,x2 ,xn,變 異 程 度大小的一個指標,它的大小說明了 對 該 樣本代表性的強弱。 樣本標準誤是樣本平均數(shù) , , 的標準差,它是抽樣誤差的估計值, 其大小說明了樣本間變異程度的大小及精確性的高低。,對于大樣本資料,常將樣本標準差S與樣本平均數(shù) 配合使用,記為 S,用以說明所考察性狀或指標的優(yōu)良性與穩(wěn)定性。 對于小樣本資料,常將樣本標準誤 與樣本平均數(shù) 配合使用,記為 , 用 以表示 所考察性狀或指標的優(yōu)良性與 抽樣誤差的大小。,3、若原分布為正態(tài)分布,平均數(shù)分布亦為正態(tài)分布。 若原分布是非正態(tài)分布,當n增大時,平均數(shù)分布亦趨向正態(tài)分布。 所以n30時,可以認為新分布符合正態(tài)分布。,例3-4,某品種葡萄總體,果穗長=30cm,=10.8cm, 隨機抽50個果穗,所得樣本平均數(shù)與相差不超過3cm的概率是多少? 解:已知U= 查附表3得 P (yU +0.28,以及y U -0.28) =0.78 P (U -0.28y U +0.28) =1-0.78=0.22=22% 以上做法對不對 不對! 分析:已知、,求 | -|3cm的概率,求樣本平均數(shù)的信息,算U值須用 ,上面的解答錯用 。,?,正確做法: 從樣本均數(shù)分布規(guī)律入手 樣本均數(shù)分布 解: U= 查附表3得P (yU +1.96,以及y U -1.96) =0.05 P (U -1.96y U +1.96) =1-0.05=0.95,若題目改為某葡萄品種總體,果穗長=30cm,=10.8cm,若從其中抽取50個穗,問50 穗中,長度與相差不超過3cm的果穗共有多少穗? 解:U= P=0.22=22% 500.22=11(穂),例3-5 某枇杷單果重=30g, =9.6g, 今從中抽取50個 分析:已知總體分布=30,=9.6, 問 解:,的概率是多少?,的概率P?,樣本中,果,其平均單果重,查附表3得兩尾概率0.46,那么單尾概率=0.46/2=0.23,所以平均單果重小于等于29g的概率為0.23。,若將是題目改成:某枇杷品種平均單果重=30g,=9.6g,問單果重小于29g的概率是多少? 解:U= P(29X30)=0.0398 P(X29)=0.5-0.0398=0.4602,查附表3得兩尾概率0.92,那么單尾概率=0.92/2=0.46,所以單果重小于等于29g的概率為0.46。,例:在江蘇沛縣調(diào)查336個平方米小地老虎蟲危害情況的結果, =4.37頭, =2.63,試問樣本容量n=30時,由于隨機抽樣得到樣本平均數(shù) 等于或小于4.37的概率為多少? 查附表2,(u-0.75)=0.2266,即概率為22.66%(屬于一尾概率)。因所得概率較大,說明差數(shù)-0.36是隨機誤差,從而證明這樣本平均數(shù)4.37是有代表性的。相對精確度估計為:,附:變異系數(shù) CV= 用處: (1)比較不同性質(zhì)、不同單位、平均數(shù)相差很遠的資料之間的變異情況; (2)在空白試驗中作為測定土壤差異的指標(解釋空白試驗); (3)在田間試驗設計中,作為確定試驗小區(qū)面積和重復次數(shù)的依據(jù)。,平均數(shù)有沒有變異系數(shù)? 反映樣本平均數(shù)的離散(變異)情況。 每一個 都代表總體平均數(shù), 可是它們之間存在差異。 為什么 因為存在抽樣誤差。,有。,之間有差異?,是的無偏估計。,是一個樣本的平均數(shù),,所以也是抽樣誤差的反映,即精確度。 因而, 又稱為精確度。 越大,精確度越低。 越小,精確度越高。,是,之間差異是抽樣誤差的反映,,之間差異的估量值,,三、樣本平均數(shù)差數(shù)的分布,總體1 1,總體2 2,三、樣本平均數(shù)差數(shù)的分布:,差數(shù)總體概率分布規(guī)律 1、差數(shù)總體平均數(shù) 即差數(shù)總體的平均數(shù)等于原來兩個總體平均數(shù)之差。 2、差數(shù)總體標準差,3、如果原來兩個總體作正態(tài)分布,則樣本平均數(shù)差數(shù) 如原兩個總體非正態(tài)分布(或分布未知): 1)當n1 、n2均大于30,樣本平均數(shù)差數(shù) 2)當n1 、n2 中有一小于或等于30 時,樣本平均數(shù)差數(shù)(,總體遵從正態(tài)分布;,總體遵從正態(tài)分布,即,)總體遵從t分布。,附: 不同情況下的變形形式 當平均數(shù)來自同一個總體,有1=2=,且n1=n2=n時, 則 當平均數(shù)來自不同總體,但是n1=n2=n時, 當平均數(shù)來自同一個總體,有1=2=,但n1n2時 則,則,平均數(shù)抽樣分布 平均數(shù)總體平均數(shù) 平均數(shù)總體標準差 平均數(shù)總體遵從什么分布 平均數(shù)差數(shù)的分布 差數(shù)總體平均數(shù) 差數(shù)總體標準差 差數(shù)總體遵從什么分布,五、二項總體的抽樣分布,(一)二項總體的分布參數(shù) 為了說明二項(0、1)總體的抽樣分布特征,以總體內(nèi)包含5個個體為例,每一個體,y=0,y=1。若總體的變量為:0,1,0,1,1,則總體平均數(shù)和方差為: =(0+1+0+1+1)/5=3/5=0.6 2=(0-0.6)2+(1-0.6)2+(0-0.6)2+(1-0.6)2 +(1-0.6)2/5=0.24 = 二項總體的平均數(shù)=p,方差為2 =p(1-P)=pq,標準差為=,= 0.49,(二)樣本平均數(shù)(成數(shù))的抽樣分布 從二項總體進行抽樣得到樣本,樣本平均數(shù)(成數(shù))的分布為二項式分布,平均數(shù) ,方差 ,標準誤 。 (三)樣本總和數(shù)(次數(shù))的抽樣分布 從二項總體進行抽樣得到樣本,樣本總和數(shù)(次數(shù))的分布為二項式分布,平均數(shù) ,方差 ,標準誤,例、棉田盲椿象為害棉株分為受害株和未受害株。假定調(diào)查2000株作為一個總體,受害株為704株。此二項總體中受害率p=35.2%, =0.4776,現(xiàn)從這一總體抽樣,以株為單位,用簡單隨機抽樣方法,調(diào)查200株棉株,獲得74株受害,那么,觀察受害率 ,試問樣本平均數(shù)與總體真值的差數(shù)的概率為多少? p=0.352,差數(shù)=0.370-0.352=0.018,樣本平均數(shù)的標準差為: =0.034。由于樣本容量大于30,樣本平均數(shù)的分布可以看作正態(tài)分布,故可以計算正態(tài)離差u查出概率. 查附表3,當u=0.53,概率值為0.59,兩尾概率為0.59,故樣本的受害率為37%有代表性。,第七節(jié) t 分 布,五、t分布 由樣本平均數(shù)抽樣分布的性質(zhì)知道: 若yN(, 2), 則 N(, 2/n)。 將隨機變量 標準化得: , 則uN(0,1)。 當總體標準差未知時, 以樣本標準差S代替所得到的統(tǒng)計量 記為t。在計算 時,由于采用S來代替,使得t 變量不再服從標準正態(tài)分布,而是服從t分布(tdistribution)。它的概率分布密度函數(shù)如下:,(4-26) 式中,t的取值范圍是(-,+); df=n-1為自由度。 t分布的平均數(shù)和標準差為: t0 (df1), (df2) (4-27) t分布密度曲線如圖4-13 所示,其特點是:,圖4-13 不同自由度的t分布密度曲線,1、t分布受自由度的制約,每一個自由度都有一條t分布密度曲線。 2、t分布密度曲線以縱軸為對稱軸,左右對稱,且在t0時,分布密度函數(shù)取得最大值。 3、與標準正態(tài)分布曲線相比,t分布曲線頂部略低,兩尾部稍高而平。df越小這種趨勢越明顯。df越大,t分布越趨近于標準正態(tài)分布。當n 30時,t分布與標準正態(tài)分布的區(qū)別很小;n 100時,t分布基本與標準正態(tài)分布相同;n時,t 分布與標準正態(tài)分布完全一致。,t分布的概率分布函數(shù)為: (4-28) 因而t在區(qū)間(t1,+)取值的概率右尾概率為1-F t (df)。由于t分布左右對稱,t在區(qū)間(-,-t1)取值的概率也為1-F t (df)。 于是 t 分布 曲線 下由-到- t 1和由t 1到+ 兩 個 相 等 的 概 率 之和兩尾概率為2(1-F t (df)。對于不同自由度下t分布的兩尾概率及其對應的臨界t

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論