江西財經(jīng)大學(xué)統(tǒng)計學(xué)第六章 抽樣分布_第1頁
江西財經(jīng)大學(xué)統(tǒng)計學(xué)第六章 抽樣分布_第2頁
江西財經(jīng)大學(xué)統(tǒng)計學(xué)第六章 抽樣分布_第3頁
江西財經(jīng)大學(xué)統(tǒng)計學(xué)第六章 抽樣分布_第4頁
江西財經(jīng)大學(xué)統(tǒng)計學(xué)第六章 抽樣分布_第5頁
已閱讀5頁,還剩25頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

STAT

第六章抽樣和抽樣分布統(tǒng)計實例STAT統(tǒng)計實例

1.稱重問題:某養(yǎng)豬場廠共有存欄生豬10萬頭,現(xiàn)欲了解這批生豬的平均毛重;

2.選舉活動:每個候選人的支持率是多少;

3.生產(chǎn)活動:產(chǎn)品不合格率是多少;

4.環(huán)境保護:污染區(qū)域、污染程度如何;

5.市場研究:產(chǎn)品品種、價格和質(zhì)量狀況;消費者的購買力狀況。統(tǒng)計調(diào)查:全面調(diào)查、非全面調(diào)查。本章將引入“抽樣推斷”的基本內(nèi)容(怎么抽、抽多少、如何推斷),這將節(jié)省人們的各種資源,并達到對客觀對象的最佳認識。第六章抽樣和抽樣分布STAT本章重點

1.統(tǒng)計推斷的基本概念

2.抽樣分布

3.抽樣標準差的意義及計算

本章難點

1.樣本均值(比率)的抽樣分布第六章抽樣和抽樣分布STAT第一節(jié)統(tǒng)計推斷的基本概念一、統(tǒng)計推斷

從樣本數(shù)據(jù)得到總體結(jié)論的過程就叫做統(tǒng)計推斷。統(tǒng)計推斷的方法:參數(shù)估計、假設(shè)檢驗→運用概率估計的方法。

統(tǒng)計推斷的理論:大數(shù)定律和中心極限定理。

統(tǒng)計推斷的效果:抽樣誤差可以計算并控制。二、總體與樣本三、總體參數(shù)與樣本統(tǒng)計量第六章抽樣和抽樣分布STAT

[例]某養(yǎng)豬場共有存欄生豬10萬頭,現(xiàn)欲了解這批生豬的平均毛重及健康比例。調(diào)查者按隨機原則從中抽取了100頭生豬進行調(diào)查,以計算其平均毛重和健康比例。

(一)總體參數(shù):反映總體特征的變量。

(二)樣本統(tǒng)計量:反映樣本特征的變量。樣本的隨機性決定統(tǒng)計量的隨機性(統(tǒng)計量是隨機變量)。注意:分母是多少?第六章抽樣和抽樣分布STAT

■為什么樣本方差和標準差計算公式的分母是n-1而不是n呢?解釋:在計算樣本方差中,n個偏差x1-,…,xn-有一個約束條件∑(x-)=0,即只有n-1個偏差可以自由取值,剩下的一個偏差由他們確定,所以自由度為n-1。

因為樣本標準差(S)是總體標準差的估計值,但只有在用n減去1的情況下才是無偏估計。把分母減去1會使得標準差大于實際的標準差。為什么要這樣做呢?因為好的統(tǒng)計學(xué)家、科學(xué)家一般都是保守的。保守的含義是,如果我們不得不出錯,我們出錯也是由于過高估計了總體的標準差。除以較小的分母可以讓我們做到這一點。主要針對小樣本?。ㄒ娤卤恚┑诹鲁闃雍统闃臃植糞TAT樣本規(guī)模公式中分子的數(shù)值總體標準差的有偏估計(除以n)總體標準差的無偏估計(除以n-1)兩者之差105007.077.450.381005002.242.250.0110005000.70710.70750.0004第六章抽樣和抽樣分布STAT三、簡單隨機抽樣(simplerandomsamplingSRS)抽樣組織形式:簡單隨機抽樣,分層(類型)抽樣,系統(tǒng)(機械)抽樣,整群抽樣,多階段抽樣(一)抽樣組織第六章抽樣和抽樣分布STAT(二)抽樣方式

1.重復(fù)抽樣(回置抽樣)[例]總體5人年齡:1,2,3,4,5。按重復(fù)抽樣隨機抽取3人。

Xi(可能結(jié)果)xi(實際結(jié)果)概率第一次抽樣1,2,3,4,5

21/5回置第二次抽樣1,2,3,4,5

51/5回置第三次抽樣1,2,3,4,5

21/5回置[例]N=3人(A、B、C)

n=2。①A、A;②A、B;③A、C;④B、A;⑤B、B;⑥B、C;⑦C、A;⑧C、B;⑨C、C。

★樣本可能數(shù)目:M=Nn

★樣本產(chǎn)生概率=1/Nn

獨立同分布的SRS樣本第六章抽樣和抽樣分布STAT

2.不重復(fù)抽樣(不回置或不重置抽樣)[例]總體年齡為:1,2,3,4,5。按不重復(fù)抽樣從中抽取3人。

Xi(可能結(jié)果)xi(實際結(jié)果)概率第一次抽樣1,2,3,4,521/5外置

第二次抽樣1,3,4,551/4外置

第三次抽樣1,3,431/3外置[例]N=3人(A、B、C)n=2①A、B;②A、C;③B、A;④B、C;⑤C、A;⑥C、B?!飿颖究赡軘?shù)目:

M=

N!/(N–n)!★樣本產(chǎn)生概率=(N–n)!/N!第六章抽樣和抽樣分布STAT第二節(jié)抽樣分布※一、統(tǒng)計誤差的種類

1.登記性誤差:各種主客觀原因所導(dǎo)致的誤差。

2.代表性誤差(1)系統(tǒng)偏差:破壞隨機原則而引起的誤差。

(2)抽樣誤差(samplingerror):隨機取樣,由于樣本與總體結(jié)構(gòu)的差異而導(dǎo)致的偶然性誤差。第六章抽樣和抽樣分布STAT二、抽樣分布的概念1.總體分布:總體變量的取值及出現(xiàn)概率所形成的分布。

[例]總體三人(A、B、C)的年齡為1,2,3。N=32.樣本分布:樣本觀測值的分布→包含總體信息和特征的多少取決于樣本容量。

→經(jīng)驗分布第六章抽樣和抽樣分布STAT

3.抽樣分布:樣本統(tǒng)計量的取值及其出現(xiàn)概率的分布。

→理論分布

抽樣分布的形成:抽樣分布的影響因素:總體分布、樣本容量、抽樣方法、抽樣組織形式、統(tǒng)計量構(gòu)造[例]n=2,計算樣本平均年齡。第六章抽樣和抽樣分布STAT三、抽樣分布的數(shù)字特征(一)樣本均值的數(shù)字特征→探討樣本均值的期望值和標準差與總體均值及標準差之間的關(guān)系

1.重復(fù)抽樣[例]總體三人(A、B、C)的年齡為1,2,3。N=3

n=2,計算樣本平均年齡。第六章抽樣和抽樣分布STAT

(2)樣本均值的標準差(抽樣標準差)★

定義:樣本均值與其期望值的平均離差?!闃悠骄`差

抽樣實際誤差?

抽樣極限誤差?

作用:衡量抽樣分布的離散程度,反映樣本統(tǒng)計量的代表性?!闃訕藴什钤酱螅ㄐ。?,抽樣分布越離散(集中),樣本的代表性平均而言越差(越好)。第六章抽樣和抽樣分布STAT[計算]N=3人,(A,B,C)=(1,2,3)n=2

無法計算;未顯示與總體的關(guān)系!第六章抽樣和抽樣分布STAT

2.不重復(fù)抽樣

無法計算;未顯示與總體的關(guān)系!第六章抽樣和抽樣分布STAT歸納

1.樣本均值的期望值等于總體均值。

2.樣本均值的標準差:樣本均值與其期望值的平均離差。第六章抽樣和抽樣分布STAT(二)樣本比例的數(shù)字特征

1.樣本比例的期望值等于總體比例。

2.樣本比例的標準差:樣本比例與其期望值的平均離差。第六章抽樣和抽樣分布STAT

四、中心極限定理

■設(shè)X是具有期望值為、方差為2的任意總體,則樣本均值的抽樣分布,將隨著n的增大而趨于正態(tài)分布,即

■當樣本容量很大且nP≥5、n(1-P)≥5時,可將樣本比例的抽樣分布近似看成正態(tài)分布。第六章抽樣和抽樣分布STAT五、正態(tài)分布的標準化

1.正態(tài)分布的定義身高

1401501601701801900.50.40.30.20.1頻率第六章抽樣和抽樣分布STAT調(diào)整:“頻率密度”(頻率/組距)“頻率”;身高

140150160170180190頻率密度0.050.040.030.020.01P{150X180}=0.90當n無窮大,折線?

直方或折線覆蓋下的面積=?第六章抽樣和抽樣分布STAT[概率計算的思路]身高

1401501601701801900.050.040.030.020.01f(xi)f(x):概率密度函數(shù)第六章抽樣和抽樣分布STAT

正態(tài)分布的定義:

如果隨機變量X的密度函數(shù)為X

μf(x)則稱X服從正態(tài)分布,記作X~N(μ,σ2

)2.正態(tài)分布的特征正態(tài)分布是依賴于μ和σ的一簇分布,其位置和形狀隨μ和σ的不同而不同,這給研究具體的正態(tài)總體帶來困難。第六章抽樣和抽樣分布STAT

3.標準正態(tài)分布

[直線研究]表達式:y=a+bxXY第六章抽樣和抽樣分布STAT一般正態(tài)分布的標準化:

x1x2-Z0ZX第六章抽樣和抽樣分布STAT

標準正態(tài)分布的作用:

■標準正態(tài)分布在正態(tài)分布中形式簡單,且任意正態(tài)分布的概率都可化為標準正態(tài)分布來計算。

■人們根據(jù)標準正態(tài)分布的分布函數(shù)編制了正態(tài)分布表,可直接查用。

標準正態(tài)分布幾種常用的概率:(必須熟記!)P(-1≤Z<1)=0.6826→68.26%P(-1.645≤Z<1.645)=0.90→90%P(-1.96≤Z<1.96)=0.95→95%P(-2≤Z<2)=0.9545→95.45%P(-3≤Z<3)=0.9973→99.73%第六章抽樣和抽樣分布STAT

[例]假定學(xué)生某門學(xué)科的考試成績服從均值為60分、標準差為12分的正態(tài)分布。那么某一學(xué)生的成績在60分到75分之間的概率應(yīng)為多少?(標準正態(tài)分布表)

x1x2-Z0Z第六章抽樣和抽樣分布STAT本章小結(jié):

■從總體中抽取一個特定的樣本,我們不知道這個樣本與總體分布的關(guān)系(樣本均值和標準差與總體均值及標準差之間的關(guān)系),但我們可以知道抽樣分布與總體分布的關(guān)系,即所有可能樣本均值的期望值和標準差與總體均值及標準差之

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論