第四章、參數(shù)估計與假設(shè)檢驗_第1頁
第四章、參數(shù)估計與假設(shè)檢驗_第2頁
第四章、參數(shù)估計與假設(shè)檢驗_第3頁
第四章、參數(shù)估計與假設(shè)檢驗_第4頁
第四章、參數(shù)估計與假設(shè)檢驗_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、大多數(shù)汽車事故出在中等速度行駛中,極少的事故時是出在大于150公里/每小時的行駛速度上。這是否意味著高速行駛比較安全?2、在亞利桑那州死于肺結(jié)核的人比其他州多。這是否意味著亞利桑那州的氣候容易使人患肺結(jié)核?3、常常聽說,汽車事故多發(fā)生在離家不遠的地方,這是否意味著在離家很遠的公路上行駛要比在城里安全呢?4、注重口味的人,想來應(yīng)該是喜歡現(xiàn)煮咖啡超過即溶咖啡的。一位持懷疑態(tài)度的人斷言:喝咖啡的人里,只有一半偏好現(xiàn)煮咖啡。為證明此結(jié)論,讓全部50個受試對象都品嘗兩杯沒有做記號的咖啡,并且要說出喜歡哪一杯。兩杯中一杯為先煮咖啡,一杯為即溶咖啡,實驗結(jié)果表明50位受試對象中,有36位選現(xiàn)煮咖啡。這是否意味著有72%的人喜歡現(xiàn)煮咖啡,或超過一半的人喜歡現(xiàn)煮咖啡。以上結(jié)論的正確與否均需要通過統(tǒng)計檢驗來證明,本章討論的內(nèi)容就是如何利用樣本信息,對統(tǒng)計結(jié)論正確與否作出判斷的程序。案例分析本章重難點(1)掌握參數(shù)估計的基本原理(2)了解參數(shù)估計量好壞的評價標準(3)掌握參數(shù)估計的一般方法(4)了解假設(shè)檢驗的基本思想(5)掌握各種條件下檢驗統(tǒng)計量的構(gòu)建(6)掌握列聯(lián)表分析的原理和應(yīng)用第四章參數(shù)估計與假設(shè)檢驗管理科學(xué)與工程學(xué)院工業(yè)工程系劉志平點估計是根據(jù)樣本資料給出總體參數(shù)的單一估計值,直接以樣本估計量作為相應(yīng)總體參數(shù)的估計值的一種參數(shù)估計方法。點估計的優(yōu)點是比較簡便,而且進行點估計時無需知道總體分布。點估計的缺點是通過此方法所得的估計值與真值之間的偏差以及估計的可靠性均未知。4.1點估計

樣本統(tǒng)計量是一個隨機變量,不同的樣本會得到不同的估計量。為了保證用于估計總體指標估計量的準確可靠,需要通過一些標準來衡量所求的估計量是否為優(yōu)良估計量。常用的標準主要有無偏性、有效性和相合性等。4.1點估計

估計量的數(shù)學(xué)期望等于被估計的總體指標,就稱該估計量為無偏估計量。設(shè)總體指標為

,其估計量為,如果有:

就是

的無偏估計量。是

的無偏估計量;

的無偏估計量。4.1點估計(無偏性)

設(shè)都是參數(shù)的無偏估計量,若

則稱估計量比有效。設(shè)是的估計量,當n趨近于無窮大時,對于任意的ε>0,有

則稱是的一致估計量。4.1點估計(有效性和相合性)

區(qū)間估計就是根據(jù)樣本估計量以一定可靠程度推斷總體參數(shù)所在的區(qū)間范圍。設(shè)總體參數(shù)為θ,為樣本確定的兩個統(tǒng)計量,對于給定的α,有:則稱為參數(shù)θ的置信度為1-α得置信區(qū)間。1-α為置信度,表示區(qū)間估計的可靠程度,即以1-α的可能性包含未知總體參數(shù)的區(qū)間為4.2區(qū)間估計

大樣本情形下總體均值的區(qū)間估計

當樣本容量足夠大,樣本均值使用正態(tài)分布統(tǒng)計量

進行估計,在1-的概率保證度下,總體均值的置信區(qū)間為:4.2區(qū)間估計(總體均值的區(qū)間估計)

4.2區(qū)間估計(總體均值的區(qū)間估計)

置信下限為置信上限為:這表明在95%的概率保證下,可認為該地區(qū)居民的平均年收入在5572.00元至5627.99元之間。4.2區(qū)間估計(總體均值的區(qū)間估計)

小樣本情形下正態(tài)總體均值的區(qū)間估計

(1)正態(tài)總體、方差已知當樣本容量足夠大,樣本均值使用正態(tài)分布統(tǒng)計量

進行估計,由于已知,在1-的概率保證度下,總體均值的置信區(qū)間為:4.2區(qū)間估計(總體均值的區(qū)間估計)

小樣本情形下正態(tài)總體均值的區(qū)間估計(2)正態(tài)總體、方差未知當方差是未知時,則采用修正樣本方差。若總體服從正態(tài)分布,可構(gòu)造t統(tǒng)計量,即

根據(jù)t分布的原理,在1-α的置信度下,可知總體均值μ的置信區(qū)間為:4.2區(qū)間估計(總體均值的區(qū)間估計)

例某倉庫有150箱食品,每箱食品均裝100個,隨機抽取10箱進行檢查,得每箱食品的變質(zhì)個數(shù)為:1,6,3,0,2,4,1,5,3,5,假定每箱食品變質(zhì)個數(shù)的概率分布為正態(tài)分布,給定置信概率95%,求平均每箱食品變質(zhì)個數(shù)的雙側(cè)置信區(qū)間。解:由于n=10,為小樣本,方差未知4.2區(qū)間估計(總體均值的區(qū)間估計)

4.2區(qū)間估計(總體均值的區(qū)間估計)

大樣本情形下,樣本比例

經(jīng)標準化變換可得給定的置信度1-,可得大樣本情形下總體比例的置信區(qū)間為:4.2區(qū)間估計(總體比例的區(qū)間估計)

4.2區(qū)間估計(總體比例的區(qū)間估計)

4.2區(qū)間估計(總體比例的區(qū)間估計)

什么是假設(shè)檢驗?(hypothesistest)先對總體的參數(shù)(或分布形式)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的統(tǒng)計方法有參數(shù)檢驗和非參數(shù)檢驗邏輯上運用反證法,統(tǒng)計上依據(jù)小概率原理小概率是在一次試驗中,一個幾乎不可能發(fā)生的事件發(fā)生的概率在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)4.3假設(shè)檢驗19步驟建立假設(shè),確定檢驗水準確定P值計算檢驗統(tǒng)計量作推斷結(jié)論拒絕H0,接受H1,認為差異有統(tǒng)計學(xué)意義P≤αP>α不拒絕H0,認為差異無統(tǒng)計學(xué)意義1、.假設(shè)檢驗的步驟第一步如何提出假設(shè)?什么是假設(shè)?

(hypothesis)在參數(shù)檢驗中,對總體參數(shù)的具體數(shù)值所作的陳述就一個總體而言,總體參數(shù)包括總體均值、比例、方差等分析之前必需陳述原假設(shè)

(nullhypothesis)又稱“0假設(shè)”,研究者想收集證據(jù)予以反對的假設(shè),用H0表示所表達的含義總是指參數(shù)沒有變化或變量之間沒有關(guān)系

最初被假設(shè)是成立的,之后根據(jù)樣本數(shù)據(jù)確定是否有足夠的證據(jù)拒絕它總是有符號=,<=

或>=H0:

m

=某一數(shù)值H0:

m

某一數(shù)值H0:m

某一數(shù)值也稱“研究假設(shè)”,研究者想收集證據(jù)予以支持的假設(shè),用H1或Ha表示所表達的含義是總體參數(shù)發(fā)生了變化或變量之間有某種關(guān)系備擇假設(shè)通常用于表達研究者自己傾向于支持的看法,然后就是想辦法收集證據(jù)拒絕原假設(shè),以支持備擇假設(shè)

總是有符號

,

或H1::m

≠某一數(shù)值H1:m

>某一數(shù)值H1:m

<某一數(shù)值備擇假設(shè)(alternativehypothesis)備擇假設(shè)沒有特定的方向性,并含有符號“”的假設(shè)檢驗,稱為雙側(cè)檢驗或雙尾檢驗(two-tailedtest)備擇假設(shè)具有特定的方向性,并含有符號“>”或“<”的假設(shè)檢驗,稱為單側(cè)檢驗或單尾檢驗(one-tailedtest)備擇假設(shè)的方向為“<”,稱為左側(cè)檢驗

備擇假設(shè)的方向為“>”,稱為右側(cè)檢驗

雙側(cè)檢驗與單側(cè)檢驗雙側(cè)檢驗與單側(cè)檢驗

(假設(shè)的形式)假設(shè)雙側(cè)檢驗單側(cè)檢驗左側(cè)檢驗右側(cè)檢驗原假設(shè)H0:m

=m0H0:m

m0H0:m

m0備擇假設(shè)H1:m

≠m0H1:m

<m0H1:m

>m0【例】一種零件的生產(chǎn)標準是直徑應(yīng)為10cm,為對生產(chǎn)過程進行控制,質(zhì)量監(jiān)測人員定期對一臺加工機床檢查,確定這臺機床生產(chǎn)的零件是否符合標準要求。如果零件的平均直徑大于或小于10cm,則表明生產(chǎn)過程不正常,必須進行調(diào)整。試陳述用來檢驗生產(chǎn)過程是否正常的原假設(shè)和被擇假設(shè)如何設(shè)定假設(shè)(例題分析)解:研究者想收集證據(jù)予以證明的假設(shè)應(yīng)該是“生產(chǎn)過程不正?!薄=⒌脑僭O(shè)和備擇假設(shè)為

H0:

10cmH1:

10cm【例】某品牌洗滌劑在它的產(chǎn)品說明書中聲稱:平均凈含量不少于500克。從消費者的利益出發(fā),有關(guān)研究人員要通過抽檢其中的一批產(chǎn)品來驗證該產(chǎn)品制造商的說明是否屬實。試陳述用于檢驗的原假設(shè)與備擇假設(shè)如何設(shè)定假設(shè)(例題分析)解:研究者抽檢的意圖是傾向于證實這種洗滌劑的平均凈含量并不符合說明書中的陳述。建立的原假設(shè)和備擇假設(shè)為

H0:

500H1:

<500【例】一家研究機構(gòu)估計,某城市中家庭擁有汽車的比例超過30%。為驗證這一估計是否正確,該研究機構(gòu)隨機抽取了一個樣本進行檢驗。試陳述用于檢驗的原假設(shè)與備擇假設(shè)如何設(shè)定假設(shè)(例題分析)解:研究者想收集證據(jù)予以支持的假設(shè)是“該城市中家庭擁有汽車的比例超過30%”。建立的原假設(shè)和備擇假設(shè)為

H0:

30%H1:

30%根據(jù)樣本觀測結(jié)果計算出對原假設(shè)和備擇假設(shè)做出決策某個樣本統(tǒng)計量對樣本估計量的標準化結(jié)果原假設(shè)H0為真點估計量的抽樣分布檢驗統(tǒng)計量(teststatistic)

標準化的檢驗統(tǒng)計量用統(tǒng)計量決策

(雙側(cè)檢驗)抽樣分布H0臨界值臨界值a/2a/2拒絕H0拒絕H01-置信水平RegionofRejectionRegionofNonrejectionRegionofRejection用統(tǒng)計量決策

(左側(cè)檢驗)抽樣分布H0臨界值a拒絕H01-置信水平RegionofRejectionRegionofNonrejection用統(tǒng)計量決策

(右側(cè)檢驗)抽樣分布H0臨界值2拒絕H01-置信水平RegionofNonrejectionRegionofRejection用P值決策

(P-value)如果原假設(shè)為真,所得到的樣本結(jié)果會像實際觀測結(jié)果那么極端或更極端的概率P值告訴我們:如果原假設(shè)是正確的話,我們得到得到目前這個樣本數(shù)據(jù)的可能性有多大,如果這個可能性很小,就應(yīng)該拒絕原假設(shè)被稱為觀察到的(或?qū)崪y的)顯著性水平?jīng)Q策規(guī)則:若p值<,拒絕H0雙側(cè)檢驗的P值/

2/

2Z拒絕H0拒絕H00臨界值計算出的樣本統(tǒng)計量計算出的樣本統(tǒng)計量臨界值1/2P值1/2P值左側(cè)檢驗的P值Z拒絕H00臨界值計算出的樣本統(tǒng)計量1/2P值右側(cè)檢驗的P值Z拒絕H00計算出的樣本統(tǒng)計量臨界值1/2P值4.4總體參數(shù)檢驗5.2.1單一總體均值的檢驗1、大樣本情形下總體均值的檢驗2、小樣本情形下正態(tài)總體均值的t檢驗總體均值的檢驗

(大樣本)1.假定條件:大樣本(n30)使用z檢驗統(tǒng)計量方差已知:方差未知:大樣本(例題)以往調(diào)查表明某市人均居住面積為8.6平方米,現(xiàn)從該市中隨機抽取500人,調(diào)查并計算得平均居住面積為8.8平方米,標準差為1.5平方米,問在0.01的顯著性水平下,能否認為該市人均居住面積有所增大?根據(jù)題意可建立原假設(shè)和備擇假設(shè)如下:總體均值的檢驗

(小樣本)1.假定條件總體服從正態(tài)分布小樣本(n<

30)檢驗統(tǒng)計量方差已知方差未知小樣本例題

例4.2某公司用自動裝袋機將一批食用鹽裝袋,在正常情況下,平均每袋的重量為500克,從某天所包裝的食用鹽中隨機抽取了10袋,測得每袋的重量(克)為:495,501,502,495,500,497,498,503,502,499,問在0.05的顯著性水平下,從所裝食用鹽的平均重量來看裝袋機運行是否正常?

根據(jù)題意可建立原假設(shè)和備擇假設(shè)如下:

4.4

兩總體參數(shù)檢驗兩總體均值比較的檢驗1、獨立樣本均值的檢驗2、配對樣本均值的檢驗

1、兩總體均值的檢驗1、獨立樣本均值的檢驗2008年8月兩個總體均值比較的檢驗

(獨立大樣本)1.假定條件兩個樣本是獨立的隨機樣本正態(tài)總體或非正態(tài)總體大樣本(n130和n230)檢驗統(tǒng)計量,已知:

未知:兩個總體均值之差的檢驗

(獨立小樣本:已知)假定條件兩個獨立的小樣本兩個總體都是正態(tài)分布已知檢驗統(tǒng)計量2008年8月兩個總體均值之差的檢驗

(獨立小樣本:未知但相等)假定條件兩個獨立的小樣本兩個總體都是正態(tài)分布12、22未知但相等,即12=22檢驗統(tǒng)計量其中:自由度:

2、兩總體均值比較的檢驗

例5.3為了研究男女性別消費支出的差異,從中某高校三年級學(xué)生中分別隨機抽取20人調(diào)查,調(diào)查并計算得,男生平均每月生活費支出為880元,標準差為60元,女生平均每月生活費支出為820元,標準差為54元,已知平均每月生活費支出均服從正態(tài)分布,且方差相等,給定顯著性水平0.05,能否認為男女生平均每月生活消費支出有顯著差異?

根據(jù)題意可建立原假設(shè)和備擇假設(shè)如下:應(yīng)拒絕原假設(shè),即認為男女性別不同,平均每月生活消費支出也有差異。

兩總體均值的檢驗1、配對樣本均值的檢驗如果比較的樣本有配對關(guān)系,就需要進行配對樣本的T檢驗,如同一組工作人員,在進行某種技能培訓(xùn)前后,測量其工作效率,培訓(xùn)前后的測量數(shù)據(jù)構(gòu)成配對樣本,在檢驗培訓(xùn)是否起作用時,就需進行配對樣本的T檢驗。兩個總體均值之差的檢驗

(配對樣本)假定條件兩個總體配對差值構(gòu)成的總體服從正態(tài)分布配對差是由差值總體中隨機抽取的

數(shù)據(jù)配對或匹配(重復(fù)測量(前/后))檢驗統(tǒng)計量樣本差值均值樣本差值標準差

總體參數(shù)檢驗

例5.4某企業(yè)為研究廣告對銷量的影響,選取了12個地區(qū),分別收集了廣告發(fā)布前后的周銷量(件)。問廣告的發(fā)布對銷量是否有顯著影響?根據(jù)題意可計算原假設(shè)和被擇假設(shè):

匹配樣本

(數(shù)據(jù)形式)

觀察序號樣本1樣本2差值1x11x21d1=x11-x212x12x22d2=x12-x22MMMMix1ix2idi

=x1i

-x2iMMMMnx1nx2ndn

=x1n-x2n

總體參數(shù)檢驗

地區(qū)編號廣告前銷量廣告后銷量差值d15560525558334748143842453032266865-3716204850533923285103634-21125272122322-1配對樣本調(diào)查表

幾種常見的假設(shè)檢驗總體均值的檢驗條件檢驗條件量拒絕域H0、H1(1)H0:μ=μ0H1:μ≠μ0

z(2)H0:μ=μ0H1:μ>μ0(3)H0:μ=μ0H1:μ<μz0z0正態(tài)總體σ2已知總體均值的檢驗條件檢驗條件量拒絕域H0、H1(1)H0:μ=μ0H1:μ≠μ0

z(2)H0:μ=μ0H1:μ>μ0(3)H0:μ=μ0H1:μ<μz0z00非正態(tài)總體n≥30σ2已知或未知總體均值的檢驗條件檢驗條件量拒絕域H0、H1(1)H0:μ=μ0H1:μ≠μ0

t(2)H0:μ=μ0H1:μ>μ0(3)H0:μ=μ0H1:μ<μt0t00正態(tài)總體σ2未知(n<30)兩個總體均值之差的檢驗條件檢驗條件量拒絕域H0、H1(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論