![區(qū)間估計與假設檢驗_第1頁](http://file4.renrendoc.com/view/0a97f2cfb3248d50eb07d1103cff149c/0a97f2cfb3248d50eb07d1103cff149c1.gif)
![區(qū)間估計與假設檢驗_第2頁](http://file4.renrendoc.com/view/0a97f2cfb3248d50eb07d1103cff149c/0a97f2cfb3248d50eb07d1103cff149c2.gif)
![區(qū)間估計與假設檢驗_第3頁](http://file4.renrendoc.com/view/0a97f2cfb3248d50eb07d1103cff149c/0a97f2cfb3248d50eb07d1103cff149c3.gif)
![區(qū)間估計與假設檢驗_第4頁](http://file4.renrendoc.com/view/0a97f2cfb3248d50eb07d1103cff149c/0a97f2cfb3248d50eb07d1103cff149c4.gif)
![區(qū)間估計與假設檢驗_第5頁](http://file4.renrendoc.com/view/0a97f2cfb3248d50eb07d1103cff149c/0a97f2cfb3248d50eb07d1103cff149c5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
區(qū)間估計與假設檢驗第1頁,課件共89頁,創(chuàng)作于2023年2月3.1區(qū)間估計與假設檢驗的基本概念3.1.1區(qū)間估計3.1.2假設檢驗第2頁,課件共89頁,創(chuàng)作于2023年2月3.1.1區(qū)間估計1.點估計和區(qū)間估計參數(shù)的估計方法主要有兩種:點估計和區(qū)間估計。點估計是用樣本的觀測值估計總體未知參數(shù)的值。由于樣本的隨機性,不同樣本觀測值計算得出的參數(shù)的估計值間存在著差異,因此常用一個區(qū)間估計總體的參數(shù),并把具有一定可靠性和精度的估計區(qū)間稱為置信區(qū)間。利用構(gòu)造的統(tǒng)計量及樣本觀測值,計算得出參數(shù)的置信區(qū)間的方法稱為參數(shù)的區(qū)間估計。第3頁,課件共89頁,創(chuàng)作于2023年2月2.參數(shù)的置信區(qū)間在區(qū)間估計中,對于總體的未知參數(shù)θ,需要求出兩個統(tǒng)計量θ1(X1,X2,...,Xn)和θ2(X1,X2,...,Xn)來分別估計總體參數(shù)θ的上限和下限,使得總體參數(shù)在區(qū)間(θ1,θ2)內(nèi)的概率為P{θ1<θ<θ2}=1–α
其中1–α稱為置信水平,而(θ1,θ2)稱為θ的置信區(qū)間,θ1,θ2分別稱為置信下限和置信上限。置信水平為1–α的含義是隨機區(qū)間(θ1,θ2)以1–α的概率包含了參數(shù)θ。第4頁,課件共89頁,創(chuàng)作于2023年2月3.正態(tài)總體均值和方差的置信區(qū)間參數(shù)的區(qū)間估計大多是對正態(tài)總體的參數(shù)進行估計,如對單總體均值、方差的估計、兩總體均值差的估計和兩總體方差比的估計等。正態(tài)總體參數(shù)的各種置信區(qū)間見表3-1。被估參數(shù)條件樞軸量及其分布參數(shù)的置信區(qū)間單正態(tài)總體μ2已知2未知2μ已知μ未知第5頁,課件共89頁,創(chuàng)作于2023年2月正態(tài)總體參數(shù)的各種置信區(qū)間見表3-1。
其中被估參數(shù)條件樞軸量及其分布參數(shù)的置信區(qū)間兩正態(tài)總體μ1-μ2兩樣本獨立,12,22已知兩樣本獨立,12=22=2
未知兩樣本獨立,μ1,
μ2未知第6頁,課件共89頁,創(chuàng)作于2023年2月4.總體比例與比例差的置信區(qū)間實際應用中經(jīng)常需要對總體比例進行估計,如產(chǎn)品的合格率、大學生的就業(yè)率和手機的普及率等。記π和P分別表示總體比例和樣本比例,則當樣本容量n很大時(一般當nP和n(1–P)均大于5時,就可以認為樣本容量足夠大),樣本比例P的抽樣分布可用正態(tài)分布近似??傮w比例與比例差的置信區(qū)間如表3-2所示。待估參數(shù)樞軸量及其分布參數(shù)的置信區(qū)間總體比例π兩總體比例差π1-π2其中P1,P2為兩個樣本比例
第7頁,課件共89頁,創(chuàng)作于2023年2月3.1.2假設檢驗1.假設檢驗的基本原理對總體參數(shù)進行假設檢驗時,首先要給定一個原假設H0,H0是關(guān)于總體參數(shù)的表述,與此同時存在一個與H0相對立的備擇假設H1,H0與H1有且僅有一個成立;經(jīng)過一次抽樣,若發(fā)生了小概率事件(通常把概率小于0.05的事件稱為小概率事件),可以依據(jù)“小概率事件在一次實驗中幾乎不可能發(fā)生”的理由,懷疑原假設不真,作出拒絕原假設H0,接受H1的決定;反之,若小概率事件沒有發(fā)生,就沒有理由拒絕H0,從而應作出拒絕H1的決定。第8頁,課件共89頁,創(chuàng)作于2023年2月2.假設檢驗的步驟
1)根據(jù)問題確立原假設H0和備選假設H1;
2)確定一個顯著水平,它是衡量稀有性(小概率事件)的標準,常取為0.05;
3)選定合適的檢驗用統(tǒng)計量W(通常在原假設中相等成立時,W的分布是已知的),根據(jù)W的分布及的值,確定H0的拒絕域。
4)由樣本觀測值計算出統(tǒng)計量W的觀測值W0,如果W0落入H0的拒絕域,則拒絕H0;否則,不能拒絕原假設H0。第9頁,課件共89頁,創(chuàng)作于2023年2月注意:在SAS系統(tǒng)中,是由樣本觀測值計算出統(tǒng)計量W的觀測值W0和衡量觀測結(jié)果極端性的p值(p值就是當原假設成立時得到樣本觀測值和更極端結(jié)果的概率),然后比較p和作判斷:p<,拒絕原假設H0;p,不能拒絕原假設H0。第10頁,課件共89頁,創(chuàng)作于2023年2月
p值通常由下面公式計算而得到。●p=P{|W|≥|W0|}=2P{W≥|W0|}
(拒絕域為兩邊對稱的區(qū)域時)●p=min{P{W≥W0},P{W
W0}}
(拒絕域為兩邊非對稱區(qū)域時)●p=P{W≥W0}(拒絕域為右邊區(qū)域時)●p=P{W
W0}(拒絕域為左邊區(qū)域時)只需根據(jù)SAS計算出的p值,就可以在指定的顯著水平下,作出拒絕或不能拒絕原假設的決定。第11頁,課件共89頁,創(chuàng)作于2023年2月3.正態(tài)總體均值和方差的假設檢驗對正態(tài)總體的參數(shù)進行假設檢驗是假設檢驗的重要內(nèi)容,如對單總體均值、方差的檢驗、兩總體均值之差的檢驗和兩總體方差比的檢驗等。正態(tài)總體參數(shù)的各種檢驗方法見下表3-3至表3-5。表3-3單正態(tài)總體N(μ,2)均值μ的檢驗法檢驗名稱條件檢驗類別H0H1檢驗統(tǒng)計量分布拒絕域Z檢驗已知雙邊檢驗μ=μ0μ≠μ0N(0,1)|Z|≥Zα/2左邊檢驗μ≥μ0μ<μ0Z≤-Zα右邊檢驗μ≤μ0μ>μ0Z≥Zαt檢驗未知雙邊檢驗μ=μ0μ≠μ0t(n–1)|t|≥tα/2(n
–1)左邊檢驗μ≥μ0μ<μ0t≤–
tα(n
–1)右邊檢驗μ≤μ0μ>μ0t≥tα(n
–1)第12頁,課件共89頁,創(chuàng)作于2023年2月表3-4單正態(tài)總體N(μ,2)方差2的檢驗法或檢驗名稱條件檢驗類別H0H1檢驗統(tǒng)計量分布拒絕域χ2檢驗μ已知雙邊檢驗左邊檢驗右邊檢驗μ未知雙邊檢驗左邊檢驗右邊檢驗第13頁,課件共89頁,創(chuàng)作于2023年2月表3-5兩正態(tài)總體的均值差與方差比的檢驗名稱條件類別H0H1檢驗統(tǒng)計量分布拒絕域Z檢驗兩樣本獨立,12=22=2未知雙邊檢驗μ1-μ2=0μ1-μ2≠0t(n1+n2
–2)左邊檢驗μ1-μ20μ1-μ2<0右邊檢驗μ1-μ20μ1-μ2>0t檢驗成對匹配樣本,12,22未知雙邊檢驗μd=0μd≠0左邊檢驗μd0μd<0右邊檢驗μd0μd>0F檢驗兩樣本獨立,μ1,μ2未知雙邊檢驗F(n1–1,n2–1)左邊檢驗右邊檢驗第14頁,課件共89頁,創(chuàng)作于2023年2月4.總體比例與比例差的檢驗當樣本容量n很大時,可根據(jù)表3-6對總體比例與比例差進行假設檢驗。表3-6總體比例與比例差的檢驗檢驗名稱檢驗類別H0H1檢驗統(tǒng)計量分布拒絕域比例檢驗雙邊檢驗
=0
0N(0,1)|z|
zα/2左邊檢驗
0
<0|z|≤–zα右邊檢驗
0
>0|z|
zα兩總體比例差檢驗雙邊檢驗1
=21
2N(0,1)|z|
zα/2左邊檢驗1
21<2|z|≤–zα右邊檢驗1
21>2|z|
zα第15頁,課件共89頁,創(chuàng)作于2023年2月3.2總體均值的區(qū)間估計與假設檢驗的SAS實現(xiàn)3.2.1使用INSIGHT模塊3.2.2使用“分析家”3.2.3使用TTEST過程第16頁,課件共89頁,創(chuàng)作于2023年2月3.2.1使用INSIGHT模塊1.總體均值的區(qū)間估計【例3-1】某藥材生產(chǎn)商要對其倉庫中的1000箱藥材的平均重量進行估計,藥材重量的總體方差未知,隨機抽取16箱樣本稱重后結(jié)果如表3-7所示。表3-716箱藥材重量(單位:千克)設藥材重量數(shù)據(jù)存放于數(shù)據(jù)集Mylib.yczl中,其中重量變量名為weight。求該倉庫中每箱藥材平均重量在95%置信水平下的置信區(qū)間。50505651495347525353495355485055第17頁,課件共89頁,創(chuàng)作于2023年2月步驟如下:
1)啟動INSIGHT模塊,并打開數(shù)據(jù)集Mylib.yczl;
2)選擇菜單“Analyze”→“Distribution(Y)”;
3)在打開的“Distribution(Y)”對話框中進行區(qū)間估計的設置(如圖)。
第18頁,課件共89頁,創(chuàng)作于2023年2月結(jié)果包括一個名為“95%ConfidenceIntervals(95%置信區(qū)間)”的列表,表中給出了均值、標準差、方差的估計值(Parameter)、置信下限(LCL)和置信上限(UCL),如圖3-2所示。結(jié)果表明,根據(jù)抽樣樣本,該倉庫中藥材的平均重量以95%的可能性位于50.08千克至52.92千克之間。第19頁,課件共89頁,創(chuàng)作于2023年2月2.單樣本總體均值的假設檢驗【例3-2】一家食品廠以生產(chǎn)袋裝食品為主,每天的產(chǎn)量大約為8000袋,每袋重量規(guī)定為100克。為了分析每袋重量是否符合要求,質(zhì)檢部門經(jīng)常進行抽檢。現(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了25袋,測得每袋重量如表3-8所示。表3-825袋食品的重量(單位:克)試從抽檢的樣本數(shù)據(jù)出發(fā),檢驗變量WEIGHT的均值與100克是否有顯著差異。假定表3-8數(shù)據(jù)存放在數(shù)據(jù)集Mylib.spzl中,重量變量名為WEIGHT。112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3第20頁,課件共89頁,創(chuàng)作于2023年2月設變量WEIGHT的均值為μ,問題是希望通過樣本數(shù)據(jù)檢驗變量WEIGHT均值的如下假設:
H0:μ=100, H1:μ
100。使用INSIGHT對均值進行檢驗的步驟如下:
1)首先啟動INSIGHT,并打開數(shù)據(jù)集Mylib.spzl;
2)選擇菜單“Analyze”→“Distribution(Y)”;
3)在打開的“Distribution(Y)”對話框中選定分析變量WEIGHT;
4)單擊“OK”按鈕,得到變量的描述性統(tǒng)計量;第21頁,課件共89頁,創(chuàng)作于2023年2月
5)選擇菜單“Tables(表)”→“TestsforLocation(位置檢驗)”;在彈出的“TestsforLocation”對話框中輸入100,單擊“OK”按鈕得到輸出結(jié)果如圖所示。
第22頁,課件共89頁,創(chuàng)作于2023年2月結(jié)果顯示,觀測值不等于100克的觀測有24個,其中19個觀測值大于100。圖中第一個檢驗為t檢驗(Student'st),需要假定變量服從正態(tài)分布,檢驗的p值為0.0105,這個檢驗在0.05水平下是顯著的,所以可認為均值與100克有顯著差異。第二個檢驗(Sign)是叫做符號檢驗的非參數(shù)檢驗,其p值為0.0066,在0.05水平下也是顯著的,結(jié)論不變。第三個檢驗(SgnedRank)是叫做符號秩檢驗的非參數(shù)檢驗,其p值為0.0048,在0.05水平下是顯著的,結(jié)論不變。第23頁,課件共89頁,創(chuàng)作于2023年2月3.兩樣本總體均值的比較:成對匹配樣本在INSIGHT中比較成對樣本均值是否顯著差異,可以計算兩變量的差值變量,再檢驗差值變量的均值是否顯著為0?!纠?-3】由10名學生組成一個隨機樣本,讓他們分別采用A和B兩套試卷進行測試,結(jié)果如表3-9所示。表3-910名學生兩套試卷的成績試從樣本數(shù)據(jù)出發(fā),分析兩套試卷是否有顯著差異。試卷A78637289914968768555試卷B71446184745155607739差值71911517-21316816第24頁,課件共89頁,創(chuàng)作于2023年2月步驟如下:
1)首先生成差值變量:啟動INSIGHT,并打開數(shù)據(jù)集Mylib.sjcj。選擇菜單“Edit”→“Variables”→“Other”,打開“EditVariables”對話框,選擇A為Y變量,B為X變量,然后選擇變換(Transformation):Y–X,如圖,生成新的差值變量d;
第25頁,課件共89頁,創(chuàng)作于2023年2月2)然后對變量d的均值做如下假設:
H0:μd=0, H1:μd
0。
3)選擇菜單“Analyze”→“Distribution(Y)”;在打開的“Distribution(Y)”對話框中選定分析變量:選擇變量差值d,單擊“Y”按鈕,將變量d移到右上方的列表框中;4)單擊“Output”按鈕,在打開的對話框中選中“TestsforLocation(位置檢驗)”復選框;5)兩次單擊“OK”按鈕,得到變量的描述性統(tǒng)計量;第26頁,課件共89頁,創(chuàng)作于2023年2月
6)選擇菜單“Tables(表)”→“TestsforLocation(位置檢驗)”;在彈出的“TestsforLocation”對話框中輸入0,單擊“OK”按鈕得到輸出結(jié)果如圖所示。結(jié)果顯示三個檢驗的結(jié)論都是p值小于0.05,所以應拒絕原假設,即總體的均值與0有顯著差異。所以兩套試卷有顯著差異。雖然SAS給出三個檢驗結(jié)果,其實作結(jié)論時只需其中一個。如果可以認為分析變量服從正態(tài)分布只要看t檢驗結(jié)果;否則只須看符號秩檢驗結(jié)果。只有在數(shù)據(jù)為兩兩比較的大小結(jié)果而沒有具體數(shù)值時符號檢驗才有用。第27頁,課件共89頁,創(chuàng)作于2023年2月3.2.2使用“分析家”1.總體均值的置信區(qū)間【例3-4】在“分析家”中求例3-1中每箱藥材平均重量在95%置信水平下的置信區(qū)間。步驟如下:
1)在“分析家”模塊中打開數(shù)據(jù)集Mylib.yczl;
2)選擇菜單“Statistics(統(tǒng)計)”→“HypothesisTests(假設檢驗)”→“OneSamplet–testforaMean(單樣本均值t-檢驗)”;
3)在打開的“OneSamplet–testforaMean”對話框中設置均值的置信區(qū)間(如圖3-6)。第28頁,課件共89頁,創(chuàng)作于2023年2月
3)在打開的“OneSamplet–testforaMean”對話框中設置均值的置信區(qū)間(如圖3-6)。結(jié)果表明(下圖),根據(jù)抽樣樣本,該倉庫中藥材的平均重量以95%的可能性位于50.08千克至52.92千克之間。
第29頁,課件共89頁,創(chuàng)作于2023年2月2.單樣本總體均值的假設檢驗【例3-5】使用“分析家”檢驗例3-2中食品重量是否符合要求。希望通過樣本數(shù)據(jù)檢驗變量WEIGHT均值的如下假設:
H0:μ=100, H1:μ
100。由于此時的方差未知,所以使用t檢驗法。步驟如下:
1)在“分析家”中打開數(shù)據(jù)集Mylib.spzl;
2)選擇菜單“Statistics(統(tǒng)計)”→“HypothesisTests(假設檢驗)”→“OneSamplet–testforaMean(單樣本均值t-檢驗)”,打開“OneSamplet–testforaMean”對話框;第30頁,課件共89頁,創(chuàng)作于2023年2月
4)按圖3-8所示設置均值檢驗,單擊“OK”按鈕,得到結(jié)果如圖左所示。;
顯示結(jié)果(圖右)表明t統(tǒng)計量的p值為0.0105<0.05,所以拒絕原假設,即認為總體的均值不等于100。第31頁,課件共89頁,創(chuàng)作于2023年2月3.兩樣本總體均值的比較:成對匹配樣本【例3-6】使用“分析家”對例3-3中兩套試卷檢驗有無顯著差異。這是一個(成對匹配)雙樣本均值檢驗問題,若μ1和μ2分別表示兩套試卷的平均成績,則檢驗的是:
H0:μ1–μ2=0, H1:μ1–μ2
0;分析步驟如下:1)在“分析家”中打開數(shù)據(jù)集Mylib.sjdf;2)選擇菜單“Statistics(統(tǒng)計)”→“HypothesisTests(假設檢驗)”→“TwoSamplePairedt-TestforaMean(均值的成對雙樣本t-檢驗)”;第32頁,課件共89頁,創(chuàng)作于2023年2月
3)在打開的“TwoSamplePairedt-TestforaMean”對話框中,按圖左所示設置雙樣本均值檢驗,單擊“OK”按鈕,得到結(jié)果如圖右所示結(jié)果顯示,無論兩總體的方差是否相等,t統(tǒng)計量的p值=0.0005<0.05,所以在95%的置信水平下,拒絕原假設,兩總體的均值有顯著差異。結(jié)果表明可以95%的把握認為兩套試卷有顯著差異。第33頁,課件共89頁,創(chuàng)作于2023年2月4.兩樣本總體均值的比較:獨立樣本【例3-7】為估計兩種方法組裝產(chǎn)品所需時間的差異,分別對兩種不同的組裝方法各隨機安排一些個工人進行操作試驗,每個工人組裝一件產(chǎn)品所需的時間如表3-10所示。試以95%的置信水平推斷兩種方法組裝產(chǎn)品所需平均時間有無差異。表3-10兩種方法組裝產(chǎn)品所需的時間(單位:分鐘)
這是一個(獨立)兩樣本均值檢驗問題,若μ1和μ2分別表示兩種方法組裝一件產(chǎn)品所需的平均時間,則檢驗的是:H0:μ1–μ2=0,H1:μ1–μ2
0;方法128.330.129.037.632.128.836.037.238.534.428.030.0方法227.622.231.033.820.030.231.726.032.031.2第34頁,課件共89頁,創(chuàng)作于2023年2月假定表3-10數(shù)據(jù)存放在數(shù)據(jù)集Mylib.zzcpsj中,將兩個樣本中被比較均值的變量的觀測值記在同一分析變量F下,不同的樣本用一個分類變量g的不同值加以區(qū)分,而且分類變量g只能取兩個值,否則無法進行。分析步驟如下:1)在“分析家”中打開數(shù)據(jù)集Mylib.zzcpsj;2)選擇菜單“Statistics(統(tǒng)計)”→“HypothesisTests(假設檢驗)”→“TwoSamplet-TestforMean(兩樣本均值的t-檢驗)”;第35頁,課件共89頁,創(chuàng)作于2023年2月
3)在打開的“TwoSamplet-TestforaMean”對話框中,按圖3-12所示設置雙樣本均值檢驗,單擊“OK”按鈕,得到結(jié)果如圖3-13所示
結(jié)果顯示,由于t統(tǒng)計量的p值=0.0433,所以在95%的置信水平下,應該拒絕原假設,即兩種方法所需時間有差異。表明有95%的把握認為兩種方法所需時間有差異。第36頁,課件共89頁,創(chuàng)作于2023年2月3.2.3使用TTEST過程TTEST過程可以執(zhí)行單樣本均值的t檢驗、配對數(shù)據(jù)的t檢驗以及雙樣本均值比較的t檢驗。1.語法格式PROCTTEST<選項列表>;
[CLASS<分組變量名>;][VAR<分析變量名列表>;][PAIED<變量名列表>;][BY<分組變量名>;]RUN;其中,PROCTTEST和RUN語句是必須的,其余語句都是可選的,而且可調(diào)換順序。第37頁,課件共89頁,創(chuàng)作于2023年2月
CLASS語句所指定的分組變量是用來進行組間比較的;而BY語句所指定的分組變量是用來將數(shù)據(jù)分為若干個更小的樣本,以便SAS分別在各小樣本內(nèi)進行各自獨立的處理。
VAR語句引導要檢驗的所有變量列表,SAS將對VAR語句所引導的所有變量分別進行組間均值比較的t檢驗。第38頁,課件共89頁,創(chuàng)作于2023年2月PAIED語句用來指定配對t檢驗中要進行比較的變量對,其后所帶的變量名列表一般形式及其產(chǎn)生的效果見表3-11。表3-11選項及其含義變量名列表形式產(chǎn)生的效果a*ba–ba*bc*da–b,c–d(ab)*(cd)a–c,a–d,b–c,b–d(ab)*(cb)a–c,a–b,b–c第39頁,課件共89頁,創(chuàng)作于2023年2月
PROCTTEST語句后可跟的選項及其表示的含義如表3-12所示。表3-12選項及其含義選項代表的含義data=等號后為SAS數(shù)據(jù)集名,指定ttest過程所要處理的數(shù)據(jù)集,默認值為最近處理的數(shù)據(jù)集alpha=等號后為0~1之間的任何值,指定置信水平,默認為0.05ci=等號后為“equal,umpu,none”中的一個,表示標準差的置信區(qū)間的顯示形式,默認為ci=equalcochran有此選項時,ttest過程對方差不齊時的近似t檢驗增加cochran近似法h0=等號后為任意實數(shù),表示檢驗假設中對兩均值差值的設定,默認值為0第40頁,課件共89頁,創(chuàng)作于2023年2月2.總體均值的置信區(qū)間【例3-8】仍然考慮例3-3中的樣本數(shù)據(jù)。假定其中數(shù)據(jù)使用如下數(shù)據(jù)步存放在數(shù)據(jù)集sjcj中,兩套試卷得分的變量名分別為A和B。datasjcj;inputAB@@;cards;7871634472618984917449516855766085775539;run;第41頁,課件共89頁,創(chuàng)作于2023年2月【例3-8】仍然考慮例3-3中的樣本數(shù)據(jù)。假定其中數(shù)據(jù)使用如下數(shù)據(jù)步存放在數(shù)據(jù)集sjcj中,兩套試卷得分的變量名分別為A和B。使用最簡代碼求均值、標準差的置信區(qū)間:procttestdata=sjcj;run;
代碼運行結(jié)果給出兩個變量在95%置信水平下的均值、標準差的置信區(qū)間,以及對原假設μ0=0所作的t檢驗的p值,如圖所示。第42頁,課件共89頁,創(chuàng)作于2023年2月3.單樣本總體均值的假設檢驗在例3-8中增加原假設選項以及置信水平,代碼如下:procttesth0=70alpha=0.01data=sjcj;varA;run;代碼運行結(jié)果除了給出變量A在99%置信水平下的均值、標準差的置信區(qū)間外,還給出對假設μ0=70,所作的t-檢驗的p值,如圖3-15所示。結(jié)果顯示t統(tǒng)計量的p值=0.5734,不能拒絕(57.34%的把握)原假設:均值=70。第43頁,課件共89頁,創(chuàng)作于2023年2月4.配對兩樣本均值的假設檢驗在例3-8中檢驗兩套試卷有無顯著差異,代碼如下:procttestdata=sjcj;pairedA*B;run;
代碼運行結(jié)果給出了對原假設μ1–μ2=0所作的t檢驗的p值,如圖3-16所示。結(jié)果顯示t統(tǒng)計量的p值=0.0005<0.05,因此拒絕原假設。說明兩套試卷有顯著差異。第44頁,課件共89頁,創(chuàng)作于2023年2月5.獨立兩樣本均值的假設檢驗過程TTEST還可以用于進行獨立雙樣本均值比較的t檢驗法。它的用法為PROCTTESTDATA=<數(shù)據(jù)集名>;CLASS<分組變量名>;VAR<分析變量名列>;RUN;
使用這一格式要求將兩個樣本中被比較均值的變量的觀測值記在同一分析變量下,不同的樣本用另一個分類變量的不同值加以區(qū)分,而且分類變量只能取兩個值,否則將報錯。第45頁,課件共89頁,創(chuàng)作于2023年2月【例3-9】仍然考慮例3-7中的樣本數(shù)據(jù)。假定其中數(shù)據(jù)使用如下數(shù)據(jù)步存放在數(shù)據(jù)集zzcpsj中:datazzcpsj;inputfg$@@;cards;28.3127.6230.1122.2229131237.6133.8232.1120228.8130.2236131.7237.2126238.5132234.4131.22281301;run;第46頁,課件共89頁,創(chuàng)作于2023年2月將兩批工人的測量結(jié)果看作兩個樣本,但其數(shù)據(jù)都放在一個數(shù)據(jù)集之中,所需的時間值是記錄在同一分析變量f之下,而兩種方法的差別是由變量g的值加以區(qū)分的,所以g可作為分類變量。檢驗代碼如下:procttestdata=zzcpsj;classg;varf;run;檢驗結(jié)果如圖所示。第47頁,課件共89頁,創(chuàng)作于2023年2月在檢驗中,先看其最后關(guān)于方差等式的檢驗結(jié)果,檢驗方差相等是用的F'統(tǒng)計量,其數(shù)值為1.29,相應的p值為0.6779>0.05=α,所以不能拒絕方差相等的假設。在方差相等的前提下,檢驗均值差異使用Pooled方法,對應統(tǒng)計量的t值為2.16,相應的p值為0.0433<0.05=α,所以兩種方法所需的時間是有顯著差異的。在異方差的情況下,使用Satterthwaite法檢驗均值的差異。第48頁,課件共89頁,創(chuàng)作于2023年2月3.3總體比例的區(qū)間估計與假設檢驗的SAS實現(xiàn)3.3.1總體比例的置信區(qū)間3.3.2單樣本總體比例的假設檢驗3.3.3兩總體比例的比較第49頁,課件共89頁,創(chuàng)作于2023年2月3.3.1總體比例的置信區(qū)間【例3-10】2004年底北京市私家車擁有量已達到129.8萬輛,位居全國之首,據(jù)業(yè)內(nèi)人士分析其中國產(chǎn)中低檔汽車的比例較大,為了估計目前北京市場個人購車的平均價格,調(diào)查人員于某日在北京最大的車市隨機抽取36位私人消費購車者,得到他們所購汽車的價格,見下表。表3-13年底購車價格(單位:萬元)根據(jù)以上調(diào)查數(shù)據(jù),試以95%的置信水平推斷該地區(qū)購買私家車在15萬元以上的消費者占有的比例。6.8811.2819.9813.610.614.86.8811.7820.9824.412.314.86.8813.6813.630.314.614.88.2814.9814.79.614.617.49.615.6815.89.612.95.3810.1815.6820.510.614.87.38第50頁,課件共89頁,創(chuàng)作于2023年2月設購車價格數(shù)據(jù)存放在數(shù)據(jù)集Mylib.gcjg中,價格變量名為price。這是一個單樣本比例的區(qū)間估計問題。由于在SAS中只能對兩水平的分類變量作比例的區(qū)間估計與檢驗,所以首先要按變量price生成一個新的分類變量。步驟如下:
1)在“分析家”中打開數(shù)據(jù)集Mylib.gcjg;
2)選擇主菜單“Edit(編輯)”→“Mode(模式)”→“Edit(編輯)”,使數(shù)據(jù)集可以被編輯(修改);第51頁,課件共89頁,創(chuàng)作于2023年2月
3)選擇主菜單“Data(數(shù)據(jù))”→“Transform(變換)”→“RecodeRanges(重編碼范圍)”,打開“RecodeRangesInformation”對話框并按圖3-18(左)設置有關(guān)內(nèi)容;
4)單擊“OK”按鈕,打開“RecodeRanges”對話框,按圖3-18右所示生成新變量price_f;
第52頁,課件共89頁,創(chuàng)作于2023年2月
6)選擇菜單“Statistics(統(tǒng)計)”→“HypothesisTests(假設檢驗)”→“OneSampleTestforaProportion(單樣本比例檢驗)”;
7)在打開的“OneSampleTestforaProportion”對話框中,按圖3-19設置比例的置信區(qū)間。
第53頁,課件共89頁,創(chuàng)作于2023年2月分析結(jié)果中包括變量的置信區(qū)間:按95%的置信水平變量price取值為“>15”的比例在區(qū)間(0.109,0.391)范圍中(如圖3-20),即可以95%的概率估計該地區(qū)所購買車輛在15萬元以上的消費者所占比例在10.9%~39.1%之間。第54頁,課件共89頁,創(chuàng)作于2023年2月3.3.2單樣本總體比例的假設檢驗【例3-11】考慮例3-10中的數(shù)據(jù),試檢驗總體中購買車輛在15萬元以上者所占比例是否超過30%。這是一個單樣本比例檢驗問題,若表示總體中購買車輛在15萬元以上者所占比例,則檢驗的是:
H0:≥0.3, H1:
<0.3;第55頁,課件共89頁,創(chuàng)作于2023年2月步驟如下:
1)選擇菜單“Statistics”→“HypothesisTests”→“OneSampleTestforaProportion”,打開并按圖左設置“OneSampleTestforaProportion”對話框;檢驗結(jié)果如圖右所示。第56頁,課件共89頁,創(chuàng)作于2023年2月
顯示的結(jié)果表明樣本中購買車輛在15萬元以上者的比例為25%,檢驗用的Z統(tǒng)計量的p值為0.2563>0.05,所以不能拒絕原假設。結(jié)果表明購買車輛在15萬元以上者所占比例在95%的置信水平下超過30%。第57頁,課件共89頁,創(chuàng)作于2023年2月3.3.3兩總體比例的比較【例3-12】2004年底很多類型的國產(chǎn)轎車價格都比年中有所下降,為了對比2004年底與年中私家購車族購車價格的差異,在年中新購車者中隨機抽取32人,調(diào)查得到的價格數(shù)據(jù)如表3-14。表3-14年中購車價格(單位:萬元):綜合表3-13與表3-14的調(diào)查數(shù)據(jù),試以95%的置信水平推斷該地區(qū)年底與年中購買私家車在15萬元以上的消費者占有比例有無差異。5.3810.7812.8814.718.8830.37.3811.213.61519.9815.287.9811.7813.6515.820.59.999.3811.7814.615.920.989.3610.312.314.71724.48.9911.3810.28第58頁,課件共89頁,創(chuàng)作于2023年2月這是一個雙樣本比例檢驗問題,若1和2分別表示總體中年底和年中購買私家車在15萬元以上的消費者所占的比例,則檢驗的是假設:
H0:1–2=0, H1:1–2
0;首先將3-7與表3-8的調(diào)查數(shù)據(jù)存入一個數(shù)據(jù)集Mylib.gcjgQ中,價格變量名為price,使用變量period以區(qū)別年中數(shù)據(jù)(2)與年底數(shù)據(jù)(1)。按例3-10中的步驟由price生成兩水平分類變量price_F。圖3-23所示即為數(shù)據(jù)集Mylib.gcjgQ中的部分數(shù)據(jù)。第59頁,課件共89頁,創(chuàng)作于2023年2月然后,對上面假設進行檢驗,步驟如下:1)在分析家中打開數(shù)據(jù)集Mylib.gcjgQ后,選擇菜單“Statistics”→“HypothesisTests”→“TwoSampleTestforProportion(雙樣本比例檢驗)”,在對話框中,按圖左設置雙樣本比例檢驗,分析結(jié)果如圖右所示。結(jié)果顯示,由于Z統(tǒng)計量的p值為0.5664,所以在95%的置信水平下,不能拒絕原假設。即該地區(qū)2004年底與年中私家購車價格在15萬元以上者所占比例無明顯差異。第60頁,課件共89頁,創(chuàng)作于2023年2月3.4總體方差的區(qū)間估計與假設檢驗的SAS實現(xiàn)3.4.1總體方差的置信區(qū)間3.4.2單樣本總體方差的假設檢驗3.4.3兩樣本總體方差的比較第61頁,課件共89頁,創(chuàng)作于2023年2月3.4.1總體方差的置信區(qū)間【例3-13】表3-15所示為某中學1980年模擬高考數(shù)學的部分學生成績,試估計本次模擬考試成績的方差。表3-15部分學生成績假定表3-15數(shù)據(jù)存放在數(shù)據(jù)集Mylib.kscj中,成績變量名為score。分析步驟如下:
1)在“分析家”中打開數(shù)據(jù)集Mylib.kscj;
2)選擇菜單“Statistics(統(tǒng)計)”→“HypothesisTests(假設檢驗)”→“OneSampleTestforaVariance(方差的單樣本檢驗)”;100969690921001009099921009810097979594100第62頁,課件共89頁,創(chuàng)作于2023年2月
3)在打開的“OneSampleTestforaVariance”對話框中設置方差的置信區(qū)間(如圖3-26)。分析結(jié)果中包括方差的置信區(qū)間估計,如圖3-27所示。結(jié)果表明,本次模擬考試成績方差在置信水平95%下的置信區(qū)間為(7.1692,28.614)。
第63頁,課件共89頁,創(chuàng)作于2023年2月3.4.2單樣本總體方差的假設檢驗【例3-14】考慮例3-13中的模擬考試成績,檢驗考試成績是否太集中。這是一個單樣本方差檢驗問題,若表示總體方差,則檢驗的是:
H0:2≤52, H1:2>52;步驟如下:
1)選擇菜單“Statistics”→“HypothesisTests”→“OneSampleTestforaVariance(單樣本方差檢驗)”,打開“OneSampleTestforaVariance”對話框并按圖設置;
2)單擊“OK”按鈕,得到結(jié)果。第64頁,課件共89頁,創(chuàng)作于2023年2月結(jié)果(圖左)顯示,樣本方差為12.732,由于2檢驗的p值=0.9504,所以不能拒絕方差≤25的原假設。結(jié)果表明有95%的把握可以認為該模擬考試的成績太過集中。第65頁,課件共89頁,創(chuàng)作于2023年2月3.4.3兩樣本總體方差的比較【例3-15】已知兩只股票深發(fā)展(000001)和萬科A(000002)在2004年6月21個交易日的收益率如表3-16所示。試在0.05的顯著水平下判斷深發(fā)展的風險是否高于萬科A?表3-16深發(fā)展和萬科A在2004年6月21個交易日的收益率day深發(fā)展萬科Aday深發(fā)展萬科Aday深發(fā)展萬科A200406010.00310.009920040610-0.00220.004120040621-0.00220.0131200406020.0301-0.01372004061100.002200406220.00330.02820040603-0.0231-0.013920040614-0.0209-0.012320040623-0.0066-0.014720040604-0.00820.006200406150.04610.018620040624-0.01440.008520040607-0.0228-0.00820040616-0.0097-0.00220040625-0.0056-0.012720040608-0.02230.00220040617-0.0228-0.042820040628-0.05190.004320040609-0.0109-0.0202200406180.0111-0.0255200406290.02260.0319第66頁,課件共89頁,創(chuàng)作于2023年2月這是一個雙樣本方差檢驗問題,若1和2分別表示深發(fā)展和萬科A兩只股票收益率的方差,則檢驗的是:
H0:1≥2, H1:1<2;檢驗步驟如下:
1)首先,將表3-8中的數(shù)據(jù)生成數(shù)據(jù)集mylib.gupiao,深發(fā)展和萬科的收益率可以用同一變量表示,另加一個分類變量以區(qū)別;也可用兩個變量表示,如分別用s和w表示。本例用第二種方法。第67頁,課件共89頁,創(chuàng)作于2023年2月
2)在分析家中打開數(shù)據(jù)集mylib.gupiao后,選擇菜單“Statistics”→“HypothesisTests”→“Two-SampleTestforVariance(雙樣本方差檢驗)”,打開“Two-SampleTestforVariance”對話框并按圖左設置;單擊“OK”按鈕,得到分析結(jié)果。
結(jié)果顯示(圖右),在0.05的顯著性水平下不能拒絕原假設,說明深發(fā)展的股票風險要高于萬科A。第68頁,課件共89頁,創(chuàng)作于2023年2月3.5分布檢驗3.5.1數(shù)據(jù)的分布研究3.5.2在INSIGHT模塊中研究分布3.5.3在“分析家”中研究分布3.5.4使用UNIVARIATE過程第69頁,課件共89頁,創(chuàng)作于2023年2月3.5.1數(shù)據(jù)的分布研究1.分布擬合圖由于密度直方圖中矩形的面積是數(shù)據(jù)落入對應區(qū)間中的頻率,根據(jù)大數(shù)定理,數(shù)據(jù)量很大時,頻率近似于概率。所以,如果數(shù)據(jù)來自一個具有概率密度f(x)的連續(xù)型隨機變量,密度直方圖就可以作為概率密度f(x)的一個估計。第70頁,課件共89頁,創(chuàng)作于2023年2月直方圖頂端的形態(tài)為折線,而常用的一些分布的密度曲線如正態(tài)分布等都是光滑曲線,所謂分布擬合圖就是在限定的參數(shù)分布類中通過對參數(shù)的估計,用估計得到的參數(shù)所對應的密度曲線去擬合直方圖頂部的形態(tài)。圖3-31所示為分布擬合圖,左圖為正態(tài)分布擬合圖,右圖為對數(shù)正態(tài)分布擬合圖。
第71頁,課件共89頁,創(chuàng)作于2023年2月在SAS系統(tǒng)中提供的參數(shù)分布類型有:正態(tài)(Normal)分布—最為常用的分布、對數(shù)正態(tài)(Lognormal)分布、指數(shù)分布、Gamma分布、Weibull分布,它們的分布密度分別為:
1)參數(shù)為(μ,)的正態(tài)分布
2)參數(shù)為(,μ,)的對數(shù)正態(tài)分布
第72頁,課件共89頁,創(chuàng)作于2023年2月
3)參數(shù)為(,)的指數(shù)分布的密度為
4)參數(shù)為(,c,)的指數(shù)分布的密度為
5)參數(shù)為(,α,)的Gamma分布的密度為
6)參數(shù)為(,c,)的Weibull分布的密度為第73頁,課件共89頁,創(chuàng)作于2023年2月2.QQ圖不論密度直方圖還是分布擬合圖,要從圖上鑒別數(shù)據(jù)的分布是否近似于某種類別的分布是較困難的。QQ圖可以幫助我們方便地鑒別數(shù)據(jù)的分布是否近似于某種類型的分布。
QQ圖是一種散點圖。對應于正態(tài)分布的QQ圖由點構(gòu)成,其橫坐標為標準正態(tài)分布的分位數(shù),縱坐標x(i)(i=1,2,…,n)是將x1,…,xn從小到大排序后的數(shù)列,為總體i/n分位點的估計。若觀測數(shù)據(jù)近似正態(tài)分布N(μ,2),則QQ圖上這些點近似在直線y=x+μ附近。第74頁,課件共89頁,創(chuàng)作于2023年2月圖3-32所示為居民家庭收入情況的QQ圖,分別為對應于正態(tài)分布與對數(shù)正態(tài)分布的QQ圖。
要利用QQ圖鑒別樣本數(shù)據(jù)是否近似于正態(tài)分布,只需看QQ圖上的點是否近似地在一條直線附近,該直線的斜率為標準差,截距為均值。同樣,也可以作對應于對數(shù)正態(tài)分布、指數(shù)分布、Gamma分布、Weibull分布的QQ圖,以鑒別樣本數(shù)據(jù)是否來自某一類型的總體分布。
第75頁,課件共89頁,創(chuàng)作于2023年2月3.5.2在INSIGHT模塊中研究分布1.繪制分布擬合圖【例3-16】在INSIGHT模塊中繪制居民家庭收入情況(參見例2-1)的分布擬合圖。選擇菜單“Analyze”→“Distribution(Y)”,打開“Distribution(Y)”對話框并按如圖3-33所示設置。
第76頁,課件共89頁,創(chuàng)作于2023年2月
圖3-34參數(shù)估計對話框與income變量的密度擬合圖變量Income的密度擬合圖和參數(shù)密度估計如圖3-34右與圖3-35所示。圖3-35income變量的參數(shù)密度估計
第77頁,課件共89頁,創(chuàng)作于2023年2月2.繪制QQ圖如果在圖3-33右所示的“Distribution(Y)”對話框中選中“NormalQQPlot(正態(tài)QQ
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中子、電子及Γ輻照裝置合作協(xié)議書
- 2025年機載設備綜合測試臺合作協(xié)議書
- 2025年石材翻新護理用品合作協(xié)議書
- 建筑力學期末考試B卷試題及答案
- 2025年個人貨物運輸協(xié)議模板(2篇)
- 2025年個人房屋設計裝修合同(4篇)
- 2025年五年級體育教師工作總結(jié)(5篇)
- 2025年儀器銷售合同標準版本(4篇)
- 2025年五年級語文備課組長工作總結(jié)范文(二篇)
- 2025年二手車車輛轉(zhuǎn)讓合同簡單版(2篇)
- DB43-T 2142-2021學校食堂建設與食品安全管理規(guī)范
- 宏觀利率篇:債券市場研究分析框架
- 橋梁頂升移位改造技術(shù)規(guī)范
- 六年級語文(上冊)選擇題集錦
- 介紹人提成方案
- 天津在津居住情況承諾書
- PHOTOSHOP教案 學習資料
- 初中數(shù)學教學“教-學-評”一體化研究
- 2012年安徽高考理綜試卷及答案-文檔
- 《游戲界面設計專題實踐》課件-知識點5:圖標繪制準備與繪制步驟
- 自動扶梯安裝過程記錄
評論
0/150
提交評論