ch03-區(qū)間估計(jì)與假設(shè)檢驗(yàn)_第1頁(yè)
ch03-區(qū)間估計(jì)與假設(shè)檢驗(yàn)_第2頁(yè)
ch03-區(qū)間估計(jì)與假設(shè)檢驗(yàn)_第3頁(yè)
ch03-區(qū)間估計(jì)與假設(shè)檢驗(yàn)_第4頁(yè)
ch03-區(qū)間估計(jì)與假設(shè)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩96頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三章

區(qū)間估計(jì)與假設(shè)檢驗(yàn)武漢大學(xué)計(jì)算機(jī)學(xué)院區(qū)間估計(jì)與假設(shè)檢驗(yàn)3.1區(qū)間估計(jì)與假設(shè)檢驗(yàn)的基本概念3.2總體均值的區(qū)間估計(jì)與假設(shè)檢驗(yàn)的SAS實(shí)現(xiàn)3.3總體比例的區(qū)間估計(jì)與假設(shè)檢驗(yàn)的SAS實(shí)現(xiàn)3.4總體方差的區(qū)間估計(jì)與假設(shè)檢驗(yàn)的SAS實(shí)現(xiàn)3.5分布檢驗(yàn)3.1區(qū)間估計(jì)與假設(shè)檢驗(yàn)的基本概念利用樣本對(duì)總體進(jìn)行統(tǒng)計(jì)推斷,主要有二類問題參數(shù)估計(jì):根據(jù)樣本的統(tǒng)計(jì)量對(duì)總體的參數(shù)進(jìn)行估計(jì);假設(shè)檢驗(yàn):研究如何利用樣本的統(tǒng)計(jì)量來檢驗(yàn)事先對(duì)總體參數(shù)作的假設(shè)是否正確3.1.1區(qū)間估計(jì)3.1.2假設(shè)檢驗(yàn)3.1.1區(qū)間估計(jì)1.點(diǎn)估計(jì)和區(qū)間估計(jì)

參數(shù)的估計(jì)方法主要有兩種:點(diǎn)估計(jì)和區(qū)間估計(jì)。

點(diǎn)估計(jì)是用樣本的觀測(cè)值估計(jì)總體未知參數(shù)的值。由于樣本的隨機(jī)性,不同樣本觀測(cè)值計(jì)算得出的參數(shù)的估計(jì)值間存在著差異,因此常用一個(gè)區(qū)間估計(jì)總體的參數(shù),并把具有一定可靠性和精度的估計(jì)區(qū)間稱為置信區(qū)間。利用構(gòu)造的統(tǒng)計(jì)量及樣本觀測(cè)值,計(jì)算得出參數(shù)的置信區(qū)間的方法稱為參數(shù)的區(qū)間估計(jì)。正態(tài)分布的實(shí)例如果數(shù)據(jù)來自正態(tài)分布總體,則:68%的值落在距均值1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)95%的值落在距均值2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)99%的值落在距均值3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)

例如:由12歲女孩體重組成一個(gè)總體,這個(gè)總體服從均值為39公斤,標(biāo)準(zhǔn)差4.5公斤,則:

68%的值落在34.5~43.5公斤之間

95%的值落在30~48公斤之間

99%的值落在25.5~52.5公斤之間置信區(qū)間正態(tài)分布描述落入不同范圍的概率.例如,近似地有(“3

”原則):◆68%的數(shù)據(jù)落入以均值為中心一倍標(biāo)準(zhǔn)差的范圍內(nèi);◆95%的數(shù)據(jù)落入以均值為中心兩倍標(biāo)準(zhǔn)差的范圍內(nèi);◆99%的數(shù)據(jù)落入以均值為中心三倍標(biāo)準(zhǔn)差的范圍內(nèi);

若樣本均值的分布為正態(tài)的,當(dāng)構(gòu)造置信區(qū)間時(shí)就可用正態(tài)分布給定的概率,這一概率對(duì)應(yīng)于置信水平.所以,構(gòu)造一個(gè)95%的置信區(qū)間,這個(gè)置信區(qū)間就有95%的概率包括總體均值.95%就為置信水平.2.參數(shù)的置信區(qū)間在區(qū)間估計(jì)中,對(duì)于總體的未知參數(shù)θ,需要求出兩個(gè)統(tǒng)計(jì)量θ1(X1,X2,...,Xn)和θ2(X1,X2,...,Xn)來分別估計(jì)總體參數(shù)θ的上限和下限,使得總體參數(shù)在區(qū)間(θ1,θ2)內(nèi)的概率為P{θ1<θ<θ2}=1–α

其中1–α稱為置信水平,而(θ1,θ2)稱為θ的置信區(qū)間,θ1,θ2分別稱為置信下限和置信上限。置信水平為1–α的含義是:隨機(jī)區(qū)間(θ1,θ2)以1–α的概率包含了參數(shù)θ。3.正態(tài)總體均值和方差的置信區(qū)間參數(shù)的區(qū)間估計(jì)大多是對(duì)正態(tài)總體的參數(shù)進(jìn)行估計(jì),如對(duì)單總體均值、方差的估計(jì)、兩總體均值差的估計(jì)和兩總體方差比的估計(jì)等。正態(tài)總體參數(shù)的各種置信區(qū)間見表3-1。被估參數(shù)條件樞軸量及其分布參數(shù)的置信區(qū)間單正態(tài)總體μ2已知2未知2μ已知μ未知正態(tài)總體參數(shù)的各種置信區(qū)間見表3-1。

其中被估參數(shù)條件樞軸量及其分布參數(shù)的置信區(qū)間兩正態(tài)總體μ1-μ2兩樣本獨(dú)立,12,22已知兩樣本獨(dú)立,12=22=2

未知兩樣本獨(dú)立,μ1,

μ2未知4.總體比例與比例差的置信區(qū)間實(shí)際應(yīng)用中經(jīng)常需要對(duì)總體比例進(jìn)行估計(jì),如產(chǎn)品的合格率、大學(xué)生的就業(yè)率和手機(jī)的普及率等。記π和P分別表示總體比例和樣本比例,則當(dāng)樣本容量n很大時(shí)(一般當(dāng)nP和n(1–P)均大于5時(shí),就可以認(rèn)為樣本容量足夠大),樣本比例P的抽樣分布可用正態(tài)分布近似??傮w比例與比例差的置信區(qū)間如表3-2所示。待估參數(shù)樞軸量及其分布參數(shù)的置信區(qū)間總體比例π兩總體比例差π1-π2其中P1,P2為兩個(gè)樣本比例

3.1.2假設(shè)檢驗(yàn)情形一:“根據(jù)我們的檢驗(yàn),我們的產(chǎn)品缺陷率只有千分之一.”,從1000件產(chǎn)品中隨機(jī)抽了5件貨品,其中2個(gè)有質(zhì)量問題.你的結(jié)論?不可能->概率為0->小概率事件發(fā)生了->否定原假設(shè)情形二:“根據(jù)我們的檢驗(yàn),我們的產(chǎn)品缺陷率只有百分之一.”,從1000件產(chǎn)品中隨機(jī)抽了5件貨品,其中2個(gè)有質(zhì)量問題.你的結(jié)論?1)缺陷率肯定高于1%,不合要求;2)缺陷率確實(shí)只有1%,只是恰巧抽到有缺陷的.在原假設(shè)成立的條件下,如果計(jì)算出樣本所對(duì)應(yīng)的事件發(fā)生概率比較大,那么沒有理由拒絕原假設(shè);如果計(jì)算出樣本所對(duì)應(yīng)的事件發(fā)生概率比較小,即小概率事件發(fā)生了,依據(jù)小概率事件在一次試驗(yàn)中幾乎不會(huì)發(fā)生的原理,它在一次實(shí)驗(yàn)中是不應(yīng)該發(fā)生的??墒聦?shí)是,本來不該發(fā)生的事件卻在我們的實(shí)驗(yàn)中發(fā)生了。那么,只能說抽查結(jié)果不支持原假設(shè)中的論斷。假設(shè)檢驗(yàn)的基本思路反證法思想先假定“H0為真”,如果檢驗(yàn)中出現(xiàn)了不合理現(xiàn)象,則表明“H0為真”的假設(shè)是錯(cuò)誤的,應(yīng)該拒絕H0。如果檢驗(yàn)中未出現(xiàn)不合理現(xiàn)象,則表明“H0為真”的假設(shè)是正確的,應(yīng)該接受H0。小概率原理小概率事件在一次實(shí)驗(yàn)中幾乎不可能發(fā)生,如果小概率事件在一次實(shí)驗(yàn)中發(fā)生了,則有理由懷疑原假設(shè)的真實(shí)性,從而拒絕原假設(shè)。3.1.2假設(shè)檢驗(yàn)1.假設(shè)檢驗(yàn)的基本原理對(duì)總體參數(shù)進(jìn)行假設(shè)檢驗(yàn)時(shí),首先要給定一個(gè)原假設(shè)H0,H0是關(guān)于總體參數(shù)的表述,與此同時(shí)存在一個(gè)與H0相對(duì)立的備擇假設(shè)H1,H0與H1有且僅有一個(gè)成立;經(jīng)過一次抽樣,若發(fā)生了小概率事件(通常把概率小于0.05的事件稱為小概率事件),可以依據(jù)“小概率事件在一次實(shí)驗(yàn)中幾乎不可能發(fā)生”的理由,懷疑原假設(shè)不真,作出拒絕原假設(shè)H0,接受H1的決定;反之,若小概率事件沒有發(fā)生,就沒有理由拒絕H0,從而應(yīng)作出拒絕H1的決定。2.假設(shè)檢驗(yàn)的步驟

1)根據(jù)問題確立原假設(shè)H0和備選假設(shè)H1;

2)確定一個(gè)顯著水平,它是衡量稀有性(小概率事件)的標(biāo)準(zhǔn),常取為0.05;

3)選定合適的檢驗(yàn)用統(tǒng)計(jì)量W(通常在原假設(shè)中相等成立時(shí),W的分布是已知的),根據(jù)W的分布及的值,確定H0的拒絕域。

4)由樣本觀測(cè)值計(jì)算出統(tǒng)計(jì)量W的觀測(cè)值W0,如果W0落入H0的拒絕域,則拒絕H0;否則,不能拒絕原假設(shè)H0。注意:在SAS系統(tǒng)中,是由樣本觀測(cè)值計(jì)算出統(tǒng)計(jì)量W的觀測(cè)值W0和衡量觀測(cè)結(jié)果極端性的p值(p值就是當(dāng)原假設(shè)成立時(shí)得到樣本觀測(cè)值和更極端結(jié)果的概率),然后比較p和作判斷:p<,拒絕原假設(shè)H0;否則,不能拒絕原假設(shè)H0。3.正態(tài)總體均值和方差的假設(shè)檢驗(yàn)

對(duì)正態(tài)總體的參數(shù)進(jìn)行假設(shè)檢驗(yàn)是假設(shè)檢驗(yàn)的重要內(nèi)容,如對(duì)單總體均值、方差的檢驗(yàn)、兩總體均值之差的檢驗(yàn)和兩總體方差比的檢驗(yàn)等。正態(tài)總體參數(shù)的各種檢驗(yàn)方法見下表3-3至表3-5。表3-3單正態(tài)總體N(μ,2)均值μ的檢驗(yàn)法檢驗(yàn)名稱條件檢驗(yàn)類別H0H1檢驗(yàn)統(tǒng)計(jì)量分布拒絕域Z檢驗(yàn)σ2已知雙邊檢驗(yàn)μ=μ0μ≠μ0N(0,1)|Z|≥Zα/2左邊檢驗(yàn)μ≥μ0μ<μ0Z≤-Zα右邊檢驗(yàn)μ≤μ0μ>μ0Z≥Zαt檢驗(yàn)σ2未知雙邊檢驗(yàn)μ=μ0μ≠μ0t(n–1)|t|≥tα/2(n

–1)左邊檢驗(yàn)μ≥μ0μ<μ0t≤–

tα(n

–1)右邊檢驗(yàn)μ≤μ0μ>μ0t≥tα(n

–1)表3-4單正態(tài)總體N(μ,2)方差2的檢驗(yàn)法檢驗(yàn)名稱條件檢驗(yàn)類別H0H1檢驗(yàn)統(tǒng)計(jì)量分布拒絕域χ2檢驗(yàn)μ已知雙邊檢驗(yàn)左邊檢驗(yàn)右邊檢驗(yàn)μ未知雙邊檢驗(yàn)左邊檢驗(yàn)右邊檢驗(yàn)表3-5兩正態(tài)總體的均值差與方差比的檢驗(yàn)名稱條件類別H0H1檢驗(yàn)統(tǒng)計(jì)量分布拒絕域Z檢驗(yàn)兩樣本獨(dú)立,12=22=2未知雙邊檢驗(yàn)μ1-μ2=0μ1-μ2≠0t(n1+n2

–2)左邊檢驗(yàn)μ1-μ20μ1-μ2<0右邊檢驗(yàn)μ1-μ20μ1-μ2>0t檢驗(yàn)成對(duì)匹配樣本,12,22未知雙邊檢驗(yàn)μd=0μd≠0左邊檢驗(yàn)μd0μd<0右邊檢驗(yàn)μd0μd>0F檢驗(yàn)兩樣本獨(dú)立,μ1,μ2未知雙邊檢驗(yàn)F(n1–1,n2–1)左邊檢驗(yàn)右邊檢驗(yàn)4.總體比例與比例差的檢驗(yàn)當(dāng)樣本容量n很大時(shí),可根據(jù)表3-6對(duì)總體比例與比例差進(jìn)行假設(shè)檢驗(yàn)。表3-6總體比例與比例差的檢驗(yàn)檢驗(yàn)名稱檢驗(yàn)類別H0H1檢驗(yàn)統(tǒng)計(jì)量分布拒絕域比例檢驗(yàn)雙邊檢驗(yàn)

=0

0N(0,1)|z|

zα/2左邊檢驗(yàn)

0

<0|z|≤–zα右邊檢驗(yàn)

0

>0|z|

zα兩總體比例差檢驗(yàn)雙邊檢驗(yàn)1

=21

2N(0,1)|z|

zα/2左邊檢驗(yàn)1

21<2|z|≤–zα右邊檢驗(yàn)1

21>2|z|

zα3.2總體均值的區(qū)間估計(jì)與假設(shè)檢驗(yàn)的SAS實(shí)現(xiàn)3.2.1使用INSIGHT模塊3.2.2使用“分析家”3.2.3使用TTEST過程3.2.1使用INSIGHT模塊1.總體均值的區(qū)間估計(jì)【例3-1】某藥材生產(chǎn)商要對(duì)其倉(cāng)庫(kù)中的1000箱藥材的平均重量進(jìn)行估計(jì),藥材重量的總體方差未知,隨機(jī)抽取16箱樣本稱重后結(jié)果如表3-7所示。表3-716箱藥材重量(單位:千克)設(shè)藥材重量數(shù)據(jù)存放于數(shù)據(jù)集Mylib.yczl中,其中重量變量名為weight。求該倉(cāng)庫(kù)中每箱藥材平均重量在95%置信水平下的置信區(qū)間。50505651495347525353495355485055步驟如下:

1)啟動(dòng)INSIGHT模塊,并打開數(shù)據(jù)集Mylib.yczl;

2)選擇菜單“Analyze”→“Distribution(Y)”;

3)在打開的“Distribution(Y)”對(duì)話框中進(jìn)行區(qū)間估計(jì)的設(shè)置(如圖)。

結(jié)果包括一個(gè)名為“95%ConfidenceIntervals(95%置信區(qū)間)”的列表,表中給出了均值、標(biāo)準(zhǔn)差、方差的估計(jì)值(Parameter)、置信下限(LCL)和置信上限(UCL),如圖3-2所示。結(jié)果表明,根據(jù)抽樣樣本,該倉(cāng)庫(kù)中藥材的平均重量以95%的可能性位于50.08千克至52.92千克之間。2.單樣本總體均值的假設(shè)檢驗(yàn)【例3-2】一家食品廠以生產(chǎn)袋裝食品為主,每天的產(chǎn)量大約為8000袋,每袋重量規(guī)定為100克。為了分析每袋重量是否符合要求,質(zhì)檢部門經(jīng)常進(jìn)行抽檢?,F(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測(cè)得每袋重量如表3-8所示。表3-825袋食品的重量(單位:克)試從抽檢的樣本數(shù)據(jù)出發(fā),檢驗(yàn)變量WEIGHT的均值與100克是否有顯著差異。假定表3-8數(shù)據(jù)存放在數(shù)據(jù)集Mylib.spzl中,重量變量名為WEIGHT。112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3設(shè)變量WEIGHT的均值為μ,問題是希望通過樣本數(shù)據(jù)檢驗(yàn)變量WEIGHT均值的如下假設(shè):

H0:μ=100, H1:μ

100。使用INSIGHT對(duì)均值進(jìn)行檢驗(yàn)的步驟如下:

1)首先啟動(dòng)INSIGHT,并打開數(shù)據(jù)集Mylib.spzl;

2)選擇菜單“Analyze”→“Distribution(Y)”;

3)在打開的“Distribution(Y)”對(duì)話框中選定分析變量WEIGHT;

4)單擊“OK”按鈕,得到變量的描述性統(tǒng)計(jì)量;

5)選擇菜單“Tables(表)”→“TestsforLocation(位置檢驗(yàn))”;在彈出的“TestsforLocation”對(duì)話框中輸入100,單擊“OK”按鈕得到輸出結(jié)果如圖所示。

結(jié)果顯示,觀測(cè)值不等于100克的觀測(cè)有24個(gè),其中19個(gè)觀測(cè)值大于100。圖中第一個(gè)檢驗(yàn)為t檢驗(yàn)(Student‘st),需要假定變量服從正態(tài)分布,檢驗(yàn)的p值為0.0105,這個(gè)檢驗(yàn)在0.05水平下是顯著的,所以可認(rèn)為均值與100克有顯著差異。第二個(gè)檢驗(yàn)(Sign)是叫做符號(hào)檢驗(yàn)的非參數(shù)檢驗(yàn),其p值為0.0066,在0.05水平下也是顯著的,結(jié)論不變。第三個(gè)檢驗(yàn)(SignedRank)是叫做符號(hào)秩檢驗(yàn)的非參數(shù)檢驗(yàn),其p值為0.0048,在0.05水平下是顯著的,結(jié)論不變。3.兩樣本總體均值的比較:成對(duì)匹配樣本在INSIGHT中比較成對(duì)樣本均值是否顯著差異,可以計(jì)算兩變量的差值變量,再檢驗(yàn)差值變量的均值是否顯著為0?!纠?-3】由10名學(xué)生組成一個(gè)隨機(jī)樣本,讓他們分別采用A和B兩套試卷進(jìn)行測(cè)試,結(jié)果如表3-9所示。表3-910名學(xué)生兩套試卷的成績(jī)?cè)噺臉颖緮?shù)據(jù)出發(fā),分析兩套試卷是否有顯著差異。試卷A78637289914968768555試卷B71446184745155607739差值71911517-21316816

步驟如下:

1)首先生成差值變量:?jiǎn)?dòng)INSIGHT,并打開數(shù)據(jù)集Mylib.sjdf。選擇菜單“Edit”→“Variables”→“Other”,打開“EditVariables”對(duì)話框,選擇A為Y變量,B為X變量,然后選擇變換(Transformation):Y–X,如圖,生成新的差值變量d;

2)然后對(duì)變量d的均值做如下假設(shè):

H0:μd=0, H1:μd

0。

3)選擇菜單“Analyze”→“Distribution(Y)”;在打開的“Distribution(Y)”對(duì)話框中選定分析變量:選擇變量差值d,單擊“Y”按鈕,將變量d移到右上方的列表框中;

4)單擊“Output”按鈕,在打開的對(duì)話框中選中“TestsforLocation(位置檢驗(yàn))”復(fù)選框;

5)兩次單擊“OK”按鈕,得到變量的描述性統(tǒng)計(jì)量;

6)選擇菜單“Tables(表)”→“TestsforLocation(位置檢驗(yàn))”;在彈出的“TestsforLocation”對(duì)話框中輸入0,單擊“OK”按鈕得到輸出結(jié)果如圖所示。

結(jié)果顯示三個(gè)檢驗(yàn)的結(jié)論都是p值小于0.05,所以應(yīng)拒絕原假設(shè),即總體的均值與0有顯著差異。所以兩套試卷有顯著差異。雖然SAS給出三個(gè)檢驗(yàn)結(jié)果,其實(shí)作結(jié)論時(shí)只需其中一個(gè)。如果可以認(rèn)為分析變量服從正態(tài)分布只要看t檢驗(yàn)結(jié)果;否則只須看符號(hào)秩檢驗(yàn)結(jié)果。只有在數(shù)據(jù)為兩兩比較的大小結(jié)果而沒有具體數(shù)值時(shí)符號(hào)檢驗(yàn)才有用。正態(tài)分布檢驗(yàn)Insight下,“分布”菜單;選擇待分析變量,單擊”Y”按鈕;“輸出”按鈕-->”累積分布”-->”正態(tài)”-->”確定”概率值>0.05,接受原假設(shè)(該變量的總體分布與正態(tài)分布無顯著差異)3.2.2使用“分析家”1.總體均值的置信區(qū)間【例3-4】在“分析家”中求例3-1中每箱藥材平均重量在95%置信水平下的置信區(qū)間。步驟如下:

1)在“分析家”模塊中打開數(shù)據(jù)集Mylib.yczl;

2)選擇菜單“Statistics(統(tǒng)計(jì))”→“HypothesisTests(假設(shè)檢驗(yàn))”→“OneSamplet–testforaMean(單樣本均值t-檢驗(yàn))”;

3)在打開的“OneSamplet–testforaMean”對(duì)話框中設(shè)置均值的置信區(qū)間(如圖3-6)。

3)在打開的“OneSamplet–testforaMean”對(duì)話框中設(shè)置均值的置信區(qū)間(如圖3-6)。

結(jié)果表明(下圖),根據(jù)抽樣樣本,該倉(cāng)庫(kù)中藥材的平均重量以95%的可能性位于50.08千克至52.92千克之間。

2.單樣本總體均值的假設(shè)檢驗(yàn)【例3-5】使用“分析家”檢驗(yàn)例3-2中食品重量是否符合要求。希望通過樣本數(shù)據(jù)檢驗(yàn)變量WEIGHT均值的如下假設(shè):

H0:μ=100, H1:μ

100。由于此時(shí)的方差未知,所以使用t檢驗(yàn)法。步驟如下:

1)在“分析家”中打開數(shù)據(jù)集Mylib.spzl;

2)選擇菜單“Statistics(統(tǒng)計(jì))”→“HypothesisTests(假設(shè)檢驗(yàn))”→“OneSamplet–testforaMean(單樣本均值t-檢驗(yàn))”,打開“OneSamplet–testforaMean”對(duì)話框;

4)按圖3-8所示設(shè)置均值檢驗(yàn),單擊“OK”按鈕,得到結(jié)果如圖所示。;

T統(tǒng)計(jì)量抽樣的密度曲線顯示結(jié)果表明t統(tǒng)計(jì)量的p值為0.0105<0.05,所以拒絕原假設(shè),即認(rèn)為總體的均值不等于100。T統(tǒng)計(jì)量的橫坐標(biāo)落在陰影區(qū)域的范圍內(nèi),拒絕原假設(shè)3.兩樣本總體均值的比較:成對(duì)匹配樣本【例3-6】使用“分析家”對(duì)例3-3中兩套試卷檢驗(yàn)有無顯著差異。這是一個(gè)(成對(duì)匹配)雙樣本均值檢驗(yàn)問題,若μ1和μ2分別表示兩套試卷的平均成績(jī),則檢驗(yàn)的是:

H0:μ1–μ2=0, H1:μ1–μ2

0;分析步驟如下:

1)在“分析家”中打開數(shù)據(jù)集Mylib.sjdf;

2)選擇菜單“Statistics(統(tǒng)計(jì))”→“HypothesisTests(假設(shè)檢驗(yàn))”→“TwoSamplePairedt-TestforaMean(均值的成對(duì)雙樣本t-檢驗(yàn))”;

3)在打開的“TwoSamplePairedt-TestforaMean”對(duì)話框中,按圖所示設(shè)置雙樣本均值檢驗(yàn),單擊“OK”按鈕,得到結(jié)果如圖右所示

結(jié)果顯示,無論兩總體的方差是否相等,t統(tǒng)計(jì)量的p值=0.0005<0.05,所以在95%的置信水平下,拒絕原假設(shè),兩總體的均值有顯著差異。結(jié)果表明可以95%的把握認(rèn)為兩套試卷有顯著差異。4.兩樣本總體均值的比較:獨(dú)立樣本【例3-7】為估計(jì)兩種方法組裝產(chǎn)品所需時(shí)間的差異,分別對(duì)兩種不同的組裝方法各隨機(jī)安排一些工人進(jìn)行操作試驗(yàn),每個(gè)工人組裝一件產(chǎn)品所需的時(shí)間如表3-10所示。試以95%的置信水平推斷兩種方法組裝產(chǎn)品所需平均時(shí)間有無差異。表3-10兩種方法組裝產(chǎn)品所需的時(shí)間(單位:分鐘)

這是一個(gè)(獨(dú)立)兩樣本均值檢驗(yàn)問題,若μ1和μ2分別表示兩種方法組裝一件產(chǎn)品所需的平均時(shí)間,則檢驗(yàn)的是:

H0:μ1–μ2=0,H1:μ1–μ2

0;方法128.330.129.037.632.128.836.037.238.534.428.030.0方法227.622.231.033.820.030.231.726.032.031.2

假定表3-10數(shù)據(jù)存放在數(shù)據(jù)集Mylib.zzcpsj中,將兩個(gè)樣本中被比較均值的變量的觀測(cè)值記在同一分析變量F下,不同的樣本用一個(gè)分類變量g的不同值加以區(qū)分,而且分類變量g只能取兩個(gè)值,不能取>=3個(gè)的值,否則無法進(jìn)行。(現(xiàn)在學(xué)習(xí)的是二樣本的均值比較,而不是多樣本的比較呀?。?/p>

分析步驟如下:

1)在“分析家”中打開數(shù)據(jù)集Mylib.zzcpsj;

2)選擇菜單“Statistics(統(tǒng)計(jì))”→“HypothesisTests(假設(shè)檢驗(yàn))”→“TwoSamplet-TestforMean(兩樣本均值的t-檢驗(yàn))”;

3)在打開的“TwoSamplet-TestforaMean”對(duì)話框中,按圖3-12所示設(shè)置雙樣本均值檢驗(yàn),單擊“OK”按鈕,得到結(jié)果如圖3-13所示

結(jié)果顯示,由于t統(tǒng)計(jì)量的p值=0.0433,所以在95%的置信水平下,應(yīng)該拒絕原假設(shè),即兩種方法所需時(shí)間有差異。表明有95%的把握認(rèn)為兩種方法所需時(shí)間有差異。數(shù)據(jù)集用2個(gè)變量分別表示二種組裝方法所花時(shí)間時(shí),如何實(shí)現(xiàn)呢?3.2.3使用TTEST過程TTEST過程可以執(zhí)行單樣本均值的t檢驗(yàn)、配對(duì)數(shù)據(jù)的t檢驗(yàn)以及雙樣本均值比較的t檢驗(yàn)。1.語(yǔ)法格式PROCTTEST<選項(xiàng)列表>;

[CLASS<分組變量名>;][VAR<分析變量名列表>;][PAIED<變量名列表>;][BY<分組變量名>;]RUN;其中,PROCTTEST和RUN語(yǔ)句是必須的,其余語(yǔ)句都是可選的,而且可調(diào)換順序。

CLASS語(yǔ)句所指定的分組變量是用來進(jìn)行組間比較的;而BY語(yǔ)句所指定的分組變量是用來將數(shù)據(jù)分為若干個(gè)更小的樣本,以便SAS分別在各小樣本內(nèi)進(jìn)行各自獨(dú)立的處理。

VAR語(yǔ)句引導(dǎo)要檢驗(yàn)的所有變量列表,SAS將對(duì)VAR語(yǔ)句所引導(dǎo)的所有變量分別進(jìn)行組間均值比較的t檢驗(yàn)。

PAIED語(yǔ)句用來指定配對(duì)t檢驗(yàn)中要進(jìn)行比較的變量對(duì),其后所帶的變量名列表一般形式及其產(chǎn)生的效果見表3-11。表3-11選項(xiàng)及其含義變量名列表形式產(chǎn)生的效果a*ba–ba*bc*da–b,c–d(ab)*(cd)a–c,a–d,b–c,b–d(ab)*(cb)a–c,a–b,b–c

PROCTTEST語(yǔ)句后可跟的選項(xiàng)及其表示的含義如表3-12所示。表3-12選項(xiàng)及其含義選項(xiàng)代表的含義data=等號(hào)后為SAS數(shù)據(jù)集名,指定ttest過程所要處理的數(shù)據(jù)集,默認(rèn)值為最近處理的數(shù)據(jù)集alpha=等號(hào)后為0~1之間的任何值,指定置信水平,默認(rèn)為0.05ci=等號(hào)后為“equal,umpu,none”中的一個(gè),表示標(biāo)準(zhǔn)差的置信區(qū)間的顯示形式,默認(rèn)為ci=equalcochran有此選項(xiàng)時(shí),ttest過程對(duì)方差不齊時(shí)的近似t檢驗(yàn)增加cochran近似法h0=等號(hào)后為任意實(shí)數(shù),表示檢驗(yàn)假設(shè)中對(duì)兩均值差值的設(shè)定,默認(rèn)值為02.總體均值的置信區(qū)間【例3-8】仍然考慮例3-3中的樣本數(shù)據(jù)。假定其中數(shù)據(jù)使用如下數(shù)據(jù)步存放在數(shù)據(jù)集sjcj中,兩套試卷得分的變量名分別為A和B。datasjcj;inputAB@@;cards;7871634472618984917449516855766085775539;run;【例3-8】仍然考慮例3-3中的樣本數(shù)據(jù)。假定其中數(shù)據(jù)使用如下數(shù)據(jù)步存放在數(shù)據(jù)集sjcj中,兩套試卷得分的變量名分別為A和B。使用最簡(jiǎn)代碼求均值、標(biāo)準(zhǔn)差的置信區(qū)間:procttestdata=sjcj;run;

代碼運(yùn)行結(jié)果給出兩個(gè)變量在95%置信水平下的均值、標(biāo)準(zhǔn)差的置信區(qū)間,以及對(duì)原假設(shè)μ0=0所作的t檢驗(yàn)的p值,如圖所示。3.單樣本總體均值的假設(shè)檢驗(yàn)在例3-8中增加原假設(shè)選項(xiàng)以及置信水平,代碼如下:procttesth0=70alpha=0.01data=sjcj;varA;run;

代碼運(yùn)行結(jié)果除了給出變量A在99%置信水平下的均值、標(biāo)準(zhǔn)差的置信區(qū)間外,還給出對(duì)假設(shè)μ0=70,所作的t-檢驗(yàn)的p值,如圖3-15所示。結(jié)果顯示t統(tǒng)計(jì)量的p值=0.5734,不能拒絕(57.34%的把握)原假設(shè):均值=70。4.配對(duì)兩樣本均值的假設(shè)檢驗(yàn)在例3-8中檢驗(yàn)兩套試卷有無顯著差異,代碼如下:procttestdata=sjcj;pairedA*B;run;

代碼運(yùn)行結(jié)果給出了對(duì)原假設(shè)μ1–μ2=0所作的t檢驗(yàn)的p值,如圖3-16所示。結(jié)果顯示t統(tǒng)計(jì)量的p值=0.0005<0.05,因此拒絕原假設(shè)。說明兩套試卷有顯著差異。5.獨(dú)立兩樣本均值的假設(shè)檢驗(yàn)過程TTEST還可以用于進(jìn)行獨(dú)立雙樣本均值比較的t檢驗(yàn)法。它的用法為PROCTTESTDATA=<數(shù)據(jù)集名>;CLASS<分組變量名>;VAR<分析變量名列>;RUN;

使用這一格式要求將兩個(gè)樣本中被比較均值的變量的觀測(cè)值記在同一分析變量下,不同的樣本用另一個(gè)分類變量的不同值加以區(qū)分,而且分類變量只能取兩個(gè)值,否則將報(bào)錯(cuò)?!纠?-9】仍然考慮例3-7中的樣本數(shù)據(jù)。假定其中數(shù)據(jù)使用如下數(shù)據(jù)步存放在數(shù)據(jù)集zzcpsj中:datazzcpsj;inputfg$@@;cards;28.3127.6230.1122.2229131237.6133.8232.1120228.8130.2236131.7237.2126238.5132234.4131.22281301;run;

將兩批工人的測(cè)量結(jié)果看作兩個(gè)樣本,但其數(shù)據(jù)都放在一個(gè)數(shù)據(jù)集之中,所需的時(shí)間值是記錄在同一分析變量f之下,而兩種方法的差別是由變量g的值加以區(qū)分的,所以g可作為分類變量。檢驗(yàn)代碼如下:procttestdata=zzcpsj;classg;varf;run;檢驗(yàn)結(jié)果如圖所示在檢驗(yàn)中,先看其最后關(guān)于方差等式的檢驗(yàn)結(jié)果,檢驗(yàn)方差相等是用的F'統(tǒng)計(jì)量,其數(shù)值為1.29,相應(yīng)的p值為0.6779>0.05=α,所以不能拒絕方差相等的假設(shè)。在方差相等的前提下,檢驗(yàn)均值差異使用Pooled方法,對(duì)應(yīng)統(tǒng)計(jì)量的t值為2.16,相應(yīng)的p值為0.0433<0.05=α,所以兩種方法所需的時(shí)間是有顯著差異的。在異方差的情況下,使用Satterthwaite法檢驗(yàn)均值的差異。3.3總體比例的區(qū)間估計(jì)與假設(shè)檢驗(yàn)的SAS實(shí)現(xiàn)(分析家下實(shí)現(xiàn))比例值:0~1或0~100%實(shí)際情況中,常檢驗(yàn)總體比例是否為某假定值,如:產(chǎn)品合格率是否為1%?3.3.1單樣本總體比例的置信區(qū)間3.3.2單樣本總體比例的假設(shè)檢驗(yàn)3.3.3兩總體比例的比較

3.3.1總體比例的置信區(qū)間【例3-10】2004年底北京市私家車擁有量已達(dá)到129.8萬(wàn)輛,位居全國(guó)之首,據(jù)業(yè)內(nèi)人士分析其中國(guó)產(chǎn)中低檔汽車的比例較大,為了估計(jì)目前北京市場(chǎng)個(gè)人購(gòu)車的平均價(jià)格,調(diào)查人員于某日在北京最大的車市隨機(jī)抽取36位私人消費(fèi)購(gòu)車者,得到他們所購(gòu)汽車的價(jià)格,見下表。表3-13年底購(gòu)車價(jià)格(單位:萬(wàn)元)根據(jù)以上調(diào)查數(shù)據(jù),試以95%的置信水平推斷該地區(qū)購(gòu)買私家車在15萬(wàn)元以上的消費(fèi)者占有的比例。6.8811.2819.9813.610.614.86.8811.7820.9824.412.314.86.8813.6813.630.314.614.88.2814.9814.79.614.617.49.615.6815.89.612.95.3810.1815.6820.510.614.87.38設(shè)購(gòu)車價(jià)格數(shù)據(jù)存放在數(shù)據(jù)集Mylib.gcjg中,價(jià)格變量名為price。這是一個(gè)單樣本比例的區(qū)間估計(jì)問題。由于在SAS中只能對(duì)兩水平的分類變量作比例的區(qū)間估計(jì)與檢驗(yàn),所以首先要按變量price生成一個(gè)新的分類變量。步驟如下:

1)在“分析家”中打開數(shù)據(jù)集Mylib.gcjg;

2)選擇主菜單“編輯”→“模式”→“編輯”,使數(shù)據(jù)集可以被編輯(修改);

3)選擇主菜單“數(shù)據(jù)”→“變換”→“重編碼范圍”,打開“RecodeRangesInformation”對(duì)話框并按圖3-18(左)設(shè)置有關(guān)內(nèi)容;

4)單擊“OK”按鈕,打開“RecodeRanges”對(duì)話框,按圖3-18右所示生成新變量price_f;

5)選擇菜單“統(tǒng)計(jì)”→“假設(shè)檢驗(yàn)”→“比例的單樣本檢驗(yàn)”;

6)在打開的單樣本比例檢驗(yàn)對(duì)話框中,按圖3-19設(shè)置比例的置信區(qū)間。

分析結(jié)果中包括變量的置信區(qū)間:按95%的置信水平變量price取值為“>15”的比例在區(qū)間(0.109,0.391)范圍中,即可以95%的概率估計(jì)該地區(qū)所購(gòu)買車輛在15萬(wàn)元以上的消費(fèi)者所占比例在10.9%~39.1%之間。3.3.2單樣本總體比例的假設(shè)檢驗(yàn)【例3-11】對(duì)購(gòu)車價(jià)格數(shù)據(jù)gcjg,試檢驗(yàn)總體中購(gòu)買車輛在15萬(wàn)元以上者所占比例是否超過30%。這是一個(gè)單樣本比例檢驗(yàn)問題,若表示總體中購(gòu)買車輛在15萬(wàn)元以上者所占比例,則檢驗(yàn)的是:

H0:≥0.3, H1:

<0.3;步驟如下:

1)選擇菜單“統(tǒng)計(jì)”→“假設(shè)檢驗(yàn)”→“比例的單樣本檢驗(yàn)”

,打開并按圖左設(shè)置“OneSampleTestforaProportion”對(duì)話框;檢驗(yàn)結(jié)果如圖右所示。顯示的結(jié)果表明樣本中購(gòu)買車輛在15萬(wàn)元以上者的比例為25%,檢驗(yàn)用的Z統(tǒng)計(jì)量的p值為0.2563>0.05,所以不能拒絕原假設(shè)。結(jié)果表明購(gòu)買車輛在15萬(wàn)元以上者所占比例在95%的置信水平下超過30%。3.3.3兩總體比例的比較【例3-12】2004年底很多類型的國(guó)產(chǎn)轎車價(jià)格都比年中有所下降,為了對(duì)比2004年底與年中私家購(gòu)車族購(gòu)車價(jià)格的差異,在年中新購(gòu)車者中隨機(jī)抽取32人,調(diào)查得到的價(jià)格數(shù)據(jù)如表3-14。表3-14年中購(gòu)車價(jià)格(單位:萬(wàn)元):綜合表3-13與表3-14的調(diào)查數(shù)據(jù),試以95%的置信水平推斷該地區(qū)年底與年中購(gòu)買私家車在15萬(wàn)元以上的消費(fèi)者占有比例有無差異。5.3810.7812.8814.718.8830.37.3811.213.61519.9815.287.9811.7813.6515.820.59.999.3811.7814.615.920.989.3610.312.314.71724.48.9911.3810.28這是一個(gè)雙樣本比例檢驗(yàn)問題,若1和2分別表示總體中年底和年中購(gòu)買私家車在15萬(wàn)元以上的消費(fèi)者所占的比例,則檢驗(yàn)的是假設(shè):

H0:1–2=0, H1:1–2

0;步驟如下:在分析家中打開數(shù)據(jù)集Mylib.gcjgQ后,選擇菜單“比例的雙樣本檢驗(yàn)”,在對(duì)話框中,按圖左設(shè)置雙樣本比例檢驗(yàn),分析結(jié)果如圖右所示。結(jié)果顯示,由于Z統(tǒng)計(jì)量的p值為0.5664,所以在95%的置信水平下,不能拒絕原假設(shè)。即該地區(qū)2004年底與年中私家購(gòu)車價(jià)格在15萬(wàn)元以上者所占比例無明顯差異。3.4總體方差的區(qū)間估計(jì)與假設(shè)檢驗(yàn)的SAS實(shí)現(xiàn)方差反映著數(shù)據(jù)分布離散程度,方差大,表明數(shù)據(jù)波動(dòng)大經(jīng)濟(jì)生活中,居民收入的方差大小是評(píng)價(jià)收入是否合理的一項(xiàng)指標(biāo);產(chǎn)品質(zhì)量中,尺寸、重量、抗拉強(qiáng)度的方差大小反映著產(chǎn)品的穩(wěn)定性;考試成績(jī)中,成績(jī)的方差大小反映出試卷難易程度;投資方面,收益率方差是評(píng)價(jià)投資風(fēng)險(xiǎn)的重要依據(jù);……3.4.1總體方差的置信區(qū)間3.4.2單樣本總體方差的假設(shè)檢驗(yàn)3.4.3兩樣本總體方差的比較3.4.1總體方差的置信區(qū)間【例3-13】表3-15所示為某中學(xué)1980年模擬高考數(shù)學(xué)的部分學(xué)生成績(jī),試估計(jì)本次模擬考試成績(jī)的方差。表3-15部分學(xué)生成績(jī)

假定表3-15數(shù)據(jù)存放在數(shù)據(jù)集Mylib.kscj中,成績(jī)變量名為score。分析步驟如下:

1)在“分析家”中打開數(shù)據(jù)集Mylib.kscj;

2)選擇菜單“統(tǒng)計(jì)”→“假設(shè)檢驗(yàn)”→“方差的單樣本檢驗(yàn)”;100969690921001009099921009810097979594100

3)在打開的“OneSampleTestforaVariance”對(duì)話框中設(shè)置方差的置信區(qū)間。結(jié)果表明,本次模擬考試成績(jī)方差在置信水平95%下的置信區(qū)間為(7.1692,28.614)。

3.4.2單樣本總體方差的假設(shè)檢驗(yàn)【例3-14】考慮例3-13中的模擬考試成績(jī),檢驗(yàn)考試成績(jī)是否太集中。這是一個(gè)單樣本方差檢驗(yàn)問題,若表示總體方差,則檢驗(yàn)的是:

H0:2≤52, H1:2>52;

步驟:選擇菜單“統(tǒng)計(jì)”→“假設(shè)檢驗(yàn)”→“方差的單樣本檢驗(yàn)”,打開“OneSampleTestforaVariance”對(duì)話框并按圖設(shè)置;結(jié)果顯示,樣本方差為12.732,由于2檢驗(yàn)的p值=0.9504,所以不能拒絕方差≤25的原假設(shè)。結(jié)果表明有95%的把握可以認(rèn)為該模擬考試的成績(jī)太過集中。加之均值高,有理由認(rèn)為試卷偏容易.3.4.3兩樣本總體方差的比較【例3-15】已知兩只股票深發(fā)展(000001)和萬(wàn)科A(000002)在2004年6月21個(gè)交易日的收益率如表3-16所示。試在0.05的顯著水平下判斷深發(fā)展的風(fēng)險(xiǎn)是否高于萬(wàn)科A?表3-16深發(fā)展和萬(wàn)科A在2004年6月21個(gè)交易日的收益率day深發(fā)展萬(wàn)科Aday深發(fā)展萬(wàn)科Aday深發(fā)展萬(wàn)科A200406010.00310.009920040610-0.00220.004120040621-0.00220.0131200406020.0301-0.01372004061100.002200406220.00330.02820040603-0.0231-0.013920040614-0.0209-0.012320040623-0.0066-0.014720040604-0.00820.006200406150.04610.018620040624-0.01440.008520040607-0.0228-0.00820040616-0.0097-0.00220040625-0.0056-0.012720040608-0.02230.00220040617-0.0228-0.042820040628-0.05190.004320040609-0.0109-0.0202200406180.0111-0.0255200406290.02260.0319這是一個(gè)雙樣本方差檢驗(yàn)問題,若1和2分別表示深發(fā)展和萬(wàn)科A兩只股票收益率的方差,則檢驗(yàn)的是:

H0:1≥2, H1:1<2;檢驗(yàn)步驟:

1)首先,生成數(shù)據(jù)集mylib.gupiao,深發(fā)展和萬(wàn)科的收益率可以用同一變量表示,另加一個(gè)分類變量以區(qū)別;也可用兩個(gè)變量表示,如分別用s和w表示。本例用第二種方法。

2)在分析家中打開數(shù)據(jù)集mylib.gupiao后,選擇菜單“統(tǒng)計(jì)”→“假設(shè)檢驗(yàn)”→“方差的雙樣本檢驗(yàn)”,設(shè)置如下

結(jié)果顯示,在0.05的顯著性水平下不能拒絕原假設(shè),說明深發(fā)展的股票風(fēng)險(xiǎn)要高于萬(wàn)科A。3.5分布檢驗(yàn)3.5.1數(shù)據(jù)的分布研究3.5.2在INSIGHT模塊中研究分布3.5.3在“分析家”中研究分布3.5.4使用UNIVARIATE過程3.5.1數(shù)據(jù)的分布研究檢驗(yàn)數(shù)據(jù)是否來自正態(tài)分布檢驗(yàn)常用方法分布擬合圖QQ圖分布檢驗(yàn)1.分布擬合圖由于密度直方圖中矩形的面積是數(shù)據(jù)落入對(duì)應(yīng)區(qū)間中的頻率,根據(jù)大數(shù)定理,數(shù)據(jù)量很大時(shí),頻率近似于概率。所以,如果數(shù)據(jù)來自一個(gè)具有概率密度f(wàn)(x)的連續(xù)型隨機(jī)變量,密度直方圖就可以作為概率密度f(wàn)(x)的一個(gè)估計(jì)。所謂分布擬合圖就是在限定的參數(shù)分布類中通過對(duì)參數(shù)的估計(jì),用估計(jì)得到的參數(shù)所對(duì)應(yīng)的密度曲線去擬合直方圖頂部的形態(tài)。圖示為分布擬合圖,左圖為正態(tài)分布擬合圖,右圖為對(duì)數(shù)正態(tài)分布擬合圖。

在SAS系統(tǒng)中提供的參數(shù)分布類型有:正態(tài)(Normal)分布—最為常用的分布、對(duì)數(shù)正態(tài)(Lognormal)分布、指數(shù)分布、Gamma分布、Weibull分布,它們的分布密度分別為:

1)參數(shù)為(μ,)的正態(tài)分布

2)參數(shù)為(,μ,)的對(duì)數(shù)正態(tài)分布

3)參數(shù)為(,)的指數(shù)分布的密度為

4)參數(shù)為(,c,)的指數(shù)分布的密度為

5)參數(shù)為(,α,)的Gamma分布的密度為

6)參數(shù)為(,c,)的Weibull分布的密度為2.QQ圖不論密度直方圖還是分布擬合圖,要從圖上鑒別數(shù)據(jù)的分布是否近似于某種類別的分布是較困難的。QQ圖可以幫助我們方便地鑒別數(shù)據(jù)的分布是否近似于某種類型的分布。

QQ圖是一種散點(diǎn)圖。若觀測(cè)數(shù)據(jù)近似正態(tài)分布N(μ,2),則QQ圖上的散點(diǎn)近似在直線y=x+μ附近,斜率為標(biāo)準(zhǔn)差,截距為均值。圖示為居民家庭收入情況的QQ圖,分別為對(duì)應(yīng)于正態(tài)分布與對(duì)數(shù)正態(tài)分布的QQ圖。

數(shù)據(jù)是否近似于正態(tài)分布,只需看QQ圖上的點(diǎn)是否近似地在一條直線附近,該直線的斜率為標(biāo)準(zhǔn)差,截距為均值。SAS下也可以作對(duì)應(yīng)于對(duì)數(shù)正態(tài)分布、指數(shù)分布、Gamma分布、Weibull分布的QQ圖,以鑒別樣本數(shù)據(jù)是否來自某一類型的總體分布。

3.5.2在INSIGHT模塊中研究分布1.繪制分布擬合圖【例3-16】在INSIGHT模塊中繪制居民家庭收入情況(參見例2-1)的分布擬合圖。選擇菜單“Analyze”→“Distribution(Y)”,打開“Distribution(Y)”對(duì)話框并按如圖3-33所示設(shè)置。

圖3-34參數(shù)估計(jì)對(duì)話框與income變量的密度擬合圖圖3-35income變量的參數(shù)密度估計(jì)

2.繪制QQ圖如果在“Distribution(Y)”對(duì)話框中選中“NormalQQPlot(正態(tài)QQ圖)”復(fù)選框,,則可以得到QQ圖,如右圖所示。

選擇菜單“曲線”→“QQ參考線”,打開“QQRefLine”對(duì)話框。選擇“Method(方法)”欄下的“LeastSquares(最小二乘)”,單擊“OK”按鈕得到帶參考線的QQ圖。

選擇菜單“Graphs(圖形)”→“QQPlot(QQ圖)”,打開“QQPlot”對(duì)話框。選擇“Distribution(分布)”欄下的“LognormalQQPlot(對(duì)數(shù)正態(tài)QQ圖)”,如圖左,單擊“OK”按鈕得到對(duì)數(shù)正態(tài)QQ圖,如圖右所示。

雖然從分布擬合圖中似乎得到居民家庭收入情況的樣本數(shù)據(jù)接近于對(duì)數(shù)正態(tài)分布,但從QQ圖可以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論