




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、 抽樣及抽樣分布抽樣及抽樣分布 參數(shù)的點估計與區(qū)間估計參數(shù)的點估計與區(qū)間估計 樣本容量確定樣本容量確定 SPSS在參數(shù)估計中的應用在參數(shù)估計中的應用 通過本章的學習,理解抽樣及抽樣分布的概念。 通過本章的學習,理解參數(shù)點估計的概念,掌握參數(shù)點估計的評價標準:無偏性,有效性和一致性。 理解參數(shù)的區(qū)間估計的概念,掌握對單個正態(tài)總體和兩個正態(tài)總體的均值與方差進行區(qū)間估計的方法及步驟。m 抽樣的概念抽樣的概念、特點特點m 抽樣分布的概念抽樣分布的概念、特點特點 從總體中抽取一個樣本作為總體的代表,這一過程稱為抽樣。即從總體中隨機地取出其中一部分觀察,由此而獲得有關總體的信息。對樣本進行調(diào)查,再根據(jù)抽樣
2、分布的原理利用樣本資料對總體數(shù)量特征進行科學的估計與推斷,這就是抽樣估計。JJJJJJJJJJ一、抽樣的概念一、抽樣的概念1、樣本的確定是按隨機原則隨機原則從全部總體單位中抽取的。2、用部分單位的指標數(shù)值去推斷和估計總體指標數(shù)值。3、抽樣推斷中的抽樣誤差是不可避免的,但在事先是 可以計算并加以控制的。 l事物在測量或試驗時有破壞性,不可能進行全面調(diào)查;l有些總體從理論上講可以進行全面調(diào)查,但實際上辦不到l和全面調(diào)查相比較,抽樣調(diào)查能節(jié)省人力、費用和時間,而且比較靈活;l在有些情況下,抽樣調(diào)查的結果比全面調(diào)查要準確;可以用來對全面調(diào)查資料進行評價和修正;l抽樣調(diào)查方法可以用于工業(yè)生產(chǎn)過程中的質(zhì)量
3、控制;l利用抽樣推斷的方法,可以對于某種總體的假設進行檢驗,來判斷這種假設的真?zhèn)?,以決定取舍。三、抽樣的適用范圍三、抽樣的適用范圍(1 1)總體:)總體:總體是指根據(jù)研究目的確定的所要研究事物的全 體??傮w單位的總數(shù)稱為總體容量,一般用N N表示。(2 2)樣本:)樣本:從總體中抽取的部分總體單位所構成的整體,稱 為該總體的一個樣本。樣本所包含的總體單位個數(shù) 稱為樣本容量,一般用n n表示。樣本按照樣本單位數(shù) 的多少分為大樣本和小樣本。一般地說,n30n30為大 樣本,n n3030為小樣本。從一個總體中可以抽取一個 樣本也可以抽取多個樣本。(3 3)總體參數(shù)總體參數(shù) 在抽樣估計中,用來反映總
4、體數(shù)量特征的指標稱為總體指標,也叫總體參數(shù)。我們所要估計的總體參數(shù)通常有總體平均數(shù),總體比例P P,總體標準差,總體方差2 2等等。總體參數(shù)的計算方法是明確的,但具體數(shù)值事先是未知的,需要用統(tǒng)計量來估計它。(4)統(tǒng)計量統(tǒng)計量 樣本指標又稱樣本統(tǒng)計量或估計量,是根據(jù)樣本資料計算的,用以估計和推斷相應總體指標的綜合指標。常見的樣本統(tǒng)計量有樣本平均數(shù) ,樣本比例(也叫樣本成數(shù))p p,樣本標準差s或樣本方差s s2 2等等。樣本統(tǒng)計量是隨樣本不同而不同的隨機變量。x全及指標:參數(shù)全及指標:參數(shù)總體平均數(shù)總體平均數(shù) 總體成數(shù)總體成數(shù) P 總體標準差總體標準差總體方差總體方差2樣本指標:統(tǒng)計量樣本指標:
5、統(tǒng)計量 樣本平均數(shù)樣本平均數(shù)x樣本成數(shù)樣本成數(shù)p樣本標準差樣本標準差 s 樣本方差樣本方差2s(5 5)樣本可能數(shù)目)樣本可能數(shù)目 又稱樣本個數(shù),是指從全及總體中可能抽取或可能構成的樣本總體。它既和每個樣本的容量有關,也和抽樣的方法有關。當樣本容量給定時,樣本的可能數(shù)目便由抽樣方法決定。(6)抽樣方法抽樣方法 按抽取樣本的方式不同分為重復抽樣和不重復抽樣。重復抽樣(回置抽樣)重復抽樣(回置抽樣)從總體中隨機抽選一個樣本之后,從總體中隨機抽選一個樣本之后,把結果登記下來,再放回到總體把結果登記下來,再放回到總體中,第二次抽選再從全部總體單中,第二次抽選再從全部總體單位中抽選。在這樣抽選過程中,位
6、中抽選。在這樣抽選過程中,總體單位數(shù)始終是相同的,每一總體單位數(shù)始終是相同的,每一單位始終都有同等被抽中的可能,單位始終都有同等被抽中的可能,同一單位有多次重復中選的可能同一單位有多次重復中選的可能。不重復抽樣(非回置抽樣)不重復抽樣(非回置抽樣)任一單位一經(jīng)抽出,不再放回任一單位一經(jīng)抽出,不再放回總體中去參加下一次抽選。在總體中去參加下一次抽選。在這樣抽選過程中,抽一次,總這樣抽選過程中,抽一次,總體單位數(shù)就少一個,每一單位體單位數(shù)就少一個,每一單位被抽中的可能不斷變化(機會被抽中的可能不斷變化(機會增加),每一單位只能被抽中增加),每一單位只能被抽中一次,不會被重復抽選出來。一次,不會被重
7、復抽選出來。重復抽樣可能得到的樣本配合總數(shù)為重復抽樣可能得到的樣本配合總數(shù)為nnNnNnnNCDNB1不考慮順序時,用,當考慮順序時,用不重復抽樣可能得到的樣本配合總數(shù)為不重復抽樣可能得到的樣本配合總數(shù)為)!( !)!(!nNnNCnNNAnNnN公式不考慮順序時,用組合公式當考慮順序時,用排列(一)抽樣分布的概念抽樣分布的概念 假如從同一總體隨機抽出容量相同的各種樣本,則從這些樣本計算出的某統(tǒng)計量所有可能值和相應概率的分布,稱為這個統(tǒng)計量的抽樣分布。 樣本統(tǒng)計量的概率分布 是一種理論概率分布 隨機變量是樣本統(tǒng)計量,如:樣本均值,樣本比例,樣本方差 結果來自容量相同的所有可能樣本 提供了樣本統(tǒng)
8、計量長遠穩(wěn)定的信息,是進行推斷的理論基礎, 也是抽樣推斷科學性的重要依據(jù) ),(2px抽樣分布抽樣分布(二)樣本均值的抽樣分布(二)樣本均值的抽樣分布例:例:假定某公司有10個銷售員構成一個總體,x是一個銷售員 在該公司工作的年數(shù),這個變量的各種取值為(1,2,3,4,5,6,7,8,9,10),從這個總體可以算出如下參數(shù):5 . 51055Nxi25. 8)(22Nxi現(xiàn)從中抽選n=2容量的樣本,在重復抽樣時,將有個可能樣本。100102nN第一次第一次抽取抽取第二次抽取第二次抽取1234567891011.1(1)1.2(1.5)1.3(2)1.4(2.5)1.5(3)1.6(3.5)1.
9、7(4)1.8(4.5)1.9(5)1.10(5.5)22.1(1.5)2.2(2)2.3(2.5)2.4(3)2.5(3.5)2.6(4)2.7(4.5)2.8(5)2.9(5.5)2.10(6)33.1(2)3.2(2.5)3.3(3)3.4(3.5)3.5(4)3.6(4.5)3.7(5)3.8(5.5)3.9(6)3.10(6.5)44.1(2.5)4.2(3)4.3(3.5)4.4(4)4.5(4.5)4.6(5)4.7(5.5)4.8(6)4.9(6.5)4.10(7)55.1(3)5.2(3.5)5.3(4)5.4(4.5)5.5(5)5.6(5.5)5.7(6)5.8(6.5)
10、5.9(7)5.10(7.5)66.1(3.5)6.2(4)6.3(4.5)6.4(5)6.5(5.5)6.6(6)6.7(6.5)6.8(7)6.9(7.5)6.10(8)77.1(4)7.2(4.5)7.3(5)7.4(5.5)7.5(6)7.6(6.5)7.7(7)7.8(7.5)7.9(8)7.10(8.5)88.1(4.5)8.2(5)8.3(5.5)8.4(6)8.5(6.5)8.6(7)8.7(7.5)8.8(8)8.9(8.5)8.10(9)99.1(5)9.2(5.5)9.3(6)9.4(6.5)9.5(7)9.6(7.5)9.7(8)9.8(8.5)9.9(9)9.10(9
11、.5)1010.1(5.5)10.2(6)10.3(6.5)10.4(7)10.5(7.5)10.6(8)10.7(8.5)10.8(9)10.9(9.5)10.10(10) 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 6.5 7 7.5 8 8.5 9 9.5 10合計合計f 1 2 3 4 5 6 7 8 9 10 9 8 7 6 5 4 3 2 1100 xff10011002100310041005100610071008100910010100910081007100610051004100310021001100100 x總體分布總體分布樣本均值的抽樣分樣本均值
12、的抽樣分布布125. 4225. 8125. 41005 .412100)5 . 510()5 . 55 . 1 ()5 . 51 ()(5 . 510055022222222nNxxxNxxxxnxixnix即:容量。以獲得抽樣分布的樣本等于原總體方差除以用抽樣分布的方差的方差于原總體的平均值的抽樣分布的平均值等即的抽樣分布的平均值正態(tài)分布均勻分布總體分布樣本均值分布(n=2)樣本均值分布(n=10)樣本均值分布(n=30)指數(shù)分布(三)中心極限定理(三)中心極限定理 令 是獨立同分布的隨機變量且具有有限均值 和方差 , 則有 12,.,nXXX2 xdxexnXPxxn22121limnX
13、XXXn.21其中m這個結論對于抽樣推斷是十分重要的,因為在經(jīng)濟現(xiàn)象中變量和的分布是普遍存在的。例如,v城市用電量是千家萬戶用電量總和的分布;v產(chǎn)品標準規(guī)格的偏差是許多獨立因素之和的分布等。v根據(jù)中心極限定理,我們有理由相信,這些分布都趨近于正態(tài)。m在現(xiàn)實生活中,一個隨機變量服從于正態(tài)分布未必很多,但多個隨機變量和的分布趨近于正態(tài)分布則是普遍存在的。m抽樣平均數(shù)也是一種隨機變量和的分布,因此,在抽樣單位數(shù)充分大的條件下,抽樣平均數(shù)也趨近于正態(tài)分布,這為抽樣誤差的概率估計提供了一個極為有效而方便的條件。m當當n n 30, 30, 無論總體分布形態(tài)如何,中心極限定理均適用;無論總體分布形態(tài)如何,
14、中心極限定理均適用;m當當n n 15, 15, 對于分布較為對稱的總體,中心極限定理適用;對于分布較為對稱的總體,中心極限定理適用;m當總體是正態(tài)分布時,無論樣本大小,中心極限定理均適用。當總體是正態(tài)分布時,無論樣本大小,中心極限定理均適用。(四)其他抽樣分布(四)其他抽樣分布m樣本比例 m樣本方差 m兩個樣本均值差的抽樣分布m兩個樣本比例差的抽樣分布 m兩個樣本方差比的抽樣分布 n, m參數(shù)的點估計參數(shù)的點估計m參數(shù)的區(qū)間估計參數(shù)的區(qū)間估計m 假設你正在研究平均一個人一生中要得到多少交通假設你正在研究平均一個人一生中要得到多少交通罰單。報告研究結果的方法有以下兩種:罰單。報告研究結果的方法
15、有以下兩種:“10”10”或或者者“8 8到到1212之間之間”,請考慮它們各自的優(yōu)缺點。,請考慮它們各自的優(yōu)缺點。(一)點估計概念要點(一)點估計概念要點 1 1、從總體中抽取一個樣本,根據(jù)該樣本的統(tǒng)計量對總體從總體中抽取一個樣本,根據(jù)該樣本的統(tǒng)計量對總體 的未知參數(shù)作出一個數(shù)值點的估計;的未知參數(shù)作出一個數(shù)值點的估計;例如例如: : 用樣本均值作為總體未知均值的估計值就是一個用樣本均值作為總體未知均值的估計值就是一個點估計點估計 2 2、點估計沒有給出估計值接近總體未知參數(shù)程度的信點估計沒有給出估計值接近總體未知參數(shù)程度的信 息;息; 3 3、點估計的方法有矩估計法、順序統(tǒng)計量法、最大似然
16、法點估計的方法有矩估計法、順序統(tǒng)計量法、最大似然法、最小二乘法等最小二乘法等(二)點估計的性質(zhì)(二)點估計的性質(zhì) 1 1、無偏性、無偏性。即以抽樣指標估計全及指標要求抽樣指標值的平均數(shù)等于被估計的全及指標本身。就是說,雖然每一次的抽樣指標(如x,p等)和未知的全及指標(如X,P等)可能不相同,但在多次反復的估計中各個抽樣指標的平均數(shù)應等于全及指標,即抽樣指標的平均來說與全及指標是沒有偏誤的。)(xE2 2、一致性。、一致性。即當樣本容量n充分大的時,若樣本指標充分地靠近被估計的全及指標,則該樣本指標是被估計的全及指標的一致估計量。較小的樣本容量較小的樣本容量較大的樣本容量較大的樣本容量3 3、
17、有效性。、有效性。即如果一個樣本估計量的方差比其他估計量的方差小,則稱該樣本估計量是被估計的全及指標的有效估計量。12(三)參數(shù)的點估計(三)參數(shù)的點估計 估計量:對總體參數(shù)進行估計的相應樣本統(tǒng)計估計量:對總體參數(shù)進行估計的相應樣本統(tǒng)計 量稱為估計量。量稱為估計量。樣本均值 是總體均值的估計量;樣本方差(樣本標準差) 為總體方差(或總體標準差)的估計量;樣本比率 為總體比例的估計量。 點估計方法簡單,但不很實用。因為,抽樣估計中抽樣指標完全點估計方法簡單,但不很實用。因為,抽樣估計中抽樣指標完全等于全及指標的可能性極小。等于全及指標的可能性極小。niixnX11nixxsin122)(11na
18、p 1 1、對一批某種型號的電子元件10000只進行耐用時間檢查,隨機抽取100只,測試的平均耐用時間為1055小時,合格率為91%,我們推斷說10000只電子元件的平均耐用時間為1055小時,全部電子元件的合格率也是91%。 2 2、某地區(qū)從全部儲蓄存款戶中抽取5000戶進行調(diào)查,其中定期存款戶占75,則可推斷該地區(qū)全部儲蓄存款中定期存款戶占75。m假定我們已選取了一個由30名管理人員組成的簡單隨機樣本,他們相應的年薪及參加管理培訓項目的數(shù)據(jù)如下表,符號X代表樣本中第一名,第二名等管理人員的年薪,在管理培訓項目這一欄,已參加過管理培訓項目的人員用“是”表示。x年薪,美元年薪,美元是否參加管理
19、培訓是否參加管理培訓程序程序年薪,美元年薪,美元是否參加管理培訓是否參加管理培訓程序程序1=49094.30是16=51766.00是2=53263.90是17=52541.30否3=49643.50是18=44980.00是4=49894.90是19=51932.60是5=47621.60否20=52973.00是6=55924.00是21=45120.90是7=49092.30是22=51753.00是8=51404.40是23=54391.80否9=50957.70是24=50164.20否10=55109.70是25=52973.60否11=45922.60是26=50241.30否1
20、2=57268.40否27=52793.90否13=55688.80是28=50979.40是14=51564.70否29=55860.90是15=56188.20否30=57309.10否xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxm在點估計中,我們用樣本數(shù)據(jù)計算一個樣本統(tǒng)計量的值作為總體參數(shù)的估計。(矩估計法)矩估計法)總體參數(shù)總體參數(shù)參數(shù)值參數(shù)值點估計量點估計量點估計值點估計值=年薪的總體均值51800.00美元= 年 薪 的 樣本均值51814.00美元=年薪的總體標準差4000.00美元 S=年薪的樣本標準差3347.72美元p=已完成管理培訓項目的總體比率0.60=
21、 已 完 成 管理培訓項目的樣本比率0.63(一)區(qū)間估計的概念和原理(一)區(qū)間估計的概念和原理 指按一定的概率(置信度)來估計總體參數(shù)的取值范圍。 置信區(qū)間:由樣本構造一個以較大的概率包含真實參數(shù)的 一個范圍或區(qū)間,這種帶有概率的區(qū)間稱為置信 區(qū)間。置信區(qū)間置信區(qū)間樣本統(tǒng)計量置信下界置信上界m估計結果包容總體參數(shù)的概率m表示為 (1 置信水平 是參數(shù)不在區(qū)間內(nèi)的概率m通常取值 99%, 95%, 90% 即0.01,0.05,0.10m區(qū)間的寬度m影響因素:m 數(shù)據(jù)離散度 m 樣本容量 nm 置信水平 (1), XXXZXZ(二)區(qū)間估計的步驟二)區(qū)間估計的步驟 以總體均值的區(qū)間估計為例:
22、m確定置信水平 ;m根據(jù)置信水平,查標準正態(tài)分布表確定其 值;m實際抽樣,并計算樣本的均值 和抽樣誤差 m確定置信區(qū)間: 1/2zxxXXZ區(qū)間估計區(qū)間估計總體均值的總體均值的區(qū)間估計區(qū)間估計總體比例的總體比例的區(qū)間估計區(qū)間估計總體方差的總體方差的區(qū)間估計區(qū)間估計兩個總體兩個總體均值之差均值之差單一總體單一總體 已知或大樣本已知或大樣本 未知且小樣本未知且小樣本(三)(三)m1.假設假設m已知總體標準差m總體正態(tài)分布m如果不是正態(tài), 可被正態(tài)分布逼近 (樣本n 30)m2.置信區(qū)間置信區(qū)間XZnXZn/22m為了估計目前北京市場二手房交易的平均交易額,制定相應的營銷策略,某房地產(chǎn)中介公司在20
23、08年第四季度的二手房交易中,隨機抽取40個交易作為樣本,得到二手房交易額如下表所示(單位:萬元)。 假定房地產(chǎn)中介公司從上季度的二手房交易記錄中得到以下信息:交易額的標準差為15萬元,于是我們假定總體標準差 =15。試在95%的置信水平下估計二手房平均交易額的置信區(qū)間。 4852.436458019.94460.53339.52158.17236.6514973.516654810237.542.84836.52746.233.5415658.53940.535.422.54150.83834.243m已知n=40, =15;m計算得到樣本均值 m由1- 0.950.95,查標準正態(tài)分布概率
24、表得:m于是在95%的置信水平下的置信區(qū)間為:m即(40.83,50.13)。結果表明:在95%的置信水平下,二手房交易額的置信區(qū)間為40.83萬元50.13萬元。1/45.48niixxn0.0251.96z/21545.48 1.9645.484.6540 xznm1.假設假設 m總體標準差未知m總體服從正態(tài)分布m2.用用 t 分布分布m3.置信區(qū)間置信區(qū)間XtSnXtSnnn/ ,/ ,2121Zt0t (df = 5)標準正態(tài)分布 t (自由度df = 11)m1. 當樣本統(tǒng)計量被計算出以后可以自由改變的觀測值數(shù)目m2. 舉例m3 個數(shù)之和是 6X1 = 1 (或其他數(shù))X2 = 2
25、(或其他數(shù))X3 = 3 (不能改變)Sum = 6m自由度df=n1=2m沿用引例,假定該房地產(chǎn)公司在某日隨機抽取16位二手房購買者,得到二手房交易額如下表所示(萬元)。 m根據(jù)以往交易情況得知:二手房交易額服從正態(tài)分布,但總體方差未知。試在95%的置信水平下估計二手房平均交易額的置信區(qū)間。 63.422.6554879.437.542.84836.52745.233.54136.230.549m已知n=16;計算得到樣本均值 ;m樣本標準差s=14.175;m由1 0.950.95,查表得:m于是在95%的置信水平下的置信區(qū)間為:m即(35.923,51.027)。m結果表明:在95%的置
26、信水平下,二手房交易額的置信區(qū)間為35.923萬元51.027萬元;即該公司可以有95%的把握認為,二手房交易額介于35.923萬元到51.027萬元之間。 43.475x 0.05152.131t/214.17543.4752.13143.4757.55216sxtnm獨立樣本(獨立樣本(Independent sample):):兩個樣本是從兩個總體中獨立地抽取的,即一個樣本中的元素與另一個樣本中的元素相互獨立。 1.大樣本條件下大樣本條件下 (1)在兩個總體的方差 1 12 2和 2 22 2均已知的情況下, 兩個總體均值之差的置信區(qū)間為:221212/212()xxznn(2)在兩個總
27、體的方差 1 12 2和 2 22 2均未知的情況下,可用兩個樣 本的方差s1 12 2和s2 22 2代替。 這時,兩個總體均值之差的置信區(qū)間為:221212/212()ssxxznnm沿用引例,為對比2009年第一季度與2008年第四季度二手房交易的差異,該房地產(chǎn)中介公司從2009年第一季度的交易中隨機抽取36個,得到二手房交易額如下表所示(單位:萬元) 55.448.6524982.47267.542.84836.57745.233.54136.539.23948.64842.83645804541.253.51055245.53158.17276.2514996m將以上數(shù)據(jù)和前例中20
28、08年第四季度二手房交易額進行整理,得到m根據(jù)以上數(shù)據(jù),試以95%置信水平估計2009年第一季度與2008年第四季度的二手房平均交易額差值的置信區(qū)間。 2008年第四季度2009年第一季度樣本容量4036樣本均值(萬元)45.4853.88樣本標準差(萬元)17.0918.10m由于兩個樣本相互獨立,且均為大樣本,因此兩個樣本的均值之差服從正態(tài)分布。 m在95%置信水平下做出區(qū)間估計如下:m即(16.45,0.35)。m結果表明:有95%的把握認為,總體平均交易額的差異介于16.45萬元0.35萬元之間,即2009年第一季度比2008年第四季度的二手房平均交易額顯著上升。22221212/21
29、217.0918.10()(45.4853.88) 1.964036 8.408.05ssxxznn m獨立樣本(獨立樣本(Independent sample):): 2.小樣本條件下小樣本條件下 (1)當兩個總體的方差均已知時,可用前式建立兩個總體均 值之差的置信區(qū)間 。(2)當兩個總體的方差 1 12 2和 2 22 2均未知,且 1 12 2 2 22 2時,可用 兩個樣本的方差s1 12 2和s2 22 2計算總體方差的合并估計量sp p2 2 。221122212112pnsnssnn這時,兩個樣本均值之差經(jīng)標準化后服從自由度為的t分布。兩個總體均值之差的置信區(qū)間為:212/212
30、1211()(2)()pxxtnnsnnm沿用引例,為對比北京市不同地區(qū)二手房交易額的差異,該房地產(chǎn)中介公司從中關村和望京地區(qū)兩個營業(yè)部2009年第一季度的二手房交易中各抽取8個,得到二手房交易額如下表所示:m假定兩個地區(qū)的二手房交易額服從正態(tài)分布,且方差相等。試以95%置信水平估計2009年第一季度中關村和望京地區(qū)的二手房平均交易額差值的置信區(qū)間。中關村75.2626486.87265.558103.5望京地區(qū)45.53158.17250.2514996m已知n=16,總體方差未知;計算得m由1- 0.95,0.95,88214查表得m于是在95%置信水平下的置信區(qū)間為22121273.37
31、5,56.6,229.81,385.77xxss0.05/2(14)2.145t212/2121211 ()(2)()11(73.37556.6)2.145307.79 ()8816.775 18.816pxxtnnsnnm即(2.041,35.591)。m結果表明:有95%的把握認為,總體平均交易額的差異介于2.041萬元到35.591萬元之間。m本例中,所求置信區(qū)間包含0,說明我們沒有足夠的理由認為2009年第一季度中關村地區(qū)和望京地區(qū)的二手房平均交易額存在顯著差異。 m獨立樣本(獨立樣本(Independent sample):): 2.小樣本條件下小樣本條件下 (3)當兩個總體的方差1
32、2和22均未知,且1222時,如果兩個總體都服從正態(tài)分布且兩個樣本的容量相等n1=n2,則可用下列公式建立兩個總體均值之差的置信區(qū)間:221212/21212()(2)ssxxtnnnnm獨立樣本(獨立樣本(Independent sample):): 2.小樣本條件下小樣本條件下 (4)當兩個總體的方差12和22均未知,且1222時,如果兩個樣本的容量不相等n1n2,則兩個樣本均值之差經(jīng)標準化后近似服從自由度為d的t分布,兩個總體均值之差的置信區(qū)間為:221212/212()( )ssxxtnnd22212122222121212()()()11ssnnssnnnnd其中,m配對樣本(配對樣
33、本(Matched sample) 即一個樣本中的數(shù)據(jù)與另一個樣本中的數(shù)據(jù)相對應。 1. 大樣本條件下大樣本條件下,兩個總體均值之差的置信區(qū)間為: 2. 小樣本條件下小樣本條件下,兩個總體均值之差的置信區(qū)間為:_/ 2ddzn_/21dsdtnn其中,d-為各差值的均值;當總體標準差未知時,可以用樣本差值的標準差替代 。m沿用引例。為比較分析北京市同一地區(qū)不同年份二手房價格的差異,該房地產(chǎn)中介公司從中關村地區(qū)2008年第四季度的二手房交易中,抽取了8個交易;并根據(jù)2009年當月市場行情,分別對這8個房源進行重新估價,得到二手房交易額如下表所示(單位:萬元)。m假定二手房交易額服從正態(tài)分布,且方
34、差相等。試以95%置信水平估計中關村地區(qū)2009年第一季度和2008年第四季度的二手房平均交易額差值的置信區(qū)間。2008年交易額55.2625466.84462.558103.52009年市場估價64.569.564.87850.272.165109差額-9.3-7.5-10.8-11.2-6.2-9.6-7-5.5m已知n=8,總體方差未知;計算得。m由1-0.95,查表得m在95%置信水平下的置信區(qū)間為:m即(10.172,6.604)。m結果表明:有95%的把握認為,總體平均交易額的差異介于10.17萬元6.60萬元之間。即認為中關村地區(qū)2009年第一季度比2008年第四季度的二手房平均
35、價格有顯著提高。1263.25,71.64,8.388,2.134dxxds 0.05/2(7)2.365t_/22.13418.3882.3658.388 1.7848dsdtnn m1.假設 m總體服從二項分布 m可以用正態(tài)分布近似估計mn p 5 且 n (1 - p) 5m2.置信區(qū)間估計/21pppznm1.假設 m總體服從二項分布 m可以用正態(tài)分布近似估計mn p1 5 且 n (1 - p1 ) 5; mn p2 5 且 n (1 p2 ) 5m2.置信區(qū)間估計112212/21211ppppppznnm根據(jù)前例的數(shù)據(jù),整理得出2009年第一季度與2008年第四季度交易額在43萬
36、元以上的二手房交易數(shù)量及所占比例,試在95%置信水平下估計這兩個時期,交易額在43萬元以上的二手房交易所占比例的差值的置信區(qū)間。整理數(shù)據(jù)如下 :2008年第四季度2009年第一季度樣本容量n403643萬元以上的交易數(shù)量2125所占比例p52.50%69.44%m已知m在95%置信水平下的置信區(qū)間為:m即(38.5%,4.62%)。m結果表明:有95%的把握認為,兩個年份價格在43萬元以上的二手房交易所占比例的差異介于-38.50%到4.62%之間。本例中,所求置信區(qū)間包含0,說明我們沒有足夠的理由認為2009年第一季度與2008年第四季度交易額在43萬元以上的二手房交易所占比例存在顯著差異。
37、121240,36;52.5%,69.44%.nnpp112212/21211 52.5% (1 52.5%)69.44% (1 69.44%)(52.5%69.44%) 1.96403616.94%21.56%ppppppznn m1.假設 m 總體服從正態(tài)分布m2.用 分布m3. 置信區(qū)間:222222/21/211nsnsm沿用前例(40個樣本),假定二手房的交易額服從正態(tài)分布。試在95%的置信水平下估計2008年第四季度二手房交易額方差的置信區(qū)間。 m計算得m由0.05m在95%置信水平下的置信區(qū)間為:m即(191.99%,466.3);相應地,總體標準差的置信區(qū)間為(13.86,21.59)。m結果表明:有95%的把握認為,2008年第四季度二手房交易額的標準差介于13.86萬元到21.59萬元之間。 245.48,292.13;xs22221/20.975/20.02513924.433,13959.342nn240 1292.1340 1292.1359.34224.433m假定E (Error)是在一定置信水平下允
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 滄州房地產(chǎn)租賃市場調(diào)研及市場預測合同
- 形狀記憶合金伸縮縫安裝技術
- 呼叫中心員工培訓
- 波羅的海白海標準定期租船合同
- 睡眠呼吸暫停綜合征的護理
- 中西方教育模式對比分析
- 中班健康活動能干的值日生
- 中小學女生青春期心理健康教育
- 培訓內(nèi)容分類
- 公休座談會流程規(guī)范
- 2024-2025教科版一年級下冊科學期末考試卷及參考答案
- 國開2024年《JavaScript程序設計》形考1-3答案
- 端子壓接技術標準
- 消費經(jīng)濟學完整整套教學課件
- 機械特性測試儀操作規(guī)程
- 超星學習通藝術美學(蘇州大學)章節(jié)答案
- 護理查房高位截癱584
- GA 1524-2018射釘器公共安全要求
- 植物學第三小組名錄
- 2023年贛南師范大學科技學院輔導員招聘考試筆試題庫及答案解析
- 電腦的認識 完整版課件
評論
0/150
提交評論