




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、 PAGE 70 計量經(jīng)濟學(xué)導(dǎo)論第2章 計量經(jīng)濟學(xué)的基礎(chǔ)工具 PAGE 71柏第頒2吧章 計量經(jīng)濟暗學(xué)的基礎(chǔ)工具搬在第1章中定義扒了計量經(jīng)濟學(xué)的稗主要工具是數(shù)學(xué)凹,包括優(yōu)化理論斑和統(tǒng)計分析。這靶些工具的基礎(chǔ)知敗識是計量經(jīng)濟學(xué)辦的基礎(chǔ)知識。盡版管這些知識在所邦有的專業(yè)書籍中瓣都可以找到,但伴是考慮到知識的岸連貫性和應(yīng)用的按便利,這里將以叭一章來介紹這些骯基本知識,以備霸那些需要的讀者啊參考。關(guān)于矩陣柏部分,主要參考昂了Sydsae挨ter,Str百om和Berc昂h(2001)胺的文獻,關(guān)于概壩率統(tǒng)計及其推斷啊部分,主要參考扮了古亞拉提(2扳000)的文獻霸,古扎拉蒂(2扒004),Sy澳dsa
2、eter拌,Strom和柏Berch(2佰001)以及王敗文中(2003扒)的文獻。2.1 矩陣凹2.1.1 翱矩陣的定義吧稱為背階矩陣襖,其中鞍a吧ij疤稱為位于矩陣的敗第搬行和第扳j絆列的元素。簡記埃。當敗時,稱矩陣為稗階方陣叭,安稱為凹的矮n芭階行列式絆。如果案則稱該方陣為氨n案階單位矩陣唉,記為白。有把=1捌。邦是對角矩陣的特斑殊形式。一般的芭對角矩陣記為絆并有霸 拌 般 吧 胺矩陣挨的名稱是由其元背素的變化決定的矮。比如,所有元挨素都為0的矩陣阿叫扮零矩陣礙,所有位于主對扒角線下面的元素佰均為0,則稱岸為絆上三角矩陣笆,反之則叫八下三角矩陣擺。定義跋為矩陣凹的矮轉(zhuǎn)置艾,記為瓣。當按時
3、,如果哀,巴稱為巴對稱矩陣;芭如果哀,壩稱為絆反對稱矩陣拜;如果百,則懊是罷冪等矩陣邦;如果扳,則稗是愛對合矩陣瓣;若矮,則笆是芭正交陣拔且氨;如果艾或霸,則吧稱為背奇異的背或巴非奇異的瓣。一個高階矩陣骯,根據(jù)實際需要扒,可分成若干小翱塊。比如艾可分成四塊:案其中安為安階矩陣絆,且藹如果版是滿足條件熬的最大白拌階方陣,則稱八的藹秩骯為啊r八,記為佰設(shè)傲,擺,則有、半設(shè)八為拌n伴階方陣,辦的疤跡稗定義為主對角線辦上所有元素之和扒,即辦2.1.2 唉矩陣的計算及其哀性質(zhì)斑同階矩陣的加、襖減等于它們的對昂應(yīng)元素相加、減霸后的矩陣。靶兩個矩陣可乘的澳條件是第一個矩拔陣的列數(shù)等于第百二個矩陣的行數(shù)半,并
4、且它們的乘唉積所得的矩陣的俺階數(shù)由第一個矩跋陣的行數(shù)和第二藹個矩陣的列數(shù)決罷定,其元素由第懊一個矩陣相應(yīng)的皚行向量和第二個熬矩陣列向量的對懊應(yīng)元素乘積的和盎組成。稗分塊矩陣的加、挨減和乘可形式上巴比照一般矩陣的隘類似做法,此時罷記住分塊矩陣的耙每個分塊可視做埃相應(yīng)矩陣的元素板。啊矩陣的加法滿足扳結(jié)合律和交換律扒。俺矩陣的乘法滿足哎結(jié)合律。拔矩陣的乘法和加哎法滿足分配律。笆不過,記住矩陣斑的乘法一般不滿皚足交換律。這一絆點從矩陣的乘積熬定義中很容易理暗解。搬性質(zhì)2.1 頒方陣藹可逆的充分必要般條件是絆如果方陣扮可逆,方陣骯的鞍逆矩陣扳的求法如下:叭其中辦伴隨矩陣隘定義為懊是元素暗的版代數(shù)余子式罷
5、,其定義為從矩案陣安中劃去第安i霸行和第阿j伴列后剩余的矩陣氨的行列式再乘上捌。版分塊矩陣的逆的靶求法霸設(shè)方陣笆分成四塊如下:霸如果扒存在,則佰的拔逆班可表示成:其中。般如果拜存在,則拌的阿逆哀可表示成:其中。擺矩陣的指數(shù)形式熬和導(dǎo)數(shù)形式分別凹表示為:,頒矩陣的導(dǎo)數(shù)等于敗各個元素分別求巴導(dǎo)后的矩陣。對哎于矩陣霸和列向量笆,有以下求導(dǎo)公版式:敗性質(zhì)2.2 擺設(shè)俺,霸。則有:板2.1.3 叭復(fù)矩陣的定義和板性質(zhì)哀元素在復(fù)數(shù)域的罷矩陣稱為罷復(fù)矩陣辦。下面把復(fù)矩陣安的某些定義和基奧本性質(zhì)敘述板 絆如下。頒定義2.1 捌設(shè)懊為一個復(fù)矩陣,襖則有隘稱為襖的共扼矩陣。暗稱為啊的共扼轉(zhuǎn)置。巴稱為Hermi頒t
6、ian矩陣,板如果班。翱稱為把酉矩陣敖,如果稗。爸性質(zhì)2.3 矮設(shè)挨為復(fù)矩陣。則頒是實的,當且僅拔當背。挨如果挨是實的,安是Hermit礙ian矩陣,當把且僅當邦是對稱的。唉性質(zhì)2.4 百設(shè)襖和耙為復(fù)矩陣,盎為復(fù)數(shù)。則有。氨2.1.4 藹特征值與特征向斑量阿定義2.2 扮設(shè)伴是邦n壩階方陣。罷稱為凹的特征值, 特征值的一個顯然性質(zhì)就是使得方陣的秩小于n。柏如果拔滿足以下方程伴根據(jù)代數(shù)基本原絆理,矮是隘的柏n板階代數(shù)方程,在澳復(fù)數(shù)域里,存在八n吧個根。這些根叫罷做邦的搬特征值隘。對于每一個特挨征值暗,把,存在一個非零哀向量瓣使得班稱為襖關(guān)于俺的邦特征向量叭。特征值很重要矮,現(xiàn)在把一些相捌關(guān)性質(zhì)敘
7、述如下隘。安性質(zhì)2.5 跋設(shè)皚為多項式。如果半為跋的特征值,則敖為阿的特稗 盎征值。敗性質(zhì)2.6 跋當且僅當0不是胺的特征值時,方襖陣佰可逆。若拔可逆且懊為案的一個特征值,斑則懊為矮的一個特征值。擺性質(zhì)2.7 唉當且僅當爸的極限是零矩陣笆(愛)時,啊的所有特征值的百模嚴格小于1。按性質(zhì)2.8 頒設(shè)翱和皚為同階矩陣。則懊和扮有相同的特征值傲。靶性質(zhì)2.9 瓣如果骯是對稱矩陣且僅絆有實元素,則挨的所有特征值是般實的。柏性質(zhì)2.10 皚 襖如果拌是佰的特征多項把式,則愛是柏的所有挨階主子式的和(捌共有岸個主子式的和)凹。扒稱為把的昂特征值方程哀或壩特征方程霸。跋性質(zhì)2.11 挨 半是可對角化的充哎分
8、必要條件是存挨在稗矩陣和對角矩陣柏使得白,氨與笆有相同的特征值爸。八性質(zhì)2.12 澳 襖如果邦有敖n皚個不同的特征值拜,則笆可對角化。扒譜定理 吧如果邦是對稱的且有特澳征值叭,則存在一個正扳交陣藹,使得耙Jordan分捌解定理 懊如果笆有礙n氨個特征值佰,則存在可逆矩翱陣凹,使得白其中,拔且罷是翱矩陣,襖,背Shur引理 耙 熬設(shè)礙為一個復(fù)矩陣。巴則存在酉矩陣俺使得壩是一個上三角矩啊陣。氨Hermiti隘an矩陣的譜定俺理 唉設(shè)愛是一個Herm罷itian矩陣叭。則存在酉矩陣斑使得壩是一個對角矩陣按。所有罷的特征值都是實凹的。捌性質(zhì)2.13 案 皚給定唉,對任意扮,存在矩陣擺有昂n罷個不同的特
9、征值懊,使得跋考慮二次型 辦,其中,且性質(zhì)2.14扳是正定的,當且版僅當岸對所有隘x癌成立或般或版的所有特征值都佰是正的。搬是半正定的,當瓣且僅當擺笆對所有絆x唉成立或埃凹或頒的所有特征值都矮是非負的。昂是負定的,當且凹僅當暗對所有敖x扒成立或礙或昂的所有特征值都澳是負的。叭是半負定的,當唉且僅當襖對所有笆x盎成立或岸哀或爸的所有特征值都叭是非正的。哀是不定的,當且敖僅當挨對某些傲x鞍成立或拌對某些捌i翱成立或辦的特征值有正有拜負。奧本節(jié)的所有性質(zhì)耙都有很好的含義阿,考慮到篇幅有捌限以及解釋所依礙據(jù)的相關(guān)知識已盎經(jīng)超出了本書的熬設(shè)想,我們只好拜把這些性質(zhì)羅列按出來,僅供參考耙。笆2.2 概率暗
10、與統(tǒng)計初步板本節(jié)主要回顧一拜些概率與統(tǒng)計的拔基本知識。鞍2.2.1 拜基本概念扒對世界上各種事敖物或現(xiàn)象的描述巴方式有確定性描跋述和不確定性描凹述。比如根據(jù)經(jīng)挨驗,地球上的每熬一天,太陽總是白從東邊升起,西礙邊落下,以及明癌天中午12點整皚,廣州將會下雨拌。前者為確定性皚描述,后者則是半不確定性描述,愛或者說是一個概奧率事件。概率統(tǒng)罷計是研究不確定皚性現(xiàn)象的理論。皚這個理論無疑變斑成了計量經(jīng)濟學(xué)跋的重要工具。邦“百不確定性奧”絆,比如拋一枚硬岸幣 這里所提到的“硬幣”、“骰子”等都暗含著這樣一層意思:它們的質(zhì)地均勻,沒有瑕疵。挨到桌面上,理論擺上出現(xiàn)兩種等可叭能結(jié)果:正面朝鞍上或反面朝上,白這
11、種不確定現(xiàn)象奧的實驗就叫做搬統(tǒng)計或隨機實驗敗。所有可能的隨伴機實驗結(jié)果的集礙合就叫做暗樣本空間或總體皚。樣本空間的每艾一個元素,如拋奧一次硬幣實驗中敗的瓣“襖正面朝上吧”安或凹“版反面朝上昂”罷,稱為樣本空間敗的一個背樣本點扮。樣本空間的每挨一個子集稱為班事件埃,即隨機實驗的襖可能結(jié)果的集合笆。最大的事件就搬是樣本空間,即爸是必然事件,理扒論上最小的事件芭是空集,也就是矮說隨機實驗沒有把發(fā)生。在實際應(yīng)巴用中,人們剔除把空集這一事件和骯必然事件。因此暗,拋一次硬幣實邦驗的事件有兩個暗,即扳“隘正面朝上罷”背、矮“靶反面朝上耙”熬。如果等可能拋按硬幣按次,壩“拜正面朝上的次數(shù)吧”頒是一個隨機事件癌
12、,其可能取值的敗結(jié)果是:骯。跟所有可能結(jié)擺果聯(lián)系起來的唉“擺正面朝上的次數(shù)愛”背就是隨機變懊 敗量,也就是說以矮隨機實驗的結(jié)果疤為取值范圍的變凹量就叫做疤隨機變量稗。隨機變量所取敗值的集合如果是芭離散的就稱為背離散型隨機變量壩;扳如果是連續(xù)的就笆叫做板連續(xù)型隨機變量佰。翱在隨機變量的取靶值范圍內(nèi),對離胺散隨機變量而言半,隨機變量取到暗某個或某些值的班可能程度有多大鞍?在探討這個問把題之前,本書將背要引入概率的相胺關(guān)知識。愛擲一顆骰子,向板上的數(shù)字只有六拌個等可能結(jié)果:捌1,2,3,4班,5,6。如果案求事件扒“敖數(shù)字小于4的面板朝上翱”伴的可能概率是多背少,結(jié)果就是1凹/2。因為擲一搬次骰子數(shù)
13、字向上埃的可能結(jié)果有6跋個,事件盎“拌數(shù)字小于4的面霸朝上邦”背含有三個樣本點扳,后者比前者就奧得到所要的結(jié)果挨。此時的樣本空盎間或總體是指集辦合盎。到此,我們可奧以給出事件斑發(fā)生的古典概率斑如下:案表示在所有可能笆的實驗結(jié)果中,叭就某一個事件罷發(fā)生的可能程度安。奧例2-1 凹房地產(chǎn)開發(fā)企業(yè)擺的資產(chǎn)負債率如昂表2-1所示。礙表2-1 房骯地產(chǎn)開發(fā)企業(yè)的百資產(chǎn)負債率罷年 份版資產(chǎn)負債率(%般)挨1997案76.2傲1998伴76.1靶1999案76.1絆2000埃75.6皚2001板7壩5.0疤2002笆74.9背2003拔75.8叭資料來源:20敖04年中國統(tǒng)計擺年鑒稗按照1%的幅度罷把資產(chǎn)負
14、債率分巴成三個區(qū)間:艾74%頒, 礙75%挨)半,75%奧, 伴76%背)爸,胺 靶76%澳, 拜77%把)岸,并計算相應(yīng)的哀頻數(shù)和頻率如表壩2-2所示。翱表2-2 資礙產(chǎn)負債率的頻數(shù)昂和頻率巴區(qū) 間懊頻 數(shù)扒頻 率拌74%,75襖%半)百1岸75%,76按%霸)巴3艾76%,77霸%按)靶3把通常情況下,頻胺率可以當作概率伴來使用。因此,芭關(guān)于資產(chǎn)負債率骯的概率柱狀分布岸圖,如圖2-1埃所示。百在本節(jié)中,罷表示事件,邦表示事件背的概率。概率的艾基本性質(zhì) 安 如下:笆搬 熬任何事件耙的概率都位于0百與1的閉區(qū)間內(nèi)皚,即0胺,鞍1。邦概率等于0的事芭件是不可能或沒盎有發(fā)生的事件,按概率等于1的事
15、柏件是必然發(fā)生的扒事件。比如,每隘天太陽都從東邊跋升起這一事件是哎必然事件,其概靶率為1,愛“頒農(nóng)歷初一月圓岸”骯這一事件是不可斑能的事件,其概扮率為0。用公式熬表示如下:熬0辦奧P稗(稗A唉)啊爸1區(qū)間概率頒圖2-1 資霸產(chǎn)負債率的概率懊柱狀分布盎半 相互獨立事件艾的和或積的概率半等于各個事件概芭率的和或積。霸比如事件頒相互獨立,則班稱為傲聯(lián)合概率哀,把稱為澳非條件概率奧或霸邊緣概率礙。如果事件笆不相互獨立,則翱有:半此時,聯(lián)合概率辦就等于邊緣概率阿乘上條件概率,隘即扳其中芭表示在事件靶B敗發(fā)生的情況下事敗件熬A辦發(fā)生的概率。上佰式給出了條件概壩率的求法:按澳 癌如果相互獨立事艾件組成一個完
16、備昂事件組,則所有氨事件的和就是必般然事件,其概率瓣為1。伴例2-2 哎假設(shè)盒子里裝有皚兩枚骰子,隨機跋抽取一枚骰子并巴拋到桌面上,計隘算數(shù)字3朝上的氨概率為多少?如搬果假設(shè)拌A柏表示奧“鞍隨機抽取一個骰礙子阿”白,礙B把表示拔“阿數(shù)字3朝上搬”瓣,試求辦A跋+頒B艾的概率。捌第一個問題的事矮件是氨AB搬,這樣,所要求俺的結(jié)果全部列在白表2-3中。絆表2-3 隨邦機事件的概率癌事 件唉概 率搬B埃B案|藹A哀A俺B扮A擺+凹B矮事件是樣本空間斑的子集,隨機變瓣量所取的值是事伴件可能的數(shù)字表百征,由事件的概背率也就可求得隨熬機變量的概率。礙接著,概率密度挨函數(shù)也隨之給出疤。懊2.2.2 拌 跋概
17、率密度函數(shù)昂概率密度函數(shù)暗的曲線表示隨機礙變量靶X哎取所有可能值概百率的集合的幾何白表述。對于隨機扒變量熬X氨所取的每一個可跋能值按,通過對應(yīng)關(guān)系挨“笆”敗,存在一個惟一疤的概率爸,即暗,與之對應(yīng)。事拌件與隨機變量通昂過概率密度函數(shù)傲和概率聯(lián)系起來吧了。當傲是離散型隨機變擺量時,概率密度爸函數(shù)可表示為:稗當暗是連續(xù)型的隨機胺變量時,癌累積分布函數(shù)伴可表示為:版如果實驗結(jié)果由百至少兩個隨機變唉量來表示,即一艾個結(jié)果是通過兩百個變量取值后才柏能確定。這時的襖相應(yīng)概率密度函吧數(shù)就是多元的。啊類似地,多元密捌度函數(shù)也一樣表艾示,比如離散型吧二元密度函數(shù)芭可表示為:盎其中芭表示辦聯(lián)合概率般。相應(yīng)的傲條件
18、密度函數(shù)扒是:鞍如果隨機變量是扮相互獨立的,則壩聯(lián)合密度函數(shù)等奧于邊緣密度函數(shù)擺之積:翱圖2-1給出了俺概率密度分布。皚設(shè)扮X啊表示資產(chǎn)負債率把的頻數(shù),氨表示與 叭之相應(yīng)的概率密隘度,則根據(jù)例2礙-1,得到以下拔概率密度和累積哀分布函數(shù)如表2翱-4所示。搬表2-4 哀 俺概率密度和累積巴分布函數(shù)哀X斑f哎(翱X澳)版X把F壩(稗X疤)擺1凹根據(jù)表2-4,壩可以做出累積分疤布函數(shù)的圖形,稗如圖2-2所示罷。辦圖2-2 捌 頒資產(chǎn)負債率的概罷率的累積分布函百數(shù)半密度函數(shù)的數(shù)字壩特征有:瓣(1)離散型隨氨機變量吧X按的期望值瓣,即總體趨勢的伴度量,也就是所皚有離散型隨機變辦量耙X搬與其概率密度函凹數(shù)
19、笆乘積的和,即襖在這里,應(yīng)注意芭的是概率密度函愛數(shù)起到了權(quán)重的襖作用。比如表2邦-1的房地產(chǎn)企柏業(yè)的資產(chǎn)負債率澳的期望是:捌(2)期望的性爸質(zhì):不變性,即巴常數(shù)的期望等于疤自己;線性性,百即隨機變量和的案期望等于隨機變拌量期望的和;分熬離性1,即相互挨獨立隨機變量積疤的期望等于隨機凹變量期望的積;板分離性2,即數(shù)拜與隨機變量乘積伴的期望等于該數(shù)暗乘上隨機變量的俺期望。拔(3)離散型隨艾機變量巴X艾的方差骯或芭,即離散程度的奧度量,也就是隨把機變量與期望差岸的平方的期望,疤記作:傲稱為標準差。方巴差描述了隨機變啊量取值的集中程白度,也就是說,岸方差越小,隨機擺變量取值的范圍壩就越小,或數(shù)值隘越集
20、中于均值或把期望。辦表2-1的房地跋產(chǎn)企業(yè)的資產(chǎn)負把債率的方差, 注意公式的分母是“7”,這是嚴格按照定義計算的。實際上,分母應(yīng)該是“6”。關(guān)于這點,將在后面說明。爸其計算如下:俺(4)方差的性稗質(zhì):常數(shù)的方差敖等于0;兩個獨罷立隨機變量相加班或相減的方差等半于相應(yīng)隨機變量埃方差的和;數(shù)與疤隨機變量乘積的挨方差等于該數(shù)平襖方再乘上隨機變岸量的方差。凹期望和方差描述藹的是單變量的密伴度函數(shù)的數(shù)字特瓣征。對于多維的埃密度函數(shù)的數(shù)字疤特征,要用協(xié)方矮差和相關(guān)系數(shù)來懊描述。 傲設(shè)敖為兩個離散型隨佰機變量,其協(xié)方胺差把定義為:壩這個表達式可改霸寫成:礙當邦時,柏,即方差是協(xié)方靶差的特殊情形。盎(5)隨機
21、變量耙X癌,拜Y奧的埃cov(凹X骯,辦Y板)背的性質(zhì)如下:傲若按相互獨立,則伴。艾對于任意常數(shù)胺,有襖。壩(6)協(xié)方差和絆方差的關(guān)系如下艾:埃協(xié)方差八描述了爸的相關(guān)關(guān)系。對絆于這種關(guān)系,有暗更好的表示:相巴關(guān)系數(shù)扒。即阿相關(guān)系數(shù)艾描述了吧的相關(guān)關(guān)系,即啊為正數(shù)表示氨是正相關(guān)關(guān)系,搬為負數(shù)表示捌是負相關(guān)關(guān)系,熬等于0表示稗沒有相關(guān)關(guān)系。氨相關(guān)系數(shù)與協(xié)方爸差的符號一致,癌同為正或負或零盎,而且相關(guān)系數(shù)襖界于拌-壩1和+1之間。扒例2-3 敖現(xiàn)在考慮全國別啊墅、高檔公寓與辦經(jīng)濟適用房的平扒均售價的相關(guān)系熬數(shù)和協(xié)方差。有胺關(guān)原始數(shù)據(jù)如表擺2-5所示。罷表2-5 全盎國別墅、高檔公擺寓和經(jīng)濟適用房芭屋
22、的平均售價擺年 份愛別墅、高檔公寓霸(元/盎m絆2懊)扮經(jīng)濟適用房屋(骯元/哎m埃2霸)叭1997八5382班1097擺1998襖4596白1035疤1999盎4503敖1093艾2000安4288吧1202搬2001暗4348岸1240隘2002捌4154爸1283白2003版4145吧1380背資料來源:20靶04年中國統(tǒng)計懊年鑒計算結(jié)果如下:稗別墅、高檔公寓背與經(jīng)濟適用房的班相關(guān)系數(shù)協(xié)方差壩分別為:白-八0.659疤盎734矮絆958半盎233班和埃-耙344挨俺94.833俺胺758百板6八別墅、高檔公寓壩與經(jīng)濟適用房的哀平均售價是負相哎關(guān)的,如圖2-案3所示。別墅、高檔公寓平均售價年
23、份平均售價(元/m2)經(jīng)濟適用房屋平均售價盎圖2-3 別熬墅、高檔公寓與版經(jīng)濟適用房的平拌均售價的相關(guān)性啊概率密度函數(shù)的襖數(shù)字特征除了以愛上介紹的外,這扒里再介紹三個:拜條件期望值和概凹率密度函數(shù)的偏八度及峰度。胺(7)條件期望擺值定義為:盎(8)隨機變量澳X矮的挨n澳階中心矩定義為案:盎當艾時,一階中心矩伴是0;當敗n凹=2案時,二階中心矩唉就是隨機變量的扮方差。方差衡量昂了分布的緊疏狀氨況,然而,概率拜密度函數(shù)的對稱笆性和分布的寬窄礙則分別由概率密疤度函數(shù)的偏度和絆峰度來刻畫。扮概率密度函數(shù)的板偏度襖S班定義為:佰當靶礙0時,概率密度壩函數(shù)的幾何圖形哀右偏;當按3辦時,概率密度函跋數(shù)的分布
24、是高峰哀態(tài)的;當霸3扳時,概率密度函鞍數(shù)的分布是低峰白態(tài)的,如圖2-芭5所示。邦圖2-5背 俺概率密度函數(shù)分柏布的峰度示意圖邦從表2-5的經(jīng)霸濟適用房的平均岸售價數(shù)據(jù)可做出搬以下頻數(shù)柱狀分搬布圖:澳圖2-6是右偏挨低峰態(tài)的漸進正佰態(tài)分布圖,其偏癌度為:班0.2322板23扮,峰度為:盎1.8578藹36拔。相比之下,別搬墅、高檔公寓的案平均售價呈現(xiàn)出拜較大的右偏高峰暗態(tài)柱狀分布,其挨偏度和峰度分別哎為:盎1.4390捌03愛和艾3.8602隘36罷。2.02.50.00.51.0 1.51100 1400 1300 1200 1000 絆圖2-6 經(jīng)白濟適用房平均售罷價頻數(shù)的柱狀分伴布圖斑2.
25、2熬.3 敗 敗樣本與樣本空間吧前面求得的期望捌值、方差、協(xié)方扒差、條件期望值暗、峰度、偏度等安都是在樣本空間半內(nèi)求的總體概率拌密度函數(shù)的數(shù)字礙特征。在實際工啊作中,人們往往半難于掌握樣本的皚總體狀況,而只罷是掌握其中某些癌數(shù)據(jù),如何通過藹這些樣本來估算俺或判斷總體樣本霸的情況,則是一扒個艱巨的任務(wù)。瓣比如,要評估全啊國人口平均的生澳活水平,人們很把難通過全國人口癌普查來實現(xiàn),而伴是通過局部抽樣叭調(diào)查來提供判斷霸的依據(jù)。為此,笆掌握樣本的數(shù)據(jù)百特征求法是必要搬的步驟。下面就半來實現(xiàn)這樣的步昂驟。1樣本均值翱設(shè)白(靶)板是隨機抽取關(guān)于啊隨機變量凹的某個實驗的懊n芭個樣本值,則隨罷機變量案的樣本均
26、值拔定義為:懊這個定義的阿n翱表示樣本的容量骯。通常情況下,拜總體期望往往是拌不清楚的,需要斑通過樣本的均值昂來估計。如何去頒評估樣本均值與胺總體期望之間的哀偏差,這是 霸衡量抽樣成功與頒否的關(guān)鍵之所在芭。這個問題留到阿以后需要時再討懊論。后面所介 吧 紹的樣本數(shù)字挨特征都是對總體案數(shù)字特征的估計叭,有關(guān)的討論也柏將留到以后適當辦時做出。2樣本方差按設(shè)安(案)挨是隨機抽取關(guān)于捌隨機變量盎的某個實驗的艾個樣本值,則埃的樣本方差跋定義為:安在樣本方差定義瓣中,分母是罷,而不是阿,原因是隨機變捌量扳,柏,不是獨立的,扮而把(霸)案的任意背個變量是線性無柏關(guān)的。由于這個邦緣故,分母為吧。3樣本協(xié)方差百
27、設(shè)翱和挨(百)艾是隨機抽取分別芭關(guān)于隨機變量癌X笆和敖Y(jié)案的某個實驗的胺個樣本值,則關(guān)皚于隨機變量癌X巴和藹Y把的樣本協(xié)方差翱定義為:靶4樣本相關(guān)系按數(shù)阿通過樣本協(xié)方差板和樣本方差計算拔樣本相關(guān)系數(shù)癌r艾表示為:5樣本偏度把關(guān)于隨機變量板X案的樣本偏度定義矮為: 見王文中(2003)。6樣本峰度傲關(guān)于隨機變量疤的樣本峰度定義巴為:半2.2.4瓣 皚 瓣概率分布簡介藹當求隨機變量的斑數(shù)據(jù)特征時,注哎意到離散型密度稗函數(shù)或連續(xù)型密敗度函數(shù)扮演著重懊要角色。實際上霸,概率密度函數(shù)隘描述了隨機變量芭的分布狀況。人鞍們通常使用的四鞍種概率分布是:芭正態(tài)分布盎、爸分布、安t艾分布和藹F佰分布。下面將簡伴要
28、介紹這四種基頒本的概率分布。1正態(tài)分布稗幾何上,隨機變辦量所取得的所有芭可能值的概率值傲集合就形成了對俺應(yīng)的概率分布。扳比如在一個充分阿大的區(qū)域里,位敖于該區(qū)域內(nèi)某年笆齡段內(nèi)人們的身半高數(shù)的集合具有八正態(tài)分布的特征伴。也就是說關(guān)于骯身高這一隨機變骯量,身高數(shù)圍繞班著全體身高數(shù)平癌均值對稱分布,藹使得這些數(shù)據(jù)的班相應(yīng)概率值所形骯成的圖形面積剛板好以平均值為中壩心分成面積對等斑的兩部分,并且藹整個面積恒為1辦。而且,越靠近白中心,數(shù)據(jù)分布扳得越稠密,其概半率所占的面積也扳越大,離中心越襖遠,數(shù)據(jù)分布越俺稀疏,其概率所奧占的面積也越小瓣。象此類隨機變芭量的概率分布,藹由其總體期望邦和方差捌刻畫出來,
29、如圖隘2-7所示。隨稗機變量的概率密安度的分布有大約敖68%落在區(qū)間愛和密度函數(shù)所圍癌成的區(qū)域內(nèi),大搬約95%落在區(qū)佰間爸和概率密度函數(shù)俺所圍成的區(qū)域內(nèi)班,而約有99.懊7%的概率分布癌落在敗和密度曲線所圍搬成的區(qū)域內(nèi)。芭圖2-7描述的阿幾何圖形是正態(tài)把分布的情形。一百般情況下,樣本八的概率分布未必絆總能呈現(xiàn)出嚴格扒的正態(tài)分布,而胺是往往呈現(xiàn)出有凹偏的漸進正態(tài)分拔布或非正態(tài)分布白。比如,圖2-板6已經(jīng)呈現(xiàn)出了靶右偏低峰態(tài)的漸霸進正態(tài)分布。傲圖2-7 正哎態(tài)曲線下的區(qū)域骯面積分布罷關(guān)于隨機變量罷正態(tài)分布的概率哀密度函數(shù)如下所霸示:藹記做:班。關(guān)于隨機變量埃的密度函數(shù)值的百計算是比較復(fù)雜捌的。所幸
30、的是這翱些密度函數(shù)值可八以通過正態(tài)分布班表直接查到。癌性質(zhì)2-15 澳 岸多個服從正態(tài)分背布的隨機變量的啊線性組合仍然服礙從正態(tài)分布。這叭些隨機變量稱為岸正態(tài)變量跋。叭設(shè)昂和搬為兩個隨機變量熬且分別滿足凹和搬,令笆,則敗為服從正態(tài)分布疤的隨機變量,且拜如果百和拌相互獨立,則案設(shè)翱為正態(tài)變量且滿拜足扳,令安則捌稱為哎標準正態(tài)變量般,記為癌。氨統(tǒng)計學(xué)上,如果艾知道數(shù)據(jù)的總體拌分布是正態(tài)的,板但是不知道總體癌期望和方差,那吧么如何從總體中拜抽樣估計出均值凹和方差呢?一般皚情況下,從正態(tài)矮總體得到的隨機安樣本均值和方差礙可以作為總體的巴期望和方差的估愛計值。但是,如芭果抽樣均值和方頒差未能客觀地反艾映
31、總體的期望和昂方差,而且當獨皚立地得到若干個案隨機樣本時,樣把本的均值和方差埃仍然與總體的均捌值和方差有偏,阿那么該如何處理澳呢?大家知道,安隨機樣本的均值岸仍然是隨機變量熬,如果把這些估熬計量如樣本均值捌作為抽樣樣本,昂能否估計得到真板實的總體值呢?拌為了回答這個問扮題,先得尋找理翱論支持,因為要暗弄清楚局部與整艾體的關(guān)系。如果唉還沒有從理論上罷了解局部與整體笆的關(guān)系,那么,礙任何局部抽樣可爸能面對著這樣一奧個問題:抽樣分扒析結(jié)果可信嗎?板的確,如果理論靶上未能給予肯定癌的回答,那么抽絆樣分析基礎(chǔ)是不澳扎實的。應(yīng)該指挨出的是,這里的懊抽樣是有堅實理爸論基礎(chǔ)的。下面扮將回顧一下相關(guān)絆理論。傲獨
32、立同分布隨機壩變量扳是指構(gòu)成容量為昂的樣本:藹,其中每一個跋是從服從同一個癌概率密度函數(shù)的敗樣本總體中獨立靶抽取的。比如,阿且每個翱是獨立抽取的,隘,則霸是獨立同正態(tài)分哎布的隨機變量。唉統(tǒng)計理論叭 傲若皚且每個版是獨立抽取的,傲,則柏以上定理就是中擺心極限定理。一胺般情況下,可知絆:般中心極限定理哎 骯如果拜是服從期望為壩,方差為百的分布的隨機樣挨本,則隨著樣本般容量的無限增大按,樣本均值鞍趨于正態(tài)分布。奧即頒中心極限定理說哎明:獨立同正態(tài)隘隨機變量,以其按均值作為樣本,藹其更向真實的總吧體期望集中,并般且,隨著均值的癌均值作為樣本,熬樣本將以冪遞增胺的速度向總體均扒值集聚。 若隨機變量獨立且
33、其概率密度函數(shù)未必一致,則當樣本容量無限增大時,在一定條件下,樣本均值仍然近似服從正態(tài)分布(Linberg Fell理論)。見古亞拉提(2000)。凹因此,隨著樣本敖容量的增加,樣奧本的均值和方差罷可以在統(tǒng)計意義暗上替代總體的期埃望和方差。絆現(xiàn)在可以討論從扒正態(tài)總體抽樣的伴方法了。本書將拜介紹兩種方法:瓣解鞋帶抽樣法和扳Monte C扮arlo實驗。邦解鞋帶抽樣法 懊 耙解鞋帶抽樣法實翱際上就是復(fù)原隨巴機抽樣法。具體拔做法是:任給一笆個有限樣本,當巴第一次等可能抽捌取一個結(jié)果后,板再把它放回原樣唉本,然后重復(fù)第伴一次的過程,直敖到抽到符合容量扳要求的樣本。扮現(xiàn)在舉一個例子奧來說明如何使用奧解鞋
34、帶抽樣法。奧假設(shè)有八個序號啊,如000,0跋01,010,白011,100拜,101,11藹0,111,并唉以這8個序號作藹為第一個樣本,扒然后按照解鞋帶版抽樣法生成其他斑樣本,標號為樣罷本1,樣本2等板,直到抽到所需靶的樣本容量為止矮。解鞋帶抽樣法爸適合于那些通過拔有限樣本信息來靶解讀某些特定特敖征的實驗。不妨啊通過解鞋帶抽樣扒法抽出七個樣本擺,如表2-6所矮示。昂表2-6 解八鞋帶抽樣法舉例凹樣熬 邦本翱樣本1礙樣本2絆樣本3翱樣本4哎樣本5懊樣本6骯樣本7罷000拔100鞍100辦111般010暗110唉100扒010頒001俺010案010按110跋010吧111瓣001艾110唉01
35、0熬000邦001愛010敖110敖010懊101熬101吧011礙100澳101凹000按011百001礙001岸011瓣100扳111疤111瓣110耙001案011奧111瓣010傲續(xù)表壩樣扳 鞍本氨樣本1佰樣本2斑樣本3般樣本4澳樣本5啊樣本6扮樣本7啊101唉110暗101半101骯000艾110搬010澳000白110班001百001俺110艾100唉010阿101昂001敗111絆101啊110笆001拜101辦101哎110拜101白Monte C爸arlo實驗 鞍 鞍Monte C昂arlo實驗簡安單來講就是估計礙量(比如樣本均襖值)的樣本分布版法。具體來講就疤是對于給定的任
36、拜意一個有限樣本澳,由解鞋帶方法癌,抽取敗個樣本,再求各板個樣本的均值,把然后再求均值樣巴本的估計量。這板個過程就叫做M疤onte Ca瓣rlo實驗。氨為了求某個總體安的期望和方差,安可采用Mont癌e Carlo稗實驗。比如,研懊究1995案扮2002年期間巴外國人到中國旅案游人數(shù)的總體均爸值和方差。考慮熬到總體樣本采集藹的困難性,這里瓣希望通過七個國哎家到中國旅游人骯數(shù)的統(tǒng)計數(shù)據(jù)來擺估算所有外國人跋到中國旅游人數(shù)佰的均值和方差。按通常情況下,如哎果直接對某個樣捌本求其均值和方拔差,將得到較為唉明顯的估計偏差案。為此,應(yīng)用M矮onte Ca翱rlo實驗,根佰據(jù)1995頒岸2002年的統(tǒng)叭計數(shù)
37、據(jù)來估計總芭體均值和方差如挨表2-7所示。 本書只是介紹Monte Carlo實驗的方法,并沒有對所估計的值作任何檢驗。類似的檢驗將在后面介紹。挨表2-7 M捌onte Ca胺rlo實驗的應(yīng)般用單位:萬人愛國斑 笆 愛別稗1995敖1997把1998扮1999按2000搬2001礙2002氨德國爸16.65扮18.47俺19.19斑21.76搬23.91頒25.34佰28.18矮法國白11.85絆13.13白13.80拔15.56鞍18.50奧19.95挨22.21版意大利扒0澳6.37矮6.51哎7.25阿7.22扒7.78稗7.77斑9.17凹荷蘭霸3.49罷5.23昂5.89鞍7.01搬
38、7.60邦9.30昂10.04拌葡萄牙搬2.56壩3.58板3.85擺4.02氨2.28柏2.68伴3.61氨瑞典伴3.52哀3.85鞍4.06扳4.68安5.36絆5.28凹6.28昂瑞士佰3.43澳3.03拜2.84白2.99癌3.07隘3.08隘3.24癌人數(shù)澳人數(shù)澳人數(shù)礙人數(shù)隘人數(shù)傲人數(shù)半人數(shù)板平均值邦6.84熬7.69罷8.13熬9.03稗9.79隘10.49艾11.82稗平均值樣本的平俺均值氨9.11癌平均值樣本的方般差傲0.737板資料來源:20柏04年中國統(tǒng)計跋年鑒哀注:第一列的國隘別是指七個國家翱,與其相對應(yīng)的搬各行數(shù)據(jù)是相應(yīng)把各年的旅游人數(shù)捌。22分布氨設(shè)稗,則罷。由統(tǒng)計學(xué)
39、知識巴可知,敗服從自由度為1艾的扮分布, 的英文讀法是chikai。跋記做壩。一般情況下,傲設(shè)艾且搬互相獨立,則暗自由度是敖分布的重要參數(shù)般。一般來講,自隘由度是指刻畫某敖個特征,比如樣半本均值或方差,澳以及獨立觀察量絆的個數(shù)。例如,柏樣本方差吧的自由度為澳,因為隘,而任意靶個艾是線性無關(guān)的。八分布隨著自由度暗的增加而趨向正絆態(tài)分布,如圖2安-8所示。22分布的概率密度自由度增加0癌圖2-8 案變量的密度函數(shù)巴分布示意圖版從圖2-8可看般出,柏分布的密度函數(shù)把的定義域是正實岸數(shù)域。自由度越澳小,哀分布越右偏,自昂由度越大,笆分布越呈現(xiàn)出對矮稱的形態(tài)。自由埃度是礙分布的重要特征唉。事實上,可得扒
40、以下性質(zhì):八性質(zhì)2-16 耙 按分布的期望是其笆自由度,方差是奧其自由度的兩倍佰。胺理論上可證明 澳 皚設(shè)樣本方差礙是來自于總體方愛差為靶的正態(tài)分布的隨搬機抽樣樣本,則扳有吧例2-4 安依2003年中艾國35個城市的藹住宅建設(shè)所投入埃的資金(萬元)唉作為原始數(shù)據(jù),挨然后把這些數(shù)據(jù)板擴大一倍,并按背順序把前半部分芭或后半部分加上罷負號,形成樣本胺容量為70的新敗數(shù)據(jù)。同時,讓瓣每一個數(shù)據(jù)均除暗于1瓣拜936板暗034,則這些柏數(shù)據(jù)的概率分布巴呈現(xiàn)出標準正態(tài)敖分布。那么,這半些數(shù)據(jù)的平方就班是服從自由度為胺1的笆分布??紤]到數(shù)罷據(jù)在運算過程中安的系統(tǒng)誤差,所伴得到的數(shù)據(jù)未必胺呈現(xiàn)出嚴格的標拌準正態(tài)
41、分布和安分布,但是可以皚近似地認為樣本扒數(shù)據(jù)滿足理論的癌要求。因此,加哎工后的原數(shù)據(jù)如骯表2-8和表2辦-9所示。罷表2-8 左佰偏高峰態(tài)正態(tài)分氨布的樣本數(shù)據(jù)爸-矮3.27辦E拔+00熬-澳1.00啊E昂+00班-耙0.1172安38拜-胺5.35敗E芭-壩01邦6.75班E擺-疤01安0.3312氨421疤0.4048澳834安-跋7.80艾E拔-靶01暗-捌0.3311背14昂-扒9.16八E拜-唉01傲-板0.4848扒29叭0.2489扒998佰6.45頒E敗-拜01懊0.1023骯515俺-捌0.1865板08敖-氨5.87藹E挨-扒01板-佰9.76哀E拔-叭01疤-艾7.07俺E
42、礙-頒01白0.2587巴491斑0.3913氨909哎0.0657澳318扒-翱0.0882頒51白-澳0.2301百48暗-板0.1551白37佰-擺0.2834柏61安3.49背E敗+00隘1.64巴E辦+00佰0.1444邦432疤-矮0.0639傲31八-凹0.3826耙78愛-骯0.2693把34阿-哀1.29安E把+00壩6.68霸E壩-愛01拌0.1187扒624扮0.1234班069傲-矮6.75礙E捌-氨01昂-礙0.3312捌42埃-矮0.4048把83擺-霸3.27柏E班+00熬1.00板E般+00哀0.1172伴381扒5.35霸E白-熬01擺-壩0.249唉-昂6.
43、45巴E凹-跋01頒-隘0.10235岸2瓣-扒7.80翱E霸-鞍01芭0.3311唉135隘9.16扒E巴-邦01骯0.4848胺293搬-伴0.2587笆49背-藹0.3913拜91笆-吧0.06573擺2扒-爸0.1865扳081拜5.87班E版-白01耙6.68拜E哎-案01澳7.07唉E澳-頒01耙-般3.49懊E熬+00案-礙1.64藹E襖+00哎-傲0.1444敖43疤-敗0.0882懊51岸0.2301辦478凹0.1551澳373扳0.2834罷609罷-隘6.68按E啊-百01懊-岸0.1187安62芭-霸0.123奧407敖-頒0.0639唉307白0.3826襖777癌
44、0.2693艾336罷1.29襖E藹+00靶資料來源:20矮04年中國統(tǒng)計扳年鑒阿表2-9 疤 阿服從自由度為1絆的阿分布的樣本數(shù)據(jù)岸1.07矮E熬+01阿1.00敖E扳+00皚0.01374佰5稗2.86吧E愛-扒01隘4.55敖E佰-俺01辦0.1097罷21頒0.1639愛31半6.08柏E版-百01跋0.1096邦36矮8.40暗E艾-翱01俺0.2350凹59礙0.0620暗01敖4.16邦E版-凹01鞍0.0104案76盎0.034笆785案3.45辦E扒-瓣01叭9.53埃E耙-把01疤5.00半E艾-扒01叭0.0669辦51昂0.1531奧87拜0.0043般21靶0.007
45、7壩88敖0.0529般68岸0.0240扳68唉0.0803吧5氨1.22扒E翱+01邦2.68罷E骯+00翱0.0208昂64安0.0040半87白0.1464背42敗0.0725邦41霸1.67敗E癌+00氨4.46百E胺-氨01澳0.0141般05笆0.0152霸29叭4.55瓣E巴-八01罷0.1097拔21稗0.1639爸31疤1.07俺E八+01扒1.00愛E案+00俺0.0137絆45盎2.86氨E巴-巴01艾續(xù)表版0.0620斑01耙4.16百E哀-扒01班0.0104背76巴6.08挨E疤-板01藹0.1096斑36敖8.40版E襖-傲01骯0.2350巴59懊0.0669
46、伴51巴0.1531笆87捌0.0043芭21昂0.0347百85按3.45胺E霸-捌01白4.46佰E熬-骯01挨5.00板E奧-懊01爸1.22絆E白+01佰2.68吧E白+00敖0.0208翱64般0.0077疤88鞍0.0529爸68阿0.0240壩68敖0.0803俺5俺4.46把E瓣-敖01罷0.0141拌05氨0.0152盎29斑0.0040暗87傲0.1464按42擺0.0725翱41叭1.67芭E辦+00搬資料來源:表2罷-8隘表2-8和表2奧-9的頻數(shù)柱狀鞍分布圖分別如圖襖2-9和圖2-靶10所示。14810462.251.250.00-1.2502-2.25頻數(shù)12愛圖2
47、-9 左斑偏高峰態(tài)正態(tài)分翱布凹注:中值:0.般012百霸371,標準差礙:0.995扒跋919,偏度:隘-挨0.040案懊894,峰度:巴8.266搬擺771。0俺圖2-10 昂自由度為1的樣壩本埃跋2辦分布3t分布岸設(shè)樣本方差愛是來自于總體方斑差為壩的正態(tài)分布的隨擺機抽樣樣本,正佰態(tài)分布的期望為絆。則半如果不知道總體把方差版,而只知道樣本霸方差作隨機變量疤則稱隨機變量翱滿足自由度為靶的懊分布,記做按。絆分布的定義說明辦,如果總體分布敖是均值為襖的正態(tài)分布,其笆方差由隨機抽樣熬樣本方差般代替,則樣本均疤值服從扳分布,襖分布的自由度等皚于樣本方差的自瓣由度。扒分布隨著自由度盎的變化而變化,奧如圖
48、2-11所拜示。伴當自由度趨向無哀窮大時,邦t氨分布曲線逼向標疤準正態(tài)分布曲線哎。氨圖2-11形象板地說明了柏t八分布曲線隨著自稗由度的變化而變藹化。實際上有以霸下 性質(zhì):自由度增加標準正態(tài)分布0t埃圖2-11 板 吧不同自由度下的胺t扮分布般性質(zhì)2-17胺 盎t氨分布的期望為0靶,方差為襖,其中拜k班為壩t叭分布的自由度。稗從形態(tài)上看,百t佰分布比標準正態(tài)隘分布略顯般“叭肥大矮”版一些。但是,隨柏著翱t俺分布的自由度不胺斷增長,氨t埃分布逐漸趨同于氨標準正態(tài)分布。皚例2-5 傲 翱根據(jù)全國35個澳城市于2003罷年所投入住宅建芭設(shè)資金的實際數(shù)隘(萬元),對其霸加工后形成樣本罷數(shù)據(jù),如表2-案
49、10所示。拜表2-10 把 艾服從自由度為3案的敗t佰分布的樣本敗-半2.47耙E吧+00百-哎0.2976扳23壩-拜1.07敖E皚+00矮-胺7.81靶E哀-絆01班4.37吧E昂-翱01芭-壩8.68阿E矮-耙01絆-絆9.17扒E百-奧01柏-安3.65版E搬+00笆-靶4.78案E襖-藹01扮-八4.21艾E扮-版01愛3.58按E白+00襖-啊2.42岸E絆-隘02靶-熬8.02板E罷-澳02俺-盎9.09襖E胺-案01敗-敗9.94辦E翱-藹01稗-般2.13版E捌-翱01捌6.56拌E壩-斑01安-半1.01矮E靶+00班資料來源:20耙04年中國統(tǒng)計敗年鑒搬根據(jù)表2-10壩,
50、繪出奧t昂(3)佰分布圖2-12伴。頻數(shù)隘圖2-12 敖 翱自由度為3的傲t隘分布搬注:這個頻數(shù)曲艾線圖是右偏高峰巴態(tài)的。之所以圖瓣形會右偏,在于癌樣本的采集。但背從皚t扮分布的示意圖來骯看是可接受的。4F分布吧F擺分布稱為傲方差比分布壩,也就是兩個相扒互獨立的樣本方隘差之比的分布,班目的是為了檢驗壩兩個總體分布的敗方差是否相等。愛具體來說,設(shè)樣本和樣本皚相互獨立,樣本擺的方差分別為和斑如果半疤,則隨機變量唉服從分子自由度暗為胺和分母自由度為敖的阿F按分布,如果絆,記做埃。一般地有 見古亞拉提(2000)。骯F霸分布隨著自由度般的增加而逐漸呈斑現(xiàn)出正態(tài)分布形安態(tài),如圖2-1阿3所示。正態(tài)分布隨
51、機變量F分布的概率密度自由度氨圖2-13 爸F分布隨著自由挨度變化而變化礙性質(zhì)2-18 壩 搬給定顯著性水平靶,有俺性質(zhì)2-19 笆 癌。板性質(zhì)2-20 白 稗,其中愛與礙相互獨立,且若充分大,則。背以上幾個性質(zhì)描霸述了襖分布、拔分布和耙分布之間的某些白聯(lián)系。這些性質(zhì)伴在古亞拉提(2八000)都有說稗明。對八分布來說,當分白子自由度矮充分大時,隨著辦分母自由度案的增加,根據(jù)性辦質(zhì)2-20,隨拜機變量哀是趨于漸進標準壩正態(tài)分布的。即爸2.3 統(tǒng)計癌推斷搬隨機抽樣的樣本罷跟總體有什么關(guān)背系呢?能否通過拌樣本的數(shù)字特征凹來估計總體的情敖?jīng)r?眾所周知,版來自同一個總體阿的每一個樣本很艾可能具有不同的熬
52、統(tǒng)計特征,比如鞍樣本均值、方差拔等可能是不一樣吧的。為了處理樣鞍本與總體的關(guān)系板,統(tǒng)計推斷扮演啊了重要的角色。澳統(tǒng)計推斷就是從瓣樣本的統(tǒng)計特征壩推斷出總體的統(tǒng)案計特征,比如從佰樣本的均值推出叭總體的均值。本吧節(jié)主要介紹估計般與假設(shè)檢驗。擺2.3.1 岸估計爸給出參數(shù)的估計白值是統(tǒng)計推斷的?;A(chǔ)。要給出參罷數(shù)的估計值,首罷先要確定 總埃體的分布,比如跋是正態(tài)分布、矮分布、埃分布或是啊分布;其次從總罷體中隨機抽樣,隘并給出樣本特征吧值的估計;然后扳通過點估計或區(qū)半間估計得出參數(shù)捌估計,如圖2-捌14所示。跋圖2-14 爸估計的一般過程澳例如,設(shè)礙,其中參數(shù)拔、芭為未知。現(xiàn)在從爸正態(tài)總體中隨機般抽取
53、容量為般的樣本,則有稗,也就得出總體敗參數(shù)耙的估計值是拜,稱為翱的懊點估計按。Monte 叭Karlo實驗盎可以實現(xiàn)點估計埃。另外,敖設(shè)隘表示隨機樣本的叭樣本方差,則氨已經(jīng)知道昂統(tǒng)計量滿足自由白度為安的背分布,在給定顯疤著水平按下,查礙分布表得出相應(yīng)巴的臨界般值為啊,得概率分布俺于是把背統(tǒng)計量代入上式昂,得到因而,巴稱為總體均值的伴區(qū)間估計胺,兩個端點分別鞍稱為上界和下界俺,拌稱為疤置信系數(shù)佰。澳稱為吧顯著水平俺或絆犯第一類錯誤的翱概率按。把表面上看,犯第擺一類錯誤的概率背似乎很小,實際安上,情況是否總隘是如此呢?答案鞍是否定的。具體氨情況可參閱第7澳章的實驗3。樣頒本的抽樣方式?jīng)Q笆定著犯第一
54、類錯巴誤的概率的實際懊大小。如果樣本瓣的抽樣方式是隨八機的,那么,犯翱第一類錯誤的概版率確實不會超過啊。但是,如果樣盎本的抽樣方式是稗主觀的,那么,隘犯第一類錯誤的跋概率很有可能大昂于叭。由此看來,人鞍們的處事方式?jīng)Q拔定著其實際犯主叭觀錯誤的可能性哀的大小。絆如果知道了昂,但是不知道瓣,則有以下區(qū)間澳估計其中,壩現(xiàn)在舉一例說明罷點估計和區(qū)間估扳計。假如人們從阿某一個總體中隨敗機抽取樣本容量鞍為35的樣本(矮請參考第3章的奧例3-1),如壩表2-11所示辦。壩表2-11 靶來自于某總體的哎樣本吧-八3.1暗0白0.05絆0.02疤-懊2.6奧0敗2.5般0背-班1.56昂0.55八-矮1.01埃
55、-罷0.13半0艾00半0.06斑-叭0.81哀1.柏16懊0.97搬-把2.2安0翱-拜0.83捌-稗1.64班-艾1唉00凹百0.41奧2.82奧0.02鞍-骯0.3笆0哀-擺0.1疤0芭-般0.94皚-罷0.32澳-澳0.2按0背0.6隘0芭-擺0.05奧-扳1.46敗-暗4.91耙-搬1.45澳-斑1.25昂-絆2.14按-霸0.37佰-邦0.62拜為了確定總體的鞍期望凹和方差骯,不妨用樣本的扮中值敖和方差捌作為懊和爸的點估計。在顯爸著水平捌,比如5%或1把%下,給出總體氨期望哎和方差壩的點估計和區(qū)間俺估計如下:點估計:,。扳區(qū)間估計:因為傲已知罷=敖-背0.5665疤7跋,礙=1.4
56、54班隘61柏,八=白佰0襖.絆05俺,挨=35熬,查澳分布表知暗,因此得到區(qū)間矮估計是:百。礙如果班,不妨設(shè)吧,則半作為總體期望估哎計值的概率的可扳能程度是95%襖,不是總體期望版估計值的可能性按只有5%的機會唉。于是,得到標愛準差的區(qū)間估計笆為:案,因而,霸 芭。皚關(guān)于標準差的點襖或區(qū)間估計,還隘可以通過表2-岸13來實現(xiàn)。斑點估計主要包含版以下性質(zhì)班:(1)線性性骯線性性是指估計癌量是樣本觀察值般的線性函數(shù)。比凹如樣本均值就是敗一個線性估計量骯。這里的均值是鞍指算術(shù)平均或加罷權(quán)平均,而不是按幾何平均,因而絆均值是關(guān)于觀察艾量的線性函數(shù)。(2)無偏性巴無偏性是指總體辦參數(shù)的估計量至班少有一
57、個與參數(shù)胺的真實值是一致奧的。比如,從標凹準正態(tài)分布總體案得到的任意獨立俺隨機抽樣的均值霸總是0,條件放百寬一點就是從某胺一總體抽得的樣頒本的均值等于該礙總體的期望。具拌有這樣的性質(zhì)的唉總體稱為是無偏吧性的。唉分布是無偏的,班分布、斑分布則都是有偏骯的。(3)有效性藹有效性是指存在瓣多個無偏估計量板的情況下,最小叭的估計量就稱為胺是有效的。這個昂性質(zhì)可從圖2-吧11中看出,正爸態(tài)分布的方差就辦是有效的,而且靶是最優(yōu)的。邦(4)最優(yōu)線性挨無偏估計量胺最優(yōu)線性無偏估藹計量是指在存在凹多個線性無偏估柏計量的情況下,八方差最小 的那版?zhèn)€無偏估計量就疤成為最優(yōu)線性無捌偏估計量。扮分布是無偏分布般,但不是
58、最優(yōu)的熬。啊分布離最優(yōu)分布昂有多大的程度呢奧?從方差的角度叭來看,差距為:阿2霸/(鞍k盎-爸2鞍)。隨著自由度敖的增長,啊分布不斷地逼近氨標準正態(tài)分布,壩其方差離最優(yōu)的半距離越來越近。(5)一致性柏一致性是指多個擺估計量隨著樣本俺容量的增大而趨擺于參數(shù)的真實值安。埃分布巴、俺分布都具有一致敗性。哀2.3.2 靶假設(shè)檢驗皚估計值是統(tǒng)計推叭斷的一個重要組霸成部分,然而,挨僅靠估計值也不阿能對總體參數(shù)給藹出更加合理的解岸釋。因此,對估背計值作檢驗是統(tǒng)哀計推斷必不可少愛的關(guān)鍵步驟。檢瓣驗假設(shè)的第一步辦是提出假設(shè)等待熬檢驗。比如,要耙檢驗矮,其中哀為大于0的數(shù)。唉為此,可以給出凹:零假設(shè):頒的備擇假設(shè)
59、記為瓣,有以下三種情傲形:單邊備擇假設(shè)。單邊備擇假設(shè)。雙邊備擇假設(shè)。礙下面將通過置信拜區(qū)間法和顯著檢澳驗法來檢驗零假澳設(shè)唉:扮。1置信區(qū)間法這里已經(jīng)知道如果落在爸內(nèi),就要接受零壩假設(shè)背,否則就拒絕零澳假設(shè)俺,稱為罷第一類錯誤案,也就是說壩棄真錯誤擺。如果樣本不是哀來自均值為隘的總體,而接受啊了懊,稱為辦第二類錯誤敗,也就是說氨取偽錯誤半。犯第二類錯誤奧的可能性是存在敗的,有時,第二礙類錯誤的概率也暗是很大的。第二奧類錯誤常常發(fā)生翱在判斷遷移過程搬中,也就是依據(jù)叭來自某個總體的胺樣本去判斷另外傲一個總體或樣本耙的狀況,比如作白點估計或區(qū)間估岸計,從而導(dǎo)致張胺冠李戴的錯誤發(fā)奧生。哎對于同一個樣本佰
60、,人們一般做不盎到同時減少犯第哎一類錯誤和第二八類錯誤的概率,氨通常的做法是先按固定一個,然后礙考慮另外一個減盎少的可能性,見扒古亞拉提(20柏00,第70頁板)。第一類錯誤半用概率奧表示,第二類錯隘誤用概率按表示。不犯第二扳類錯誤的概率為哀,也就是說零假暗設(shè)安是錯誤的而拒絕笆了零假設(shè)般,則稱為板檢驗的功效熬。前面的例子給翱出了在顯著水平拌5%下的雙邊備壩擇假設(shè)檢驗。如笆果是單邊備擇假氨設(shè)檢驗,應(yīng)該有頒:和2顯著性檢驗靶顯著性檢驗是一皚種完備的、二選熬一的假設(shè)檢驗方搬法。比如設(shè)挨,其中參數(shù)稗、安為未知的?,F(xiàn)在辦從正態(tài)總體中隨傲機抽取容量為佰的樣本,則有敗。設(shè)搬表示隨機樣本的挨樣本方差,則稗作零
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 客戶需求分析課程
- 統(tǒng)編版小學(xué)語文二年級下冊《快樂讀書吧》精美課件
- 2025年高中地理壓軸題答題技巧分享教你快速拿高分
- 第5課+古代非洲與美洲+高一歷史下學(xué)期統(tǒng)編版(2019)必修中外歷史綱要下
- 九年級化學(xué)下冊 第7章 應(yīng)用廣泛的酸、堿、鹽 基礎(chǔ)實驗7 溶液的酸堿性教學(xué)實錄 (新版)滬教版
- 自動化測試提升維護效率
- 食品包裝袋內(nèi)氧氣水平監(jiān)控
- 雙十一營銷活動方案汽車
- 山西省陽曲縣八年級地理上冊 2.1 千姿百態(tài)的地表形態(tài)教學(xué)實錄 晉教版
- 四年級數(shù)學(xué)(除數(shù)是兩位數(shù))計算題專項練習及答案
- 綠城玫瑰園別墅項目全套樓書圖片29P
- 《陜西省安全生產(chǎn)條例》考核試題
- 大班PPT課件《拍手歌》
- GB/T 10059-2023電梯試驗方法
- GB/T 21837-2023鐵磁性鋼絲繩電磁檢測方法
- 貨物運輸服務(wù)投標方案(技術(shù)方案)
- 15D500-15D505 防雷與接地圖集(合訂本)
- 2023年高考全國卷英語完型填空講解 課件 2024屆高考英語一輪復(fù)習
- 第二章1:公文寫作的構(gòu)成要素
- 單兵隊列教學(xué)法
- DB14-T 2803-2023 藥品委托儲存配送管理規(guī)范
評論
0/150
提交評論