




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
商務(wù)統(tǒng)計學(xué)5隨機變量及其分布5.1隨機變量對一項試驗的結(jié)果進(jìn)行數(shù)值描述,稱為隨機變量(randomvariable)。隨機變量通常用大寫字母X、Y、Z表示,它們的取值用小寫字母x,y,z等表示。2隨機變量的特點:一是取值的隨機性,事先不能確定X的取值;二是取值的統(tǒng)計規(guī)律,能夠確定X取某個值或在某區(qū)間的概率。根據(jù)隨機變量所取數(shù)值的不同,可以分為兩種類型:離散型隨機變量(discreterandomvariables)和連續(xù)型隨機變量(continuousrandomvariables)。3離散型隨機變量是指取值為可數(shù)個值的隨機變量,其取值不需要都是正數(shù),只需要從一個可能的值“跳躍”到另一個值。連續(xù)型隨機變量是指隨機變量可以取區(qū)間上的任一值,即可能的取值有不可數(shù)個。其取值連續(xù)地從一個轉(zhuǎn)移到另一個,任意兩個值之間沒有任何間斷。45.2概率分布概率分布是指由隨機變量的取值和相應(yīng)概率所構(gòu)成的分布,能夠具體描述一個隨機變量的所有取值和相應(yīng)概率之間的關(guān)系。55.2.1離散型隨機變量的概率分布離散型隨機變量的概率分布(probabilitydistribution)由離散型隨機變量X的取值和相應(yīng)的概率P組成。常用表5-1來反映。6離散型隨機變量的概率分布滿足以下兩個條件:(1),對所有的取值成立(2)7把離散型隨機變量取小于等于某一值的概率稱為累積概率分布(cumulativedistributionfunction),記為,即
8例5-1投資者擬從創(chuàng)業(yè)板新上市的10只股票中選4只。但他并不知道這10只股票中有3只股票將使購買者盈利,其余的將使購買者虧損。試求:(1)購買者選中的獲利股票數(shù)目X的概率分布和累積概率分布;(2)至少選中1只獲利股票的概率;(3)至多選中2只獲利股票的概率。9解:(1)
所以X的概率分布為10(2)(3)
115.2.2連續(xù)型隨機變量的概率分布設(shè)X為連續(xù)型隨機變量,且函數(shù)滿足下列條件:(1)(2)(3)則稱為概率密度函數(shù)(probabilitydensityfunction)12連續(xù)型隨機變量的累積概率分布稱為分布函數(shù)(distributionfunction)。設(shè)X是一個連續(xù)型隨機變量,對任意實數(shù)x,事件的概率稱為隨機變量X的分布函數(shù),記為,即有:
易見,對任意實數(shù),有13分布函數(shù)具有如下性質(zhì):(1)(2)(3)(4)是非降函數(shù),即若
則145.2.3隨機變量的期望和方差(1)離散型隨機變量的期望和方差離散型隨機變量X表示出現(xiàn)不同的可能結(jié)果,其均值一般稱為期望(expectation),用表示(有時也用表示):15我們常常需要計算隨機變量的離散性或變異性,而方差就可以解釋隨機變量的變異性。離散型隨機變量方差(variance)的數(shù)學(xué)表達(dá)式如下:標(biāo)準(zhǔn)差16例5-2某野生動物保護區(qū)每個季度發(fā)生少數(shù)違反保護條例的事件,其次數(shù)的概率分布如表5-2所示:請計算野生動物保護區(qū)每季度違反保護條例的事件次數(shù)的期望值。17解:根據(jù)期望公式可得:即野生動物保護區(qū)每季度違反保護條例的事件次數(shù)的期望值為1.4。18(2)連續(xù)型隨機變量的期望和方差設(shè)X是連續(xù)型隨機變量,為概率密度函數(shù),其數(shù)學(xué)期望(expectation)定義為:連續(xù)型隨機變量的方差(variance)為:19(3)期望和方差的性質(zhì)期望的性質(zhì):?設(shè)C為常數(shù),則?若a,b是常數(shù),則?若X和Y為相互獨立的隨機變量,則
?若X和Y為任意的兩個隨機變量,則20方差的性質(zhì):?設(shè)C為常數(shù),則?若a,b是常數(shù),則?若X和Y為相互獨立的隨機變量,則
?215.3幾種常見的離散型隨機變量的概率分布5.3.10-1分布0-1分布又稱兩點分布,或伯努利分布(Bernoullidistribution)。服從0-1分布的隨機變量X的取值有這樣的特征:試驗產(chǎn)生的結(jié)果只有兩種可能,“是”或“不是”。22在統(tǒng)計學(xué)中經(jīng)常把我們感興趣的表現(xiàn)稱為“成功”,則另一種稱為“失敗”,每次試驗結(jié)果不是“成功”就是“失敗”。我們可以規(guī)定用“0”表示失敗,“1”表示成功,因此稱為0-1分布。23設(shè)隨機變量X只能取0或1兩個值,其概率分布為:或者整理成表5-3的形式:240-1分布的期望和方差分別為:25例5-3檢查一批產(chǎn)品的合格情況,從中任意抽取一件產(chǎn)品,記為“不合格品”,為“合格品”,則隨機變量服從0-1分布:試求隨機變量X的期望和方差。26解:期望方差275.3.2二項分布在0-1分布的條件下,進(jìn)行一系列結(jié)果為“成功”或“失敗”的獨立試驗,也就是n重伯努利試驗(n-Bernoullitrials)。因此出現(xiàn)“成功”的次數(shù)不再是1,而是一個不能確定的隨機變量28試驗成功的次數(shù)的概率分布就是二項分布(binomialdistribution),記作
。其中,n表示試驗次數(shù),p表示試驗成功的概率。每次試驗相互獨立,任一次試驗結(jié)果都對其他試驗結(jié)果沒有影響。29二項分布中“成功”次數(shù)k的概率表達(dá)式為:式中,n為試驗次數(shù);k為試驗成功的次數(shù);p為一次試驗成功的概率;q為一次試驗失敗的概率,則。二項分布的期望和方差分別為:30例5-4某課程測驗由20道選擇題構(gòu)成,每題有5個選項,但只有一個正確選項。一個同學(xué)參加該測驗打算全憑猜測來答題,則:(1)該同學(xué)全部答錯的概率是多少?(2)該同學(xué)全部答對的概率是多少?31解:設(shè)=“答對的題數(shù)”根據(jù)二項分布計算概率的公式得:全部答錯的概率為全部答對的概率為325.3.3超幾何分布從一個有限總體中進(jìn)行不放回抽樣得到超幾何分布(hypergeometricdistribution)。超幾何隨機變量X的特征為:從N個總體中隨機且無放回地抽取n個單元,總體中有M個單元被標(biāo)記為“成功”,其余都標(biāo)記為“失敗”。。33X表示在抽取的n個單元中被標(biāo)記為“成功”的個數(shù),則。超幾何分布的試驗不具有獨立性,本次試驗抽中“成功”或“失敗”的概率與上次試驗結(jié)果有關(guān)。34通常情況下,在已知n,N,M時,得到k個成功數(shù)的超幾何分布的概率為:式中,;。超幾何分布的期望和方差分別為:35當(dāng)時,即抽取的個數(shù)遠(yuǎn)遠(yuǎn)小于總數(shù)N,每次抽取后,總體中的“成功”概率改變不明顯,因此不放回抽樣可以看成是放回抽樣,這時可以用二項分布近似:
式中,。36例5-5假設(shè)一位教授打算從10位申請人(6男4女)中隨機挑選3人為助教。令X是3位申請人中女性的人數(shù),求:(1)X的均值以及標(biāo)準(zhǔn)差;(2)受聘者中沒有女性的概率。37解:(1)X服從超幾何分布,其中均值方差標(biāo)準(zhǔn)差
38(2)受聘者中沒有女性,則,其概率為:
395.3.4泊松分布泊松分布主要應(yīng)用于某一段時間,或某一距離,或某一空間范圍內(nèi),某個事件的發(fā)生次數(shù)。例如,我們感興趣的是某一段時間進(jìn)入麥當(dāng)勞餐廳的人數(shù),某一長度管材的瑕疵點數(shù),某段生產(chǎn)時間內(nèi)的工傷人數(shù),以及某一時期的結(jié)婚率等。40如果在一段時間或空間內(nèi),事件出現(xiàn)的次數(shù)X同時滿足以下條件,則稱此隨機變量服從泊松分布(Poissondistribution),記為:(1)在某一間隔內(nèi)事件發(fā)生與否和其他任何一個間隔內(nèi)該事件發(fā)生與否相互獨立;41(2)任意兩個相等的間隔內(nèi)事件發(fā)生的概率相等;(3)事件發(fā)生的概率僅與間隔長度有關(guān);(4)如果把事件區(qū)間或空間區(qū)間分成許多很小的區(qū)間,兩個或兩個以上某事件發(fā)生的概率小到可以視為0。42泊松分布的概率分布為:我們稱隨機變量X服從參數(shù)為(為某事件發(fā)生的概率)的泊松分布。泊松分布的期望和方差為:43因為是常數(shù),若很大時,就很小,因此有:即二項分布近似為泊松分布(通常在
)時。44例5-6已知某種產(chǎn)品的不合格率為0.02,現(xiàn)從一批產(chǎn)品中隨機抽取100件進(jìn)行檢查,問:(1)至多有3件不合格的概率是多少?(2)恰好有4件不合格的概率是多少?45解:設(shè)X為不合格品數(shù),p為不合格品率,則X服從二項分布,由于n很大,p很小,可以近似認(rèn)為X服從參數(shù)為的泊松分布,從而得到:(1)至多有3件不合格的概率為:(2)恰好有4件不合格的概率為:465.4幾種常見的連續(xù)型隨機變量的概率分布5.4.1均勻分布如果連續(xù)型隨機變量所能取到的每個值的概率都相等,那么隨機變量服從均勻分布(uniformdistribution)。47若連續(xù)型隨機變量X在有限區(qū)間內(nèi)取值,且其概率密度函數(shù)為:則稱X在區(qū)間上服從均勻分布,記為。48均勻分布的分布函數(shù)為:49均勻分布的概率密度圖和分布函數(shù)圖,如圖5-1和圖5-2所示。50均勻分布的期望和方差分別為:51例5-7假設(shè)鋼鐵廠的一臺軋鋼機可以生產(chǎn)不同厚度的鋼板,其厚度為取值在150200毫米的均勻隨機變量。厚度小于160毫米的鋼板被認(rèn)為是廢品,請計算:(1)該機器生產(chǎn)的鋼板厚度X的均值和標(biāo)準(zhǔn)差;(2)該機器生產(chǎn)的鋼板被認(rèn)為是廢品的概率有多大?52解:(1)(2)求機器生產(chǎn)的鋼板是廢品的概率,即求鋼板厚度小于160毫米的概率,運用均勻分布的公式,得:因此,20%的鋼板被認(rèn)為是廢品。535.4.2指數(shù)分布在描述各種“壽命”,比如電子元件的壽命、人或動物的壽命、電話的通話時間,給一輛卡車裝貨所需要的時間等,都可以假定隨機變量服從指數(shù)分布(exponentialdistribution)。54若隨機變量服從指數(shù)分布,記為,其概率密度函數(shù)為:55指數(shù)分布的形狀和位置取決于參數(shù),如圖5-3。56指數(shù)分布的分布函數(shù)為:指數(shù)分布的期望和方差分別為:57指數(shù)分布的無記憶性:如果隨機變量
,則對任意的和,有我們稱指數(shù)分布具有無記憶性。58指數(shù)分布與泊松分布有著密切的聯(lián)系。泊松分布描述的是在某一給定區(qū)間(時間、距離)內(nèi),事件發(fā)生的次數(shù);而指數(shù)分布描述的是兩次事件發(fā)生之間的間隔長度。如果說某事件發(fā)生的次數(shù)服從泊松分布,那么兩次發(fā)生的時間間隔一定服從指數(shù)分布。59例5-8為描述在一小時內(nèi)到達(dá)洗車店的汽車數(shù),假定該隨機變量服從均值為10的泊松分布。請寫出:(1)每小時到達(dá)洗車點的汽車數(shù)X的概率分布;(2)兩輛車到達(dá)的時間間隔Y的概率密度函數(shù)。60解:(1)因為隨機變量X服從均值為10的泊松分布,所以泊松分布的參數(shù),其概率分布為:
61(2)因為每小時有10輛車到達(dá)洗車點,所以兩輛車到達(dá)的時間間隔是,從而兩輛車到達(dá)的時間間隔Y的指數(shù)分布的均值為,相應(yīng)的概率密度函數(shù)為:
62例5-9為確定某燈泡的使用壽命,根據(jù)初步測試證明燈泡的壽命X服從指數(shù)分布,參數(shù)為,求:(1)X的均值和標(biāo)準(zhǔn)差;(2)設(shè)保修期為5年,當(dāng)
時,必須更換燈泡的概率是多少?
63解:(1)(2)求必須更換燈泡的概率,即求即廠商必須更換燈泡的概率為55%。
645.4.3正態(tài)分布(1)一般正態(tài)分布德國10馬克的鈔票上印有德國著名數(shù)學(xué)家高斯的頭像,鈔票上同時印有正態(tài)分布的密度曲線。可見在高斯的一切科學(xué)貢獻(xiàn)中,對人類文明影響最大的,就是正態(tài)分布。因此正態(tài)分布(normaldistribution)也稱為高斯分布(Gaussiandistribution)。65如果隨機變量X的概率密度函數(shù)為:則稱X服從參數(shù)為和的正態(tài)分布,記為。式中,為正態(tài)隨機變量的均值;為標(biāo)準(zhǔn)差。66正態(tài)分布的分布函數(shù)為:正態(tài)分布的概率密度圖和分布函數(shù)圖,如圖5-5和圖5-6所示。6768根據(jù)正態(tài)分布的概率密度圖,可以看出正態(tài)曲線的特點:?關(guān)于中心位置對稱,在處取得最大值。?可以用目測的方法找出它的標(biāo)準(zhǔn)差:想象你從山頂開始滑雪,山的形狀和正態(tài)曲線一樣。69起先當(dāng)你開始下滑時,往下的角度非常陡,當(dāng)你還沒有直墜下去以前,陡度變得緩和起來,你越往下滑越平坦。這個陡度開始發(fā)生改變的點就代表了標(biāo)準(zhǔn)差的位置。圖5-7給出了當(dāng)和發(fā)生變化時,相應(yīng)的正態(tài)密度曲線的變化情況:7071從圖中可以看出,如果固定,改變,則圖形的形狀不發(fā)生變化,只是沿著x軸平移,因此稱為位置參數(shù)(locationparameter)。如果固定,改變,則圖形的位置不發(fā)生改變。越小,圖形越尖峭,分布較為集中;越大,圖形越平坦,分布較為分散。因此稱為尺度參數(shù)(scaleparameter)。72(2)標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)當(dāng),時,稱為標(biāo)準(zhǔn)正態(tài)分布,記為。其概率密度函數(shù)和分布函數(shù)分別為:73標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)和分布函數(shù)具有如下性質(zhì):??,和為常數(shù);?,且為常數(shù);?;?概率密度函數(shù)關(guān)于y軸對稱,在處取得最大值74一般正態(tài)分布與標(biāo)準(zhǔn)正態(tài)分布的關(guān)系為:如果隨機變量X服從參數(shù)為和的正態(tài)分布,即,則隨機變量
服從標(biāo)準(zhǔn)正態(tài)分布,即
,這一變換稱為標(biāo)準(zhǔn)化變換。75的分布函數(shù)可以寫成:
則對于任意的,有:76通過標(biāo)準(zhǔn)化變換,可以計算出隨機變量取值落在任何區(qū)間內(nèi)的概率,如圖5-8所示。77例5-10學(xué)生《商務(wù)統(tǒng)計學(xué)》課程的考試成績服從均值為70分,標(biāo)準(zhǔn)差為12分的正態(tài)分布,請問某個學(xué)生的成績在70分到80分之間的概率有多大?78解:設(shè)是學(xué)生的成績,則有
查附表1的標(biāo)準(zhǔn)正態(tài)分布表,得到因此也就是說學(xué)生的成績在70分到80分之間的概率為29.67%。79例5-11超市里每天的牛奶銷售量服從均值為500千克,標(biāo)準(zhǔn)差為50千克的正態(tài)分布,若早上營業(yè)前超市有牛奶庫存600千克,當(dāng)天牛奶脫銷的概率是多大?80解:設(shè)是每天的牛奶銷售量,則有
查標(biāo)準(zhǔn)正態(tài)分布表,得到因此也就是說牛奶脫銷的概率為2.28%。81(3)正態(tài)分布的原則對于任何正態(tài)分布,大約有68.27%的觀測值落在距離均值1個標(biāo)準(zhǔn)差的范圍內(nèi),95.45%的觀測值落在距離均值2個標(biāo)準(zhǔn)差的范圍內(nèi),99.73%的觀測值落在距離均值3個標(biāo)準(zhǔn)差的范圍內(nèi)。8283例5-12根據(jù)近期數(shù)據(jù)資料,某地18歲男青年的身高服從平均數(shù)為172.7cm,標(biāo)準(zhǔn)差為4.01cm的正態(tài)分布。請根據(jù)原則,分析該地男青年身高的分布規(guī)律。84解:根據(jù)原則,該地:
大約有68.27%的男青年身高介于168.69-176.71之間,大約有95.45%的男青年身高介于164.68-180.72之間,大約有99.73%的男青年身高介于160.67-184.73之間。85(4)管理原則管理原則是一種以數(shù)據(jù)為基礎(chǔ),追求幾乎完美無瑕的現(xiàn)代企業(yè)質(zhì)量管理策略。一般企業(yè)的瑕疵率大約是3到4個。以
為例,假設(shè)一個機場,每天起降100架飛機。86若每架起飛的飛機安全質(zhì)量以標(biāo)準(zhǔn)管理,那么這100架飛機都安全的概率是
,說明至少有一架飛機不安全的概率為0.2369。若采用管理原則,則這100架飛機都安全的概率是。875.5由正態(tài)分布導(dǎo)出的三個重要分布5.5.1卡方分布設(shè)隨機變量互相獨立,并且都服從標(biāo)準(zhǔn)正態(tài)分布,則稱
的分布是自由度為的
分布,記為
。
88卡方分布(Chi-squaredistribution)的概率密度函數(shù)為:其中,是伽馬函數(shù)。通常我們稱為伽馬函數(shù),參數(shù)。89伽馬函數(shù)具有以下性質(zhì):(1)(2),若為自然數(shù),則
。90卡方分布的概率密度圖是一個取值為非負(fù)的偏態(tài)分布,如圖5-10所示,從左到右依次為自由度為2,4,10,20的概率密度圖。其期望和方差分別為:91卡方分布具有下面的重要性質(zhì):若來自正態(tài)總體,其樣本均值和方差分別為:則有:(1)與相互獨立(2)(3)925.5.2F分布設(shè)隨機變量,,且與
相互獨立,則稱的分布是自由度為和的F分布,記為。設(shè)F的取值為,對,其密度函數(shù)為:
93F分布(Fdistribution)的概率密度圖如圖5-11。圖中,1、2、3、4、5、6分別表示、
、、、的概率密度圖。94F分布一般為正偏分布。若,則
,對于給定的,有
F分布一般可用于兩個正態(tài)總體方差的比較檢驗,方差分析和線性回歸模型的檢驗。955.5.3t分布設(shè)隨機變量,,則稱
的分布是自由度為的t分布,記為。其密度函數(shù)為
96t分布(tdistribution)的概率密度圖關(guān)于Y軸對稱(如圖5-12),與標(biāo)準(zhǔn)正態(tài)分布的圖形類似,都是均值為0的鐘形曲線,但t分布的峰比標(biāo)準(zhǔn)正態(tài)分布的峰低,且兩尾較高。97圖中,1、2、3、4分別表示、、和的概率密度圖形。t分布的期望和方差分別為:t分布具有下面的重要性質(zhì):若都是來自正態(tài)總體的樣本,和分別是樣本均值和方差,則有98t分布多用于小樣本()情況下的區(qū)間估計和假設(shè)檢驗,或是在總體方差未知時正態(tài)總體均值的區(qū)間估計和假設(shè)檢驗,以及線性回歸模型中回歸系數(shù)的顯著性檢驗等。995.6大數(shù)定理和中心極限定理5.6.1大數(shù)定理(1)伯努利大數(shù)定理(Bernoulli'sLawofLargeNumbers)設(shè)是重伯努利試驗中事件發(fā)生的次數(shù),是每次試驗中事件出現(xiàn)的概率,則對于任意的正數(shù),有
100伯努利大數(shù)定理說明:隨著試驗次數(shù)
的增大,事件發(fā)生的頻率與其概率無限接近,它們的偏差要多小有多小。這就說明了頻率的穩(wěn)定性。而在許多實際應(yīng)用中,當(dāng)試驗次數(shù)很大時,可以用事件發(fā)生的頻率代替事件發(fā)生的概率。
101(2)切比雪夫大數(shù)定理(Chebyshev’sLawofLargeNumbers)設(shè)為一列兩兩不相關(guān)的隨機變量序列,若每個的方差存在,且有共同的上界,即(),則對于任意的正數(shù),有:
102切比雪夫大數(shù)定理說明:隨著試驗次數(shù)趨于無窮大,隨機變量變化的均值依概率收斂到這個隨機變量的期望的均值
103切比雪夫大數(shù)定理只要求兩兩不相關(guān),并未對其分布做出說明。因此可以得到:若是獨立同分布的隨機變量,方差有界,則一定服從大數(shù)定理。伯努利大數(shù)定理是切比雪夫大數(shù)定理的特例。
104(3)辛欽大數(shù)定理(Khinchin’sLawofLargeNumbers)設(shè)為一獨立同分布的隨機變量序列,若每個的期望存在且有相同的期望值,則對于任意的正數(shù),有:
105辛欽大數(shù)定理提供了求隨機變量數(shù)學(xué)期望
的近似方法。假設(shè)現(xiàn)在對隨機變量重復(fù)觀察次,每次的觀察值相互獨立且與同分布。在期望存在時,按照辛欽大數(shù)定理,若足夠大,可以把平均觀察值,作為期望的近似。
1065.6.2中心極限定理中心極限定理(CentralLimitTheorem)是研究隨機變量和的極限分布在什么條件下為正態(tài)分布的問題。(1)樣本平均數(shù)的中心極限定理
107考慮從均值為,標(biāo)準(zhǔn)差為,服從任意概率分布的總體中抽取容量為的樣本,當(dāng)趨于無窮大時,樣本平均數(shù)的分布近似服從均值,標(biāo)準(zhǔn)差的正態(tài)分布。108由中心極限定理我們可以知道,無論總體服從何種概率分布,只要知道它的均值和標(biāo)準(zhǔn)差,對于足夠大的樣本,樣本平均數(shù)
的分布近似為正態(tài)。一般認(rèn)為樣本量的是大樣本,大樣本的平均數(shù)近似服從正態(tài)分布。
109例5-13某公司1000名員工的人均年獎金為2000元,標(biāo)準(zhǔn)差500元,從中隨機抽取36人進(jìn)行調(diào)查,問該樣本中人均年獎金在1900-2200元之間的概率是多少?
110解:,根據(jù)樣本平均數(shù)的中心極限定理可知111查標(biāo)準(zhǔn)正態(tài)分布表,得到因此即樣本中人均年獎金在1900-2200元之間的概率是0.8767。112(2)樣本成數(shù)的中心極限定理從任一總體成數(shù)為,方差為的0-1分布總體中,抽取容量為的樣本,隨著樣本容量的增大,當(dāng)且時,樣本成數(shù)的分布近似服從均值為,標(biāo)準(zhǔn)差的正態(tài)分布。
113例5-14某股民判斷股票漲跌正確的概率為0.6,且每次判斷相互獨立,假設(shè)該股民作了100次判斷,至少有50次判斷正確的概率有多大?114解:設(shè)為第次判斷正確,判斷正確取值為1,否則為0。記的和為,則至少有50次判斷正確的概率為:
查標(biāo)準(zhǔn)正態(tài)分布表,得到1155.7抽樣和抽樣分布5.7.1統(tǒng)計推斷在很多實際統(tǒng)計問題中,由于人力物力等諸多條件的限制,我們不能獲取全部數(shù)據(jù),只能從中抽取一部分?jǐn)?shù)據(jù),依據(jù)這部分觀測數(shù)據(jù)對全部研究對象的數(shù)量特征或數(shù)量規(guī)律進(jìn)行推斷,稱為統(tǒng)計推斷(statisticalinference)。
116統(tǒng)計推斷包括兩方面的內(nèi)容:一是參數(shù)估計,即通過樣本數(shù)據(jù)對總體的數(shù)量特征進(jìn)行估計;二是假設(shè)檢驗,由樣本數(shù)據(jù)對總體的數(shù)量規(guī)律性是否具有某種指定特征進(jìn)行檢驗。
1175.7.2抽樣的基本概念抽樣(sampling),也叫抽樣調(diào)查(samplingsurvey),是按照隨機原則,以一定的概率從總體中抽取部分樣本進(jìn)行調(diào)查,根據(jù)樣本統(tǒng)計量對總體參數(shù)的數(shù)量特征做出可靠的估計和推斷。抽取樣本時,個體可以按照相等的概率被抽到,也可以按照不等的概率被抽到,前者稱為等概率抽樣,后者稱為不等概率抽樣。
118為什么要進(jìn)行抽樣調(diào)查呢?因為在很多情況下抽樣比研究總體更切實可行。一方面有些試驗具有破壞性,不適合全面調(diào)查,如調(diào)查燈泡壽命。也有一些總體在理論上可以進(jìn)行全面調(diào)查,但在實際中不具有可行性,如調(diào)查森林中有多少棵樹。
119(1)樣本容量和樣本可能個數(shù)樣本中包含的個體數(shù)稱為樣本容量。樣本可能個數(shù)是指從一個總體中可能抽取多少組樣本,即容量相同的所有可能樣本有多少組。樣本可能個數(shù)的多少與抽樣方法有關(guān)。
120(2)總體參數(shù)和樣本統(tǒng)計量總體分布的數(shù)量特征就是總體參數(shù),其數(shù)值是唯一的,確定的。即總體參數(shù)為常數(shù),但多為未知的。常見的總體參數(shù)有:總體平均數(shù)、總體比例(成數(shù))、總體方差或總體標(biāo)準(zhǔn)差等,它們都能反映總體的分布特征。
121以未加權(quán)的情況為例,總體平均數(shù)、總體方差和總體標(biāo)準(zhǔn)差分別為:122與總體參數(shù)對應(yīng)的是樣本統(tǒng)計量,即根據(jù)樣本數(shù)據(jù)計算出的指標(biāo)。由于樣本是從總體中抽取出來的,是隨機的,因此樣本統(tǒng)計量是隨機變量。常見的樣本統(tǒng)計量有:樣本平均數(shù)、樣本比例(成數(shù))、樣本方差或樣本標(biāo)準(zhǔn)差等。
123以未加權(quán)的情況為例,總體平均數(shù)、總體方差和總體標(biāo)準(zhǔn)差分別為:124(3)重復(fù)抽樣和不重復(fù)抽樣重復(fù)抽樣(或重置抽樣)是指從總體中抽出一個樣本單位,記錄其標(biāo)志值后,放回總體中繼續(xù)參加下一輪樣本單位的抽取。重復(fù)抽樣的特點是:第一,個單位的樣本是由次試驗的結(jié)果構(gòu)成的。
125第二,每次試驗是獨立的,即試驗的結(jié)果與前次、后次的結(jié)果都無關(guān)。第三,每次試驗都是在相同條件下進(jìn)行的,每個單位在多次試驗中中選的機會(概率)是相同的。重復(fù)抽樣時,樣本可能個數(shù)為,為總體單位數(shù),為樣本容量。
126不重復(fù)抽樣(或不重置抽樣)是指每次從總體中抽出一個樣本單位,記錄其標(biāo)志值后,不放回原總體,不繼續(xù)參加下一輪抽樣。下一次從余下的單位中抽取樣本。不重復(fù)抽樣的特點是:第一,個單位的樣本由次試驗結(jié)果構(gòu)成,但由于每次抽樣不重復(fù),實質(zhì)上相當(dāng)于從總體中同時抽取
個樣本單位。
127第二,每次試驗結(jié)果是不獨立的,上次中選的情況影響下次抽選的結(jié)果。第三,每個單位在多次試驗中中選的機會是不相等的。對于考慮順序的不重復(fù)抽樣,樣本可能個數(shù)為;對于不考慮順序的不重復(fù)抽樣,樣本可能個數(shù)為。
1285.7.3抽樣組織方式(1)簡單隨機抽樣簡單隨機抽樣(simplerandomsampling)也稱純隨機抽樣,是指按照隨機原則從總體的所有單位中抽取樣本的方式,要保證全部可能的樣本被抽到的概率都相等。
129簡單隨機抽樣是其他抽樣方法的基礎(chǔ),因為它在理論上最容易處理,并且當(dāng)總體包含的抽樣單元數(shù)N不太大時實施并不困難,但是當(dāng)N很大時實施起來就相當(dāng)困難,此時可以采用隨機數(shù)表的方法。
130當(dāng)N很大時所抽到的樣本單元往往很分散,不能保證樣本在總體中較為均勻地分布,使調(diào)查極不方便且樣本缺乏代表性。因此在大規(guī)模抽樣調(diào)查中很少單獨采用簡單隨機抽樣。
131(2)分層抽樣分層抽樣(stratifiedsampling)也稱類型抽樣或分類抽樣,是將總體中的抽樣單元按某種原則劃分成若干個組,然后在每個組內(nèi)獨立地進(jìn)行抽樣以獲得樣本的抽樣方式。其優(yōu)點是通過劃類分組,增大了各類中單位間的共同性,容易抽出具有代表性的樣本。
132分層抽樣的實施和組織都比較方便,樣本單元分布比較均勻。當(dāng)組內(nèi)差異較小而組間差異較大時,采用分層抽樣可以大大提高估計的精度。
133(3)等距抽樣等距抽樣也稱機械抽樣或系統(tǒng)抽樣(systematicsampling),首先將總體單元按一定順序排列,在規(guī)定的范圍內(nèi)隨機抽取一個單元作為初始單元,然后按照一定的規(guī)則確定其他樣本單元。
134在等距抽樣中,初始單元是隨機抽取的,其他樣本單元都隨著初始單元的確定而確定。在進(jìn)行等距抽樣時,應(yīng)提前觀察總體的實物順序。若實物順序與總體的特征相關(guān),就不應(yīng)該使用等距抽樣。
135(4)整群抽樣整群抽樣(Clustersampling)也稱集團抽樣,是指將總體單元按照一定的標(biāo)準(zhǔn)分成若干部分,每個部分稱為一個群,然后以群為單位,隨機抽取一個或幾個群,對被抽中的群進(jìn)行全面調(diào)查。整群抽樣的效率與群的劃分密切相關(guān),其劃分原則是盡量使每個群都有較好的代表性,群間差異小,而群內(nèi)差異大。
136(5)二階段抽樣和多階段抽樣在調(diào)查對象的總體范圍大、分布又廣的情況下,只進(jìn)行一次抽樣很難選出所需的樣本。我們可以把整個抽樣過程分成兩個或多個階段。如在企業(yè)職工收入調(diào)查中,先對企業(yè)進(jìn)行抽樣,再在被抽中的企業(yè)內(nèi)對職工進(jìn)行抽樣,然后對被抽中的職工進(jìn)行調(diào)查,這就是二階段抽樣(two-stagesampling)
137如果總體可以劃分成多個級別的抽樣單元,每一級別的抽樣單元由若干下一級別的抽樣單元組成,相應(yīng)地存在多個級別的抽樣框,抽樣時先在一級抽樣框中對一級單元抽樣,再在中選的一級單元中對二級單元抽樣。
138如果每個二級單元又由更小的三級單元組成,那么在二階段抽樣后,在中選的二級單元中對三級單元抽樣,稱為三階段抽樣(three-stagesampling)。以此類推,還可以定義更高階段的抽樣。對于二階段以上的抽樣統(tǒng)稱為多階段抽樣(multi-stagesampling)。
1395.7.4抽樣誤差隨機樣本的樣本值和總體值之間的差異稱為抽樣誤差(samplingerror),抽樣誤差是在選取樣本時一些偶然因素影響的結(jié)果。通常,抽樣誤差的大小由樣本均值的標(biāo)準(zhǔn)差來衡量。
140(1)樣本均值的標(biāo)準(zhǔn)差重復(fù)抽樣時,有式中,為樣本均值的標(biāo)準(zhǔn)差,又稱為抽樣平均誤差;為總體的標(biāo)準(zhǔn)差;為樣本容量。141不重復(fù)抽樣時,有式中,為樣本均值的標(biāo)準(zhǔn)差;
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 大班健康的蔬菜公開課
- 河南中考答案 數(shù)學(xué)試卷
- 廣東省職高一數(shù)學(xué)試卷
- 醫(yī)院課件宣傳海報制作
- 肝炎病毒微生物與免疫基礎(chǔ)99課件
- 2025年中國生物傳感器行業(yè)市場運營現(xiàn)狀及投資戰(zhàn)略咨詢報告
- 2025年中國河北省房地產(chǎn)行業(yè)未來前景預(yù)測研究報告
- 青海省項目-藏區(qū)區(qū)域醫(yī)療中心項目可行性研究報告-智博睿編制
- 2025-2030年中國防水防油針刺呢行業(yè)深度研究分析報告
- 健康的人快樂多課件
- 安徽高危人員管理辦法
- 安保工作月度總結(jié)
- 開業(yè)美容項目活動方案
- 2025年技術(shù)玻璃制品行業(yè)市場調(diào)研報告
- 2025至2030高純氯化鉀行業(yè)產(chǎn)業(yè)運行態(tài)勢及投資規(guī)劃深度研究報告
- 2025年吉林省中考數(shù)學(xué)試卷真題(含答案詳解)
- 2025年中國自由鍛件行業(yè)發(fā)展運行現(xiàn)狀及投資潛力預(yù)測報告
- 醫(yī)學(xué)美容技術(shù)專業(yè)教學(xué)標(biāo)準(zhǔn)(高等職業(yè)教育??疲?025修訂
- QGDW11970.7-2023輸變電工程水土保持技術(shù)規(guī)程第7部分水土保持設(shè)施質(zhì)量檢驗及評定
- 變電站創(chuàng)優(yōu)工程匯報
- 黨課課件含講稿:以作風(fēng)建設(shè)新成效激發(fā)干事創(chuàng)業(yè)新作為
評論
0/150
提交評論