《商務統(tǒng)計學》隨機變量及其分布_第1頁
《商務統(tǒng)計學》隨機變量及其分布_第2頁
《商務統(tǒng)計學》隨機變量及其分布_第3頁
《商務統(tǒng)計學》隨機變量及其分布_第4頁
《商務統(tǒng)計學》隨機變量及其分布_第5頁
已閱讀5頁,還剩151頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

商務統(tǒng)計學5隨機變量及其分布5.1隨機變量對一項試驗的結果進行數(shù)值描述,稱為隨機變量(randomvariable)。隨機變量通常用大寫字母X、Y、Z表示,它們的取值用小寫字母x,y,z等表示。2隨機變量的特點:一是取值的隨機性,事先不能確定X的取值;二是取值的統(tǒng)計規(guī)律,能夠確定X取某個值或在某區(qū)間的概率。根據(jù)隨機變量所取數(shù)值的不同,可以分為兩種類型:離散型隨機變量(discreterandomvariables)和連續(xù)型隨機變量(continuousrandomvariables)。3離散型隨機變量是指取值為可數(shù)個值的隨機變量,其取值不需要都是正數(shù),只需要從一個可能的值“跳躍”到另一個值。連續(xù)型隨機變量是指隨機變量可以取區(qū)間上的任一值,即可能的取值有不可數(shù)個。其取值連續(xù)地從一個轉移到另一個,任意兩個值之間沒有任何間斷。45.2概率分布概率分布是指由隨機變量的取值和相應概率所構成的分布,能夠具體描述一個隨機變量的所有取值和相應概率之間的關系。55.2.1離散型隨機變量的概率分布離散型隨機變量的概率分布(probabilitydistribution)由離散型隨機變量X的取值和相應的概率P組成。常用表5-1來反映。6離散型隨機變量的概率分布滿足以下兩個條件:(1),對所有的取值成立(2)7把離散型隨機變量取小于等于某一值的概率稱為累積概率分布(cumulativedistributionfunction),記為,即

8例5-1投資者擬從創(chuàng)業(yè)板新上市的10只股票中選4只。但他并不知道這10只股票中有3只股票將使購買者盈利,其余的將使購買者虧損。試求:(1)購買者選中的獲利股票數(shù)目X的概率分布和累積概率分布;(2)至少選中1只獲利股票的概率;(3)至多選中2只獲利股票的概率。9解:(1)

所以X的概率分布為10(2)(3)

115.2.2連續(xù)型隨機變量的概率分布設X為連續(xù)型隨機變量,且函數(shù)滿足下列條件:(1)(2)(3)則稱為概率密度函數(shù)(probabilitydensityfunction)12連續(xù)型隨機變量的累積概率分布稱為分布函數(shù)(distributionfunction)。設X是一個連續(xù)型隨機變量,對任意實數(shù)x,事件的概率稱為隨機變量X的分布函數(shù),記為,即有:

易見,對任意實數(shù),有13分布函數(shù)具有如下性質(zhì):(1)(2)(3)(4)是非降函數(shù),即若

則145.2.3隨機變量的期望和方差(1)離散型隨機變量的期望和方差離散型隨機變量X表示出現(xiàn)不同的可能結果,其均值一般稱為期望(expectation),用表示(有時也用表示):15我們常常需要計算隨機變量的離散性或變異性,而方差就可以解釋隨機變量的變異性。離散型隨機變量方差(variance)的數(shù)學表達式如下:標準差16例5-2某野生動物保護區(qū)每個季度發(fā)生少數(shù)違反保護條例的事件,其次數(shù)的概率分布如表5-2所示:請計算野生動物保護區(qū)每季度違反保護條例的事件次數(shù)的期望值。17解:根據(jù)期望公式可得:即野生動物保護區(qū)每季度違反保護條例的事件次數(shù)的期望值為1.4。18(2)連續(xù)型隨機變量的期望和方差設X是連續(xù)型隨機變量,為概率密度函數(shù),其數(shù)學期望(expectation)定義為:連續(xù)型隨機變量的方差(variance)為:19(3)期望和方差的性質(zhì)期望的性質(zhì):?設C為常數(shù),則?若a,b是常數(shù),則?若X和Y為相互獨立的隨機變量,則

?若X和Y為任意的兩個隨機變量,則20方差的性質(zhì):?設C為常數(shù),則?若a,b是常數(shù),則?若X和Y為相互獨立的隨機變量,則

?215.3幾種常見的離散型隨機變量的概率分布5.3.10-1分布0-1分布又稱兩點分布,或伯努利分布(Bernoullidistribution)。服從0-1分布的隨機變量X的取值有這樣的特征:試驗產(chǎn)生的結果只有兩種可能,“是”或“不是”。22在統(tǒng)計學中經(jīng)常把我們感興趣的表現(xiàn)稱為“成功”,則另一種稱為“失敗”,每次試驗結果不是“成功”就是“失敗”。我們可以規(guī)定用“0”表示失敗,“1”表示成功,因此稱為0-1分布。23設隨機變量X只能取0或1兩個值,其概率分布為:或者整理成表5-3的形式:240-1分布的期望和方差分別為:25例5-3檢查一批產(chǎn)品的合格情況,從中任意抽取一件產(chǎn)品,記為“不合格品”,為“合格品”,則隨機變量服從0-1分布:試求隨機變量X的期望和方差。26解:期望方差275.3.2二項分布在0-1分布的條件下,進行一系列結果為“成功”或“失敗”的獨立試驗,也就是n重伯努利試驗(n-Bernoullitrials)。因此出現(xiàn)“成功”的次數(shù)不再是1,而是一個不能確定的隨機變量28試驗成功的次數(shù)的概率分布就是二項分布(binomialdistribution),記作

。其中,n表示試驗次數(shù),p表示試驗成功的概率。每次試驗相互獨立,任一次試驗結果都對其他試驗結果沒有影響。29二項分布中“成功”次數(shù)k的概率表達式為:式中,n為試驗次數(shù);k為試驗成功的次數(shù);p為一次試驗成功的概率;q為一次試驗失敗的概率,則。二項分布的期望和方差分別為:30例5-4某課程測驗由20道選擇題構成,每題有5個選項,但只有一個正確選項。一個同學參加該測驗打算全憑猜測來答題,則:(1)該同學全部答錯的概率是多少?(2)該同學全部答對的概率是多少?31解:設=“答對的題數(shù)”根據(jù)二項分布計算概率的公式得:全部答錯的概率為全部答對的概率為325.3.3超幾何分布從一個有限總體中進行不放回抽樣得到超幾何分布(hypergeometricdistribution)。超幾何隨機變量X的特征為:從N個總體中隨機且無放回地抽取n個單元,總體中有M個單元被標記為“成功”,其余都標記為“失敗”。。33X表示在抽取的n個單元中被標記為“成功”的個數(shù),則。超幾何分布的試驗不具有獨立性,本次試驗抽中“成功”或“失敗”的概率與上次試驗結果有關。34通常情況下,在已知n,N,M時,得到k個成功數(shù)的超幾何分布的概率為:式中,;。超幾何分布的期望和方差分別為:35當時,即抽取的個數(shù)遠遠小于總數(shù)N,每次抽取后,總體中的“成功”概率改變不明顯,因此不放回抽樣可以看成是放回抽樣,這時可以用二項分布近似:

式中,。36例5-5假設一位教授打算從10位申請人(6男4女)中隨機挑選3人為助教。令X是3位申請人中女性的人數(shù),求:(1)X的均值以及標準差;(2)受聘者中沒有女性的概率。37解:(1)X服從超幾何分布,其中均值方差標準差

38(2)受聘者中沒有女性,則,其概率為:

395.3.4泊松分布泊松分布主要應用于某一段時間,或某一距離,或某一空間范圍內(nèi),某個事件的發(fā)生次數(shù)。例如,我們感興趣的是某一段時間進入麥當勞餐廳的人數(shù),某一長度管材的瑕疵點數(shù),某段生產(chǎn)時間內(nèi)的工傷人數(shù),以及某一時期的結婚率等。40如果在一段時間或空間內(nèi),事件出現(xiàn)的次數(shù)X同時滿足以下條件,則稱此隨機變量服從泊松分布(Poissondistribution),記為:(1)在某一間隔內(nèi)事件發(fā)生與否和其他任何一個間隔內(nèi)該事件發(fā)生與否相互獨立;41(2)任意兩個相等的間隔內(nèi)事件發(fā)生的概率相等;(3)事件發(fā)生的概率僅與間隔長度有關;(4)如果把事件區(qū)間或空間區(qū)間分成許多很小的區(qū)間,兩個或兩個以上某事件發(fā)生的概率小到可以視為0。42泊松分布的概率分布為:我們稱隨機變量X服從參數(shù)為(為某事件發(fā)生的概率)的泊松分布。泊松分布的期望和方差為:43因為是常數(shù),若很大時,就很小,因此有:即二項分布近似為泊松分布(通常在

)時。44例5-6已知某種產(chǎn)品的不合格率為0.02,現(xiàn)從一批產(chǎn)品中隨機抽取100件進行檢查,問:(1)至多有3件不合格的概率是多少?(2)恰好有4件不合格的概率是多少?45解:設X為不合格品數(shù),p為不合格品率,則X服從二項分布,由于n很大,p很小,可以近似認為X服從參數(shù)為的泊松分布,從而得到:(1)至多有3件不合格的概率為:(2)恰好有4件不合格的概率為:465.4幾種常見的連續(xù)型隨機變量的概率分布5.4.1均勻分布如果連續(xù)型隨機變量所能取到的每個值的概率都相等,那么隨機變量服從均勻分布(uniformdistribution)。47若連續(xù)型隨機變量X在有限區(qū)間內(nèi)取值,且其概率密度函數(shù)為:則稱X在區(qū)間上服從均勻分布,記為。48均勻分布的分布函數(shù)為:49均勻分布的概率密度圖和分布函數(shù)圖,如圖5-1和圖5-2所示。50均勻分布的期望和方差分別為:51例5-7假設鋼鐵廠的一臺軋鋼機可以生產(chǎn)不同厚度的鋼板,其厚度為取值在150200毫米的均勻隨機變量。厚度小于160毫米的鋼板被認為是廢品,請計算:(1)該機器生產(chǎn)的鋼板厚度X的均值和標準差;(2)該機器生產(chǎn)的鋼板被認為是廢品的概率有多大?52解:(1)(2)求機器生產(chǎn)的鋼板是廢品的概率,即求鋼板厚度小于160毫米的概率,運用均勻分布的公式,得:因此,20%的鋼板被認為是廢品。535.4.2指數(shù)分布在描述各種“壽命”,比如電子元件的壽命、人或動物的壽命、電話的通話時間,給一輛卡車裝貨所需要的時間等,都可以假定隨機變量服從指數(shù)分布(exponentialdistribution)。54若隨機變量服從指數(shù)分布,記為,其概率密度函數(shù)為:55指數(shù)分布的形狀和位置取決于參數(shù),如圖5-3。56指數(shù)分布的分布函數(shù)為:指數(shù)分布的期望和方差分別為:57指數(shù)分布的無記憶性:如果隨機變量

,則對任意的和,有我們稱指數(shù)分布具有無記憶性。58指數(shù)分布與泊松分布有著密切的聯(lián)系。泊松分布描述的是在某一給定區(qū)間(時間、距離)內(nèi),事件發(fā)生的次數(shù);而指數(shù)分布描述的是兩次事件發(fā)生之間的間隔長度。如果說某事件發(fā)生的次數(shù)服從泊松分布,那么兩次發(fā)生的時間間隔一定服從指數(shù)分布。59例5-8為描述在一小時內(nèi)到達洗車店的汽車數(shù),假定該隨機變量服從均值為10的泊松分布。請寫出:(1)每小時到達洗車點的汽車數(shù)X的概率分布;(2)兩輛車到達的時間間隔Y的概率密度函數(shù)。60解:(1)因為隨機變量X服從均值為10的泊松分布,所以泊松分布的參數(shù),其概率分布為:

61(2)因為每小時有10輛車到達洗車點,所以兩輛車到達的時間間隔是,從而兩輛車到達的時間間隔Y的指數(shù)分布的均值為,相應的概率密度函數(shù)為:

62例5-9為確定某燈泡的使用壽命,根據(jù)初步測試證明燈泡的壽命X服從指數(shù)分布,參數(shù)為,求:(1)X的均值和標準差;(2)設保修期為5年,當

時,必須更換燈泡的概率是多少?

63解:(1)(2)求必須更換燈泡的概率,即求即廠商必須更換燈泡的概率為55%。

645.4.3正態(tài)分布(1)一般正態(tài)分布德國10馬克的鈔票上印有德國著名數(shù)學家高斯的頭像,鈔票上同時印有正態(tài)分布的密度曲線??梢娫诟咚沟囊磺锌茖W貢獻中,對人類文明影響最大的,就是正態(tài)分布。因此正態(tài)分布(normaldistribution)也稱為高斯分布(Gaussiandistribution)。65如果隨機變量X的概率密度函數(shù)為:則稱X服從參數(shù)為和的正態(tài)分布,記為。式中,為正態(tài)隨機變量的均值;為標準差。66正態(tài)分布的分布函數(shù)為:正態(tài)分布的概率密度圖和分布函數(shù)圖,如圖5-5和圖5-6所示。6768根據(jù)正態(tài)分布的概率密度圖,可以看出正態(tài)曲線的特點:?關于中心位置對稱,在處取得最大值。?可以用目測的方法找出它的標準差:想象你從山頂開始滑雪,山的形狀和正態(tài)曲線一樣。69起先當你開始下滑時,往下的角度非常陡,當你還沒有直墜下去以前,陡度變得緩和起來,你越往下滑越平坦。這個陡度開始發(fā)生改變的點就代表了標準差的位置。圖5-7給出了當和發(fā)生變化時,相應的正態(tài)密度曲線的變化情況:7071從圖中可以看出,如果固定,改變,則圖形的形狀不發(fā)生變化,只是沿著x軸平移,因此稱為位置參數(shù)(locationparameter)。如果固定,改變,則圖形的位置不發(fā)生改變。越小,圖形越尖峭,分布較為集中;越大,圖形越平坦,分布較為分散。因此稱為尺度參數(shù)(scaleparameter)。72(2)標準正態(tài)分布(standardnormaldistribution)當,時,稱為標準正態(tài)分布,記為。其概率密度函數(shù)和分布函數(shù)分別為:73標準正態(tài)分布的概率密度函數(shù)和分布函數(shù)具有如下性質(zhì):??,和為常數(shù);?,且為常數(shù);?;?概率密度函數(shù)關于y軸對稱,在處取得最大值74一般正態(tài)分布與標準正態(tài)分布的關系為:如果隨機變量X服從參數(shù)為和的正態(tài)分布,即,則隨機變量

服從標準正態(tài)分布,即

,這一變換稱為標準化變換。75的分布函數(shù)可以寫成:

則對于任意的,有:76通過標準化變換,可以計算出隨機變量取值落在任何區(qū)間內(nèi)的概率,如圖5-8所示。77例5-10學生《商務統(tǒng)計學》課程的考試成績服從均值為70分,標準差為12分的正態(tài)分布,請問某個學生的成績在70分到80分之間的概率有多大?78解:設是學生的成績,則有

查附表1的標準正態(tài)分布表,得到因此也就是說學生的成績在70分到80分之間的概率為29.67%。79例5-11超市里每天的牛奶銷售量服從均值為500千克,標準差為50千克的正態(tài)分布,若早上營業(yè)前超市有牛奶庫存600千克,當天牛奶脫銷的概率是多大?80解:設是每天的牛奶銷售量,則有

查標準正態(tài)分布表,得到因此也就是說牛奶脫銷的概率為2.28%。81(3)正態(tài)分布的原則對于任何正態(tài)分布,大約有68.27%的觀測值落在距離均值1個標準差的范圍內(nèi),95.45%的觀測值落在距離均值2個標準差的范圍內(nèi),99.73%的觀測值落在距離均值3個標準差的范圍內(nèi)。8283例5-12根據(jù)近期數(shù)據(jù)資料,某地18歲男青年的身高服從平均數(shù)為172.7cm,標準差為4.01cm的正態(tài)分布。請根據(jù)原則,分析該地男青年身高的分布規(guī)律。84解:根據(jù)原則,該地:

大約有68.27%的男青年身高介于168.69-176.71之間,大約有95.45%的男青年身高介于164.68-180.72之間,大約有99.73%的男青年身高介于160.67-184.73之間。85(4)管理原則管理原則是一種以數(shù)據(jù)為基礎,追求幾乎完美無瑕的現(xiàn)代企業(yè)質(zhì)量管理策略。一般企業(yè)的瑕疵率大約是3到4個。以

為例,假設一個機場,每天起降100架飛機。86若每架起飛的飛機安全質(zhì)量以標準管理,那么這100架飛機都安全的概率是

,說明至少有一架飛機不安全的概率為0.2369。若采用管理原則,則這100架飛機都安全的概率是。875.5由正態(tài)分布導出的三個重要分布5.5.1卡方分布設隨機變量互相獨立,并且都服從標準正態(tài)分布,則稱

的分布是自由度為的

分布,記為

88卡方分布(Chi-squaredistribution)的概率密度函數(shù)為:其中,是伽馬函數(shù)。通常我們稱為伽馬函數(shù),參數(shù)。89伽馬函數(shù)具有以下性質(zhì):(1)(2),若為自然數(shù),則

。90卡方分布的概率密度圖是一個取值為非負的偏態(tài)分布,如圖5-10所示,從左到右依次為自由度為2,4,10,20的概率密度圖。其期望和方差分別為:91卡方分布具有下面的重要性質(zhì):若來自正態(tài)總體,其樣本均值和方差分別為:則有:(1)與相互獨立(2)(3)925.5.2F分布設隨機變量,,且與

相互獨立,則稱的分布是自由度為和的F分布,記為。設F的取值為,對,其密度函數(shù)為:

93F分布(Fdistribution)的概率密度圖如圖5-11。圖中,1、2、3、4、5、6分別表示、

、、、的概率密度圖。94F分布一般為正偏分布。若,則

,對于給定的,有

F分布一般可用于兩個正態(tài)總體方差的比較檢驗,方差分析和線性回歸模型的檢驗。955.5.3t分布設隨機變量,,則稱

的分布是自由度為的t分布,記為。其密度函數(shù)為

96t分布(tdistribution)的概率密度圖關于Y軸對稱(如圖5-12),與標準正態(tài)分布的圖形類似,都是均值為0的鐘形曲線,但t分布的峰比標準正態(tài)分布的峰低,且兩尾較高。97圖中,1、2、3、4分別表示、、和的概率密度圖形。t分布的期望和方差分別為:t分布具有下面的重要性質(zhì):若都是來自正態(tài)總體的樣本,和分別是樣本均值和方差,則有98t分布多用于小樣本()情況下的區(qū)間估計和假設檢驗,或是在總體方差未知時正態(tài)總體均值的區(qū)間估計和假設檢驗,以及線性回歸模型中回歸系數(shù)的顯著性檢驗等。995.6大數(shù)定理和中心極限定理5.6.1大數(shù)定理(1)伯努利大數(shù)定理(Bernoulli'sLawofLargeNumbers)設是重伯努利試驗中事件發(fā)生的次數(shù),是每次試驗中事件出現(xiàn)的概率,則對于任意的正數(shù),有

100伯努利大數(shù)定理說明:隨著試驗次數(shù)

的增大,事件發(fā)生的頻率與其概率無限接近,它們的偏差要多小有多小。這就說明了頻率的穩(wěn)定性。而在許多實際應用中,當試驗次數(shù)很大時,可以用事件發(fā)生的頻率代替事件發(fā)生的概率。

101(2)切比雪夫大數(shù)定理(Chebyshev’sLawofLargeNumbers)設為一列兩兩不相關的隨機變量序列,若每個的方差存在,且有共同的上界,即(),則對于任意的正數(shù),有:

102切比雪夫大數(shù)定理說明:隨著試驗次數(shù)趨于無窮大,隨機變量變化的均值依概率收斂到這個隨機變量的期望的均值

103切比雪夫大數(shù)定理只要求兩兩不相關,并未對其分布做出說明。因此可以得到:若是獨立同分布的隨機變量,方差有界,則一定服從大數(shù)定理。伯努利大數(shù)定理是切比雪夫大數(shù)定理的特例。

104(3)辛欽大數(shù)定理(Khinchin’sLawofLargeNumbers)設為一獨立同分布的隨機變量序列,若每個的期望存在且有相同的期望值,則對于任意的正數(shù),有:

105辛欽大數(shù)定理提供了求隨機變量數(shù)學期望

的近似方法。假設現(xiàn)在對隨機變量重復觀察次,每次的觀察值相互獨立且與同分布。在期望存在時,按照辛欽大數(shù)定理,若足夠大,可以把平均觀察值,作為期望的近似。

1065.6.2中心極限定理中心極限定理(CentralLimitTheorem)是研究隨機變量和的極限分布在什么條件下為正態(tài)分布的問題。(1)樣本平均數(shù)的中心極限定理

107考慮從均值為,標準差為,服從任意概率分布的總體中抽取容量為的樣本,當趨于無窮大時,樣本平均數(shù)的分布近似服從均值,標準差的正態(tài)分布。108由中心極限定理我們可以知道,無論總體服從何種概率分布,只要知道它的均值和標準差,對于足夠大的樣本,樣本平均數(shù)

的分布近似為正態(tài)。一般認為樣本量的是大樣本,大樣本的平均數(shù)近似服從正態(tài)分布。

109例5-13某公司1000名員工的人均年獎金為2000元,標準差500元,從中隨機抽取36人進行調(diào)查,問該樣本中人均年獎金在1900-2200元之間的概率是多少?

110解:,根據(jù)樣本平均數(shù)的中心極限定理可知111查標準正態(tài)分布表,得到因此即樣本中人均年獎金在1900-2200元之間的概率是0.8767。112(2)樣本成數(shù)的中心極限定理從任一總體成數(shù)為,方差為的0-1分布總體中,抽取容量為的樣本,隨著樣本容量的增大,當且時,樣本成數(shù)的分布近似服從均值為,標準差的正態(tài)分布。

113例5-14某股民判斷股票漲跌正確的概率為0.6,且每次判斷相互獨立,假設該股民作了100次判斷,至少有50次判斷正確的概率有多大?114解:設為第次判斷正確,判斷正確取值為1,否則為0。記的和為,則至少有50次判斷正確的概率為:

查標準正態(tài)分布表,得到1155.7抽樣和抽樣分布5.7.1統(tǒng)計推斷在很多實際統(tǒng)計問題中,由于人力物力等諸多條件的限制,我們不能獲取全部數(shù)據(jù),只能從中抽取一部分數(shù)據(jù),依據(jù)這部分觀測數(shù)據(jù)對全部研究對象的數(shù)量特征或數(shù)量規(guī)律進行推斷,稱為統(tǒng)計推斷(statisticalinference)。

116統(tǒng)計推斷包括兩方面的內(nèi)容:一是參數(shù)估計,即通過樣本數(shù)據(jù)對總體的數(shù)量特征進行估計;二是假設檢驗,由樣本數(shù)據(jù)對總體的數(shù)量規(guī)律性是否具有某種指定特征進行檢驗。

1175.7.2抽樣的基本概念抽樣(sampling),也叫抽樣調(diào)查(samplingsurvey),是按照隨機原則,以一定的概率從總體中抽取部分樣本進行調(diào)查,根據(jù)樣本統(tǒng)計量對總體參數(shù)的數(shù)量特征做出可靠的估計和推斷。抽取樣本時,個體可以按照相等的概率被抽到,也可以按照不等的概率被抽到,前者稱為等概率抽樣,后者稱為不等概率抽樣。

118為什么要進行抽樣調(diào)查呢?因為在很多情況下抽樣比研究總體更切實可行。一方面有些試驗具有破壞性,不適合全面調(diào)查,如調(diào)查燈泡壽命。也有一些總體在理論上可以進行全面調(diào)查,但在實際中不具有可行性,如調(diào)查森林中有多少棵樹。

119(1)樣本容量和樣本可能個數(shù)樣本中包含的個體數(shù)稱為樣本容量。樣本可能個數(shù)是指從一個總體中可能抽取多少組樣本,即容量相同的所有可能樣本有多少組。樣本可能個數(shù)的多少與抽樣方法有關。

120(2)總體參數(shù)和樣本統(tǒng)計量總體分布的數(shù)量特征就是總體參數(shù),其數(shù)值是唯一的,確定的。即總體參數(shù)為常數(shù),但多為未知的。常見的總體參數(shù)有:總體平均數(shù)、總體比例(成數(shù))、總體方差或總體標準差等,它們都能反映總體的分布特征。

121以未加權的情況為例,總體平均數(shù)、總體方差和總體標準差分別為:122與總體參數(shù)對應的是樣本統(tǒng)計量,即根據(jù)樣本數(shù)據(jù)計算出的指標。由于樣本是從總體中抽取出來的,是隨機的,因此樣本統(tǒng)計量是隨機變量。常見的樣本統(tǒng)計量有:樣本平均數(shù)、樣本比例(成數(shù))、樣本方差或樣本標準差等。

123以未加權的情況為例,總體平均數(shù)、總體方差和總體標準差分別為:124(3)重復抽樣和不重復抽樣重復抽樣(或重置抽樣)是指從總體中抽出一個樣本單位,記錄其標志值后,放回總體中繼續(xù)參加下一輪樣本單位的抽取。重復抽樣的特點是:第一,個單位的樣本是由次試驗的結果構成的。

125第二,每次試驗是獨立的,即試驗的結果與前次、后次的結果都無關。第三,每次試驗都是在相同條件下進行的,每個單位在多次試驗中中選的機會(概率)是相同的。重復抽樣時,樣本可能個數(shù)為,為總體單位數(shù),為樣本容量。

126不重復抽樣(或不重置抽樣)是指每次從總體中抽出一個樣本單位,記錄其標志值后,不放回原總體,不繼續(xù)參加下一輪抽樣。下一次從余下的單位中抽取樣本。不重復抽樣的特點是:第一,個單位的樣本由次試驗結果構成,但由于每次抽樣不重復,實質(zhì)上相當于從總體中同時抽取

個樣本單位。

127第二,每次試驗結果是不獨立的,上次中選的情況影響下次抽選的結果。第三,每個單位在多次試驗中中選的機會是不相等的。對于考慮順序的不重復抽樣,樣本可能個數(shù)為;對于不考慮順序的不重復抽樣,樣本可能個數(shù)為。

1285.7.3抽樣組織方式(1)簡單隨機抽樣簡單隨機抽樣(simplerandomsampling)也稱純隨機抽樣,是指按照隨機原則從總體的所有單位中抽取樣本的方式,要保證全部可能的樣本被抽到的概率都相等。

129簡單隨機抽樣是其他抽樣方法的基礎,因為它在理論上最容易處理,并且當總體包含的抽樣單元數(shù)N不太大時實施并不困難,但是當N很大時實施起來就相當困難,此時可以采用隨機數(shù)表的方法。

130當N很大時所抽到的樣本單元往往很分散,不能保證樣本在總體中較為均勻地分布,使調(diào)查極不方便且樣本缺乏代表性。因此在大規(guī)模抽樣調(diào)查中很少單獨采用簡單隨機抽樣。

131(2)分層抽樣分層抽樣(stratifiedsampling)也稱類型抽樣或分類抽樣,是將總體中的抽樣單元按某種原則劃分成若干個組,然后在每個組內(nèi)獨立地進行抽樣以獲得樣本的抽樣方式。其優(yōu)點是通過劃類分組,增大了各類中單位間的共同性,容易抽出具有代表性的樣本。

132分層抽樣的實施和組織都比較方便,樣本單元分布比較均勻。當組內(nèi)差異較小而組間差異較大時,采用分層抽樣可以大大提高估計的精度。

133(3)等距抽樣等距抽樣也稱機械抽樣或系統(tǒng)抽樣(systematicsampling),首先將總體單元按一定順序排列,在規(guī)定的范圍內(nèi)隨機抽取一個單元作為初始單元,然后按照一定的規(guī)則確定其他樣本單元。

134在等距抽樣中,初始單元是隨機抽取的,其他樣本單元都隨著初始單元的確定而確定。在進行等距抽樣時,應提前觀察總體的實物順序。若實物順序與總體的特征相關,就不應該使用等距抽樣。

135(4)整群抽樣整群抽樣(Clustersampling)也稱集團抽樣,是指將總體單元按照一定的標準分成若干部分,每個部分稱為一個群,然后以群為單位,隨機抽取一個或幾個群,對被抽中的群進行全面調(diào)查。整群抽樣的效率與群的劃分密切相關,其劃分原則是盡量使每個群都有較好的代表性,群間差異小,而群內(nèi)差異大。

136(5)二階段抽樣和多階段抽樣在調(diào)查對象的總體范圍大、分布又廣的情況下,只進行一次抽樣很難選出所需的樣本。我們可以把整個抽樣過程分成兩個或多個階段。如在企業(yè)職工收入調(diào)查中,先對企業(yè)進行抽樣,再在被抽中的企業(yè)內(nèi)對職工進行抽樣,然后對被抽中的職工進行調(diào)查,這就是二階段抽樣(two-stagesampling)

137如果總體可以劃分成多個級別的抽樣單元,每一級別的抽樣單元由若干下一級別的抽樣單元組成,相應地存在多個級別的抽樣框,抽樣時先在一級抽樣框中對一級單元抽樣,再在中選的一級單元中對二級單元抽樣。

138如果每個二級單元又由更小的三級單元組成,那么在二階段抽樣后,在中選的二級單元中對三級單元抽樣,稱為三階段抽樣(three-stagesampling)。以此類推,還可以定義更高階段的抽樣。對于二階段以上的抽樣統(tǒng)稱為多階段抽樣(multi-stagesampling)。

1395.7.4抽樣誤差隨機樣本的樣本值和總體值之間的差異稱為抽樣誤差(samplingerror),抽樣誤差是在選取樣本時一些偶然因素影響的結果。通常,抽樣誤差的大小由樣本均值的標準差來衡量。

140(1)樣本均值的標準差重復抽樣時,有式中,為樣本均值的標準差,又稱為抽樣平均誤差;為總體的標準差;為樣本容量。141不重復抽樣時,有式中,為樣本均值的標準差;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論