版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
統(tǒng)計學第六章抽樣推斷第一頁,共一百五十五頁,2022年,8月28日第六章抽樣推斷★§1.1抽樣方案的設計§1.2簡單隨機抽樣的抽樣誤差的測定§1.3簡單隨機抽樣的抽樣估計第二頁,共一百五十五頁,2022年,8月28日§1.1抽樣方案的設計一、抽樣估計的意義和一般步驟二、抽樣方案設計的基本準則★第三頁,共一百五十五頁,2022年,8月28日一、抽樣估計的意義和一般步驟㈠抽樣估計的定義㈡抽樣估計的特點㈢抽樣估計的運用㈣抽樣估計的一般步驟㈤總體參數(shù)與樣本指標第四頁,共一百五十五頁,2022年,8月28日指樣本單位的抽取不受主觀因素及其他系統(tǒng)性因素的影響,每個總體單位都有均等的被抽中機會抽樣估計第六章抽樣推斷按照隨機原則
從調查對象中抽取一部分單位進行調查,并以調查結果對總體數(shù)量特征作出具有一定可靠程度的估計與推斷,從而認識總體的一種統(tǒng)計方法第五頁,共一百五十五頁,2022年,8月28日統(tǒng)計推斷全及總體指標:參數(shù)(未知量)樣本總體指標:統(tǒng)計量(已知量)抽樣估計第六章抽樣推斷第六頁,共一百五十五頁,2022年,8月28日并非所有的抽樣估計都按隨機原則抽取樣本,也有非隨機抽樣總體隨機樣本非隨機樣本與總體分布特征相同與總體分布特征不同第六章抽樣推斷第七頁,共一百五十五頁,2022年,8月28日按隨機原則抽取樣本單位目的是推斷總體的數(shù)量特征抽樣推斷的結果具有一定的可靠程度,抽樣誤差可以事先計算并控制抽樣估計的特點第六章抽樣推斷第八頁,共一百五十五頁,2022年,8月28日不可能進行全面調查時不必要進行全面調查時來不及進行全面調查時對全面調查資料進行補充修正時抽樣估計的應用第六章抽樣推斷第九頁,共一百五十五頁,2022年,8月28日第六章抽樣推斷抽樣調查研究
SamplingStudy為什么要抽樣?
1.
涉及破壞受試對象質量控制2.取得精確可靠的結果3.實際情況的約束時間,成本等第十頁,共一百五十五頁,2022年,8月28日設計抽樣方案抽取樣本單位收集樣本數(shù)據(jù)計算樣本統(tǒng)計量推斷總體參數(shù)抽樣估計的一般步驟第六章抽樣推斷第十一頁,共一百五十五頁,2022年,8月28日設總體中個總體單位某項標志的標志值分別為,其中具有某種屬性的有個單位,不具有某種屬性的有個單位,則⒈總體平均數(shù)(又叫總體均值):指被估計的總體指標,又被稱為全及指標總體參數(shù)第六章抽樣推斷第十二頁,共一百五十五頁,2022年,8月28日⒉總體單位標志值的標準差:⒊總體單位標志值的方差:第六章抽樣推斷第十三頁,共一百五十五頁,2022年,8月28日⒋總體成數(shù):⒌總體是非標志的標準差:⒍總體是非標志的方差:第六章抽樣推斷第十四頁,共一百五十五頁,2022年,8月28日設樣本中個樣本單位某項標志的標志值分別為,其中具有和不具有某種屬性的樣本單位數(shù)目分別為和個,則⒈樣本平均數(shù)(又叫樣本均值):指根據(jù)樣本單位的標志值計算的用以估計和推斷相應總體指標的綜合指標,又被稱為估計量或統(tǒng)計量樣本指標第六章抽樣推斷第十五頁,共一百五十五頁,2022年,8月28日1.樣本平均數(shù)的計算公式為:計算公式第十六頁,共一百五十五頁,2022年,8月28日⒉樣本單位標志值的標準差:⒊樣本單位標志值的方差:為自由度第十七頁,共一百五十五頁,2022年,8月28日2.樣本方差的計算公式為:計算公式第十八頁,共一百五十五頁,2022年,8月28日第十九頁,共一百五十五頁,2022年,8月28日⒋樣本成數(shù):⒌樣本單位是非標志的標準差:⒍樣本單位是非標志的方差:第六章抽樣推斷第二十頁,共一百五十五頁,2022年,8月28日§1.1抽樣方案的設計一、抽樣估計的意義和一般步驟二、抽樣方案設計的基本準則三、抽樣方案設計的主要內容★★第二十一頁,共一百五十五頁,2022年,8月28日㈠隨機原則——抽取樣本單位時,應確保每個總體單位都有被抽取的可能;在對樣本單位的資料進行搜集和整理時,不能隨意遺漏或更換樣本單位㈡抽樣誤差最小——在其他條件相同的情況下,選抽樣誤差最小的方案㈢費用最少——在其他條件相同的情況下,選費用最少的方案設計抽樣方案時,通常是在誤差達到一定要求的條件下,選擇費用最少的方案抽樣方案設計的基本準則第六章抽樣推斷第二十二頁,共一百五十五頁,2022年,8月28日§1.1抽樣方案的設計一、抽樣估計的意義和一般步驟二、抽樣方案設計的基本準則三、抽樣方案設計的主要內容★★★第二十三頁,共一百五十五頁,2022年,8月28日㈠編制抽樣框㈡確定抽樣方法㈢確定抽樣組織方式㈣確定樣本容量三、抽樣方案設計的主要內容第二十四頁,共一百五十五頁,2022年,8月28日抽樣框指包括全部抽樣單位的名單框架,僅對有限總體而言主要形式名單抽樣框區(qū)域抽樣框時間表抽樣框編制抽樣框第六章抽樣推斷第二十五頁,共一百五十五頁,2022年,8月28日區(qū)域抽樣框在商場的大門口在微波爐柜臺前在市區(qū)街道旁邊在某個住宅小區(qū)中山區(qū)…沙河口區(qū)星海街道…黑石礁街道尖山一委…尖山二委居民一組居民二組…某外國公司在大連進行微波爐市場調查:第六章抽樣推斷第二十六頁,共一百五十五頁,2022年,8月28日時間表抽樣框連續(xù)出產的產品總體可以編制抽樣框:均勻的出產時間、可以預見到的產品總量。連續(xù)到加油站加油的汽車總體無法編制抽樣框:時間不定、總量也無法確定。第六章抽樣推斷第二十七頁,共一百五十五頁,2022年,8月28日確定抽樣方法重復抽樣又被稱作重置抽樣、有放回抽樣抽出個體登記特征放回總體繼續(xù)抽取特點同一總體單位有可能被重復抽中,而且每次抽取都是獨立進行第六章抽樣推斷第二十八頁,共一百五十五頁,2022年,8月28日不重復抽樣又被稱作不重置抽樣、不放回抽樣抽出個體登記特征繼續(xù)抽取特點同一總體中每個單位被抽中的機會并不均等,在連續(xù)抽取時,每次抽取都不是獨立進行是最為常用的抽樣方法,用于無限總體和許多有限總體樣本單位的抽樣。確定抽樣方法第六章抽樣推斷第二十九頁,共一百五十五頁,2022年,8月28日確定抽樣組織方式1·簡單隨機抽樣(純隨機抽樣)——對總體單位逐一編號,然后按隨機原則直接從總體中抽出若干單位構成樣本應用僅適用于規(guī)模不大、內部各單位標志值差異較小的總體是最簡單、最基本、最符合隨機原則,但同時也是抽樣誤差最大的抽樣組織形式第六章抽樣推斷第三十頁,共一百五十五頁,2022年,8月28日2·類型抽樣(分層抽樣)——將總體全部單位分類,形成若干個類型組,然后從各類型中分別抽取樣本單位組成樣本。總體N樣本n等額抽取等比例抽取······能使樣本結構更接近于總體結構,提高樣本的代表性;能同時推斷總體指標和各子總體的指標確定抽樣組織方式第六章抽樣推斷第三十一頁,共一百五十五頁,2022年,8月28日3·等距抽樣(機械抽樣或系統(tǒng)抽樣)——將總體單位按某一標志排序,而后按一定的間隔抽取樣本單位?!ぁぁぁぁぁるS機起點半距起點對稱起點(總體單位按某一標志排序)按無關標志排隊,其抽樣效果相當于簡單隨機抽樣;按有關標志排隊,其抽樣效果相當于類型抽樣。確定抽樣組織方式第六章抽樣推斷第三十二頁,共一百五十五頁,2022年,8月28日4·整群抽樣(集團抽樣)——將總體全部單位分為若干“群”,然后隨機抽取一部分“群”,被抽中群體的所有單位構成樣本例:總體群數(shù)R=16樣本群數(shù)r=4ABCDEFGHIJKLMNOPLHPD樣本容量簡單、方便,能節(jié)省人力、物力、財力和時間,但其樣本代表性可能較差確定抽樣組織方式第六章抽樣推斷第三十三頁,共一百五十五頁,2022年,8月28日5·多階段抽樣——指分兩個或兩個以上的階段來完成抽取樣本單位的過程例:在某省100多萬農戶抽取1000戶調查農戶生產性投資情況。第一階段:從該省所有縣中抽取5個縣第二階段:從被抽中的5個縣中各抽4個鄉(xiāng)第三階段:從被抽中的20個鄉(xiāng)中各抽5個村第四階段:從被抽中的100個村中各抽10戶樣本n=100×10=1000(戶)確定抽樣組織方式第六章抽樣推斷第三十四頁,共一百五十五頁,2022年,8月28日調查對象的性質特點對調查對象的了解程度(抽樣框的特點)抽樣誤差的大小人力、財力和物力等條件的限制在實際工作中,選擇適當?shù)某闃咏M織方式主要應考慮:確定抽樣組織方式第六章抽樣推斷第三十五頁,共一百五十五頁,2022年,8月28日確定樣本容量n≥30,為大樣本;n<30,為小樣本樣本容量指樣本中含有的總體單位的數(shù)目,通常用n來表示。確定適當樣本容量的意義:若n過大,調查工作量增大,體現(xiàn)不出抽樣調查的優(yōu)越性;若n過小,抽樣誤差會增大,抽樣推斷就會失去價值。第六章抽樣推斷第三十六頁,共一百五十五頁,2022年,8月28日樣本的可能數(shù)目在考慮順序的抽樣條件下,從總體N中隨機抽取n個樣本單位共有多少種可能的抽選結果⒈重復抽樣的可能樣本數(shù)目:⒉不重復抽樣的可能樣本數(shù)目:共n個確定樣本容量第六章抽樣推斷第三十七頁,共一百五十五頁,2022年,8月28日第六章抽樣推斷★§1.1抽樣方案的設計§1.2簡單隨機抽樣的抽樣誤差的測定§1.3簡單隨機抽樣的抽樣估計★第三十八頁,共一百五十五頁,2022年,8月28日一、抽樣分布二、抽樣估計量的優(yōu)良標準三、抽樣誤差的概念四、抽樣平均誤差五、抽樣極限誤差§1.2簡單隨機抽樣的抽樣誤差的測定第三十九頁,共一百五十五頁,2022年,8月28日樣本統(tǒng)計量總體未知參數(shù)樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量抽樣分布樣本統(tǒng)計量所有可能值的概率分布主要樣本統(tǒng)計量平均數(shù)比率(成數(shù))方差第六章抽樣推斷第四十頁,共一百五十五頁,2022年,8月28日例:某大公司人事部經理整理其2500個中層干部的檔案。其中一項內容是考察這些中層干部的平均年薪及參加過公司培訓計劃的比例。總體:2500名中層干部,
如果:上述情況可由每個人的個人檔案中得知,可容易地測出這2500名中層干部的平均年薪及標準差。假如:1:已經得到了如下的結果:
總體均值:51800
總體標準差:
=4000第四十一頁,共一百五十五頁,2022年,8月28日
上述總體均值、總體標準差、比例均稱為總體的參數(shù)2、同時,有1500人參加了公司培訓,則參加公司培訓計劃的比例為:P=1500/2500=0.60如:上例中的中層干部平均年薪,年薪標準差及受培訓人數(shù)所占比例均為該公司中層干部這一總體的參數(shù)?!癯闃庸烙嬀褪且ㄟ^樣本而非總體來估計總體參數(shù)。第四十二頁,共一百五十五頁,2022年,8月28日如果抽樣的樣本與前一次的不同,則可得到另外的平均年薪樣本均值、標準差以及受訓干部的比例。
如果多次抽樣,則可得到多個不同的結果。
下表是一個假設的經過500次抽樣后的情況表。第四十三頁,共一百五十五頁,2022年,8月28日下表給出了500個的頻數(shù)分布與相對頻數(shù)分布,第四十四頁,共一百五十五頁,2022年,8月28日圖4.1500個的相對頻數(shù)分布這里,的相對頻數(shù)分布,就稱為的抽樣分布。第四十五頁,共一百五十五頁,2022年,8月28日正是抽樣分布及其特征使得用樣本統(tǒng)計量估計總體參數(shù)的“精確程度”能夠給予概率上的描述。一般地,樣本統(tǒng)計量的可能取值及其取值概率所形成的概率分布,統(tǒng)計上稱為抽樣分布(samplingdistribution)。精確度可靠度第四十六頁,共一百五十五頁,2022年,8月28日平均數(shù)的抽樣分布全部可能樣本平均數(shù)的均值等于總體均值,即:從非正態(tài)總體中抽取的樣本平均數(shù)當n足夠大時其分布接近正態(tài)分布。從正態(tài)總體中抽取的樣本平均數(shù)不論容量大小其分布均為正態(tài)分布。樣本均值的標準差為總體標準差的。第六章抽樣推斷第四十七頁,共一百五十五頁,2022年,8月28日比率的抽樣分布全部可能樣本比率的均值等于總體比率,即:從非正態(tài)總體中抽取的樣本比率,當n足夠大時其分布接近正態(tài)分布。從正態(tài)總體中抽取的樣本比率,不論容量大小其分布均為正態(tài)分布。樣本比率的標準差為總體標準差的。第六章抽樣推斷樣本比率的抽樣分布是樣本比率所有可能值的概率分布。第四十八頁,共一百五十五頁,2022年,8月28日樣本抽樣分布原總體分布第六章抽樣推斷第四十九頁,共一百五十五頁,2022年,8月28日一、抽樣分布二、抽樣估計量的優(yōu)良標準三、抽樣誤差的概念四、抽樣平均誤差五、抽樣極限誤差§1.2簡單隨機抽樣的抽樣誤差的測定★★第五十頁,共一百五十五頁,2022年,8月28日抽樣估計量的優(yōu)良標準設為待估計的總體參數(shù),為樣本統(tǒng)計量,則的優(yōu)良標準為:若,則稱為的無偏估計量指樣本指標的均值應等于被估計的總體指標無偏性第六章抽樣推斷第五十一頁,共一百五十五頁,2022年,8月28日若,則稱為比更有效的估計量若越大越小,則稱為的一致估計量作為優(yōu)良的估計量,除了滿足無偏性的要求外,其方差應比較小有效性指隨著樣本單位數(shù)的增大,樣本估計量將在概率意義下越來越接近于總體真實值一致性抽樣估計量的優(yōu)良標準第六章抽樣推斷第五十二頁,共一百五十五頁,2022年,8月28日為的無偏、有效、一致估計量;為的無偏、有效、一致估計量;為的無偏、有效、一致估計量。數(shù)理統(tǒng)計證明:抽樣估計量的優(yōu)良標準第六章抽樣推斷第五十三頁,共一百五十五頁,2022年,8月28日一、抽樣分布二、抽樣估計量的優(yōu)良標準三、抽樣誤差的概念四、抽樣平均誤差五、抽樣極限誤差§1.2簡單隨機抽樣的抽樣誤差的測定★★★第六章抽樣推斷第五十四頁,共一百五十五頁,2022年,8月28日說明對于任何一個樣本,其抽樣誤差都不可能測量出來抽樣誤差的大小可以依據(jù)概率分布理論加以說明指樣本估計量與總體參數(shù)之間數(shù)量上的差異,僅指由于按照隨機原則抽取樣本而產生的代表性誤差,不包括登記性誤差和系統(tǒng)偏差抽樣誤差第六章抽樣推斷第五十五頁,共一百五十五頁,2022年,8月28日影響因素1、樣本單位數(shù)。(越大,誤差越小)2、總體內各單位被研究標志的變異程度。(越大,誤差越大)3、抽樣方法。(不重復小于重復)4、抽樣組織形式。(通常采用機械和類型抽樣方式組織抽樣調查)第五十六頁,共一百五十五頁,2022年,8月28日一、抽樣分布二、抽樣估計量的優(yōu)良標準三、抽樣誤差的概念四、抽樣平均誤差五、抽樣極限誤差§1.2簡單隨機抽樣的抽樣誤差的測定★★★★第五十七頁,共一百五十五頁,2022年,8月28日抽樣平均誤差指每一個可能樣本的估計值與總體指標值之間離差的平均數(shù),即樣本估計量的標準差式中:為樣本平均數(shù)的抽樣平均誤差;為可能的樣本數(shù)目;為第個可能樣本的平均數(shù);為總體平均數(shù)注意:不要混淆抽樣標準差與樣本標準差!第六章抽樣推斷第五十八頁,共一百五十五頁,2022年,8月28日〖例〗現(xiàn)有A、B、C、D四名工人構成的總體,他們的日產量分別為22、24、26、28件。從四名工人中任取兩名構成一個樣本,請利用重復抽樣和不重復抽樣的方法計算抽樣平均誤差?!痉治觥肯扔嬎愠鋈悢?shù)值:根據(jù)抽樣平均誤差的計算公式,我們必須本題要求我們計算抽樣平均誤差。可能樣本總數(shù)??傮w平均日產量、樣本平均日產量、第五十九頁,共一百五十五頁,2022年,8月28日總體平均日產量1、重復抽樣。樣本數(shù)為第六十頁,共一百五十五頁,2022年,8月28日2、不重復抽樣。樣本數(shù)為第六十一頁,共一百五十五頁,2022年,8月28日但是,上面計算抽樣平均誤差的這個理論公式,在實際應用上會存在兩個困難:⑴運用這個公式要求把所有的樣本都抽選出來,然后計算它們的指標數(shù)值。這在實際應用過程中幾乎是不可能的。⑵運用上面公式要求總體平均數(shù)的數(shù)值是已知的。但實際上,總體平均數(shù)的數(shù)值是未知的,它正是抽樣調查要推斷的。第六十二頁,共一百五十五頁,2022年,8月28日抽樣平均誤差的計算公式⒈樣本平均數(shù)的抽樣平均誤差當N≥500時,有重復抽樣時:不重復抽樣時:第六章抽樣推斷第六十三頁,共一百五十五頁,2022年,8月28日如果總體單位數(shù)很“大”而樣本容量很“小”,則該修正因子趨近于1,這時,對不重復抽樣可直接按重復抽樣的公式去計算。
一個經驗的衡量標準是n/N<=0.05。稱為修正因子第六十四頁,共一百五十五頁,2022年,8月28日⒉樣本成數(shù)的抽樣平均誤差重復抽樣時:不重復抽樣時:當N≥500時,有抽樣平均誤差的計算公式第六章抽樣推斷第六十五頁,共一百五十五頁,2022年,8月28日影響抽樣誤差的因素總體各單位的差異程度(即標準差的大?。涸酱?,抽樣誤差越大;樣本單位數(shù)的多少:越大,抽樣誤差越小;抽樣方法:不重復抽樣的抽樣誤差比重復抽樣的抽樣誤差小;抽樣組織方式:簡單隨機抽樣的誤差最大。第六章抽樣推斷第六十六頁,共一百五十五頁,2022年,8月28日一、抽樣分布二、抽樣估計量的優(yōu)良標準三、抽樣誤差的概念四、抽樣平均誤差五、抽樣極限誤差§1.2簡單隨機抽樣的抽樣誤差的測定★★★★★第六十七頁,共一百五十五頁,2022年,8月28日68.27%95.45%99.73%抽樣極限誤差第六章抽樣推斷第六十八頁,共一百五十五頁,2022年,8月28日抽樣極限誤差指在一定的概率保證程度下,抽樣誤差不允許超過的某一給定范圍,也稱作允許誤差、誤差范圍、誤差置信限等由于提高把握程度,會增大允許誤差,使估計精度降低,而縮小允許誤差,提高估計的精度,又會降低估計的把握程度,所以在實際中應根據(jù)具體情況,先確定一個合理的把握程度再求相應的允許誤差或先確定一個允許誤差范圍再求相應的把握程度。第六章抽樣推斷第六十九頁,共一百五十五頁,2022年,8月28日抽樣極限誤差的計算公式(大樣本條件下)樣本平均數(shù)的極限誤差:⒈樣本成數(shù)的極限誤差:⒉Z為概率度,是給定概率保證程度下樣本均值偏離總體均值的抽樣平均誤差的倍數(shù)。第六章抽樣推斷第七十頁,共一百五十五頁,2022年,8月28日Z與相應的概率保證程度存在一一對應關系,常用Z值及相應的概率保證程度為:
z值概率保證程度
1.000.68271.650.90001.960.95002.000.95452.580.99003.000.9973抽樣極限誤差的計算公式(大樣本條件下)第六章抽樣推斷第七十一頁,共一百五十五頁,2022年,8月28日第七十二頁,共一百五十五頁,2022年,8月28日標準正態(tài)分布函數(shù)值表第七十三頁,共一百五十五頁,2022年,8月28日▼注意:
1、統(tǒng)計學上往往用抽樣極限誤差來測度抽樣誤差的大小或者說測度點估計的精度。
原因:總體參數(shù)值往往并不知道,因此,實際抽樣誤差與抽樣平均誤差也往往無法求出,但在抽樣分布大體知道的情況下,抽樣極限誤差是可以估計出來的。一定概率下抽樣誤差的可能范圍(也稱允許誤差):第七十四頁,共一百五十五頁,2022年,8月28日
2、抽樣極限誤差的估計總是要和一定的概率保證程度聯(lián)系在一起的。原因:樣本統(tǒng)計量往往是一隨機變量,它與總體參數(shù)真值之差也是一個隨機變量,因此就不能期望某次抽樣的樣本估計值落在一定區(qū)間內是一個必然事件,而只能給予一定的概率保證。因此,在進行抽樣估計時,既需要考慮抽樣誤差的可能范圍,同時還需考慮落到這一范圍的概率大小。前者是估計的準確度問題,后者是估計的可靠性問題,兩者緊密聯(lián)系不可分開。這也正是區(qū)間估計所關心的主要問題。第七十五頁,共一百五十五頁,2022年,8月28日第六章抽樣推斷★§1.1抽樣方案的設計§1.2簡單隨機抽樣的抽樣誤差的測定§1.3簡單隨機抽樣的抽樣估計★★第七十六頁,共一百五十五頁,2022年,8月28日一、點估計二、區(qū)間估計三、樣本數(shù)目的確定§1.3簡單隨機抽樣的抽樣估計★第七十七頁,共一百五十五頁,2022年,8月28日點估計指直接以樣本指標來估計總體指標,也叫定值估計簡單,具體明確優(yōu)點缺點無法控制誤差,僅適用于對推斷的準確程度與可靠程度要求不高的情況第六章抽樣推斷第七十八頁,共一百五十五頁,2022年,8月28日
用樣本統(tǒng)計量(samplestatistics)可以作為其對應的總體的點估計量(pointestimator)。但要估計總體的某一指標,并非只能用一個樣本指標,而可能有多個指標可供選擇,即對同一總體參數(shù),可能會有不同的估計量。
點估計量的性質:估計量優(yōu)劣的衡量作為一個好的點估計量,統(tǒng)計量必須具有如下性質:
無偏性、有效性、一致性第七十九頁,共一百五十五頁,2022年,8月28日在上例中,假如隨機抽取了一個容量為30的樣本:年薪是否參加過培訓計劃
49094.3Yes53263.9Yes49643.5Yes……
點估計(PointEstimation)假如根據(jù)該樣本求得的年薪樣本平均數(shù)、標準差及參加過培訓計劃人數(shù)的比例分別為:第八十頁,共一百五十五頁,2022年,8月28日
則可用上述結果分別代表2500名中層干部的平均年薪、年薪的標準差及受訓比例。
上述估計總體參數(shù)的過程被稱為點估計(pointestimation);樣本均值(標準差/比例)稱為總體均值(標準差/比例)的點估計量(pointestimator);樣本均值(標準差/比例)的具體數(shù)值稱為總體均值(標準差/比例)的點估計值(pointestimate)。由于點估計量是由樣本測算的,因此也稱為樣本統(tǒng)計量。第八十一頁,共一百五十五頁,2022年,8月28日一、點估計二、區(qū)間估計三、樣本數(shù)目的確定§1.3簡單隨機抽樣的抽樣估計★★第八十二頁,共一百五十五頁,2022年,8月28日二、區(qū)間估計㈠區(qū)間估計的定義和原理㈡總體平均數(shù)的區(qū)間估計㈢總體成數(shù)的區(qū)間估計第八十三頁,共一百五十五頁,2022年,8月28日區(qū)間估計指根據(jù)樣本指標和抽樣極限誤差以一定的可靠程度推斷總體指標的可能范圍;其中,被推斷的總體指標的下限與上限所包括的區(qū)間稱為置信區(qū)間,估計的可靠程度也稱為置信度。(這里只討論常用的大樣本的情況)第六章抽樣推斷是根據(jù)樣本估計量以一定的可靠程度推斷總體參數(shù)所在的區(qū)間范圍。第八十四頁,共一百五十五頁,2022年,8月28日
一般地,設總體參數(shù)為,L、U為由樣本確定的兩個統(tǒng)計量值,對于給定的(0<
<1),有則稱(L,U)為參數(shù)的置信度為1-的置信區(qū)間,L、U分別稱為置信下限與置信上限,為顯著性水平,1-為置信度。置信區(qū)間第八十五頁,共一百五十五頁,2022年,8月28日
2、
1-可以認為是用樣本估計值代替總體真值時誤差在某一范圍內的“可能性”,則可認為是這種替代產生的抽樣極限誤差超過這一范圍的“可能性”。
注意:
1、置信區(qū)間的直觀意義為:多次抽樣形成的多個置信區(qū)間中,有(1-)100%包含總體參數(shù)真值。/2/2第八十六頁,共一百五十五頁,2022年,8月28日區(qū)間估計原理0.6827落在范圍內的概率為68.27%樣本抽樣分布曲線原總體分布曲線第六章抽樣推斷第八十七頁,共一百五十五頁,2022年,8月28日區(qū)間估計原理0.9545落在范圍內的概率為95.45%樣本抽樣分布曲線原總體分布曲線第六章抽樣推斷第八十八頁,共一百五十五頁,2022年,8月28日區(qū)間估計原理0.9973落在范圍內的概率為99.73%樣本抽樣分布曲線總體分布曲線第六章抽樣推斷第八十九頁,共一百五十五頁,2022年,8月28日總體平均數(shù)的區(qū)間估計表達式其中,為極限誤差第六章抽樣推斷第九十頁,共一百五十五頁,2022年,8月28日步驟⒈計算樣本平均數(shù);⒉搜集總體方差的經驗數(shù)據(jù);或計算樣本標準差,即總體平均數(shù)的區(qū)間估計第六章抽樣推斷第九十一頁,共一百五十五頁,2022年,8月28日步驟⒊計算抽樣平均誤差:重復抽樣時:不重復抽樣時:總體平均數(shù)的區(qū)間估計第六章抽樣推斷修正因子如果總體單位數(shù)很“大”而樣本容量很“小”,則該修正因子趨近于1第九十二頁,共一百五十五頁,2022年,8月28日步驟⒋計算抽樣極限誤差:⒌確定總體平均數(shù)的置信區(qū)間:總體平均數(shù)的區(qū)間估計第六章抽樣推斷第九十三頁,共一百五十五頁,2022年,8月28日【例A】某企業(yè)生產某種產品的工人有1000人,某日采用不重復抽樣從中隨機抽取100人調查他們的當日產量,要求在95﹪的概率保證程度下,估計該廠全部工人的日平均產量和日總產量。總體平均數(shù)的區(qū)間估計第六章抽樣推斷第九十四頁,共一百五十五頁,2022年,8月28日按日產量分組(件)組中值(件)工人數(shù)(人)110~114114~118118~122122~126126~130130~134134~138138~14211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合計—100126004144100名工人的日產量分組資料第六章抽樣推斷第九十五頁,共一百五十五頁,2022年,8月28日解:第六章抽樣推斷第九十六頁,共一百五十五頁,2022年,8月28日則該企業(yè)工人人均產量及日總產量的置信區(qū)間為:即該企業(yè)工人人均產量在124.797至127.203件之間,其日總產量在124797至127303件之間,估計的可靠程度為95﹪。第六章抽樣推斷第九十七頁,共一百五十五頁,2022年,8月28日總體均值區(qū)間估計程序n>=30?知否?用s代替總體是否接近正態(tài)分布?知否?用s代替增大樣本容量至n>=30yesNoyesNoyesyesNoNo第九十八頁,共一百五十五頁,2022年,8月28日【例】某商場從一批袋裝食品中隨機抽取10袋,測得每袋重量(單位:克)分別為789、780、794、762、802、813、770、785、810、806。要求以95%的把握程度,估計這批食品的平均每袋重量的抽樣極限誤差。第九十九頁,共一百五十五頁,2022年,8月28日解:第一百頁,共一百五十五頁,2022年,8月28日總體成數(shù)的區(qū)間估計表達式其中,為極限誤差第六章抽樣推斷第一百零一頁,共一百五十五頁,2022年,8月28日步驟⒈計算樣本成數(shù);⒉搜集總體方差的經驗數(shù)據(jù);⒊計算抽樣平均誤差:重復抽樣條件下不重復抽樣條件下總體成數(shù)的區(qū)間估計第六章抽樣推斷第一百零二頁,共一百五十五頁,2022年,8月28日步驟⒋計算抽樣極限誤差:⒌確定總體成數(shù)的置信區(qū)間:總體成數(shù)的區(qū)間估計第六章抽樣推斷第一百零三頁,共一百五十五頁,2022年,8月28日【例B】若例A中工人日產量在118件以上者為完成生產定額任務,要求在95﹪的概率保證程度下,估計該廠全部工人中完成定額的工人比重及完成定額的工人總數(shù)??傮w成數(shù)的區(qū)間估計第六章抽樣推斷第一百零四頁,共一百五十五頁,2022年,8月28日按日產量分組(件)組中值(件)工人數(shù)(人)110~114114~118118~122122~126126~130130~134134~138138~142112116120124128132136140371823211864合計—100100名工人的日產量分組資料完成定額的人數(shù)第六章抽樣推斷第一百零五頁,共一百五十五頁,2022年,8月28日解:第六章抽樣推斷第一百零六頁,共一百五十五頁,2022年,8月28日則該企業(yè)全部工人中完成定額的工人比重及完成定額的工人總數(shù)的置信區(qū)間為:即該企業(yè)工人中完成定額的工人比重在0.8432至0.9568之間,完成定額的工人總數(shù)在843.2至956.8人之間,估計的可靠程度為95﹪。第六章抽樣推斷第一百零七頁,共一百五十五頁,2022年,8月28日一、點估計二、區(qū)間估計三、樣本數(shù)目的確定§1.3簡單隨機抽樣的抽樣估計★★★第一百零八頁,共一百五十五頁,2022年,8月28日三、樣本容量的確定㈠確定樣本容量的意義㈡推斷總體平均數(shù)所需的樣本容量㈢推斷總體成數(shù)所需的樣本容量㈣必要樣本容量的影響因素第一百零九頁,共一百五十五頁,2022年,8月28日樣本容量調查誤差調查費用小樣本容量節(jié)省費用但調查誤差大大樣本容量調查精度高但費用較大找出在規(guī)定誤差范圍內的最小樣本容量確定樣本容量的意義找出在限定費用范圍內的最大樣本容量第六章抽樣推斷第一百一十頁,共一百五十五頁,2022年,8月28日確定方法推斷總體平均數(shù)所需的樣本容量⑴重復抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差?;騍通常未知。一般按以下方法確定其估計值:①過去的經驗數(shù)據(jù);②試驗調查樣本的S。計算結果通常向上進位第六章抽樣推斷第一百一十一頁,共一百五十五頁,2022年,8月28日⑵不重復抽樣條件下:確定方法推斷總體平均數(shù)所需的樣本容量第六章抽樣推斷第一百一十二頁,共一百五十五頁,2022年,8月28日【例A】某食品廠要檢驗本月生產的10000袋某產品的重量,根據(jù)上月資料,這種產品每袋重量的標準差為25克。要求在95.45﹪的概率保證程度下,平均每袋重量的誤差范圍不超過5克,應抽查多少袋產品?第六章抽樣推斷第一百一十三頁,共一百五十五頁,2022年,8月28日解:第六章抽樣推斷第一百一十四頁,共一百五十五頁,2022年,8月28日確定方法推斷總體成數(shù)所需的樣本容量⑴重復抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差。計算結果通常向上進位通常未知。一般按以下方法確定其估計值:①過去的經驗數(shù)據(jù);②試驗調查樣本的;③取方差的最大值0.25。第六章抽樣推斷第一百一十五頁,共一百五十五頁,2022年,8月28日⑵不重復抽樣條件下:確定方法推斷總體成數(shù)所需的樣本容量第六章抽樣推斷第一百一十六頁,共一百五十五頁,2022年,8月28日【例B】某企業(yè)對一批總數(shù)為5000件的產品進行質量檢查,過去幾次同類調查所得的產品合格率為93﹪、95﹪、96﹪,為了使合格率的允許誤差不超過3﹪,在99.73﹪的概率保證程度下,應抽查多少件產品?【分析】因為共有三個過去的合格率的資料,為保證推斷的把握程度,應選其中方差最大者,即P=93﹪。第六章抽樣推斷第一百一十七頁,共一百五十五頁,2022年,8月28日解:第六章抽樣推斷第一百一十八頁,共一百五十五頁,2022年,8月28日必要樣本容量的影響因素總體方差的大??;允許誤差范圍的大小;概率保證程度;抽樣方法;抽樣的組織方式。第六章抽樣推斷第一百一十九頁,共一百五十五頁,2022年,8月28日說明:4、重復抽樣應比不重復抽樣抽取較多的單位數(shù)。1、總體方差(是非標志總體為P(1-P))越大,表明離散程度越大,應抽取較多的單位數(shù)。2、允許誤差(或者)越小,表明推斷的精度要求增高,應抽取較多的單位數(shù)。3、置信水平越大,表明推斷的可靠程度要求增高,應抽取較多的單位數(shù)。第一百二十頁,共一百五十五頁,2022年,8月28日抽樣復查的方法其全面調查時的登記結果為2.2861億元其抽樣復查的結果為2.1734億元隨機抽取五個下屬單位修正系數(shù)為則:該企業(yè)集團所擁有的固定資產原值應為16.851×0.9507=16.020(億元)所擁有固定資產原值的普查結果為16.851億元某企業(yè)集團總體第六章抽樣推斷第一百二十一頁,共一百五十五頁,2022年,8月28日中心極限定理的內容中心極限定理是指從總體中抽取樣本容量為n的樣本,當樣本容量足夠大時,其統(tǒng)計量的分布可用正態(tài)概率分布近似。第一百二十二頁,共一百五十五頁,2022年,8月28日第一百二十三頁,共一百五十五頁,2022年,8月28日上圖中,在圖的上部分中,三個總體分別為均勻分布、U形分布和J形分布,即都是非正態(tài)的。隨著樣本容量的增加,抽樣分布開始發(fā)生變化。當樣本容量為2時,抽樣分布開始呈現(xiàn)與總體分布不同的外形;當樣本容量為5時,抽樣分布開始呈現(xiàn)一個鐘形;當樣本容量為30時,三個抽樣分布近似于同一種分布,即正態(tài)分布。因而,當樣本容量足夠大時,抽樣分布可用正態(tài)概率分布近似。第一百二十四頁,共一百五十五頁,2022年,8月28日t分布樣本統(tǒng)計量的抽樣分布,并不完全服從正態(tài)分布,而是服從與正態(tài)分布相似的t分布。當樣本容量不大于30,而且總體標準差未知時,可以使用t分布。t分布為對稱分布。對于不同的樣本容量都有一個不同的t分布,隨著樣本容量增加,t分布的形狀由平坦逐漸變得接近正態(tài)分布。當樣本容量大于30時,t分布就非常接近于正態(tài)分布。第一百二十五頁,共一百五十五頁,2022年,8月28日假設檢驗在統(tǒng)計方法中的地位統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計參數(shù)估計假設檢驗第一百二十六頁,共一百五十五頁,2022年,8月28日假設檢驗所謂假設檢驗,就是事先對總體參數(shù)或總體分布形式作出一個假設,然后利用樣本信息來判斷原假設是否合理,即判斷樣本信息與原假設是否有顯著差異,從而決定是否接受或否定原假設
第一百二十七頁,共一百五十五頁,2022年,8月28日一、與參數(shù)估計的推斷角度不同。它是先對總體參數(shù)的值提出一個假設,然后利用樣本信息去檢驗假設是否成立。二、首先提出原假設和替換假設(備擇假設)三、進行假設正確性檢驗是基于“小概率事件原理”要確定顯著性水平α,通常取0.05、0.1、0.01四、雙側檢驗、單側檢驗第一百二十八頁,共一百五十五頁,2022年,8月28日總體假設檢驗的過程
(提出假設→抽取樣本→作出決策)抽取隨機樣本均值
X=20我認為人口的平均年齡是50歲提出假設拒絕假設!別無選擇.作出決策第一百二十九頁,共一百五十五頁,2022年,8月28日假設檢驗的步驟提出原假設和備擇假設確定適當?shù)臋z驗統(tǒng)計量規(guī)定顯著性水平計算檢驗統(tǒng)計量的值作出統(tǒng)計決策第一百三十頁,共一百五十五頁,2022年,8月28日提出原假設和備擇假設什么是原假設?1. 待檢驗的假設,又稱“0假設”2. 如果錯誤地作出決策會導致一系列后果3. 總是有等號,或4. 表示為H0H0:
某一數(shù)值指定為=號,即或例如,H0:
3190(克)第一百三十一頁,共一百五十五頁,2022年,8月28日什么是備擇假設?1. 與原假設對立的假設2. 總是有不等號:
,
或3. 表示為H1H1:
<某一數(shù)值,或某一數(shù)值例如,H1:
<3910(克),或3910(克)提出原假設和備擇假設第一百三十二頁,共一百五十五頁,2022年,8月28日什么是檢驗統(tǒng)計量?1. 用于假設檢驗問題的統(tǒng)計量2. 選擇統(tǒng)計量的方法與參數(shù)估計相同,需考慮是大樣本還是小樣本總體方差已知還是未知檢驗統(tǒng)計量的基本形式為確定適當?shù)臋z驗統(tǒng)計量第一百三十三頁,共一百五十五頁,2022年,8月28日規(guī)定顯著性水平什么顯著性水平?1. 是一個概率值2. 原假設為真時,拒絕原假設的概率被稱為抽樣分布的拒絕域3. 表示為常用的值有0.01,0.05,0.104. 由研究者事先確定第一百三十四頁,共一百五十五頁,2022年,8月28日作出統(tǒng)計決策計算檢驗的統(tǒng)計量根據(jù)給定的顯著性水平,查表得出相應的臨界值Z或Z/2將檢驗統(tǒng)計量的值與水平的臨界值進行比較得出接受或拒絕原假設的結論第一百三十五頁,共一百五十五頁,2022年,8月28日假設檢驗中的小概率原理什么小概率?1. 在一次試驗中,一個幾乎不可能發(fā)生的事件發(fā)生的概率2. 在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設;反之,小概率事件沒有發(fā)生,則認為原假設是合理的。3. 小概率由研究者事先確定第一百三十六頁,共一百五十五頁,2022年,8月28日
1、提出原假設(nullhypothesis)和備擇假設(alternativehypothesis)
原假設為正待檢驗的假設:H0;備擇假設為可供選擇的假設:H1
一般地,假設有三種形式:
(1)雙側檢驗:
H0:0;H1:0
(2)左側檢驗:
H0:0;H1:<0
或
H0:0;H1:<0
(3)右側檢驗:
H0:0;H1:>0
或
H0:<=0;H1:>0
假設檢驗的步驟第一百三十七頁,共一百五十五頁,2022年,8月28日
2、選擇適當?shù)慕y(tǒng)計量,并確定其分布形式
統(tǒng)計量是根據(jù)所涉及的問題而定的,如總體均值、比例(率)可選取正態(tài)分布的Z統(tǒng)計量等。
3、選擇顯著性水平或置信度,確定臨界值
顯著性水平為原假設為真時,樣本點落在臨界值外的概率(即抽樣結果遠離中心點的概率,它為小概率),也是原假設為真時,拒絕原假設所冒的風險。
臨界值將樣本點所落區(qū)域分為拒絕域與接受域,臨界值“外”為拒絕域,“內”為接受域。第一百三十八頁,共一百五十五頁,2022年,8月28日通過樣本計算統(tǒng)計量的具體值,與臨界值比較,根據(jù)落入拒絕域或接受域的情況來拒絕或接受原假設。
4、作出結論第一百三十九頁,共一百五十五頁,2022年,8月28日
由于假設檢驗是根據(jù)有限的樣本信息來推斷總體特征,由樣本的隨機性可能致使判斷出錯。
(一)第一類錯誤當原假設為真時,而拒絕原假設所犯的錯誤,稱為第I類錯誤或拒真錯誤。易知犯第I類錯誤的概率就是顯著性水平:
假設檢驗中的兩類錯誤(二)第二類錯誤當原假設為假時,而接受原假設所犯的錯誤,稱為第II類錯誤或采偽錯誤。犯第II類錯誤的概率常用表示:第一百四十頁,共一百五十五頁,2022年,8月28日假設檢驗中的四種可能情況
H0為真H0不真接受H0GoodBad/TypeIIerror拒絕H0Bad/TypeIerrorGood第一百四十一頁,共一百五十五頁,2022年,8月28日1、犯第一類錯誤與犯第二類錯誤的概率存在此消彼長的關系;2、若要同時減少與,須增大樣本容量n。3、通常的作法是,取顯著性水平較小,即控制犯第一類錯誤的概率在較小的范圍內;
4、在犯第二類錯誤的概率不好控制時,將“接受原假設”更傾向于說成“不拒絕原假設”。注意:第一百四十二頁,共一百五十五頁,2022年,8月28日
一、總體均值的假設檢驗(一)總體方差已知,正態(tài)總體,樣本大小不限如果總體X~N(,2),在方差已知的情況下,對總體均值進行假設檢驗。由于總體均值和比例的假設檢驗
注意:
如果總體方差未知,且總體分布未知,但如果是大樣本(n>=30),仍可通過Z統(tǒng)計量進行檢驗,只不過總體方差需用樣本方差s替代。因此,可通過構造Z統(tǒng)計量來進行假設檢驗:第一百四十三頁,共一百五十五頁,2022年,8月28日
例1:根據(jù)以往的資
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年食堂信息化管理及服務外包合同5篇
- 2025年度購物中心物業(yè)管理員勞動合同3篇
- 二零二五版泰康人壽保險產品推廣合同范本3篇
- 2025年度木工項目投資與建設合同4篇
- 2025年度定制化木模板木方定制加工及銷售合同4篇
- 印刷材料的科技創(chuàng)新與應用考核試卷
- 2025版老舊建筑幕墻改造升級合同范文4篇
- 2025年醫(yī)療病例管理協(xié)議
- 2025年度美發(fā)店客戶滿意度調查與服務提升合同8篇
- 2025年食堂檔口租賃及市場營銷合作合同范本3篇
- 電纜擠塑操作手冊
- 浙江寧波鄞州區(qū)市級名校2025屆中考生物全真模擬試卷含解析
- IATF16949基礎知識培訓教材
- 【MOOC】大學生創(chuàng)新創(chuàng)業(yè)知能訓練與指導-西北農林科技大學 中國大學慕課MOOC答案
- 勞務派遣公司員工考核方案
- 基礎生態(tài)學-7種內種間關系
- 2024年光伏農田出租合同范本
- 《阻燃材料與技術》課件 第3講 阻燃基本理論
- 2024-2030年中國黃鱔市市場供需現(xiàn)狀與營銷渠道分析報告
- 新人教版九年級化學第三單元復習課件
- 江蘇省南京鼓樓區(qū)2024年中考聯(lián)考英語試題含答案
評論
0/150
提交評論