第五章抽樣與統(tǒng)計(jì)推論_第1頁(yè)
第五章抽樣與統(tǒng)計(jì)推論_第2頁(yè)
第五章抽樣與統(tǒng)計(jì)推論_第3頁(yè)
第五章抽樣與統(tǒng)計(jì)推論_第4頁(yè)
第五章抽樣與統(tǒng)計(jì)推論_第5頁(yè)
已閱讀5頁(yè),還剩69頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五章抽樣與統(tǒng)計(jì)推論1第一頁(yè),共七十四頁(yè),編輯于2023年,星期五第五章:抽樣與統(tǒng)計(jì)推論第六章:參數(shù)值的估計(jì)第七章:假設(shè)檢定:均值與百分率第八章:假設(shè)檢定:兩個(gè)變量的相關(guān)2第二頁(yè),共七十四頁(yè),編輯于2023年,星期五回顧:內(nèi)容掌握

1、敘述統(tǒng)計(jì)部分,主要掌握集中趨勢(shì)測(cè)量、離散趨勢(shì)測(cè)量的單變量分析,兩個(gè)變量分布及λ、tau_y、Gamma、dy、r、E2等相關(guān)測(cè)量法;2、推論統(tǒng)計(jì)部分,主要掌握抽樣與統(tǒng)計(jì)推論,參數(shù)估計(jì)以及Z檢定、χ2檢定、F檢定、t檢定等假設(shè)檢定;3、以上理論課程內(nèi)容,主要要求明確統(tǒng)計(jì)方法的適用條件,原理與步驟以及統(tǒng)計(jì)值的意義。3第三頁(yè),共七十四頁(yè),編輯于2023年,星期五第一節(jié)抽樣的意義為了研究總體,我們需要從總體中抽出一部分樣本,借此了解總體中的情況。研究的歷程:總體——樣本——總體4第四頁(yè),共七十四頁(yè),編輯于2023年,星期五社會(huì)研究的過程一、籌劃二、執(zhí)行三、總結(jié)一、選定研究題目二、初步探索三、成立假設(shè)四、理論解釋與澄清概念五、研究策略1.研究設(shè)計(jì)2.測(cè)量變量3.測(cè)量層次4.界定母體和決定抽樣的步驟5.統(tǒng)計(jì)分析訪問法;觀察法;檔案資料;一、統(tǒng)計(jì)分析二、解釋研究結(jié)果三、開啟新的研究議題實(shí)驗(yàn)法社會(huì)調(diào)查法5第五頁(yè),共七十四頁(yè),編輯于2023年,星期五統(tǒng)計(jì)敘述:描述變量或者變量之間的關(guān)系。無論數(shù)據(jù)怎么來的,是樣本還是總體的數(shù)據(jù),無論隨機(jī)樣本還是非隨機(jī)樣本,統(tǒng)計(jì)敘述的方法都可以使用。關(guān)注樣本的情況。統(tǒng)計(jì)推論:根據(jù)樣本的情況,來推測(cè)總體的情況。關(guān)注總體的情況。6第六頁(yè),共七十四頁(yè),編輯于2023年,星期五兩套話語(yǔ):樣本與總體。從樣本中計(jì)算出來的數(shù)值稱作統(tǒng)計(jì)值,在總體中計(jì)算出來的數(shù)值稱為參數(shù)值。我們的目標(biāo)是:總體的狀況。我們的手段是:從樣本推論總體,或者從樣本中歸納總體。7第七頁(yè),共七十四頁(yè),編輯于2023年,星期五問題:在對(duì)一個(gè)變量或者兩個(gè)變量的分布狀況,或者相關(guān)關(guān)系的分析中得出的統(tǒng)計(jì)值。代表的這種分布或者關(guān)系是不是在總體中也是這樣?8第八頁(yè),共七十四頁(yè),編輯于2023年,星期五第二節(jié)抽樣的歷程抽取有代表性的樣本,盡量減少誤差。9第九頁(yè),共七十四頁(yè),編輯于2023年,星期五總體抽樣框樣本大小決定樣本大小的一般原則:根據(jù)研究能付出的最大代價(jià)抽取樣本。抽樣比例設(shè)計(jì)抽樣方法,抽取樣本評(píng)估樣本:總體分布與樣本分布在基本特征上是否分布一致。10第十頁(yè),共七十四頁(yè),編輯于2023年,星期五第三節(jié)隨機(jī)與非隨機(jī)抽樣法11第十一頁(yè),共七十四頁(yè),編輯于2023年,星期五一、簡(jiǎn)單隨機(jī)抽樣二、系統(tǒng)隨機(jī)抽樣三、分層隨機(jī)抽樣四、集體抽樣法五、多段抽樣六、多期抽樣12第十二頁(yè),共七十四頁(yè),編輯于2023年,星期五第四節(jié)幾率與抽樣分布13第十三頁(yè),共七十四頁(yè),編輯于2023年,星期五社會(huì)學(xué)研究抽樣調(diào)查的目的是通過樣本推算總體的情況。歸納法的結(jié)論不可能百分百正確。概率論(幾率論)即是研究我們通過樣本推測(cè)總體的時(shí)候所犯的錯(cuò)誤是多少。14第十四頁(yè),共七十四頁(yè),編輯于2023年,星期五通過概率論,可以知道在一定條件下,總體中的各種抽樣結(jié)果所具有的概率特征。統(tǒng)計(jì)推論是研究在發(fā)生了某種抽樣結(jié)果的情況下,判斷它來自何種總體更合適。統(tǒng)計(jì)推論是概率論研究的逆問題。15第十五頁(yè),共七十四頁(yè),編輯于2023年,星期五一、隨機(jī)現(xiàn)象客觀現(xiàn)象可分為確定現(xiàn)象和非確定現(xiàn)象。隨機(jī)現(xiàn)象-非確定現(xiàn)象在一定條件下,事物的出現(xiàn)只有可能性但不具有必然性??赡芏植槐厝?,意味著在一定條件下出現(xiàn)的結(jié)果不止一種,其中任何一種情況的出現(xiàn)都具有一定的隨機(jī)性。16第十六頁(yè),共七十四頁(yè),編輯于2023年,星期五確定性現(xiàn)象——必然命題,表示為:若……,則……非確定性現(xiàn)象——隨機(jī)命題,表示為:若……,可能……社會(huì)學(xué)研究多為隨機(jī)命題。17第十七頁(yè),共七十四頁(yè),編輯于2023年,星期五二、概率與頻率隨機(jī)現(xiàn)象的結(jié)果以及結(jié)果的集合成為隨機(jī)事件:可能發(fā)生也可能不發(fā)生的非確定性事件。概率是這些隨機(jī)事件發(fā)生可能性大小的數(shù)量表示。隨機(jī)事件發(fā)生的概率為:0≦P≦118第十八頁(yè),共七十四頁(yè),編輯于2023年,星期五概率反映隨機(jī)事件內(nèi)涵的統(tǒng)計(jì)規(guī)律性。統(tǒng)計(jì)規(guī)律性:在一定條件下,就其個(gè)別一次的結(jié)果來說都具有偶然性,但大量重復(fù)的試驗(yàn)或者觀察,則結(jié)果就呈現(xiàn)必然的規(guī)律。統(tǒng)計(jì)規(guī)律性是事物本身所固有的客觀屬性。19第十九頁(yè),共七十四頁(yè),編輯于2023年,星期五隨機(jī)事件的兩重性:一次試驗(yàn)或者觀察中事件出現(xiàn)與否具有偶然性大量重復(fù)試驗(yàn)或者觀察時(shí),隨機(jī)事件出現(xiàn)的可能性是穩(wěn)定的?!y(tǒng)計(jì)規(guī)律性。20第二十頁(yè),共七十四頁(yè),編輯于2023年,星期五頻率:在相同條件下,進(jìn)行N次試驗(yàn),隨機(jī)事件出現(xiàn)了n次。隨機(jī)事件的頻率是可知:0≦f≦1當(dāng)試驗(yàn)(觀察)次數(shù)N無限增大的時(shí)候,f值趨向于P。21第二十一頁(yè),共七十四頁(yè),編輯于2023年,星期五頻率是實(shí)驗(yàn)值,它隨著試驗(yàn)或者觀察而變化,具有隨機(jī)性,只能近似反映事件出現(xiàn)可能性的大小。概率是理論值,它由事件的本質(zhì)決定,值是唯一的,能精確地反映出事件出現(xiàn)可能性的大小。22第二十二頁(yè),共七十四頁(yè),編輯于2023年,星期五概率,將隨機(jī)事件與一個(gè)精確反映事件出現(xiàn)可能大小的數(shù)量緊密聯(lián)系在一起。23第二十三頁(yè),共七十四頁(yè),編輯于2023年,星期五三、概率分布頻率分布是實(shí)驗(yàn)值,可以變化,頻率分布又稱作隨機(jī)變量的統(tǒng)計(jì)分布或者經(jīng)驗(yàn)分布。概率分布是理論值,是唯一的,概率分布則是隨機(jī)變量的理論分布。24第二十四頁(yè),共七十四頁(yè),編輯于2023年,星期五隨機(jī)事件隨機(jī)變量隨機(jī)事件概率隨機(jī)變量的分布僅當(dāng)觀測(cè)次數(shù)很大時(shí),隨機(jī)變量取值的頻率接近于其概率,此時(shí)隨機(jī)變量的統(tǒng)計(jì)分布與理論分布大致相符。25第二十五頁(yè),共七十四頁(yè),編輯于2023年,星期五隨機(jī)事件盡管具有隨機(jī)性,但是對(duì)于一個(gè)確定的隨機(jī)樣本來說,我們得到的是確定的觀測(cè)值,這些值是確定的,根據(jù)這些值計(jì)算出來的數(shù)值叫做統(tǒng)計(jì)值。而抽樣分布是在概率論的基礎(chǔ)上成立的理論分布,是在假定如果在同一總體中反復(fù)不斷抽取不同樣本時(shí),各個(gè)可能出現(xiàn)的樣本統(tǒng)計(jì)值的分布狀況。26第二十六頁(yè),共七十四頁(yè),編輯于2023年,星期五概率,將隨機(jī)事件與一個(gè)精確反映事件出現(xiàn)可能大小的數(shù)量緊密聯(lián)系在一起。假設(shè)試驗(yàn)或者觀測(cè)進(jìn)行了無限多次。概率分布,假設(shè)進(jìn)行無數(shù)次抽樣,得到那個(gè)最為完美的樣本的分布狀況。將變量取值分布和一個(gè)固定的形狀聯(lián)系起來。27第二十七頁(yè),共七十四頁(yè),編輯于2023年,星期五兩個(gè)定理:大數(shù)定理和中心極限定理隨機(jī)事件的兩重性:隨機(jī)性和統(tǒng)計(jì)規(guī)律性。大量的隨機(jī)現(xiàn)象所構(gòu)成的總體,呈現(xiàn)的規(guī)律有穩(wěn)定性。當(dāng)進(jìn)行大量觀察時(shí),n趨向于無限時(shí),得出來的定律,叫做極限定律。28第二十八頁(yè),共七十四頁(yè),編輯于2023年,星期五極限定律有兩類:大數(shù)定律:有關(guān)闡明大量隨機(jī)現(xiàn)象平均結(jié)果的穩(wěn)定性的一系列定理,研究在什么條件下隨機(jī)事件可以轉(zhuǎn)化為不可能事件或者必然事件。中心極限定理:研究在什么條件下隨機(jī)變量之和的分布可以近似正態(tài)分布。偶然性與必然性的辯證關(guān)系大數(shù)定理將局部、偶然的影響消除掉,使共同的原因顯現(xiàn)出來。29第二十九頁(yè),共七十四頁(yè),編輯于2023年,星期五最重要的兩個(gè)抽樣分布:二項(xiàng)抽樣分布均值抽樣分布30第三十頁(yè),共七十四頁(yè),編輯于2023年,星期五一、二項(xiàng)分布31第三十一頁(yè),共七十四頁(yè),編輯于2023年,星期五一、二點(diǎn)分布變量的取值只有兩類。兩個(gè)類別習(xí)慣上用0和1來表示,又叫做0-1分布。在社會(huì)調(diào)查中有大量的二分變量。二點(diǎn)分布是二項(xiàng)分布只做一次觀察的概率分布。32第三十二頁(yè),共七十四頁(yè),編輯于2023年,星期五二點(diǎn)分布——是與否“是”的概率為P(取值為1的時(shí)候、成功),“否”的概率為Q。(取值為0的時(shí)候、失?。┨卣鳎篜(0)>0;Q>0P+Q=1對(duì)于性別、拋硬幣等來說,P=Q=0.5其他狀況P不一定等于Q。33第三十三頁(yè),共七十四頁(yè),編輯于2023年,星期五二分變量是社會(huì)研究中最常見最普遍的形式,也是多取值變量,其中包括高層次測(cè)量變量的簡(jiǎn)化研究方式。34第三十四頁(yè),共七十四頁(yè),編輯于2023年,星期五二、二項(xiàng)分布當(dāng)試驗(yàn)進(jìn)行n次的時(shí)候,成功的次數(shù)呈現(xiàn)一種概率分布。35第三十五頁(yè),共七十四頁(yè),編輯于2023年,星期五拋五次硬幣的概率分布圖36第三十六頁(yè),共七十四頁(yè),編輯于2023年,星期五當(dāng)試驗(yàn)次數(shù)或者觀測(cè)個(gè)案n無限大的時(shí)候,頻率的分布接近于理論的概率分布37第三十七頁(yè),共七十四頁(yè),編輯于2023年,星期五二項(xiàng)分布的特征:離散型分布,當(dāng)試驗(yàn)次數(shù)為n時(shí),二項(xiàng)分布共有n+1個(gè)取值。這種分布圖可以用分布律來表示,可也以用折線圖來表示。38第三十八頁(yè),共七十四頁(yè),編輯于2023年,星期五二項(xiàng)分布圖39第三十九頁(yè),共七十四頁(yè),編輯于2023年,星期五二項(xiàng)分布有兩個(gè)參數(shù):n和P,(Q=1-P)40第四十頁(yè),共七十四頁(yè),編輯于2023年,星期五二項(xiàng)分布圖當(dāng)P=0.5時(shí),是對(duì)稱分布。當(dāng)P≠0.5時(shí),是非對(duì)稱的。n越大,非對(duì)稱性越不明顯。41第四十一頁(yè),共七十四頁(yè),編輯于2023年,星期五二項(xiàng)分布各項(xiàng)概率是可以根據(jù)以上公式計(jì)算出來的,也可以相加。42第四十二頁(yè),共七十四頁(yè),編輯于2023年,星期五二項(xiàng)分布概率值的實(shí)際意義:二項(xiàng)分布所計(jì)算的概率值都是理論值,具有先驗(yàn)的性質(zhì)。在實(shí)踐中大量的重復(fù)二項(xiàng)分布中的獨(dú)立試驗(yàn),則頻率的分布將趨向于二項(xiàng)分布。43第四十三頁(yè),共七十四頁(yè),編輯于2023年,星期五二項(xiàng)分布在社會(huì)學(xué)研究中的統(tǒng)計(jì)推論意義。書上的例子(133頁(yè)):44第四十四頁(yè),共七十四頁(yè),編輯于2023年,星期五二項(xiàng)分布的經(jīng)典例子就是拋硬幣式的P=Q=0.5的情況,然而只要P+Q=1,P和Q可以是任何數(shù)值。各項(xiàng)分布概率均可以計(jì)算出來。P≠Q(mào)時(shí),是不對(duì)稱分布。45第四十五頁(yè),共七十四頁(yè),編輯于2023年,星期五例子:人群中同性戀出現(xiàn)的概率是5%,異性戀出現(xiàn)的概率是95%。如果隨機(jī)抽取十個(gè)人,那么這十個(gè)人中出現(xiàn)同性戀取向個(gè)人的概率分布為:46第四十六頁(yè),共七十四頁(yè),編輯于2023年,星期五例子:根據(jù)生命表,年齡為60歲的人,可望活到下一年的概率為0.95。某單位有十個(gè)60歲的人,問其中有九人活到下年的概率是多少?至少有九人活到下年的概率是多少?根據(jù)公式計(jì)算:p(r=9)=0.315P(9≤r≤10)=p(r=9)+p(r=10)=0.91447第四十七頁(yè),共七十四頁(yè),編輯于2023年,星期五二、均值抽樣分布中心極限定理中心極限定理:研究在什么條件下隨機(jī)變量之和的分布可以近似正態(tài)分布。中心極限定理:如果從任何一個(gè)具有均值M和方差S2的總體中重復(fù)抽取容量為n的隨機(jī)樣本,那么當(dāng)n變得很大的時(shí)候,樣本均值的抽樣分布接近正態(tài),并具有均值M和方差S2/n。48第四十八頁(yè),共七十四頁(yè),編輯于2023年,星期五理解中央極限定理的含義中央極限定理之所以重要,因?yàn)樗鼘⒕哂形寤ò碎T分布特征的變量和一個(gè)整齊、美麗、易于計(jì)算的正態(tài)分布聯(lián)系起來。使我們簡(jiǎn)便地認(rèn)識(shí)社會(huì)現(xiàn)象。無論變量自身的分布如何,其均值抽樣分布都接近于正態(tài)分布。49第四十九頁(yè),共七十四頁(yè),編輯于2023年,星期五總體分布不是正態(tài),為什么抽樣分布是正態(tài)的?50第五十頁(yè),共七十四頁(yè),編輯于2023年,星期五例子:擲骰子51第五十一頁(yè),共七十四頁(yè),編輯于2023年,星期五擲一枚骰子每個(gè)面1、2、3、4、5、6出現(xiàn)的概率都是1/6,此時(shí)的概率分布為矩形(離散)。52第五十二頁(yè),共七十四頁(yè),編輯于2023年,星期五擲兩枚骰子53第五十三頁(yè),共七十四頁(yè),編輯于2023年,星期五54第五十四頁(yè),共七十四頁(yè),編輯于2023年,星期五擲3枚骰子55第五十五頁(yè),共七十四頁(yè),編輯于2023年,星期五56第五十六頁(yè),共七十四頁(yè),編輯于2023年,星期五例子(134頁(yè))57第五十七頁(yè),共七十四頁(yè),編輯于2023年,星期五58第五十八頁(yè),共七十四頁(yè),編輯于2023年,星期五均值抽樣分布的特點(diǎn)一、如果樣本相當(dāng)大,則均值的抽樣分布接近于正態(tài)分布。在社會(huì)學(xué)研究中,樣本量至少是30(n≥30),才能算是滿足大樣本的要求。(一般在n≥100的時(shí)候,總是可以認(rèn)為滿足了大樣本的要求,無論總體分布如何。在n≥50的時(shí)候,總體分布接近正態(tài)分布時(shí)使用比較合適。)59第五十九頁(yè),共七十四頁(yè),編輯于2023年,星期五均值抽樣分布接近正態(tài)分布,則正態(tài)分布的所有特征都具備。單峰、對(duì)稱,眾值、中位值和均值相同。60第六十頁(yè),共七十四頁(yè),編輯于2023年,星期五二、抽樣分布的均值就是總體的均值。將各個(gè)樣本的均值相加起來,取均值,就會(huì)等于總體的均值。抽樣分布的標(biāo)準(zhǔn)差:標(biāo)準(zhǔn)誤差。61第六十一頁(yè),共七十四頁(yè),編輯于2023年,星期五由于不知道總體的情況,所以,以一個(gè)樣本的標(biāo)準(zhǔn)差當(dāng)做總體的標(biāo)準(zhǔn)差,這樣標(biāo)準(zhǔn)誤差的計(jì)算公式為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論