版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
本資料來源第十章χ2檢驗χ2檢驗(chi-squaretest)是專門用于計數(shù)數(shù)據(jù)的統(tǒng)計方法。由于這類數(shù)據(jù)在整理時,常常以列聯(lián)表(contingencytable)或交叉表(crosstabulation)呈現(xiàn),因此這種分析方法又被稱為列聯(lián)表分析或交叉表分析。χ2檢驗用于對點計而來的離散型數(shù)據(jù)資料進行假設檢驗,對總體的分布不做要求,也不對總體參數(shù)進行推論,因此屬于自由分布的非參數(shù)檢驗。χ2檢驗是對由樣本得來的實際頻數(shù)與理論頻數(shù)的分布是否有顯著性差異所進行的檢驗。其計算公式為:(15.1)三大類別配合度檢驗獨立性檢驗同質(zhì)性檢驗配合度檢驗把實得的點計數(shù)據(jù)只按一種分類標準編制成表就是單向表。對單向表的數(shù)據(jù)所進行的χ2檢驗,稱為單向表的χ2檢驗,也稱為配合度檢驗(goodnessoffittest)。獨立性檢驗獨立性檢驗主要用以兩個或兩個以上因素多項分類的計數(shù)資料分析,也就是研究兩類變量的關聯(lián)性和依存性問題。如人的血型和人的性格是否有關聯(lián)。把兩個因素實得的點計數(shù)據(jù)按兩種分類標準編制成的表就是雙向表。對雙向表的數(shù)據(jù)所進行的χ2檢驗,叫作雙向表的χ2檢驗,即雙因素的χ2檢驗。兩個以上因素形成的表稱為多維列聯(lián)表。重點是兩因素的獨立性檢驗。假如雙向表中橫行所分的組數(shù)用R表示,縱列所分的組數(shù)用C表示,那么,雙向表的χ2檢驗也稱為R×C表的χ2檢驗。在雙向表的χ2檢驗中,如果要判斷兩種分類特征,即兩個因素之間是否有依從關系,這種χ2檢驗稱為獨立性檢驗。如果是判斷幾次重復實驗的結果是否相同,這種χ2檢驗稱為同質(zhì)性檢驗。(一)雙向表χ2檢驗的計算1.理論頻數(shù)的計算雙向表χ2檢驗中,理論頻數(shù)的計算公式為(16.1)
公式中,fxi表示橫行各組實際頻數(shù)的總和
fyi表示縱列各組實際頻數(shù)的總和
N表示樣本容量的總和例1:家庭經(jīng)濟狀狀況屬于上上、中、下下的高三畢畢業(yè)生,對對于是否愿愿意報考師師范大學有有三種不同同的態(tài)度((愿意、不不愿意、未未定),其其人數(shù)分布布如表10-6。問學生是是否愿意報報考師范大大學與家庭庭經(jīng)濟狀況況是否有關關系?表10-6不同家庭經(jīng)經(jīng)濟狀況學學生報考師師范大學的的不同態(tài)度度家庭經(jīng)濟狀況對于報考師范大學的態(tài)度總和愿意不愿意未定上中下18201827197102011555936總和565341150解題過程解:1.提出假設H0:學生是否否愿意報考考師范大學學與家庭經(jīng)經(jīng)濟狀況無無關H1:學生是否否愿意報考考師范大學學與家庭經(jīng)經(jīng)濟狀況有有關2.選擇檢驗統(tǒng)統(tǒng)計量并計計算對計數(shù)數(shù)據(jù)據(jù)進行差異異檢驗,可選擇χ2檢驗理論頻數(shù)計計算計算理論頻頻數(shù)允許有有小數(shù),因因為χ2分布已被作作為連續(xù)型型的分布看看待。表10-7不同家庭經(jīng)經(jīng)濟狀況學學生報考師師范大學的的不同態(tài)度度家庭經(jīng)濟狀況對于報考師范大學的態(tài)度總和愿意不愿意未定上中下1820182719710201155=fx159=fx236=fx3總和56=fy153=fy241=fy3150=N20.5312.7222.0313.4419.4320.8515.0316.139.84計算表10-8學生報考師師范大學的的態(tài)度與家家庭經(jīng)濟狀狀況的χ2檢驗計算表表愿意-上1820.53-2.536.40090.3118愿意-中2022.03-2.034.12090.1871愿意-下1813.444.5620.79361.5471不愿意-上2719.437.5757.30492.9493不愿意-中1920.85-1.853.42250.1641不愿意-下712.72-5.7232.71842.5722未定-上1015.03-5.0325.30091.6834未定-中2016.133.8714.97690.9285未定-下119.841.161.34560.1367總和15015010.48023.統(tǒng)計決斷雙向表的自自由度:df=(R-1)(C-1)查χ2值表,當df=(3-1)(3-1)=4時計算結果為為:χ2=10.48*9.49<χ2=10.48<13.3,則0.05>P>0.01結論:學生生是否愿意意報考師范范大學與家家庭經(jīng)濟狀狀況有顯著著關系。雙向表的χ2值除用理論論頻數(shù)方法法計算外,,還可以用用下式由實實際頻數(shù)直直接求得::公式中,foi表示雙向表表中每格的的實際頻數(shù)數(shù)(16.2)將例1數(shù)據(jù)用公式式(10.8)計算=10.48家庭經(jīng)濟狀況對于報考師范大學的態(tài)度總和愿意不愿意未定上中下18201827197102011555936總和565341150表10-8不同家庭經(jīng)經(jīng)濟狀況學學生報考師師范大學的的不同態(tài)度度雙向表的獨立性χ2檢驗和同質(zhì)性χ2檢驗,只是是檢驗的意義不同,而方法完全相相同。對于同一組組數(shù)據(jù)所進進行的χ2檢驗,有時時既可以理理解為獨立立性χ2檢驗,又可可以理解為為同質(zhì)性檢檢驗,兩者者無根本區(qū)區(qū)別。第十四章抽樣原理及及方法統(tǒng)計推斷的的可靠性與與下列因素素有關1.數(shù)據(jù)的質(zhì)量量樣本對總體體的代表性性,既涉及及到抽樣方法,又涉及到樣本的容量量。2.運用統(tǒng)計方法及數(shù)據(jù)處理理的準確性性3.樣本對總體體的代表性在收集數(shù)據(jù)據(jù)的過程中控制制選擇恰當?shù)牡姆椒ㄍㄟ^抽樣設計控制抽樣設計的的原則抽樣設計的的要求是樣樣本對研究究總體有良良好的代表性,即即樣樣本本的的構構成成與與總總體體保保持持一一致致。。為為了了保保證證這這一一點點,,抽抽樣樣時時必必須須遵遵循循隨機機化化(randomization)的的基基本本原原則則。。所謂謂隨隨機機化化原原則則,,是是指指在在抽抽樣樣時時,,樣樣本本中中的的每每一一個個體體都都是是按按照照隨隨機機的的原原理理被被抽抽取取的的,,總總體體中中每每一一個個體體被被抽抽到到的的可可能能性性是是相相等等的的。。一..幾幾種種重重要要的的隨隨機機抽抽樣樣方方法法1.簡單單隨隨機機抽抽樣樣(simplerandomsampling)簡單單隨隨機機抽抽樣樣就就是是按按照照隨隨機機原原則則直直接接從從總總體體中中抽抽取取出出若若干干個個單單位位作作為為樣樣本本。。簡單單隨隨機機抽抽樣樣法法能能保保證證總總體體中中的的每每一一個個對對象象都都有有同同等等的的被被抽抽取取到到的的可可能能性性,,并并且且個個體體之之間間都都相相互互獨獨立立。。這這是是在在總總體體異異質(zhì)質(zhì)性性不不是是很很大大而而且且所所抽抽取取的的樣樣本本較較小小時時經(jīng)經(jīng)常常采采用用的的一一種種形形式式。。簡單單隨隨機機抽抽樣樣法法的的局局限限是是::當當樣樣本本規(guī)規(guī)模模小小時時,,樣樣本本的的代代表表性性較較差差。。簡單單隨隨機機取取樣樣有有兩兩種種基基本本方方式式:抽簽簽法法(drawinglots)隨機機數(shù)數(shù)字字表表法法(randomnumbertable)2.等等距距抽抽樣樣等距距抽抽樣樣(intervalsampling)也稱稱為為機機械械抽抽樣樣或或系系統(tǒng)統(tǒng)抽抽樣樣。。實實施施時時,,先先把把總總體體中中的的所所有有個個體體按按一一定定順順序序編編號號,,然然后后依依固固定定的的間間隔隔取取樣樣。。等距距抽抽樣樣可可以以保保證證樣樣本本的的成成分分與與總總體體一一致致,,但但隨隨機機性性不不如如單單純純隨隨機機抽抽樣樣法法。。應應用用中中可可將將兩兩種種方方法法結結合合使使用用。。3.分層隨隨機抽樣樣分層隨機機取樣簡簡稱分層層抽樣((stratifiedsampling或hierarchicalsampling),是是進行行大規(guī)規(guī)模研研究時時常常常使用用的抽抽樣方方法。。分層抽抽樣的的方法法:先將總總體按按照一一定標標準分分為若若干類類型((統(tǒng)計計上稱稱為層層),,再根根據(jù)各各層對對象的的數(shù)量量在總總體數(shù)數(shù)量中中所占占的比比例,,確定定從每每一種種類型型(層層)中中抽取取樣本本的數(shù)數(shù)量,,然后后按隨隨機原原則和和所確確定的的各層層取樣樣的數(shù)數(shù)量,,從各各層中中取樣樣。做好分分層隨隨機取取樣的的關鍵鍵:分類的的標準準要科科學,,要符符合實實際情情況。。各層層內(nèi)的的差別別要小小,而而層與與層之之間的的差異異則越越大越越好。。計算各各層應應抽樣樣的個個體數(shù)數(shù)量的的計算算方法法:⑴.按按各層層比例例計算算公式中中,ni為第i層中被被抽取取的個個體數(shù)數(shù)量n為整個個研究究樣本本中個個體的的總數(shù)數(shù)量Ni為第i層中對對象的的數(shù)量量N為總體體內(nèi)個個體的的數(shù)量量(22.1)例1:為了調(diào)調(diào)查某某區(qū)重重點中中學720名高一一學生生的視視力,,首先先按視視力的的情況況將他他們分分成好(108人)、中(360人)、、差(252人)三三種水水平。。若用用分層層抽樣樣法抽抽取120人進行行調(diào)查查,問問各層層應抽抽多少少人??計算::⑵.最最佳配配置法法最佳配配置法法不僅僅考慮慮各層層的人人數(shù)比比例,,而且且考慮慮到了了各層層的標標準差差。當當各層層內(nèi)的的標準準差已已知,,應該該在標標準差差大的的層內(nèi)內(nèi)多分分配而而在標標準差差小的的層內(nèi)內(nèi)少分分配抽抽樣數(shù)數(shù)量。。最佳配配置法法可以以使得得到的的樣本本具有有較好好的異質(zhì)性性。在各層層內(nèi)應應抽取取個體體數(shù)計計算公式中中,ni表示從從某一一層所所抽個個體數(shù)數(shù)n表示樣樣本容容量Ni表示某某層個個體總總數(shù)σi表示某某層標標準差差(22.2)當各個個σ沒有現(xiàn)現(xiàn)成資資料可可以應應用時時,可可以先先從該該層抽抽一個個小樣樣本,,由這這一小小樣本本計算算出的的樣本本標準準差S對σ進行估估計。。(22.3)分層隨隨機取取樣法法的優(yōu)點是代表表性和和推論論的精精確性性較好好。它它適用用于總總體單單位數(shù)數(shù)量較較多,,并且且內(nèi)部部差異異較大大的研研究對對象。。分層隨隨機取取樣法法的局限性是要要求對對總體體各單單位的的情況況有較較多的的了解解,否否則就就難以以作出出科學學的分分類。。4.兩階階段隨隨機抽抽樣當總體體容量量很大大時,,直接接以總總體中中的所所有個個體為為對象象,從從中進進行抽抽樣,,在實實際調(diào)調(diào)查或或研究究中存存在很很大困困難。。采用分階段段的抽樣方方法,可以以縮小實際際抽樣的范范圍,使實實際抽樣工工作能夠按按研究設計計的要求順順利進行。。兩階段隨機機抽樣(two-stagesrandomsampling)的一般過過程是:先先將總體分分成M個部分;第一階段從這M個部分中隨隨機抽取m個部分作為為第一階段段樣本;第二階段是分別從這這m個部分中抽抽取一定數(shù)數(shù)量(ni)的個體構構成第二階階段樣本。。5.整群抽樣樣整群隨機抽抽樣是先將將總體各單單位按一定定的標準分分成許多群群(小組)),然后按按隨機原則則從這些群群中抽取若若干群作為為樣本。整群隨機取取樣法的優(yōu)點是樣本比較較集中,適適宜于某些些特定的研研究,尤其其是在教育育實驗中常常用此法。。此外,在在規(guī)模較大大的調(diào)查研研究中,整整群隨機取取樣易于組組織,可節(jié)節(jié)省人力、、物力和時時間。整群隨機抽抽樣法的缺點是樣本分布布不均勻,,代表性較較差。二.樣本本容量的確確定(自學學)1.確定樣本本容量的意意義在應用中應應根據(jù)研究究所要求的的精確度及及經(jīng)費情況況確定樣本本容量。如如果樣本容容量過小,,會影響樣樣本對總體體的代表性性,增大抽抽樣誤差而而降低研究究推論的精精確性;樣樣本容量過過大,雖然然減小了抽抽樣誤差,,但可能增增大過失誤誤差,并且且增加不必必要的人力力物力資源源的浪費。。樣本容量與與抽樣誤差差并不是直直線關系。。確定容量的的基本原則則是:在盡盡量節(jié)省人人力、經(jīng)費費和時間的的條件下,,確保用樣樣本推斷總總體達到預預定的可行行度及準確確性。2.總體平均均數(shù)估計樣樣本容量的的確定⑴.總體σ已知其中,最大大允許誤差差為,可信度為為1-α。由有(22.4)可以看到,,當α確定之后,,總體標準準差和最大大允許誤差差d是決定樣本本容量的兩兩個因素。。⑵.總體σ未知由有當樣本容量量n未確定時,,t值無法確定定,因此一一般采用嘗嘗試法。(22.5)嘗試法求樣樣本容量的的過程⑴.將df=∞的t值代入公式式求出n1,⑵.將n1的t值代入公式式求出n2,……⑶.直至前后兩兩次求出的的n相同為止。。也可據(jù)S/d查附表20求出樣本容容量例2:擬估計某市市高校四級級英語考試試成績的總總體平均分分數(shù)。以往往考試成績績的標準差差為13,這次的估估計最大允允許誤差為為2分,可信度度為95%,問應抽取取多大的樣樣本?例3:擬對某市初初中升入高高中入學考考試語文成成績的總體體平均數(shù)進進行估計。。根據(jù)以同同等難度的的試題對同同等教育水水平的另一一城市部分分初中升入入高中入學學考試語文文成績算出出的S=11.4。若要求估估計的最大大允許誤差差為d=3,可信度為為99%,問樣本容容量應為多多少?計算1.由t分布表查得得自由度度df=∞時,t1=2.5762.由t分布表查得得自由度度df=96-1時,t2=2.6293.由t分布表查得得自由度度df=100-1時,t3=2.627前后兩次算算出的樣本本容量相等等,因此n=100當估計出的的樣本容量量比較大時時,可以直直接按公式式(22.4)計算而不不必采用嘗嘗試法。2.平均數(shù)顯顯著性檢驗驗時
樣本本容量的確確定⑴.總體σ已知在假設檢驗驗中,要同同時考慮α錯誤和β錯誤,因此此將以上兩式式相加為::若令δ=μ-μ0,則單側檢驗:雙側檢驗:(22.6)(22.7)式中的α和β由研研究究者者預預先先確確定定,,α值要要比比β值小小。。一一般般α為0.05或0.01,而而β值一一般般確確定定為為0.10、0.20或0.30。對對同同一一個個α值,,單單側側和和雙雙側側時時的的Z臨界界值值是是不不一一樣樣的的。。當樣本容量已已知,α值及其他條件件也已確定,,則β就是確定值。。這時可以利利用有關公式式計算β值,從而對檢檢驗的統(tǒng)計力力作出評價。??梢钥吹?,在在平均數(shù)的假假設檢驗中,,當確定了α和β之后,樣本的的容量n取決于總體標標準差σ和假設的總體體差異δ。與參數(shù)估計計相比,多考考慮了一個β因子,并且δ與參數(shù)估計中中的具有不同同的涵義。例4:某市高中入
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025屆江西省贛州市博雅文高三第四次模擬考試英語試卷含解析
- 2025屆上海市金山區(qū)高三下第一次測試英語試題含解析
- 江蘇省南通市示范中學2025屆高考語文倒計時模擬卷含解析
- 2025屆皖西省示范高中聯(lián)盟高三最后一卷語文試卷含解析
- 2025屆濱州市重點中學高三3月份模擬考試語文試題含解析
- 2025屆吉林省蛟河市高三3月份第一次模擬考試語文試卷含解析
- 《保險公司早會流程》課件
- 《解熱鎮(zhèn)痛藥和非甾》課件
- 北京市東城區(qū)示范校2025屆高三第二次聯(lián)考數(shù)學試卷含解析
- 2025屆貴州省盤縣四中高考語文四模試卷含解析
- 設備操作三好四會四項要求五項原則培訓教材
- CCTV《開門大吉》選手報名表VM
- 乒乓球比賽用表
- 某公司項目部質(zhì)量管理體系及制度
- 關于開展全員營銷活動的實施方案
- 碩士開題報告和文獻綜述模板-北京理工大學研究生院
- 磚基礎工程量計算PPT課件
- 蝸輪蝸桿的設計及其參數(shù)計算
- 5-10萬山平塘設計報告
- 單片機程序源代碼
- 城鎮(zhèn)燃氣室內(nèi)施工及質(zhì)量驗收規(guī)范(完整版)
評論
0/150
提交評論