




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第八章 2檢驗 孫海龍內(nèi)容 一、2檢驗概述 二、總體分布的假設(shè)檢驗 三 、獨(dú)立性檢驗引言推斷統(tǒng)計參數(shù)檢驗正態(tài)分布和方差同質(zhì)非參數(shù)檢驗對分布較少有要求,也叫用于名義/順序型數(shù)據(jù)均值檢驗方差分析2檢驗其他非參數(shù)檢驗參數(shù)統(tǒng)計和非參數(shù)統(tǒng)計優(yōu)缺點 參數(shù)統(tǒng)計優(yōu)點: 對資料的分析利用充分 統(tǒng)計分析的效率高缺點: 對資料的要求高 適用范圍有限 非參數(shù)統(tǒng)計優(yōu)點:對資料的沒有特殊要求 不受分布的影響(偏態(tài)、分布不明的資料) 不受方差齊性的限制 不受變量類型的影響 不受樣本量的影響缺點: 檢驗效率低(易犯型錯誤) 對信息的利用不充分。因此在二者都可用時,總是用參數(shù)檢驗因此在二者都可用時,總是用參數(shù)檢驗引言 實際應(yīng)用
2、情況:調(diào)查、問卷、訪談等方法中,按性質(zhì)劃分類別,然后將結(jié)果按類計點人數(shù)或個數(shù),得到計數(shù)數(shù)據(jù)。 類別變量(1)只能劃分為類別,如性別、民族;(2)人為劃分類別,如學(xué)習(xí)成績(連續(xù)數(shù)據(jù))分成優(yōu)、良、中、差。 這些計數(shù)數(shù)據(jù)不能使用前幾章所講的統(tǒng)計方法,需要用到計數(shù)數(shù)據(jù)專用的統(tǒng)計方法,這些分析方法主要是根據(jù)2(卡方)分布進(jìn)行的,故稱為卡方檢驗。這類數(shù)據(jù)大都以表格形式表示,所以又稱列聯(lián)表分析。一、2檢驗概述1.單變量的卡方檢驗:同時檢驗一個因素兩項或多項分類的實際觀察數(shù)與某理論次數(shù)分布是否相一致的問題,或說有無顯著差異的問題。這種檢驗又稱為擬合度檢驗。理論次數(shù)是指根據(jù)概率原理、某種理論、某種理論次數(shù)分布或
3、經(jīng)驗次數(shù)分布所計算出來的次數(shù)。3獨(dú)立類別的卡方檢驗:用于檢驗兩個或兩個以上因素(變量)各有多項分類之間是否有關(guān)聯(lián)或是否具有獨(dú)立性的問題。如不同性別的人在態(tài)度上是否有差異。這類檢驗又稱獨(dú)立性檢驗。一、2檢驗概述卡方檢驗的基本公式實際觀察次數(shù)與某理論次數(shù)之差的平方再除以理論次數(shù),即 f0:觀察次數(shù) f e :期望次數(shù)其中,f e 期望次數(shù)越大(大于5),分布越接近卡方分布。 keefff20一、2檢驗概述 指用樣本數(shù)據(jù)檢驗總體分布的形狀或比率,以確定與假設(shè)的總體性質(zhì)的匹配度,是對次數(shù)分布的檢驗。(一)研究情境主要用于實際觀察次數(shù)(f0)與某理論次數(shù)(fe)是否有差別的分析。例如,在醫(yī)生職業(yè)中,男的
4、多還是女的多?在三種咖啡中,哪種被國人最喜歡?在北京大學(xué)中,各國留學(xué)生的比例有代表性嗎?二、總體分布的擬合檢驗(一)定義(二)統(tǒng)計假設(shè)及相關(guān)計算 H0: f0 = fe H1: f0 fe 運(yùn)用基本公式計算出卡方值查表,比較其與臨界卡方值的大小,如果注意注意:卡方值分布全部為正值,但f0-f e可能是負(fù)值,因此,卡方檢驗是雙側(cè)檢驗,0.05和0.01是指雙側(cè)概率而言。擬合度檢驗需要先計算理論次數(shù),這是計算卡方值的關(guān)鍵性步驟。(一般根據(jù)某種理論或經(jīng)驗)二、總體分布的擬合檢驗實際觀察次數(shù)與某理論次數(shù)之差的平方再除以理論次數(shù),即 f0:觀察次數(shù) f e :期望次數(shù)其中,f e 期望次數(shù)(大于5)。
5、keefff20二、總體分布的擬合檢驗(三)擬合檢驗公式例1 某項民意測驗,答案有同意、不置可否和不同意三種,調(diào)查結(jié)果如下表:同意不置可否不同意Nfi24121248問:三種意見的人數(shù)是否有顯著不同?有顯著差異。即此項民意測驗的態(tài)度所以,推翻原假設(shè),)(查表理論次數(shù)所以各類別概率皆為分類數(shù)是各分類的概率相等該題為檢驗無差假設(shè)解 ,02. 0p , 99. 52 , 213df, 6161612161612161624,163148e , 1/3, 3,:H ,:205. 02205. 02222i0二、總體分布的擬合檢驗例2 某班學(xué)生50人,體檢結(jié)果按一定標(biāo)準(zhǔn)劃分為甲、乙、丙三類,各類人數(shù)分別
6、為:甲類16人,乙類24人,丙類10人,問該班學(xué)生的身體狀況是否符合正態(tài)分布?正態(tài)分布。不符合,該班學(xué)生的身體狀態(tài)推翻,查表,各類別的理論次數(shù)為:。曲線下的面積應(yīng)為:之間,丙類:為:之間,曲線下的面積應(yīng)乙類:,曲線下的面積應(yīng)為:之間,甲類:為故各類人數(shù)應(yīng)占的比例。應(yīng)該相同,即且各類別所占的橫坐標(biāo)全體數(shù)據(jù),包括了在正態(tài)分布中可以認(rèn)為算。理論次數(shù)按正態(tài)分布計合正態(tài)分布該班學(xué)生的身體狀況符解丙乙甲02005. 022005. 031i222i2ii20H ,005. 0p , 6 .10 , 21-3df,44.1188103434248816ee-f 8500.1587e 34,500.6826e
7、 8,500.1587e0.15870.3413-0.50 -3-1- 6826. 023413. 0 11 1587. 03413. 050. 0 13 236 3 :H :例3 下表所列資料是552名中學(xué)生的身高次數(shù)分布,問這些學(xué)生的身高分布是否符合正態(tài)分布。身高分組組中值 Xc實際次數(shù)fiXc-X=xZ=x/S查正態(tài)分布表求yPi=y(組距) Sei=yN169-166-163-160-157-154-151-148-145-142-139-17016716416115815515214914614314027225711012411280258415.3812.389.386.383.
8、380.38-2.62-5.62-8.62-11.62-14.623.032.441.851.260.670.07-0.52-1.11-1.70-2.29-2.880.00400.00200.07200.18400.31870.39790.34840.21540.09400.02890.00670.002370.012010.042600.108880.188580.235440.206150.127460.055620.017100.003961724601041301147031920.1250.1670.1500.4710.2770.0351.4291.1610.090N=552, X=
9、154.62, S=5.072=3.905iiieef2ccciiiii29ii2i 1i:(1) XXx, xX -X;X -Xx(2) Z;SS(3) Zy(4) py;S(5) epN5 9f -e3.905,e解 計算理論次數(shù)的步驟求各組組中值與平均數(shù) 的離差即求各離差的標(biāo)準(zhǔn)分?jǐn)?shù)根據(jù)各 分?jǐn)?shù)查正態(tài)分布表求相應(yīng)的值;組距求 各分組的概率求各組的理論次數(shù)由于第一組和最后一組的理論次數(shù), 所以第一、二組合并,最后一組和前一組合并,總組數(shù)為 。20.05220.05 df9-36 (6)12.6, p0.05, 552在計算理論次數(shù)的過程中共用到平均數(shù),標(biāo)準(zhǔn)差和總數(shù)三個統(tǒng)計量,故本題的自由度為
10、 ,查卡方分布表,故差異不顯著,即名中學(xué)生的身高分布符合正態(tài)分布。二、總體分布的擬合檢驗三、獨(dú)立性檢驗 主要用于兩個或兩個以上因素多項分類的計數(shù)資料分析。如果要研究的兩個自變量之間是否具有獨(dú)立性或有無關(guān)聯(lián)或有無“交互作用”的存在,就要應(yīng)用卡方獨(dú)立性檢驗。 如果兩個子變量是獨(dú)立的,無關(guān)聯(lián)的,就意味著對其中一個自變量來說,另一個自變量的多項分類次數(shù)上的變化是在取樣誤差的范圍之內(nèi)。假如兩個因素是非獨(dú)立,則稱兩變量有交互作用。(一)適用材料虛無假設(shè):兩變量(或多變量)之間是獨(dú)立的或無關(guān)聯(lián)的備擇假設(shè):兩變量之間有關(guān)聯(lián)或差異顯著,一般用文字?jǐn)⑹?,不用統(tǒng)計符號。例4:某學(xué)校對學(xué)生的課外活動內(nèi)容進(jìn)行調(diào)查,結(jié)果
11、整理成下表: 三、獨(dú)立性檢驗(二)統(tǒng)計假設(shè) 虛無假設(shè):體重自我知覺與性別無關(guān)自我知覺總和過輕過重女性419(786.78)1995 (1627.22)2414男性959 (591.22)855 (1222.78)1814總和137828504228(二)統(tǒng)計假設(shè)三、獨(dú)立性檢驗計算自我知覺過輕過重女性(419-786.78)2/786.78=171.92( 1995 -1627.22) 2 /1672.22=83.12男性228.78110.622 2 (1)=594.44 df=1 a= 0.05 臨界值臨界值3.84 因素Y因 素 X分類1分類2分類1aba+b分類2cdc+da+cb+dn
12、 1222dbcadcbabcadn(三) 22 列聯(lián)表 檢驗 三、獨(dú)立性檢驗2 觀察頻數(shù)觀察頻數(shù)a a對應(yīng)的理論頻數(shù)為:對應(yīng)的理論頻數(shù)為: 式中TRC為第R(row)行、第C(column)列的理論頻數(shù),nR為相應(yīng)行的合計,nc為相應(yīng)列的合計,n為總例數(shù).ncabaBAnPT)()(1111nnnTCRRC.三、獨(dú)立性檢驗(三) 22 列聯(lián)表 檢驗 2 檢驗的自由度取決于可以自由取值的格子數(shù)目,而不是樣本含量n。四格表資料只有兩行兩列,自由度(df)=1,即在周邊合計數(shù)固定的情況下,4個基本數(shù)據(jù)當(dāng)中只有一個可以自由取值. 自由度=(行數(shù)-1)(列數(shù)-1) 自由度自由度三、獨(dú)立性檢驗(三) 2
13、2 列聯(lián)表 檢驗 2(三) 22 列聯(lián)表 檢驗 1 、 當(dāng)n40, Tij 5的條件下 可用下列簡化公式21f ,)(22ddbcadcbabcadn三、獨(dú)立性檢驗 例例5 工農(nóng)業(yè)高血壓患病率的比較(50歲以上男性),首鋼調(diào)查50-59歲男性工人1281人、高血壓患者386人,患病率為30.13%。石景山區(qū)農(nóng)民387人,血壓血患者65人,患病率為16.80%,從事工農(nóng)業(yè)生產(chǎn)的男性患病率有無差別。(三) 22 列聯(lián)表 檢驗 三、獨(dú)立性檢驗2患病未患病小計工人3868951281農(nóng)民65322387小計45112171668解: 建立檢驗假設(shè) H0:1 =2 (工人與農(nóng)民的總體患病率相同) =0.
14、05 估計總體某現(xiàn)象的發(fā)生或存在的概率,假定高血壓的發(fā)生和這兩種工種眾彼此獨(dú)立無關(guān),因此,這兩組資料是一總體中的兩個隨機(jī)樣本,估計 總體患病率= 451/1668 =0.2704 未患率= 1217/1668=0.7296三、獨(dú)立性檢驗(三) 22 列聯(lián)表 檢驗 2 50-59 歲男性工人與農(nóng)民高血壓患病比較歲男性工人與農(nóng)民高血壓患病比較患高血壓人數(shù)患高血壓人數(shù) 合 計觀察數(shù)理論數(shù)觀察數(shù)理論數(shù)首鋼工人386346.4895934.61281石景山區(qū)農(nóng)民65104.6322282.4387合計451451121712171668(三) 22 列聯(lián)表 檢驗 三、獨(dú)立性檢驗2 計算檢驗統(tǒng)計量 2 值
15、 查 2 分布界值表,作出統(tǒng)計結(jié)論。 df = (r-1)(c-1)=1; 故按 p0.01 水平拒絕Ho 接受H1 。 結(jié)合具體問題作出專業(yè)結(jié)論:不同職業(yè)的高血壓患病率極顯著意義,工人的高血壓患病率顯著高于農(nóng)民。26.7505.55314.9921.6784.5274 .2824 .2823226 .1046 .104656 .9346 .9348954 .3464 .34638622222 843 21050 6.63 21010(三)(三) 22 列聯(lián)表列聯(lián)表 檢驗檢驗 三、獨(dú)立性檢驗(三) 22 列聯(lián)表 檢驗 2應(yīng)用簡化公式計算:75.2612174513871281)65895322386(1668)(222dbcadcbabcadn(三) 22 列聯(lián)表 檢驗 三、獨(dú)立性檢驗2 2 n 40, 但有但有1 Tij 5時,時,需對上述公式進(jìn)行校正。需對上述公式進(jìn)行校正。dbcadcbanbcadn25 . 02(三) 22 列聯(lián)表 檢驗 三、獨(dú)立性檢驗2(四) 與 r系數(shù)(phi coeffi
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025屆山東省青島市第二中學(xué)學(xué)業(yè)水平考試數(shù)學(xué)試題模擬卷(十三)含解析
- 遼寧省葫蘆島市龍港區(qū)2024-2025學(xué)年六年級下學(xué)期小升初數(shù)學(xué)試卷含解析
- 遼寧沈陽皇姑區(qū)重點達(dá)標(biāo)名校2025年初三5月中考模擬考試英語試題含答案
- 人教版四年級音樂下冊(五線譜)第一單元《憶江南》教學(xué)設(shè)計
- 河北省秦皇島市名校2025屆初三中考預(yù)測金卷化學(xué)試題試卷含解析
- 宜春學(xué)院《運(yùn)動訓(xùn)練3》2023-2024學(xué)年第二學(xué)期期末試卷
- 浙江省之江教育聯(lián)盟2025屆高三(生物試題文)一模試題含解析
- 重慶公共運(yùn)輸職業(yè)學(xué)院《乒乓球Ⅳ》2023-2024學(xué)年第一學(xué)期期末試卷
- 江蘇省江都區(qū)周西中學(xué)2025屆初三年級五月模擬考試(二)化學(xué)試題試卷含解析
- 廈門城市職業(yè)學(xué)院《理解藝術(shù)B:創(chuàng)意舞動》2023-2024學(xué)年第二學(xué)期期末試卷
- 【初中生物】食物中營養(yǎng)物質(zhì)課件2024-2025學(xué)年人教版生物七年級下冊
- 2025河北保定鈔票紙業(yè)限公司招聘33人易考易錯模擬試題(共500題)試卷后附參考答案
- 中專藥品gsp考試試題及答案
- 智慧教育解決方案
- 2025年共青團(tuán)入團(tuán)積極分子考試測試試卷題庫及答案
- T-CSOE 0003-2024 井下套管外永置式光纜安裝要求
- 合肥鼎材科技有限公司光阻車間光刻膠生產(chǎn)線技術(shù)改造項目環(huán)評報告書
- 北師大版(2024)七年級下冊生物第6章 人體的營養(yǎng) 學(xué)情評估測試卷(含答案解析)
- 2025體育單招英語備考100個高頻名詞精講(精校打印版)
- 9.1.2 用坐標(biāo)描述簡單幾何圖形(課件)-2024-2025學(xué)年新教材七年級下冊數(shù)學(xué)
- 精神科敘事護(hù)理案例分享
評論
0/150
提交評論