第十講列聯(lián)表課件_第1頁(yè)
第十講列聯(lián)表課件_第2頁(yè)
第十講列聯(lián)表課件_第3頁(yè)
第十講列聯(lián)表課件_第4頁(yè)
第十講列聯(lián)表課件_第5頁(yè)
已閱讀5頁(yè),還剩36頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第十講列聯(lián)表第十講 列聯(lián)表v第一節(jié) 概念v1、研究?jī)?nèi)容v1)研究?jī)啥愖兞康年P(guān)系v2)為研究y的分類是否與x之分類有關(guān),將數(shù)據(jù)先按x分類,再分別統(tǒng)計(jì)x分類情況下y的分類。v3)按兩個(gè)定類變量進(jìn)行交叉分類的頻次分配表,即二維列聯(lián)表。第十講列聯(lián)表4、列聯(lián)表的一般形式Nij:x=xi y=yj時(shí)所具有的頻次y xx1x2. . . xcy1N11N21. . .Nc1y2N12N22. . .Nc2.yrN1rN2r. . .Ncr第十講列聯(lián)表學(xué)生上網(wǎng)調(diào)查(統(tǒng)計(jì)各項(xiàng)比例,能發(fā)現(xiàn)什么問(wèn)題?)男 生 女生聊天玩游戲網(wǎng)戀學(xué)習(xí) 20 20 50 50 15 15 15 15 第十講列聯(lián)表2、列聯(lián)表中變量的分

2、布v1)聯(lián)合分布v對(duì)于二變量來(lái)說(shuō),為了知道分布,集合中的變量值,必須同時(shí)具有x和y兩個(gè)變量的取值。v( x1 y1 N11)v( x2 y2 N12)v( x1 yr N1r) 此稱聯(lián)合分布v( xi yj Nij)v( xc yr Ncr)vNij 表示頻次時(shí) 聯(lián)合頻次分布表v 表示概率時(shí) 聯(lián)合概率分布表v后者可以通過(guò)前者求出NNpijijcirjijNN11111cirjijp第十講列聯(lián)表v2)邊緣分布:v對(duì)聯(lián)合分布進(jìn)行簡(jiǎn)比,只研究其中某一變量的分布,而不管另一變量的取值,這樣就得到邊緣分布。v按行加總 y的邊緣分布:v按列加總 x的邊緣分布:ppppyrcrrrryp21ppppxccr

3、cccxp21第十講列聯(lián)表v3)條件分布:v將其中一個(gè)變量控制起來(lái)取固定值,再看另一變量的分布,即條件分布。v控制x時(shí),條件分布中的每一項(xiàng)都以邊緣分布的 為分母v控制y時(shí),條件分布中的每一項(xiàng)都以邊緣分布的 為分母NNNc*2*1NNNr*2*1*第十講列聯(lián)表3、列聯(lián)表中的相互獨(dú)立性:v1)列聯(lián)表研究定類變量之間的關(guān)系,實(shí)際上是通過(guò)條件分布的比較進(jìn)行的。v如果兩個(gè)變量之間沒(méi)有關(guān)系,則稱變量之間是相互獨(dú)立的。v2)如果兩個(gè)變量之間是相互獨(dú)立的,則必然存在變量的條件分布與其邊緣分布相同 。第十講列聯(lián)表v條件分布=邊緣分布是列聯(lián)表檢驗(yàn)的基礎(chǔ):(控制x時(shí))j*i*ijj*Iijj* iij1*221*1

4、11PPP NNNNNNNNNNNNNNNN第十講列聯(lián)表第二節(jié) 列聯(lián)表的檢驗(yàn)v一、原假設(shè):v將總體中變量間無(wú)關(guān)系或相互獨(dú)立作為檢驗(yàn)的原假設(shè)。v總體 和 未知時(shí),用樣本 和 代替。pppHjiij*0:pi*pj*pi*pj*nnpii*nnpjj*第十講列聯(lián)表二、統(tǒng)計(jì)量v v x2cirjijEEnxijij1122112crxnnnEjiij*npE nnnnnnnpppEjijiijij*第十講列聯(lián)表統(tǒng)計(jì)量的討論v1、對(duì)于22列聯(lián)表,由于格數(shù)過(guò)少,為減少作為離散觀測(cè)值與作為連續(xù)型變量x值之間的偏差,可作連續(xù)性修正:v2、二項(xiàng)總體 統(tǒng)計(jì)量 為總體成數(shù)2121225 . 0ijijEEnxij

5、ij EEnEEnx221225 . 05 . 02211pEn01pEn012p0第十講列聯(lián)表男女休閑愛(ài)好 男 女 泡吧 80 30 逛商店 20 70第十講列聯(lián)表對(duì)開(kāi)卷考試的看法 態(tài)度 贊成 反對(duì) 人數(shù) 60 40第十講列聯(lián)表3、對(duì)多項(xiàng)總體:v統(tǒng)計(jì)量:v 4、使用統(tǒng)計(jì)量 對(duì)列聯(lián)表進(jìn)行檢驗(yàn),每一格值的 要保持在一定數(shù)目之上。如果有的格值 過(guò)小,那么在計(jì)算 值時(shí) 值的波動(dòng)就會(huì)較大。riiEEnxii12212rxpEiin0 x2EijEijx2EEnijijij2第十講列聯(lián)表v每格要求:處理方法:將期望值偏小的格值合并右例,做檢驗(yàn)。Eij20 30 3 1nij18 29 4 2 5Eij第

6、十講列聯(lián)表v注意: 列聯(lián)表就其檢驗(yàn)內(nèi)容來(lái)看是雙邊檢驗(yàn),但從形式上看,卻又很像單邊檢驗(yàn)。其判斷的內(nèi)容僅是變量間似乎否存在關(guān)系。至于方向,由于列聯(lián)表屬定類變量,因此是不存在的。第十講列聯(lián)表列聯(lián)表檢驗(yàn)步驟v1、v2、統(tǒng)計(jì)量:v v3、v4、比較H0H1riiEEnxii12212rx第十講列聯(lián)表例:以下是老、中、青三代對(duì)某影片的抽樣,能否認(rèn)為三代人對(duì)該影片評(píng)價(jià)有顯著差異老中青很高453921一般472622第十講列聯(lián)表第三節(jié) 列聯(lián)強(qiáng)度v一、變量間的相關(guān)v1、列聯(lián)表中的頻次分布情況,不僅是檢驗(yàn)是否存在關(guān)系的依據(jù),同時(shí)也是度量變量間關(guān)系強(qiáng)弱的依據(jù)。相關(guān)性程度越高,說(shuō)明社會(huì)現(xiàn)象與社會(huì)現(xiàn)象間的關(guān)系愈密切。v

7、2、列聯(lián)表中變量間的關(guān)系的強(qiáng)度分析,可以將頻次轉(zhuǎn)化為條件分布,然后比較自變量取不同值時(shí),因變量條件分布的不同。第十講列聯(lián)表例v右表中,男生上網(wǎng)玩游戲的比例高于女生;而上網(wǎng)聊天的比例低于女生;v想一想,當(dāng)x取值大于2時(shí),怎樣比較?y x男生 女生玩游戲聊天40 67% 10 25%30 33% 30 75%第十講列聯(lián)表二、22表 系數(shù)和系數(shù)v列聯(lián)表中兩個(gè)變量都只有二種取值時(shí),就是22表v當(dāng)變量間無(wú)關(guān)系時(shí)(獨(dú)立)v對(duì)于22表,無(wú)論 系數(shù)或系數(shù),都以差值 為基礎(chǔ)進(jìn)行討論,同時(shí),也把關(guān)系強(qiáng)度的取值范圍定義在 之間。 y x a b c d x1x2y1y2dbbcaabcad bcad 11 ,第十講

8、列聯(lián)表v1、 系數(shù)v 當(dāng)兩變量相互獨(dú)立v b、c為零, 值最大1v a、d為零, 值最小-1v 一般情況v前例中計(jì)算dbcadcbabcad011第十講列聯(lián)表v2、系數(shù)v當(dāng)a、b、c、d中有一個(gè)是零時(shí),則v對(duì)應(yīng)的實(shí)際情況是配對(duì)樣本研究v例v3、 、系數(shù)的選擇v當(dāng)自變量的不同取值都會(huì)影響因變量時(shí),用 系數(shù)。當(dāng)存在控制組時(shí),用系數(shù)bcadbc-adQ1Q 第十講列聯(lián)表v新政策頒發(fā)前后出勤狀況新政策前 新政策后正點(diǎn)遲到50 10050 0第十講列聯(lián)表4、 列聯(lián)表v1)以 值為基礎(chǔ)的相關(guān)性測(cè)量v期望頻次 是基于無(wú)相關(guān)前提下計(jì)量出來(lái)的,因 愈大,表示變量間距離無(wú)相關(guān)性愈遠(yuǎn)。v 值構(gòu)成 系數(shù)v其與22表中

9、 系數(shù)是一致,22表中是 表中 系數(shù)的特例。crx2x2x2EEnxijijij22Eijnx2cr第十講列聯(lián)表v由于 表的數(shù)增多后, 值增加,沒(méi)有上限,無(wú)法比較,因此以c系數(shù)修正。 vc值 在0,1但永遠(yuǎn)小于1,又出現(xiàn)了v系數(shù):vV 的取值:crncxx22 1,1min2crV1Vo第十講列聯(lián)表v例:已知 c=2 r=4 求 系數(shù),c系數(shù),v系數(shù)再例:32.192x第十講列聯(lián)表練習(xí)v習(xí)題三、四。第十講列聯(lián)表2)以減少誤差比例為基礎(chǔ)的相關(guān)性測(cè)量vPRE不受變量層次的限制,通過(guò)現(xiàn)象之間的關(guān)系研究,從一個(gè)現(xiàn)象預(yù)測(cè)另一個(gè)現(xiàn)象。v :不知y與x有關(guān)系時(shí),預(yù)測(cè)y的全部誤差v :知道y與x有關(guān)系后,用x

10、去預(yù)測(cè)y的全部誤 差v 表示所減少的相對(duì)誤差,越大表示y與x關(guān)系越密切。EEEPRE121E1E2EEE221第十講列聯(lián)表vPRE的取值范圍:vPRE=0:兩變量是無(wú)相關(guān)(知道x 與否無(wú)助于y的預(yù)測(cè), 誤差不變)vPRE=1:兩變量是全相關(guān)(知道x與y有關(guān)系后,可以消除預(yù)測(cè)的全部誤差)v0 PRE 1:其他v :不知y與x 有關(guān),用y的邊緣和 的最大值去猜y值,猜中的頻次會(huì)更多。全部誤差為:v :知道有關(guān)后,先看它屬于x的哪一類,然后用這一類的眾值去猜y值,誤差為E1E2EE21cijnn1imaxnjnmaxj*n第十講列聯(lián)表兩種系數(shù):v1) 系數(shù)v即:v 的取值范圍:vx與y無(wú)相關(guān): ;x

11、與y全相關(guān): nnnEEEjjciijn*1121maxmaxmax邊緣和中最高頻次觀察總數(shù)邊緣和中最高頻次每列最高頻次之和yy10第十講列聯(lián)表v例:上網(wǎng)愛(ài)好與性別(100人)男女聊天103040游戲4020605050100025. 0a 第十講列聯(lián)表 值的非對(duì)稱性:v1)以x為自變量,用對(duì)y的預(yù)測(cè)來(lái)定義PRE,所得 值稱作v2)以y為自變量,用對(duì)x的預(yù)測(cè)來(lái)定義PRE,所得 值稱作v3)如果x和y孰因孰果不明顯的情況,這時(shí)可同時(shí)計(jì)算 和 ,并取其平均 值,作為x和y間的相關(guān)程度。yDNyyyxDNxxyyxDDNNDDDDDDxyxyxxyxyxyy第十講列聯(lián)表 系數(shù):v對(duì) 和 的定義比 系

12、數(shù)又有修正:v當(dāng)不知道x與y有關(guān)系預(yù)測(cè)y時(shí),充分考慮到y(tǒng)值邊緣分布所提供的信息。v 的取值范圍:vx與y無(wú)相關(guān): (邊緣分布與條件分布相同)vx與y全相關(guān): (各行、各列均只有一個(gè)不為0的頻次)E1E2rjjrjjcirjiijnnnnEEEnnn12*12*11*21211101第十講列聯(lián)表以前例為參照的推導(dǎo):1、不知x與y有關(guān):猜游戲與聊天:用邊緣分布:40%,60%隨機(jī)指派40人,猜對(duì)游戲的人數(shù)4040/100=16猜錯(cuò)的人數(shù)40-4040/100=40(1-40/100)=24同理:隨機(jī)指派60人,猜對(duì)聊天的人數(shù)6060/100=36猜錯(cuò)的人數(shù)60-6060/100=60(1-60/100)=24第十講列聯(lián)表vE1即為猜錯(cuò)人數(shù)之和。v推廣:r1jj*2r*2*2*1*1*1nn1n(n)nn1 (n)nn1 (nE第十講列聯(lián)表v知道x與y有關(guān)后:用y的條件分布來(lái)猜y值當(dāng)x=男生時(shí)隨機(jī)10人,猜對(duì)聊天的人數(shù):1010/50猜錯(cuò)的人數(shù):10-1010/50隨機(jī)40人,猜對(duì)游戲的人數(shù):4040/50猜錯(cuò)的人數(shù):40-4040/50猜錯(cuò)二者相加:=(10-1010/50)+(40-4040/50) =50-1/50 (102 +402 )同理:當(dāng)x=女生時(shí)?第十講列聯(lián)表v

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論