統(tǒng)計(jì)學(xué)第二章列聯(lián)_第1頁
統(tǒng)計(jì)學(xué)第二章列聯(lián)_第2頁
統(tǒng)計(jì)學(xué)第二章列聯(lián)_第3頁
統(tǒng)計(jì)學(xué)第二章列聯(lián)_第4頁
統(tǒng)計(jì)學(xué)第二章列聯(lián)_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、2021-10-1412021-10-142統(tǒng)計(jì)分析中,我們常常會(huì)遇到一些定性的數(shù)據(jù)性別(男、女)態(tài)度(喜歡、不喜歡)性別對態(tài)度是否有影響1.可使用列聯(lián)表分析技術(shù)2.可運(yùn)用對數(shù)線性模型與 Logistic模型分析技術(shù)2021-10-1432 一、分類數(shù)據(jù)一、分類數(shù)據(jù)二、列聯(lián)表的構(gòu)造二、列聯(lián)表的構(gòu)造三、列聯(lián)表的分布三、列聯(lián)表的分布2021-10-144l分類變量的結(jié)果表現(xiàn)為類別分類變量的結(jié)果表現(xiàn)為類別l例如:性別例如:性別 ( (男男, , 女女) )l各類別用符號或數(shù)字代碼來測度各類別用符號或數(shù)字代碼來測度l使用分類或順序尺度使用分類或順序尺度l你吸煙嗎你吸煙嗎? ? ?1.1.是;是;2.2

2、.否否l你贊成還是反對這一改革方案你贊成還是反對這一改革方案? ?1.1.贊成;贊成;2.2.反對反對l對分類數(shù)據(jù)的描述和分析通常使用列聯(lián)表對分類數(shù)據(jù)的描述和分析通常使用列聯(lián)表l可使用可使用 檢驗(yàn)檢驗(yàn)l數(shù)值型數(shù)據(jù)也可以轉(zhuǎn)化為分類數(shù)據(jù)數(shù)值型數(shù)據(jù)也可以轉(zhuǎn)化為分類數(shù)據(jù)2021-10-142021-10-145 5由兩個(gè)以上的變量交叉分類的頻數(shù)分布表由兩個(gè)以上的變量交叉分類的頻數(shù)分布表行變量的類別用行變量的類別用 r r 表示,表示, r ri i 表示第表示第 i i 個(gè)個(gè)類別類別列變量的類別用列變量的類別用 c c 表示,表示, c cj j 表示第表示第 j j 個(gè)個(gè)類別類別每種組合的觀察頻數(shù)用

3、每種組合的觀察頻數(shù)用 f fijij 表示表示表中列出了行變量和列變量的所有可能的組表中列出了行變量和列變量的所有可能的組合,所以稱為列聯(lián)表合,所以稱為列聯(lián)表一個(gè)一個(gè) r r 行行 c c 列的列聯(lián)表稱為列的列聯(lián)表稱為 r r c c 列聯(lián)列聯(lián)表表2021-10-142021-10-146 62021-10-147列列( cj )合計(jì)合計(jì)j =1j =1i =1f11f12f11+ f12i =2f21f22f21+ f22合計(jì)合計(jì)f11+ f21f12+ f22n2021-10-142021-10-148 8列列(cj)合計(jì)合計(jì)j =1j = 2i =1f11f12r1i = 2f21f22

4、r2:合計(jì)合計(jì)c1c2n列列( (c cj j) )行行( (r ri i) )f fijij 表示第表示第 i i 行第行第 j j 列的觀察頻數(shù)列的觀察頻數(shù)2021-10-142021-10-149 9例題分析例題分析一分公司二分公司三分公司四分公司合計(jì)合計(jì)贊成該方案贊成該方案6868757557577979279279反對該方案反對該方案3232757533333131141141合計(jì)合計(jì)1001001201209090110110420420【例例】一個(gè)集團(tuán)公司在四個(gè)不同的地區(qū)設(shè)有分公司,現(xiàn)該一個(gè)集團(tuán)公司在四個(gè)不同的地區(qū)設(shè)有分公司,現(xiàn)該集團(tuán)公司欲進(jìn)行一項(xiàng)改革,此項(xiàng)改革可能涉及到各分公司

5、集團(tuán)公司欲進(jìn)行一項(xiàng)改革,此項(xiàng)改革可能涉及到各分公司的利益,故采用抽樣調(diào)查方式,從四個(gè)分公司共抽取的利益,故采用抽樣調(diào)查方式,從四個(gè)分公司共抽取420420個(gè)個(gè)樣本單位樣本單位( (人人) ),了解職工對此項(xiàng)改革的看法,調(diào)查結(jié)果如,了解職工對此項(xiàng)改革的看法,調(diào)查結(jié)果如下表下表邊緣分布邊緣分布行邊緣分布行邊緣分布行觀察值的合計(jì)數(shù)的分布行觀察值的合計(jì)數(shù)的分布例如,贊成改革方案的共有例如,贊成改革方案的共有279人,反對改革方案的人,反對改革方案的141人人列邊緣分布列邊緣分布列觀察值的合計(jì)數(shù)的分布列觀察值的合計(jì)數(shù)的分布例如,四個(gè)分公司接受調(diào)查的人數(shù)分別為例如,四個(gè)分公司接受調(diào)查的人數(shù)分別為100人,

6、人,120人,人,90人,人,110人人條件分布與條件頻數(shù)條件分布與條件頻數(shù)變量變量 X 條件下變量條件下變量Y 的分布,或在變量的分布,或在變量Y 條件下變條件下變量量 X 的分布的分布每個(gè)具體的觀察值稱為條件頻數(shù)每個(gè)具體的觀察值稱為條件頻數(shù)2021-10-142021-10-141010二、列聯(lián)表的分布二、列聯(lián)表的分布-觀察值的分布觀察值的分布2021-10-142021-10-141111觀察值的分布觀察值的分布( (圖示圖示) )一分公司一分公司二分公司二分公司三分公司三分公司四分公司四分公司合計(jì)合計(jì)贊成該方案贊成該方案6868757557577979279279反對該方案反對該方案3

7、232454533333131141141合計(jì)合計(jì)1001001201209090110110420420行邊緣分布行邊緣分布列邊緣分布列邊緣分布條件頻數(shù)條件頻數(shù)條件頻數(shù)反映了數(shù)據(jù)的分布,但不適合對比條件頻數(shù)反映了數(shù)據(jù)的分布,但不適合對比為在相同的基數(shù)上進(jìn)行比較,可以計(jì)算相應(yīng)為在相同的基數(shù)上進(jìn)行比較,可以計(jì)算相應(yīng)的百分比,稱為的百分比,稱為百分比分布百分比分布l行百分比:行的每一個(gè)觀察頻數(shù)除以相應(yīng)的行行百分比:行的每一個(gè)觀察頻數(shù)除以相應(yīng)的行合計(jì)數(shù)合計(jì)數(shù)( (f fijij / / r ri i) )l列百分比:列的每一個(gè)觀察頻數(shù)除以相應(yīng)的列列百分比:列的每一個(gè)觀察頻數(shù)除以相應(yīng)的列合計(jì)數(shù)合計(jì)數(shù)(

8、 ( f fijij / / c cj j ) )l總百分比:每一個(gè)觀察值除以觀察值的總個(gè)數(shù)總百分比:每一個(gè)觀察值除以觀察值的總個(gè)數(shù)( ( f fijij / / n n ) )2021-10-142021-10-141212百分比分布百分比分布( (概念要點(diǎn)概念要點(diǎn)) )2021-10-1413百分比分布百分比分布( (圖示圖示) )一分公司一分公司二分公司二分公司三分公司三分公司四分公司四分公司合計(jì)合計(jì)贊成該方案贊成該方案24.4%24.4%26.9%26.9%20.4%20.4%28.3%28.3%66.4%66.4%68.0%68.0%62.5%62.5%63.3563.3571.8%

9、71.8%16.2%16.2%17.8%17.8%13.6%13.6%18.8%18.8%反對該方案反對該方案22.7%22.7%31.9%31.9%23.4%23.4%22.0%22.0%33.6%33.6%32.0%32.0%37.5%37.5%36.7%36.7%28.2%28.2%7.6%7.6%10.7%10.7%7.9%7.9%7.4%7.4%合計(jì)合計(jì)23.8%23.8%28.6%28.6%21.4%21.4%26.2%26.2%100%100%總百分比總百分比列百分比列百分比行百分比行百分比假定行變量和列變量是獨(dú)立的假定行變量和列變量是獨(dú)立的一個(gè)實(shí)際頻數(shù)一個(gè)實(shí)際頻數(shù) fij 的期

10、望頻數(shù)的期望頻數(shù) eij ,是總頻,是總頻數(shù)的個(gè)數(shù)數(shù)的個(gè)數(shù) n 乘以該實(shí)際頻數(shù)乘以該實(shí)際頻數(shù) fij 落入第落入第 i 行行 和第和第j列的概率,即列的概率,即2021-10-142021-10-141414期望頻數(shù)的分布期望頻數(shù)的分布jijiijcrcrennnn2021-10-142021-10-141515期望頻數(shù)的分布期望頻數(shù)的分布( (例題分析例題分析) )由于觀察頻數(shù)的總數(shù)為由于觀察頻數(shù)的總數(shù)為n ,所以,所以f11 的期望頻數(shù)的期望頻數(shù) e11 應(yīng)應(yīng)為為例如,第例如,第1行和第行和第1列的實(shí)際頻數(shù)為列的實(shí)際頻數(shù)為 f11 ,它落在第它落在第1行的行的概率估計(jì)值為該行的頻數(shù)之和概率

11、估計(jì)值為該行的頻數(shù)之和r1除以總頻數(shù)的個(gè)數(shù)除以總頻數(shù)的個(gè)數(shù) n ,即:即:r1/n;它落在第;它落在第1列的概率的估計(jì)值為該列的頻數(shù)列的概率的估計(jì)值為該列的頻數(shù)之和之和c1除以總頻數(shù)的個(gè)數(shù)除以總頻數(shù)的個(gè)數(shù) n ,即:,即:c1/n 。根據(jù)概率的。根據(jù)概率的乘法公式,該頻數(shù)落在第乘法公式,該頻數(shù)落在第1行和第行和第1列的概率應(yīng)為列的概率應(yīng)為11rcnn111 111279 10066.4366420rcrcennnn 2021-10-142021-10-141616期望頻數(shù)的分布期望頻數(shù)的分布( (例題分析例題分析) )一分公司一分公司二分公司二分公司三分公司三分公司四分公司四分公司贊成該贊成該

12、方方 案案實(shí)際頻數(shù)實(shí)際頻數(shù)6868757557577979期望頻數(shù)期望頻數(shù)6666808060607373反對該反對該方方 案案實(shí)際頻數(shù)實(shí)際頻數(shù)3232757533333131期望頻數(shù)期望頻數(shù)3434404030303737第二節(jié)第二節(jié) 檢驗(yàn)檢驗(yàn) 一、一、 統(tǒng)計(jì)量統(tǒng)計(jì)量 二、擬合優(yōu)度檢驗(yàn)二、擬合優(yōu)度檢驗(yàn)2021-10-142021-10-141717用于檢驗(yàn)列聯(lián)表中變量間擬合優(yōu)度和獨(dú)立性用于檢驗(yàn)列聯(lián)表中變量間擬合優(yōu)度和獨(dú)立性用于測定兩個(gè)分類變量之間的相關(guān)程度用于測定兩個(gè)分類變量之間的相關(guān)程度 計(jì)算公式為計(jì)算公式為 其自由度為其自由度為 式中式中 -列聯(lián)表中第列聯(lián)表中第i行第行第j列類別的實(shí)際頻

13、數(shù)列類別的實(shí)際頻數(shù) -列聯(lián)表中第列聯(lián)表中第i行第行第j列類別的期望頻數(shù)列類別的期望頻數(shù)2021-10-142021-10-141818一、一、 統(tǒng)計(jì)量統(tǒng)計(jì)量2211()=rcijijijijfee(1)(1)rcijfije2021-10-142021-10-141919 統(tǒng)計(jì)量統(tǒng)計(jì)量(例題分析例題分析)實(shí)際頻數(shù)實(shí)際頻數(shù)(fij)期望頻數(shù)期望頻數(shù)(eij)fij - eij(fij - eij)2(fij- eij)2eij687557793245333166806073344030372-5-36-253-64259364259360.06060.31250.15000.49320.1176

14、0.62500.30000.9730合計(jì):合計(jì):3.031922()3.0319f ee2021-10-1420二、擬合優(yōu)度二、擬合優(yōu)度檢驗(yàn)檢驗(yàn)( (品質(zhì)數(shù)據(jù)的假設(shè)檢驗(yàn)品質(zhì)數(shù)據(jù)的假設(shè)檢驗(yàn)) )品質(zhì)數(shù)據(jù)品質(zhì)數(shù)據(jù)比例檢驗(yàn)比例檢驗(yàn)獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn)Z Z 檢驗(yàn)檢驗(yàn)一個(gè)總體 檢驗(yàn)檢驗(yàn)Z Z 檢驗(yàn)檢驗(yàn) 檢驗(yàn)檢驗(yàn)兩個(gè)以上總體兩個(gè)總體檢驗(yàn)多個(gè)比例是否相等檢驗(yàn)多個(gè)比例是否相等檢驗(yàn)的步驟檢驗(yàn)的步驟提出假設(shè)提出假設(shè)lH0: 1 = 2 = = j;H1: 1 , 2 , , j 不全相等不全相等 計(jì)算檢驗(yàn)的統(tǒng)計(jì)量計(jì)算檢驗(yàn)的統(tǒng)計(jì)量2021-10-142021-10-142121擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)(goodn

15、ess of fit test)進(jìn)行決策進(jìn)行決策l 根據(jù)顯著性水平根據(jù)顯著性水平 和自由度和自由度(r-1)(c-1)查出臨界值查出臨界值 2l 若若 2 2,拒絕,拒絕H0;若;若 2 2,接受,接受H02211()rcijijijijfeeH0: 1= 2= 3= 4 H1: 1, 2, 3, 4 不全相等不全相等 = 0.1df = (2-1)(4-1)= 3臨界值臨界值(s):擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)(例題分析例題分析)統(tǒng)計(jì)量統(tǒng)計(jì)量:在在 = 0.1的水平上不能拒絕的水平上不能拒絕H0可以認(rèn)為四個(gè)分公司對改革方案的贊成比可以認(rèn)為四個(gè)分公司對改革方案的贊成比例是一致的例是一致的 決策決策

16、:結(jié)論結(jié)論:6.2513.0319 =0.12211()3.0319rcijijijijfee02 【例例】為了提高市場占有率,為了提高市場占有率,A公公司和司和B公司同時(shí)開展了廣告宣傳。公司同時(shí)開展了廣告宣傳。在廣告宣傳戰(zhàn)之前,在廣告宣傳戰(zhàn)之前,A公司的市場公司的市場占有率為占有率為45%,B公司的市場占有公司的市場占有率為率為40%,其他公司的市場占有率,其他公司的市場占有率為為15%。為了了解廣告戰(zhàn)之后。為了了解廣告戰(zhàn)之后A、B和其他公司的市場占有率是否發(fā)和其他公司的市場占有率是否發(fā)生變化,隨機(jī)抽取了生變化,隨機(jī)抽取了200名消費(fèi)者,名消費(fèi)者,其中其中102人表示準(zhǔn)備購買人表示準(zhǔn)備購買A

17、公司產(chǎn)公司產(chǎn)品,品,82人表示準(zhǔn)備購買人表示準(zhǔn)備購買B公司產(chǎn)品,公司產(chǎn)品,另外另外16人表示準(zhǔn)備購買其他公司產(chǎn)人表示準(zhǔn)備購買其他公司產(chǎn)品。檢驗(yàn)廣告戰(zhàn)前后各公司的市場品。檢驗(yàn)廣告戰(zhàn)前后各公司的市場占有率是否發(fā)生了變化占有率是否發(fā)生了變化 ( 0.05)2021-10-142021-10-142323擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)( (例題分析例題分析) )H H0 0: : 1 1=0.45 =0.45 2 2=0.4 =0.4 3 3= = 0.150.15 H H1 1: :原假設(shè)中至少有一個(gè)不成立原假設(shè)中至少有一個(gè)不成立 = 0.05= 0.05df = (2-1)(3-1)= 2df = (2

18、-1)(3-1)= 2臨界值臨界值(s):(s):擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)( (例題分析例題分析) )統(tǒng)計(jì)量統(tǒng)計(jì)量: : 在在 = 0.05= 0.05的水平上拒絕的水平上拒絕H H0 0可以認(rèn)為廣告后各公司產(chǎn)品市場占有可以認(rèn)為廣告后各公司產(chǎn)品市場占有率發(fā)生顯著變化率發(fā)生顯著變化 決策決策: :結(jié)論結(jié)論: :8.188.185.995.99 =0.05 =0.0522211()8.18rcijijijijfee 24第第1步:將觀察值輸入一列,將期望值輸入一列步:將觀察值輸入一列,將期望值輸入一列第第2步:選擇步:選擇“函數(shù)函數(shù)”選項(xiàng)選項(xiàng)第第3步:在函數(shù)分類中選步:在函數(shù)分類中選“統(tǒng)計(jì)統(tǒng)計(jì)”,

19、在函數(shù)名中選,在函數(shù)名中選 “CHITEST”,點(diǎn)擊,點(diǎn)擊“確定確定”第第4步:在對話框步:在對話框“Actual_range”輸入觀察數(shù)據(jù)區(qū)域輸入觀察數(shù)據(jù)區(qū)域 在對話框在對話框“Expected_range”輸入期望數(shù)據(jù)區(qū)輸入期望數(shù)據(jù)區(qū) 域得到域得到P值為值為0.016711,所以拒絕原假設(shè),所以拒絕原假設(shè) 擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)(例題分析例題分析用用P值檢驗(yàn)值檢驗(yàn)) 25第三節(jié)第三節(jié) 列聯(lián)表中的相關(guān)測量列聯(lián)表中的相關(guān)測量一一、 相關(guān)系數(shù)相關(guān)系數(shù)二、列聯(lián)相關(guān)系數(shù)二、列聯(lián)相關(guān)系數(shù)三三、V V 相關(guān)系數(shù)相關(guān)系數(shù)2021-10-1426品質(zhì)相關(guān)品質(zhì)相關(guān)對品質(zhì)數(shù)據(jù)對品質(zhì)數(shù)據(jù)(分類和順序數(shù)據(jù)分類和順

20、序數(shù)據(jù))之間相關(guān)程之間相關(guān)程度的測度度的測度列聯(lián)表變量的相關(guān)屬于品質(zhì)相關(guān)列聯(lián)表變量的相關(guān)屬于品質(zhì)相關(guān)列聯(lián)表相關(guān)測量的統(tǒng)計(jì)量主要有列聯(lián)表相關(guān)測量的統(tǒng)計(jì)量主要有 相關(guān)系數(shù)相關(guān)系數(shù)列聯(lián)相關(guān)系數(shù)列聯(lián)相關(guān)系數(shù)V 相關(guān)系數(shù)相關(guān)系數(shù)2021-10-142021-10-142727列聯(lián)表中的相關(guān)測量列聯(lián)表中的相關(guān)測量測度測度2 2列聯(lián)表中數(shù)據(jù)相關(guān)程度列聯(lián)表中數(shù)據(jù)相關(guān)程度對于對于2 2 列聯(lián)表,列聯(lián)表, 系數(shù)的值在系數(shù)的值在01之間之間 相關(guān)系數(shù)相關(guān)系數(shù)計(jì)算公式為計(jì)算公式為 式中式中n為列聯(lián)表的總頻數(shù),即樣本量為列聯(lián)表的總頻數(shù),即樣本量2021-10-142021-10-142828一、一、 相關(guān)系數(shù)相關(guān)系數(shù)(

21、correlation coefficient)22211fercijijijeijn ()式中:一個(gè)簡化的一個(gè)簡化的 2 2 2 2 列聯(lián)表列聯(lián)表2021-10-1429 相關(guān)系數(shù)相關(guān)系數(shù)( (原理分析原理分析) )因素因素Y因素因素 X合計(jì)合計(jì)x1x2y1aba + by2cdc + d合計(jì)合計(jì)a + cb + dnla、b、c、d均為條件頻數(shù)均為條件頻數(shù)l當(dāng)變量當(dāng)變量X,Y相互獨(dú)立,不存在相關(guān)關(guān)系時(shí),頻數(shù)間應(yīng)有下面的相互獨(dú)立,不存在相關(guān)關(guān)系時(shí),頻數(shù)間應(yīng)有下面的關(guān)系:關(guān)系:l化簡后有:化簡后有:l差值差值 的大小可以反映變量之間相關(guān)程度的高低。差的大小可以反映變量之間相關(guān)程度的高低。差值越

22、大,說明兩個(gè)變量的相關(guān)程度越高。值越大,說明兩個(gè)變量的相關(guān)程度越高。 系數(shù)就是以差值系數(shù)就是以差值為基礎(chǔ),實(shí)現(xiàn)對兩個(gè)變量相關(guān)程度的測量。為基礎(chǔ),實(shí)現(xiàn)對兩個(gè)變量相關(guān)程度的測量。2021-10-1430 相關(guān)系數(shù)相關(guān)系數(shù)( (原理分析原理分析) )abacbdadbcadbc列聯(lián)表中每個(gè)單元格的期望頻數(shù)分別為列聯(lián)表中每個(gè)單元格的期望頻數(shù)分別為2021-10-142021-10-143131 相關(guān)系數(shù)相關(guān)系數(shù)(原理分析原理分析)11211222()()()()()()()()ab acac cdeennab bdbd cdeenn將各期望頻數(shù)代入將各期望頻數(shù)代入 的計(jì)算公式得的計(jì)算公式得222221

23、1122122111221222()()()()()()()()()aebecedeeeeen adbcab cd ac bd將將 代入代入 相關(guān)系數(shù)的計(jì)算公式得相關(guān)系數(shù)的計(jì)算公式得2021-10-142021-10-143232 相關(guān)系數(shù)相關(guān)系數(shù)(原理分析原理分析)2()()()()adbcna b cd a c b dlad 等于等于 bc , = 0,表明變量,表明變量X 與與 Y 之間獨(dú)立之間獨(dú)立l若若 b=0 ,c=0,或,或a=0 ,d=0,意味著各觀察頻數(shù),意味著各觀察頻數(shù)全部落在對角線上,此時(shí)全部落在對角線上,此時(shí)| | =1,表明變量表明變量X 與與 Y 之之間完全相關(guān)間完全

24、相關(guān) 列聯(lián)表中變量的位置可以互換,列聯(lián)表中變量的位置可以互換, 的符號沒有的符號沒有實(shí)際意義,故取絕對值即可實(shí)際意義,故取絕對值即可用于測度大于用于測度大于2 2列聯(lián)表中數(shù)據(jù)的相關(guān)程度列聯(lián)表中數(shù)據(jù)的相關(guān)程度計(jì)算公式為計(jì)算公式為2021-10-142021-10-143333二、列聯(lián)二、列聯(lián)相關(guān)系數(shù)相關(guān)系數(shù)(coefficient ofcontingency)22CnlC 的取值范圍是的取值范圍是 0 C1lC = 0表明列聯(lián)表中的兩個(gè)變量獨(dú)立表明列聯(lián)表中的兩個(gè)變量獨(dú)立lC 的數(shù)值大小取決于列聯(lián)表的行數(shù)和列數(shù),的數(shù)值大小取決于列聯(lián)表的行數(shù)和列數(shù),并隨行數(shù)和列數(shù)的增大而增大并隨行數(shù)和列數(shù)的增大而增

25、大l根據(jù)不同行和列的列聯(lián)表計(jì)算的列聯(lián)系數(shù)不根據(jù)不同行和列的列聯(lián)表計(jì)算的列聯(lián)系數(shù)不便于比較便于比較計(jì)算公式為計(jì)算公式為2021-10-142021-10-143434三三、V 相關(guān)系數(shù)相關(guān)系數(shù)(V correlation coefficient)2min (1),(1)Vnrc2. V 的取值范圍是的取值范圍是 0 V 13. V = 0表明列聯(lián)表中的兩個(gè)變量獨(dú)立表明列聯(lián)表中的兩個(gè)變量獨(dú)立4. V=1表明列聯(lián)表中的兩個(gè)變量完全相關(guān)表明列聯(lián)表中的兩個(gè)變量完全相關(guān)5. 不同行和列的列聯(lián)表計(jì)算的列聯(lián)系數(shù)不便于比較不同行和列的列聯(lián)表計(jì)算的列聯(lián)系數(shù)不便于比較6. 當(dāng)列聯(lián)表中有一維為當(dāng)列聯(lián)表中有一維為2,m

26、in(r-1),(c-1)=1,此時(shí)此時(shí) V= 同一個(gè)列聯(lián)表,同一個(gè)列聯(lián)表, 、C、V 的結(jié)果會(huì)不同的結(jié)果會(huì)不同不同的列聯(lián)表,不同的列聯(lián)表, 、C、V 的結(jié)果也不同的結(jié)果也不同在對不同列聯(lián)表變量之間的相關(guān)程度進(jìn)行在對不同列聯(lián)表變量之間的相關(guān)程度進(jìn)行比較時(shí),不同列聯(lián)表中的行與行、列與列比較時(shí),不同列聯(lián)表中的行與行、列與列的個(gè)數(shù)要相同,并且采用同一種系數(shù)的個(gè)數(shù)要相同,并且采用同一種系數(shù)2021-10-142021-10-143535四四、 、C、V 的比較的比較2021-10-142021-10-143636列聯(lián)表中的相關(guān)測量列聯(lián)表中的相關(guān)測量(例題分析例題分析)【例例】一種原料來自三個(gè)不同地區(qū),

27、原料質(zhì)量被分成三個(gè)一種原料來自三個(gè)不同地區(qū),原料質(zhì)量被分成三個(gè)不同等級。從這批原料中隨機(jī)抽取不同等級。從這批原料中隨機(jī)抽取500件進(jìn)行檢驗(yàn),結(jié)果如件進(jìn)行檢驗(yàn),結(jié)果如下表。分別計(jì)算下表。分別計(jì)算 系數(shù)、系數(shù)、C系數(shù)和系數(shù)和V系數(shù),并分析相關(guān)程度系數(shù),并分析相關(guān)程度地區(qū)地區(qū)一級一級二級二級三級三級合計(jì)合計(jì)甲地區(qū)甲地區(qū)525264642424140140乙地區(qū)乙地區(qū)606059595252171171丙地區(qū)丙地區(qū)505065657474189189合計(jì)合計(jì)1621621881881501505005002021-10-142021-10-143737列聯(lián)表中的相關(guān)測量列聯(lián)表中的相關(guān)測量 (例題分析例

28、題分析)解:已知解:已知n=500, 19.82,列聯(lián)表為,列聯(lián)表為3 3結(jié)論:三個(gè)系數(shù)均不高,表明產(chǎn)地和原料等級之結(jié)論:三個(gè)系數(shù)均不高,表明產(chǎn)地和原料等級之 間的相關(guān)程度不高間的相關(guān)程度不高219.820.199500n2219.820.19519.82500Cn219.820.141min (1),(1)500 2Vnrc第四節(jié)第四節(jié) 列聯(lián)分析中應(yīng)注意的問題列聯(lián)分析中應(yīng)注意的問題一、條件百分表的方向一、條件百分表的方向二、二、 分布的期望準(zhǔn)則分布的期望準(zhǔn)則2021-10-142021-10-1438382對于具有因果關(guān)系的兩個(gè)品質(zhì)變量對于具有因果關(guān)系的兩個(gè)品質(zhì)變量X X與與Y Y,在列聯(lián)表

29、中的位置,在列聯(lián)表中的位置有習(xí)慣的處理,即將自變量有習(xí)慣的處理,即將自變量(X)(X)置于列的位置,將因變量置于列的位置,將因變量(Y)(Y)置于行的位置,這樣可以更好地表現(xiàn)原因?qū)Y(jié)果的影響。置于行的位置,這樣可以更好地表現(xiàn)原因?qū)Y(jié)果的影響。2021-10-1439一、條件百分表的方向一、條件百分表的方向價(jià)值取向價(jià)值取向Y職業(yè)職業(yè)X制造業(yè)制造業(yè)服務(wù)業(yè)服務(wù)業(yè)物質(zhì)報(bào)酬物質(zhì)報(bào)酬(%)105724556人情關(guān)系人情關(guān)系(%)40283544合計(jì)合計(jì)(%果因變量在樣本內(nèi)的分布不能代表其在總體內(nèi)的分布,例如果因變量在樣本內(nèi)的分布不能代表其在總體內(nèi)的分布,例如,為了滿足分析的需要,

30、抽樣時(shí)擴(kuò)大了因變量某項(xiàng)內(nèi)容的如,為了滿足分析的需要,抽樣時(shí)擴(kuò)大了因變量某項(xiàng)內(nèi)容的樣本量,這時(shí)若仍以自變量的方向計(jì)算百分表就會(huì)歪曲事實(shí)。樣本量,這時(shí)若仍以自變量的方向計(jì)算百分表就會(huì)歪曲事實(shí)。例如,社會(huì)學(xué)家欲研究家庭狀況(自變量)對青少年犯罪例如,社會(huì)學(xué)家欲研究家庭狀況(自變量)對青少年犯罪(因變量)的影響。該地區(qū)有未犯罪記錄的青少年(因變量)的影響。該地區(qū)有未犯罪記錄的青少年1000010000名,名,犯罪記錄的青少年犯罪記錄的青少年150150名。如果從未犯罪青少年中抽取名。如果從未犯罪青少年中抽取1%1%,即即100100名進(jìn)行研究,按相同比例從犯罪青少年中抽取的樣本名進(jìn)行研究,按相同比例從

31、犯罪青少年中抽取的樣本量僅為量僅為1.51.5人。顯然,這樣少的樣本量無法滿足研究的需要。人。顯然,這樣少的樣本量無法滿足研究的需要。故要擴(kuò)大犯罪青少年的樣本量,如擴(kuò)大到故要擴(kuò)大犯罪青少年的樣本量,如擴(kuò)大到50%50%。調(diào)查結(jié)果:。調(diào)查結(jié)果:2021-10-1440條件百分表的方向(特殊情況)條件百分表的方向(特殊情況)青少年行為青少年行為家庭狀況家庭狀況合計(jì)合計(jì)完整家庭完整家庭離異家庭離異家庭犯罪犯罪383775未犯罪未犯罪928100合計(jì)合計(jì)130451752021-10-1441條件百分表的方向(例題數(shù)據(jù))條件百分表的方向(例題數(shù)據(jù))觀察數(shù)據(jù)觀察數(shù)據(jù)青少年行為青少年行為家庭狀況家庭狀況完整家庭完整家庭離異家庭離異家庭犯罪(犯罪(%)2982未犯罪(未犯罪(%)7118合計(jì)(人)合計(jì)(人)13045條件百分表?xiàng)l件百分表從條件百分表可知,完整家庭犯罪青少年所占比重為從條件百分表可知,完整家庭犯罪青少年所占比重為29%29%,離異家庭犯罪青少年所占比重為離異家庭犯罪青少年所占比重為82%82%,兩者過高的比重令人,兩者過高的比重令人懷疑。其原因是擴(kuò)大了犯罪青少年的抽取數(shù)量。如果此時(shí)按懷疑。其原因是擴(kuò)大了犯罪青少年的抽取數(shù)量。如果此時(shí)按因變量方向編制條件百分表,則得如下結(jié)果:因變量方向編制條件百分表,則得如下

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論