第三講雙變量分析1_第1頁(yè)
第三講雙變量分析1_第2頁(yè)
第三講雙變量分析1_第3頁(yè)
第三講雙變量分析1_第4頁(yè)
第三講雙變量分析1_第5頁(yè)
已閱讀5頁(yè),還剩89頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第三講第三講 雙變量的統(tǒng)計(jì)分析雙變量的統(tǒng)計(jì)分析n單變量的分析和統(tǒng)計(jì)描述,是我們了解和認(rèn)識(shí)單變量的分析和統(tǒng)計(jì)描述,是我們了解和認(rèn)識(shí)社會(huì)現(xiàn)象的基礎(chǔ)。社會(huì)現(xiàn)象的基礎(chǔ)。n但社會(huì)生活中的現(xiàn)象并不是孤立存在的,現(xiàn)象但社會(huì)生活中的現(xiàn)象并不是孤立存在的,現(xiàn)象之間往往存在或多或少的關(guān)系,或者說(shuō),社會(huì)之間往往存在或多或少的關(guān)系,或者說(shuō),社會(huì)現(xiàn)象之間往往是相互聯(lián)系、相互影響、相互依現(xiàn)象之間往往是相互聯(lián)系、相互影響、相互依存的。存的。n“學(xué)好數(shù)理化,走遍天下都不怕學(xué)好數(shù)理化,走遍天下都不怕”n“學(xué)好數(shù)理化,不如有個(gè)好爸爸學(xué)好數(shù)理化,不如有個(gè)好爸爸”變量之間的關(guān)系變量之間的關(guān)系n兩個(gè)變量之間的關(guān)系兩個(gè)變量之間的關(guān)系n多

2、個(gè)變量之間的關(guān)系多個(gè)變量之間的關(guān)系n在多數(shù)情況下,多個(gè)變量之間的關(guān)系又可以分在多數(shù)情況下,多個(gè)變量之間的關(guān)系又可以分解為若干個(gè)兩個(gè)變量之間的關(guān)系,也就是說(shuō)多解為若干個(gè)兩個(gè)變量之間的關(guān)系,也就是說(shuō)多個(gè)變量之間的關(guān)系可以通過(guò)若干個(gè)兩個(gè)變量間個(gè)變量之間的關(guān)系可以通過(guò)若干個(gè)兩個(gè)變量間的關(guān)系來(lái)描述。的關(guān)系來(lái)描述。 n進(jìn)一步了解社會(huì)現(xiàn)象發(fā)生和變化的原因,揭示進(jìn)一步了解社會(huì)現(xiàn)象發(fā)生和變化的原因,揭示社會(huì)現(xiàn)象的發(fā)展規(guī)律,探索和發(fā)現(xiàn)現(xiàn)象之間的社會(huì)現(xiàn)象的發(fā)展規(guī)律,探索和發(fā)現(xiàn)現(xiàn)象之間的關(guān)系,才是大多數(shù)社會(huì)研究的主要目的,而這關(guān)系,才是大多數(shù)社會(huì)研究的主要目的,而這則需要對(duì)兩個(gè)變量或多個(gè)變量之間的關(guān)系進(jìn)行則需要對(duì)兩個(gè)

3、變量或多個(gè)變量之間的關(guān)系進(jìn)行分析。分析。 雙變量的描述技術(shù)n交互分類(lèi)與交互分類(lèi)表n相關(guān)測(cè)量法一、交互分類(lèi)與交互分類(lèi)表一、交互分類(lèi)與交互分類(lèi)表n交互分類(lèi)就是將調(diào)查所得的一組數(shù)據(jù)按照兩交互分類(lèi)就是將調(diào)查所得的一組數(shù)據(jù)按照兩個(gè)不同的變量進(jìn)行綜合分類(lèi)。通常以交互分個(gè)不同的變量進(jìn)行綜合分類(lèi)。通常以交互分類(lèi)表(列聯(lián)表)的形式出現(xiàn),如表類(lèi)表(列聯(lián)表)的形式出現(xiàn),如表1:交互分析的作用交互分析的作用如表如表3,我們只能得出贊成和反對(duì)的人大致相等,我們只能得出贊成和反對(duì)的人大致相等的結(jié)論的結(jié)論實(shí)際從不同性別來(lái)看,男性和女性之間存在很實(shí)際從不同性別來(lái)看,男性和女性之間存在很大的差異大的差異n思考:思考:兩個(gè)表格所

4、顯兩個(gè)表格所顯示信息的差示信息的差異異交互分析的作用交互分析的作用n較為深入的描述樣本資料的分布狀況較為深入的描述樣本資料的分布狀況和內(nèi)在結(jié)構(gòu);和內(nèi)在結(jié)構(gòu); n進(jìn)行分組比較;進(jìn)行分組比較;n對(duì)變量之間的關(guān)系進(jìn)行分析和解釋。對(duì)變量之間的關(guān)系進(jìn)行分析和解釋。交互分類(lèi)表的形式要求交互分類(lèi)表的形式要求每個(gè)表的頂端要有每個(gè)表的頂端要有表號(hào)和標(biāo)題表號(hào)和標(biāo)題線條規(guī)范、簡(jiǎn)潔,最好不用豎線線條規(guī)范、簡(jiǎn)潔,最好不用豎線百分比符號(hào)的處理:百分比符號(hào)的處理:一種在表頂端的右角;另一種在表中一種在表頂端的右角;另一種在表中每一列數(shù)字的上方每一列數(shù)字的上方表的下端用括號(hào)標(biāo)出每一列的頻數(shù)表的下端用括號(hào)標(biāo)出每一列的頻數(shù)兩個(gè)變

5、量的安排:通常是將自變量、或被看作自變量或用兩個(gè)變量的安排:通常是將自變量、或被看作自變量或用來(lái)做解釋的變量放在上面(列),將因變量、或被看作因來(lái)做解釋的變量放在上面(列),將因變量、或被看作因變量、或被解釋的那個(gè)變量放在表的左側(cè)(行)。變量、或被解釋的那個(gè)變量放在表的左側(cè)(行)。變量取值不宜太多。如變量取值不宜太多。如4個(gè)自變量,個(gè)自變量,5個(gè)因變量就是個(gè)因變量就是20個(gè)個(gè)百分比百分比少數(shù)點(diǎn)的位數(shù)要一致。如少數(shù)點(diǎn)的位數(shù)要一致。如67.3和和50.0必須要進(jìn)行假設(shè)檢驗(yàn)(多選變量的分析可以沒(méi)有)必須要進(jìn)行假設(shè)檢驗(yàn)(多選變量的分析可以沒(méi)有)二、相關(guān)關(guān)系(二、相關(guān)關(guān)系(correlation)n兩變

6、量間的相關(guān)關(guān)系指的是一個(gè)變量的值與另一兩變量間的相關(guān)關(guān)系指的是一個(gè)變量的值與另一個(gè)變量有連帶關(guān)系。也就是,當(dāng)一個(gè)變量發(fā)生變個(gè)變量有連帶關(guān)系。也就是,當(dāng)一個(gè)變量發(fā)生變化時(shí)(或取值不同時(shí)),另一個(gè)變量也隨之發(fā)生化時(shí)(或取值不同時(shí)),另一個(gè)變量也隨之發(fā)生變化。(變化。(P68)如:如:文化程度文化程度 收入期望收入期望女性的文化程度女性的文化程度 生育期望生育期望1、相關(guān)的性質(zhì)、相關(guān)的性質(zhì)(1)相關(guān)關(guān)系的強(qiáng)度)相關(guān)關(guān)系的強(qiáng)度相關(guān)程度,指的是相關(guān)關(guān)系的強(qiáng)弱或大小。相關(guān)關(guān)系的相關(guān)程度,指的是相關(guān)關(guān)系的強(qiáng)弱或大小。相關(guān)關(guān)系的強(qiáng)弱或大小可以用統(tǒng)計(jì)法進(jìn)行測(cè)量。變量間相關(guān)關(guān)系強(qiáng)弱或大小可以用統(tǒng)計(jì)法進(jìn)行測(cè)量。變量

7、間相關(guān)關(guān)系的統(tǒng)計(jì)結(jié)果稱(chēng)為相關(guān)系數(shù)。的統(tǒng)計(jì)結(jié)果稱(chēng)為相關(guān)系數(shù)。相關(guān)關(guān)系的程度介于相關(guān)關(guān)系的程度介于0,1之間,之間,0代表無(wú)相關(guān),代表無(wú)相關(guān),1 代表代表全相關(guān),數(shù)值越大,表示相關(guān)的程度愈強(qiáng)。全相關(guān),數(shù)值越大,表示相關(guān)的程度愈強(qiáng)。兩點(diǎn)說(shuō)明:1.在對(duì)社會(huì)現(xiàn)象和社會(huì)行為的調(diào)查中,一般來(lái)說(shuō)各種相在對(duì)社會(huì)現(xiàn)象和社會(huì)行為的調(diào)查中,一般來(lái)說(shuō)各種相關(guān)系數(shù)的值不可能達(dá)到關(guān)系數(shù)的值不可能達(dá)到1或一或一1)。也就是說(shuō),在社。也就是說(shuō),在社會(huì)研究中不可能存在兩個(gè)完全相關(guān)的事物或現(xiàn)象會(huì)研究中不可能存在兩個(gè)完全相關(guān)的事物或現(xiàn)象2. 相關(guān)系數(shù)只是用來(lái)表示變量間相關(guān)程度的指標(biāo),而不相關(guān)系數(shù)只是用來(lái)表示變量間相關(guān)程度的指標(biāo),而不

8、是相關(guān)數(shù)值的等單位度量。是相關(guān)數(shù)值的等單位度量。如不能說(shuō)相關(guān)系數(shù)如不能說(shuō)相關(guān)系數(shù)0.6是相關(guān)系數(shù)是相關(guān)系數(shù)0.3的的2倍,只能說(shuō)相倍,只能說(shuō)相關(guān)系數(shù)關(guān)系數(shù)0.6的兩個(gè)變量的關(guān)系比相關(guān)系數(shù)的兩個(gè)變量的關(guān)系比相關(guān)系數(shù)0.3的兩個(gè)變的兩個(gè)變量的關(guān)系更強(qiáng)。量的關(guān)系更強(qiáng)。(2)相關(guān)關(guān)系的方向()相關(guān)關(guān)系的方向(+、-)n正相關(guān)關(guān)系和負(fù)相關(guān)關(guān)系正相關(guān)關(guān)系和負(fù)相關(guān)關(guān)系n正相關(guān)關(guān)系:一個(gè)變量的取值增加時(shí),另一個(gè)變正相關(guān)關(guān)系:一個(gè)變量的取值增加時(shí),另一個(gè)變量的取值也增加,反之亦然;量的取值也增加,反之亦然;n人們的文化程度越高,他們的收入水平也越人們的文化程度越高,他們的收入水平也越高;文化程度較低的人,他們的

9、收入水平也高;文化程度較低的人,他們的收入水平也普遍較低。反之,那些收入水平較低的人,普遍較低。反之,那些收入水平較低的人,他們的文化程度一般來(lái)說(shuō)也較低。他們的文化程度一般來(lái)說(shuō)也較低。 n負(fù)相關(guān)關(guān)系:一個(gè)變量的取值增加時(shí),另一個(gè)變負(fù)相關(guān)關(guān)系:一個(gè)變量的取值增加時(shí),另一個(gè)變量的取值減少;而一個(gè)變量的值減少時(shí),另一個(gè)量的取值減少;而一個(gè)變量的值減少時(shí),另一個(gè)變量值的增加。變量值的增加。n在調(diào)查中發(fā)現(xiàn),文化程度越高的被調(diào)查者,在回答問(wèn)在調(diào)查中發(fā)現(xiàn),文化程度越高的被調(diào)查者,在回答問(wèn)卷時(shí),花費(fèi)的時(shí)間越少,而文化程度較低的被調(diào)查者,卷時(shí),花費(fèi)的時(shí)間越少,而文化程度較低的被調(diào)查者,填答問(wèn)卷時(shí)花費(fèi)的時(shí)間較長(zhǎng)。

10、在此,我們可以說(shuō)文化填答問(wèn)卷時(shí)花費(fèi)的時(shí)間較長(zhǎng)。在此,我們可以說(shuō)文化程度和問(wèn)卷填答時(shí)間之間存在著負(fù)相關(guān)關(guān)系。程度和問(wèn)卷填答時(shí)間之間存在著負(fù)相關(guān)關(guān)系。 注意:方向的分析只適用于定序以上層次的變量注意:方向的分析只適用于定序以上層次的變量(3)相關(guān)關(guān)系的對(duì)稱(chēng)性與非對(duì)稱(chēng)性)相關(guān)關(guān)系的對(duì)稱(chēng)性與非對(duì)稱(chēng)性相關(guān)的兩個(gè)變量,不一定有因果關(guān)系,相關(guān)的兩個(gè)變量,不一定有因果關(guān)系,可能是共同變化。可能是共同變化。n不對(duì)稱(chēng)關(guān)系不對(duì)稱(chēng)關(guān)系:自變量:自變量X影響因變量影響因變量Y,但是,但是因變量因變量Y不會(huì)影響不會(huì)影響X-因果關(guān)系因果關(guān)系,如施肥量和小麥產(chǎn)量之間的關(guān)系如施肥量和小麥產(chǎn)量之間的關(guān)系n對(duì)稱(chēng)關(guān)系對(duì)稱(chēng)關(guān)系:不能確

11、定或區(qū)分兩個(gè)變量的方向。:不能確定或區(qū)分兩個(gè)變量的方向。如交往的多少與他們的互愛(ài)程度如交往的多少與他們的互愛(ài)程度因果關(guān)系因果關(guān)系n大多數(shù)的社會(huì)研究,都涉及因果關(guān)系的概念,社大多數(shù)的社會(huì)研究,都涉及因果關(guān)系的概念,社會(huì)研究的最終目的,往往在于希望獲得某些社會(huì)會(huì)研究的最終目的,往往在于希望獲得某些社會(huì)現(xiàn)象間因果關(guān)系的知識(shí)。現(xiàn)象間因果關(guān)系的知識(shí)。n如如“受教育程度與人們的職業(yè)獲得的研究受教育程度與人們的職業(yè)獲得的研究”、“不同職業(yè)的被調(diào)查者收入的差異不同職業(yè)的被調(diào)查者收入的差異”-首先認(rèn)為首先認(rèn)為這些變量之間存在因果關(guān)系。這些變量之間存在因果關(guān)系。n研究的目的在于辨明這些研究的因果關(guān)系狀態(tài)研究的目的

12、在于辨明這些研究的因果關(guān)系狀態(tài)舉例:相關(guān)關(guān)系與因果關(guān)系的區(qū)分夏天太陽(yáng)鏡的銷(xiāo)量與雪糕的銷(xiāo)量火災(zāi)造成的損失與救火人數(shù)降雪量與交通事故發(fā)生的關(guān)系人的身高與年齡之間的關(guān)系受教育程度與收入 外商投資與經(jīng)濟(jì)增長(zhǎng)個(gè)人努力與學(xué)習(xí)成績(jī)(4)相關(guān)的類(lèi)型)相關(guān)的類(lèi)型n相關(guān)關(guān)系是一種數(shù)量關(guān)系上不很?chē)?yán)格的相互依相關(guān)關(guān)系是一種數(shù)量關(guān)系上不很?chē)?yán)格的相互依存關(guān)系。存關(guān)系。n如果這種關(guān)系近似地表現(xiàn)為一條直線,就稱(chēng)為如果這種關(guān)系近似地表現(xiàn)為一條直線,就稱(chēng)為直線相關(guān),又稱(chēng)線性相關(guān);直線相關(guān),又稱(chēng)線性相關(guān);n如果這個(gè)關(guān)系近似地表現(xiàn)為一條曲線,則稱(chēng)為如果這個(gè)關(guān)系近似地表現(xiàn)為一條曲線,則稱(chēng)為曲線相關(guān),又稱(chēng)非線性相關(guān)。曲線相關(guān),又稱(chēng)非線性

13、相關(guān)。n雖然在自然界和社會(huì)生活中,曲線相關(guān)現(xiàn)象遠(yuǎn)雖然在自然界和社會(huì)生活中,曲線相關(guān)現(xiàn)象遠(yuǎn)比直線相關(guān)更多,但由于數(shù)學(xué)手段上的局限性,比直線相關(guān)更多,但由于數(shù)學(xué)手段上的局限性,社會(huì)統(tǒng)計(jì)研究中多以闡述線性(直線)相關(guān)為社會(huì)統(tǒng)計(jì)研究中多以闡述線性(直線)相關(guān)為主。主。 n如何來(lái)測(cè)量相關(guān)系數(shù)呢?有兩個(gè)標(biāo)準(zhǔn):n選用統(tǒng)計(jì)值有意義的相關(guān)測(cè)量法,在統(tǒng)計(jì)學(xué)中有一組相關(guān)測(cè)量法,具有消減誤差比例的意義,稱(chēng)為PRE測(cè)量法n要注意變量的不同層次,屬于不同測(cè)量層次的變量,就要用不同的相關(guān)測(cè)量法。 (5)削減誤差比例)削減誤差比例可以表示兩個(gè)變量間關(guān)系的強(qiáng)弱可以表示兩個(gè)變量間關(guān)系的強(qiáng)弱消減誤差比例消減誤差比例(PRE測(cè)量,測(cè)

14、量,Proportionate reduction in error):我們?cè)陬A(yù)測(cè)或解釋社會(huì)):我們?cè)陬A(yù)測(cè)或解釋社會(huì)現(xiàn)象現(xiàn)象y時(shí),難免會(huì)有誤差(錯(cuò)誤),假定另一種時(shí),難免會(huì)有誤差(錯(cuò)誤),假定另一種社會(huì)現(xiàn)象社會(huì)現(xiàn)象x與與y是有關(guān)系的,我們可以根據(jù)是有關(guān)系的,我們可以根據(jù)x的值的值來(lái)預(yù)測(cè)來(lái)預(yù)測(cè)y的值,理應(yīng)可以減少若干誤差,其值表的值,理應(yīng)可以減少若干誤差,其值表示的就是示的就是x對(duì)對(duì)y的誤差的消減程度的誤差的消減程度理解:理解:x對(duì)對(duì)y的可認(rèn)知程度的可認(rèn)知程度n如假定不知道如假定不知道x的值,我們?cè)谡J(rèn)識(shí)的值,我們?cè)谡J(rèn)識(shí)y時(shí)的全部時(shí)的全部誤差是誤差是E1。我們知道我們知道x的值,可以根據(jù)的值,可以

15、根據(jù)x的值的值來(lái)認(rèn)識(shí)來(lái)認(rèn)識(shí)y的值時(shí)的誤差的總數(shù)的值時(shí)的誤差的總數(shù)(不可認(rèn)知的部不可認(rèn)知的部分)為分)為E2,那么用,那么用x的值來(lái)預(yù)測(cè)的值來(lái)預(yù)測(cè)y的值時(shí)減少的值時(shí)減少的誤差就是的誤差就是E1-E2,這個(gè)值(,這個(gè)值( E1-E2 )與)與y全全部誤差的比例,則稱(chēng)謂消減了的誤差比例部誤差的比例,則稱(chēng)謂消減了的誤差比例121EEEPRE Y右圖紅色表示右圖紅色表示E1-E2,E1nPRE的數(shù)值越大,表示以x值預(yù)測(cè)y值時(shí),減少的誤差所占的比例越大,說(shuō)明x與y的關(guān)系越強(qiáng)。121EE EPRE PRE值的意義:值的意義:1、PRE的值在的值在0,12、E2=0,則,則PRE=1,x與與y是全相關(guān),用是全

16、相關(guān),用x解釋解釋y時(shí)不會(huì)產(chǎn)生誤差時(shí)不會(huì)產(chǎn)生誤差3、E1=E2,則,則PRE=0,x與與y是無(wú)相關(guān),是無(wú)相關(guān),用用x來(lái)預(yù)測(cè)來(lái)預(yù)測(cè)y時(shí)產(chǎn)生的誤差等于不用時(shí)產(chǎn)生的誤差等于不用x來(lái)來(lái)預(yù)測(cè)預(yù)測(cè)y時(shí)的誤差時(shí)的誤差4、如、如PRE=0.8,表示用,表示用x預(yù)測(cè)預(yù)測(cè)y可以減少可以減少80%的誤差,也反映了兩者的相關(guān)程度的誤差,也反映了兩者的相關(guān)程度頗高;如果頗高;如果PRE=0.08,則表示只能減,則表示只能減少少8%的誤差,即的誤差,即x對(duì)對(duì)y的影響甚小,需的影響甚小,需要尋找其他的變量解釋或預(yù)測(cè)要尋找其他的變量解釋或預(yù)測(cè)y121EEEPRE強(qiáng)調(diào):PRE值的兩個(gè)意義n用一個(gè)變量預(yù)測(cè)另一個(gè)變量能消減的誤用一

17、個(gè)變量預(yù)測(cè)另一個(gè)變量能消減的誤差比例差比例n兩個(gè)變量之間關(guān)系的大小兩個(gè)變量之間關(guān)系的大小課堂提問(wèn)n1.交互分類(lèi)表(即列聯(lián)表)的作用是什么?n2.相關(guān)的性質(zhì)是什么?(三個(gè)方面)n3.為什么說(shuō)PRE測(cè)量法可以反映兩個(gè)變量之間關(guān)系的強(qiáng)弱?學(xué)習(xí)提示:n相關(guān)測(cè)量法的學(xué)習(xí)請(qǐng)把握以下幾點(diǎn):n不需要在公式的推演和具體的計(jì)算上下功夫,這些用軟件就可以操作。n必須記牢不同的變量層次對(duì)應(yīng)的相關(guān)測(cè)量法(即相關(guān)系數(shù)統(tǒng)計(jì)量)n必須理解各種相關(guān)系數(shù)的意義并能解釋計(jì)算出的結(jié)果三、相關(guān)測(cè)量法n相關(guān)測(cè)量法,是用一個(gè)統(tǒng)計(jì)值來(lái)表示變量和變量之間的關(guān)系。這個(gè)統(tǒng)計(jì)值,通常稱(chēng)為相關(guān)系數(shù)(coefficient of association

18、)。相關(guān)測(cè)量法有很多種,在進(jìn)行選擇時(shí),主要依據(jù)以下法則:n兩個(gè)變量的測(cè)量層次;n兩個(gè)變量的影響方向(是否對(duì)稱(chēng));n盡可能選擇有消減誤差比例意義的相關(guān)測(cè)量法。n盡可能用PRE測(cè)量法:社會(huì)學(xué)不但要描述社會(huì)現(xiàn)象,最重要的是要解釋和預(yù)測(cè)社會(huì)現(xiàn)象。研究中之所以要探討兩個(gè)變量之間的關(guān)系,是為了減少解釋或預(yù)測(cè)時(shí)的錯(cuò)誤。消減誤差比例,就是用一個(gè)變量x預(yù)測(cè)另一個(gè)變量y時(shí)消減的誤差的量化測(cè)量。因此,在測(cè)量?jī)蓚€(gè)變量之間的關(guān)系時(shí),應(yīng)盡可能選擇有消減誤差比例意義的測(cè)量方法。n另外,在測(cè)量?jī)蓚€(gè)變量關(guān)系時(shí),最主要的法則是遵循變量的測(cè)量層次,即嚴(yán)格依據(jù)變量的層次選擇合適的相關(guān)測(cè)量法。n次要的準(zhǔn)則,是注意兩個(gè)變量之間的對(duì)稱(chēng)和非

19、對(duì)稱(chēng)關(guān)系。對(duì)于這一點(diǎn),最好要遵守,但不用過(guò)分強(qiáng)求。變量的層次與相關(guān)測(cè)量法n社會(huì)學(xué)研究中最經(jīng)常遇到的是定類(lèi)、定序和定距三類(lèi)變量,這三類(lèi)變量在分析兩個(gè)變量的關(guān)系時(shí),會(huì)產(chǎn)生以下六種情況;n (1)定類(lèi)變量一定類(lèi)變量;n (2)定序變量一定序變量;n (3)定距變量一定距變量;n (4)定類(lèi)變量一定序變量;n (5)定類(lèi)變量一定距變量;n (6)定序變量一定距變量。n 下面分別介紹這幾種不同測(cè)量層次變量的相關(guān)測(cè)量法。相關(guān)測(cè)量法是什么?(一)兩個(gè)定類(lèi)變量:(一)兩個(gè)定類(lèi)變量:Lambda,tau-y(都是(都是PRE測(cè)量法)測(cè)量法)1、Lambdan基本邏輯:基本邏輯:如果兩個(gè)定類(lèi)變量相關(guān),以一個(gè)如果兩

20、個(gè)定類(lèi)變量相關(guān),以一個(gè)變量的值來(lái)預(yù)測(cè)另一個(gè)變量的值時(shí),倘若用變量的值來(lái)預(yù)測(cè)另一個(gè)變量的值時(shí),倘若用眾值來(lái)預(yù)測(cè),可以減少多少誤差。眾值來(lái)預(yù)測(cè),可以減少多少誤差。n消減的誤差在全部誤差中所占的比例越消減的誤差在全部誤差中所占的比例越大,就表示兩個(gè)變量的相關(guān)越強(qiáng)大,就表示兩個(gè)變量的相關(guān)越強(qiáng)公式:公式:(1)、不對(duì)稱(chēng)形式)、不對(duì)稱(chēng)形式:My=Y變項(xiàng)的眾數(shù)次數(shù)變項(xiàng)的眾數(shù)次數(shù)my=X變項(xiàng)的每個(gè)值(類(lèi)別)之下變項(xiàng)的每個(gè)值(類(lèi)別)之下Y變項(xiàng)的眾數(shù)的次數(shù)變項(xiàng)的眾數(shù)的次數(shù)n=全部個(gè)案數(shù)全部個(gè)案數(shù)n-My=不知道不知道x值的情況下預(yù)測(cè)值的情況下預(yù)測(cè)Y值產(chǎn)生的誤差值產(chǎn)生的誤差分子分子E1-E2=(n-My)-(n-m

21、y)= my-MyyyyymMnM例例1:分析性別與理想志愿之間的關(guān)系:分析性別與理想志愿之間的關(guān)系4030500.4010050yyyymMnM(2 2)對(duì)稱(chēng)形式:不確定兩個(gè)變量的影響方向)對(duì)稱(chēng)形式:不確定兩個(gè)變量的影響方向My=Y變項(xiàng)的眾數(shù)次數(shù)變項(xiàng)的眾數(shù)次數(shù)Mx=X變項(xiàng)的眾數(shù)次數(shù)變項(xiàng)的眾數(shù)次數(shù)mx=Y變項(xiàng)的每個(gè)值(類(lèi)別)之下變項(xiàng)的每個(gè)值(類(lèi)別)之下X變項(xiàng)的眾數(shù)次數(shù)變項(xiàng)的眾數(shù)次數(shù)my=X變項(xiàng)的每個(gè)值(類(lèi)別)之下變項(xiàng)的每個(gè)值(類(lèi)別)之下Y變項(xiàng)的眾數(shù)次數(shù)變項(xiàng)的眾數(shù)次數(shù)n=全部個(gè)案數(shù)全部個(gè)案數(shù)()2()xyxyxymmMMnMM例:青年的教育期望與父母的教育期望例:青年的教育期望與父母的教育期望(

22、)2()(28414)(28417)(5450)2 *100(5450)0.47xyxyxymmMMnMMn不足:相關(guān)測(cè)量法,是以眾數(shù)作為測(cè)量的準(zhǔn)則,不理會(huì)眾數(shù)以外的頻數(shù)分布,因此,如果眾數(shù)全部集中在交互分類(lèi)表中的同一列或同一行中,則系數(shù)便會(huì)等于0,如表114所示的數(shù)據(jù)。n這一結(jié)果表示性別與就業(yè)取向是沒(méi)有關(guān)系的,但從交互分類(lèi)表中可以看出,性別和就業(yè)取向或多或少還是有關(guān)系的。之所以出現(xiàn)相關(guān)系數(shù)為零這樣的結(jié)果,主要是因?yàn)楸碇械谋姅?shù)都在同一行。為了彌補(bǔ)相關(guān)測(cè)量法的這類(lèi)不足之處有些研究者就采用古德曼和古魯斯卡的相關(guān)系數(shù)測(cè)量?jī)蓚€(gè)定類(lèi)變量的相關(guān)程度。特例:如下表,特例:如下表,72.4%的制造業(yè)工人和的制

23、造業(yè)工人和64.3%的服的服務(wù)業(yè)人員注重物質(zhì)報(bào)酬,職業(yè)類(lèi)型與價(jià)值取向是務(wù)業(yè)人員注重物質(zhì)報(bào)酬,職業(yè)類(lèi)型與價(jià)值取向是略有影響的,但是略有影響的,但是(10545)1500215120yyyymMnM2、tau-yn不對(duì)稱(chēng)測(cè)量法不對(duì)稱(chēng)測(cè)量法n系數(shù)值介于系數(shù)值介于0-1之間之間n計(jì)算系數(shù)時(shí)包括了所有的邊緣次數(shù)和條件次計(jì)算系數(shù)時(shí)包括了所有的邊緣次數(shù)和條件次數(shù)數(shù)n如果是不對(duì)稱(chēng)關(guān)系最好選用如果是不對(duì)稱(chēng)關(guān)系最好選用tau-y計(jì)算計(jì)算計(jì)算過(guò)程:先求出計(jì)算過(guò)程:先求出E1和和E2,計(jì)算消減誤差的比例,計(jì)算消減誤差的比例121EEtauyE1()yynFFEn2()xxFffEFn=全部個(gè)案數(shù)目全部個(gè)案數(shù)目f=某條

24、件次數(shù)某條件次數(shù)Fy=Y變項(xiàng)的某個(gè)邊緣次數(shù)變項(xiàng)的某個(gè)邊緣次數(shù)Fx=X變項(xiàng)的某個(gè)邊緣次數(shù)變項(xiàng)的某個(gè)邊緣次數(shù)58 450.22458tauy140(10040)50(10050)10(100 10)58100100100E210(60 10)40(6040) 10(60 10)30(4030) 10(40 10)0(400)456040E前例:2()(145 105)*105(14540)*40(7045)*45(7025)*251457090.07xxFf fEF121136.0590.070.34136.05EEtauyE1()(215 150) 150(21565) 65136.052152

25、15nFy FyEn(二)兩個(gè)定序變量:(二)兩個(gè)定序變量:Gamma、 dyn對(duì)稱(chēng)關(guān)系:對(duì)稱(chēng)關(guān)系:Gamman不對(duì)稱(chēng)關(guān)系:薩默斯不對(duì)稱(chēng)關(guān)系:薩默斯dyn系數(shù)值系數(shù)值-1,+1n系數(shù)值既表示相關(guān)的程度,也表示相關(guān)的方系數(shù)值既表示相關(guān)的程度,也表示相關(guān)的方向,還具有消減誤差比例的意義向,還具有消減誤差比例的意義n基本邏輯:根據(jù)任何兩個(gè)個(gè)案在某變項(xiàng)上的基本邏輯:根據(jù)任何兩個(gè)個(gè)案在某變項(xiàng)上的等級(jí)來(lái)預(yù)測(cè)他們?cè)诹硪粋€(gè)變量上的等級(jí)來(lái)預(yù)測(cè)他們?cè)诹硪粋€(gè)變量上的等級(jí)等級(jí)時(shí),時(shí),可以減少的誤差是多少,它是以每對(duì)個(gè)案取可以減少的誤差是多少,它是以每對(duì)個(gè)案取值的等級(jí)作為預(yù)測(cè)準(zhǔn)則的。值的等級(jí)作為預(yù)測(cè)準(zhǔn)則的。n級(jí)序相關(guān)法

26、是成對(duì)考慮個(gè)案之間的關(guān)系,那么先來(lái)看一下有關(guān)“對(duì)”的概念。n假定研究青年的學(xué)歷水平和工資等級(jí)的關(guān)系,將學(xué)歷水平分為低、中、高三個(gè)等級(jí),取值分別為1、2、3,工資等級(jí)也分為低、中、高三個(gè)等級(jí),取值分別為1、2、3,n那么我們就可以知道每個(gè)被調(diào)查者的基本情況(如表115所示)。n 3X同分對(duì)(same graded pair on X)n x同分對(duì)指的是兩個(gè)個(gè)案在x變量上的等級(jí)是相同的,區(qū)分不出高低,通常用Tx表示。n4Y同分對(duì)(same graded pair on Y)ny同分對(duì)是指兩個(gè)個(gè)案在y變量上的等級(jí)是相同的,通常用Ty表示。n 5x、Y同分對(duì)(same graded pair on X

27、 and Y)n x、 Y同分對(duì)是指兩個(gè)個(gè)案在x和y變量上的等級(jí)都是相同的,通常用T x y表示。1、對(duì)稱(chēng)關(guān)系:、對(duì)稱(chēng)關(guān)系: GammanGamma的計(jì)算公式:sdsdNNGNNnNs=f11(f22+f23+f32+f33)+f12(f23+f33)+f21(f32+f33)+f22*f33nNS=12(30+5+16+12)+10(5+12)+8(16+12)+30*12=1510Nd=f13(f21+f22+f31+f32)+f12(f21+f31)+f23(f31+f32)+f22*f31Nd=3(30+8+16+4)+10(8+4)+5(4+16)+304=5141510-5140.

28、4921510+514sdsdNNGNNn工人的文化程度和收入水平成正相關(guān)關(guān)系工人的文化程度和收入水平成正相關(guān)關(guān)系n相關(guān)程度是相關(guān)程度是0.492n用工人的文化程度來(lái)解釋工人的收入水平時(shí)用工人的文化程度來(lái)解釋工人的收入水平時(shí)可以減少可以減少49.2%的誤差的誤差2、非對(duì)稱(chēng)關(guān)系:薩默斯、非對(duì)稱(chēng)關(guān)系:薩默斯dyndy屬于非對(duì)稱(chēng)相關(guān)測(cè)量屬于非對(duì)稱(chēng)相關(guān)測(cè)量nTy是指因變量是同序?qū)Φ膶?duì)數(shù)。(分母表是指因變量是同序?qū)Φ膶?duì)數(shù)。(分母表示的是示的是Y所有的誤差)同一橫行次數(shù)的乘積所有的誤差)同一橫行次數(shù)的乘積sdsdyNNdyNNT例nNs=23(55+24+28+27)+11(27+24)+20(28+24

29、)+5524=6003nNd=4(11+55+8+27)+20(11+8)+28(8+27)+558=2204nTy=23(20+4)+204+11(55+29)+5528+8(27+24)+2724=41416003-22040.3086003+2204+4141sdysdyN NdN N Tn注意:原則上對(duì)稱(chēng)分析用注意:原則上對(duì)稱(chēng)分析用Gamma,不,不對(duì)稱(chēng)分析用對(duì)稱(chēng)分析用dy,但在實(shí)際的運(yùn)用中,但在實(shí)際的運(yùn)用中,一些不對(duì)稱(chēng)分析中(區(qū)分了自變量和一些不對(duì)稱(chēng)分析中(區(qū)分了自變量和因變量)也用因變量)也用Gamma,雖然不太嚴(yán)謹(jǐn),雖然不太嚴(yán)謹(jǐn),但可以接受。但可以接受。n測(cè)量時(shí)首先注意的是變量的

30、層次,對(duì)測(cè)量時(shí)首先注意的是變量的層次,對(duì)稱(chēng)性是次要的考慮稱(chēng)性是次要的考慮3、其他測(cè)量法之一:、其他測(cè)量法之一:tau系數(shù)系數(shù)n計(jì)算同序?qū)?shù)與異序?qū)?shù)之差在全部計(jì)算同序?qū)?shù)與異序?qū)?shù)之差在全部可能對(duì)數(shù)中所占的比例可能對(duì)數(shù)中所占的比例n適用于分析對(duì)稱(chēng)關(guān)系適用于分析對(duì)稱(chēng)關(guān)系ntau-antau-bntau-c(1) tau-a(2)tau-b(3)tau-c3、其他測(cè)量法之二:斯皮爾曼的、其他測(cè)量法之二:斯皮爾曼的rho系數(shù)系數(shù)特點(diǎn):不僅區(qū)別了兩者的高低差異,還特點(diǎn):不僅區(qū)別了兩者的高低差異,還知道差異的具體數(shù)值大小知道差異的具體數(shù)值大小D表示每個(gè)個(gè)案在兩列級(jí)別順序上的相表示每個(gè)個(gè)案在兩列級(jí)別順序上

31、的相互抵消?;サ窒?。D2可以避免正負(fù)抵消可以避免正負(fù)抵消2261(1)Drhon nrho系數(shù)的意義系數(shù)的意義n對(duì)稱(chēng)相關(guān)測(cè)量法n其統(tǒng)計(jì)值是一1到十1,可表示相關(guān)的程度和方向。n其平方值具有消減誤差比例的意義。n由數(shù)據(jù)可知 , ,n10,那么:n可見(jiàn),文化水平和收入水平的關(guān)系是非常強(qiáng)的。這個(gè)統(tǒng)計(jì)值不區(qū)分哪個(gè)是自變量,哪個(gè)是因變量。其平方值表示以一個(gè)變量的等級(jí)來(lái)預(yù)測(cè)另一個(gè)變量的等級(jí)時(shí),可以減少84.64的誤差。21 1 14101 10414D 22266 14110.92(1)10 (101)Dn n (三)兩個(gè)定距變量:(三)兩個(gè)定距變量: PearsonPearson相關(guān)系數(shù)相關(guān)系數(shù)r rn

32、測(cè)量?jī)蓚€(gè)定距變量的相關(guān)關(guān)系時(shí),經(jīng)常用測(cè)量?jī)蓚€(gè)定距變量的相關(guān)關(guān)系時(shí),經(jīng)常用到皮爾遜到皮爾遜(PearsonPearson)的積矩相關(guān)系數(shù)的積矩相關(guān)系數(shù)(通常用通常用r或或R表示表示),取值范圍在一,取值范圍在一1到十到十1之間。積之間。積矩相關(guān)系數(shù)主要分析對(duì)稱(chēng)性關(guān)系,公式如矩相關(guān)系數(shù)主要分析對(duì)稱(chēng)性關(guān)系,公式如下:下:22()()()()XXYYrXXYYPearsonPearson相關(guān)系數(shù)的意義相關(guān)系數(shù)的意義n對(duì)稱(chēng)相關(guān)測(cè)量法:不分自變量和因變量n其統(tǒng)計(jì)值是一1到十1,可表示相關(guān)的程度和方向。n其平方值具有消減誤差比例的意義。n如何解釋這一結(jié)果?(四)、簡(jiǎn)單線性回歸:兩個(gè)定距變(四)、簡(jiǎn)單線性回歸:兩個(gè)定距變量(非對(duì)稱(chēng)關(guān)系)量(非對(duì)稱(chēng)關(guān)系)n兩個(gè)定距變量不僅可以計(jì)算相關(guān)系數(shù),確定相關(guān)的程度和方向,而且還可以進(jìn)一步確定兩個(gè)變量的線性關(guān)系。線性回歸分析法是用自變量的數(shù)值預(yù)測(cè)或估計(jì)因變量的數(shù)值,積矩相關(guān)系數(shù)r可以用來(lái)測(cè)量?jī)蓚€(gè)變量的相關(guān)程度和方向。b系數(shù):分析不對(duì)稱(chēng)關(guān)系的變量n根據(jù)公式計(jì)算得出b=0.90,a=1.22回歸系數(shù)b的意義

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論