社會(huì)統(tǒng)計(jì)學(xué)相關(guān)測(cè)量法與變量層次PPT課件_第1頁(yè)
社會(huì)統(tǒng)計(jì)學(xué)相關(guān)測(cè)量法與變量層次PPT課件_第2頁(yè)
社會(huì)統(tǒng)計(jì)學(xué)相關(guān)測(cè)量法與變量層次PPT課件_第3頁(yè)
社會(huì)統(tǒng)計(jì)學(xué)相關(guān)測(cè)量法與變量層次PPT課件_第4頁(yè)
社會(huì)統(tǒng)計(jì)學(xué)相關(guān)測(cè)量法與變量層次PPT課件_第5頁(yè)
已閱讀5頁(yè),還剩35頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、相關(guān)測(cè)量的六種情況 兩個(gè)定類變量 兩個(gè)定序變量 兩個(gè)定距變量 一個(gè)定類變量與定序變量 一個(gè)定類變量與定距變量 一個(gè)定序變量與定距變量第1頁(yè)/共40頁(yè)第一節(jié) 兩個(gè)定類變量n Lambda 相關(guān)測(cè)量法 基本邏輯是計(jì)算以一個(gè)定類變量的值來(lái)預(yù)測(cè)另一個(gè)定類變量的值時(shí),如果以眾值作為預(yù)測(cè)的準(zhǔn)則,可以減除多少誤差。消減的誤差在全部誤差中所占的比例愈大,就表示這兩個(gè)變量的相關(guān)越強(qiáng)。 Lambda 相關(guān)測(cè)量法有兩種形式。一種是對(duì)稱形式,簡(jiǎn)寫是系數(shù),即不分自變量與因變量。另一種是不對(duì)稱形式,簡(jiǎn)寫是y系數(shù),即要求一個(gè)是自變量,一個(gè)是因變量。第2頁(yè)/共40頁(yè)系數(shù)n E1的定義:n未知y與x有關(guān)之前,如果預(yù)測(cè)y值,唯一

2、可資依據(jù)的就是y本身的分布。由于y與x無(wú)關(guān),所以只能根據(jù)y的行邊緣和(與x無(wú)關(guān))去預(yù)測(cè)y,也即由y的行邊緣和中最大者眾值,去預(yù)測(cè)y,可能性最大。 E1 = n max(n*j) (即總頻次n減去y的行邊緣和中最大者) 分析:n(1)E1 = 0 (E1最?。┊?dāng) max(n*j) = n 時(shí),E1 = 0。也即眾值極大,異眾比率為0,此時(shí)眾值代表性最高,故E1為0。n(2)E 1 = n (E1最大)當(dāng) max(n*j) = 0 時(shí),E1 = n。也即眾值為0,異眾比率最大,此時(shí)眾值代表性最低,故E1為n。第3頁(yè)/共40頁(yè)nE2的定義:n 當(dāng)已知y與x有關(guān)之后,如果再去預(yù)測(cè)y值,則可借助x預(yù)測(cè)y

3、。即用各類x條件下,y的條件分布中的眾值去預(yù)測(cè)y,可能性最大。 E2 = n max(nij) 分析:n1)E2 = 0 (即max(nij) = n,即各類x條件下的眾值皆為最大值)n2)E2 = n (即max(nij) = 0,即各類x條件下的眾值皆為最小值)第4頁(yè)/共40頁(yè)系數(shù)計(jì)算公式y(tǒng)yyyyyyMnMmMnmnMnEEE)()()(121)(2)(yxyxyxMMnMMmm其中,My=Y變量的眾值次數(shù), Mx=X變量的眾值次數(shù) my=X變量的每個(gè)值(類別)之下Y變量的眾值次數(shù) mx=Y變量的每個(gè)值(類別)之下X變量的眾值次數(shù)第5頁(yè)/共40頁(yè)例:對(duì)稱與不對(duì)稱系數(shù) 表 青年人與其知心朋

4、友的志愿自己志愿自己志愿知心朋友志愿知心朋友志愿快樂家庭理想工作增廣見聞總數(shù)快樂家庭289340理想工作241750增廣見聞24410總數(shù)325414100)(2)(yxyxyxMMnMMmm47. 05054-10025054-7412844128)()()()()(yyyyMnMm52.0502650-10050-74128)(第6頁(yè)/共40頁(yè)系數(shù)與尤拉Q系數(shù)愛好愛好男男女女籃球9010跳繩1090bcadbcadQ976. 082008000101090901010-9090yyyMnMm8.010080100-200100-9090)(第7頁(yè)/共40頁(yè)系數(shù)的缺點(diǎn)nLambda相關(guān)測(cè)量法

5、的特點(diǎn)是以眾值作為預(yù)測(cè)的準(zhǔn)則,不理會(huì)眾值以外的次數(shù)分布。因此,如果全部眾值集中在條件次數(shù)表的同一列或同一行中,則Lambda系數(shù)便會(huì)等于0.南方南方北方北方邊緣次數(shù)邊緣次數(shù)面食52025米食453075邊緣次數(shù)5050n=100yyyyMnMm075-10075-3045)(第8頁(yè)/共40頁(yè)tau-y相關(guān)測(cè)量法n tau-y是不對(duì)稱相關(guān)測(cè)量法,這個(gè)方法是在計(jì)算系數(shù)值時(shí)會(huì)包括所有的邊緣次數(shù)和條件次數(shù)。12121-)()(EEEytauFffFEnFFnExxyy其中:其中: nn=全部個(gè)案書目,全部個(gè)案書目,nf=某條件次數(shù)某條件次數(shù)nFy=Y變量的某個(gè)邊緣次數(shù)變量的某個(gè)邊緣次數(shù)nFx=X變量的

6、某個(gè)邊緣次數(shù)變量的某個(gè)邊緣次數(shù)第9頁(yè)/共40頁(yè)n 再以飲食習(xí)慣表為例:5.3710075)75100(10025)25100(1E335030)3050(20)2050(5045)4550(5 ) 550(2E12. 05 .37335 .37-121EEEytau第10頁(yè)/共40頁(yè)練習(xí)題1 題:以下是某高校對(duì)高、低年級(jí)學(xué)生求職意愿的抽樣調(diào)查。問:(1)計(jì)算不對(duì)稱Lambda系數(shù);(2)計(jì)算tau-y系數(shù);(3)建立條件百分表。高年級(jí)高年級(jí)低年級(jí)低年級(jí)學(xué)校學(xué)校1010企業(yè)企業(yè)2010機(jī)關(guān)機(jī)關(guān)1020第11頁(yè)/共40頁(yè)第二節(jié) 兩個(gè)定序變量n Gamma系數(shù) 級(jí)序相關(guān)法的基本邏輯是要求出;根據(jù)任何

7、兩個(gè)個(gè)案在某變量上的等級(jí)來(lái)預(yù)測(cè)他們?cè)诹硪粋€(gè)變量上的等級(jí)時(shí),可以減少的誤差是多少。 同序?qū)εc異序?qū)Γ杭僭O(shè)樣本的全部個(gè)案數(shù)目是n,就會(huì)組成1/2n(n-1)對(duì)個(gè)案。某對(duì)個(gè)案在兩個(gè)變量上的相對(duì)等級(jí)時(shí)相同,則成為同序?qū)?;如果是不相同,則成為異序?qū)Α5?2頁(yè)/共40頁(yè)同序?qū)εc異序?qū) xy yx1y1x2y2x3y3x4y4x xy yx1y1x2y2x3y3x4y4x xy yx1y1x2y2x3y3x4y4x xy yx1y1x2y2x3y3x4y4第13頁(yè)/共40頁(yè)同分對(duì)n兩個(gè)個(gè)案在某變量上次序相對(duì),無(wú)法分高低,即同分對(duì)。通常以Tx代表只在X變量上同分的對(duì)數(shù),以Ty代表只在Y變量上同分的對(duì)數(shù),而以

8、Txy代表在兩個(gè)變量上都是同分的對(duì)數(shù)。工廠工廠積極性積極性等級(jí)等級(jí)產(chǎn)量等產(chǎn)量等級(jí)級(jí)A55B33C41D1.53E1.53第14頁(yè)/共40頁(yè)Gamma系數(shù)n Gamma系數(shù)的計(jì)算公式如下: 其中:Ns 是同序?qū)?shù),Nd異序?qū)?shù)。 G的絕對(duì)值越大,就表示所犯的錯(cuò)誤可能性越小,G是負(fù)值,則如果知道一對(duì)個(gè)案在某個(gè)變量的相對(duì)等級(jí),就應(yīng)該估計(jì)他們?cè)诹硪粋€(gè)變量上的相對(duì)等級(jí)是相反的。反之亦然。dsdsNNNNG第15頁(yè)/共40頁(yè)求下表G系數(shù)工廠工廠積極性等級(jí)積極性等級(jí)產(chǎn)量等級(jí)產(chǎn)量等級(jí)A55B33C41D1.53dsdsNNNNGE1.5314.0343-4nG系數(shù)是屬于對(duì)稱相關(guān)測(cè)量法。如果是非對(duì)稱,即一個(gè)是自

9、變量,一個(gè)是因變量,則適宜于簡(jiǎn)化不對(duì)稱關(guān)系的薩默斯dy系數(shù)。第16頁(yè)/共40頁(yè)薩默斯dy系數(shù) dy的計(jì)算公式如下: 其中:Ns 是同序?qū)?shù),Nd異序?qū)?shù),Ty是只在因變量上同分的對(duì)數(shù)。 假設(shè)積極性等級(jí)是x,產(chǎn)量是Y,求dyydsdsyTNNNNd第17頁(yè)/共40頁(yè)計(jì)算列聯(lián)表的同序?qū)εc異序?qū)Ω吒咧兄械偷透吒遪1n4n7中中n2n5n8低低n3n6n9高高中中低低高高n1n4n7中中n2n5n8低低n3n6n9n同序?qū)Γ簄1(n5+n6+n8+n9)+n2(n6+n8)+n4(n8+n9)+n5(n9)n異序?qū)Γ簄7(n2+n5+n3+n6)+n4(n2+n3)+n8(n3+n6)+n5(n3)第

10、18頁(yè)/共40頁(yè)計(jì)算列聯(lián)表的同分對(duì)高高中中低低高高n1n4n7中中n2n5n8低低n3n6n9高高中中低低高高n1n4n7中中n2n5n8低低n3n6n9n同分對(duì):Tx=n1(n2+n3)+n2(n3)+n4(n5+n6)+n5(n6)+n7(n8+n9)+n8(n9)n同分對(duì):2) 1(219911nnnnTxy)(第19頁(yè)/共40頁(yè)例:計(jì)算G系數(shù)與dy系數(shù)大學(xué)大學(xué)中學(xué)中學(xué)小學(xué)小學(xué)美滿美滿9165一般一般83018不美滿不美滿347婚姻美滿文化程度n同序?qū)Γ?(30+18+4+7)+8(4+7)+16(18+7)+30(7)=1229n異序?qū)Γ?(8+30+3+4)+18(3+4)+16(8

11、+3)+30(3)=617n同分對(duì):9(16+5)+16(5)+8(30+18)+30(18)+3(4+7)+4(7)=1254nG系數(shù)=0.33ndy系數(shù)系數(shù)=0.22第20頁(yè)/共40頁(yè)肯德爾的tau系數(shù)ntau系數(shù)的基本邏輯是計(jì)算同序?qū)?shù)與異序?qū)?shù)之差在全部的可能對(duì)數(shù)中所占的比例。公式如下:) 1()(2-) 1(21-2mnNNmctauTNNTNNNNbtaunnNNataudsydsxdsdsdsn其中m是列聯(lián)表中行數(shù)與列數(shù)中的較小者。第21頁(yè)/共40頁(yè)斯皮爾曼rho系數(shù)n斯皮爾曼rho系數(shù)的特點(diǎn)是計(jì)算每個(gè)個(gè)案在兩個(gè)變量上的等級(jí)時(shí),不僅要區(qū)別兩者的高低差異,而且還要計(jì)算二者差異的確切

12、數(shù)值。 其中D表示每個(gè)個(gè)案在兩列級(jí)序上的差異值,n表示全部個(gè)案數(shù)目。D平方可以避免正負(fù)值抵消 rho系數(shù)是對(duì)稱相關(guān)測(cè)量法,要求同分情況不多,統(tǒng)計(jì)值在-1至1之間。其平方值可以有消減誤差比例的意義。)1(6122nnDrs第22頁(yè)/共40頁(yè)求斯皮爾曼rho系數(shù)參賽人參賽人ABCDEFGHIJ評(píng)判員112435876910評(píng)判員212345687910等級(jí)差等級(jí)差d001-102-1-100d平方平方0011041100) 1(6122nnDrs95. 0990481) 110(10)8(612第23頁(yè)/共40頁(yè)第三節(jié) 兩個(gè)定距變量n 簡(jiǎn)單線性回歸分析法 簡(jiǎn)單線性回歸時(shí)根據(jù)一個(gè)直線方程式,以一個(gè)自

13、變量X的數(shù)值來(lái)預(yù)測(cè)一個(gè)因變量Y的數(shù)值。目的是要找出一個(gè)錯(cuò)誤最小的方法來(lái)預(yù)測(cè)因變量的數(shù)值。 其中X是自變量數(shù)值;b成為回歸系數(shù),表示回歸線的斜率;a是截距,是回歸線與Y軸的交點(diǎn);是根據(jù)回歸方程所預(yù)測(cè)的Y變量值。abXYY第24頁(yè)/共40頁(yè)最小二乘法n回歸法在繪制回歸線時(shí)所根據(jù)的準(zhǔn)則是最小二乘法。假定我們根據(jù)一條直線來(lái)以自變量X估計(jì)因變量的某個(gè)值,所估計(jì)的值是Y1,而實(shí)際上該值是Y2,則誤差便是:e=Y2-Y1n各個(gè)e相加起來(lái)就是誤差總數(shù),為防止正負(fù)值相抵消的問題,改為e的平方值相加起來(lái),即直線應(yīng)使 最小。2e第25頁(yè)/共40頁(yè)計(jì)算公式 斜率 截距n其中X是自變量值, 是自變量的均值,Y是因變量值

14、, 是因變量的均值,n是全部個(gè)案數(shù)目。222)()()()()()(xxnyxxynxxyyxxbnxbyxbya)(XY第26頁(yè)/共40頁(yè)例1:計(jì)算回歸方程婦女婦女教育年期教育年期勞動(dòng)小時(shí)勞動(dòng)小時(shí)A25B24C34D33E41F41G40H60I80總數(shù)總數(shù)3618XY1042584161291699941614161016003600640471746832.583.032.59)36)(83.0(1883.0)36()174(9)18)(36()47(92XYab第27頁(yè)/共40頁(yè)回歸與相關(guān)n線性回歸方程不僅具有簡(jiǎn)化資料的作用,而且可以推廣應(yīng)用于預(yù)測(cè)或估計(jì)樣本之外個(gè)案的數(shù)值。 回歸系數(shù)(

15、b)表示X對(duì)Y的影響有多少,指每增加一個(gè)單位的X值時(shí)Y值的變化有多大。 B值是表示自變量對(duì)因變量的影響的大小與方向,它是不對(duì)稱關(guān)系的統(tǒng)計(jì)法。 回歸方程不具有消減誤差比例作用,一般在計(jì)算回歸方程時(shí)須進(jìn)行相關(guān)系數(shù)測(cè)量。如果相關(guān)系數(shù)比較小,消減誤差比例太少,則不適合作線性回歸方程。第28頁(yè)/共40頁(yè)積矩相關(guān)測(cè)量法nb系數(shù)沒有上限,很少用來(lái)比較變量與變量之間的相關(guān)程度。而且容易受到統(tǒng)計(jì)單位的影響。nr系數(shù)與b系數(shù)的不同地方,是r系數(shù)假定X與Y的關(guān)系是對(duì)稱的,而且r的統(tǒng)計(jì)值是-1至1,同時(shí)r2具有消減誤差比例的意義。r2稱為決定系數(shù)。第29頁(yè)/共40頁(yè)r系數(shù)n r系數(shù)計(jì)算公式如下: r系數(shù)與簡(jiǎn)單線性回歸

16、都是假定X與Y的關(guān)系具有直線的性質(zhì)。如果非直線,就會(huì)犯錯(cuò)誤。222222)()()()()()(YYnXXnYXXYnYYXXYYXXr第30頁(yè)/共40頁(yè)第31頁(yè)/共40頁(yè)直線與非直線第32頁(yè)/共40頁(yè)第四節(jié) 定類變量與定距變量n相關(guān)比率,又稱為eta平方系數(shù)(E2),是以一個(gè)定類變量為自變量,來(lái)預(yù)測(cè)或估計(jì)以一個(gè)定距變量為因變量的值。 其中,Y是因變量的值, 是因變量的均值; 是自變量值(Xi)上各因變量的均值。222222222)()()(EEYnYYnYnYYYYYYEiiiYiY第33頁(yè)/共40頁(yè) 表1 20名學(xué)生的家庭職業(yè)背景對(duì)英文水平的影響職業(yè)種類職業(yè)種類干部工人農(nóng)民7852838259759173828561788180808351906454ni785Yi84.2961.7579.6Si4.409.642.87英文水平(得分)英文水平(得分)第34頁(yè)/共40頁(yè)非線性關(guān)系n比較E值與r值的大小,就可以大致知道是否非直線關(guān)系:兩者相差愈大,顯示變量之間的關(guān)系越是非直線。第35頁(yè)/共40頁(yè)練習(xí)1:主

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論