版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
基礎(chǔ)統(tǒng)計(jì)學(xué)簡(jiǎn)介傳播方法論-調(diào)查方法2:基礎(chǔ)統(tǒng)計(jì)學(xué)課件第一節(jié)概述一、統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)是應(yīng)用數(shù)學(xué)的一個(gè)分支描述、組織和解釋數(shù)據(jù)或信息的一套工具和技術(shù)利用概率論建立數(shù)學(xué)模型,收集所觀察系統(tǒng)的數(shù)據(jù),進(jìn)行量化的分析、總結(jié),并進(jìn)而進(jìn)行推斷和預(yù)測(cè),為相關(guān)決策提供依據(jù)和參考2022/12/102第一節(jié)概述一、統(tǒng)計(jì)學(xué)2022/12/102二、兩個(gè)概念描述性統(tǒng)計(jì)(DescriptiveStatistics)
推論性統(tǒng)計(jì)(InferentialStatistics)2022/12/103二、兩個(gè)概念2022/12/1031、描述性統(tǒng)計(jì)組織、描述和總結(jié)所收集到的一組數(shù)據(jù)的特征它所描述的是這組數(shù)據(jù)本身的分布特征
測(cè)量層次(適用于較低測(cè)量層次的統(tǒng)計(jì)法,可以適用于較高層次,反之則不成立)2022/12/1041、描述性統(tǒng)計(jì)2022/12/1042、推論統(tǒng)計(jì)從一個(gè)較小的群體中了解的信息并得出相關(guān)結(jié)論,推廣到更大的一個(gè)群體我們把較小的這個(gè)群體,也就是我們收集了數(shù)據(jù)的群體稱(chēng)之為樣本(sample),把更大的那個(gè)群體,也就是我們所感興趣的、要研究的對(duì)象群體稱(chēng)之為總體(population)。統(tǒng)計(jì)值→參數(shù)值2022/12/1052、推論統(tǒng)計(jì)2022/12/105三、變量的層次定類(lèi)變量:按事物性質(zhì)劃分,是一種分類(lèi)體系。比如:性別,婚姻狀況等。定序變量:數(shù)據(jù)具有某種邏輯順序,有高低、大小、強(qiáng)弱差異。比如等級(jí)評(píng)定、學(xué)歷、喜愛(ài)程度等。定距變量:反映事物在數(shù)量方面的差異,具有相等的單位。比如智商、溫度等。定比變量:不僅具有相當(dāng)單位,還具有實(shí)際意義的絕對(duì)零點(diǎn)。比如年齡、收入等。2022/12/106三、變量的層次2022/12/106適用的運(yùn)算形式=、≠>、<+、-×、÷定類(lèi)變量√定序變量√√定距變量√√√定比變量√√√√2022/12/107適用的運(yùn)算形式=、≠>、<+、-×、÷定類(lèi)變量√定序變量√√第二節(jié)單變量描述統(tǒng)計(jì)一、基本技術(shù)(一)定類(lèi)層次1、次數(shù)分布2、比例3、比率4、對(duì)比值5、圖示法2022/12/108第二節(jié)單變量描述統(tǒng)計(jì)一、基本技術(shù)2022/12/101、次數(shù)分布(frequencydistribution)原理與做法:思考:從右邊兩個(gè)表格可以說(shuō)明什么?不可以說(shuō)明什么?職業(yè)次數(shù)干部110工人152農(nóng)民288總數(shù)550職業(yè)次數(shù)干部50工人135農(nóng)民295總數(shù)4802022/12/1091、次數(shù)分布(frequencydistribution)2、比例(proportions)每類(lèi)的次數(shù)除以總數(shù)原理:使不同樣本的總數(shù)變成同一個(gè)基數(shù),即都以1為基數(shù),就可以比較了2022/12/10102、比例(proportions)2022/12/1010職業(yè)次數(shù)比例(p)干部1100.200工人1520.276農(nóng)民2880.524總數(shù)5501.000職業(yè)次數(shù)比例(p)干部500.104工人1350.281農(nóng)民2950.615總數(shù)4801.0002022/12/1011職業(yè)次數(shù)比例(p)干部1100.200工人1520.276農(nóng)3、比率(rates)原理:把計(jì)算比例時(shí)所用的基數(shù)擴(kuò)大百分率(f/n)*100千分率f/n*1000萬(wàn)分率f/n*100002022/12/10123、比率(rates)2022/12/1012職業(yè)次數(shù)比例(p)百分比干部1100.20020.0工人1520.27627.6農(nóng)民2880.52452.4總數(shù)5501.000100.0職業(yè)次數(shù)比例(p)百分比干部500.10410.4工人1350.28128.1農(nóng)民2950.61561.5總數(shù)4801.000100.02022/12/1013職業(yè)次數(shù)比例(p)百分比干部1100.20020.0工人154、對(duì)比值(ratios)A數(shù)值與B數(shù)值的對(duì)比值,就是A除以B全校學(xué)生43285人,教師6118人生師比為:43285/6118=7.1:12022/12/10144、對(duì)比值(ratios)2022/12/10145、圖示法長(zhǎng)條圖:barchart2022/12/10155、圖示法2022/12/1015圓瓣圖:piechart2022/12/1016圓瓣圖:piechart2022/12/1016(二)定序?qū)哟?、累加次數(shù)2、累加百分比2022/12/1017(二)定序?qū)哟?022/12/10172022/12/10182022/12/1018(三)定距層次1、分組組限:上限、下限組距:示例2022/12/1019(三)定距層次2022/12/10192、圖示(1)矩形圖(直方圖)histogram2022/12/10202、圖示2022/12/1020(2)線(xiàn)形圖(LineChart)2022/12/1021(2)線(xiàn)形圖(LineChart)2022/12/1021二、集中趨勢(shì)測(cè)量法集中趨勢(shì)的量度(measuresofcentraltendency):共性找出一個(gè)數(shù)值來(lái)代表變項(xiàng)的資料分布,以反映資料的集結(jié)情況可以根據(jù)這個(gè)代表值來(lái)估計(jì)或預(yù)測(cè)每個(gè)研究對(duì)象的數(shù)值2022/12/1022二、集中趨勢(shì)測(cè)量法2022/12/1022(一)定類(lèi)變項(xiàng):眾數(shù)(mode)次數(shù)最多之值2022/12/1023(一)定類(lèi)變項(xiàng):眾數(shù)(mode)2022/12/1023(二)定序變項(xiàng):中位數(shù)(median)一個(gè)序列的中央位置之值,即高于此值也有50%的個(gè)案,低于此值也有50%按照某種順序排列,之后尋找位于頻次中間的值2022/12/1024(二)定序變項(xiàng):中位數(shù)(median)2022/12/102求中位值Md位置=(n+1)/2有男女兩組成績(jī)的定序數(shù)據(jù)男:優(yōu),優(yōu),良,良,中,中,中,中,差女:優(yōu),優(yōu),優(yōu),良,良,中,中,中,中,差2022/12/1025求中位值2022/12/1025(三)定距變項(xiàng):平均值(mean)2022/12/1026(三)定距變項(xiàng):平均值(mean)2022/12/1026報(bào)紙上報(bào)道有個(gè)人在一條河中淹死了,這條河的平均深度僅2尺。怎么回事?平均數(shù)怎么回事?2022/12/1027報(bào)紙上報(bào)道有個(gè)人在一條河中淹死了,這條河的平均深度僅2尺。答案:這個(gè)人是在一個(gè)10多尺深的陷坑處沉下去的。2022/12/1028答案:這個(gè)人是在一個(gè)10多尺深的陷坑處沉下去的。2022/1吉斯莫先生的企業(yè)招新員工,他承諾所有員工的平均薪金是每周300元。薩姆十分樂(lè)意地接受了這份工作,但沒(méi)過(guò)多久就發(fā)現(xiàn)沒(méi)有一個(gè)普通員工的工資超過(guò)每周100元。怎么回事?2022/12/1029吉斯莫先生的企業(yè)招新員工,他承諾所有員工的平均薪金是每周30答案原來(lái)吉斯莫的企業(yè)中有少數(shù)高薪管理者是他的親戚,由于存在極端值的影響,平均工資雖然很高,但考慮一下眾數(shù),你就會(huì)發(fā)現(xiàn)大多數(shù)人的工資都很低。2022/12/1030答案原來(lái)吉斯莫的企業(yè)中有少數(shù)高薪管理者是他的親戚,由于存在極騙人的平均數(shù)不宜使用均值的情況:極端值非常特殊,代表性有問(wèn)題2022/12/1031騙人的平均數(shù)不宜使用均值的情況:2022/12/1031三、離散趨勢(shì)測(cè)量法(measuresofvariability):異質(zhì)性求出一個(gè)值表示個(gè)案與個(gè)案之間的差異情況2022/12/1032三、離散趨勢(shì)測(cè)量法2022/12/1032(一)定類(lèi)變項(xiàng)n為全部個(gè)案數(shù)目,fmo是眾值的次數(shù)
離異/異眾比率,簡(jiǎn)寫(xiě)v2022/12/1033(一)定類(lèi)變項(xiàng)n為全部個(gè)案數(shù)目,fmo是眾值的次數(shù)離異某院系對(duì)大四學(xué)生的就業(yè)意愿進(jìn)行了調(diào)查,請(qǐng)根據(jù)右表進(jìn)行有關(guān)闡述。想就業(yè)的類(lèi)型男生女生自主創(chuàng)業(yè)123外企員工3120中學(xué)教師2652公務(wù)員510總數(shù)74852022/12/1034某院系對(duì)大四學(xué)生的就業(yè)意愿進(jìn)行了調(diào)查,請(qǐng)根據(jù)右表進(jìn)行有關(guān)闡述(二)定序變項(xiàng)四分位差:將一組數(shù)據(jù)按順序排列,將數(shù)據(jù)的個(gè)數(shù)分為四個(gè)相等的部分除去兩端的兩個(gè)25%的數(shù)據(jù),以中間50%的數(shù)據(jù)所占的范圍作為數(shù)據(jù)分散程度的指標(biāo)2022/12/1035(二)定序變項(xiàng)2022/12/1035(三)定距變項(xiàng)全距(range)、標(biāo)準(zhǔn)差(standarddeviation)、方差(variance)全距=最大數(shù)-最小數(shù)簡(jiǎn)單但粗糙2022/12/1036(三)定距變項(xiàng)2022/12/10362、標(biāo)準(zhǔn)差反映的是每一個(gè)個(gè)案的分值與平均的分值之間的差距,簡(jiǎn)單來(lái)說(shuō),就是平均差異有多大。標(biāo)準(zhǔn)差越大表示差異越大。
2022/12/10372、標(biāo)準(zhǔn)差反映的是每一個(gè)個(gè)案的分值與平均的分值之間的差距,簡(jiǎn)3、方差標(biāo)準(zhǔn)差的平方2022/12/10383、方差2022/12/1038五、單變量描述統(tǒng)計(jì)的作用樣本情況報(bào)告了解數(shù)據(jù)的基本情況(判斷數(shù)據(jù)質(zhì)量)…………2022/12/1039五、單變量描述統(tǒng)計(jì)的作用2022/12/1039眾數(shù)中位數(shù)平均值集中趨勢(shì)值離散趨勢(shì)值異眾比率四分位差全距標(biāo)準(zhǔn)差2022/12/1040眾數(shù)集中趨勢(shì)值離散趨勢(shì)值異眾比率2022/12/1040六、單變量描述的操作1、次數(shù)、百分?jǐn)?shù)等Frequencies2、中位數(shù)等Frequencies+statistics3、均值與標(biāo)準(zhǔn)差Descriptive2022/12/1041六、單變量描述的操作2022/12/1041第三節(jié)雙變量描述性統(tǒng)計(jì)事物之間的關(guān)系確定性關(guān)系(函數(shù)關(guān)系)非確定性關(guān)系(相關(guān)關(guān)系)線(xiàn)性關(guān)系非線(xiàn)性關(guān)系必然現(xiàn)象不可能事件2022/12/1042第三節(jié)雙變量描述性統(tǒng)計(jì)事物之間的關(guān)系確定性關(guān)系非確定相關(guān):一個(gè)變項(xiàng)的值與另一個(gè)變項(xiàng)的值有連帶性相關(guān)的三種情況:正相關(guān)、負(fù)相關(guān)、零相關(guān)相關(guān)程度(0~1)相關(guān)的方向(+-)2022/12/1043相關(guān):一個(gè)變項(xiàng)的值與另一個(gè)變項(xiàng)的值有連帶性2022/12/1交互分類(lèi)與百分表交互分類(lèi):同時(shí)依據(jù)兩個(gè)變項(xiàng)的值,將所研究的個(gè)案分類(lèi)列聯(lián)表(交互分類(lèi)表)表的大小=行*列自變量、因變量2022/12/1044交互分類(lèi)與百分表交互分類(lèi):同時(shí)依據(jù)兩個(gè)變項(xiàng)的值,將所研究的個(gè)志愿性別男女總數(shù)快樂(lè)家庭103040理想工作401050增廣見(jiàn)聞10010總數(shù)60401002022/12/1045志愿性別男女總數(shù)快樂(lè)家庭103040理想工作401050增廣制作條件百分表的準(zhǔn)則——信息清楚、表格簡(jiǎn)潔社會(huì)學(xué)研究的常規(guī)做法:以自變項(xiàng)為計(jì)算百分率的方向——根據(jù)自己的研究需要三線(xiàn)表的制作(表格簡(jiǎn)明型1,去掉末行)2022/12/1046制作條件百分表的準(zhǔn)則——信息清楚、表格簡(jiǎn)潔2022/12/1第四節(jié)相關(guān)測(cè)量法相關(guān)測(cè)量法以一個(gè)統(tǒng)計(jì)值表示變項(xiàng)之間的相關(guān)程度這個(gè)值,通常稱(chēng)為相關(guān)系數(shù)2022/12/1047第四節(jié)相關(guān)測(cè)量法相關(guān)測(cè)量法2022/12/1047定類(lèi)和定類(lèi)變量定類(lèi)和定序變量Lambda相關(guān)測(cè)量法tau-y相關(guān)測(cè)量法基本邏輯:以一個(gè)定類(lèi)變項(xiàng)的值來(lái)預(yù)測(cè)另一個(gè)定類(lèi)變項(xiàng)的值時(shí),可以減少多少誤差其值介于0~1之間2022/12/1048定類(lèi)和定類(lèi)變量Lambda相關(guān)測(cè)量法基本邏輯:以一個(gè)定類(lèi)變項(xiàng)例題:考察性別(v2)與政治面貌(d11a)之間的關(guān)系2022/12/1049例題:2022/12/1049定序和定序變量Gamma系數(shù)Gamma系數(shù)按照同序?qū)彤愋驅(qū)€(gè)數(shù)來(lái)計(jì)算兩定序變量的相關(guān)程度和方向;同序?qū)彤愋驅(qū)ο嗖钤酱螅f(shuō)明相關(guān)越強(qiáng)2022/12/1050定序和定序變量Gamma系數(shù)Gamma系數(shù)按照同序?qū)彤愋驅(qū)}:考察受教育程度b4_a與對(duì)自己社會(huì)地位滿(mǎn)意程度i5_a之間的關(guān)系2022/12/1051例題:2022/12/1051定類(lèi)和定距變量定序和定距變量相關(guān)比率(eta平方系數(shù))原理:根據(jù)自變量取值來(lái)預(yù)測(cè)或估計(jì)因變量的均值2022/12/1052定類(lèi)和定距變量相關(guān)比率(eta平方系數(shù))2022/12/10例題:考察性別(v2)與家務(wù)勞動(dòng)時(shí)間之間的關(guān)系2022/12/1053例題:2022/12/1053定距和定距變量相關(guān)系數(shù)r即皮爾遜相關(guān)系數(shù)原理:兩個(gè)變量以平均數(shù)為基準(zhǔn)的平均共變程度r本身不具有消減誤差比率的性質(zhì),但r2具有這一性質(zhì)2022/12/1054定距和定距變量相關(guān)系數(shù)r原理:兩個(gè)變量以平均數(shù)為基準(zhǔn)的平均共例題:考察讀書(shū)年數(shù)(b2)與收入之間(c18_a)的關(guān)系2022/12/1055例題:2022/12/1055消減誤差比例(PRE/proportionatereductioninerror)PRE數(shù)值的意義為,用一個(gè)變項(xiàng)來(lái)解釋另一個(gè)變項(xiàng)時(shí)能夠減少的錯(cuò)誤比率X與Y的關(guān)系越強(qiáng),所能減少的預(yù)測(cè)誤差就會(huì)越多2022/12/1056消減誤差比例(PRE/proportionatered第五節(jié)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)是根據(jù)樣本調(diào)查結(jié)果證實(shí)或推翻總體有關(guān)假設(shè)的一種推論統(tǒng)計(jì)方法。2022/12/1057第五節(jié)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)是根據(jù)樣本調(diào)查結(jié)果證實(shí)或推翻總最終目的總體參數(shù)值樣本統(tǒng)計(jì)值估算驗(yàn)證統(tǒng)計(jì)推論邏輯思路2022/12/1058最終目的總體參數(shù)值樣本統(tǒng)計(jì)值估算驗(yàn)證統(tǒng)計(jì)推論邏輯思路2022思路常用分布(統(tǒng)計(jì)理論確定)根據(jù)樣本計(jì)算特定統(tǒng)計(jì)量,判斷此統(tǒng)計(jì)量在理論分布中出現(xiàn)的概率情況此過(guò)程稱(chēng)為“統(tǒng)計(jì)推論”2022/12/1059思路常用分布根據(jù)樣本計(jì)算特定統(tǒng)計(jì)量,判斷此統(tǒng)計(jì)量在理論分布中統(tǒng)計(jì)推論:用于抽樣調(diào)查資料的處理——根據(jù)局部資料(樣本資料)對(duì)總體的特征進(jìn)行推斷,屬于歸納推理的范疇,不可能保證100%正確。1、由于局部資料源于總體,因此局部資料的特性在某種程度上能反映總體的特性。2、由于社會(huì)資料的隨機(jī)性,即抽樣結(jié)果不是唯一的,又使得一次抽樣結(jié)果不能恰好就等于總體的結(jié)果。2022/12/1060統(tǒng)計(jì)推論:用于抽樣調(diào)查資料的處理2022/12/1060(一)卡方檢驗(yàn)常用的幾種檢驗(yàn)方法適用于定類(lèi)、定序變量原理:以理論次數(shù)為基準(zhǔn)考察實(shí)際次數(shù)與理論次數(shù)之間的偏離程度通常結(jié)果要匯報(bào)卡方值ⅹ2、自由度df、顯著度p。2022/12/1061(一)卡方檢驗(yàn)常用的幾種檢驗(yàn)方法適用于定類(lèi)、定序變量2022(二)z檢驗(yàn)和t檢驗(yàn)主要用于總體參數(shù)的檢驗(yàn),包括平均數(shù)、百分比等的檢驗(yàn)。2022/12/1062(二)z檢驗(yàn)和t檢驗(yàn)2022/12/1062Z檢驗(yàn)基于正態(tài)分布,要求大樣本,t檢驗(yàn)則基于t值抽樣分布,可用于小樣本。因?yàn)楫?dāng)樣本增大時(shí),t值會(huì)逐漸接近正態(tài)分布,這時(shí),二者區(qū)別不大。因此,不論樣本大小如何,皆可用t檢驗(yàn)。Z檢驗(yàn)可以說(shuō)是t檢驗(yàn)的一種特殊(大樣本)情況。在近代社會(huì)研究中,t檢驗(yàn)應(yīng)用更為廣泛。2022/12/1063Z檢驗(yàn)基于正態(tài)分布,要求大樣本,t檢驗(yàn)則基于t值抽樣分布,t檢驗(yàn)的幾種類(lèi)型One-samplettest與已有的某一參照值進(jìn)行比較Independent-samplesttest用于比較同一變量?jī)?nèi)兩組數(shù)據(jù)之間的差異,而該兩組數(shù)據(jù)是按照某一定類(lèi)變量或定序變量劃分的。Paired-samplettest配對(duì)樣本t檢驗(yàn),用于同一批個(gè)案在兩種不同情況下或兩個(gè)變量中的差異分別舉例演示2022/12/1064t檢驗(yàn)的幾種類(lèi)型2022/12/1064(三)F檢驗(yàn)(方差分析ANOVA)
原理:通過(guò)對(duì)方差的分解和比較,以確定主要變異來(lái)源主要用途:比較幾個(gè)均值之間是否存在顯著差異適用于定距變量間的相關(guān)檢驗(yàn)計(jì)算:F=組間均方/組內(nèi)均方演示2022/12/1065(三)F檢驗(yàn)(方差分析ANOVA)2022/12/1065兩變量的測(cè)量層次相關(guān)測(cè)量法(PRE)假設(shè)檢驗(yàn)定類(lèi)-定類(lèi)λ,tau-y卡方檢驗(yàn)定類(lèi)-定序定序-定序Gamma,dyZ或t檢驗(yàn)定類(lèi)-定距EtaF檢驗(yàn)或t檢驗(yàn)定序-定距定距-定距r,b總結(jié)2022/12/1066兩變量的測(cè)量層次相關(guān)測(cè)量法(PRE)假設(shè)檢驗(yàn)定類(lèi)-定類(lèi)λ,t演示習(xí)題分別對(duì)性別與政治面貌、受教育程度、讀書(shū)年數(shù)等的關(guān)系進(jìn)行探索,將結(jié)果撰寫(xiě)成簡(jiǎn)要報(bào)告。2022/12/1067演示習(xí)題分別對(duì)性別與政治面貌、受教育程度、讀書(shū)年數(shù)等的關(guān)系進(jìn)基礎(chǔ)統(tǒng)計(jì)學(xué)簡(jiǎn)介傳播方法論-調(diào)查方法2:基礎(chǔ)統(tǒng)計(jì)學(xué)課件第一節(jié)概述一、統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)是應(yīng)用數(shù)學(xué)的一個(gè)分支描述、組織和解釋數(shù)據(jù)或信息的一套工具和技術(shù)利用概率論建立數(shù)學(xué)模型,收集所觀察系統(tǒng)的數(shù)據(jù),進(jìn)行量化的分析、總結(jié),并進(jìn)而進(jìn)行推斷和預(yù)測(cè),為相關(guān)決策提供依據(jù)和參考2022/12/1069第一節(jié)概述一、統(tǒng)計(jì)學(xué)2022/12/102二、兩個(gè)概念描述性統(tǒng)計(jì)(DescriptiveStatistics)
推論性統(tǒng)計(jì)(InferentialStatistics)2022/12/1070二、兩個(gè)概念2022/12/1031、描述性統(tǒng)計(jì)組織、描述和總結(jié)所收集到的一組數(shù)據(jù)的特征它所描述的是這組數(shù)據(jù)本身的分布特征
測(cè)量層次(適用于較低測(cè)量層次的統(tǒng)計(jì)法,可以適用于較高層次,反之則不成立)2022/12/10711、描述性統(tǒng)計(jì)2022/12/1042、推論統(tǒng)計(jì)從一個(gè)較小的群體中了解的信息并得出相關(guān)結(jié)論,推廣到更大的一個(gè)群體我們把較小的這個(gè)群體,也就是我們收集了數(shù)據(jù)的群體稱(chēng)之為樣本(sample),把更大的那個(gè)群體,也就是我們所感興趣的、要研究的對(duì)象群體稱(chēng)之為總體(population)。統(tǒng)計(jì)值→參數(shù)值2022/12/10722、推論統(tǒng)計(jì)2022/12/105三、變量的層次定類(lèi)變量:按事物性質(zhì)劃分,是一種分類(lèi)體系。比如:性別,婚姻狀況等。定序變量:數(shù)據(jù)具有某種邏輯順序,有高低、大小、強(qiáng)弱差異。比如等級(jí)評(píng)定、學(xué)歷、喜愛(ài)程度等。定距變量:反映事物在數(shù)量方面的差異,具有相等的單位。比如智商、溫度等。定比變量:不僅具有相當(dāng)單位,還具有實(shí)際意義的絕對(duì)零點(diǎn)。比如年齡、收入等。2022/12/1073三、變量的層次2022/12/106適用的運(yùn)算形式=、≠>、<+、-×、÷定類(lèi)變量√定序變量√√定距變量√√√定比變量√√√√2022/12/1074適用的運(yùn)算形式=、≠>、<+、-×、÷定類(lèi)變量√定序變量√√第二節(jié)單變量描述統(tǒng)計(jì)一、基本技術(shù)(一)定類(lèi)層次1、次數(shù)分布2、比例3、比率4、對(duì)比值5、圖示法2022/12/1075第二節(jié)單變量描述統(tǒng)計(jì)一、基本技術(shù)2022/12/101、次數(shù)分布(frequencydistribution)原理與做法:思考:從右邊兩個(gè)表格可以說(shuō)明什么?不可以說(shuō)明什么?職業(yè)次數(shù)干部110工人152農(nóng)民288總數(shù)550職業(yè)次數(shù)干部50工人135農(nóng)民295總數(shù)4802022/12/10761、次數(shù)分布(frequencydistribution)2、比例(proportions)每類(lèi)的次數(shù)除以總數(shù)原理:使不同樣本的總數(shù)變成同一個(gè)基數(shù),即都以1為基數(shù),就可以比較了2022/12/10772、比例(proportions)2022/12/1010職業(yè)次數(shù)比例(p)干部1100.200工人1520.276農(nóng)民2880.524總數(shù)5501.000職業(yè)次數(shù)比例(p)干部500.104工人1350.281農(nóng)民2950.615總數(shù)4801.0002022/12/1078職業(yè)次數(shù)比例(p)干部1100.200工人1520.276農(nóng)3、比率(rates)原理:把計(jì)算比例時(shí)所用的基數(shù)擴(kuò)大百分率(f/n)*100千分率f/n*1000萬(wàn)分率f/n*100002022/12/10793、比率(rates)2022/12/1012職業(yè)次數(shù)比例(p)百分比干部1100.20020.0工人1520.27627.6農(nóng)民2880.52452.4總數(shù)5501.000100.0職業(yè)次數(shù)比例(p)百分比干部500.10410.4工人1350.28128.1農(nóng)民2950.61561.5總數(shù)4801.000100.02022/12/1080職業(yè)次數(shù)比例(p)百分比干部1100.20020.0工人154、對(duì)比值(ratios)A數(shù)值與B數(shù)值的對(duì)比值,就是A除以B全校學(xué)生43285人,教師6118人生師比為:43285/6118=7.1:12022/12/10814、對(duì)比值(ratios)2022/12/10145、圖示法長(zhǎng)條圖:barchart2022/12/10825、圖示法2022/12/1015圓瓣圖:piechart2022/12/1083圓瓣圖:piechart2022/12/1016(二)定序?qū)哟?、累加次數(shù)2、累加百分比2022/12/1084(二)定序?qū)哟?022/12/10172022/12/10852022/12/1018(三)定距層次1、分組組限:上限、下限組距:示例2022/12/1086(三)定距層次2022/12/10192、圖示(1)矩形圖(直方圖)histogram2022/12/10872、圖示2022/12/1020(2)線(xiàn)形圖(LineChart)2022/12/1088(2)線(xiàn)形圖(LineChart)2022/12/1021二、集中趨勢(shì)測(cè)量法集中趨勢(shì)的量度(measuresofcentraltendency):共性找出一個(gè)數(shù)值來(lái)代表變項(xiàng)的資料分布,以反映資料的集結(jié)情況可以根據(jù)這個(gè)代表值來(lái)估計(jì)或預(yù)測(cè)每個(gè)研究對(duì)象的數(shù)值2022/12/1089二、集中趨勢(shì)測(cè)量法2022/12/1022(一)定類(lèi)變項(xiàng):眾數(shù)(mode)次數(shù)最多之值2022/12/1090(一)定類(lèi)變項(xiàng):眾數(shù)(mode)2022/12/1023(二)定序變項(xiàng):中位數(shù)(median)一個(gè)序列的中央位置之值,即高于此值也有50%的個(gè)案,低于此值也有50%按照某種順序排列,之后尋找位于頻次中間的值2022/12/1091(二)定序變項(xiàng):中位數(shù)(median)2022/12/102求中位值Md位置=(n+1)/2有男女兩組成績(jī)的定序數(shù)據(jù)男:優(yōu),優(yōu),良,良,中,中,中,中,差女:優(yōu),優(yōu),優(yōu),良,良,中,中,中,中,差2022/12/1092求中位值2022/12/1025(三)定距變項(xiàng):平均值(mean)2022/12/1093(三)定距變項(xiàng):平均值(mean)2022/12/1026報(bào)紙上報(bào)道有個(gè)人在一條河中淹死了,這條河的平均深度僅2尺。怎么回事?平均數(shù)怎么回事?2022/12/1094報(bào)紙上報(bào)道有個(gè)人在一條河中淹死了,這條河的平均深度僅2尺。答案:這個(gè)人是在一個(gè)10多尺深的陷坑處沉下去的。2022/12/1095答案:這個(gè)人是在一個(gè)10多尺深的陷坑處沉下去的。2022/1吉斯莫先生的企業(yè)招新員工,他承諾所有員工的平均薪金是每周300元。薩姆十分樂(lè)意地接受了這份工作,但沒(méi)過(guò)多久就發(fā)現(xiàn)沒(méi)有一個(gè)普通員工的工資超過(guò)每周100元。怎么回事?2022/12/1096吉斯莫先生的企業(yè)招新員工,他承諾所有員工的平均薪金是每周30答案原來(lái)吉斯莫的企業(yè)中有少數(shù)高薪管理者是他的親戚,由于存在極端值的影響,平均工資雖然很高,但考慮一下眾數(shù),你就會(huì)發(fā)現(xiàn)大多數(shù)人的工資都很低。2022/12/1097答案原來(lái)吉斯莫的企業(yè)中有少數(shù)高薪管理者是他的親戚,由于存在極騙人的平均數(shù)不宜使用均值的情況:極端值非常特殊,代表性有問(wèn)題2022/12/1098騙人的平均數(shù)不宜使用均值的情況:2022/12/1031三、離散趨勢(shì)測(cè)量法(measuresofvariability):異質(zhì)性求出一個(gè)值表示個(gè)案與個(gè)案之間的差異情況2022/12/1099三、離散趨勢(shì)測(cè)量法2022/12/1032(一)定類(lèi)變項(xiàng)n為全部個(gè)案數(shù)目,fmo是眾值的次數(shù)
離異/異眾比率,簡(jiǎn)寫(xiě)v2022/12/10100(一)定類(lèi)變項(xiàng)n為全部個(gè)案數(shù)目,fmo是眾值的次數(shù)離異某院系對(duì)大四學(xué)生的就業(yè)意愿進(jìn)行了調(diào)查,請(qǐng)根據(jù)右表進(jìn)行有關(guān)闡述。想就業(yè)的類(lèi)型男生女生自主創(chuàng)業(yè)123外企員工3120中學(xué)教師2652公務(wù)員510總數(shù)74852022/12/10101某院系對(duì)大四學(xué)生的就業(yè)意愿進(jìn)行了調(diào)查,請(qǐng)根據(jù)右表進(jìn)行有關(guān)闡述(二)定序變項(xiàng)四分位差:將一組數(shù)據(jù)按順序排列,將數(shù)據(jù)的個(gè)數(shù)分為四個(gè)相等的部分除去兩端的兩個(gè)25%的數(shù)據(jù),以中間50%的數(shù)據(jù)所占的范圍作為數(shù)據(jù)分散程度的指標(biāo)2022/12/10102(二)定序變項(xiàng)2022/12/1035(三)定距變項(xiàng)全距(range)、標(biāo)準(zhǔn)差(standarddeviation)、方差(variance)全距=最大數(shù)-最小數(shù)簡(jiǎn)單但粗糙2022/12/10103(三)定距變項(xiàng)2022/12/10362、標(biāo)準(zhǔn)差反映的是每一個(gè)個(gè)案的分值與平均的分值之間的差距,簡(jiǎn)單來(lái)說(shuō),就是平均差異有多大。標(biāo)準(zhǔn)差越大表示差異越大。
2022/12/101042、標(biāo)準(zhǔn)差反映的是每一個(gè)個(gè)案的分值與平均的分值之間的差距,簡(jiǎn)3、方差標(biāo)準(zhǔn)差的平方2022/12/101053、方差2022/12/1038五、單變量描述統(tǒng)計(jì)的作用樣本情況報(bào)告了解數(shù)據(jù)的基本情況(判斷數(shù)據(jù)質(zhì)量)…………2022/12/10106五、單變量描述統(tǒng)計(jì)的作用2022/12/1039眾數(shù)中位數(shù)平均值集中趨勢(shì)值離散趨勢(shì)值異眾比率四分位差全距標(biāo)準(zhǔn)差2022/12/10107眾數(shù)集中趨勢(shì)值離散趨勢(shì)值異眾比率2022/12/1040六、單變量描述的操作1、次數(shù)、百分?jǐn)?shù)等Frequencies2、中位數(shù)等Frequencies+statistics3、均值與標(biāo)準(zhǔn)差Descriptive2022/12/10108六、單變量描述的操作2022/12/1041第三節(jié)雙變量描述性統(tǒng)計(jì)事物之間的關(guān)系確定性關(guān)系(函數(shù)關(guān)系)非確定性關(guān)系(相關(guān)關(guān)系)線(xiàn)性關(guān)系非線(xiàn)性關(guān)系必然現(xiàn)象不可能事件2022/12/10109第三節(jié)雙變量描述性統(tǒng)計(jì)事物之間的關(guān)系確定性關(guān)系非確定相關(guān):一個(gè)變項(xiàng)的值與另一個(gè)變項(xiàng)的值有連帶性相關(guān)的三種情況:正相關(guān)、負(fù)相關(guān)、零相關(guān)相關(guān)程度(0~1)相關(guān)的方向(+-)2022/12/10110相關(guān):一個(gè)變項(xiàng)的值與另一個(gè)變項(xiàng)的值有連帶性2022/12/1交互分類(lèi)與百分表交互分類(lèi):同時(shí)依據(jù)兩個(gè)變項(xiàng)的值,將所研究的個(gè)案分類(lèi)列聯(lián)表(交互分類(lèi)表)表的大小=行*列自變量、因變量2022/12/10111交互分類(lèi)與百分表交互分類(lèi):同時(shí)依據(jù)兩個(gè)變項(xiàng)的值,將所研究的個(gè)志愿性別男女總數(shù)快樂(lè)家庭103040理想工作401050增廣見(jiàn)聞10010總數(shù)60401002022/12/10112志愿性別男女總數(shù)快樂(lè)家庭103040理想工作401050增廣制作條件百分表的準(zhǔn)則——信息清楚、表格簡(jiǎn)潔社會(huì)學(xué)研究的常規(guī)做法:以自變項(xiàng)為計(jì)算百分率的方向——根據(jù)自己的研究需要三線(xiàn)表的制作(表格簡(jiǎn)明型1,去掉末行)2022/12/10113制作條件百分表的準(zhǔn)則——信息清楚、表格簡(jiǎn)潔2022/12/1第四節(jié)相關(guān)測(cè)量法相關(guān)測(cè)量法以一個(gè)統(tǒng)計(jì)值表示變項(xiàng)之間的相關(guān)程度這個(gè)值,通常稱(chēng)為相關(guān)系數(shù)2022/12/10114第四節(jié)相關(guān)測(cè)量法相關(guān)測(cè)量法2022/12/1047定類(lèi)和定類(lèi)變量定類(lèi)和定序變量Lambda相關(guān)測(cè)量法tau-y相關(guān)測(cè)量法基本邏輯:以一個(gè)定類(lèi)變項(xiàng)的值來(lái)預(yù)測(cè)另一個(gè)定類(lèi)變項(xiàng)的值時(shí),可以減少多少誤差其值介于0~1之間2022/12/10115定類(lèi)和定類(lèi)變量Lambda相關(guān)測(cè)量法基本邏輯:以一個(gè)定類(lèi)變項(xiàng)例題:考察性別(v2)與政治面貌(d11a)之間的關(guān)系2022/12/10116例題:2022/12/1049定序和定序變量Gamma系數(shù)Gamma系數(shù)按照同序?qū)彤愋驅(qū)€(gè)數(shù)來(lái)計(jì)算兩定序變量的相關(guān)程度和方向;同序?qū)彤愋驅(qū)ο嗖钤酱螅f(shuō)明相關(guān)越強(qiáng)2022/12/10117定序和定序變量Gamma系數(shù)Gamma系數(shù)按照同序?qū)彤愋驅(qū)}:考察受教育程度b4_a與對(duì)自己社會(huì)地位滿(mǎn)意程度i5_a之間的關(guān)系2022/12/10118例題:2022/12/1051定類(lèi)和定距變量定序和定距變量相關(guān)比率(eta平方系數(shù))原理:根據(jù)自變量取值來(lái)預(yù)測(cè)或估計(jì)因變量的均值2022/12/10119定類(lèi)和定距變量相關(guān)比率(eta平方系數(shù))2022/12/10例題:考察性別(v2)與家務(wù)勞動(dòng)時(shí)間之間的關(guān)系2022/12/10120例題:2022/12/1053定距和定距變量相關(guān)系數(shù)r即皮爾遜相關(guān)系數(shù)原理:兩個(gè)變量以平均數(shù)為基準(zhǔn)的平均共變程度r本身不具有消減誤差比率的性質(zhì),但r2具有這一性質(zhì)2022/12/10121定距和定距變量相關(guān)系數(shù)r原理:兩個(gè)變量以平均數(shù)為基準(zhǔn)的平均共例題:考察讀書(shū)年數(shù)(b2)與收入之間(c18_a)的關(guān)系2022/12/10122例題:2022/12/1055消減誤差比例(PRE/proportionatereductioninerror)PRE數(shù)值的意義為,用一個(gè)變項(xiàng)來(lái)解釋另一個(gè)變項(xiàng)時(shí)能夠減少的錯(cuò)誤比率X與Y的關(guān)系越強(qiáng),所能減少的預(yù)測(cè)誤差就會(huì)越多2022/12/10123消減誤差比例(PRE/proportionatered第五節(jié)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)是根據(jù)樣本調(diào)查結(jié)果證實(shí)或推翻總體有關(guān)假設(shè)的一種
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年影視制作公司導(dǎo)演聘用合同
- 2024年度影視版權(quán)轉(zhuǎn)讓協(xié)議
- 2024年投資借款展期協(xié)議書(shū)
- 基層護(hù)理工作計(jì)劃(4篇)
- 期末考試目標(biāo)計(jì)劃書(shū)(合集7篇)
- 2024年排水管道非開(kāi)挖頂管承包合同
- 暑假自學(xué)課2023年小學(xué)英語(yǔ)三升四課本預(yù)習(xí)-第11講-四上U2新課預(yù)習(xí)人教PEP版(學(xué)生版)
- 2024年建筑智能化系統(tǒng)安裝工程
- DB4101T 62.1-2023 網(wǎng)絡(luò)交易管理規(guī)范 第1部分:電子數(shù)據(jù)取證
- 2024年建筑設(shè)施安裝合作協(xié)議
- 木門(mén)窗施工方案
- 2024-2025學(xué)年八年級(jí)語(yǔ)文上冊(cè)期末專(zhuān)項(xiàng)復(fù)習(xí):綜合性學(xué)習(xí)+口語(yǔ)交際【考題猜想】原卷版
- 逐夢(mèng)芳華-吉林省松原市前郭爾羅斯蒙古族自治縣南部學(xué)區(qū)三校2024-2025學(xué)年九年級(jí)上學(xué)期11月期中道德與法治試題(含答案)
- 四川省成都市九縣區(qū)2024-2025學(xué)年高一上學(xué)期期中考試數(shù)學(xué)試題(含答案)
- 2024年深圳市中考英語(yǔ)試題及解析版
- 2024年中央企業(yè)全面質(zhì)量管理知識(shí)競(jìng)賽考試真題庫(kù)(含答案)
- (高清版)JTG D50-2017 公路瀝青路面設(shè)計(jì)規(guī)范
- 《中外舞蹈史》考試復(fù)習(xí)題庫(kù)(含答案)
- 《我家漂亮的尺子》課件-定稿
- 《蘿卜生長(zhǎng)過(guò)程》課件
- 思想道德與法治第二章
評(píng)論
0/150
提交評(píng)論