社會統(tǒng)計學(第一講)_第1頁
社會統(tǒng)計學(第一講)_第2頁
社會統(tǒng)計學(第一講)_第3頁
社會統(tǒng)計學(第一講)_第4頁
社會統(tǒng)計學(第一講)_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

社會統(tǒng)計學

(SocialStatistics)引子:在學統(tǒng)計學之前,我們需要了解……為什么要學統(tǒng)計學?統(tǒng)計學是什么?如何學習統(tǒng)計學?科學只有當它利用了數(shù)學的時候,它才達到了完善的程度?!R克思

對于追求效率的公民而言,統(tǒng)計思維總有一天會和讀寫能力一樣必要。

——H.G.Wells社會統(tǒng)計學是社會學十門必修課中的一門,它與“社會學調(diào)查研究方法”結合起來,完整的介紹了當代社會調(diào)查研究的科學方法與資料處理技術。社會統(tǒng)計學側重于介紹資料的收集、整理、分析和推論的處理技術。社會統(tǒng)計學的發(fā)展統(tǒng)計學的兩大流派:數(shù)理統(tǒng)計學派和社會統(tǒng)計學派數(shù)理統(tǒng)計學派的原創(chuàng)始人是比利時的A·凱特靳,其最大的貢獻就是將法國的古典概率引入統(tǒng)計學,用純數(shù)學的方法對社會現(xiàn)象進行研究;社會統(tǒng)計學派的首倡者是德國的K·克尼斯,他認為統(tǒng)計研究的對象是社會現(xiàn)象,研究方法為大量觀察法。社會統(tǒng)計學的兩大流派社會指標學派描述統(tǒng)計學派統(tǒng)計學是什么?——概念與內(nèi)涵

統(tǒng)計學是描述一系列可用于描述、整理和解釋資料或數(shù)據(jù)的統(tǒng)計工具和技術。社會統(tǒng)計學是運用統(tǒng)計的一般原理,對社會各種靜態(tài)結構與動態(tài)趨勢進行定量描述或推斷的一種專門方法與技術。

統(tǒng)計學的基本分類:描述統(tǒng)計與推斷統(tǒng)計

描述統(tǒng)計(DescriptiveStatistics):用于整理、描述所收集的數(shù)據(jù)的特征推論統(tǒng)計(InferentialStatistics):利用較小群體的數(shù)據(jù)(樣本)來推論可能的較大群體(總體),通過推論統(tǒng)計,我們可以解釋數(shù)據(jù)。社會統(tǒng)計的方法1.大量觀察法所謂大量觀察,即是就總體中足夠多的單位進行調(diào)查和綜合分析,用以反映社會總體的數(shù)量特征。

2.大數(shù)規(guī)律隨機現(xiàn)象出現(xiàn)的基本規(guī)律,其一般意義是:觀察過程中每次取得的結果可能不同(因為具有偶然性),但大量重復觀察結果的平均值卻幾乎接近某個確定的數(shù)值。所謂描述統(tǒng)計就是討論范圍僅以搜集資料本身為限,而不予以擴大。

所謂推論統(tǒng)計,主要是依據(jù)概率論,研究如何依據(jù)有限資料對總體性質(zhì)作推斷,從而使統(tǒng)計的功能大為擴充。

假設檢驗

參數(shù)估計

社會統(tǒng)計工作的程序制定計劃

統(tǒng)計調(diào)查統(tǒng)計整理統(tǒng)計分析統(tǒng)計報告如何學習統(tǒng)計學?樹立信心培養(yǎng)興趣由淺入深,逐步推進。仔細閱讀你的教材按時完成練習。多多留意報刊、雜志甚至學術期刊上的統(tǒng)計實例。多多使用統(tǒng)計軟件練習數(shù)據(jù)分析。第一章社會學研究與統(tǒng)計分析第一節(jié)社會學研究的科學性

科學的研究邏輯操作化通過對理論的演繹建立研究假設科學實驗得出結論社會科學研究的一般過程確定課題、了解情況建立研究假設概念的操作化設計問卷、抽樣調(diào)查統(tǒng)計分析假設檢驗、得出結論案例:在校大學生的戀愛行為是否存在性別差異?——誰更需要愛情?男生還是女生?事實上,社會調(diào)查與統(tǒng)計推論是大多數(shù)“社會科學”之所以稱之為“科學”的基石!概念(Concept):人們對事物本質(zhì)的認識,是研究的基本單位,具有抽象性。定義(Definition):將概念呈現(xiàn)、描述出來,從而明確認識對象。操作化定義(Operationaldefinition):用一系列可以觀察、可以測量的指標來模擬或表述定義,使得非量化的概念得以運算并得以操作測量。概念抽象定義操作化定義都市化現(xiàn)代都市的生活形態(tài)婦女就業(yè)人數(shù)、子女數(shù)、交通;通訊手段等個人現(xiàn)代化一個人由于經(jīng)濟、工業(yè)等現(xiàn)代因素所產(chǎn)生的內(nèi)部變化對時間、效率、家庭、親屬、消費、自信等具體問題的看法子代偏重經(jīng)濟上、感情上和生活上對子代過分的偏重子代撫育費與家庭平均消費的比較、子代過生日的花費與長輩生日花費的比較、花在子代閑暇時間的多少等開始學習社會統(tǒng)計學之前的知識儲備什么是變量?變量有哪些層次?不同類型變量的統(tǒng)計表制作方法?總體與單位所謂總體,就是作為統(tǒng)計研究對象的、由許多具有共性的單位構成的整體??傮w也有人稱之為母體。構成總體的每一個個體稱為總體單位,簡稱單位,也稱為個體。

有限總體與無限總體可加總體與不可加總體

總體在抽樣調(diào)查及推論統(tǒng)計中,還引出了它與樣本總體這個概念的聯(lián)系與區(qū)別。推論統(tǒng)計有“部分推斷總體”的特征。通過抽樣得到的用以推斷總體特征的那個“部分”,在統(tǒng)計學上稱為樣本或樣本總體。樣本中所含的單位數(shù),在統(tǒng)計學上稱為樣本大小,也叫做樣本容量。從總體抽選出樣本的過程叫抽樣,也有叫取樣的。二者是互為存在條件地聯(lián)結在一起的,二者的地位在某種意義上不是固定不變的。

1、相互依存關系。

2、當研究目的和研究范圍變動,總體和個體可以相互轉化。總體的特征:大量性、同質(zhì)性和差異性。總體的這三個特征是缺一不可的。大量性是條件、同質(zhì)性是基礎,差異性是前提。樣本

樣本是從總體中抽取的一部分個體所組成的集合,也稱子樣。樣本容量是指樣本所包含的個體數(shù)。當樣本容量大于30時,為大樣本。樣本個數(shù)是指從總體中最多可以抽取的不同樣本的套數(shù)。樣本容量用n表示。樣本個數(shù)用m表示。

總體與樣本的關系1、總體是所要研究的對象,而樣本則是所要觀測的對象。2、樣本是用來推斷總體的。3、總體和樣本的角色是可以改變的。4、總體與樣本都有大量性,同質(zhì)性和差異性的特征。樣本容量用n表示。樣本個數(shù)用m表示。

變量(Variables)——在統(tǒng)計學中表示研究對象的特征,變量下的各種表現(xiàn)形式或不同取值,就是變量值。變量變量變量值性別家庭子女數(shù)重要性文化程度男;女1個;2個;3個;…非常重要;一般;不重要大學;中學;小學;文盲變量取值時注意的問題:完備性互斥性單變量分析——變量的分布(frequencydistribution)分布——某個變量的變量值出現(xiàn)的次數(shù)或頻次,也稱頻次分布。例:家庭結構(變量X)可能的取值包括:X1——由父母和未婚子女組成的核心家庭X2——由父母和單一已婚子女組成的三代人家庭,即主干家庭X3——由父母和多對已婚子女所組成的三代人家庭,即聯(lián)合家庭

如果我們將調(diào)查結果按照被訪人的回答,分別歸入上述三類,于是有以下三對數(shù)據(jù):(X1,n1)(X2,n2)(X3,n3)

(Xk,nk)

其中Xi表示變量X的第i個取值;ni表示該取值所對應的次數(shù)所謂分布,實際上就是這些對數(shù)據(jù)的集合。當n代表不同的含義時,表示不同的分布如:當n表示概率時,稱作概率分布當n表示頻次時,稱作頻次分布當n表示百分比時,稱作頻率或相對頻次分布家庭結構頻次核心家庭1050主干家庭720聯(lián)合家庭110其他250總數(shù)2130家庭結構的頻次分布(XX地,XX年XX月)家庭結構百分比核心家庭49.3主干家庭33.8聯(lián)合家庭5.2其他11.7總和百分比100家庭結構的百分比分布(XX地,XX年XX月,N=2130)正面次數(shù)概率0123456789100.000.010.040.120.210.250.210.120.040.010.00拋10次硬幣正面出現(xiàn)次數(shù)的概率分布第二節(jié)社會調(diào)查資料的特點和統(tǒng)計學的運用一、社會調(diào)查資料的特點:(一)隨機性確定性現(xiàn)象:“若A,則必有B”,A與B之間,存在確定性的函數(shù)關系。非確定性現(xiàn)象:若A,則可能有B,或者C;D;E。f(A)BA●●●●●●●●●●●●●●●●●●●●●BA(二)統(tǒng)計規(guī)律性表面雜亂無章的隨機現(xiàn)象,實際上是有內(nèi)在規(guī)律性的。統(tǒng)計規(guī)律性表現(xiàn)為大量觀察或試驗中隨機事件發(fā)生的頻率的穩(wěn)定性,即一個隨機事件發(fā)生的頻率經(jīng)常在某個定值附近擺動,而且,試驗次數(shù)越多,一般擺動越少。二、統(tǒng)計學的運用介紹有關社會調(diào)查資料收集、整理、分析和推論的統(tǒng)計方法。社會統(tǒng)計學的特點:抽象概念向操作化定義,設計好調(diào)查問卷;被測量對象是人,主觀意識影響資料收集;低層次變量占較大比重。三、統(tǒng)計分析的作用及主要內(nèi)容統(tǒng)計分析在社會調(diào)查研究中的功用,主要表現(xiàn)在經(jīng)驗層次的大面積數(shù)據(jù)處理方面。統(tǒng)計結果不能輕率的作出因果的結論。例:(P15-表1-10和表1-11)社會科學研究的一般過程確定課題、了解情況建立研究假設概念的操作化設計問卷、抽樣調(diào)查統(tǒng)計分析假設檢驗、得出結論統(tǒng)計分析內(nèi)容主要分為:統(tǒng)計描述和統(tǒng)計推論第三節(jié)怎樣選用統(tǒng)計分析方法

一、全面調(diào)查和非全面調(diào)查全面調(diào)查是對所研究全部對象進行觀察與調(diào)查,從而掌握整個單位的全部資料。對全面調(diào)查,一般可用統(tǒng)計描述。統(tǒng)計描述是將所觀察的數(shù)據(jù)、資料,進行整理、歸納和分析,以期找到某種規(guī)律。非全面調(diào)查是在全部研究對象中只調(diào)查其中的一部分。在非全面調(diào)查中,以概率抽樣法最重要。抽樣調(diào)查是在一定條件下,科學、客觀的抽取總體中一部分單位來加以研究,其目的是獲得對于總體性質(zhì)的正確敘述。二、單變量和多變量單變量主要調(diào)查的內(nèi)容是一個或多個相互獨立的概念,需要對每個獨立的變量研究其變動情況和頻次,及集中和分散的特征。二變量研究兩個變量之間是否存在關系及關系密切程度,及研究結論是否可以推斷整體。多變量研究多種關系,一因多果和一果多因。單變量分析——變量的分布(frequencydistribution)分布——某個變量的變量值出現(xiàn)的次數(shù)或頻次,也稱頻次分布。例:家庭結構(變量X)可能的取值包括:X1——由父母和未婚子女組成的核心家庭X2——由父母和單一已婚子女組成的三代人家庭,即主干家庭X3——由父母和多對已婚子女所組成的三代人家庭,即聯(lián)合家庭

兩變量關系——命題的研究兩個變量之間是否存在關系?關系的密切程度(強度)如何?自變量(independentvariable):也叫獨立變量,由研究者主動操縱,或被研究者界定為不受其他變量影響,獨立變化的變量。因變量(dependentvariable):也叫依變量,指受其他變量影響,隨其他變量變化的變量。

自變量與因變量是就因果關系而言的,判斷自變量與因變量的標準:(1)時間的先后。由于后發(fā)生者無法影響先發(fā)生者,所以先發(fā)生者是自變量;(2)變量的不變性與可變性。在社會研究中常將一些具有固定性、持久性的變量作為自變量。對于多變量的研究,情況更為復雜,它們除了兩兩之間可能存在聯(lián)系,而且還可能存在網(wǎng)狀、鏈狀、一因多果或一果多因等多種聯(lián)系,這些都屬于更高層次的統(tǒng)計技巧。1、定類層次變量(NominalVariable):變量取值只有類別屬性之分,根據(jù)變量值,只能知道研究對象是相同或是不同。從數(shù)學運算特征來看,只具有等于或不等于(=、≠)的性質(zhì)。例如:性別。變量層次2、定序?qū)哟巫兞浚∣rdinalVariable):變量取值除了有類別屬性之外,還有等級,次序的差別,其數(shù)學特性除了(=、≠)之外,還有大于或小于(><)之分。例如文化程度、社會經(jīng)濟地位等。2011中國大學排行榜10中山大學廣東綜合33.7734.4729.6042.6128華南理工大學廣東理工16.7315.3614.1033.2163暨南大學廣東綜合8.206.947.0318.7971華南師范大學廣東師范6.644.037.7413.3474華南農(nóng)業(yè)大學廣東農(nóng)林6.156.175.856.03102南方醫(yī)科大學廣東醫(yī)藥4.363.784.545.46108深圳大學廣東綜合3.944.212.807.26128廣州中醫(yī)藥大學廣東醫(yī)藥3.162.831.6411.76173廣州大學廣東綜合1.842.061.213.40名次學校名稱所在省市類型總分科學研究人才培養(yǎng)綜合聲譽3、定距層次變量(IntervalVariable):變量取值除了有類別、次序?qū)傩灾?,取值之間的距離還可以用標準化的距離去量度。其數(shù)學特性除了(=、≠;><)之外,還可以進行加或減(+,-)。例如智商。4、定比層次變量(RatioVariable):變量取值除了有上述三種屬性之外,其取值還可以構成一個有意義的比率,其數(shù)學特性除了(=、≠;><;+,-)之外,還可以進行除法運算。例如年齡。定比變量和定距變量的差別在于前者有一個真正有意義的零點。1、高層次的變量包含低層次變量的數(shù)學特征。

變量層次的比較2、在社會學研究中,一般不區(qū)分定距和定比變量,而是當作一類,稱作定距變量。4、變量的層次與社會實際衡量之間有可能存在著差距或不一致性。5、根據(jù)研究內(nèi)容不同,變量的層次也可能不同3、一個變量的層次并不是唯一的。高層次的變量可以作為低層次變量來使用,但是會使資料的信息使用不完全。層次數(shù)學運算特征定類定序定距定比=,≠√√√√<,>√√√+,-√√×,÷√統(tǒng)計分析全面調(diào)查多變量單變量定距定序定類定距定序定類抽樣調(diào)查其他非概率抽樣多變量定距定序定類單變量定距定序定類統(tǒng)計描述統(tǒng)計推論應用——如何制作不同類型的單變量統(tǒng)計表?1、定類單變量統(tǒng)計表性別頻次百分比男女2747155963.836.2總計4306100表1:微博用戶的性別統(tǒng)計表(N=4306)(資料來源:SSI在線樣本庫,調(diào)查地包括北京、上海、廣州、深圳、成都、沈陽、西安、杭州八市)

表頭

表號標識行

主體行表尾2、定序單變量統(tǒng)計表表2:微博用戶的教育程度統(tǒng)計(N=4306)受教育程度頻數(shù)百分比初中及以下高中、職高、技校大專大學本科研究生及以上1723786627524340.45.520.163.910.1總計4306100(資料來源:SSI在線樣本庫,調(diào)查地包括北京、上海、廣州、深圳、成都、沈陽、西安、杭州八市)3、定距和定比單變量統(tǒng)計表定距和定比變量的兩種類型:離散型變量——取值為有限個或列為有限個,如子女數(shù)連續(xù)型變量——取值為有限或無限區(qū)間內(nèi)的任意實數(shù),即變量的取值連續(xù),如身高若變量為離散型變量,且取值相對較少,可以按照定類或定序統(tǒng)計表方式統(tǒng)計頻次或百分比。若變量為連續(xù)型變量,則需要將變量值分為若干個區(qū)間或組,統(tǒng)計每一個組內(nèi)的頻次或百分比。數(shù)據(jù)分組時需要考慮的幾個問題:

A組數(shù)B組距C組限如何制作分組統(tǒng)計表1、確定組數(shù):一般調(diào)查總數(shù)N與分組數(shù)有如下經(jīng)驗關系調(diào)查總數(shù)N分組數(shù)K50~1006~10100~2507~12250以上10~202、確定組距:分為等距分組與非等距分組,一般來說為等距分組等距分組組距計算公式:組距(h)=(最大值-最小值)/組數(shù)斯特格斯(Sturges)經(jīng)驗公式確定組數(shù):K=1+3.322lgN3、確定組限:一個組的最小值叫下限,最大值叫上限各組中心值bi計算公式4、分組原則:不重復、不遺漏,組上限不在內(nèi)5、中心值計算缺上限開口組組中值bi=下限+鄰組組

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論