版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第十四章統(tǒng)計分析一、知識框架統(tǒng)計分析及其目的統(tǒng)計分析及其目的統(tǒng)計分析的過程統(tǒng)計分析概述統(tǒng)計分析的過程統(tǒng)計分析概述統(tǒng)計分析的層次統(tǒng)計分析的層次描述統(tǒng)計及其內(nèi)容描述統(tǒng)計及其內(nèi)容描述統(tǒng)計與推斷統(tǒng)計推斷統(tǒng)計與抽樣分布描述統(tǒng)計與推斷統(tǒng)計推斷統(tǒng)計與抽樣分布推斷統(tǒng)計的兩種基本形式推斷統(tǒng)計的兩種基本形式集中量數(shù)分析集中量數(shù)分析離散量數(shù)分析單變量統(tǒng)計分析離散量數(shù)分析單變量統(tǒng)計分析統(tǒng)計分析統(tǒng)計分析單變量統(tǒng)計推斷單變量統(tǒng)計推斷雙變量分析的內(nèi)容雙變量分析的內(nèi)容雙變量統(tǒng)計分析雙變量統(tǒng)計分析雙變量分析的方法雙變量分析的方法多變量相關(guān)分析多變量相關(guān)分析多元回歸分析多元回歸分析多元方差分析多元方差分析多變量統(tǒng)計分析簡介因子分析多變量統(tǒng)計分析簡介因子分析對數(shù)線性模型分析對數(shù)線性模型分析結(jié)構(gòu)方程模型分析結(jié)構(gòu)方程模型分析多層線性模型分析多層線性模型分析二、知識點與關(guān)鍵詞解釋序號知識點頁碼教材章節(jié)1統(tǒng)計分析的目的P24814.1.12統(tǒng)計分析的層次P24914.1.33描述統(tǒng)計的內(nèi)容P25014.2.14推斷統(tǒng)計的形式P25114.2.35常用的集中量數(shù)與離散量數(shù)P25414.3.16單變量統(tǒng)計推斷P26014.3.37雙變量統(tǒng)計分析的內(nèi)容P26114.4.18雙變量統(tǒng)計分析的方法P26214.4.29多變量統(tǒng)計分析的方法P27114.5統(tǒng)計分析統(tǒng)計分析就是運用統(tǒng)計學原理和方法處理調(diào)查所獲得的數(shù)據(jù)資料,簡化和描述數(shù)據(jù)資料、揭示變量之間的統(tǒng)計關(guān)系,并進而推斷總體的一整套程序和方法。描述統(tǒng)計描述統(tǒng)計,就是運用數(shù)字,如頻數(shù)、百分比、平均值,以及圖、表等形式匯總所收集來的數(shù)據(jù)信息。推斷統(tǒng)計推斷統(tǒng)計,是運用概率分布知識,通過樣本統(tǒng)計量預測總體參數(shù)的分析方法。抽樣分布所謂抽樣分布,是指在一個總體中重復抽取許多大小一樣樣本的統(tǒng)計量而形成的分布。集中量數(shù)分析所謂集中量數(shù)分析,是指用一個具體的統(tǒng)計量反映一組數(shù)據(jù)向該統(tǒng)計量集中趨勢的統(tǒng)計方法,它所表示的是一組數(shù)據(jù)集中的程度或水平。集中量數(shù)有平均數(shù)、中位數(shù)、眾數(shù)、四分位數(shù)、百分位數(shù)以及倒數(shù)平均數(shù)、幾何平均數(shù)等。其中,常用的集中量數(shù)是平均數(shù)、中位數(shù)和眾數(shù)。離散量數(shù)所謂離散量數(shù),就是表示一組數(shù)據(jù)變異程度或分散程度的量數(shù)。離散量數(shù)越大,表示數(shù)據(jù)分布范圍越廣,越不集中,越不整齊;反之,離散量數(shù)越小,表示數(shù)據(jù)分布范圍越集中,變動程度越小。離散量數(shù)有多種,如方差和標準差、全距、四分位差、異眾比率、離散系數(shù)、偏態(tài)系數(shù)等。其中,常用的是方差與標準差、全距、異眾比率和偏度系數(shù)。相關(guān)關(guān)系變量間的相關(guān)關(guān)系,是指當一個變量X發(fā)生變化時,另一個變量Y也隨之發(fā)生變化,反之,當Y發(fā)生變化時,X也發(fā)生變化。人們通常把兩個變量之間的相關(guān)關(guān)系表示為X←→Y。必須指出,存在相關(guān)關(guān)系的兩個變量,只強調(diào)它們之間存在著相互影響的關(guān)系,而不清楚也不在乎它們變化的先后,因而也無所謂前因后果的問題。因果關(guān)系兩變量間的因果關(guān)系,是指一變量的變化可以確定為另一變量變化的原因的關(guān)系。在自然科學中,確定現(xiàn)象之間的因果關(guān)系比較容易。在社會研究中,要確定兩個變量之間的因果關(guān)系則比較困難。三、課后習題詳解1.如何認識統(tǒng)計分析在社會研究中的作用?答案:社會調(diào)查往往要涉及大量的變量并包括眾多的個案,而且這些變量間的關(guān)系又往往是錯綜復雜的,這就使每項調(diào)查所要處理與分析的數(shù)字信量十分龐大,處理和理解這么多信息資料是極其困難的,必須設(shè)法將其提煉壓縮,找出其內(nèi)在的特征。統(tǒng)計分析就是幫助人們提高控制和處理數(shù)據(jù)的能力,透過這些龐雜的數(shù)字和復雜的關(guān)系去把握其內(nèi)在規(guī)律性的一種有力的工具。統(tǒng)計分析的作用主要有:可對資料進行簡化和描述。統(tǒng)計分析的作用之一就是從精簡的數(shù)字來綜合大量的事實,對研究變量自身特征作出清晰的描述,這也就是所謂的描述性統(tǒng)計。可通過樣本資料推論總體。在社會研究中,大量調(diào)查是抽樣調(diào)查,抽樣調(diào)查所關(guān)注的不是樣本本身的性質(zhì),而是樣本所在的更大總體的特性。因此,如何由樣本資料概推到總體,就成為抽樣調(diào)查必須解決的一個問題,統(tǒng)計學很好地解決了這一問題,它可以通過參數(shù)估計和統(tǒng)計檢驗等手段將樣本資料推論到總體并能指出這種推論的誤差和做出這種推論把握有多大,這就是所謂推斷性統(tǒng)計,它是建立在概率論基礎(chǔ)上的。推論性統(tǒng)計使抽樣調(diào)查科學化,它與描述性統(tǒng)計和抽樣調(diào)查一起成為一整套定量分析方法。從而大大擴展了社會調(diào)查的范圍和提高了社會調(diào)查的效率,并使社會研究得以深入進行??蓪ψ兞恐g的關(guān)系進行描述和深入的分析。變量之間的關(guān)系是社會研究最主要的內(nèi)容之一,統(tǒng)計分析為深入描述和分析變量間關(guān)系,進而為達到理論解釋提供了十分有力的手段。解析:本題主要考察對統(tǒng)計分析研究目的的理解。在統(tǒng)計分析是一種基于系統(tǒng)的模式或模型的理解方法,它按照一定的程序收集、整理和分析研究數(shù)據(jù),發(fā)現(xiàn)數(shù)據(jù)背后所隱含的社會意義。同時,還提供了檢驗理論假設(shè)的方法,使人們對研究對象建立起一個客觀、系統(tǒng)和全面的認識和合理推論。2.某城市2015年有大學生106.95萬人,從中抽取2000人進行煙癮調(diào)查,在調(diào)查問卷中提問:“在過去一周中,你每天至少吸一包煙的天數(shù)有多少?”(1)在以上敘述中,什么是總體,什么是樣本?答:總體時2015年某城市的106.95萬大學生;樣本是接受調(diào)查的2000名大學生(2)經(jīng)統(tǒng)計分析發(fā)現(xiàn),回答0天的學生占89%,它是一個參數(shù)還是一個統(tǒng)計量?為什么?答:它是一個樣本統(tǒng)計量??傮w參數(shù)可以通過對總體進行普查和研究計算得到,用于描述總體的特征或規(guī)律,樣本統(tǒng)計量則是基于樣本數(shù)據(jù)計算得出的指標,可以通過統(tǒng)計推斷估計總體參數(shù)。3.假如你獲得了一份人口普查的總體數(shù)據(jù),你會如何進行統(tǒng)計分析?解釋為什么你只需要進行描述分析,而不需要進行推斷統(tǒng)計。答:普查是指對總體所有對象進行數(shù)據(jù)收集。數(shù)據(jù)分析分為描述統(tǒng)計和推斷統(tǒng)計。描述統(tǒng)計研究的是數(shù)據(jù)收集、處理、匯總、圖表描述、概括與分析等方法,而推斷統(tǒng)計是研究如何利用樣本數(shù)據(jù)來推斷總體特征的方法。普查意味著我們已經(jīng)收集到了研究對象的總體數(shù)據(jù),因此不需要通過樣本來推斷總體參數(shù)。4.2010年中國綜合社會調(diào)查(ChineseGeneralSocialSurvey,CGSS)顯示了我國城鄉(xiāng)男性體重狀況(見表14-6),根據(jù)統(tǒng)計分析結(jié)果進行說明。表14-62010年我國城鄉(xiāng)男性體重狀況單位:kg樣本量平均數(shù)中位數(shù)標準差最小值最大值農(nóng)業(yè)戶口285762.676010.7435123非農(nóng)戶口252368.936911.2336.5115答:如表所示,農(nóng)業(yè)戶口男性體重的均值為62.67公斤,明顯低于非農(nóng)戶口男性體重均值(68.93公斤),前者中位數(shù)為60公斤,也低于后者的69公斤。從離散趨勢看,農(nóng)業(yè)戶口男性極差為88公斤,而非農(nóng)戶口男性極差為78.5公斤,說明農(nóng)業(yè)戶口男性存在兩極分化,但從標準差看,非農(nóng)戶口男性的差異(標準差為11.23)要大些。5.2010年中國綜合社會調(diào)查(CGSS)問道:“您上一周是否為了取得收入而從事一小時以上的勞動?”在11764個被訪者中,有6751人回答“是”,請證明回答“是”的總體比例95%的置信區(qū)間為[0.56,0.58]。答:已知:置信區(qū)間=點估計±誤差邊際,誤差邊際:標準誤的倍數(shù),即等于z*標準誤點估計:6751/11764=0.0.57386943標準誤:=0.0.004559320.57386943-1.96*0.00455932=0.564933160.57386943+1.96*0.00455932=0.5828057所以回答“是”的總體比例95%的置信區(qū)間為[0.56,0.58]。6.以下假設(shè)是虛無假設(shè)還是備擇假設(shè)?說明這些假設(shè)的參數(shù)符號和參數(shù)值。(1)在大學中,談戀愛的學生比例為0.37。答:虛無(原)假設(shè),H0:μ=0.37Ha:μ≠0.37。(2)目前所有在校大學生的飲酒比例小于10年前的0.31。答:備擇假設(shè),H0:μ=0.31Ha:μ<0.31。(3)某大學在校男生的平均身高大于172cm。答:備擇假設(shè),H0:μ=172Ha:μ>172。7.2010年中國綜合社會調(diào)查(CGSS)調(diào)查了男性的吸煙和飲酒狀況,結(jié)果見表14-7。表14-72010年我國成年男性吸煙、飲酒狀況單位:人飲酒合計否是吸煙否387381768是2908061096合計67711871864根據(jù)上表結(jié)果,對吸煙和飲酒兩變量之間的關(guān)系進行χ2檢驗。答:假定隨機大樣本,每個單元格至少5個觀測值,總的樣本量大于40。假設(shè):H0:吸煙和飲酒在統(tǒng)計上獨立;Ha:吸煙和飲酒在統(tǒng)計上相依。計算卡方值:X2=(387-(768*677/1864))^2/(768*677/1864)+(381-(768*1187/1864))^2/(768*1187/1864)+(290-(677*1096/1864))^2/(677*1096/1864)+(806-(1187*1096/1864))^2/(1187*1096/1864)=111.81284計算p值為0.000結(jié)論,p(0.000)<a(0.05),拒絕原假設(shè),說明吸煙與飲酒在統(tǒng)計上相依。8.一項關(guān)于居民幸福感的調(diào)查數(shù)據(jù)的分析結(jié)果顯示,幸福感(不太幸福、一般、比較幸福)和收入(低于平均數(shù)、平均數(shù)、高于平均數(shù))之間的Gamma系數(shù)為0.45,請解釋。Gamma系數(shù)為0.45,說明幸福感和收入之間有接近中等程度的正關(guān)聯(lián)。9.據(jù)某年度一項涉及63個國家的預期壽命研究表明,預期壽命(Y)與人均國民生產(chǎn)總值(X)的預測方程為Y=55+5.6X。其中預期壽命的范圍為54歲(海地)和79歲(加拿大),人均國民生產(chǎn)總值的取值范圍為0.037萬美元(塔吉克斯坦)至4萬美元(瑞士)。(1)解釋Y的截距和斜率。答:截距是人均GDP等于0時Y的值,即55;斜率是自變量人均國民生產(chǎn)總值每增加一個單位時預期壽命的變化,即人均國民生產(chǎn)總值每增加1萬美元,預期壽命增加5.6歲。(2)若海地人均國民生產(chǎn)總值為0.043美元,加拿大3.5美元,求兩國的預期壽命預測值。答:海地預期壽命為55.02歲,加拿大為74.6歲。(3)相關(guān)系數(shù)為0.72,請解釋。答:相關(guān)系數(shù)為0.72,意味著預期壽命與人均國民生產(chǎn)總值存在中度相關(guān)的線性關(guān)系,但這并不意味著預期壽命與人均國民生產(chǎn)總值一定有因果關(guān)系。10.簡述因果關(guān)系的三個條件。對每一個條件,描述兩個變量之間因為違背這些條件而沒有因果關(guān)系的情況。答:變量之間有相關(guān)關(guān)系,兩個變量有一定的時間順序,原因在前,結(jié)果在后,還要排除其他變量的影響。小學生的身高與數(shù)學分數(shù)有相關(guān)性,身高高的小學生,數(shù)學分數(shù)高的可能性大,同時身高在時間上是先于數(shù)學學習的,也不受數(shù)學學習的影響,但顯然小學生身高與數(shù)學分數(shù)之間是虛假相關(guān),因為真正影響數(shù)學分數(shù)的重要因素是智力,身高和智力的發(fā)育與年齡密切相關(guān)。因此,如果控制智力水平的話,身高的學習效應就很可能消失了。四、考研真題與典型題詳解(一)簡答題1.在定距變量的統(tǒng)計分析中,怎樣認識相關(guān)分析與回歸分析的關(guān)系?答:兩個定距變量的統(tǒng)計分析,是傳統(tǒng)統(tǒng)計分析的主要內(nèi)容,因而也是相對成熟的統(tǒng)計分析方法。它包括相關(guān)分析方法和回歸分析方法。相關(guān)分析與回歸分析,是兩種既有密切聯(lián)系、又有本質(zhì)區(qū)別的統(tǒng)計分析方法。首先,相關(guān)分析與回歸分析都以兩個定距變量的線性關(guān)系為基礎(chǔ),分析與解釋兩個變量之間的相關(guān)或相互影響作用力的大小。其次,相關(guān)分析是回歸分析的前提和基礎(chǔ)。一般地說,只有當兩個變量之間存在著比較高的相關(guān)關(guān)系,回歸分析才有價值,而且相關(guān)程度越高回歸預測效果越好。因此,在定距—定距變量分析過程中,通常是先進行相關(guān)分析,然后再選擇其中那些有比較強的相關(guān)關(guān)系的變量進行回歸分析。但是,相關(guān)分析與回歸分析又是兩種不同分析方法,它們的區(qū)別是:其一,相關(guān)分析是對兩個變量雙向依存關(guān)系的分析,通常不確定誰是自變量誰是因變量;回歸分析是對兩個變量單向關(guān)系的分析,即對自變量影響因變量的分析,必須明確誰是自變量、誰是因變量,而且對于自變量每一個給定的數(shù)值,通過回歸方程求得的因變量的估計值不只是一個確定的數(shù)值,而是許多可能數(shù)值的平均數(shù),因而可以計算估計值的誤差。其二,從分析層次上講,相關(guān)分析是一種描述和解釋既存事實的研究方法,而回歸分析則是一種通過對已有事實的分析進一步推斷和預測未來可能發(fā)生什么的研究方法。因此,與相關(guān)分析相比較,回歸分析是一種更高層次、更為深刻的統(tǒng)計分析方法。解析:本題主要考察兩變量之間統(tǒng)計分析方法中的主要內(nèi)容,即相關(guān)分析方法和回歸分析方法。在作答時首先對于二者各自的定義要有一個清晰的理解,其次在敘述二者之間的關(guān)系時,既要指出兩種分析方法的內(nèi)在聯(lián)系,它們之間是相互影響、相互作用的關(guān)系;也要區(qū)分兩種方法之間的不同之處,主要的區(qū)別是在分析路徑和分析層次方面。知識點:相關(guān)分析與回歸分析的內(nèi)涵及二者之間的聯(lián)系與區(qū)別。2.試述置信區(qū)間的基本概念,如何用置信區(qū)間進行參數(shù)估計?答:置信區(qū)間是指進行區(qū)間估計時,在某一概率水平下總體參數(shù)所處的數(shù)值區(qū)間。區(qū)間的上、下限(端點)稱為臨界值,所確定的概率水平稱為置信水平或置信度,以概率1-α表示,α稱為顯著性水平,表示該區(qū)間估計的不可靠性程度,即估計參數(shù)位于該區(qū)間時可能犯錯誤的概率。顯然,1-α則表示估計參數(shù)落入置信區(qū)間的可靠性程度或把握度。所謂參數(shù)估計,就是運用樣本統(tǒng)計量對總體參數(shù)進行推斷或估計的統(tǒng)計過程與統(tǒng)計方法,在實際研究工作中通常選擇區(qū)間估計法。區(qū)間估計的理論基礎(chǔ)是抽樣分布,核心問題是把樣本統(tǒng)計量與總體參數(shù)之間的關(guān)系轉(zhuǎn)換成抽樣分布來處理。區(qū)間估計的一般程序是:①確定置信水平,區(qū)間估計是與這種估計的可信度(置信水平)的要求是分不開的,要求估計的越可信,即置信水平越高高則估計的區(qū)間也越大。②計算標準誤差,根據(jù)樣本分布特點和樣本不同統(tǒng)計值,分別采用不同的方法確定標準誤差。③根據(jù)樣本統(tǒng)計值和標準誤差確定置信區(qū)間。解析:本題主要考察對于區(qū)間估計這種參數(shù)估計方法的把握程度。在回答時,首先要對參數(shù)估計的類型以及置信區(qū)間的基本概念有一個總體說明,其次在說明如何用置信區(qū)間去進行參數(shù)估計時,需要對于區(qū)間估計方法有一個簡要介紹,再完整闡釋區(qū)間估計方法的一般程序以及不同的置信區(qū)間所代表的實際意義。知識點:相關(guān)分析與回歸分析的內(nèi)涵及二者之間的聯(lián)系與區(qū)別。3.簡述回歸方程最重要的統(tǒng)計功能答:回歸方程是根據(jù)樣本資料,通過回歸分析所得到的反映一個變量(因變量)對另一個或一組變量(自變量)的回歸關(guān)系的數(shù)學表達式,建立回歸方程通常采用的方法稱為最小二乘方法,其最簡化的形式如:y=a+bx,其中,y為因變量,x為自變量,a為常數(shù)項,b為系數(shù)。線性回歸分析,實質(zhì)上就是要在變量X和變量Y之間建立一個線性回歸方程,從而用X去預測Y?;貧w方程最重要的功能就是能夠通過正確的擬合達到預報和控制的功能。下面結(jié)合一個虛擬的回歸方程了解這兩個功能。比如教育的經(jīng)濟回報現(xiàn)象在不同社會條件下都得以證實。假定經(jīng)過隨機抽樣取得某地區(qū)有關(guān)“受教育年限”(單位:年)與“當前實際收入”(單位:元)的樣本,得到回歸方程如下:其中,y為“當前實際收入”,x為樣本的“受教育年限”。該方程表面,受教育年限每增加一個單位,當前實際收入就會有300個單位的增長。換句話說,樣本的受教育程度提高一年,當前實際收入就會預期有300元的增長。從預報的功能看,該回歸方程表明,y將隨著x的增高或降低相應有b個單位的變化。在本例中,樣本手教育年限降低一年,當前實際收入會有300個單位的減少;降低二年,則會有600個單位的減少。回歸方程可以依據(jù)自變量的單位變化,預測因變量的相應變化。從控制的功能看,該回歸方程表明,人為地提高受教育的年限,將預期得到收入的普遍提高。這種人為地提高某一因素水平,從而促進經(jīng)濟社會進步的原理,普遍應用在公共政策領(lǐng)域。解析:本題主要考察對于回歸方程的建立過程以及回歸分析方法的功能的理解。在作答時要注意對于回歸方程公式的實際意義的準確把握,首先要對回歸方程的構(gòu)成做一個總體闡釋,根據(jù)回歸方程的內(nèi)在意義去理解回歸分析方法所具有的社會學意義,并進一步理解回歸方程所具有的統(tǒng)計學功能。最后可以適當結(jié)合相應案例更加具體地去說明實際功能。知識點:回歸分析方法的內(nèi)涵以及回歸方程的統(tǒng)計功能。(二)論述題與計算題1.根據(jù)下表的統(tǒng)計數(shù)據(jù)能否得出群眾參與體育活動和教育水平有直接關(guān)系的結(jié)論?是否有與教育水平有關(guān)的其他更直接的因素影響群眾參與體育活動?試申述你的理由和檢驗方法(用文字表述)?群眾參與體育活動和教育水平的交互表文化程度(人數(shù))%(同類人群中參與體育活動者比率)研究生360.5大學30336.6中專75430.0初中48218.4小學26512.4文盲1014.6答:(1)根據(jù)該表的統(tǒng)計數(shù)據(jù),不能得出群眾參與體育活動和教育水平有直接關(guān)系的結(jié)論;該表內(nèi)容提供了兩個變量,作為有待解釋的因變量,即:“人數(shù)”與“%(同類人群中參與體育活動者比率)”。對于“人數(shù)”這個變量來說,由于沒有交代取得樣本的抽樣方法,因此,僅僅憑該列的數(shù)據(jù)值就進入統(tǒng)計檢驗過程,是不嚴謹?shù)?。與此同時,僅從該列數(shù)據(jù)值,看“文化程度”與“人數(shù)”,并沒有明顯的直接關(guān)系。對于“%(同類人群中參與體育活動者比率)”這個變量來說,直觀上看,從文盲到大學的學歷遞增,參與體育活動的比率也在相應地遞增。只有研究生學歷的樣本是個例外。但,由于“%(同類人群中參與體育活動者比率)”變量,在格式上屬于相對頻次,即比例值,因此不適用進行卡方檢驗等基于頻數(shù)分布的統(tǒng)計檢驗過程。與此同時,該變量也不是“人數(shù)”變量所占該類人群的比率值,因此不能通過該比率值計算“同類人群中參與體育活動者”與“同類人群中未參與體育活動者”的具體頻數(shù)。(2)可能會有與教育水平有關(guān)的其他更直接的因素影響群眾參與體育活動,比如:個體工作類型。個體受教育的水平在一定程度上決定了個體工作或勞動的類型,而勞動類型也意味著不同的閑暇時間安排的模式,從而形成不同的參與體育運動的模式。(3)如果能夠基于嚴謹?shù)某闃釉O(shè)計,準確記錄每個學歷類型參加與不參加體育活動的頻數(shù),采用卡方檢驗等過程是可以得出更加確定的結(jié)論。解析:本題主要考察雙變量關(guān)系分析和測量方法的應用。在解答時,首先要辨別出兩個變量的測量層次;其次,要根據(jù)已有材料判定兩個變量之間的關(guān)系類型,直觀上看,從文盲到大學的學歷遞增,參與體育活動的比率也在相應地遞增,因此,可以初步估計二者之間具有相關(guān)關(guān)系;最后要通過對應的相關(guān)測量方法計算出兩個變量之間的相關(guān)強度和方向,并用對應的假設(shè)檢驗方法去驗證二者是否具有顯著性相關(guān)關(guān)系。知識點:兩變量的測量層次、相關(guān)測量方法以及假設(shè)檢驗方法。2.怎樣確定兩種社會現(xiàn)象之間存在因果關(guān)系,請舉例說明。答:兩變量之間的因果關(guān)系,是指一變量的變化可以確定為另一變量變化原因的關(guān)系。在自然科學中,確定現(xiàn)象之間的因果關(guān)系比較容易。在社會研究中,要確定兩個變量之間的因果關(guān)系必須同時滿足三個條件:其一,兩變量之間必須存在相關(guān)關(guān)系。兩變量之間存在相關(guān)關(guān)系是兩變量之間存在因果關(guān)系的必要條件,但不是充分條件。這就是說,如果兩變量之間存在相關(guān)關(guān)系,則兩變量之間可能是因果關(guān)系,也可能不是因果關(guān)系;如果兩變量之間沒有相關(guān)關(guān)系,則決不可能存在因果關(guān)系。反過來說,如果兩變量之間存在著因果關(guān)系,則必定存在著相關(guān)關(guān)系。其二,必須確定自變量變化在前,因變量變化在后,即先有原因,后有結(jié)果。也就是說,兩變量之間的因果關(guān)系是一種單向影響關(guān)系,只能是原因?qū)е陆Y(jié)果,自變量的變化導致因變量的變化,而不能反過來說因變量的變化引起自變量的變化。兩變量的因果關(guān)系通常表示為X→Y。其三,必須確定變量X與Y之間的關(guān)系,不是由于第三個變量的存在而呈現(xiàn)出的一種虛假關(guān)系。在研究中,要使兩個變量完全滿足上述三項條件,是一件很不容易的事情,因而在社會研究中很難完全確定兩種現(xiàn)象之間的因果關(guān)系。盡管如此,在統(tǒng)計分析中,仍然可以對社會現(xiàn)象之間的因果關(guān)系進行粗略的分析。比如,在研究政治體制對于民主的穩(wěn)定性的影響時。首先,變量政治體制是一個國家最重要的政治元素,根據(jù)已有的歷史經(jīng)驗可知,一個國家的政治體制涉及領(lǐng)導人選舉機制、法律制定與執(zhí)行等面,這些都與國家民主穩(wěn)定程度有著顯著的相關(guān)關(guān)系;其次,政治體制的不同會導致國家內(nèi)部各個不同權(quán)力集團之間的組織方式、監(jiān)督方式不同,從而使得不同群體的利益滿足情況不一樣。也就是說,自變量政治體制的變化會導致社會內(nèi)部聯(lián)系程度及利益獲得情況的變化,從而導致因變量民主穩(wěn)定性的變化。解析:本題主要考察兩個變量之間關(guān)系的類型分析以及對于因果關(guān)系的確定準則。在解答時,首先要確定兩個變量之間是否具有一方影響另一方的關(guān)系,即一個變量發(fā)生變化時,另一個變量也隨之發(fā)生變化;其次,對于具有相關(guān)關(guān)系的兩個變量需要進一步確定二者之間是相互影響還是單項影響的關(guān)系,只有當二者是單向影響的關(guān)系時,是由于自變量的變化導致了因變量的變化。最后,要確定這種因果關(guān)系是真實的,兩個變量間的關(guān)系不是由于第三方變量所導致的虛假因果關(guān)系。知識點:雙變量統(tǒng)計分析內(nèi)容、社會研究中兩種現(xiàn)象之間因果關(guān)系的確定3.一個骰子有六個面,重復擲骰子180次之后,得到如下的分布:骰面123456頻次395120222622有沒有統(tǒng)計學證據(jù),說明這個骰子被人做了手腳?(置信水平)參考:卡方表置信水平0.100.050.0250.010.001自由度12.7063.8415.0246.63510.82824.6055.9917.3789.21013.81636.2517.8159.34811.34516.26647.7799.48811.14313.27718.46759.23611.07012.83315.08620.515610.64512.59214.44916.81222.458712.01714.06716.01318.47524.322813.36215.50717.53520.09026.125914.68416.91919.02321.66627.8771015.98718.30720.48323.20929.588答:應用卡方檢驗過程。如果骰子正常的話,那么骰子的6個面出現(xiàn)的期望頻數(shù)為總次數(shù)的6分之一。對本題來說,為30次。:頻次與骰面數(shù)值相互獨立;:頻次與骰面數(shù)值不相互獨立;經(jīng)計算得:自由度:臨界值:可知,故,有95%的把握拒絕零假設(shè),接受備選假設(shè),即頻次與骰面數(shù)值不是獨立事件,是有關(guān)的關(guān)系。如果骰子是正常的,則骰子1-6個數(shù)字出現(xiàn)的頻次是均勻的,其與數(shù)值相互獨立。所以這個骰子被人做了手腳。解析:本題主要考察雙變量統(tǒng)計分析方法和檢驗方法的掌握程度。在解答時,首先要明確兩個變量的測量層次。為了驗證骰子的準確性,就要考察轉(zhuǎn)到骰子各個面的概率是否均勻,轉(zhuǎn)化成統(tǒng)計問題,即扔到每一面的頻數(shù)與骰面數(shù)值之間有沒有顯著性相關(guān)關(guān)系;其次由于是基于頻數(shù)分布的數(shù)據(jù),因此使用卡方檢驗的檢驗方法;進行計算之后得出X2值并與臨界值比較,從而確定是否接受原假設(shè)。知識點:雙變量統(tǒng)計分析和假設(shè)檢驗方法4.怎樣理解變量方差的本質(zhì)含義的不確定性。方差是一種重要的離散量數(shù),它的計算方法是,把一組數(shù)據(jù)中每個數(shù)據(jù)與該組算術(shù)平均數(shù)相減,將其差進行平方然后相加,再除以數(shù)據(jù)的個數(shù)。方差的計算公式為:按照這個公式理解方差時,通常會簡單地把方差理解成是相對對于均值的波動,如果是對更復雜的隨機變量,如二維的隨機變量,則最好使用不確定性概念。假設(shè)一個神槍手和一個參加軍訓的大學生一塊打靶,顯然大學生打靶時相對于靶心(均值)的彈著點(方差)的不確定性更大。不確定性比相對于均值的波動更能反映方差這個概念的本質(zhì)特征。在考慮定性變量的方差時,應使用不確定性而不是用相對于均值的波動來理解其方差。與此同時,在社會科學的研究中,更應該根據(jù)情況使用不確定性,來表現(xiàn)社會現(xiàn)象演變的不確定性?!安▌印迸c“不確定性”相比,是一個反映“規(guī)律性”的概念,即觀測到的變化更多地表現(xiàn)在一個可以控制和預知的區(qū)間內(nèi)。而社會科學的研究,則更關(guān)注社會現(xiàn)象變化的多種可能性,亦即不確定性。在這個意義上去理解方差,是獨具社會科學的內(nèi)涵的。解析:本題主要考察對于方差本質(zhì)的理解。在解答時首先要指出方差作為一種重要的離散量數(shù)所具有的含義,以及具體的計算方法和公式;其次,要針對計算公式進一步說明方差所代表的本質(zhì)內(nèi)涵,并可以通過舉例的方式闡釋方差含義在具體操作中的應用。最后,要將這一統(tǒng)計概念在社會科學領(lǐng)域所具有的特殊性,即由于社會現(xiàn)象的不確定性導致了方差實際運用中的不確定性.知識點:離散量數(shù)分析方法與離散量數(shù)方差的含義5.方差分析的適用對象,及其假設(shè)和檢驗的基本過程。方差分析適用于定類—定距變量的研究,所謂方差分析就其內(nèi)容而言,是分析或檢驗總體間的均值是否有所不同,而不是方差是否有所不同。方差分析對總體必須滿足一下假定:(1)等方差性,這一假定要求總體中自變量的每一個取值對應因變量的分布多具有相同的方差;(2)總體正態(tài)分布或因變量的分布為正態(tài)分布,即要求每一個自變量所對應的應變量的分布呈正太分布;(3)變異的可加性,方差分析所依據(jù)的一個基本原理就是變異的可加性。確切地說,應該是變異的可分解性,總變異可以分解成幾個不同來源的部分,這幾個部分變異的來源在意義上必須明確,而且彼此要相互獨立。方差分析大致有4個基本過程:(1)求平方和SSw=SSt-SSb(2)確定自由度由于K是實驗處理數(shù),因此,組間自由度dfb=k-1;組內(nèi)自由度dfw=k(n1)總自由度dft=nk-1(3)求均方組間均方MSb=SSb/df;組內(nèi)均方MSw=SSw/dfw(4)進行F檢驗解析:本題主要考察對于雙變量分析方法的掌握情況。在解答時,首先要指出方差分析的含義以及其對應的兩個變量的測量層次;其次,要明確方差分析方法的具體內(nèi)容,包括方差分析的基本步驟和對應的假設(shè)檢驗方法,進行方差分析采用的主要檢驗方法是F檢驗,并用eta平方系數(shù)來測量兩變量的相關(guān)強度。知識點:雙變量分析的具體方法以及方差分析的具體內(nèi)容五、擴展閱讀(一)統(tǒng)計故事:點估計與飛鏢游戲飛鏢游戲起源于英國,是一項風靡全球,集趣味性、競技性于一體的休閑運動項目,既可用于比賽,又可作為工作、學習之余的消遣。從統(tǒng)計學的角度看,飛鏢游戲暗含了點估計的統(tǒng)計推斷思維邏輯,可以用來直觀說明點估計的原理。簡單起見,假定4位選手(A、B、C、D)參加飛鏢比賽。前3位選手的比賽成績?nèi)鐖D1所示,第4位選手的比賽結(jié)果單獨列出,如圖2所示。其中,小點表示各位選手投擲飛鏢的結(jié)果,飛鏢盤中心的白點表示靶心。那么這些密密麻麻的小點和點估計又是怎么扯上關(guān)系呢?實際上,只要是估計,總要有一個估計目標,通俗地講,估計就是猜測,總有一個可能被猜中的“正確”答案。若以總體均值作為目標,該目標或“正確”答案就在圖1、圖2飛鏢盤中的靶心的位置。各位選手的每一次投擲(其結(jié)果就表現(xiàn)為小點),可以看成是估計或猜測的一次嘗試,統(tǒng)計學人稱為估計量(其結(jié)果稱為估計值)。猜測總有準或不準的問題,我們還需要游戲評委對比賽結(jié)果作進一步地解說。在飛鏢游戲中,我們不能只看一次投擲結(jié)果,更重要的是透過多次投擲結(jié)果去分析評判一位選手的競技素質(zhì)。要反映一位選手的競技素質(zhì),至少可以從兩個方面著眼:①眼神好壞:是否能盯準靶心;②投擲技術(shù)穩(wěn)定性:手發(fā)抖的程度。游戲評委按照這兩個標準,對4位選手競技素質(zhì)作了評判:選手A的投擲結(jié)果緊密圍繞靶心,可以斷定其眼神好使,手不抖。選手B的投擲結(jié)果密集在飛鏢盤的左下角,說明該選手手雖不抖,但嚴重斜視,你不能說該選手技術(shù)不穩(wěn)定,但由于眼神問題,不能很好瞄準靶心。選手C投擲結(jié)果非常密集,卻略微偏離靶心.說明該選手技術(shù)相當穩(wěn)定,遺憾的是略帶散光。至于選手D,和飛鏢靶有仇似的,將整個飛鏢盤打成了麻子。他眼神沒有問題,能夠盯準靶心,但手卻抖動厲害。這樣來看,A為專業(yè)選手,而B、C、D由于各種原因,只能是業(yè)余水平了。統(tǒng)計學中一個估計的好壞,實際上也是這個評判邏輯。首先,單次的估計值不足以決定一個估計的好壞。拿上面的飛鏢比賽來講,再穩(wěn)定的選手也有踩西瓜皮的時候,比如選手A也可能陰錯陽差投出脫靶的飛鏢來,雖然這種可能性并不大。而選手B也可能投出正中靶心的結(jié)果,那是他歪打正著。其次,估計的好壞,正如一個選手的競技素質(zhì)。投擲技術(shù)穩(wěn)定性,即手的發(fā)抖程度,對應估計量的方差。而眼神好壞,即是否能盯準靶心,對應估計量的偏差。所有眼神好使選手的投擲(這里為A和D),在統(tǒng)計上,對應無偏估計。若在眼神好使的選手里面論英雄,則手不抖者勝,顯然選手A毫無爭議摘得桂冠,這在統(tǒng)計上對應為有效估計。至于選手B和C,由于眼神問題,在這樣的標準下,連排名的資格都沒有。如此一來,選手C必然會喊冤,他覺得自己的投擲結(jié)果離靶心很近,不能單以眼神定成敗。游戲評委考慮到專業(yè)選手并不多見,在業(yè)余選手中也需要定個標準來決定名次。因此,將眼神好壞和投擲技術(shù)穩(wěn)定性綜合起來考慮,給出的結(jié)果是選手C強于D。這在統(tǒng)計上便對應于著名的均方誤差準則及其分解問題了?!S恒君;《游戲中的統(tǒng)計推斷邏輯:點估計》來源:《無處不在的統(tǒng)計(三)》(中國統(tǒng)計出版社)(二)定量資料的整理與統(tǒng)計分析由資料收集階段得到的原始資料通常是粗糙的、雜亂的,雖然代表著事物的某種特征,具有社會實在性,但它們本身并不能深刻揭示事物和現(xiàn)象的本質(zhì),只有對一其進行去偽存真、由此及彼,由表及里的制作,才能把握其內(nèi)部的規(guī)律性,反映出事物的木質(zhì)。分析便是資料加工的一種方法,它包括兩個內(nèi)容:第一,資料的整理,即對收集到的資料的真實性、準確性、合格性、完整性等進行審查,并通過編輯、分類、分組,匯總等使其條理化、系統(tǒng)化;第二,分析本身,它是資料處理的核心部分,它通過對資料所包含的被研究事物的各個部分、各個階段和屬性的考察,對木質(zhì)與非本質(zhì)、偶然與必然因素的區(qū)分,把握事物的本質(zhì)特征、屬性、功能、結(jié)構(gòu)與規(guī)律性,進而對所研究的作出正確的解釋與結(jié)論。因此,資料分析不僅決定著收集到的資料是否有價值,而且能夠很好地檢驗研究它當初提出的一些假設(shè),或者適當?shù)鼗卮鹚芯康膯栴},它還能夠以令人信服和可以理解的形式描述研究成果。通過分析,研究者可以將認識從具體提高到抽象,從個別提高到一般,并可以此為基礎(chǔ)提出對策性建議或進行決策。應當指出的是,一個成功的分析,除必須遵循一定的程序及熟練掌握和靈活運用各種分析方法與技術(shù)外,還必須善于運用分析的策略和邏輯,而它們依賴于分析者的“分析的想象力”,象敏銳的洞察力一樣,分析的想象力也是每一個從事社會研究的人必須具備的基本素質(zhì)。因為一個成功的分析不僅是一種技術(shù),而且是“一種藝術(shù)、一種靈感、一種神機,也是一種洞見”,它需要研究者反復錘煉,細心培養(yǎng),一長期積累。在某種意義上說,分析的水平?jīng)Q定著一個研究的水平,而分析水平的高低則依賴于分析者的理論素養(yǎng),對分析方法與分析技術(shù)的掌握以及分析的想象力。王漢生:《定量資料的整理與統(tǒng)計分析》,《青年研究》,1993(07).六、教學案例案例1:高爾頓與回歸方程的起源“回歸”是由英國著名生物學家兼統(tǒng)計學家高爾頓(FrancisGalton,1822-1911,著名生物學家達爾文的表弟)在研究人類遺傳問題時提出來的。為了研究父代與子代身高的關(guān)系,高爾頓搜集了1078對父親及其兒子的身高數(shù)據(jù)。1855年,高爾頓發(fā)表《遺傳的身高向平均數(shù)方向的回歸》一文,他和他的學生皮爾遜通過觀察1078對夫婦的身高數(shù)據(jù),以每對夫婦的平均身高作為自變量,取他們的一個成年兒子的身高作為因變量,分析兒子身高與父母身高之間的關(guān)系,發(fā)現(xiàn)父母的身
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度個人貸款合同模板跨境電商貸款專項版
- 鐵路貨物運輸書面合同
- 2025版電子顯示屏租賃代售及安裝調(diào)試服務合同3篇
- 二零二五版消防設(shè)施驗收及消防安全隱患整改協(xié)議3篇
- 餐飲加盟合同書模板年
- 二零二五版土地房產(chǎn)轉(zhuǎn)讓與生態(tài)保護補償合同3篇
- 用電的協(xié)議書范本
- 二零二五年度環(huán)保材料生產(chǎn)工序委托合同3篇
- 軟件采購技術(shù)協(xié)議
- 二零二五版物流配送中心房屋租賃與物流信息化解決方案合同3篇
- ICU新進人員入科培訓-ICU常規(guī)監(jiān)護與治療課件
- 選擇性必修一 期末綜合測試(二)(解析版)2021-2022學年人教版(2019)高二數(shù)學選修一
- 《論語》學而篇-第一課件
- 《寫美食有方法》課件
- 學校制度改進
- 各行業(yè)智能客服占比分析報告
- 年產(chǎn)30萬噸高鈦渣生產(chǎn)線技改擴建項目環(huán)評報告公示
- 心電監(jiān)護考核標準
- (完整word版)申論寫作格子紙模板
- 滾筒焊縫超聲波探傷檢測報告
- DB43-T 2612-2023林下竹蓀栽培技術(shù)規(guī)程
評論
0/150
提交評論