李沛良《社會研究的統(tǒng)計應(yīng)用》筆記和典型題(含考研真題)詳解_第1頁
李沛良《社會研究的統(tǒng)計應(yīng)用》筆記和典型題(含考研真題)詳解_第2頁
李沛良《社會研究的統(tǒng)計應(yīng)用》筆記和典型題(含考研真題)詳解_第3頁
李沛良《社會研究的統(tǒng)計應(yīng)用》筆記和典型題(含考研真題)詳解_第4頁
李沛良《社會研究的統(tǒng)計應(yīng)用》筆記和典型題(含考研真題)詳解_第5頁
已閱讀5頁,還剩148頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

目錄內(nèi)容簡介目錄第一部分復習筆記第一篇導論第一章科學方法與社會研究歷程第二篇統(tǒng)計敘述:單變項與雙變項第二章簡化一個變項之分布第三章簡化兩個變項之分布第四章相關(guān)測量法與測量層次第三篇統(tǒng)計推論:單變項與雙變項第五章抽樣與統(tǒng)計推論第六章參數(shù)值的估計第七章假設(shè)檢定:均值與百分率第八章假設(shè)的檢定:兩個變項之相關(guān)第四篇多變項分析第九章詳析模式與統(tǒng)計控制第十章多因分析第十一章因徑分析第十二章定類或定序依變項回歸分析第十三章多項互關(guān)分析第五篇社會變遷分析第卜四章趨勢資料分析法第十五章同組分析第二部分典型題(含考研真題)詳解一、名詞解釋二、簡答題三、論述題第一部分復習筆記第一篇導論第一章科學方法與社會研究歷程「社會學三先的受念/社會學航允歷程的來龍去肱1 「等劃〔社會學研究的步驟《執(zhí)行I息結(jié)(選定所允題目初步探索成立假設(shè)理論貂茗與澄涌蛻念科學方法與社會研究方程號劃] (研究設(shè)計科學方法與社會研究方程-定類層次定字層次定及百次一定比廛次界定母體和決定抽樣的步零【統(tǒng)計分忻f訪問法f抽取樣本.收兵交。(觀察法執(zhí)行? 〔檔累資料〔至理資料J校對I魂明[統(tǒng)計分析.將眾多的資料作海合運算'總結(jié)J敏恭用先絕果'說明用咒玲果的貢蛾〔受柒若干新的斫克題目【知識框架】【重點難點歸納】一、社會學研究歷程的來龍去脈社會學研究的概念社會學研究,是指運用科學的方法來搜集和分析社會事實,以理解社會現(xiàn)象之間的關(guān)系,尤其是因果關(guān)系。社會學研究采用科學方法來敘述和解釋社會現(xiàn)象間的關(guān)系。2.社會學研究的步驟采用科學方法的社會學研究的整個歷程,大致上可分為三個階段:(1)籌劃:研究題目初步探索、成立假設(shè)、理論解釋與澄清概念及研究策略。(2)執(zhí)行:試點研究、抽取樣本、收集資料及整理資料。(3)總結(jié):統(tǒng)計分析、解釋研究結(jié)果及理論與實際貢獻。二、籌劃在規(guī)劃一項研究時,大致上可以分為下面的五個步驟:.選定研究題目開始一項研究時,選定研究題目是非常重要的。.初步探索(1)收集有關(guān)的文獻;(2)咨詢對研究的題目有經(jīng)驗、有知識的人,進行了解;(3)觀察個案,即挑選一些較為典型的個案,親自觀察所要研究的現(xiàn)象。.成立假設(shè)(1)變項是指社會學研究的社會現(xiàn)象。假設(shè)是指根據(jù)研究者對問題的了解,假定現(xiàn)象與現(xiàn)象之間的關(guān)系。假設(shè)的形式包括函數(shù)式和差異式。(2)在成立假設(shè)時,必須盡可能說清楚變項與變項之間的關(guān)系。研究假設(shè),一般是說明兩個變項的關(guān)系,但也可以只假定一個變項的情況或假定多個變項的相關(guān)情況。(3)不是所有的社會學研究都成立假設(shè)。但當前的社會學研究,大部分是爭取先成立假設(shè),再搜集事實來加以驗證,并且重復測驗。.理論解釋與澄清概念在成立假設(shè)以后,便要予以解釋。另外,對假設(shè)中的變項所包含的概念,要清楚界定它們的意義,以免發(fā)生誤解。.研究策略要證明假設(shè),必須首先設(shè)計研究方式,然后確定每個變項的測量方法及其測量層次,最后計劃抽取樣本和選擇統(tǒng)計方法。(1)研究設(shè)計較為常用的研究方式有實驗法和社會調(diào)查法,二者皆可驗證假設(shè)。①實驗法實驗法的基本邏輯,是有意地改變A變項,然后看看B變項是否隨著變化;如果B變項顯然是隨著A變項的變化而變化,即說明A變項對B變項有影響。實驗法的邏輯很嚴密,其操作程序為:a.將研究對象分為實驗組和控制組。兩組的成員在實驗前的情況要基本相同,尤其是那些會影響實驗效果的情況。使兩組情況相同有兩種方法:隨機法和配對法。b.為證明假設(shè):A-B,要改變實驗組的A變項,但不改變控制組的A變項,然后比較兩組的B變項在實驗前、后的變化。如果變化的程度不同,表示A對B有影響;如果相同,則表示無影響。②社會調(diào)查法社會調(diào)查法的特點,是在研究過程中不改變社會現(xiàn)狀,只求就地取材,然后以統(tǒng)計方法推算變項與變項之間的關(guān)系。社會調(diào)查法可以分為敘述性調(diào)查和解釋性調(diào)查兩大類。a.一般的社區(qū)調(diào)查或民意調(diào)查屬于敘述性調(diào)查。當代的社會學研究,偏重因果關(guān)系,較常進行解釋性調(diào)查。b.解釋性的社會調(diào)查研究,目的是要證明不同的變項之間是否有因果關(guān)系。③實驗法與社會調(diào)查法的比較a.如果證明因果關(guān)系,社會調(diào)查法在邏輯上不及實驗法嚴謹。嚴格來說,調(diào)查法只能確定變項之間是否相關(guān)。b.進行社會調(diào)查時,可作全體調(diào)查,也可作抽樣調(diào)查。在某一個時期進行的社會調(diào)查是橫剖調(diào)查;在不同的時期重復的社會調(diào)查是縱貫調(diào)查??v貫調(diào)查又分趨勢研究和同組研究。③個案研究個案研究是指選擇一個或幾個個案,作深入的接觸和觀察,目的是對所研究的問題作深入的了解。個案研究不適宜用作證明假設(shè)。(2)測量變項①選擇指標確定如何測量變項,是指采用哪些事實作為變項的指標。每個社會現(xiàn)象都有許多不同的數(shù)值或?qū)傩裕@些不同的值便構(gòu)成了一個變項。任何一個變項都可能有許多不同的指標,因此選擇指標的標準必須符合變項的含義,同時又易于搜集所需的事實。②指標的合并對于簡單的變項,用一個指標便足夠。對于較復雜的變項,可能要用上多個指標,為便于分析,有時需要將各項指標合并起來。合并的方法,主要有類型法、指數(shù)構(gòu)成法和尺度法二坐一—類型法是將各指標交互分類。型-類法數(shù)成指拗法指數(shù)構(gòu)成法是用簡明而合理的公式,來綜合各指標。度尺法尺度法是根據(jù)各指標之間的關(guān)系來計算總值,使研究對象高低有序??偤统叨确ㄗ顬楹唵我仔校沧畛S?,計算總值的方法是將各指標的數(shù)值相加起來。③研究單位在測量變項時,要注意研究單位的性質(zhì)。以個人為研究單位的變項,稱為個人變項;以地區(qū)或群體為研究單位的,稱為群體變項。在測量變項時,要清楚說明研究單位是個人還是群體。推論的兩種錯誤:—將以群體研究單位研究得出的結(jié)論推論到以個人為研究單位時的情況。區(qū)群謬誤微體謬誤將以個人為研究單位的研究結(jié)論推論及于群體或整個地區(qū)。(3)測量層次變項在測量以后,會有不同的數(shù)值或?qū)傩?。根?jù)這些值的數(shù)學特質(zhì),可以將它們由低至高分為四個層次:定類、定序、定距和定比。①定類層次,是指變項的值只能把研究對象分類,即只能決定研究對象是同類抑或不同類,具有=與#的數(shù)學特質(zhì)。分類時,要注意互斥性和無遺性兩個原則。②定序?qū)哟?,是能確定值的次序,即變項的值能把研究對象排列高低或大小,具有,與V的數(shù)學特質(zhì)。定序?qū)哟伟硕悓哟蔚奶刭|(zhì)。③定距層次,是指能確定值與值之間的距離,即變項之值與值間的距離是可以知道的,因而具有加與減的數(shù)學特質(zhì)。定距層次包括了定序和定類層次的特質(zhì)。④定比層次,是最高的測量層次,其數(shù)值中的零值是絕對的、固定的,除了定類、定序和定距層次的特質(zhì)以外,也具有乘與除(X、+)的數(shù)學特質(zhì)。(4)界定母體和決定抽樣的步驟界定母體,是指清楚說明研究對象的范圍,即所研究的人物、時間和地點。母體的定義愈清楚愈好。如果所界定的母體范圍過大,不容易全部研究,就需要采取抽樣的方法。(5)統(tǒng)計分析統(tǒng)計方法分兩大類:敘述統(tǒng)計法和推論統(tǒng)計法。①敘述統(tǒng)計法就是幫助簡化資料的方法。②推論統(tǒng)計法是根據(jù)抽樣取出的資料推論出母體的情況。三、執(zhí)行為保證研究質(zhì)量,應(yīng)該首先做小規(guī)模的試點研究,即抽取若干研究對象來試驗整套計劃是否可行。根據(jù)試點研究的結(jié)果和經(jīng)驗修改原來的計劃以后,就可以進行大規(guī)模的研究工作。.抽取樣本,收集資料依據(jù)抽樣的計劃,從全部研究對象中抽取樣本。抽取樣本以后,向每一個樣本單位收集所需的資料。搜集資料的方法,可以歸為三大類:訪問、觀察和檔案資料。(1)訪問法①訪問法在社會學研究中最常用,它可以在較短時間內(nèi)獲取大量資料。訪問之前,一般是預先設(shè)計好一組問題,稱為問卷。答案的方式主要有固定答題和自由答題兩種:a.固定答題,由研究員預先設(shè)計了若干可能的答案,由答者選擇。固定答題便于統(tǒng)計分析,但所提供的答案不一定適當。b.自由答題,讓答者隨著自己的意思回答,研究員不提供可能的答案。自由答題能夠讓答者充分表達他的意思,較為準確,但答者可能哆嗦和花樣眾多,訪問費時且分析起來也不容易。②用問卷收集資料的方式可以分為兩類:自填和對答。自填是指把問卷交給答者,由他自己填寫答案。這種方式又分為郵寄和當面填寫兩類:a.郵寄方式的好處是節(jié)省人力,但問題是寄回來的問卷可能很少。b.當面填寫是指把研究對象集合起來,在研究員面前自己填寫問卷。自填的方式要求答者懂得文字和J'解問題的意思,難以在教育落后的地區(qū)應(yīng)用。對答是指由研究員詢問,答者作口頭答復,然后研究員作記錄。這種方式又分為電話訪問與面對面訪問兩類:a.電話訪問是指研究員用電話詢問研究對象,可以節(jié)省交通費用和時問,但只能提出少量問題,而且在電話普遍地區(qū)才可進行,否則樣本的代表性有疑問。b.面對面訪問是指登門拜訪,直接訪問研究對象,此方法耗費人力和時間多,但可以避免自填方式以及電話訪問的短處,而且有較長的訪問時間,搜集大量資料。③設(shè)計問卷時,切忌太長,要盡可能精簡,要經(jīng)過反復考慮,力求去蕪存菁。同時,每個問題所用的詞語,要具體和明確,不能模棱兩可或有雙重含義。所用的詞語,也不可影響答者的意見。(2)觀察法觀察法即是以耳聞目睹的方式,實地了解研究對象的行為。觀察法分為參與觀察法和非參與觀察法兩種。參與觀察法是指研究員要參加所研究的活動,從而獲取資料。非參與觀察法是指研究員的身份是旁觀者。(3)檔案資料檔案資料,包括報紙、雜志、機關(guān)文件與書信等。這是現(xiàn)有的資料,所以一般來說,花的時間最少,代價最小。.整理資料整理資料一般分為校對和編碼兩步。(1)校對是指查看所收集的資料有沒有錯,有沒有錯漏和是否清楚。有錯漏或不清楚的,就要馬上補上或更正。(2)編碼是指把資料作簡明的記錄和分類。記錄資料時,可用簡單的數(shù)碼表示。四、總結(jié)統(tǒng)計分析,將眾多的資料作綜合運算(1)運用適當?shù)臄⑹鼋y(tǒng)計方法,把所得到的資料簡化,使之易于理解。如果所研究的是一個樣本,要運用適當?shù)耐普摻y(tǒng)計方法,用樣本的研究結(jié)果來推論總體的情況。一個嚴謹?shù)难芯浚谖捶治鲎冺椗c變項之間的關(guān)系之前,應(yīng)該先檢驗每個變項的測量信度和測量效度,再開始運用統(tǒng)計方法分析資料以求驗證假設(shè)。測量信度是指用相同的方法重復測量變項時所得的資料與原有資料的吻合程度。測量效度是指所得資料與測量的目標的吻合程度。.解釋研究結(jié)果研究者提出更精確和更周詳?shù)慕忉?。如果研究結(jié)果是否定原來的假設(shè),須解釋其原因。.說明研究結(jié)果的貢獻研究結(jié)果的貢獻包括理論的貢獻和實際的貢獻。.提供若干新的研究題目提供若干新的研究題目,即使自己未能解答,也要提議別人去尋求答案。第二篇統(tǒng)計敘述:單變項與雙變項第二章簡化一個變項之分布

,次致分布

比例/定類層次《比室至示【對比值C累加次效/基本技術(shù),定字星決〔累tn百分率f次數(shù)的計算[矩形田,定距縣次《為示法I多魚淺虱優(yōu)化一個變項之分布"形宸淺優(yōu)化一個變項之分布1一些的我的嗝念Jc形腔淺‘峰狀曲畿I對稱與不對稱曲線「定類變項:眾值勇士趨勢更量法1定字變項:中也值〔定距至項:均值「定類變項:稟異比軍或靈異指歟要歌迨勢出量法,定字變項:四分也差I(lǐng)定域變項:標準差『正態(tài)曲線及正態(tài)分布1正態(tài)分布與標準值?I標鹿正態(tài)分布【知識框架】【重點難點歸納】一、基本技術(shù)定類層次【知識框架】【重點難點歸納】一、基本技術(shù)定類層次適用于簡化一個定類變項資料的方法,有次數(shù)分布、比例、比率、對比值和圖示法等。次數(shù)分布①次數(shù)分布法是指統(tǒng)計變項內(nèi)每一個值的原資料出現(xiàn)多少次。②次數(shù)分布可以把原資料作初步的簡化,但不能用來比較不同的樣本。如要比較,可以計算比例或比率。比例比例是指將每類的次數(shù)(/)除以總數(shù)(.V)。比例是使兩個樣本的總數(shù)變成同一個基數(shù),即都是以1為基數(shù),就可以進行比較。公式:比率①比率是把計算比例時所用的基數(shù)變大,使之容易領(lǐng)會。比率的公式是:..—Z.X100一ZxlOOO_,qZ-X10000a.百分率:.Vb.千分率:.V C.萬分率:.V②社會學研究最常用的是百分率(%)。一般來說,要求精確程度愈高或樣本愈大,可以保留的小數(shù)愈多。社會學研究通常是保留小數(shù)點以后的一位或兩位數(shù)字。③對數(shù)值中的小數(shù)作取舍,通俗的做法是“四舍五入”。近代統(tǒng)計學有一項新原則,就是“前單五人”,即“五”前面是單數(shù)就進位,若是雙數(shù)就舍掉(0也算雙數(shù))。④如果百分率的數(shù)值也太小,可以用千分率、萬分率等。如犯罪研究的統(tǒng)計,通常是用十萬為基數(shù);人口學的研究則較常用千分率。1r分析定類層次資料時,也可以計算兩數(shù)值的對比值。A數(shù)值與B數(shù)值的對比值,即A除以B。圖示法圖示法是以圖形來簡化資料。在社會學研究中比較多用的有長條圖和圓瓣圖。①長條圖是以長方形的長度(寬度相同)來表示次數(shù)或百分率的多少;②圓瓣圖是把一個圓形平面按數(shù)值的比例分割。2.定序?qū)哟卫奂哟螖?shù)和累加百分率適用于定序?qū)哟味豢捎糜诙悓哟巍#?)累加次數(shù)(簡寫cf)累加次數(shù)是把次數(shù)逐級相加起來。分為向上累加和向下累加兩種。它們的作用是使研究者容易知道某值以下或以上之次數(shù)總和。(2)累加百分率(簡寫c%)累加百分率是將各級的百分率數(shù)值逐級相加。3.定距層次累加次數(shù)或累加百分率的方法,即可以分析定序資料,也可以用于分析定距資料。(1)次數(shù)的計算一般是先將各值分成若干組,然后計算每組的次數(shù)。分組時,要留意每組的界限、寬度和斷點。①組限,即每組的范圍,包括上限和下限。②每個組的寬度,簡稱組距,即組的真實上限與真實下限之差。組中點即真實上限與真實下限的平均數(shù)。(2)圖示法較常用于社會學研究的有矩形圖和多角線圖。①矩形圖以一個矩形的面積(長X寬)表示每組數(shù)值之次數(shù)或百分率的多少。繪制矩形圖時,通常是以一個坐標的橫軸的寬度表示組距,以縱軸的長度表示次數(shù)或百分率,二者的乘積就是該組之次數(shù)或百分率。矩形圖與長條圖的區(qū)別包括:a.長條圖只講長度,寬度則固定;矩形圖則是計算面積,長度與寬度均有意義。b.長條圖可以分開;而矩形圖由于數(shù)值有連續(xù)性,各個矩形要相連排列,不可以分開。②多角線圖多角線圖是把各個矩形頂端的中點用直線連結(jié)起來。其作用是使各組的次數(shù)(或百分率)的分布情況更顯而易見。(3)一些曲線的概念整理定距資料時,可將資料分組,然后用多角線顯示分布情況。但各組距的大小,會影響線條的平滑程度。一般是組距愈小,線條就愈平滑。社會學研究常用平滑曲線來表示定距變項的資料分布,如下列一些曲線:①J形曲線下降時先急后緩或上升時先緩后急,如圖2-1所示。圖2-1J型曲線②U形曲線先降后升或先升后降,如圖2-2所示。ff圖2-2U型曲線如圖2-3所示。③峰狀曲線如圖2-3所示。③峰狀曲線圖2-3峰狀曲線④對稱與不對稱曲線如果把曲線從中央分割,兩邊的資料分布完全相同,且圖形對稱就是對稱曲線,否則就稱為不對稱曲線。不對稱曲線顯示資料作偏態(tài)分布,分為正向(即向右)偏態(tài)和負向(即向圖2-4對稱與不對稱曲線二、集中趨勢測量法集中趨勢測量法是指找出一個數(shù)值來代表變項的資料分布,以反映資料的集結(jié)情況。.定類變項:眾值眾值(簡寫"。)即次數(shù)最多之值。因為眾值最有代表性,因此具有估計或預測的意義,長遠來說,以眾值作預測所犯的錯誤總數(shù)是最小的。眾值適合于分析定類變項,當然也可用來分析定序或定距變項的資料。.定序變項:中位值中位值(簡寫以,)為一個序列的中央位置之值,即高于此值的有50%的研究個案,低于此值的也有50%o計算中位值有用原資料和用分組資料計算兩種情況。(1)根據(jù)原資料求出中位值計算方法是將各個個案由低至高排列起來,居序列中央位置的個案的值就是中位值。其公式為:M位置=亍,其中”是個案數(shù)目。如果”是偶數(shù)時,通常的做法,是將位于最中央的兩個數(shù)值的平均值作為中位值。(2)用分組資料來求出中位值首先將分組資料中各組的次數(shù)(,)向上累加起來(//、

寧日

M=z+--:—h-T),再求出中位值的位置。公式如下:其中,工=中位值組之真實下限;/=中位值組之次數(shù);“=中位值組之組距;可=低于中位值組真實下限之累加次數(shù);”全部個案數(shù)目。中位值具有估計或預測的意義。長遠來說,以中位值去估計定序變項的數(shù)值,所犯的錯誤總數(shù)是最小的。.定距變項:均值定距資料可以作加減運算,故可以將變項的各個數(shù)值相加起來,求取一個平均的數(shù)值,即均值(簡寫了)。計算的方法,也分為兩種情況,即用原資料和用分組資料。(1)根據(jù)原資料求出均值Yx公式:~其中,E'表示各個個案數(shù)值之和,”表示全部個案數(shù)目。均值表明了資料的集中趨勢,可作估計或預測之用。長遠來說,以均值估計定距變項的資料,錯誤最小。如果某個變項值重復出現(xiàn)許多次,可以先統(tǒng)計每個值(X)之次數(shù)(/),再求取次數(shù)與相應(yīng)變項值之間的乘積(戶),然后利用各個乘積之總和求出均值。(2)根據(jù)分組資料求出均值_工一?公式:”其中,/表示每組的次數(shù),X.表示組中點,'表示個案數(shù)目。總的來說,如要測量集中趨勢,即找出一個最有代表性之值,定類變項的資料可用眾值(乂。);定序變項可用眾值(M。),但以中位值(乂,)較適宜。定距變項可用眾值(乂。),也可用中位值(?",),但以均值(了)最適宜。然而,有兩種情況下不宜用均值:①在分組資料中的極端組沒有組限時,不能求出均值,只能用中位值;②在變項中有個別的數(shù)值非常特殊(過高或過低),則均值的代表性就有疑問,用中位值較為適合。三、離散趨勢測量法離散趨勢測量法,是要求出一個值來表示個案與個案之間的差異情況。.定類變項:離異比率或質(zhì)異指數(shù)(1)離異比率離異比率(簡寫V)是指非眾值的次數(shù)與全部個案數(shù)目的比率。公式如下:其中“是全部個案數(shù)目,加。是眾值的次數(shù),二者之差(n一九)就是非眾值的次數(shù)。V愈大,就表示眾值的代表性愈小,以之作估計或預測時所犯的錯誤也就愈大。(2)質(zhì)異指數(shù)由于離異比率的方法過于粗略,另一個較為精確和常用的方法是質(zhì)異指數(shù)(簡寫IQV),其作用是求出各個類別之間在理論上最多的可能差異中(以M代表)實際上出現(xiàn)了多少差異(以A代表)。公式如下:命-"jZOF--.J'n4(k-l)其中,〃=全部個案數(shù)目,k=變項的類別數(shù)目,/=每個類別的實際次數(shù).定序變項:四分位差四分位差的計算方法,是將個案由低至高排列,然后分為四個等分(即每個等分包括25%的個案),則第一個四分位置的值(2)與第三個四分位置的值(2)的差異,即四分位差(簡寫。),公式為:Q=Q「Q\計算四分位差時,先要求出。的位置和2的位置,然后計算在這兩個位置上的值的差異。實際做法,分為原資料與分組資料兩種情況。(1)根據(jù)原資料求出9與Q的位置公式為:W+19位置=丁3(?+1)△位置=1~其中“是全部個案數(shù)目。(2)根據(jù)分組資料來計算四分位差步驟①計算向上累加次數(shù)。②求出白和烏的位置,公式如下:9位置=]3n口位置=丁其中”是全部個案數(shù)目。③參考累加次數(shù)分布,決定烏和。的位置應(yīng)屬于哪一組。④從所屬的組中,計算a位置和a位置的數(shù)值。公式如下:其中屬組之真實下限;4=0屬組之真實下限;工=9屬組之次數(shù);工=烏屬組之次數(shù);%=低于a屬組下限之累加次數(shù);%=低于2屬組下限之累加次數(shù);丐屬組之組距;%=烏屬組之組距;”全部個案數(shù)目。3.定距變項:標準差全距即最大數(shù)值與最小數(shù)值之差,精確性甚有疑問。分析定距變項的離散情況,最常用的方法是標準差(簡寫S),即將各數(shù)值(X)與其均值(工)之差的平方和除以全部個案數(shù)目(〃),然后取其平方根。公式如下:公式中X與jf的相差,即表示以均值作為代表值時會引起的偏差或錯誤。如果各個實際數(shù)值與均值之相差的總和很大,就表示變項數(shù)值的離勢度很大,即均值的代表性很小。公式以〃為分母,是要求出各個個案的數(shù)值與均值之間的差異"平均''有多少,反映均值的代表性。計算標準差,可以根據(jù)原資料,也可以根據(jù)分組資料。(1)原資料公式:V?標準差的數(shù)值在相互比較時更能突出其意義。標準差也有另一種意義,即表示用均值作估計或預測變項值時所犯錯誤的大小。同理,可以計算次數(shù)資料的標準差。(2)分組資料公式:,=感亙尸其中。是每組的組中點,/是該組的次數(shù)。表示定距資料的離散程度,另一種常用的方法是方差。方差(簡寫S:)即標準差的平方值,其意義與標準差相同??傮w來說,質(zhì)異指數(shù)(或離異比率)最適合于分析定類變項,也可用于分析定序或定距變項。四分位差(或十分位差)最適合用來分析定序變項,也可分析定距變項。標準差(或方差)則只能用于分析定距變項。這些離勢測量法與集中趨勢測量法作用互補。測量方法與測量層次的關(guān)系可以綜合如表2-1所示:表2-1測量方法與測量層次的關(guān)系定類變項定序變項定距.變項集中趨勢余值中位值均值離散趨勢質(zhì)異指數(shù)四分位差新準姜四、正態(tài)分布與標準值正態(tài)曲線及正態(tài)分布定距資料可用一條平滑的曲線表示,如正態(tài)曲線。此曲線呈鐘形,如圖2-5所示:圖2-5正態(tài)曲線(1)正態(tài)分布的公式其中x=變項的數(shù)值;/⑴=該變項值的次數(shù);$=標準差;爪=3.1416;3=2.7183;『=均值。(2)正態(tài)分布的特點①正態(tài)分布的眾值、中位值和均值相同。②正態(tài)分布的x值與均值三差異愈大,其次數(shù)會愈少,但不會等于零。③在正態(tài)曲線下每一部分的面積(即次數(shù)總和)都可以計算出來。2.標準正態(tài)分布將正態(tài)分布的數(shù)值改用標準差為單位,可以將不同形態(tài)的正態(tài)分布歸納為一種分布。這個以標準差為單位的正態(tài)分布,一般稱為標準正態(tài)分布,其每個變項值(x)變?yōu)椋?/p>

x-x上式的z稱為“標準值”,代表每個X值在標準正態(tài)分布上的數(shù)值。標準正態(tài)分布的均值是0,標準差是1。例如,Z=2.4,就表示該值與均值(等于0)的距離是2.4個標準差。每個標準值所表示的面積,可用下圖的斜線部分來表示,如圖2-6所示。由于正態(tài)分布是對稱的,因此標準值其實是絕對值,只要是數(shù)值相同,則無論是正值或負值,所表示的面積大小都相同。標準值是正數(shù)時,所表示的面積是在均值右邊;Z>|Z>|1.65|,Z>|1.96|,Z>|2.33|,Z>|2.40|,Z>|2.58|,Z>|3.09|,Z>|3.30|,標準值是負數(shù),則在左邊。圖2-6標準正態(tài)分布既然可以知道每個標準值所表示的面積,那么也可以求得任何兩個標準值之間所包括的面積,或是超越這個標準值的面積。因此可以算得如下的數(shù)值(在社會學研究中常用):比例是0.05;比例是0.025;比例是0.01;比例是0.0082;比例是0.005:比例是0.001;比例是0.0005。

第三章簡化兩個變項之分布

「統(tǒng)計相關(guān)的概念簡化兩個變項之分布(統(tǒng)計相關(guān)的性質(zhì)?相關(guān)程度與相關(guān)方向

I相關(guān)程度與方向的測量簡化兩個變項之分布「列聯(lián)表及其相關(guān)概念1交互分類與百分表\列聯(lián)表的計算I條件百分表及其制定準則

r相關(guān)測量法

I筒化相關(guān)與消減誤差t消減誤差比例【知識框架】【重點難點歸納】一、統(tǒng)計相關(guān)的性質(zhì)統(tǒng)計相關(guān)的概念相關(guān),是指一個變項的值與另一個變項的值有連帶性。即如果一個變項的值發(fā)生變化,另一個變項的值也有變化,則兩個變項就是相關(guān)了。.相關(guān)程度與相關(guān)方向(1)變項與變項之間的相關(guān)程度,可用統(tǒng)計法予以測量。大多數(shù)的統(tǒng)計法是以0代表無相關(guān),以1代表全相關(guān)。介于0與1之間的數(shù)值如果愈大,就表示相關(guān)的程度愈強。(2)相關(guān)方向,也可用統(tǒng)計方法予以測量。變項與變項之間的關(guān)系,可以分為正與負兩個方向,即正相關(guān)(又稱正比)與負相關(guān)(又稱反比)。正相關(guān)是指一個變項的值增加時,另一變項的值也增加。負相關(guān)是指一個變項的值增加時,另一變項的值卻減少。相關(guān)方向的分析只限于定序或定距變項。.相關(guān)程度與方向的測量尤拉Q系數(shù),特別適合于分析兩個二分變項的關(guān)系。表3-1變量示例1 a c2b~~dT?ad^bc如表3-1所示,X與丫都是二分變項,可計算Q系數(shù)如下:Q值是0則表示兩個變項沒有關(guān)系,愈大則表示關(guān)系愈強,但不會大于1。Q值可以是正數(shù)或負數(shù),前者表示正相關(guān),后者表示負相關(guān)。此外,分析兩個變項的關(guān)系時,還需注意兩個變項是否有因果關(guān)系。許多社會學研究在成立假設(shè)時,會假定某變項是因,稱為自變項;另一變項是果,后者稱為依變項。自變項(X)與依變項(Y)的關(guān)系,可表示為:X-Y。相關(guān)的兩個變項,不一定有因果之分,可能是共同變化。不對稱關(guān)系是指X影響Y,而丫不會影響X;對稱關(guān)系是指不確定或不區(qū)分影響的方向。二、交互分類與百分表列聯(lián)表及其相關(guān)概念交互分類,是指同時依據(jù)兩個變項的值,將所研究的個案分類。綜合了兩個變項的共同分布的統(tǒng)計表,通常稱為列聯(lián)表,又稱條件次數(shù)表。在表的最下端是對應(yīng)變項各級水平的總次數(shù),稱為邊緣次數(shù),它們的分布情況稱為邊緣分布。表中的其他次數(shù),稱為條件次數(shù),表示在自變項的每個值(條件)的情況下依變項的各個值的個案數(shù)目(次數(shù))。.列聯(lián)表的計算列聯(lián)表有大小之分。計算的方法,通常是將依變項值的數(shù)目乘上自變項值的數(shù)目。如果將依變項放于表的旁邊,將自變項放于表的上端,則表的大小=rxc(r為橫行數(shù)目,c為縱列數(shù)目)。先后次序表示前者(依變項)受后者(自變項)的影響。rxc表與cxr表是不同的o因為前后兩個數(shù)值代表不同的變項,包含不同類別數(shù)。.條件百分表及其制定準則為求相互比較從而知道兩個變項間的關(guān)系,需將各個基數(shù)標準化。最常用的標準化方法,是將所有基數(shù)都變成100,各個條件次數(shù)變?yōu)榘俜致省_@樣制成的表,稱為條件百分表。制定條件百分表的依據(jù)準則:(1)每個表的頂端要有表號和標題。(2)繪表時所用的線條,要盡可能簡潔。(3)在表上層的自變項每個值下的%號,表示下列的數(shù)值都是百分率。(4)表下層括弧內(nèi)的數(shù)值,表示在計算百分率時所根據(jù)的個案總數(shù)。在研究報告中,如果有條件百分表,便不需要有條件次數(shù)表。(5)表內(nèi)百分率數(shù)值的小數(shù)位要保留多少,視乎研究的需要,但最好是有一致性。在繪制條件百分表時,通常是根據(jù)自變項的方向來計算百分率;但如果依變項在樣本內(nèi)的分布不能代表其在總體內(nèi)的分布,則百分率的計算要根據(jù)依變項的方向。三、簡化相關(guān)與消減誤差相關(guān)測量法相關(guān)測量法,是指以一個統(tǒng)計值表示變項與變項之間的關(guān)系。這個值,通常稱為相關(guān)系數(shù)。選擇相關(guān)測量法時,應(yīng)注意以下三點:(1)變項的測量層次:定類、定序和定距。(2)兩個變項間之關(guān)系是否對稱。(3)統(tǒng)計值的意義:最好選用統(tǒng)計值有意義的相關(guān)測量法,如PRE測量法,其統(tǒng)計值具有消減誤差比例的意義,因此常用于社會學研究中。2.消減誤差比例現(xiàn)假定X的值未知,預測丫值時所產(chǎn)生的全部誤差是身;若X的值已知,則可根據(jù)X的每個值來預測丫值,假定誤差的總數(shù)是J則以X值來預測丫值時所減少的誤差為:鳥一層。這個數(shù)值(瑪一44)與原來的全部誤差(耳)相比,即為消減誤差比例。公式如下:PRE的數(shù)值愈大,表示以X值預測丫值時能夠減少的誤差所占的比例愈大,即X與丫的關(guān)系愈強。PRE的數(shù)值在。與1之間,如果冬=0,則PRE=1,反映X與丫是全相關(guān);如果瑪=瑪,則PRE=O,反映X與丫是無相關(guān)。第四章相關(guān)測量法與測量層次rLambda相關(guān)測量法C\系數(shù),兩個定類變項:Lambda,Tau-y? &一系數(shù)、Tau-y相關(guān)測量法zGamma相關(guān)測量法相關(guān)測量法與測量層次兩個定序變項:Gainna.d.ci,相關(guān)沌量法相關(guān)測量法與測量層次Gamma或《系數(shù)值在次數(shù)表中的求辭

(tau系數(shù)和rho系數(shù)

「簡單線性回歸分析兩個定距變項:演單線性七積矩相關(guān)測量法定類變項與定距變項:相關(guān)比率與非線性相關(guān)定類變項與定序變項:Lambda,Tau-y系數(shù)定序變項與定距變項:相關(guān)比率I綜合【知識框架】【重點難點歸納】一、兩個定類變項:Lambda,Tau-y如果兩個變項都屬于定類測量層次,可用Lambda相關(guān)測量法,也可用古德曼和古魯斯卡的Tau-y相關(guān)測量法。其統(tǒng)計值都具有PRE意義。Lambda相關(guān)測量法(1)Lambda相關(guān)測量法的含義Lambda相關(guān)測量法,又稱格特曼的可預測度系數(shù),其基本邏輯是計算以一個定類變項的值來預測另一個定類變項的值時,如果以眾值作為預測的準則,可以減除多少誤差。消減的誤差在全部誤差中所占的比例愈大,就表示這兩個變項的相關(guān)愈強。)Lambda相關(guān)測量法的兩種形式①對稱形式,簡寫入系數(shù),其特點是假定兩個變項間的關(guān)系是對稱的,即不分自變項或依變項。②不對稱形式,簡寫々系數(shù),即要求一個是自變項(X)而另一個是依變項(Y)。公式如下:(對稱) 2AM+MJ(不對稱)’T其中,以,=丫變項的眾值次數(shù),m.=x變項的眾值次數(shù),w,=x變項的每個值(類別)之下丫變項的眾值次數(shù),也=丫變項的每個值(類別)之下X變項的眾值次數(shù),n=全部個案數(shù)目。入系數(shù)與4系數(shù)的統(tǒng)計值均介于o與1之間,且都具有消減誤差比例的意義。)Lambda相關(guān)測量法的特點Lambda相關(guān)測量法的特點是以眾值作為預測的準則,因此,如果全部眾值集中在條件次數(shù)表的同一列或同一行中,則Lambda系數(shù)便會等于0。2.Tau-y相關(guān)測量法Tau-y系數(shù)屬于不對稱相關(guān)測量法,要求兩個定類變項中有一個是自變項(X),另一個是依變項(Y)。其系數(shù)值介于0與1之間,具有消減誤差比例的意義。公式如下:£ )4其中?「乙——,即不知X而預測丫時的全部誤差;F.,即知道X預測丫時所犯的錯誤;”=全部個案數(shù)目;/=某條件次數(shù);尸,7變項的某個邊緣次數(shù);月=工變項的某個邊緣次數(shù)。由于Tau-y測量法是考慮全部的次數(shù),故其敏感度高于Lambda測量法。二、兩個定序變項:Gamma,<如要以一個統(tǒng)計值來簡化一個定序變項與另一個定序變項的關(guān)系,可應(yīng)用古德曼和古魯斯卡的Gamma系數(shù),適用于分析對稱的關(guān)系;也可應(yīng)用薩默斯的4系數(shù),適用于不對稱的關(guān)系。兩者的系數(shù)值都是由-1至+1,既表示相關(guān)的程度,也表示相關(guān)的方向,而且都有消減誤差比例的意義。由于Gamma系數(shù)與4系數(shù)的目標都是分析兩列等級的關(guān)系,故可統(tǒng)稱為級序相關(guān)法。級序相關(guān)法是以每對個案之間的相對等級作為預測的準則。假如樣本的全部個案數(shù)目是“,則會組成5獻“一"對個案。同序?qū)κ侵改硨€案在兩個變項上的相對等級是相同的;異序?qū)κ侵改硨€案在兩個變項上的相對等級是不同的。通常以N代表同序?qū)倲?shù),以區(qū)代表異序?qū)倲?shù),Gamma系數(shù)與4系數(shù)就是根據(jù)這兩個數(shù)值來計算兩個定序變項的相關(guān)程度和相關(guān)方向。Gamma相關(guān)測量法計算Gamma系數(shù)(簡寫G)的公式如下:其中M是同序?qū)?shù),也是異序?qū)?shù)。Gamma系數(shù)值具有消減誤差比例的意義。G是負值,即表示從樣本中任意取出兩個個案時,如果知道他們在某個變項上的相對等級,就應(yīng)該估計他們在另一變項上的相對等級是相反的,而G的絕對值愈大,就表示估計時所犯的錯誤可能性愈小。另外,Q系數(shù)是Gamma系數(shù)的一種特殊方式,倘若兩個定序變項都是二分的,則、=6。4相關(guān)測量法—公式:-N+M+芍其中叱是同序?qū)?shù),M是異序?qū)?shù),4是只在依變項(Y)上同分的對數(shù)。<的系數(shù)值通常小于Gamma系數(shù)值,因為在4公式中分母的數(shù)值較大。Gamma或4系數(shù)值在次數(shù)表中的求解在次數(shù)表中計算Gamma或4系數(shù)值的程序如下:(1)在次數(shù)表中,X的值(i)分為1與2兩個等級,丫的值(J)也一樣。交互分類后的次數(shù)(人)分布如表4-1所示:表4-12x2表示例□ILY12fll(2)上表中的左上角次數(shù)乘上其右下角的次數(shù),就是同序?qū)?shù)。即:乂=正(左)上表中的右上角次數(shù)乘上其左下角的次數(shù),就是異序?qū)?shù)。即:N-f6上表中同一縱列的次數(shù)的乘積,就是只在X變項上同分的對數(shù)。即:工=為左)上表中同一橫行的次數(shù)的乘積,就是只在丫變項上同分的對數(shù)。即:W=65AMM至于在兩個變項上都是同分的對數(shù),先要計算每個方格內(nèi)的個案所組成對數(shù),然后將各方T一工15-1),工:(,:-,(t左(左一。壬2 2 2 2格的對數(shù)相加起來。即:(3)根據(jù)公式計算Gamma或4系數(shù)值。同理,可以從任何的rxc表中求出Gamma或4的系數(shù)值。tau系數(shù)和rho系數(shù)級序相關(guān)測量法,除了Gamma系數(shù)與4系數(shù),還有肯德爾的tau系數(shù)和斯皮爾曼的rho系數(shù)。(1)肯德爾的tau系數(shù)的三種形式肯德爾的tau系數(shù)有三種形式,分別稱為tau-a、tau-b和tau-c,都是適宜于分析對稱的關(guān)系。tau系數(shù)的基本邏輯,是計算同序?qū)?shù)與異序?qū)?shù)之差在全部的可能對數(shù)中所占的比例。公式如下:tau系數(shù)計算公式區(qū)別tau-a■ v-乂tau-a- 2' ,如果在兩個變項上都沒有同分對,則tau-a的統(tǒng)計值是由-1至+1。tau-bh Nf_如有同分對,可用lau?b,只有在交互分類表行數(shù)與列數(shù)相同(即r=c)的情況下,tau-b系數(shù)值才由-1至+1otau-c2m(N-N八tau-c?——;一i -無論有無同分對和無論行數(shù)與列數(shù)是多少,tau-c系數(shù)值都是由-1至+1。tau系數(shù)中以tau-c最常適合社會學研究,但tau-c沒有消減誤差比例的含義。其中凡是同序?qū)?shù),M是異序?qū)?shù),”是全部個案數(shù)目,m是交互分類表的行數(shù)(r)與列數(shù)(c)中的較小者。(2)斯皮爾曼rho系數(shù)斯皮爾曼rho系數(shù)的特點是在計算每個個案在兩個變項上的等級時,不僅要區(qū)別二者的高低差異,而且還要計算二者差異的確切數(shù)值。這個公式的基本邏輯,是求出在最大可能的=-等級差異總值中,實際的等級差異所占的比例是多少。公式如下:其中D表示每個個案在兩列級序上的差異值,”表示全部個案數(shù)目。D-可以避免正負值相抵消。rho是對稱相關(guān)測量法。其統(tǒng)計值是由-1至+1,表示相關(guān)的程度和方向,其平方值可以有消減誤差比例的意義。三、兩個定距變項:簡單線性如果所研究的變項都是屬于定距測量層次,可以用簡單線性回歸分析法來以自變項的數(shù)值預測或估計依變項的數(shù)值,而用積矩相關(guān)系數(shù)來測量兩個變項的相關(guān)程度和方向。.簡單線性回歸分析(1)簡單線性回歸分析法是指根據(jù)一個直線方程式,以一個自變項(X)的數(shù)值來預測Y'=bX+a一個依變項(丫)的數(shù)值。方程式為:其中X是自變項數(shù)值;方是回歸系數(shù),表示回歸線的斜率;4是截距,即回歸線與y軸的交點;尸是根據(jù)回歸方程式所預測的y變項值。(2)回歸法在繪制回歸線時所根據(jù)的準則是最小平方,依此推算出回歸直線的位置。其斜率(b)與截距(a)的數(shù)值如下:a=F-留=三 J—n其中x是自變項值,了是自變項的均值,y是依變項值,?是依變項的均值,?是全部個案數(shù)目。如果知道b與a的數(shù)值,則可以在坐標圖上定出直線的位置。把這兩個數(shù)值代入簡單線性回歸方程式,便可以用X值預測y值。(3)回歸方程式中的回歸系數(shù)。),其值大小表示x對y的影響有多少;其值符號表示x對y的影響方向。用公式表示為:總,即每增加一個單位的x值時,y值變化的大小。.積矩相關(guān)測量法要測量兩個定距變項間的相關(guān)強弱,最好應(yīng)用皮爾遜(Pearson)的積矩相關(guān)系數(shù)(簡寫’"㈤八球血一):’厘下t歹而產(chǎn)-(?/,),其公式如下:其中X與y分別代表兩個變項之值,它們的均值分別是了與手。,系數(shù)假定X與y的關(guān)系是對稱的,且,的統(tǒng)計值是由-1至+1,同時,的平方值具有消減誤差的意義。八值,稱為決定系數(shù),其具有消減誤差比例的意義。積矩相關(guān)系數(shù)(,)與簡單線性回歸分析(F=V+a)有密切的關(guān)系:如果,系數(shù)值愈大,就表示線性回歸方程式的預測能力愈強。四、定類變項與定距變項:相關(guān)比率與非線性相關(guān)相關(guān)比率,又稱eta平方系數(shù)(簡寫E:),是以一個定類變項(X)為自變項,以一個定距變項(Y)為依變項。eta系數(shù)值(£:二—一門:-與廣行=E)由0至1,其平方值(無)具有消減誤差比例的意義。公式如下:其中y是依變項的數(shù)值,F(xiàn)是依變項的均值,K是在每個自變項值(X)上各依變項值的均值;”是全部個案數(shù)目,國是每個自變項值(茍)的個案數(shù)目。另外,相關(guān)比率系數(shù)還有一個作用,即分析兩個定距變項之間的非線性關(guān)系。因此,如果兩個定距變項之間的關(guān)系是非線性的,則可將其中的一個變項看做是定類變項,然后用e系數(shù)來測量相關(guān)情況。五、定類變項與定序變項:Lambda,Tau-y系數(shù)最適合分析一個定類變項與一個定序變項的關(guān)系的統(tǒng)計法是威爾科森的區(qū)分系數(shù),又稱theta系數(shù)(簡寫9)。其基本邏輯是根據(jù)各個個案在定類變項上所屬的類別來估計他們在定序變項上的相對等級,屬于不對稱相關(guān)的測量法。其系數(shù)值由。至1,但沒有消減誤差比例的意義。由于定序測量層次具有定類測量層次的數(shù)學特質(zhì),大部分社會學研究都是采用Lambda或Tau-y系數(shù)來測量一個定類變項與一個定序變項的關(guān)系,即將定序變項作為定類變項看待。六、定序變項與定距變項:相關(guān)比率相關(guān)比率,即將定序變項看做是定類變項。在分析一個定序變項與一個定距變項的相關(guān)時,除了可以應(yīng)用相關(guān)比率系數(shù)以外,也有些社會學研究會將定序變項看做是定距變項,因此采用積矩相關(guān)系數(shù),甚至進行線性回歸分析。同理,如果兩個變項都是定序變項,理應(yīng)用Gamma或4,但也有不少研究是采用,系數(shù)或回歸分析。七、綜合社會學研究中進行統(tǒng)計分析的步驟主要包括:(1)簡化每一個變項的分布??梢赃\用次數(shù)、百分率、集中趨勢測量法和離勢測量法等統(tǒng)計技術(shù)。(2)敘述兩個變量之間的關(guān)系。要把它變成條件百分表,使各類的個案能夠在相同的基礎(chǔ)上作比較。(3)選擇相關(guān)測量法。在選擇相關(guān)測量法時,首要的準則是變項的測量層次,次要的考慮是關(guān)系的對稱與否。當前的社會學研究,較常采用具有消減誤差比例意義的相關(guān)測量法,尤其是以下幾種方法:

Lambda系數(shù)統(tǒng)計值由0至1,適用于分析兩個定類變項的關(guān)系,也有用來分析一個定類變項與一個定序變項的關(guān)系。這種測量法有兩種形式:入假定是對稱關(guān)系;4則假定是不對稱關(guān)系。Tau-y系數(shù)統(tǒng)計值的范圍和變項的測量層次,都與Lambda系數(shù)相同。但這種方法,只適合于分析不對稱的關(guān)系。在分析兩變項問的相關(guān)時,Tan-y的敏感度高于Lambda。Gamma系數(shù)統(tǒng)計值由-1至+1.表示相關(guān)的程度與方向,最適用于分析兩個定序變項之間的對稱關(guān)系。家數(shù)統(tǒng)計值的范圍和變項的測量層次,與Gamma系數(shù)相同。不同的是這種方法假定兩變項之間的關(guān)系不對稱。單性歸析簡線回分要求兩個變項都是定距變項,而且彼此的關(guān)系是不對稱的。其作用是以直線回歸方程式(『=S+a)來運算自變項(X)的數(shù)值,從而預測或估計依變項(Y)的數(shù)值。矩關(guān)數(shù)積機系適合于分析兩個定距變項的對稱關(guān)系,統(tǒng)計值由-1至+1,其平方值(rO有消減誤差比例的意義。除了表示相關(guān)的程度與方向以外,I?系數(shù)值也可表示簡單線性回歸方程式在預測時的準確程度。但r系數(shù)是假定兩個變項之間具有直線關(guān)系,如果兩者的關(guān)系顯然是非直線性,則要用其他方法,如相關(guān)比率(E2)o相關(guān)比率適用于分析一個定類變項與一個定距變項的不對稱關(guān)系,也有用來分析定序變項與定距變項的關(guān)系。這種方法的統(tǒng)計值是由。至1,其數(shù)值(日)具有消減誤差的意義。第三篇統(tǒng)計推論:單變項與雙變項第五章抽樣與統(tǒng)計推論「抽樣的意義(抽樣的意義與問題?I抽樣的問題r界定總體根據(jù)總體的定義,收集一份全部個案的名單抽樣的歷程i決定樣本的大小設(shè)計抽樣的方法,從抽樣根架中選取所需的個案數(shù)目抽樣與統(tǒng)計推論i評估樣本之正誤抽樣與統(tǒng)計推論?■立意抽樣法(非隨機抽樣法《偶遇抽樣法〔定額抽樣法陵機與非港機抽樣法《 (葡單R8機抽樣系統(tǒng)隨機抽樣〔冏機抽樣法J分層的機抽樣/定比分層抽樣‘集體抽樣法t異比分層抽憚方法多段抽樣I多期抽樣「二項抽樣分布1機率與抽樣分布?I均值抽樣分布【知識框架】【重點難點歸納】一、抽樣的意義與問題抽樣的意義(1)社會學研究關(guān)心的是總體的情況,不是樣本的情況。(2)節(jié)省在搜集資料和分析資料時所需的代價,包括人力、物力和時間。(3)由于樣本的個案數(shù)目較少,可以集中時間和人力,作詳細的調(diào)查和深入的分析2.抽樣的問題統(tǒng)計值是指從樣本中計算出來的數(shù)值;參數(shù)值是指在總體中的數(shù)值。抽樣的問題是:怎樣運用樣本的統(tǒng)計值來推測總體的參數(shù)值。這就要應(yīng)用推論統(tǒng)計法,又稱歸納統(tǒng)計法。二、抽樣的歷程代表性樣本是指樣本統(tǒng)計值近似總體參數(shù)值的樣本。求取有代表性樣本的步驟包括:界定總體;搜集全部名單;決定樣本的大?。贿x取樣本個案;在收集資料以后,評估樣本之正誤。具體如下:.界定總體界定總體是指清楚地說明全部研究對象的范圍,包括時間、地點和人物。由樣本所得的研究結(jié)果,原則上只能推論到這個所界定的總體范圍。.根據(jù)總體的定義,收集一份全部個案的名單抽樣框架是指包含總體的名單。.決定樣本的大小決定樣本的大小時需要考慮以下內(nèi)容:(1)樣本大小與抽樣誤差、代價①樣本的大小是與抽樣誤差成反比的,樣本愈大便愈有代表性,但所需的研究代價(包括人力、資金和時間)也愈大。在決定樣本的大小時,必須同時考慮抽樣誤差和研究代價這兩個因素,盡可能均衡二者的要求。②考慮總體的情況,如果成分復雜,相互差異大,則樣本就要加大,才能抽取出各式各樣的個案。③日后的資料分析計劃,也會影響樣本的大小。繁復和精細的統(tǒng)計分析需要較大的樣本。(2)決定樣本大小的準則決定樣本大小的一般的準則是:根據(jù)所能付出的研究代價的最大限度抽取最大的樣本。決定樣本的大小以后,可以計算抽樣比例: N其中n是樣本的個案數(shù)目,N是總體的個案數(shù)目。抽樣比例愈大,則樣本的代表性就愈大。.設(shè)計抽樣的方法,從抽樣框架申選取所需的個案數(shù)目假定樣本的個案數(shù)目是固定的,則不同的抽樣方法所犯的抽樣誤差會不相同,所需求的研究代價也不相同。因此,在抽樣時,要小心選擇一種較為適當?shù)姆椒ā?評估樣本之正誤(1)抽樣誤差一項良好的研究,必須盡可能評估樣本的正誤,如果總體的資料分布與樣本的資料分布基本上一致,則樣本的代表性較好。(2)非抽樣誤差在調(diào)查樣本個案時,可能發(fā)生非抽樣誤差,如調(diào)查員可能有偏見或犯錯誤。最常見的非抽樣誤差是由遺失或無回應(yīng)的問題引發(fā),如有些個案因健康問題不能接受調(diào)查,有些個案沒法找到,或有些個案拒絕合作,這些遺失的個案可能使樣本有偏差。三、隨機與非隨機抽樣法抽樣的方法可以分為隨機抽樣法與非隨機抽樣法兩大類。.非隨機抽樣法(1)非隨機抽樣的方法非隨機抽樣不受機率的限制,主要包括以下三種方法:意樣匚立抽法立意抽樣法又稱判定抽樣法,是依據(jù)研究員的主觀見解和判斷,選取他認為是典型的個案。遇樣偶抽法偶遇抽樣法又稱方便抽樣法,是選取一些偶然遇見的個案作為樣本。這種抽樣方法很容易進行,但樣本的代表性卻有疑問。電臺或報章記者所做的訪問,頗多是用偶遇抽樣方法,取其方便易做。定額抽樣法定額抽樣法是根據(jù)某些標準將總體分組,然后用立意或偶遇抽樣法由每組中選取樣本個案。用定額抽樣法取得的樣本,由于包括了各組的個案,故其代表性通常高于單純用立意或偶遇抽樣法。(2)非隨機抽樣的優(yōu)缺點①優(yōu)點:簡便,用較少的代價便能找到所需的樣本個案,故常用于探討性或試點性的研究中。②缺點:不能用統(tǒng)計方法來推測總體的情況。.隨機抽樣法隨機抽樣法,是指根據(jù)已知的機率來抽取樣本個案,可作統(tǒng)計推論。隨機抽樣方法主要包括以下幾種:(1)簡單隨機抽樣簡單隨機抽樣,通常采用不回置方式,即選出的個案,不用放回總體中再抽取。這種方法最簡單,最基本。它要求每個個案被選取的機會是相同的。抽樣比率,即£=!!/?4。社會學研究,一般應(yīng)用隨機數(shù)表來抽取樣本的個案。使用隨機數(shù)表進行抽樣的步驟包括:①先將所有的個案編號。②從隨機數(shù)表中任意地選定一個數(shù)字作為起點,順序選出一系列的號碼,號碼的多少,視乎樣本的大小。③這組號碼的相應(yīng)個案,就構(gòu)成一個簡單隨機樣本。(2)系統(tǒng)隨機抽樣系統(tǒng)隨機抽樣的步驟包括:①將全部個案排列起來。②按抽樣比例分成間隔,并在第一個間隔內(nèi)選取第一個個案。③每經(jīng)一個間隔就選取一個個案。這樣選出的個案,就是所需的樣本。在大規(guī)模的研究中,這種抽樣方法較為簡便快捷。在應(yīng)用系統(tǒng)隨機抽樣法時,要考察樣本是否具有周期性的特征。較為安全的做法,是經(jīng)過若干間隔以后,再用隨機方式抽取個案,以新的秩序取代原來的秩序。(3)分層隨機抽樣分層隨機抽樣分為采用相同比例抽樣和采用不同比例抽樣兩種。①定比分層抽樣在社會學研究中較為常用的是定比分層隨機抽樣法。定比分層隨機抽樣法是指在各組中按同樣的比例抽取樣本個案。具體步驟包括:首先將總體按某些標準分組,然后在每組中按照相同的比例用簡單隨機或系統(tǒng)隨機抽樣法選取個案。②異比分層抽樣方法異比分層隨機抽樣是指在不同的組中用不同的比例來抽樣。有兩種情況適宜采用異比分層隨機抽樣:a.某些組的個案數(shù)量特別少,按相同比例抽取的樣本個案數(shù)量就會很少,以致影響統(tǒng)計分析的準確性。b.某組個案的內(nèi)部差異頗大,便要擴大抽樣比例,以求選出不同意見者。采用異比分層隨機抽樣方法,在統(tǒng)計分析時頗為麻煩。由于各組的抽樣比例不同,用樣本資料來統(tǒng)計數(shù)值時就必須加以修正。(4)集體抽樣法集體隨機抽樣法是指隨機地抽取若干集體,然后以它們所包括的全部個案作為研究的樣本o選取集體時,可用簡單隨機抽樣法,也可以將集體分組以后才隨機抽取,后者所犯的抽樣誤差比較小。各個集體所包括的個案數(shù)量可以相同,也可以不相同。集體抽樣的優(yōu)點是代價比較少,特別適用于大規(guī)模的抽樣調(diào)查;缺點是所犯的抽樣誤差會比較大,樣本的代表性通常比不上用簡單或分層隨機抽樣法。在采用集體抽樣法之前,最好先了解各個個案在集體內(nèi)和在集體間的差異情況。(5)多段抽樣

多段抽樣法是指先抽取若干集體,然后從所選取的集體中再抽取若干較小的單位。在每個階段抽樣時,可以用簡單隨機抽樣法,也可以較為精密地采用分層隨機抽樣法。在大規(guī)模的抽樣調(diào)查中,尤其是地域分布廣泛,采用多段抽樣可以節(jié)省很多研究代價,包括人力、資金和時間。但每一個階段的抽樣都會有誤差,經(jīng)過多個階段才抽出來的樣本,誤差就會頗大。(6)多期抽樣多期抽樣是指從樣本中抽取分樣本,分期收集和累積資料的方法。一般來說,較為重要的資料,應(yīng)在前期較大和較有代表性的樣本中收集。這種抽樣方法,一方面可以搜集大量資料,另一方面可以減少對頗多被研究者的滋擾。當然,愈后期的樣本個案受滋擾愈大,抽樣誤差也愈大。四、機率與抽樣分布以樣本的數(shù)值來推算總體的情況,只能作“或然”的說法,不能說是“必然”如此。統(tǒng)計推論是“機率”論為基礎(chǔ)的。抽樣分布是指根據(jù)機率的原則而成立的理論性分布,顯示由同一總體中反復不斷抽取不同樣本時,各個可能出現(xiàn)的樣本統(tǒng)計值的分布情況。.二項抽樣分布(1)二項分布的計算公式二項,是指所研究的變項只有兩個值。假定在總體內(nèi)這兩個值的個案數(shù)目是相同的,即各占半數(shù)的個案,同時假定抽樣是隨機的,則從總體中一次一次地抽取個案時,每一次的成功機會(P)應(yīng)是1/2,失敗機會(Q)也是1/2。r!(n-r)?尸‘?!?r!(n-r)?尸‘。”'當從n個個案中獲得r次成功的計算公式為:其中n是樣本大小,r是成功的數(shù)目,P是每次的成功機會,Q是每次的失敗機會,p(r)是獲得r次成功個案的機率。其實,只要是P+Q=l,P與Q可以是任何數(shù)值。把這P、Q代入前述的數(shù)學公式中,就可計算得在不同樣本大小的情況下的二項抽樣分布。當然,由于PRQ,抽樣分布是不對稱的。(2)二項抽樣分布的特質(zhì)①當P=Q=1/2的二項抽樣分布是對稱的;②各個機率是可以相加的。.均值抽樣分布(1)均值抽樣分布均值抽樣分布是指從總體中不斷地抽取大小相同的隨機樣本,分別計算每個樣本的均值X,并把每個均值的出現(xiàn)次數(shù)相加起來,得到樣本均值的次數(shù)分布情況。用矩形圖來表示均值分布的情況,然后以多角線來連接各矩形的頂端的中點。由于所計算的是定距資料,各個矩形的寬度可以無限小,因而連接各個矩形頂端的中點的多角線,理應(yīng)是一條平滑的曲線,如圖5-1所示。圖中的橫軸表示各個樣本的均值X,縱軸表示每個均值的次數(shù)(f)O圖5-1均值之抽樣分布(正態(tài))(2)均值抽樣分布的特征根據(jù)數(shù)學上的中央極限定理,均值的抽樣分布具有如下特征:①如果樣本相當大(通常是指n不可少于30,最好是應(yīng)100),則抽樣分布接近正態(tài)分布o其特點是單峰和對稱,因而眾值、中位值與均值都相同。②抽樣分布之均值就是總體之均值。如果樣本相當大,通常是以樣本的標準差(s)作為總體的標準差。標準誤差是指抽樣分布的標準差,可以用樣本的標準差代替總體標準差來估計標準誤差(SE),公式如下:③抽樣分布的均值(M)兩旁的樣本均值次數(shù)所占的比例是可以知道的。在社會學研究中,下面幾項數(shù)值較為常用,值得注意:a.有90%在M±1.65(SE);b.有95%在M±1.96(SE);c.有98%在M±2.33(SE);d.有99%在M±2.58(SE).(3)統(tǒng)計推論統(tǒng)計推論,是根據(jù)抽樣分布的原理來進行的,而抽樣分布與機率的概念密切相關(guān)。只要研究者采用隨機抽樣法,就可以根據(jù)抽樣分布,以樣本的數(shù)值來推測總體的情況。統(tǒng)計推論一般可分為兩大類:參數(shù)估計和假設(shè)檢定。①參數(shù)估計,是指根據(jù)一個隨機樣本的統(tǒng)計值來估計總體參數(shù)值。②假設(shè)檢定,是首先假設(shè)總體的情況,然后以一個隨機樣本的統(tǒng)計值來檢驗這個假設(shè)是否正確。第六章參數(shù)值的估計丁點值估計參數(shù)值的估計,點值估計與間距估計t間距估計參數(shù)值的估計「均值的間距估計間能估計:均值、百分率、程矩相關(guān)4百分率(或比例)的間距估計I估計程矩相關(guān)系數(shù)值(r)「決定樣本的準則及問題I決定樣本的大小4所能容忍的錯混量I推斷樣本大小的困難及做法【知識框架】【重點難點歸納】一、點值估計與間距估計以樣本的統(tǒng)計值來估計總體的參數(shù)值,有兩大類做法:點值估計和間距估計。二者皆要求樣本是以隨機方法抽取的。.點值估計點值估計,是指以一個最適當?shù)臉颖窘y(tǒng)計值來代表總體的參數(shù)值。一般來說,如果樣本愈大,且抽樣方法愈嚴謹,這種估計方法愈可信。但無論如何,抽樣誤差總是難免的,加之由點值估計法得到的估計值的可信程度很難確定。因此在社會學研究中,通常多采用間距估計法。.間距估計間距估計,是指以兩個數(shù)值之間的間距來估計參數(shù)值。間距的大小取決于在估計時所要求的可信程度。在樣本大小相同的情況下,如果要求的可信度愈大,則間距就會愈大。這個間距,通常稱為“可信間距”。應(yīng)用間距估計法時,可以選定任何的可信度,但一般用95%或99%。決定可信度以后,就可以計算間距的大小。

二、間距估計:均值、百分率、積矩相關(guān)均值的間距估計^-1.96(X)<JZ<^+1.96(-L)(1)如果可信度為95%,可信間距的計算公式為:_s—SX-2.58(-=)<M<X+2.58(5=)y/n yfn(2)(2)如果可信度是99%,可信間距的計算為:其中又是樣本的均值,M是總體的均值,S是樣本的標準差,n是隨機樣本的大小。(3)間距的大小與可信度的高低成正比,可信間距的大小與樣本的大小成反比。在可信度已經(jīng)確定的前提下,提高間距估計的精確性的方法是加大樣本容量。.百分率(或比例)的間距估計(1)如果要求95%的可信度,則計算可信間距的公式為p±1.96(SE),即:,.QAIpO-P)p+『一「(2)如果要求99%的可信度,則計算可信間距的公式為p±2.58(SE),即:p+2%尹Vn其中p是樣本中的比例(即百分率),SE是抽樣分布的標準誤差,n是隨機樣本的大小。如果樣本頗大,百分率(或比例)的抽樣分布會近似正態(tài)分布,各個樣本的百分率都是對稱地散布于總體百分率的兩旁,其標準誤差是:其中P是總體的比例(即百分率)。由于難以知道P的數(shù)值,可以改用樣本的比例(p)。(3)如果樣本相當大,可以用樣本p值代替總體P值。另一個較為保守的做法,是以p=0.50代入SE公式,使SE達到最大值,再將SE值代入可信間距公式就獲得最大的間距。.估計積矩相關(guān)系數(shù)值(r)計算總體相關(guān)系數(shù)的步驟為:Z'=1.1511og(1)將樣本的積矩相關(guān)系數(shù)(r)轉(zhuǎn)化為值,公式如下:(2)在Z,值的抽樣分布(正態(tài))中的標準誤差,可用下面公式計算:其中n是樣本的大小。(3)假定要求的司信度是95%,則可信間距是:Z'±1.96(SE)。(4)查數(shù)學用表可知計算得到的可信間距對應(yīng)的r值區(qū)間,由此可得在可信度95%的情況下,總體的積矩相關(guān)系數(shù)區(qū)間。三、決定樣本的大小決定樣本的準則(1)在能夠付出的研究代價的限度內(nèi),選取最大的樣本。(2)研究可以容忍的錯誤愈小,樣本就要愈大。(3)所研究個案之間的相互差異愈大,樣本就要愈大。2.樣本大小的計算公式研究中的錯誤為:其中,e為錯誤,M為總體均值,了為一個隨機樣本(n)中計算出來的均值。^-1,964=<M<X+1.96之假定總體的標準差(S)已知,則在估計總體的均值時,95%的可信度間距應(yīng)為因為fl.96SV

n= 可推算出如果把可信度提高為99%,則公式是:由此可知,可信度愈高,樣本就要愈大。以統(tǒng)計公式來推斷樣本的大小通常只作為參考。第七章假設(shè)檢定:均值與百分率「研究限設(shè)與虛無假設(shè)否定域與顯著度基本知識一端與二端檢定假設(shè)檢定:制值與百分率,甲種誤篁與乙種誤差假設(shè)檢定:制值與百分率檢定力:參數(shù)與非參數(shù)法I檢定假設(shè)的步驟jZ檢定法(大樣本)(單均值tt檢定法(小樣本)單均值與均值差異[ 「Z檢定法I兩個均值的差異tt檢定法I多個均值的差異「單百分率(或比例)單百分率與百分率差異,兩個百分率(或比例)的差異

I多個百分率的差異【知識框架】【重點難點歸納】一、基本知識在統(tǒng)計推論上較為常用的是檢定假設(shè)的方法。假設(shè)檢定,是指先成立一個關(guān)于總體情況的假設(shè),繼而抽取一個隨機樣本,然后以樣本的統(tǒng)計值來驗證假設(shè)。.研究假設(shè)與虛無假設(shè)(1)研究假設(shè)科學的研究一般是先成立假設(shè),即假定在總體中存在某些情況,這個假設(shè),稱為研究假設(shè)(簡寫HD。(2)虛無假設(shè)虛無假設(shè)(簡寫H))是指與研究假設(shè)相對立的假設(shè)。檢定假設(shè)的基本原則是直接檢定H。,因而間接地檢定H”目的是排除抽樣誤差的可能性。否定Ho,也不能說Hi一定對,只能說“可能”對,因為H。被否定是由于它在抽樣分布中出現(xiàn)的可能性很小,但不是完全沒有可能性。同時,除了抽樣誤差以外,也可能有其他因素引起錯誤。.否定域與顯著度(1)否定域否定域是指在未分析資料之前,研究者決定的否定虛無假設(shè)(H。)的區(qū)域。確切地說,否定域(簡寫CR),是指抽樣分布內(nèi)一端或兩端的小區(qū)域,如果樣本的統(tǒng)計值在此區(qū)域范圍內(nèi),則否定虛無假設(shè)。否定域在抽樣分布的一端還是二端,則要視研究假設(shè)(H)的性質(zhì)而定。否定域的大小,取決予研究的需要。(2)顯著度顯著度是指表示否定域在整個抽樣分布中所占的比例,即表示樣本的統(tǒng)計值落在否定域內(nèi)CH的機會,如圖7-1所示。圖7-1否定域(CR)與顯著度(p).一端與二端檢定一端檢定是指否定域只在一端(可以在右端,也可在左端)。二端檢定是指否定域在兩端的位置。如果所選定的顯著度相同,二端檢定比一端檢定更難否定虛無假設(shè)(H。)。一端或二端檢定取決于是否可以確定研究假設(shè)(H)的方向。.甲種誤差與乙種誤差(1)甲種誤差甲種誤差,是指否定H。,但實際上H。是對的錯誤可能性。這個可能性,就是研究者所選定的顯著度。(2)乙種誤差乙種誤差,是指不否定H。,但實際上H。是不對的錯誤可能性。.檢定力:參數(shù)與非參數(shù)法用作檢定假設(shè)的推論統(tǒng)計法可以分為兩大類:參數(shù)檢定法和非參數(shù)檢定法。統(tǒng)計法的檢定力,是指該統(tǒng)計法能夠準確地判斷虛無假設(shè)(H。)的正誤之能力。由于在統(tǒng)計推論之前,已決定顯著度(即甲種誤差)的大小,故檢定力的大小其實是指乙種誤差的大?。喝绻诮y(tǒng)計推論時所犯的乙種誤差愈小,該統(tǒng)計法的檢定力就愈大。兩者的關(guān)系,可以表示為:檢定力=1一乙種誤差之機會。參數(shù)檢定法的檢定力大于非參數(shù)檢定法是因為原則上其在檢定假設(shè)時所犯的乙種誤差較小。(1)參數(shù)檢定法參數(shù)檢定法的特點,是要求總體具備某些條件,如正態(tài)分布或標準差相等。參數(shù)檢定法,一般也要求變項的數(shù)值具有定距測量層次的特質(zhì)。參數(shù)檢定法包括z檢定、t檢定和F檢定等。(2)非參數(shù)檢定法非參數(shù)檢定法,又稱分布自由檢定法,一般不要求是定距測量層次,因而適用于推論定類或定序資料。但是,由于非參數(shù)檢定法不理會總體的情況,在推論時就較為困難,準確性也會因此而影響。.檢定假設(shè)的步驟(1)根據(jù)研究假設(shè)(H)成立與其對立的虛無假設(shè)(H。)。明確檢定的目的就是要否定Ho,從而知道Hi是對的可能性。(2)選擇適當?shù)臋z定統(tǒng)計法,并要列舉其假定或要求。(3)確定抽樣分布。(4)決定顯著度,并依據(jù)Hi的性質(zhì)選用一端或二端檢定,然后從抽樣分布中求出否定域的位置和大小。(5)根據(jù)樣本的資料計算檢定值,從而作出決策。倘若檢定值是在否定域的范圍內(nèi),可以否定H。,即Hi可能是對的;否則的話,就不能否定H。,也即Hi可能是錯誤的。二、單均值與均值差異單均值當研究假設(shè)是總體中的一個均值時,樣本相當大時可用Z檢定法;樣本較小時則用t檢定法o二者都屬于參數(shù)檢定法,要求包括:定距變項;隨機抽樣;總體呈正態(tài)分布。Z檢定法(大樣本)這種檢定法要求樣本是以隨機方法抽取的,而且相當大(通常后100)。在這種情況之下,便可應(yīng)用均值抽樣分布來檢定虛無假設(shè)(H。)。Z檢定法的步驟包括:①決定顯著度和否定域的大小,并考慮選擇一端或二端檢定的問題。②設(shè)立H。,即總體中的均值是M,進而以此為基礎(chǔ)來確定抽樣分布。③如果是大樣本,則無限個樣本均值的抽樣分布會近似正態(tài)分布,其均值就等于M,而標準誤差(SE)則等于總體的標準差除以樣本大小的平方根,但此可以使用下式估算:④查數(shù)學用表可知計算得到的Z值對應(yīng)的正態(tài)曲線下各部分面積的比例數(shù)值。⑤將計算得到的均值又落在否定區(qū)域的機會,與顯著度進行比較。t檢定法(小樣本)如果是小樣本,尤其是當吐30,就要改用t檢定法。以t值來表示樣本的均值在標準化抽樣X-MX-MSE~S!y[n-1分布中的位置。公式如下:其中M是所假定的總體均值,n是樣本大小,SE是標準誤差,X和S分別是樣本均值和標準差。t的抽樣分布形狀取決于自由度。自由度(簡寫df)是指有多少個案的數(shù)值可以隨意變更°df=n-1,df愈小則t分布愈扁平,df愈大則t分布愈高聳而且接近正態(tài)分布。不同顯著度和自由度對應(yīng)的t值均可在數(shù)學用表中查得。.兩個均值的差異Z檢定法如果兩個樣本的個案總數(shù)額大,一般在(m+m)N100時,則可用下面的公式:其中京和&分別代表第一個樣本(n.)的均值和標準差,而K和工分別是第二個樣本(m)的均值和標準差。t檢定法倘若兩個隨機樣本的個案總數(shù)較小,即:(m十m)<100,則用下面的公式:上式中的SE是兩個樣本均值相差之抽樣分布的標準誤差,可作如下的估計:

SE=附+峪:區(qū)+叱df=(%-1)+(%—1)=/+-2由于有兩個樣本,故此自由度是:在實驗研究中,由于樣本一般都較小,t檢定法是經(jīng)常被采用的。.多個均值的差異研究時可能有三個或以上的樣本,如以M代表總體的均值,X代表樣本均值,則研究假設(shè)和虛無假設(shè)為:而研究者就要根據(jù)正、乂和工等數(shù)值的相互差異來檢定H。的正確性。常用的方法是F檢定,又稱方差分析法。Z檢定法與t檢定法的區(qū)別主要包括:Z檢定法基于正態(tài)抽樣分布,要求大樣本;t檢定法基于t值抽樣分布,可用于小樣本。(2)當樣本增大時,t值分布會逐漸接近正態(tài)分布,這時t檢定法與Z檢定法的分別就不大oZ檢定法可以說是t檢定法的一種特殊(大樣本)情況。在近代社會研究中,t檢定法的應(yīng)用更為廣泛。三、單百分率與百分率差異單百分率(或比例)如果研究假設(shè)(H)是總體的一個百分率(或比例),可用Z檢定法來驗證虛無假設(shè)(H“z=p-pz=p-p-P-pSE尸(1一尸)),其公式如下:其中P是所假設(shè)的總體百分率(或比例),p是樣本中算出的百分率(或比例),n是樣本大小,SE是標準誤差。應(yīng)用這個公式時,最好是樣本較大。.兩個百分率(或比例)的差異寸均七如要檢定兩個樣本的百分率(pi和戶)在其總體中是否有差異,可用下面的Z檢定公式:兩個隨機樣本百分率之相差的抽樣分布接近正態(tài)分布,故可用Z檢定法。公式中的分母就是標準誤差。.多個百分率的差異如要檢定三個或以上的百分率在其總體中是否有差異,可以用X,檢定。X,檢定屬于非參數(shù)檢定法,而且也可用來檢定兩個百分率的差異,是當前社會學研究常用的推論統(tǒng)計法。X?的作用,是檢定兩個或以上的隨機樣本的次數(shù)分布是否有差別。第八章假設(shè)的檢定:兩個變項之相關(guān)JX?檢定法的步孩/X;檢定及其相關(guān)測量法I根據(jù)X:數(shù)值測量兩個定類變項的相關(guān),Gamma系數(shù)的應(yīng)用jZ檢定法Gamn1a及其他級字相關(guān)的檢定J 't檢定法〔檢定S因子數(shù)值的方法假設(shè)的檢定:兩個變質(zhì)之相關(guān)(單因方差中F檢定的應(yīng)用

運用F檢定的要求假設(shè)的檢定:兩個變質(zhì)之相關(guān)單因方差分析與F檢定<F檢定公式求解否定域的范圍*檢定的另一種推算方法兩個定更變項成直淺關(guān)系程矩相關(guān)與回歸系數(shù)的檢定?I兩個定定變頊成非直線關(guān)系[非參數(shù)檢定法非參數(shù)檢定:I.檢定與H檢定■I.檢定〔H檢定?檢定假設(shè)方法的共同點i總結(jié),檢定法總結(jié)I超機抽樣旃定兩變項之間的關(guān)系的步驟【知識框架】【重點難點歸納】一、x?檢定及其相關(guān)測量法如果兩個變項都是定類變項,可用片檢定來推論在總體中兩者是否相關(guān)。這是非參數(shù)檢定法的一種,基本上只要求:樣本是用隨機方法抽取的;兩個變項都具有定類的性質(zhì)。.X?檢定法的步驟(1)建立假設(shè)關(guān)于總體的情況,研究假設(shè)(H)與虛無假設(shè)(H。)分別是:Hl:X與丫相關(guān)(總體中);Ho:X與丫不相關(guān)(總體中)。(2)計算X2值表8-1是據(jù)樣本的資料而成立的一個條件次數(shù)表:表8-1條件次數(shù)表□X121fnfl2Bl2fixfllB2AlA2nXZ檢定的公式如下:自由度df=(r—1)(c—1)其中f是根據(jù)所抽取的樣本而計算出來的實際次數(shù),e是與每個實際次數(shù)相應(yīng)的預期次數(shù),A與B分別是X與丫這兩個變項的邊緣次數(shù),n是樣本大小,r與c則分別是表的行數(shù)與列數(shù)。預期次數(shù)(e),是指在總體中兩個變項沒有關(guān)系(即H。是對)時,上面的表內(nèi)每格所應(yīng)有的次數(shù)。倘若X與丫確實是不相關(guān),即e”和已2所占的比例應(yīng)該相同,而和心所占的比例也相同。表中每格的預期次數(shù)(e),就是相應(yīng)的兩個邊緣次數(shù)(B與A)的乘積除以樣本的大小(n)o片數(shù)值愈大,就表示在總體中X與丫不相關(guān)的可能性愈大,即表示愈能否定虛無假設(shè)(H(>)o(3)查數(shù)學用表確定否定虛無假設(shè)的X?值犬的抽樣分布取決于自由度,在決定顯著度以后是否能夠否定Ho,就要視乎自由度的大小。犬抽樣分布的自由度是據(jù)表的行數(shù)(r)與列數(shù)(c)來計算的,公式是:df=(r-1)(c-1),表示表中各個方格內(nèi)的預期次數(shù)有多少個是可以自由決定的。在數(shù)學用表中可查到不同自由度的X?分布的值。自由度愈大,X?分布的偏態(tài)度愈小。倘若一個是定類變項,另一個是定序變項,通常亦是用犬檢定,即將定序變項看作是定類變項。(4)得到研究結(jié)論若樣本中算得的檢定值在否定域的范國內(nèi),則可否定虛無假設(shè),得到研究結(jié)論。.根據(jù)代數(shù)值測量兩個定類變項的相關(guān)據(jù)力數(shù)值也可以測量兩個定類變項的相關(guān)。較為常見的方法有:Phi相關(guān)系數(shù):(2)列聯(lián)相關(guān)系數(shù):(3)克拉默的V相關(guān)系數(shù):其中,n是樣本的大小,m是表的行數(shù)(r)與列數(shù)(c)中較小的數(shù)目。這些相關(guān)測量法的系數(shù)值愈大,就表示兩個變項的相關(guān)程度愈強。但是,這三種系數(shù)值都沒有消滅誤差比例的意義。V系數(shù)值則是由0至1,不受表的大小所影響,最適用于社會學研究。二、Gamma及其他級序相關(guān)的檢定Gamma系數(shù)的應(yīng)用如果兩個變項都是定序變項,可以用Gamma系數(shù)(簡寫G)來測量相關(guān)的程度和方向。但倘若所研究的是一個隨機樣本,就要設(shè)法推論總體的情況。以Gamma系數(shù)來求出樣本中X與丫的相關(guān),然后以Z檢定法或t檢定法來推論在總體中的Gamma是否等于0。研究假設(shè)(HI)與虛無假設(shè)(Hu)分別是:Hi:總體中Gamma〉或<0;H。:總體中Gamma=0。Z檢定法使用Gamma系數(shù)的條件包括:①兩個變項都具有定序的特質(zhì);②采用隨機抽樣;③樣本較大(最好是應(yīng)100)。G值標準化的公式如下:

其中G是隨機樣本的Gamma系數(shù)值,N,是同序?qū)?shù),N4是異序?qū)?shù),n是樣本的大小。t檢定法如研究假設(shè)(Hi)是總體中Gamma>0或Gamma<0,可用一端檢定;如是Gamma/),則要用二端檢定。如果是小樣本,就要改用t檢定法,公式如下:df=N.^Ni-l2.檢定S因子數(shù)值的方法較為精確的做法,是不用理會G值,而是直接檢定“N,—NJ這個稱為S因子的數(shù)值??梢酝ㄟ^檢定S來間接檢定G。檢定S的方法如下:s'=IW2(r-lXc-l)s'=IW2(r-lXc-l)(1)為使S的抽樣分布近似正態(tài)分布,要把S的數(shù)值修正為S,,公式如下:其中n是樣本大小,r與C分別是表的行數(shù)與列數(shù)。SE=&2+ ].土區(qū)yw-1 破1)(2)(2)要用下面的公式來計算修正值(S')的標準誤差:其中:A2:相應(yīng)于X變項的邊緣次數(shù)中兩個數(shù)值之乘積的總和;B::相應(yīng)于丫變項的邊緣次數(shù)中兩個數(shù)值之乘積的總和;A3:相應(yīng)于X變項的邊緣次數(shù)中三個數(shù)值之乘積的總和;B3:相應(yīng)于丫變項的邊緣次數(shù)中三個數(shù)值之乘積的總和。(3)計算檢定值(Z),公式如下:(4)根據(jù)顯著度,查表判斷是否否定虛無假設(shè)。三、單因方差分析與F檢定單因方差中F檢定的應(yīng)用分析一個定類變項(X)和一個定距變項(Y)的關(guān)系,可用相關(guān)比率(即eta平方系數(shù))測量法來求出相關(guān)的程度。倘若所研究的是一個隨機樣本,推論總體情況時較為常用的是單因方差分析中的F檢定,其目的是要推算在各組總體中的均值是否相等。.運用F檢定的要求F檢定是參數(shù)檢定法的一種,其具體要求如下:(1)隨機樣本;(2)有一個變項是定距變項;(3)各組的總體都是正態(tài)分布和具有相等的方差。.F檢定公式計算檢定值的F檢定公式如下:dfx=k-\dfz=n-k其中E?是樣本的相關(guān)比率,n是樣本的大小,k是分組數(shù)目。計算出來的檢定值F,通常稱為F比率。F的抽樣分布取決于兩個自由度,可以dfi和dfZ分別表示。.求解否定域的范圍F的分布情況取決于兩個自由度:(1)計算消減誤差(ED時的自由度,df,=k-lo(2)計算剩余誤差(1—E2)時的自由度,df2=n—ko可由兩個自由度查表知F值在不同顯著度下的否定域的臨界值。.F檢定的另一種推算方法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論