社會統(tǒng)計學(xué) 復(fù)習(xí)資料_第1頁
社會統(tǒng)計學(xué) 復(fù)習(xí)資料_第2頁
社會統(tǒng)計學(xué) 復(fù)習(xí)資料_第3頁
社會統(tǒng)計學(xué) 復(fù)習(xí)資料_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、參數(shù):是一個變量。我們在研究當(dāng)前問題的時候,關(guān)心某幾個變量的變化以及它們之間的相互關(guān)系,用自變量和因變量來表示。如果我們引入一個或一些另外的變量來描述自變量與因變量的變化,引入的變量本來并不是當(dāng)前問題必須研究的變量,我們把這樣的變量叫做參變量或參數(shù)。2、列聯(lián)表:又稱交互列表,是一種專門用來測量兩個變量關(guān)系的方法,將研究所得的數(shù)據(jù)按兩個變量進行交叉分類的頻次分配表。3、備擇假設(shè):又稱研究假設(shè),是我們在社會學(xué)研究中事先安排的假設(shè)。通過抽樣調(diào)查有充分根據(jù)否定原假設(shè),是與原假設(shè)相反的假設(shè),用H1表示,是當(dāng)原假設(shè)被推翻時需要接受的假設(shè)。備擇假設(shè)有三種形式,以H0為=Z0為例,當(dāng)H0被否定,可能被采用的H1為Z0,Z0或Z04、非參數(shù)檢驗:也稱自由檢定法,指對分布類型已知總體進行參數(shù)檢驗之外,所有檢驗方法的總稱,這類方法的使用不需要對總體分布作任何事先的假定,例如:正態(tài)分布等,同時從檢驗內(nèi)容來說,也不是檢驗總體分布的某些參數(shù),例如均值等,而是檢驗總體某些有關(guān)的性質(zhì)。5、非參數(shù)檢驗與參數(shù)檢驗的區(qū)別非參數(shù)檢驗的限制比參數(shù)檢驗少,無需任何假定,無需限制變量類型,且計算量小,簡單易行但非參數(shù)檢驗與參數(shù)檢驗相比,效率較差,不精確,檢驗相同的問題,需要比參數(shù)檢驗更大的樣本量非參數(shù)檢驗顯著,參數(shù)檢驗不一定顯著,但參數(shù)檢驗顯著,非參數(shù)檢驗必定顯著6、選擇相關(guān)系數(shù)的標(biāo)準(zhǔn) 1看兩個變量的變量層次 2看兩個變量是否對稱7、假設(shè)檢驗與區(qū)間估計的邏輯有哪些不同不同假設(shè)檢驗從總體到樣本,即事先對總體參數(shù)值或分布形式作出某 種假設(shè),然后利用樣本來判斷這個原假設(shè)是否成立區(qū)間估計從樣本到總體,即根據(jù)樣本計算出一個范圍來對未知參數(shù)進行估計相同:區(qū)間估計與假設(shè)檢驗的統(tǒng)計處理時相通的,實際上假設(shè)檢驗的接受域也正是區(qū)間估計的置信區(qū)間8、相關(guān)關(guān)系的特點:現(xiàn)象之間確實存在著數(shù)量上的依存關(guān)系。就是說,一個現(xiàn)象發(fā)生數(shù)量上的變化,另一個現(xiàn)象也會相應(yīng)地發(fā)生數(shù)量上的變化?,F(xiàn)象間的數(shù)量依存關(guān)系值是不確定的。就是說,一個現(xiàn)象發(fā)生數(shù)量上的變化,另一個現(xiàn)象會有幾個可能值與之對應(yīng),而不是唯一確定的值。9、相關(guān)系數(shù):指線性相關(guān)系數(shù),對兩個變量之間線性相關(guān)程度的度量。相關(guān)程度有強弱之分,一般是在-1到1之間,相關(guān)系數(shù)越趨于0,關(guān)系越弱,相關(guān)系數(shù)與趨于絕對值1時,關(guān)系越強。10、參數(shù)估計:即根據(jù)抽樣結(jié)果合理地、科學(xué)地猜測總體參數(shù)的具體值或其范圍。參數(shù)估計包括參數(shù)的點估計和區(qū)間估計兩種11、統(tǒng)計值:關(guān)于調(diào)查樣本中某一變量的綜合描述,是樣本特征值,如樣本均值,成數(shù)及方差12、置信水平:指總體位置參數(shù)落在置信區(qū)間內(nèi)的概率。用(1-a)表示,常用的置信水平有:99%,95%,90% 13、變量分為哪幾個層次?定類變量與定序變量之間的相關(guān)系數(shù)是什么?變量分為四個層次,即定類變量、定序變量、定距變量和定比變量。相關(guān)系數(shù)是eat2 14、我們通常根據(jù)哪些原則確定原假設(shè)與備擇假設(shè)? 原假設(shè)是關(guān)于總體間參數(shù)值相等或總體分布符合某種分布的假設(shè),是待否定的假定,與之相對立,備擇假設(shè)是指總體間參數(shù)值不相等或總體分布不符合某種分布的假設(shè),是待選擇的假設(shè) 原則二:原假設(shè)往往是研究者不愿接受而期待拒絕的假設(shè),備擇假設(shè)往往是研究者希望證實并且期待接受的假設(shè),研究中的假設(shè)一般是備擇假設(shè),通常先設(shè)立備擇假設(shè),再對立的設(shè)定原假設(shè) 原則三:如果研究的目的只在于分析事物間是否有差異,不強調(diào)哪個比哪個好,這種情況下的假設(shè)比較容易,可以根據(jù)原則去理解和假設(shè),這時進行的是雙側(cè)檢驗的情形,原假設(shè)設(shè)定為H0:U=U0等,備擇假設(shè)隨即設(shè)定為其對立面 原則四:如果研究的目的在于分析事物哪個比哪個好,這時可以根據(jù)原則二去理解和假設(shè)如題目中問“是否更長,大”,即進行右側(cè)檢驗,原假設(shè)設(shè)定為:H0:UU0等,反之,則進行左側(cè)檢驗,原假設(shè)為H0:UU0等。15、何為列聯(lián)表?制作列聯(lián)表的原則有哪些? 1)列聯(lián)表:又稱交互列表,是一種專門用來測量兩個變量關(guān)系的方法,將研究所得的數(shù)據(jù)按兩個變量進行交叉分類的頻次分配表。2)制作原則:第一行是自變量的取值,第二行是因變量的取值16、接受域:接受H0的區(qū)間,抽樣所獲數(shù)據(jù)計算的統(tǒng)計量值小于臨界值,則接受H0。17、臨界值:把拒絕原假設(shè)的小概率事件定在分布的右尾,則右尾面積總和所代表的概率即為顯著水平,(Z)=1-,Z稱作臨界值。(詳見教材p232)18、推斷統(tǒng)計:主要用于抽樣調(diào)查,以抽樣調(diào)查獲得的信息材料通過推斷統(tǒng)計進行簡化處理,以便從樣本的統(tǒng)計值推斷總體的參數(shù)值。19、抽樣分布:指統(tǒng)計量的分布。抽樣分布是在同一總體反復(fù)不斷抽取不同樣本時,各個樣本可能出現(xiàn)的樣本統(tǒng)計值的分布情況20、假設(shè)檢驗中選擇統(tǒng)計量的一般原則是什么?假設(shè)檢驗是通過樣本計算某個統(tǒng)計量進行的,選擇統(tǒng)計量的一般原則首先是確定是大樣本還是小樣本,然后根據(jù)總體方差是一直還是未知選擇統(tǒng)計量21、試比較相關(guān)系數(shù)與回歸系數(shù)的關(guān)系相關(guān)系數(shù)r表示的是兩變量之間的疏密程度,回歸系數(shù)b是回歸直線的斜率,說明回歸直線的陡度。相關(guān)關(guān)系r表現(xiàn)了真實數(shù)據(jù)與回歸直線靠攏的程度22、總體均值檢驗時,哪些情況下可以使用Z檢驗答:總體均值檢驗使用Z檢驗時的假定條件如下: 1連個樣本都是獨立的隨機樣本2兩個總體都服從正態(tài)分布3如總體不服從正態(tài)分布,可以用正態(tài)分布來近似23、小概率原則:它是假設(shè)檢驗的基本思想,包括兩個部分,一是指概率很小的隨機事件在一次觀察中不可能出現(xiàn);二是如果小概率事件在一次觀察中出現(xiàn)了,那么假設(shè)就是錯誤的。(小概率原理:在日常生活中,人們習(xí)慣于把概率很小的事件,當(dāng)做在一次觀察中不可能出現(xiàn)的事件。)24、散點圖:散點圖是相關(guān)關(guān)系的圖形表示,數(shù)據(jù)點在直角坐系平面上的分布圖。散點圖表示因變量隨自變量而變化的大致趨勢,據(jù)此可以選擇合適的回歸方程對數(shù)據(jù)點進行擬合。25、回歸方程:是研究自變量x不同取值時,因變量y平均值的變化。當(dāng)因變量y的平均值與自變量x呈線性規(guī)律時,稱做線性回歸方程。26、拒絕域:是在顯著性水平a下,小概率事件發(fā)生后,拒絕原假設(shè)H0的區(qū)間。27、簡述點估計與區(qū)間估計的含義。他們之間的區(qū)別與聯(lián)系有哪些1)點估計:指用樣本計算出來的一個數(shù)來估計未知參數(shù),由于它只是一個點值所以稱為參數(shù)的點估計。2)區(qū)間估計:是通過樣本計算出一個范圍來對位置參數(shù)進行估計3)區(qū)別4)聯(lián)系28、簡述置信度和置信區(qū)間的含義,并說明他們之間的關(guān)系是什么1)含義:用Q(X1,X2,X3.Xn)作為未知參數(shù)Q的估計值,那么包含未知參數(shù)估計值的區(qū)間就為置信區(qū)間;用置信度1-a來測量置信區(qū)間 估計的可靠性2)關(guān)系:在樣本容量一定的情況下,置信區(qū)間和置信度是相互制約的,置信度越大,即估計的可靠性愈大,則相應(yīng)的置信區(qū)間也愈寬,估計的愈不精確,例如,某班的考試成績,如果估計區(qū)間為0-100分,顯然這樣的估計永遠可靠,因為任何考試的結(jié)果,平均成績都不會超出估計的范圍總之,置信度與置信區(qū)間的關(guān)系表達式:相互制約,置信度越大,置信區(qū)間越寬。29、中心極限定理對社會調(diào)查的意義有哪些?中心極限定理在社會調(diào)查中有著重要的意義。因為在抽樣調(diào)查中被研究對象的總體分布往往是未知的。在這種情況下,中心極限定理告訴我們,只要樣本容量足夠大,樣本均值的分布都是已知的,且都接近正態(tài)分布。這樣就給未知分布總體的研究奠定了理論基礎(chǔ),對社會調(diào)查有著很實用的理論意義。30、PRE:指消減誤差比例,就是表示用一個現(xiàn)象來解釋另一個現(xiàn)象時,能夠減除百分之幾的錯誤。在測量變量的相關(guān)程度時,假定現(xiàn)象x與現(xiàn)象y有關(guān),用x去測量y的誤差的相對差值與不知y與x有關(guān)時預(yù)測y的全部誤差之比:即PRE=(E1-E2)/E131、獨立樣本:從兩個總體中分別獨立的隨機抽取一個樣本進行比較研究32、相關(guān)樣本:又稱配對樣本。它只有一個樣本,但樣本中每個個體要先后測量兩次,這樣所有個體先觀測的值看做是來自第一個總體的樣本值,所有個體先后觀測的值看作是來自另一個總體的樣本值,以此來比較研究 連個總體之間的不同。33、非對稱關(guān)系:數(shù)學(xué)中,若R為集合A到B上的關(guān)系,對集合中任意元素a與b(aA,bB),下述語句保持有效,則A到B上的二元關(guān)系R是非對稱的:若aRb,且bRa,那么,a=b。其數(shù)學(xué)表述為:任取aA,bB,aRb且bRaa=b。34、為什么要進行假設(shè)檢驗,簡述假設(shè)檢驗的步驟。1)原因:1社會現(xiàn)象具有隨機性或非確定性,同時也有規(guī)律性2一切具有隨機性質(zhì)的社會現(xiàn)象進行局部推論總體時難免有誤會3當(dāng)總體很大時,一般都采用抽樣調(diào)查來檢驗命題假設(shè)4假設(shè)檢驗實際上就是人們來意常識性地進行盤頓和決策的小概率原理2)步驟:根據(jù)實際問題作出假設(shè),假設(shè)包括原假設(shè)H0和備擇假設(shè)H1兩部分,原假設(shè)必須寫出,備擇假設(shè)在雙邊檢驗的情況下可不寫根據(jù)樣本確定合適的檢驗統(tǒng)計量根據(jù)問題的需要給出顯著性水平的大小搜集數(shù)據(jù),計算檢驗統(tǒng)計量的值作出統(tǒng)計決策,若樣本統(tǒng)計量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論