大學統(tǒng)計學 3 課件_第1頁
大學統(tǒng)計學 3 課件_第2頁
大學統(tǒng)計學 3 課件_第3頁
大學統(tǒng)計學 3 課件_第4頁
大學統(tǒng)計學 3 課件_第5頁
已閱讀5頁,還剩18頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、簡化兩個變量之分布第一節(jié) 統(tǒng)計相關(guān)的性質(zhì)第二節(jié) 交互分類與百分表第三節(jié) 簡化相關(guān)與消減誤差 一項研究表明一個國家的人民,喝牛奶和死于癌癥的比例都很高。 一項研究表明在某個城市心力衰竭而死亡的人數(shù)和啤酒的消耗量都急劇升高。 兩種情況的增加是人口迅速增加的結(jié)果。若按同樣的理由,心臟病發(fā)作還可見歸咎于上百個其他因素,如咖啡消耗量增加,嚼口香糖的人增多,玩橋牌更加盛行,更多的人看電視,等等。 統(tǒng)計資料表明大多數(shù)汽車事故出在中等速度的行駛中,極少的事故是出在大于150公里/小時的行駛速度上的。 由于多數(shù)人是以中等速度開車,所以多數(shù)事故是出在中等速度的行駛中。 統(tǒng)計關(guān)系往往不能表明因果關(guān)系。簡化兩個變量之

2、分布一、相關(guān)分析的內(nèi)容: 相關(guān)程度強弱 相關(guān)方向 對稱與不對稱的關(guān)系二、相關(guān)測量的種類1、從變量或現(xiàn)象的多少分:單相關(guān)與復相關(guān)2、從變量變化的形式看:直線相關(guān)與曲線相關(guān)3、從測量層次看簡化兩個變量之分布第二節(jié) 交互分類與百分表列聯(lián)表的構(gòu)造6列聯(lián)表(概念要點)由兩個以上的變量進行交叉分類的頻數(shù)分布表行變量的類別用 r 表示, ri 表示第 i 個類別列變量的類別用 c 表示, cj 表示第 j 個類別每種組合的觀察頻數(shù)用 fij 表示表中列出了行變量和列變量的所有可能的組合,所以稱為列聯(lián)表一個 r 行 c 列的列聯(lián)表稱為 r c 列聯(lián)表簡化兩個變量之分布列聯(lián)表的結(jié)構(gòu)(2 列聯(lián)表)列(cj)行 (

3、ri)一個2 列聯(lián)表列聯(lián)表的結(jié)構(gòu)(r c 列聯(lián)表的一般表示)列(cj)行(ri)r 行 c 列的列聯(lián)表fij 表示第 i 行第 j 列的觀察頻數(shù)列聯(lián)表(一個實際例子)【例】一個集團公司在四個不同的地區(qū)設(shè)有分公司,現(xiàn)該集團公司欲進行一項改革,此項改革可能涉及到各分公司的利益,故采用抽樣調(diào)查方式,從四個分公司共抽取420個樣本單位(人),了解職工對此項改革的看法,調(diào)查結(jié)果如下表列聯(lián)表的分布11觀察值的分布(概念要點)邊緣分布行邊緣分布行觀察值的合計數(shù)的分布例如,贊成改革方案的共有279人,反對改革方案的141人列邊緣分布列觀察值的合計數(shù)的分布例如,四個分公司接受調(diào)查的人數(shù)分別為100人,120人,

4、90人,110人條件分布與條件頻數(shù)變量 X 條件下變量 Y 的分布,或在變量 Y 條件下變量 X 的分布每個具體的觀察值稱為條件頻數(shù)觀察值的分布(圖示)行邊緣分布列邊緣分布條件頻數(shù)百分比分布(概念要點)條件頻數(shù)反映了數(shù)據(jù)的分布,但不適合進行對比為在相同的基數(shù)上進行比較,可以計算相應(yīng)的百分比,稱為百分比分布行百分比:行的每一個觀察頻數(shù)除以相應(yīng)的行合計數(shù)(fij / ri)列百分比:列的每一個觀察頻數(shù)除以相應(yīng)的列合計數(shù)( fij / cj )總百分比:每一個觀察值除以觀察值的總個數(shù)( fij / n )百分比分布(圖示)總百分比列百分比行百分比列聯(lián)分析中應(yīng)注意的問題 :條件百分表的方向一般說來,列

5、聯(lián)表中變量的位置是任意的。變量X既可以放在列的位置,也可以放在行的位置。如果變量X與Y存在因果關(guān)系,令X為自變量(原因),Y為因變量(結(jié)果),一般把自變量X放在列的位置,條件百分表也多按自變量的方向計算,因為這樣便于更好地表現(xiàn)原因?qū)Y(jié)果的影響。 表31 職業(yè)背景與工作價值觀取向數(shù)據(jù)表明,與制造業(yè)相比,服務(wù)業(yè)就業(yè)人員更注重人情關(guān)系。人們的職業(yè)背景不同,工作的價值觀有可能不同。 簡化兩個變量之分布如果因變量在樣本內(nèi)的分布不能代表其在總體內(nèi)的分布,例如為了滿足分析的需要,抽樣時擴大了因變量某項內(nèi)容的樣本總量,這時仍以自變量的方向計算百分表就會歪曲實際情況。 例如,社會學家欲研究家庭狀況(自變量)對青

6、少年犯罪(因變量)的影響。 該地區(qū)有未犯罪記錄的青少年10 000名,有犯罪記錄的青少年150名。如果從未犯罪青少年中抽取1,即100名進行研究,則用相同比例從犯罪青少年中抽取的樣本量僅為1.5人。顯然,這樣少的數(shù)量無法滿足對比研究的需要。因此,對犯罪青少年的抽樣比要擴大,譬如擴大到二分之一,即抽取75人。假定從兩個樣本調(diào)查所獲得的數(shù)據(jù)如下表所示。 表32 家庭狀況與青少年犯罪 單位人 表33 家庭狀況與青少年犯罪 把計算百分表的方向變換一下,改為按因變量方向計算,則得到表34。 表34 家庭狀況與青少年犯罪百分表 在完整家庭中,未犯罪青少年的比例占到92,而在離異家庭中,這個比例僅為8。完整家庭的青少年未犯罪率遠遠高于離異家庭的這個比例,家庭狀況對青少年行為的影響得到了比較真實的反映。 第三節(jié) 簡化相關(guān)與消減誤差比例簡化相關(guān) 相關(guān)測量法:用一個統(tǒng)計值來表示變量與變量之間的關(guān)系,這個統(tǒng)計值就是相關(guān)系數(shù)2、選擇相關(guān)測量法應(yīng)注意:測量層次; 具有消減誤差比例意義; 變量關(guān)系的對稱與否第三節(jié) 簡化相關(guān)與消減誤差比例消減誤差比例(PRE):用一種現(xiàn)象x來解釋另一種現(xiàn)象y,能減少多少誤差。E1:不知道X的情況下預測Y所產(chǎn)生的全部誤差E2:知道X的情況下,根據(jù)X各值預測Y所產(chǎn)生的全部誤差第三節(jié) 簡化相關(guān)與消減誤差比例PRE的取值范圍:當兩變量無關(guān)時,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論