統(tǒng)計(jì)學(xué)考點(diǎn)梳理(適用于文科專業(yè))_第1頁
統(tǒng)計(jì)學(xué)考點(diǎn)梳理(適用于文科專業(yè))_第2頁
統(tǒng)計(jì)學(xué)考點(diǎn)梳理(適用于文科專業(yè))_第3頁
統(tǒng)計(jì)學(xué)考點(diǎn)梳理(適用于文科專業(yè))_第4頁
統(tǒng)計(jì)學(xué)考點(diǎn)梳理(適用于文科專業(yè))_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、抽樣分布1 ;統(tǒng)計(jì)規(guī)律性1 ;顯著性水平3 ;單邊檢驗(yàn)1-2 ; PRE ;虛無假設(shè);研究假設(shè)概率分布3-4 ;置信度3;配對(duì)樣本4;集中趨勢(shì)測(cè)量、離散趨勢(shì)測(cè)量4;眾數(shù)4 ;中位值4 ;平均數(shù)5 ;異眾比率5 ;方差6 ;大樣本單總體均值的區(qū)間估計(jì)6;大樣本單總體均值的假設(shè)檢驗(yàn)8;大樣本兩總體均值的假設(shè)檢驗(yàn)9 ;入系數(shù)10; Gamma 系數(shù)11 ;回歸直線方程 12;積矩相關(guān)系數(shù) 13;決定系數(shù)13 ;兩個(gè)定類變量相關(guān)性的卡方檢驗(yàn)13 ;兩個(gè)定距變量相關(guān)性的F檢與盤14;.抽樣分布p117嚴(yán)格地說,抽樣分布就是根據(jù)概率的原則二成立的理論分布,它顯示由同一總體中反復(fù)抽取不同樣本時(shí),各個(gè)可能出現(xiàn)

2、的樣本統(tǒng)計(jì)值的分布情況。統(tǒng)計(jì)規(guī)律性在相同條件下,進(jìn)行大量重復(fù)試驗(yàn)或觀察時(shí),隨機(jī)事件出現(xiàn)可能的大小是穩(wěn)定的?!狙a(bǔ)充】隨機(jī)現(xiàn)象(變量)是概率論的研究對(duì)象,概率論是統(tǒng)計(jì)推論的理論(數(shù)學(xué))基礎(chǔ),概率是統(tǒng)計(jì)推論的依據(jù)。統(tǒng)計(jì)推論的所有數(shù)學(xué)表都是以概率為基礎(chǔ)的。隨機(jī)現(xiàn)象具有雙重性:偶然性:在一次試驗(yàn)或觀察中事件出現(xiàn)的可能具有偶然性;統(tǒng)計(jì)規(guī)律性:在相同條件下,進(jìn)行大量重復(fù)試驗(yàn)或觀察時(shí),隨機(jī)事件出現(xiàn)可能的大小是穩(wěn)定的。概率論研究的正是隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律性。單獨(dú)的現(xiàn)象具有偶然性,但對(duì)于大量的現(xiàn)象,具有規(guī)律性。偶然事件(隨機(jī)事件)的概率就是隨機(jī)事件隱蔽著的規(guī)律。隨機(jī)事件的定義:對(duì)隨機(jī)現(xiàn)象進(jìn)行的觀察或試驗(yàn)稱為隨機(jī)試驗(yàn)

3、。單邊檢驗(yàn)p151單邊本金驗(yàn)(one-sided test)亦稱單尾檢驗(yàn),又稱單側(cè)檢驗(yàn),在假設(shè)檢驗(yàn)中,用檢驗(yàn)統(tǒng)計(jì)量 的密度曲線和二軸所圍成面積中的單側(cè)尾部面積來構(gòu)造臨界區(qū)域進(jìn)行檢驗(yàn)的方法稱 為單邊 檢驗(yàn).若將采用的顯著性水平a概率所確定的摒棄區(qū)域置于密度曲線的右邊,則稱為右單邊檢驗(yàn)(或稱右單尾檢驗(yàn),右單側(cè)檢驗(yàn) 等).若置于密度曲 線的左邊,則稱為左單邊檢驗(yàn)(或稱左 單尾檢驗(yàn),左單側(cè)檢驗(yàn)等).拒絕域分布在統(tǒng)計(jì)量分布的一端,稱為一端檢驗(yàn)根據(jù)拒絕域選擇在左側(cè)還是右側(cè),一端檢驗(yàn)可以分為左端檢驗(yàn)和右端檢驗(yàn)左端檢驗(yàn)的三種寫法:(一)(二)(三)Ho: m = 國H 0: m> 卬Ho: m>

4、卬H i: m國H i: m <卬【左端檢驗(yàn)(例1 )】:該批產(chǎn)品的平均使用壽命超過1000小時(shí)(屬于檢驗(yàn)聲明的有效性,先提出虛無假設(shè))提出虛無假設(shè):H 0: m 1000選擇研究假設(shè):H 1: m < 1000【左端檢驗(yàn)(例 2)】:學(xué)生中經(jīng)常上網(wǎng)的人數(shù)超過25%嗎?(屬于研究中的假設(shè),先提出研究假設(shè))虛無假設(shè):H 0:P 25%研究假設(shè):H 1: P > 25%右端檢驗(yàn)的三種寫法:(二)H0: m <也(一)H 0: m (Ho: m = (joH i: m >卬H i: m > 卬(三)【右端檢驗(yàn)(例子 1 )1學(xué)生中經(jīng)常上網(wǎng)的人數(shù)超過25%嗎?(屬于

5、研究中的假設(shè),先提出研究假設(shè))虛無假設(shè):Ho:P 25%研究假設(shè):H 1: P > 25%如何區(qū)分一端檢驗(yàn)還是兩端檢驗(yàn)?一般來講,它取決于是否可以確定研究假設(shè)的方向。如果根據(jù)經(jīng)驗(yàn)或理論,在成立研究假設(shè)時(shí)可以確定方向,則選擇一端檢驗(yàn)。而有的研究假設(shè)難以確定方向,只能驗(yàn)證是否有差異,這時(shí)選擇兩端檢驗(yàn)。置信度p125置信區(qū)間(confidence interval總體參數(shù)的估計(jì)范圍;置信度(confidence coefficient置信區(qū)間估計(jì)的可靠性;用1 a來表示。顯著性水平(significance level置信區(qū)間估計(jì)的不可靠的概率,用a來表示。置信度和置信區(qū)間的關(guān)系:1、在樣本容

6、量的一定的情況下,置信區(qū)間和置信度是互相制約的,表現(xiàn)為:置信度越高,置信區(qū)間越寬,估計(jì)精度越低;置信度越低,置信區(qū)間越窄,估計(jì)精度越高。2、參數(shù)區(qū)間估計(jì)時(shí),置信區(qū)間和置信度缺一不可,必須同時(shí)給出置信區(qū)間和置信度。置信度(1 a )與顯著性水平 a的關(guān)系:1、對(duì)立統(tǒng)一的兩個(gè)概念。置信度是估計(jì)可靠的概率,而顯著性水平是不可靠的概率。2、置信度+顯著性水平= 1;如果提出置信度要求為0.95 ,那么意味著顯著性水平為0.05;3、置信度往往用在參數(shù)估計(jì)中,顯著性水平一般用于假設(shè)檢驗(yàn)中;顯著性水平p150定義:簡(jiǎn)單的說,在假設(shè)檢驗(yàn)研究中,存在著一些不能控制的因素,如隨機(jī)抽樣導(dǎo)致的偶然性誤差,不能100

7、%保證得到的結(jié)果完全是有要檢驗(yàn)的因素(關(guān)于總體參數(shù)的假定)引起的,必須給沒有控制的活著潛在的其他因素分出一部分概率來,這就是顯著性水平。當(dāng)顯著性水平位0.05時(shí),意味著每進(jìn)行 100次觀測(cè)或?qū)嶒?yàn),有 5次得到的結(jié)果不是由要檢驗(yàn)的因素(總體的結(jié)構(gòu)性特征)引起的,即發(fā)生了 5次小概率事件,這樣也就確定了研究者愿意承擔(dān)的風(fēng)險(xiǎn)水平。簡(jiǎn)而言之,顯著性水平就是虛無假設(shè)實(shí)際上正確卻被否定的概率。1 .是一個(gè)概率值,和置信度相對(duì)應(yīng);2 .在原假設(shè)成立條件下,假設(shè)檢驗(yàn)中所規(guī)定的小概率的標(biāo)準(zhǔn),即小概率的數(shù)量界限;3 .顯著性水平和拒絕域相聯(lián)系,顯著性水平表示樣本的統(tǒng)計(jì)值落在拒絕域內(nèi)的概率;4 .表示 a (alp

8、ha)常用的 a 值有 0.01,0.05,0.10。5 .由研究者事先確定的。概率分布p27隨機(jī)變量的取值帶有不確定性,要想完整地描述隨機(jī)變量的特征,需要把它與概率的討論聯(lián)系起來。換言之,對(duì)個(gè)隨機(jī)變量進(jìn)行研究,主要是弄清它的取值范圍,可能取哪些值,以及能以怎樣的概率取這些數(shù)值。隨機(jī)變量的概率分布描述了隨機(jī)變量所有可能的取值及其所對(duì)應(yīng)的概率分布情況,利用它可以更加全面考察觀測(cè)或試驗(yàn)的結(jié)果.并揭示客觀事物內(nèi)在的統(tǒng)計(jì)規(guī)律性。由變量值及其發(fā)生的概率所組成的統(tǒng)計(jì)數(shù)列,就稱為概率分布(probability distribution)。在社會(huì)研究中,最常用的概率分布有二項(xiàng)分布、正態(tài)分布、t分布、XA2分

9、布、F分布等(p109)。1 .離散型隨機(jī)變量的概率分布;2 .連續(xù)型隨機(jī)變量的概率分布3 .隨機(jī)變量的數(shù)學(xué)期望與方差配對(duì)樣本p167定義:相關(guān)樣本(配對(duì)樣本)是指兩個(gè)樣本存在某種關(guān)系,并不是相互獨(dú)立的,如對(duì)同一樣本在不同時(shí)期的調(diào)查結(jié)果進(jìn)行比較或兩個(gè)樣本之間存在一對(duì)一的匹配關(guān)系等?!纠印繉?duì)模版堆積抽取了10名學(xué)生,調(diào)查它們?cè)谛陆虒W(xué)法實(shí)施前后成績的變化。對(duì)比“獨(dú)立樣本”:兩個(gè)樣本獨(dú)立抽取,互不關(guān)聯(lián)。(實(shí)驗(yàn)組和對(duì)照組)配對(duì)樣本一般可分為兩種情況:1 .嚴(yán)格配對(duì)例如:對(duì)同一農(nóng)村居民或城市居民改革開放前后的生活水平的變化;2 .模擬配對(duì)例如:選擇兩組智商、年齡、閱讀能力、家庭條件等因素相同或接近的兩

10、組兒童進(jìn)行教學(xué)方法的比較。配對(duì)的目的:使研究者除了研究的因素外,做到其它條件大體一致。相當(dāng)于對(duì)影響現(xiàn)象的其它因素進(jìn)行了有效控制。集中趨勢(shì)測(cè)量;離散趨勢(shì)測(cè)量 p81集中趨勢(shì)測(cè)量就是用一個(gè)典型值或代表值來反映一組數(shù)據(jù)的一般水平。最常見的有:眾數(shù)、中位數(shù)、均值;在統(tǒng)計(jì)學(xué)中,集中趨勢(shì)(central tendency )或中央趨勢(shì),在口語上也經(jīng)常被稱為平均,表 示一個(gè)機(jī)率分布的中 間值。最常見的幾種集中 趨勢(shì)包括算數(shù)平均數(shù)、 中位數(shù)及眾數(shù)。集中 趨勢(shì)可以由有限的數(shù)組(如一群樣本)中或理論上的機(jī)率分配(如 正態(tài)分布)中求得。有 些人使用集中 趨勢(shì)(或集中性)這個(gè)詞匯以表示 數(shù)量化的資料之中央值的趨勢(shì)”。

11、離散程度測(cè)量是指用一個(gè)數(shù)值來反映一組數(shù)據(jù)之間的離散或差異程度。最常見的有:異眾比率、 四分位差、方差、標(biāo)準(zhǔn)差是指通過隨機(jī)地觀測(cè)變量各個(gè)取 值之間的差異程度,用來衡量 風(fēng)險(xiǎn)大小的指標(biāo)。眾數(shù)p81 (定類變量)集中趨勢(shì) 是一組數(shù)據(jù)中出現(xiàn)頻次最多(次數(shù)最多)的變量值,一般用 Mo表示;注意:最大的頻數(shù)不是眾數(shù),最大頻數(shù)對(duì)應(yīng)的變量取值才是眾數(shù)。中位值p81集中趨勢(shì)眾值(Mode) 定類層次中位值(Median -定序?qū)哟尉担∕ean )定距層次中位數(shù)【例1】:甲地的5戶人家的人數(shù)為:2, 4, 3, 6, 8,求中位值?!纠?】:乙地的6戶人家的人數(shù)為:2, 4 , 3 , 6, 8, 5求中位值。

12、對(duì)于分組數(shù)據(jù),需要借助中位值公式。1、先找出中位值位置;2、再利用公式計(jì)算中位值:L:中位值所在組的真實(shí)下限值;N:調(diào)查總數(shù);U :中位值所在組的真實(shí)上限值;n:中位值組的頻次;cf :低于中位值所在組的累積頻次;平均數(shù)p851、均值的定義:總體各單位取值之和除以總體單位數(shù)目2、3、僅適用于定距變量,不適用于定類和定序;【未分組數(shù)據(jù)】某班10 名學(xué)生年齡分別為20、21、19、19、20、20、21、22、18、20 歲,求他們的平均年齡【分組數(shù)據(jù)】對(duì)于分組數(shù)據(jù),可用組中值來代替變量值,計(jì)算方法同未分組數(shù)據(jù)。P86-87離散趨勢(shì)測(cè)量異眾比率(定類層次)p881、異眾比率(簡(jiǎn)寫Vr)為指非眾值在

13、總數(shù)中所占的比率。N-fMo2、計(jì)算公式:f(Mo:眾值的頻次)【補(bǔ)充】異眾比率是眾值的補(bǔ)充。取值范圍是(0,1)當(dāng)Vr =0,說明變量只有一個(gè)值,那就是眾值;當(dāng)Vr接近于0,說明資料比較集中,眾值的代表性比較高;當(dāng)Vr接近于1 ,說明資料比較分散,眾值的代表性低。方差p91所謂方差(Variance ),觀察值與其均值之差的平方和除以全部觀察總數(shù)Nn2? (Xi - X)n- 1S2 =目【例題】求標(biāo)準(zhǔn)差,并進(jìn)行簡(jiǎn)單比較。中文東:78 , 79 , 80 , 81 , 82(80 )解:根據(jù)公式(T (中文東)=1.414分?jǐn)?shù)學(xué)系:65 , 72 , 80 , 88 , 95(80 )b (

14、數(shù)學(xué)系)=10.8分英語系:35 , 78 , 89 , 98 , 100(80 )b (英語系)=23.8分結(jié)論:中文系差別最小,英語系差別最大。大樣本單總體均值的區(qū)間估計(jì)p124 S SP = X=Za X< W<X+Za 7=1-a 2 n2 n或者置信度為1-“的區(qū)間估計(jì)為:jX= Za 區(qū)M+Za ?2 n 2【理解一】1、大樣本(通常指n> 50 ,當(dāng)然越大越好,均值抽樣分布服從正態(tài)分布;2、均值抽樣分布之均值就是總體均值心;3、均值抽樣分布的標(biāo)準(zhǔn)差,稱為標(biāo)準(zhǔn)誤差( standard error),計(jì)算公式為4、如果將均值標(biāo)準(zhǔn)化,就可得到標(biāo)準(zhǔn)正態(tài)分布:X= 1S、

15、n n(0,1) 5、通過標(biāo)準(zhǔn)化轉(zhuǎn)化,均值抽樣分布中任意兩值之間的樣本均值次數(shù)所占的比例是可以知道的 通過查標(biāo)準(zhǔn)正態(tài)分布表,社會(huì)學(xué)常用的有:90 %的面積在 a±1.65(SE);95 %的面積在 a±1.96(SE);99 %的面積在a±2.58(SE);總體均值區(qū)間估計(jì)的常用公式女=1.65皂M +1.65-L 立置信度為90%: ?,n、n?e-S S u1 = 1.96一曉 +1.96 -置信度為95 % :?弋 n,n ?置信度為99 % :/二 258/F?【例題1】某網(wǎng)絡(luò)第戲公司,為了測(cè)算游戲玩家某周至該公司游戲網(wǎng)站上雙皆的阿,就隨機(jī)抽取了 20。個(gè)

16、游戲玩家,測(cè)得其平均時(shí)間為2, 32個(gè)小時(shí),已知玩說戲的時(shí)間工 服從均值為,方差為,的正態(tài)分布,且#=2. 259求該網(wǎng)站游戲玩家此間在該網(wǎng)站卜逗留 的平均時(shí)間,應(yīng)于置信度0.95的置蔽嬴 心彳技,萬邦一解已知耳= 12.32,由于置信度為0. 95,可知顯著性水平為Q.Q5,查附錄B可得,Z"工=24.=1.96.由于總體均值就在95%的置信度下的置信區(qū)間=X±1. 964可得,12. 32 L 96*<京<12. 32+L96X= J2、戶一 J7200y200即 12,01 <£(<12. S3.【理解二】SP=X= Za2 n<

17、; S . .X+Za2 n) = 1-ax 為總體均值 11的點(diǎn)估計(jì)值,即樣本均值;1a 為置信度;7 n為標(biāo)準(zhǔn)誤差(SE ),其中b為總體標(biāo)準(zhǔn)差;當(dāng)0未知時(shí),用樣本標(biāo)準(zhǔn)差S代替;n為樣本量,一般 n> 30 ;大樣本單總體均值的假設(shè)檢驗(yàn)p154大樣本總體均值檢驗(yàn)(兩端)1 .假定條件總體服從正態(tài)分布樣本是隨機(jī)抽樣的樣本檢驗(yàn)的變量是定距及以上測(cè)量層次的變量2 .虛無假設(shè)為:Ho: m=m 0;研究假設(shè)為:H1:m m o3 .使用z統(tǒng)計(jì)量X - H0z=N(0,1)s . n【例1】某機(jī)床廠加工一種零件,根據(jù)經(jīng)驗(yàn)知道,該廠加工零件的橢圓度近似服從正態(tài)分布,其今換一種新機(jī)床進(jìn)行加工,抽取

18、n=200總體均值為0=0.081mm,總體標(biāo)準(zhǔn)差為 s= 0.025個(gè)零件進(jìn)行檢驗(yàn),得到的橢圓度均值為0.076mm 。試問新機(jī)床加工零件的橢圓度的均值與以前有無顯著差異? (=0.05 )軍;'l u = a.ofliH- * Q.oai0.05=2tX)廟;=1.90工-為 0.076-0.0K) pgA胃工cr 0.025、200決,因?yàn)閆=-243.小F睢界假一1.鷗.位于內(nèi)定域.所 以拒絕接也電結(jié)論:大樣本總體均值的假設(shè)檢驗(yàn)(一端)有證據(jù)表明新機(jī)麻加1:的零件 的橢圓度與以蛇省顯著差異【例2】某批發(fā)商欲從生產(chǎn)廠家購進(jìn)一批燈泡,根據(jù)合同規(guī)定,燈泡的使用壽命平均不能低于1000

19、小時(shí)。已知燈泡使用壽命服從正態(tài)分布,標(biāo)準(zhǔn)差為20小時(shí)。在總體中隨機(jī)抽取 100只燈泡,測(cè)得樣本均值為960小時(shí)。批發(fā)商是否應(yīng)該購買這批燈泡?( = 0.05)2 1000 I ¥ 1000 -0-M100檢裝統(tǒng)計(jì)量:%0- L000 “Z = = T0 ”修 20 +1。0決策;在口。力5的水平上辦第Hg結(jié)地:目正據(jù)裹明這批燈泡的他用 辱甑幡.T 1DM小時(shí)p156 同樣的顯著性水平下,一端比兩端更容易否定H大樣本兩總體均值的假設(shè)檢驗(yàn)p164檢驗(yàn)步驟:1 .原假設(shè) H 0: m a= m b2 .研究假設(shè)雙邊 H1 m aWm b單邊 H 1 : m a> m b 或 H 1

20、m a< m b ;3 .統(tǒng)計(jì)量ZhXA- X B) - Do計(jì)算式替換書上的: 22s_2_S_2nAnB例8】分析兩個(gè)城市的居民P休閑箱疥是否有 艮的平均月糅閑潸費(fèi)為30。元,標(biāo)準(zhǔn)差為8。元 用酒費(fèi)為315元,標(biāo)準(zhǔn)差為70元斗尸0. OS)?鼻就露我就落出誓.機(jī)抽2”,屈 坪但斷定薪城市居民月休盛:遙M襄(Z)因植聆方向未聒定, CIW 界值 IZ.I-L96.研究假設(shè)虛無假設(shè) 1和??诠?所以采用朝修檢檢,又因?yàn)轱@著性水平。止05,充表(見附錄<3)根據(jù)調(diào)查結(jié)果,可知下列敦魅*«i 120,叫= 150Xj-300,兄= 315S|-80, &-7。代人Z檢

21、驗(yàn)公式,可斛 I3M-3H -但*3i fl7 V12D 150(4J因?yàn)镮© <|4|*所以不幗否定虛無假設(shè),即在。二6 05的顯著性水平下,兩個(gè)城市 居民的月休閑消費(fèi)沒有差異.";溫需落歌:3 gM*根據(jù)題意,可做以那礪.研究假設(shè)虛無假設(shè) 因研究偎設(shè)方向確定*聚用一僦檢豌,潮界值I%|L睛.孫W <蘆? H. *刈,四 又因?yàn)榘l(fā)署性水平寸.。.05.查衰£見附錄匚)(3J根據(jù)條件可得與例外同樣的靖果,z_ 5】g£4)因10<以對(duì),所以不趣杳定虛無限設(shè),也就聚說在電 “定甲城市居民的月休闈消箝低于乙城市居民的.0.3的顯著性水平下,

22、不招人系數(shù)p214 (兩個(gè)定類層次的變量)1、Lambda基本邏輯:用一個(gè)定類變量的值來預(yù)測(cè)另一個(gè)定類變量的值時(shí),如果以眾數(shù)作為測(cè)量的準(zhǔn)則,可以減少多少誤差。消減的誤差在全部誤差中所占的比例越大,就表示兩個(gè)變量的相關(guān)越強(qiáng)?m<+?D(Mx+My)2n-(Mx+My)My=Y變項(xiàng)的眾數(shù)次數(shù)Mx=X變項(xiàng)的眾數(shù)次數(shù)mx=Y變項(xiàng)的每個(gè)值(類別)之下X變項(xiàng)的眾數(shù)次數(shù)my=X變項(xiàng)的每個(gè)值(類別)之下丫變項(xiàng)的眾數(shù)次數(shù)n=全部個(gè)案數(shù)【例題1】對(duì)稱形式:不確定兩個(gè)變量的影響方向表2杳年的教育期望與父母的教育期望,父適的數(shù)育期望,音年教育盛里合計(jì)盧本札碩士尹蹲土.本科.40-碩士,*41小厚土,衣4 a狂如

23、合計(jì)F3*54。如1期l = ? m*+? m y - (M x + M y)2n - (M x + M y)_ (28 + 41 + 4) + (28 + 41 + 7) - (54 + 50) 2*100- (54 + 50)=0.47【例題2】不對(duì)稱形式lymyMyMy=Y變項(xiàng)的眾數(shù)次數(shù)my=X變項(xiàng)的每個(gè)值(類別)之下丫變項(xiàng)的眾數(shù)的次數(shù)n=全部個(gè)案數(shù)n-M y=不知道x值的情況下預(yù)測(cè) Y值產(chǎn)生的誤差分子 E1-E 2= (n-M y) - (n- E m y) = 12nly-My表1JOO名青年內(nèi)船捌與蝕性別另知快解庭m如40如1加斯見聞10.隼10-'削E嗎一% = 40 +

24、 30 50=0 40' n-Mv 100-50Gamma 系數(shù)p217 (兩個(gè)定序變量)系數(shù)值-1 , +1對(duì)稱關(guān)系系數(shù)值既表示相關(guān)的程度,也表示相關(guān)的方向,還具有消減誤差比例的意義基本邏輯:根據(jù)任何兩個(gè)個(gè)案在某變項(xiàng)上的等級(jí)來預(yù)測(cè)他們?cè)诹硪粋€(gè)變量上的等級(jí)時(shí),可以減少的誤差是多少同序?qū)?same-order pair 或concordant pair ),指的是某對(duì)個(gè)案在兩個(gè)變量上的相對(duì)等級(jí)是相同的,通常用 Ns表示。異序又t ( different-ordered pair 或discordant pair ),指的是某對(duì)個(gè)案在兩個(gè)變量上的相對(duì)等級(jí)是不相同的,通常用GGamma 的計(jì)

25、算公式:【例題】Nd表不'。Ns - NdNs + NdNs=12 (30+5+16+12) +10 (5+12 ) +8(16+12 ) +30*12=1510Nd=3 (30+8+16+4 ) +10 (8+4 ) +5 (4+16 )+30 X 4=514Ns - NdG =Ns + Nd1510-5141510+514= 0.492結(jié)論:工人的文化程度和收入水平成正相關(guān)關(guān)系相關(guān)程度是0.492用工人的文化程度來解釋工人的收入水平時(shí)可以減少49.2%的誤差回歸直線方程p223 (兩個(gè)定距變量)線性回歸分析法是用自變量的數(shù)值預(yù)測(cè)或估計(jì)因變量的數(shù)值;最小二乘法:u ? (X- X)(

26、Y-Y) b = >2? (X- X)2a=Y-?Y-b?XbX=:n如果知道b和a的數(shù)值,當(dāng)然就可以在坐標(biāo)圖上定出直線的位置。把這兩個(gè)數(shù)值代入直線回歸方程式,便可以用 X的值預(yù)測(cè)Y的值。(直線關(guān)系)積矩相關(guān)系數(shù)p227 (兩個(gè)定距變量,對(duì)稱性)? (X- X)(Y-Y) r =? (X- X)2、? (Y-Y)21、r2具有PRE意義,稱為決定系數(shù);2、取值范圍 -1 , +1 3、r=0,不存在線性相關(guān)決定系數(shù)p231r系數(shù)越大,表示線性回歸方程的預(yù)測(cè)能力越強(qiáng)。兩個(gè)定類變量相關(guān)性的卡方檢驗(yàn)p192 (獨(dú)立性檢驗(yàn),檢驗(yàn)變量之間是否相關(guān))2x檢驗(yàn)的基本假定和原假設(shè)基本假定分別是:(1)樣

27、本是用隨機(jī)方法取得的。(2)兩個(gè)變量都是定類變量(定序變量可以降低層次看作定類變量應(yīng)用)檢驗(yàn)假設(shè)分別是:研究假設(shè):X與Y相關(guān) (總體中) 虛無假設(shè):X與丫不相關(guān) (總體中)(fo- fe)2fe_9 (f-e)2 =? e自由度df = ( r 1) (c 1), r和c表示的是交互分類表的行數(shù)和列數(shù)。期望頻數(shù)(e):每一個(gè)f所在行的總數(shù)乘以所在列的總數(shù),再除以全部個(gè)案數(shù)。九某英語培訓(xùn)學(xué)校為了研究英語四畿考試試卷客觀選擇題正曲答案的設(shè)置是否在人出, C與口的某一個(gè)選項(xiàng)上有偏好,對(duì)錄近三年英語四級(jí)考試試卷做了分析,然8個(gè)單選題的正. 答案在A,B,C與口四個(gè)選項(xiàng)上的分配情況如下襲所示. 答案逸里

28、.敕 VBMC式b肥合g網(wǎng)(I)請(qǐng)陳述研究假設(shè)H1和虛無翻設(shè)Ho*(2) A,B,C與D四個(gè)選項(xiàng)上的期望假數(shù)是多少?(3>計(jì)算Z1值.<4)看顯著性水平為6。5.請(qǐng)判斷英語四皴考試試卷選擇題的正確答案在A、E、C與工 四個(gè)選項(xiàng)上的分配是否有顯著的修向性*兩個(gè)定距變量相關(guān)性的F檢與效p235氏.三、次電q:F”一痣理救,於 粗矩相關(guān)系數(shù)和面單線性回歸系數(shù)測(cè)盤的是兩個(gè)定距變量的關(guān)系,而樣本的杓一y 和回歸系敷能否反映總體中兩個(gè)變量的關(guān)系簫要用到正檢驗(yàn)法:F檢嬴前 關(guān)移和國史擁時(shí)要皂樣本是隨機(jī)推樣樣本遮金鼠是足距變量:各盛 是正態(tài)a布.由于在計(jì)算,的公式與計(jì)算占的公式中,分子都是爪

29、63;、¥)_£犬2; 因此,若r=o.則6=0,檢驗(yàn)也等于檢驗(yàn)了 3因此,在/和占的假設(shè)檢驗(yàn)中,可以做過 的假設(shè)樣研究假設(shè) 兄:,00,*0虛無假設(shè)風(fēng)尸。.6=0具有消減誤爰的意義門一,是剩余誤差,要估計(jì)總體的/和1-,,必須考出財(cái) 計(jì)算,的自由度為dh=l,計(jì)算1 一戶的自由度為d0 = R2,所以F檢驗(yàn)的公遺(嬰'4/玨 一 2)(Lh - -以表11-8為例說明F檢驗(yàn)的過程,工人的工齡和工資等級(jí)的關(guān)系在總體中是否也有 在"坪究假設(shè)和虛無假設(shè)分別是Hi :r#0H心;尸0研究假設(shè)虛無假設(shè) 糧據(jù)數(shù)據(jù)可知"二在87,力=9,則df =1dft

30、= ff2=7假設(shè)顯著性水平是lO,的皿=加=7時(shí),查表(見附錄G)得否定域F>5 59-H:79>5.的在否定域苞圈內(nèi),因此否定虛無假設(shè)n 一 1tlV;的工齡與工資箸級(jí)有范也就是說在。,。5的基署性水平“了 F檢臆外,也可用,檢騏法檢聆程矩相關(guān)系數(shù)和網(wǎng)歸系數(shù)公式是df=Ji-2以上述工人的工鵬和工資等級(jí)的關(guān)系為例,已知產(chǎn)*»0, &%小.91所以 扇。山73急T67df=7假設(shè)顯著性水平為口 = 0. 05 ,兩端檢驗(yàn).由附錄E中的r分布襄可得知否定域山 工薊5,統(tǒng)計(jì)值九67A2.365,統(tǒng)計(jì)值在否定域之內(nèi),因此否定虛無假設(shè),也就是說在口州 的顯著性水平下,工

31、人的工睹和工資等疑有美.這里所說的對(duì)和b的F檢我和t檢驗(yàn),都是假定x變和V變量是宜線關(guān)系,如果 在總體中"和Y的關(guān)系是非直線的.上述檢檢法就會(huì)出問期了,那么,如何檢驗(yàn)變*X和 支量¥是直螳關(guān)?。壳懊嬖谙嚓P(guān)測(cè)量法的分析中曾經(jīng)指出,可用相差比率(E1)筒化藺個(gè)定 電變量的非統(tǒng)性關(guān)系.通過r和r的比較,大致可以知道X Ml ¥是否是直繳美系.如果要 整驗(yàn)壹量X和變¥在總體中是告是直線關(guān)系,可胤鑿這樣的假設(shè)研究假設(shè) 閉(非直戰(zhàn)關(guān)系)虛無假設(shè) 仇江=£*(直線美塞)可以用F比率公式來檢驗(yàn)H, ,即一一” 一=吁二1/祚二一 F- T'lra Jd

32、fi=>-2dG 在這里m是樣本的數(shù)量修是*變量值的數(shù)目,也就是分組的粒目表示直境關(guān)系時(shí) 所消減的誤差里示非直城美系時(shí)所消減的謖差'因而(仃/3就是非直線方式所雒.少 的誤差門_守)就是癇余摒量.為了估計(jì)總體的數(shù)值,在公式中,分子分母都除目相應(yīng)的 向由度,在指定的顯著性水平下,將F比率的值與否定里的界限進(jìn)行比較,從而確定是接 受還是否定虛無限設(shè),進(jìn)而確定的變量之間是否是直線關(guān)系*相關(guān)系t相關(guān)方向 值地力用工十彳陸丫 +蛆) 2 it (Mjf + Mr)?。ǘㄐ蜃兞?定序變量)r; _ NMC KTn;X-Y0tlX-*YOdyA-*r傍VX-Y不固定X-YOUX-Y不固定X-Y1一,+1d*f ¥lr+ 1VX-Y不固定J相關(guān)系教相關(guān)方向 慎嵯PREM-N.JK + M十內(nèi)萬N一¥t2m( Nt - Nj)XT不固定O i* +1尸”/Mf#具有pre性質(zhì)1 + 1(定距變量一定距變量)nSJfY-<SX)CXY>有二0x), J/X*一立可y i + n,具有PRE性質(zhì)定類變通一定序變盤)心后7定類變量一定距變

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論