版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第章計(jì)數(shù)數(shù)據(jù)的統(tǒng)計(jì)分析:二項(xiàng)式檢驗(yàn)及分析第一節(jié)二項(xiàng)實(shí)驗(yàn)與二項(xiàng)分布一二項(xiàng)實(shí)驗(yàn)二項(xiàng)實(shí)驗(yàn)的任務(wù)是,讓被試根據(jù)某種原則把兩類事物分開(kāi),或者把事物分為兩種類別。例如,呈現(xiàn)給被試兩條長(zhǎng)度相差不多的線段,讓被試選出較長(zhǎng)的一條;呈現(xiàn)兩個(gè)強(qiáng)度相差不大的聲音,讓被試分辨哪個(gè)聲音強(qiáng)一些。在這樣的實(shí)驗(yàn)中,研究者想明確被試的正確判斷是反映出他真的具有某種辨別能力,還是反映出猜測(cè)的結(jié)果。二項(xiàng)實(shí)驗(yàn)通常需要進(jìn)行多次,每次實(shí)驗(yàn)結(jié)果只有兩種可能,即正確與錯(cuò)誤或者是某種情況與非某種情況。當(dāng)多次實(shí)驗(yàn)結(jié)果的正確次數(shù)超過(guò)一定數(shù)量,即僅憑機(jī)遇得到這種結(jié)果的概率很小的時(shí)候,我們就有理由相信被試具備某種判斷力。假定某人聲稱自己有“千里眼”功能,可以看到封閉容器里的東西。心理學(xué)家要對(duì)此進(jìn)行驗(yàn)證,可以使用二項(xiàng)實(shí)驗(yàn)方法,每次向被試呈現(xiàn)兩個(gè)一模一樣的密封盒子,其中一只盒子里有東西,讓被試判斷東西在哪只盒子里。如果被試沒(méi)有其聲稱的“千里眼”功能,他僅憑機(jī)遇一次判斷正確的概率為1/2,二次實(shí)驗(yàn)都判斷正確的概率為1/2*1/2,n次實(shí)驗(yàn)都正確的概率為(1/2)n。假設(shè)我們做了5次這樣的實(shí)驗(yàn),僅憑機(jī)遇,5次判斷都正確的概率已經(jīng)小于0.05。如果被試5次都正確的話,我們就可以相信他有“千里眼”功能了。對(duì)上述二項(xiàng)實(shí)驗(yàn),我們可以改變?cè)O(shè)計(jì)方法,用多個(gè)密封盒子,比如用3個(gè),其中有一只盒子里放東西,讓被試判斷東西在哪只盒子里。這時(shí),僅憑機(jī)遇,被試一次判斷正確的概率變?yōu)?/3,n次都正確的概率為(1/3)n。另外,我們也可以用多個(gè)密封盒子,比如5個(gè),在其中兩個(gè)盒子里放東西,讓被試選擇出一只放有東西的盒子。這時(shí),僅憑機(jī)遇,被試一次選擇正確的概率為2/5,n次選擇都正確的概率為(2/5)n。二二項(xiàng)實(shí)驗(yàn)的基本條件二項(xiàng)實(shí)驗(yàn)每次呈現(xiàn)的實(shí)驗(yàn)刺激并非一定要求是兩個(gè),可以是一個(gè),二個(gè)或者多個(gè),被試任何一次的反應(yīng)只能有兩種結(jié)果,即成功與失敗,或者A與非A。上述是二項(xiàng)實(shí)驗(yàn)的基本條件之一。二項(xiàng)實(shí)驗(yàn)第二個(gè)基本條件是,要有n次實(shí)驗(yàn),n是預(yù)先給定的任一正整數(shù)。心理學(xué)家要通過(guò)二項(xiàng)實(shí)驗(yàn)及二項(xiàng)分布知識(shí)進(jìn)行假設(shè)檢驗(yàn)工作,通常需要將設(shè)計(jì)好的二項(xiàng)實(shí)驗(yàn)進(jìn)行反復(fù)多次的實(shí)驗(yàn),然后根據(jù)二項(xiàng)實(shí)驗(yàn)結(jié)果隨機(jī)分布的概率模型,計(jì)算被試反應(yīng)結(jié)果憑機(jī)遇可能性的大小,從而推測(cè)被試是否具有某種判斷能力。二項(xiàng)實(shí)驗(yàn)第三個(gè)基本條件是,各次實(shí)驗(yàn)之間要相互獨(dú)立,也就是說(shuō)各次實(shí)驗(yàn)之間不能相互產(chǎn)生影響。如果實(shí)驗(yàn)假設(shè)某此實(shí)驗(yàn)被試選擇了刺激1或?qū)Υ碳?做出了反應(yīng),那么接下來(lái)的實(shí)驗(yàn)就不能再選擇刺激1或?qū)Υ碳?做出反應(yīng)。這樣的設(shè)定造成實(shí)驗(yàn)之間的相互影響,不符合二項(xiàng)實(shí)驗(yàn)的基本條件。二項(xiàng)實(shí)驗(yàn)第四個(gè)基本條件是,每次實(shí)驗(yàn)其成功或失敗概率恒定,即n次實(shí)驗(yàn)的成功概率或失敗概率相同,并且每次實(shí)驗(yàn)成功與失敗概率和為1。這個(gè)條件很重要,如果每次實(shí)驗(yàn)成功概率不等,那么實(shí)驗(yàn)結(jié)果就無(wú)法用二項(xiàng)分布公式來(lái)解釋。例如在“千里眼”問(wèn)題的實(shí)驗(yàn)中,如果我們?cè)O(shè)計(jì)了5只盒子,只在其中一只里放東西,并讓被試做判斷,那么在接下來(lái)的各項(xiàng)試驗(yàn)中,就不能再做變化,保證各次實(shí)驗(yàn)成功概率都為1/5。根據(jù)二項(xiàng)實(shí)驗(yàn)的條件,能力測(cè)驗(yàn)或知識(shí)測(cè)試的選擇題通常也可以設(shè)計(jì)為二項(xiàng)實(shí)驗(yàn),用二項(xiàng)分布知識(shí)回答被試是否具有某項(xiàng)能力或者某方面的知識(shí)。例如有10道單選題,每題都有相同數(shù)量的選項(xiàng),假如5項(xiàng)僅有一個(gè)選項(xiàng)正確,僅憑機(jī)遇選對(duì)一題的概率都為1/5,這10道單選題測(cè)驗(yàn)可以看成一個(gè)n=10的二項(xiàng)實(shí)驗(yàn)。再例如,有10道多選題,每題都有相同數(shù)量的選項(xiàng),假定有5個(gè)選項(xiàng),每項(xiàng)只有一種正確選擇,僅憑機(jī)遇選對(duì)一題的概率都為1=1/31,這10道多選題測(cè)驗(yàn)也可以看成一個(gè)n=10的二項(xiàng)實(shí)驗(yàn)。三二項(xiàng)實(shí)驗(yàn)各種成功次數(shù)的概率分布二項(xiàng)分布是用來(lái)描述二項(xiàng)實(shí)驗(yàn)各種成功次數(shù)的概率分布情況的,例如有一個(gè)重復(fù)n次的二項(xiàng)實(shí)驗(yàn),僅憑機(jī)遇對(duì)0次至n次的概率所形成的分布為二項(xiàng)分布。由于二項(xiàng)分布描述自然數(shù)的概率,因此屬于離散型數(shù)據(jù)概率分布。二項(xiàng)分布有何規(guī)律性?讓我們首先看看n=2和n=3的二項(xiàng)實(shí)驗(yàn)情形。設(shè)定p為二項(xiàng)實(shí)驗(yàn)每次僅憑機(jī)遇判斷正確的概率,q為失敗概率,當(dāng)p=q=1/2并且n=2時(shí),憑機(jī)遇該二項(xiàng)實(shí)驗(yàn)有下述各種可能結(jié)果:對(duì)對(duì)(第一次對(duì)、第二次也對(duì))、對(duì)錯(cuò)、錯(cuò)對(duì)、錯(cuò)錯(cuò)。因此,僅憑機(jī)遇兩次都對(duì)的概率為1/2×1/2=1/4,對(duì)一次的概率為1/2×1/2+1/2×1/2=1/2,對(duì)0次的概率為(即兩次皆錯(cuò)的概率)1/2×1/2=1/4。對(duì)2次、1次、0次的概率正好分別是二項(xiàng)式(1/2+1/2)2展開(kāi)的三項(xiàng)值,即(1/2+1/2)2=1/4+1/2+1/4。當(dāng)p=q=1/2并且n=3時(shí),憑機(jī)遇此二項(xiàng)實(shí)驗(yàn)有下述各種可能結(jié)果:對(duì)對(duì)對(duì)、對(duì)對(duì)錯(cuò)、對(duì)錯(cuò)對(duì)、錯(cuò)對(duì)對(duì)、錯(cuò)錯(cuò)對(duì)、錯(cuò)對(duì)錯(cuò)、對(duì)錯(cuò)錯(cuò)、錯(cuò)錯(cuò)錯(cuò)8種情況,3次實(shí)驗(yàn)對(duì)3次的概率為1/2×1/2×1/2=1/8,對(duì)2次的概率為1/2×1/2×1/2+1/2×1/2×1/2+1/2×1/2×1/2=3×1/8,對(duì)1次的概率也為3×1/8,對(duì)0次的概率為1/8,對(duì)3次、2次、1次和0次的概率正好分別是二項(xiàng)式(1/2+1/2)3展開(kāi)的四項(xiàng)值,即:==。對(duì)于任何二項(xiàng)實(shí)驗(yàn),設(shè)定p和q,以及實(shí)驗(yàn)的次數(shù)n,僅憑機(jī)遇對(duì)n次至0次的概率正好是二項(xiàng)式(p+q)n展開(kāi)式對(duì)應(yīng)的各項(xiàng)值,即:=(x=0,1...n)。四二項(xiàng)分布的應(yīng)用以“千里眼”問(wèn)題為例,為明確某人是否有“千里眼”功能,心理學(xué)家設(shè)計(jì)4只密封盒子,在1只盒子里放東西,讓被試判斷東西在哪只盒子里,實(shí)驗(yàn)共做10次,憑機(jī)遇每次判斷正確的概率為1/4,即p=1/4,q=3/4。根據(jù)二項(xiàng)分知識(shí),10次皆對(duì)的概率為:=(1/4)10=0.00000095,9次對(duì)的概率為0.000029,8次對(duì)的概率為0.00039,7次對(duì)的概率為,6次對(duì)的概率為0.016,5次對(duì)的概率為0.058。被試判斷正確6次及以上的概率為0.016+0.0031+0.00039+0.000029+0.00000095=0.0195,即被試僅憑機(jī)遇能夠判斷6次及以上正確的概率僅為0.0195,低于0.05顯著水平。通過(guò)實(shí)驗(yàn),如果被試判斷正確次數(shù)為6次或者超過(guò)6次,我們就可以做出統(tǒng)計(jì)結(jié)論:被試具有“千里眼”功能。當(dāng)然,被試也有可能憑機(jī)遇碰巧猜對(duì)6次或6次以上,但這樣可能性很小,概率低于5%。如果被試真的是碰巧猜對(duì)6次或6次以上,那么我們就犯下統(tǒng)計(jì)錯(cuò)誤,但犯下這種錯(cuò)誤的概率很低,小于5%。第二節(jié)用正態(tài)分布模型求解二項(xiàng)分布概率一二項(xiàng)實(shí)驗(yàn)數(shù)據(jù)符合正態(tài)分布的條件二項(xiàng)實(shí)驗(yàn)數(shù)據(jù)可以用二項(xiàng)分布知識(shí)解釋,二項(xiàng)分布是離散型數(shù)據(jù)分布,其概率直方圖是躍階式的。當(dāng)p=q時(shí),圖形對(duì)稱,當(dāng)pq時(shí),直方圖呈偏態(tài)。如果二項(xiàng)分布滿足p<q,且np5(或者p>q,且nq5)時(shí),二項(xiàng)分布接近正態(tài)分布,可以用正態(tài)分布知識(shí)求解二項(xiàng)分布的概率。這時(shí)x變量(即n次二項(xiàng)實(shí)驗(yàn)僅憑機(jī)遇正確判斷的次數(shù))具有如下性質(zhì):無(wú)數(shù)被試參與該二項(xiàng)實(shí)驗(yàn),總體正確判斷次數(shù)的平均值=np,標(biāo)準(zhǔn)差=,且x變量的分布于=np,=的正態(tài)分布接近。在此需要提示注意的是,接近的概念不是說(shuō)x變量的分布與對(duì)應(yīng)=np,=的正態(tài)分布相似。x變量的分布屬于離散分布,而正態(tài)分布屬于連續(xù)分布?!敖咏币庵?,此時(shí),x變量的相對(duì)概率密度與對(duì)應(yīng)正態(tài)分布計(jì)算的概率密度接近。也就是說(shuō)通過(guò)二項(xiàng)分布計(jì)算出的超過(guò)某x值(是自然數(shù))的概率,與通過(guò)對(duì)應(yīng)正態(tài)分布計(jì)算出的超過(guò)同樣x值的概率十分接近。有了上述二項(xiàng)分布的性質(zhì),我們可以借助正態(tài)分布求解二項(xiàng)分布的概率,這樣可以避免二項(xiàng)分布的繁瑣計(jì)算。二利用正態(tài)分布求二項(xiàng)分布概率以“千里眼”問(wèn)題為例,設(shè)計(jì)2只盒子,其中一只盒子放有東西,讓被試判斷東西放在哪只盒子里,實(shí)驗(yàn)共做10次,每次憑機(jī)遇猜對(duì)的概率為1/2。通過(guò)實(shí)驗(yàn)解釋二項(xiàng)判斷的結(jié)果是基于隨機(jī)的猜測(cè),還是基于真實(shí)的判斷力。此題p=q=1/2,np5,所以二項(xiàng)分布接近正態(tài)分布,對(duì)應(yīng)正態(tài)分布的=np=101/2=5,==1.58。依據(jù)正態(tài)分布概率(查表可知)Z=1.645時(shí),該點(diǎn)一下包含了全體的95%,該點(diǎn)的原始分值x=+1.645=7.6。這意味,在此正態(tài)分布中,大于7.6分值的概率小于5%。由于二項(xiàng)分布為離散分布,不可能有7.6次正確判斷次數(shù),取x值為8時(shí),在此二項(xiàng)分布中,大于8分值的概率同樣小于5%(取x值為7時(shí),大于7分的概率大于5%,因此不能取x值為7)。通過(guò)正態(tài)分布計(jì)算,被試猜對(duì)8次及以上的概率小于5%,因此,可以推測(cè)說(shuō),猜對(duì)8次及以上者,僅憑機(jī)遇的可能性小于5%,此概率很小,我們有理由相信這樣的人有“千里眼”功能。利用正態(tài)分布求解二項(xiàng)分布概率,只有在滿足相關(guān)條件的時(shí)候才可以這么做。如果條件不滿足,我們只能老老實(shí)實(shí)通過(guò)二項(xiàng)分布求解概率。例如在二項(xiàng)分布應(yīng)用的題目中,p=1/4,n=10,np=2.5<5,此時(shí)二項(xiàng)分布與正態(tài)分布相差甚遠(yuǎn),不能再用正態(tài)分布求解概率了。第三節(jié)百分比及百分比差值檢驗(yàn)二項(xiàng)實(shí)驗(yàn)的數(shù)據(jù),有時(shí)是用比例來(lái)表示的。另外,在二分變量的調(diào)查研究中,屬于定義情況的個(gè)案數(shù)量通常也是用比例來(lái)反映的。上述比例表示的變量都是只有兩種類別的分類變量,本節(jié)內(nèi)容主要介紹此類型數(shù)據(jù)的推論分析。一百分比檢驗(yàn)百分比檢驗(yàn)適用于處理單一樣本或一種條件下二分變量比例的研究結(jié)果。例如,有人聲稱大白鼠有右轉(zhuǎn)彎的偏好。動(dòng)物心理學(xué)家用T型迷津做研究,發(fā)現(xiàn)一只大白鼠64次實(shí)驗(yàn)中,有42次向右轉(zhuǎn),右轉(zhuǎn)百分比為65.6%。根據(jù)這個(gè)二項(xiàng)實(shí)驗(yàn)結(jié)果,能不能說(shuō)大白鼠有右轉(zhuǎn)彎偏好(注:實(shí)驗(yàn)控制好了其他額外變量)。再例如,某糖果廠為孩子試制了兩種圖案不同的糖果包裝紙去征求孩子的意見(jiàn),在一個(gè)包含200個(gè)孩子的樣本中,有140個(gè)孩子喜歡甲種包裝紙,喜歡甲種包裝紙的人數(shù)占調(diào)查總?cè)藬?shù)的70%。根據(jù)這個(gè)調(diào)查結(jié)果,是否可以說(shuō)孩子對(duì)甲種包裝紙有所偏愛(ài)呢?上述兩個(gè)例子就涉及到百分比分析問(wèn)題。(一)樣本百分比分布比例和頻數(shù)是可以互換的,比例分布實(shí)際上屬于二項(xiàng)分布。當(dāng)樣本容量較小時(shí),可以用頻數(shù)進(jìn)行二項(xiàng)式檢驗(yàn),比例進(jìn)行的檢驗(yàn)通常用于處理大樣本情況。在大樣本情況下,常用正態(tài)分布表示二項(xiàng)分布的近似值。假設(shè)總體具有某種屬性的比例為p,不具有某種屬性的概率為q,從該總體隨機(jī)抽取容量為n的樣本,可以計(jì)算出樣本具有某種屬性的個(gè)案比例,用p’表示容量為n的樣本中具有某種屬性的個(gè)案所占比例,當(dāng)nP5(p<q)或nq5(p>q)時(shí),樣本比率p’的分布接近一個(gè)正態(tài)分布,該正態(tài)分布的平均數(shù)和標(biāo)準(zhǔn)差的計(jì)算方法見(jiàn)公式(6.1)和(6.2)。公式(6.1)和(6.2)同頻數(shù)表示的二項(xiàng)分布接近的正態(tài)分布參數(shù)計(jì)算公式有聯(lián)系,是在原公式的右邊分別除以n,完成將頻數(shù)轉(zhuǎn)換為比率。=p(6.1)或=(6.2)(二)總體比例的區(qū)間估計(jì)對(duì)于一個(gè)無(wú)限總體或非常大的總體,要想了解其總體具有某特征的比例,我們通常采取隨機(jī)抽樣的方法抽取一個(gè)樣本并計(jì)算出樣本比例,然后根據(jù)樣本比例符合的統(tǒng)計(jì)模型來(lái)說(shuō)明總體比例的置信區(qū)間,這點(diǎn)很像平均數(shù)的區(qū)間估計(jì)。前面我們剛剛介紹了,當(dāng)樣本量足夠大時(shí),nP5時(shí),樣本比例分布可以借助正態(tài)分布模型來(lái)說(shuō)明。根據(jù)正態(tài)分布的知識(shí),總體比例的置信區(qū)間可由公式(6.3)計(jì)算。=p=(6.3)具體計(jì)算時(shí),由于總體的p和q不知,此時(shí)可以用和代換p和q。下面是一個(gè)具體的例子。為了知道某大學(xué)男女生的比例,我們按照隨機(jī)抽樣原則,在該大學(xué)學(xué)生管理處隨機(jī)抽取50個(gè)同學(xué),結(jié)果顯示男生30人,女生20人,問(wèn)該大學(xué)男生比率95%的置信區(qū)間。根據(jù)已知條件,可得==0.6(男生的樣本比例),==0.4(女生的樣本比例)。由于n>5,可以借用正態(tài)分布模型,即公式(6.3)推論置信區(qū)間。由=1.96,===0.0693,P的0.95置信區(qū)間為:P=0.61.960.0693=0.46~0.74。由此可以推知該大學(xué)男生比例在0.46~0.74之間,作此推論錯(cuò)誤概率為0.05,為小概率。(三)比例的假設(shè)檢驗(yàn)比例的假設(shè)檢驗(yàn)?zāi)康脑谟冢ㄟ^(guò)運(yùn)用樣本比例分布模型,推測(cè)樣本是否來(lái)自已知總體,即研究的樣本與已知總體是否有顯著差異性。根據(jù)樣本比例分布知識(shí),在已知總體的p和q確定后,當(dāng)np5或時(shí),從該總體隨機(jī)抽取樣本,其的分布可借用前面所講的正態(tài)模型來(lái)說(shuō)明。如果我們所研究的某個(gè)樣本屬于該總體的一個(gè)隨機(jī)樣本,那么該樣本統(tǒng)計(jì)量在該總體屬性比例0.95或0.99置信區(qū)間內(nèi)屬正常,而超出這個(gè)區(qū)間屬異常。當(dāng)與已知總體的P相差較大,處于小概率的極端位置,我們便推論該樣本不屬于已知總體,做此推論犯錯(cuò)誤的概率很小,僅為0.05或0.01。比例假設(shè)檢驗(yàn)的一般步驟是,首先提出虛無(wú)假設(shè)“研究樣本屬于已知總體的一個(gè)隨機(jī)樣本”;然后根據(jù)已知總體其樣本分布符合的正態(tài)分布模型,考察樣本的比例是否超出0.95或0.99置信區(qū)間,如果超出置信區(qū)間,就做出不屬于該總體的結(jié)論,即接受備選假設(shè)“研究樣本不屬于已知總體的一個(gè)隨機(jī)樣本”。下面以大白鼠轉(zhuǎn)彎偏好問(wèn)題為例,來(lái)說(shuō)明比例的假設(shè)檢驗(yàn)過(guò)程。干擾因素被控制之后,大白鼠在T型迷津里行走,如果沒(méi)有轉(zhuǎn)彎的偏好,總體上看其左右轉(zhuǎn)彎的概率是相同的,都為50%。假設(shè)我們對(duì)一只大白鼠的64次實(shí)驗(yàn)為總體的一個(gè)隨機(jī)樣本,該假設(shè)為虛無(wú)假設(shè),即“大白鼠無(wú)右轉(zhuǎn)彎偏好”。根據(jù)前面所講的正態(tài)分布模型,可以計(jì)算出。0.5,=0.656===0.0625由實(shí)驗(yàn)得到統(tǒng)計(jì)量=0.656,用該正態(tài)分布表示二項(xiàng)分布的近似值,計(jì)算出在樣本分布中的Z值,Z值的計(jì)算方法是:查正態(tài)分布表,Z=2.50時(shí),較小部分的面積為0.0062。由于現(xiàn)在要檢驗(yàn)的是大白鼠偏好右轉(zhuǎn)彎,而不是有向左或向右轉(zhuǎn)彎偏好,因此要選擇單側(cè)檢驗(yàn)。通過(guò)假設(shè)檢驗(yàn)分析,我們可以在0.01水平上推翻虛無(wú)假設(shè),認(rèn)為大白鼠有很顯著的右轉(zhuǎn)彎偏好。上例正好遇到總體的p=q=0.50的情況,實(shí)踐上p可以不等于q,這同樣可以按上述的過(guò)程進(jìn)行假設(shè)檢驗(yàn),只要注意把相應(yīng)的p,q及n值代入公式計(jì)算相關(guān)指標(biāo)就行了。二兩個(gè)樣本比例差異的顯著性檢驗(yàn)比例差異的顯著性檢驗(yàn)適用于處理兩個(gè)樣本比例的實(shí)驗(yàn)結(jié)果,通過(guò)兩個(gè)樣本比例差異的分析來(lái)推論兩個(gè)樣本是否來(lái)自同一個(gè)總體。心理學(xué)研究時(shí)常遇到兩個(gè)樣本比例之間的比較,例如將一群被試隨機(jī)分成兩組,分別包含n1和n2個(gè)被試,其中一組被試接受態(tài)度轉(zhuǎn)變培訓(xùn),另一組被試接受與某種態(tài)度轉(zhuǎn)變無(wú)關(guān)的其它培訓(xùn)。培訓(xùn)結(jié)束后對(duì)每名被試進(jìn)行態(tài)度調(diào)查,實(shí)驗(yàn)的目的在于分析兩組被試肯定態(tài)度的比例是否有顯著的差異性。如果經(jīng)檢驗(yàn)差異顯著,那就說(shuō)明態(tài)度轉(zhuǎn)變培訓(xùn)起到了改變被試態(tài)度的作用。分析上述實(shí)驗(yàn)結(jié)果,需要用到兩個(gè)樣本比例差異的抽樣分布模型,有了這個(gè)模型就可以解釋差異是否達(dá)到顯著水平。(一)兩個(gè)樣本比例差異的抽樣分布模型從總體比例分別為和的兩個(gè)總體中,隨機(jī)抽取樣本容量為n1和n2的兩個(gè)樣本,得到兩個(gè)樣本比例,當(dāng)時(shí),統(tǒng)計(jì)量的分布近似正態(tài)分布,該正態(tài)分布的參數(shù)分別為公式(6.4)和(6.5)。(6.4)(6.5)如果總體和不知,可分別用兩個(gè)樣本的代替和,公式(6.5)可寫(xiě)為公式(6.6)。(6.6)在比例差異的假設(shè)檢驗(yàn)中,虛無(wú)假設(shè)通常是=,即兩個(gè)樣本來(lái)自同一總體。如果=,這時(shí)兩個(gè)樣本比例差值分布的平均值為0;其分布的標(biāo)準(zhǔn)差計(jì)算不再單獨(dú)用,而是用加權(quán)比例平均數(shù)()。(6.7)(6.8)將公式(6.8)代入公式(6.7)得公式(6.9)。(6.9)如果公式(6.9)變?yōu)楣剑?.10)。(6.10)在此需要指出,上述關(guān)于兩個(gè)樣本比例差值分布的知識(shí)是針對(duì)兩個(gè)獨(dú)立樣本來(lái)說(shuō)的,也就是講兩個(gè)樣本沒(méi)有相關(guān)關(guān)系。兩個(gè)獨(dú)立樣本比例差異的顯著性檢驗(yàn)兩個(gè)獨(dú)立樣本比例差異的顯著性檢驗(yàn)一般步驟是:提出虛無(wú)假設(shè),或(設(shè)定值),即兩個(gè)樣本代表的總體比例相同或相差一個(gè)之前設(shè)定的值;根據(jù)前面所講的兩個(gè)獨(dú)立樣本比例差值抽樣分布知識(shí),求出;計(jì)算出實(shí)驗(yàn)樣本比例差值的標(biāo)準(zhǔn)分?jǐn)?shù),計(jì)算公式為(6.11);最后查正態(tài)分布表,看Z值是否達(dá)到顯著水平,并做出推論。(6.11)比例差異的檢驗(yàn)也有單側(cè)和雙側(cè)檢驗(yàn)的區(qū)別。雙側(cè)檢驗(yàn)的虛無(wú)假設(shè)是或,備選假設(shè)是或;單側(cè)檢驗(yàn)的虛無(wú)假設(shè)是或,備選假設(shè)是或。雙側(cè)檢驗(yàn)時(shí),需查Z值對(duì)應(yīng)的雙側(cè)面積;單側(cè)檢驗(yàn)時(shí),需查Z值對(duì)應(yīng)的單側(cè)面積。下面兩個(gè)例題具體說(shuō)明此類檢驗(yàn)的過(guò)程。例題一:以態(tài)度轉(zhuǎn)變培訓(xùn)問(wèn)題為例,80名受試者被隨機(jī)分為兩組,50人接受態(tài)度轉(zhuǎn)變培訓(xùn),另30人接受其它培訓(xùn)。培訓(xùn)結(jié)束后進(jìn)行態(tài)度調(diào)查,調(diào)查結(jié)果顯示,態(tài)度轉(zhuǎn)變培訓(xùn)組受試者持肯定態(tài)度比例為84%;其它培訓(xùn)組受試者持肯定態(tài)度比率為60%。問(wèn)態(tài)度轉(zhuǎn)變培訓(xùn)是否起到轉(zhuǎn)變態(tài)度的效果?此例具體分析是:設(shè)和分別為態(tài)度轉(zhuǎn)變培訓(xùn)組和其它內(nèi)容培訓(xùn)組總體持肯定態(tài)度的比例,虛無(wú)假設(shè)是,即態(tài)度轉(zhuǎn)變培訓(xùn)沒(méi)有顯著提高持肯定態(tài)度的比例,推論屬于單側(cè)檢驗(yàn)。將,,代入公式(6.8),得,再將、和、值代入公式(6.7),得最后把,代入公式(6.11),得查正態(tài)分布表可知,Z=24.00時(shí),Z對(duì)應(yīng)的單側(cè)面積遠(yuǎn)遠(yuǎn)小于0.01,因此在0.01水平上,兩個(gè)組比例差異達(dá)到顯著。統(tǒng)計(jì)的結(jié)論是,態(tài)度轉(zhuǎn)變培訓(xùn)起到了顯著效果。例題二:將上例做一改變,假定一公司提出要求,態(tài)度轉(zhuǎn)變培訓(xùn)要達(dá)到接受態(tài)度轉(zhuǎn)變培訓(xùn)后總體上積極態(tài)度的比率高出沒(méi)有接受態(tài)度轉(zhuǎn)變培訓(xùn)總體5個(gè)百分點(diǎn)以上。已知和(接受態(tài)度轉(zhuǎn)變培訓(xùn)組)為100和80%,和為150和60%,問(wèn)結(jié)果是否達(dá)到公司要求?例題二的具體分析:虛無(wú)假設(shè)為,即態(tài)度轉(zhuǎn)變培訓(xùn)沒(méi)有達(dá)到總體上提高積極態(tài)度5個(gè)百分點(diǎn)的要求,檢驗(yàn)也屬于單側(cè)檢驗(yàn)。與例題一不同,例題二計(jì)算的公式用公式(6.6),不要求加權(quán)值。最后把=0.80,=0.60,=0.01和=0.05代入公式(6.11),得查正態(tài)分布表可知,Z=2.65時(shí),Z對(duì)應(yīng)的單側(cè)面積0.01,因此在0.01水平上顯著,統(tǒng)計(jì)結(jié)論是,態(tài)度轉(zhuǎn)變培訓(xùn)顯著提高總體積極態(tài)度比例5個(gè)百分點(diǎn)以上。兩個(gè)相關(guān)樣本比率差異的顯著性檢驗(yàn)前述兩個(gè)樣本比例差值分布的知識(shí),是針對(duì)兩個(gè)獨(dú)立樣本來(lái)講的,它不符合兩個(gè)相關(guān)樣本比例差異的顯著性檢驗(yàn)。因此,相關(guān)樣本的檢驗(yàn)還需要尋找其它方法。在心理學(xué)研究中,有時(shí)會(huì)考慮安排同一組被試在不同條件下做實(shí)驗(yàn),這時(shí)實(shí)驗(yàn)結(jié)果的數(shù)據(jù)之間就有了相關(guān)關(guān)系。對(duì)于分類變量的研究也存在該種情況,例如在前面的例子中,我們?yōu)檠芯繎B(tài)度轉(zhuǎn)變培訓(xùn)是否有提高肯定態(tài)度比例的效果,可以在培訓(xùn)前后對(duì)同一組受試者進(jìn)行態(tài)度測(cè)查,看看前后兩次調(diào)查結(jié)果中持肯定態(tài)度的比例是否有變化。這樣的實(shí)驗(yàn)結(jié)果就需要進(jìn)行兩個(gè)相關(guān)樣本比例差異的顯著性檢驗(yàn)。上述相關(guān)樣本的實(shí)驗(yàn)結(jié)果可以整理成22的表格,表格一般形式如下:實(shí)驗(yàn)條件一實(shí)驗(yàn)條件二 是某種情況非某種情況是某種情況BAA+B非某種情況DCC+DB+DA+CA表示同一組被試中,第一條件是某種情況而第二條件下卻為非某種情況的人數(shù);B表示同一組被試中,第一條件下是某種情況且第二條件下也是某種情況的人數(shù);C和D表示的意義類推。根據(jù)上表,兩次調(diào)查得到的是某種情況的比例分別為(A+B)/n和(B+D)/n。那么就有兩次調(diào)查比例差值的計(jì)算形式:從差值計(jì)算公式可以看出,兩次調(diào)查比例的差值只與A和D有關(guān)。因此在這種比例差異的顯著性檢驗(yàn)中只需要考慮A和D的數(shù)值。從總體上看,如果A=D,那么總體比例就無(wú)差異。根據(jù)表,A和D分別表示兩種條件下兩種不一致個(gè)體的數(shù)量:A反映第一種條件為肯定而第二種條件轉(zhuǎn)為否定的個(gè)案數(shù)量;D反映第一張條件為否定而第二種條件轉(zhuǎn)為肯定的個(gè)案數(shù)量。當(dāng)總體上有A=D時(shí),樣本觀察到的A和D的分布符合二項(xiàng)分布,該二項(xiàng)分布的p=q=,A+D=k為二項(xiàng)實(shí)驗(yàn)的次數(shù),A與D是否有顯著差異可以借助二次分布的知識(shí)解釋。當(dāng)kp即(A+D)時(shí),二項(xiàng)分布接近正態(tài)分布,A與D的顯著性推論分析就轉(zhuǎn)變成正態(tài)分布模型解釋。樣本分布的Z計(jì)算公式:(6.12)公式(6.12)實(shí)際是二項(xiàng)分布近似正態(tài)分布條件下Z檢驗(yàn)公式的具體化,下面以態(tài)度轉(zhuǎn)變培訓(xùn)問(wèn)題為例來(lái)說(shuō)明具體分析過(guò)程,假設(shè)研究的數(shù)據(jù)如下:培訓(xùn)前培訓(xùn)后肯定人數(shù)否定人數(shù) 肯定人數(shù)55(B)5(A)否定人數(shù)15(D)25(C)將A和D代入公式(6.12),得Z>1.96,因此可以推論培訓(xùn)有顯著的效果。上述分析過(guò)程只適合k10的情況,當(dāng)k<10時(shí),二項(xiàng)分布與相應(yīng)的正態(tài)分布差別較大,此時(shí)應(yīng)采用二項(xiàng)展開(kāi)式具體計(jì)算。第四節(jié)一個(gè)變量多種分類數(shù)據(jù)及兩個(gè)分類變量的推論分析:檢驗(yàn)。一檢驗(yàn)概述(一)檢驗(yàn)的數(shù)據(jù)特征二項(xiàng)式檢驗(yàn)以及與二項(xiàng)式檢驗(yàn)相關(guān)的比例檢驗(yàn),主要用來(lái)分析只有兩種分類的單個(gè)分類變量實(shí)驗(yàn)或調(diào)查的結(jié)果。當(dāng)兩種分類結(jié)果以頻數(shù)表示時(shí),分析采用二項(xiàng)式檢驗(yàn);當(dāng)兩種分類結(jié)果以比例表示時(shí),分析采用比例檢驗(yàn)方法。在心理學(xué)實(shí)際研究中,我們常遇到一些分類變量,它有兩種以上的分類,并且在一項(xiàng)具體研究中分類變量也不僅僅只有一個(gè)。這樣的單變量多種分類的結(jié)果,以及多個(gè)分類變量的實(shí)驗(yàn)結(jié)果,其分析不能再用上述的二項(xiàng)式檢驗(yàn)和比例檢驗(yàn)方法。在介紹概率分布知識(shí)時(shí),我們提到一些計(jì)數(shù)數(shù)據(jù)的分布也符合c2分布,c2檢驗(yàn)將借助c2分布模型處理多種分類以及多個(gè)分類變量的實(shí)驗(yàn)結(jié)果。例如:某學(xué)院有5個(gè)專業(yè),也就是說(shuō)該學(xué)院專業(yè)變量有5個(gè)分類,這5個(gè)專業(yè)在校學(xué)生數(shù)可以調(diào)查出來(lái),假設(shè)從全國(guó)來(lái)看類似學(xué)院5個(gè)專業(yè)學(xué)生人數(shù)基本一致,問(wèn)該學(xué)院情況是否和全國(guó)類似學(xué)院一樣?(即5個(gè)專業(yè)學(xué)生人數(shù)基本一致)。再例如,從某學(xué)院隨機(jī)抽取n名學(xué)生,調(diào)查他們的性別和專業(yè)兩個(gè)方面的屬性(即兩個(gè)變量),性別和專業(yè)屬于分類變量,性別有兩個(gè)分類,專業(yè)有5個(gè)分類,調(diào)查結(jié)果為男女人數(shù)分布和5個(gè)專業(yè)人數(shù)分布,問(wèn)5個(gè)專業(yè)的人數(shù)分布是否有男女差別?上述兩個(gè)例題的數(shù)據(jù)分析就會(huì)用到c2檢驗(yàn)法。c2檢驗(yàn)的內(nèi)容c2檢驗(yàn)的內(nèi)容主要有配合度卡方檢驗(yàn)(goodness-of-fitc2test)和獨(dú)立性卡方檢驗(yàn)(c2testofindependence)兩個(gè)方面。配合度檢驗(yàn)用于分析單個(gè)分類變量實(shí)際觀察到的不同類別頻數(shù)分布,是否與假設(shè)或期望總體的頻數(shù)分布一致。獨(dú)立性檢驗(yàn)用于分析兩個(gè)分類變量的實(shí)驗(yàn)結(jié)果,回答一個(gè)變量不同類別的頻數(shù)分布是否與另一個(gè)分類變量不同類別有關(guān)系這個(gè)問(wèn)題。這兩種c2檢驗(yàn)分別對(duì)應(yīng)于前面所舉的兩個(gè)例子的數(shù)據(jù)分析。配合度檢驗(yàn)配合度檢驗(yàn)需要滿足的基本假設(shè)條件配合度檢驗(yàn)適用于分析單個(gè)多類變量的實(shí)驗(yàn)結(jié)果,這種實(shí)驗(yàn)數(shù)據(jù)應(yīng)滿足三個(gè)條件:(1)不同分類之間要相互排除;(2)觀察是獨(dú)立的;(3)樣本要足夠大。只有同時(shí)滿足上面3個(gè)條件,c2配合度檢驗(yàn)的結(jié)果才可以說(shuō)明問(wèn)題。不同分類之間要相互排除,是說(shuō)在歸類時(shí)每個(gè)被試或調(diào)查對(duì)象只能歸為n個(gè)分類中的某一類,而不能同時(shí)屬于兩類甚至更多的類別。就某些分類變量來(lái)說(shuō),例如性別、婚姻狀態(tài)等,每個(gè)受試對(duì)象客觀上只能屬于某個(gè)類別。而對(duì)于另外一些分類變量來(lái)說(shuō),例如在校大學(xué)生所屬專業(yè)變量,每個(gè)受試對(duì)象實(shí)際上可能同時(shí)屬于兩個(gè)專業(yè),在這種情況,也應(yīng)當(dāng)保證每個(gè)受試者只屬于某個(gè)專業(yè)的學(xué)生,只有這樣才符合c2檢驗(yàn)的條件。因此,在c2檢驗(yàn)過(guò)程中,各種類別頻數(shù)之和與被試人數(shù)正好相等。觀察要是獨(dú)立的,意指判斷各類別的標(biāo)準(zhǔn)要一致,也就是說(shuō)每個(gè)受試對(duì)象除了要研究的原因外不能有其他的限制性因素影響其所屬類別。例如,在研究大學(xué)生專業(yè)人數(shù)的分布問(wèn)題時(shí),我們想知道大學(xué)生專業(yè)選擇是否有偏好,此時(shí),每個(gè)受試對(duì)象應(yīng)能夠在n個(gè)專業(yè)中自由選擇,而不能特別設(shè)定某個(gè)專業(yè)只有達(dá)到某一標(biāo)準(zhǔn)時(shí)才能選擇。c2檢驗(yàn)還要求樣本的容量要足夠大,足夠大的一般原則是,樣本大小滿足每種分類的期望頻數(shù)不少于5。如果期望頻數(shù)過(guò)小,c2值計(jì)算易產(chǎn)生過(guò)大的誤差。配合度檢驗(yàn)過(guò)程讓我們以一個(gè)簡(jiǎn)單的例子來(lái)說(shuō)明c2配合度檢驗(yàn)任務(wù)。某大學(xué)要求每個(gè)學(xué)生第一學(xué)年結(jié)束之后,必須在5個(gè)體育項(xiàng)目中選擇一項(xiàng)作為體育課程的學(xué)習(xí)內(nèi)容。某個(gè)學(xué)院的輔導(dǎo)員對(duì)該學(xué)院同學(xué)選擇不同體育項(xiàng)目的人數(shù)感興趣,想知道本院學(xué)生選擇情況與學(xué)校總體情況是否一致。假設(shè)學(xué)校限定每個(gè)同學(xué)只能選擇一項(xiàng),并且選擇是自由的;該假設(shè)保證不同項(xiàng)目群體之間是排斥的,并且選擇不受特殊限制的。表6.1是該學(xué)院同學(xué)選擇的結(jié)果。表6.1某學(xué)院300名同學(xué)選修體育項(xiàng)目人數(shù)體育項(xiàng)目觀測(cè)頻數(shù)網(wǎng)球O1=3羽毛球O2=45乒乓球O3=77籃球O4=90足球O5=85TotalT=300從上表可以看出,籃球是同學(xué)們選擇最多的項(xiàng)目,而網(wǎng)球最少。這種情況是否與全校的情況一致?換句話說(shuō),該學(xué)院的調(diào)查數(shù)據(jù)分布于全校的模式是否匹配呢?表6.2同時(shí)反映出觀測(cè)頻數(shù)和期望頻數(shù)。表中全校的比率pi表示全校所有選修體育項(xiàng)目的同學(xué)中各項(xiàng)目選擇人數(shù)占總?cè)藬?shù)的比率,例如全校中有25%的人選擇了籃球,表中期望頻數(shù)表示按照全校的比率情況計(jì)算出來(lái)的頻數(shù),例如,按照全校25%的比率,該學(xué)院300人中應(yīng)有75人選擇籃球項(xiàng)目。表6.2某學(xué)院300名同學(xué)選修體育項(xiàng)目觀測(cè)頻數(shù)與期望頻數(shù)體育項(xiàng)目觀測(cè)頻數(shù)全校選修比率期望頻數(shù)(pi×T)網(wǎng)球O1=3p1=0.05E1=0.05×300=15羽毛球O2=45p2=0.30E2=0.30×300=90乒乓球O3=77p3=0.25E3=0.25×300=75籃球O4=90p4=0.25E4=0.25×300=75足球O5=85p5=0.15E5=0.15×300=45Total3001.00300從表6.2可以看出,觀測(cè)頻數(shù)與期望頻數(shù)有一些差別。例如,該學(xué)院同學(xué)中選修網(wǎng)球和羽毛球的人數(shù)比期望人數(shù)少,而選修乒乓球、籃球和足球的人數(shù)比期望人數(shù)多?,F(xiàn)在我們可以提出這個(gè)問(wèn)題:上述觀測(cè)頻數(shù)與期望評(píng)述之間的差別是因?yàn)殡S機(jī)抽樣誤差造成,還是確實(shí)存在著統(tǒng)計(jì)上的顯著性?回答這個(gè)問(wèn)題,就需要借助c2配合度檢驗(yàn)了。公式(6.13)定義了c2值,Oi表示各類別觀測(cè)頻數(shù),Ei表示各類別期望頻數(shù)。根據(jù)公式如果觀測(cè)頻數(shù)與期望頻數(shù)之間的差別僅反映出隨機(jī)誤差,那么c2值將相對(duì)較?。蝗绻^測(cè)頻數(shù)期望頻數(shù)之間的差別不足以用隨機(jī)誤差原因來(lái)解釋,那么c2值將會(huì)相對(duì)較大。(6.13)c2值大到什么程度才可以說(shuō)不是隨機(jī)誤差原因能解釋的?也就是說(shuō)c2值大到什么程度才可以拒絕虛無(wú)假設(shè)“觀測(cè)頻數(shù)與某個(gè)總體定義的期望頻數(shù)相匹配”?這個(gè)問(wèn)題的回答需要用到c2分布模型。c2分布是一系列分布,其具體形態(tài)由自由度決定,公式(6.14)是c2配合度檢驗(yàn)的自由度計(jì)算公式,自由度比分類數(shù)少一,即:(6.14)在上述例題里,總共有5個(gè)項(xiàng)目分類,因此自由度為df=4(df=5-1)。有了自由度就可以通過(guò)查c2分布表(附表)確定c2檢驗(yàn)的臨界值,當(dāng)觀測(cè)c2值等于或大于臨界c2值,我們將拒絕虛無(wú)假設(shè)。c2檢驗(yàn)與我們后面將要講到的方差分析一樣,是一個(gè)沒(méi)有方向的,公共性質(zhì)的檢驗(yàn),因此,檢驗(yàn)時(shí)要查c2表的單側(cè)臨界值。c2檢驗(yàn)的結(jié)果不能指明觀測(cè)數(shù)與期望數(shù)差異的具體位置,也就是說(shuō)在哪個(gè)具體類別上觀測(cè)數(shù)與期望數(shù)有顯著差異。將表6.2的數(shù)據(jù)代入公式(6.13),計(jì)算出觀測(cè)c2值為70.17。查自由度為4的c2分布表,得0.05水平的臨界c2值為9.49。觀測(cè)c2值大于臨界c2值,拒絕虛無(wú)假設(shè),接受備擇假設(shè)。統(tǒng)計(jì)結(jié)論是,某學(xué)院學(xué)生選修體育項(xiàng)目的頻數(shù)分布與學(xué)校總體情況不匹配,即不一致。在上面的例題中,根據(jù)總體定義的各分類期望概率不同,各分類的期望頻數(shù)也各不相同。在另外一些研究情境中,我們會(huì)遇到期望頻數(shù)相同的情況。下面舉一例說(shuō)明此種情況的c2配合度檢驗(yàn)問(wèn)題。一位糖果銷售商人想知道,兒童對(duì)紅、綠、藍(lán)、黃4種顏色的糖果包裝紙是否有偏好,他在一大型幼兒園隨機(jī)地調(diào)查了400多名兒童。這400多名兒童對(duì)紅、綠、藍(lán)、黃4種顏色包裝紙選擇結(jié)果是:紅色有78人、綠色有105人、藍(lán)色有98人、黃色有119人。選擇中要求每名兒童只選擇一種自己喜歡的顏色,問(wèn)該調(diào)查結(jié)果是否說(shuō)明兒童有偏好?從總體看,如果兒童不存在偏好,那么各類選擇的期望頻數(shù)應(yīng)一樣,都是100人,即(105+98+78+119)÷4=100。將本題的觀測(cè)頻數(shù)和期望頻數(shù)帶入公式(6.13),計(jì)算觀測(cè)c2值:本例題有4種分類,c2檢驗(yàn)自由度df=k-1=4-1=3。查自由度為3的c2分布表,得0.05水平的臨界c2值為7.82。觀測(cè)c2值大于臨界c2值,拒絕虛無(wú)假設(shè)“觀測(cè)頻數(shù)與期望頻數(shù)匹配”。統(tǒng)計(jì)結(jié)論是,兒童對(duì)4種顏色糖果包裝紙有顯著偏好。從數(shù)據(jù)看,選擇黃色的人數(shù)較多。接下來(lái),我們對(duì)c2匹配度檢驗(yàn)過(guò)程做出總結(jié):(1)提出虛無(wú)假設(shè)“觀測(cè)頻數(shù)與總體定義的期望頻數(shù)匹配或一致”,同時(shí)提出備擇假設(shè)“觀測(cè)頻數(shù)與總體定義的期望頻數(shù)不匹配或不一致”;(2)根據(jù)總體定義情況,計(jì)算出各類別的期望頻數(shù);(3)用c2計(jì)算公式求出觀測(cè)的c2值;(4)用自由度計(jì)算公式,計(jì)算c2分布的自由度df=k-1,根據(jù)自由度查c2表,得出0.05或0.01水平的臨界c2值;(5)比較觀測(cè)c2值和臨界c2值,當(dāng)觀測(cè)c2值大于或等于臨界c2值時(shí),拒絕虛無(wú)假設(shè),反之就接受虛無(wú)假設(shè);(6)寫(xiě)出統(tǒng)計(jì)結(jié)論。獨(dú)立性檢驗(yàn)c2配合度檢驗(yàn)可以處理單個(gè)分類變量的實(shí)驗(yàn)結(jié)果,c2檢驗(yàn)的邏輯同樣可以擴(kuò)展到處理兩個(gè)分類變量的實(shí)驗(yàn)結(jié)果,檢驗(yàn)兩個(gè)分類變量之間是否獨(dú)立,這就是我們將要講的c2獨(dú)立性檢驗(yàn)的問(wèn)題。接下來(lái),讓我們看一個(gè)采用c2獨(dú)立性檢驗(yàn)的簡(jiǎn)單例題,了解獨(dú)立性檢驗(yàn)的具體過(guò)程。為了解大學(xué)生在考研問(wèn)題上是否有男女差異,即考研選擇是否與性別有關(guān),一名學(xué)生管理工作者在其關(guān)心的大學(xué)生群體中,隨機(jī)選取了50名女生和50名男生,并調(diào)查他(她)們是否考研,調(diào)查結(jié)果顯示,女生有35人決定考研,男生有15人決定考研。上述例題的研究涉及性別和考研選擇兩個(gè)分類變量,每個(gè)變量各有2個(gè)分類,其調(diào)查結(jié)果可以整理成一個(gè)交叉表,交叉表的單元數(shù)為兩個(gè)分類變量類別數(shù)的乘積,即2×2=4(單元數(shù))。表6.3反映了本次調(diào)查的結(jié)果。表6.3說(shuō)明c2獨(dú)立性檢驗(yàn)的例題數(shù)據(jù)類別考研不考研總計(jì)女O11=35O12=15R1=50男O21=10O22=40R2=50總計(jì)C1=45C2=55T=100同c2配合度一樣,c2獨(dú)立性檢驗(yàn)也要確定每個(gè)單元的期望頻數(shù)。期望頻數(shù)是假設(shè)兩個(gè)分類變量無(wú)關(guān)情況下,按照調(diào)查得到的各種情況的比例和人數(shù)計(jì)算出來(lái)的,獨(dú)立性檢驗(yàn)各單元期望頻數(shù)的計(jì)算公式是:(6.15)公式中,Ri和Ci表示某一行和某一列觀測(cè)總數(shù),T表示全部觀測(cè)總體,Eij表示某一單元的期望頻數(shù)。根據(jù)期望頻數(shù)計(jì)算公式,我們把各單元的期望頻數(shù)計(jì)算出來(lái),并填入交叉表6.3。表中Oij表示各單元觀測(cè)到的頻數(shù)。如果兩個(gè)變量之間沒(méi)有聯(lián)系,即相互是獨(dú)立的,那么每
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 軟件開(kāi)發(fā)合同管理指南
- 學(xué)校高考獎(jiǎng)金分配方案
- 藝人演出云計(jì)算平臺(tái)維護(hù)服務(wù)協(xié)議
- 度假島洗車場(chǎng)租賃協(xié)議
- 2025版凈水器租賃與環(huán)保產(chǎn)業(yè)合作框架合同3篇
- 2024年酒店用品買賣協(xié)議
- 2025版肥料生產(chǎn)市場(chǎng)渠道拓展與營(yíng)銷策劃合同3篇
- 二零二五年大豆市場(chǎng)價(jià)格波動(dòng)影響分析合同3篇
- 礦山通信合同
- 2024年財(cái)產(chǎn)轉(zhuǎn)讓合同模板
- 知識(shí)創(chuàng)新與學(xué)術(shù)規(guī)范中國(guó)大學(xué)mooc課后章節(jié)答案期末考試題庫(kù)2023年
- 企業(yè)貸款書(shū)面申請(qǐng)書(shū)
- 人教五年級(jí)英語(yǔ)上冊(cè)2011版五年級(jí)英語(yǔ)上冊(cè)《Lesson17》教案及教學(xué)反思
- 交換機(jī)安裝調(diào)試記錄表實(shí)用文檔
- 理性思維作文素材800字(通用范文5篇)
- 應(yīng)急物資清單明細(xì)表
- 房地產(chǎn)估計(jì)第八章成本法練習(xí)題參考
- 《社會(huì)主義核心價(jià)值觀》優(yōu)秀課件
- 《妊娠期糖尿病患者個(gè)案護(hù)理體會(huì)(論文)3500字》
- 《小學(xué)生錯(cuò)別字原因及對(duì)策研究(論文)》
- 便攜式氣體檢測(cè)報(bào)警儀管理制度
評(píng)論
0/150
提交評(píng)論