




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
教育統(tǒng)計學(xué)主講:馬勇瓊教育科學(xué)系第一章緒論一、什么是教育統(tǒng)計學(xué)二、教育統(tǒng)計學(xué)的內(nèi)容三、學(xué)習(xí)教育統(tǒng)計學(xué)的意義四、如何學(xué)好教育統(tǒng)計學(xué)一、什么是教育統(tǒng)計學(xué)〔一〕統(tǒng)計學(xué)的概念客觀現(xiàn)象分:確定現(xiàn)象、不確定現(xiàn)象不確定現(xiàn)象:在相同條件下,可能發(fā)生,也可能不發(fā)生;可能發(fā)生這樣的結(jié)果,也可能發(fā)生那樣的結(jié)果。也稱隨機(jī)現(xiàn)象。如:拋硬幣一般來說,統(tǒng)計學(xué)是研究隨機(jī)現(xiàn)象,統(tǒng)計其規(guī)律性的科學(xué)。〔二〕教育統(tǒng)計學(xué)的概念教育統(tǒng)計學(xué):運(yùn)用數(shù)理統(tǒng)計的原理和方法,來研究教育問題的一門應(yīng)用科學(xué)。教育統(tǒng)計學(xué)是應(yīng)用統(tǒng)計學(xué)的一個分支。二、教育統(tǒng)計學(xué)的內(nèi)容〔一〕描述統(tǒng)計對已獲得的數(shù)據(jù)進(jìn)行整理、概括,顯現(xiàn)其分布特征的統(tǒng)計方法,稱為描述統(tǒng)計。主要研究如何整理心理與教育研究中獲得的大量數(shù)據(jù),描述一組數(shù)據(jù)的全貌,表達(dá)一件事物的性質(zhì),以充分利用數(shù)據(jù)所提供的信息?!捕惩普摻y(tǒng)計推論統(tǒng)計是研究如何通過局部〔樣本〕所提供的信息來推論全局〔總體〕的情形。內(nèi)容包括:總體參數(shù)估計、假設(shè)檢驗這是統(tǒng)計學(xué)上比擬重要且應(yīng)用較多又較困難的一局部。〔三〕實驗設(shè)計實驗者為了揭示實驗中自變量與因變量的關(guān)系,在實驗之前所制訂的實驗方案,稱為實驗設(shè)計。主要研究如何科學(xué)地、經(jīng)濟(jì)地以及更有效地進(jìn)行實驗。作為一個嚴(yán)謹(jǐn)?shù)膶嶒炑芯?,在實驗以前就要對研究的步驟,被試的取樣方法,實驗條件的控制,以及對結(jié)果的統(tǒng)計分析方法等等做出嚴(yán)格的設(shè)計。實驗設(shè)計的內(nèi)容不一樣,統(tǒng)計所用的方法也不一樣以上三局部內(nèi)容,相互聯(lián)系三、學(xué)習(xí)教育統(tǒng)計學(xué)的意義1、統(tǒng)計學(xué)為科學(xué)研究提供一種科學(xué)方法2、教育統(tǒng)計學(xué)是教育科研定量分析的重要工具3、廣闊教育工作者學(xué)習(xí)教育統(tǒng)計學(xué)的具體意義①可以順利閱讀運(yùn)用統(tǒng)計方法進(jìn)行定量分析的科研報告和文獻(xiàn),從中可間接了國外內(nèi)先進(jìn)的研究成果②可以提高教育工作者的科學(xué)性和效率③為學(xué)習(xí)教育測量及教育評價打下根底四、如何學(xué)好教育統(tǒng)計學(xué)㈠克服畏難情緒㈡在學(xué)習(xí)時要注意重點掌握各種統(tǒng)計方法使用的條件㈢克服“統(tǒng)計無用”與“統(tǒng)計萬能”的思想,要注意科研道德,認(rèn)真分析實驗數(shù)據(jù),正確選用統(tǒng)計方法五、統(tǒng)計學(xué)中的幾個根本概念〔一〕隨機(jī)變量隨機(jī)現(xiàn)象:具有以下三種特性的現(xiàn)象,稱為隨機(jī)現(xiàn)象。第一,一次試驗有多種可能結(jié)果,其所有可能結(jié)果是的;第二,試驗之前不能預(yù)料哪一種結(jié)果會出現(xiàn);第三,在相同條件下可以重復(fù)試驗隨機(jī)事件:隨機(jī)現(xiàn)象的每一種結(jié)果叫做一個隨機(jī)事件隨機(jī)變量:表示隨機(jī)現(xiàn)象各種結(jié)果的變量統(tǒng)計處理的變量都是隨機(jī)變量,如學(xué)生的身高、體重、考試成績等,一般用英文大寫字母X、Y等表示〔二〕總體和樣本總體:某一類所欲研究的對象的全體,或指具有某種特征的一類事物的全體。個體:構(gòu)成總體的每個根本單位樣本:從總體中抽出n個個體,這n個個體就組成了樣本。樣本中包含的個體數(shù)目稱為樣本容量,一般用n表示。按容量的多少分為大樣本〔n>30〕,小樣本〔n≤30〕〔三〕統(tǒng)計量和參數(shù)統(tǒng)計量是根據(jù)一組觀察值計算出來的一切量數(shù),它是描述一組數(shù)據(jù)的統(tǒng)計指標(biāo)參數(shù)是描述總體情況的各種統(tǒng)計指標(biāo)區(qū)別:參數(shù)相對于總體而言,統(tǒng)計量相對于樣本而言〔四〕次數(shù)、頻率、概率1、次數(shù):某一隨機(jī)事件在某一類別中出現(xiàn)的數(shù)目,又稱為頻數(shù),一般用符號f表示。如:某班進(jìn)行某測驗,成績?yōu)椋梗胺值墓灿袔讉€,這便是90分這一事件出現(xiàn)的次數(shù)。2、頻率:又稱相對次數(shù),即某一事件的次數(shù)被總的事件數(shù)目除。通常用比例、百分?jǐn)?shù)表示3、概率:某事件在無限次觀察中可能出現(xiàn)的頻率,用符號p表示。第二章數(shù)據(jù)的初步整理第一節(jié)數(shù)據(jù)的來源、種類和統(tǒng)計分類第二節(jié)統(tǒng)計表第三節(jié)統(tǒng)計圖第一節(jié)數(shù)據(jù)的來源、種類和統(tǒng)計分類一、教育統(tǒng)計資料的來源〔一〕經(jīng)常性資料主要指文字記載的資料,包括日常工作記錄和統(tǒng)計報表等。如:教育工作情況記錄、畢業(yè)生登記表〔二〕專題性資料主要指通過專題性的調(diào)查或?qū)嶒炈@得的資料。1、教育調(diào)查教育調(diào)查指在沒有預(yù)定的因子、不施行控制的條件下,對現(xiàn)成的教育方面有關(guān)客觀事實所進(jìn)行的觀察和分析。調(diào)查的方法、種類很多:A、從調(diào)查方法來分,可分為現(xiàn)情調(diào)查、回憶調(diào)查和追蹤調(diào)查;B、從調(diào)查范圍來分,可分為全面調(diào)查和非全面調(diào)查通過教育調(diào)查可以獲得客觀、真實可靠的資料2、教育實驗教育實驗是指在預(yù)定的控制因子影響下,對教育方面有關(guān)客觀事實所進(jìn)行的觀察和分析。一般設(shè)立兩種實驗處理〔控制實驗和對照實驗〕進(jìn)行對照和比擬二、數(shù)據(jù)的種類數(shù)據(jù):隨機(jī)變量的觀察值,用來描述對客觀事物觀察測量結(jié)果的數(shù)值?!惨弧嘲磾?shù)據(jù)的來源分1、計數(shù)數(shù)據(jù):指計算個數(shù)所獲得的數(shù)據(jù)。如:學(xué)生數(shù)、教室數(shù)2、測量數(shù)據(jù):指用一定的工具或一定的標(biāo)準(zhǔn)測量所獲得的數(shù)據(jù)?!捕嘲礈y量水平不同劃分1、比率數(shù)據(jù):具有相等的單位、絕對的零點這一類數(shù)據(jù)可進(jìn)行加、減、乘、除,如身高、體重2、等距數(shù)據(jù):有相等的單位,沒有絕對的零點能加減,不能乘除。如溫度計上的讀數(shù)3、順序數(shù)據(jù):沒有相等的單位,也沒有絕對的零點,但可以進(jìn)行排序。這類數(shù)據(jù)不能進(jìn)行加減乘除如:等級—甲、乙、丙、??;名次—第一名、第二名4、分類數(shù)據(jù):沒有相等的單位和絕對的零點,也不能進(jìn)行排序,它只是把事物按某種標(biāo)準(zhǔn)進(jìn)行分類,對事物有區(qū)分作用〔只能進(jìn)行計數(shù)〕。如:性別、名字〔三〕按數(shù)據(jù)是否具有連續(xù)性劃分1、間斷型隨機(jī)變量的數(shù)據(jù):取值個數(shù)有限的數(shù)據(jù)。通常取整數(shù),數(shù)軸上用點表示這種數(shù)據(jù)的單位是獨立的,兩個單位之間不能再劃分成細(xì)小的單位。如計數(shù)數(shù)據(jù)2、連續(xù)型隨機(jī)變量的數(shù)據(jù):取值個數(shù)無限的數(shù)據(jù)。數(shù)軸上用線表示,所用的數(shù)值,只是表示該連續(xù)變量的中央點。如:連續(xù)變量1是表示0.5~1.499‥50秒表示〔49.5,50.5)67寸是66.5寸以67.499‥寸,即但凡測量時尺寸在66.5~67.499寸這間的數(shù),我們都記為67寸三、數(shù)據(jù)的統(tǒng)計分類數(shù)據(jù)的統(tǒng)計分類是指根據(jù)研究對象的特征,將所得數(shù)據(jù)劃分到各個類別?!惨弧辰y(tǒng)計分類應(yīng)注意的問題1、做好分類前的準(zhǔn)備⑴如果有理由證明某些數(shù)據(jù)受到過失誤差影響,應(yīng)該把它刪去。誤差:隨機(jī)誤差〔沒法控制〕、系統(tǒng)誤差〔有一定方向〕、過失誤差〔明顯歪曲〕但不能隨心所欲的去掉那些不符合自己主觀假設(shè)的數(shù)據(jù)⑵要遵循三個標(biāo)準(zhǔn)差法那么〔3σ法那么〕
,大于或小于3σ那么去掉
2、根據(jù)與被研究對象本質(zhì)有關(guān)的特性來分類;這些作為分類依據(jù)的特性,稱為分類標(biāo)志
3、分類標(biāo)志要明確,前后一致,包括所有數(shù)據(jù)〔二〕性質(zhì)類別和數(shù)量類別1、性質(zhì)類別:按事物的不同性質(zhì)進(jìn)行分類2、數(shù)量類別:依數(shù)值的大小分類,并進(jìn)行排序⑴直接按數(shù)據(jù)大小來排序⑵等級排序:將數(shù)據(jù)按等級大小排列,等級上下根據(jù)事物性質(zhì)來定。方法A、給數(shù)據(jù)定等級:有相同數(shù)據(jù)時,不管相同數(shù)據(jù)有幾個,應(yīng)該將所有相同數(shù)據(jù)所占有的等級相加再平均,作為這幾個數(shù)據(jù)的共同等級B、等級級數(shù)應(yīng)與數(shù)據(jù)個數(shù)相同例:數(shù)據(jù):61、60、60、58、57、57、57、55等級:1〔等〕2.5、2.5、4、6、6、6、8第二節(jié)統(tǒng)計表一、統(tǒng)計表的構(gòu)造和要求〔一〕內(nèi)容1、序號:在表的左上角,如:表2—1,表2.12、名稱〔標(biāo)題〕:一般在表的上方3、標(biāo)目:表格中對統(tǒng)計數(shù)據(jù)分類的工程。標(biāo)目的好壞決定統(tǒng)計表的質(zhì)量。按標(biāo)目在表中上位置分橫標(biāo)目、縱標(biāo)目,必要時,在橫縱標(biāo)目的上方加上適當(dāng)?shù)目倶?biāo)目4、線條:表頭、表尾兩橫線有粗線,左右兩邊不用邊線5、數(shù)字:整齊劃一,整數(shù)超過3位數(shù)要用分位點,有效位數(shù)要一致,小數(shù)點后缺位的要補(bǔ)零,無數(shù)字的用“——”6、表注:補(bǔ)充,不是表的必要組成局部〔二〕要求:簡單明了例:表2.1上海市區(qū)男幼兒20米跑步用時資料來源:引自《華東師范大學(xué)學(xué)報》〔教育科學(xué)版〕1985年第2期第30頁二、統(tǒng)計表的種類〔一〕簡單表:只列出觀察對象的名稱、地點、時序或統(tǒng)計指標(biāo)名稱的統(tǒng)計表〔二〕分組表:只有一個分類標(biāo)志分組的統(tǒng)計表〔三〕復(fù)合表:按兩個或兩個以上標(biāo)志分組的統(tǒng)計表三、次數(shù)分布表〔頻數(shù)分布表〕次數(shù)分布表:對于一組大小不同的數(shù)據(jù)劃出等距的分組區(qū)間(稱為組距),然后將數(shù)據(jù)按其數(shù)值大小列入各個相應(yīng)的組別內(nèi),便可以出現(xiàn)一個有規(guī)律的表式,稱之。〔一〕一般次數(shù)分布表編制步驟:1、求全距:R=Nmax—Nmin2、決定組數(shù)與組距⑴組距常采用2、3、5、10、20等,目的是便于計算分組區(qū)間、組中值⑵據(jù)經(jīng)驗,當(dāng)數(shù)據(jù)數(shù)目大于100時,可分為10—20組,常取12—16組,當(dāng)數(shù)據(jù)數(shù)目較少時,可分為7—9組⑶采用經(jīng)驗公式:當(dāng)數(shù)據(jù)總體分布接近于正態(tài)分布時,用
〔N為數(shù)據(jù)個數(shù),最后K取整數(shù)〕3、決定組限〔列出分組區(qū)間〕⑴最高組區(qū)間應(yīng)包含最大數(shù)據(jù),最低組區(qū)間包含最小數(shù)據(jù)。⑵最高〔最低〕組下限最好是組距的整數(shù)倍⑶書寫時數(shù)據(jù)大的區(qū)間寫在左側(cè)上方一行4、登記次數(shù)5、計算次數(shù)6、抄錄新表〔二〕累加次數(shù)分布表可在一般次數(shù)分布表上再增加一欄可從上往下累加,也可從下往上累加實際累積次數(shù)表示某一組上限以下的次數(shù)相對累積次數(shù)表示為實際累加次數(shù)與最高次數(shù)之比表2.2師大附小二年級80個學(xué)生身高實測數(shù)值表2.3師大附小二年級80個學(xué)生身高的頻數(shù)分布第三節(jié)統(tǒng)計圖一、統(tǒng)計圖的結(jié)構(gòu)統(tǒng)計圖由標(biāo)題、圖號、標(biāo)目、圖形、圖注等項構(gòu)成二、統(tǒng)計圖的類型直條圖、圓形圖、線形圖、頻數(shù)分布圖第三章集中量數(shù)集中量是代表一組數(shù)據(jù)典型水平或集中趨勢的量。它能反映頻數(shù)分布中大量數(shù)據(jù)向某一點集中的情況第一節(jié):算術(shù)平均數(shù)第二節(jié):中數(shù)第三節(jié):眾數(shù)第一節(jié)算術(shù)平均數(shù)一、概念算術(shù)平均數(shù)指觀測數(shù)的總和除以觀測數(shù)的個數(shù)所得的商,又稱均數(shù)、均值。用符號M表示.常用表示總體平均數(shù),表示樣本平均數(shù)式中:X1、X2、X3、‥‥‥Xn為各次觀測數(shù);N為觀測次數(shù)算術(shù)平均數(shù)的性質(zhì):1、X的總和等于平均數(shù)的N倍,2、離均差〔各變量與其均數(shù)之差〕之和為零3、由各局部變量值的均數(shù)和變量值的個數(shù),可以求出全部變量值的均數(shù)4、每一組數(shù)據(jù)都+〔或-〕一個常數(shù),那么所得的平均數(shù)等于原來的平均數(shù)+〔或-〕這個常數(shù)5、一組數(shù)據(jù)中的每一個數(shù)據(jù)都乘以一個常數(shù)C,那么所得的平均數(shù)為原來的平均數(shù)的C倍二、平均數(shù)的計算〔一〕未分組數(shù)據(jù)的算術(shù)平均數(shù)的計算例1:10名學(xué)生的數(shù)學(xué)期考分?jǐn)?shù)為:79、62、84、90、71、76、83、98、77、78,求其算術(shù)平均數(shù)?!捕撤纸M數(shù)據(jù)平均數(shù)計算式中:Xc為各區(qū)間的組中值f為各區(qū)間的次數(shù)N為數(shù)據(jù)的總次數(shù),例2:48個學(xué)生數(shù)學(xué)分?jǐn)?shù)算術(shù)平均數(shù)組中值計算法分組區(qū)間組中值〔XC〕次數(shù)〔f〕f·XC計算95—90—85—80—75—70—65—60—55—50—45—979287827772676257524765777832021582460609574539576201124010447總和483816三、算術(shù)平均數(shù)的意義與應(yīng)用均數(shù)是真值的最好的會計值優(yōu)點:1、反響靈敏2、簡明易解3、較少受抽樣變動的影響缺點:1、易受極端數(shù)據(jù)影響2、出現(xiàn)數(shù)據(jù)模糊不清時,無法計算平均數(shù)適用條件:一組數(shù)據(jù)中每個數(shù)據(jù)都比擬準(zhǔn)確、可靠又同質(zhì);無極端數(shù)值影響;需要通過它計算其它統(tǒng)計量第二節(jié)中數(shù)一、概念中數(shù)是指位于一組數(shù)據(jù)中較大的一半與較小一半中間位置的那個數(shù)。又稱中點數(shù)、中位數(shù),用符號Md表示。中數(shù)可能是數(shù)據(jù)中的某一個,也可能根本不是原有的數(shù)。如果將數(shù)據(jù)依大小順序排列,中數(shù)恰于中間,它將數(shù)據(jù)的數(shù)目分成較大的一半和較小的一半。二、中數(shù)的計算方法〔一〕原始數(shù)據(jù)計算法首先將數(shù)據(jù)從小到大排列,位置在此序列中間的數(shù)據(jù)就是中數(shù)。1、中間的個數(shù)不是重復(fù)數(shù)⑴當(dāng)數(shù)據(jù)個數(shù)為奇數(shù)時,第個數(shù)據(jù)為中數(shù)例3:3、5、10、7、6,求中數(shù)⑵當(dāng)數(shù)據(jù)個數(shù)為偶數(shù)時,第個數(shù)與第+1個數(shù)的平均數(shù)為中數(shù)例4:求以下8個數(shù)的中數(shù)2、8、5、19、3、15、10、7解:把這8個數(shù)依大小排列為:2、3、5、7、8、10、15、19中數(shù)=〔7+8〕÷2=7.52、位于中間位置的幾個數(shù)據(jù)為重復(fù)數(shù)時:
把這個重復(fù)數(shù)看作是連續(xù)數(shù)并且讓這幾個重復(fù)數(shù)均分這個連續(xù)數(shù)所占領(lǐng)的區(qū)間,計算出位于上、下各個數(shù)據(jù)的分界線位置的數(shù)為中數(shù)。例5:求2、3、5、5、7、7、7、11、13的中數(shù)解:N/2是4.5,序列中上下各4.5的那一點恰好是第一個數(shù)7的中點,可將連續(xù)數(shù)7理解為:6.5~7.5之間有三個數(shù)據(jù)分布其中,而三個7是均勻分布在這區(qū)間之內(nèi)的,如圖:Md=〔6.5+6.83〕/2=6.67例6:求2、3、5、5、7、7、7、11、13、15的中數(shù)〔二〕次數(shù)分布表求中數(shù)方法式中:Ld=中數(shù)所在組的精確下限;Fb=中數(shù)所在組精確下限以下的觀測值的個數(shù)fMd=中數(shù)所在組內(nèi)的觀測值個數(shù)N=分布中觀測值的總個數(shù);i=組距La=中數(shù)所在組的精確上限;Fa=中數(shù)所在組精確上限以上的觀測值的個數(shù)例7:48個學(xué)生數(shù)學(xué)分?jǐn)?shù)中位數(shù)計算法分組區(qū)間次數(shù)〔f〕累積次數(shù)(cf)計算中位數(shù)95—90—85—80—75—70—65—60—55—50—45—6577783202148423730231685331⑴N/2=48/2=24⑵第與第+1個數(shù)中間即中數(shù)所在組區(qū)間是79.5—84.5⑶中數(shù)所在組以下的次數(shù)和Fb=23⑷fMd=7,i=5⑸利用公式〔3-3〕計算中數(shù):N=48
注意:當(dāng)由小往大計算中數(shù)時,如果小于某一組下限的累積頻數(shù)正好等于總次數(shù)的一半,那么該組的下限就是中數(shù);當(dāng)由大往小計算中數(shù)時,大于某一組上限的累積頻數(shù)正好等于總次數(shù)的一半,那么該組的上限就是中數(shù)。三、中數(shù)的意義和作用優(yōu)點:計算簡單、容易理解,適用于某些特殊情況缺點:反響不靈敏,受抽樣影響較大,不如平均數(shù)穩(wěn)定;對中數(shù)不能做出進(jìn)一步的代數(shù)運(yùn)算應(yīng)用:1、當(dāng)一組數(shù)據(jù)中出現(xiàn)兩極端數(shù)目時2、當(dāng)個別數(shù)據(jù)為清楚時3、當(dāng)需要快速估計一組數(shù)據(jù)的代表值時第三節(jié)眾數(shù)一、眾數(shù)的概念〔密集數(shù)〕眾數(shù)是指在一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個數(shù)據(jù)。用Mo表示二、眾數(shù)的求法〔一〕直接觀察求眾數(shù)1、原始數(shù)據(jù)中,次數(shù)出現(xiàn)最多的數(shù)值,即為眾數(shù)例8:求3、4、5、5、7、5的眾數(shù)2、次數(shù)分布表中,次數(shù)最多的一組的組中值為眾數(shù)〔二〕用公式求眾數(shù)1、皮爾遜經(jīng)驗法〔當(dāng)分布接近正態(tài)時使用〕Mo=3Md-2M〔3—5〕2、金氏補(bǔ)插法〔當(dāng)分布呈偏態(tài)時使用〕式中:LMo=眾數(shù)所在組的精確下限fa=包含眾數(shù)所在組的上一組的次數(shù)fb=包含眾數(shù)所在組的下一組的次數(shù)三、眾數(shù)的意義和應(yīng)用優(yōu)點:簡單明了缺點:1、不穩(wěn)定,受分組影響2、不靈敏,較少受極端數(shù)據(jù)影響3、不能做出進(jìn)一步代數(shù)運(yùn)算應(yīng)用:1、當(dāng)需要快速估計一組數(shù)據(jù)的代表值時2、當(dāng)次數(shù)分布中有極端數(shù)據(jù)時〔一般用中數(shù)〕3、當(dāng)一組數(shù)據(jù)中出現(xiàn)不同質(zhì)的情況時,可用眾數(shù)來表示典型情況。如:工資收入、學(xué)生成績等常以次數(shù)最多者為代表。四、平均數(shù)、中數(shù)、眾數(shù)的關(guān)系1、在正態(tài)分布中,三者重合:M=Md=Mo2、在偏態(tài)分布中,M-Md=(M-Mo)÷3Md居中,M與Md距離較近,而Mo與Md距離較遠(yuǎn)練習(xí):以下數(shù)據(jù),使用何種集中量數(shù)表示集中趨勢,其代表性更好?并計算出來。①4、5、6、6、7、29②3、4、5、5、7、5③2、3、5、6、7、8、9第四章差異量數(shù)第一節(jié)方差和標(biāo)準(zhǔn)差第二節(jié)其它差異量數(shù)差異量數(shù):描述一組數(shù)據(jù)的變異量或者離中趨勢的統(tǒng)計量集中量數(shù)指量尺上的一點,差異量數(shù)是量尺上的一段距離。一組數(shù)據(jù)集中量的代表性如何,可由表示差異情況的量數(shù)來說明。差異量數(shù)愈小,那么集中量數(shù)的代表性愈大;反之,那么代表性愈小。例:甲、乙、丙三個班學(xué)生各50人,其數(shù)學(xué)的平均成績各為75分,但甲班最高成績?yōu)?5分,最低分為45分,乙班最高成績?yōu)?5分,最低分為65分,丙班最高成績?yōu)?8分,最低分為73分→三個班的成績并不相同第一節(jié)方差和標(biāo)準(zhǔn)差一、方差和標(biāo)準(zhǔn)差的概念方差是指離差平方的算術(shù)平均數(shù)。即每個數(shù)據(jù)與該組數(shù)據(jù)平均數(shù)之差乘方后的均值。〔〕式中:X表示原數(shù)據(jù);表示數(shù)據(jù)平均數(shù)N為數(shù)據(jù)總數(shù)目;〔X-〕表示離差方差的平方根為標(biāo)準(zhǔn)差:標(biāo)準(zhǔn)差的值越大,說明這組數(shù)據(jù)的離散程度越大,即數(shù)據(jù)越參差不齊,分布范圍越廣;反之,那么說明數(shù)據(jù)越集中整齊,分布范圍小。二、方差和標(biāo)準(zhǔn)差的計算〔一〕由未分組數(shù)據(jù)求方差和標(biāo)準(zhǔn)差1、經(jīng)由平均數(shù)來求〔定義公式計算法〕例1:求6、5、7、4、6、8的方差、標(biāo)準(zhǔn)差1、經(jīng)由平均數(shù)來求〔定義公式計算法〕解:2、原始數(shù)據(jù)計算法上例1:3、次數(shù)分布表計算法式中:Xc為組中值;f為各組次數(shù)或者:式中:AM為估計平均數(shù)Xc為組中值f為各組次數(shù)為組距例2:練習(xí):48個學(xué)生數(shù)學(xué)分?jǐn)?shù)方差、標(biāo)準(zhǔn)差的計算分?jǐn)?shù)XCfdfdfd2計算95—90—85—80—75—70—65—60—55—50—45—
65777832021
分組區(qū)間XC次數(shù)〔f〕dfdfd2計算95—90—85—80—75—70—65—60—55—50—45—97928782777267625752476577783202143210-1-2-3-4-5-624151470-8-6-60-10-6964528708121805036
=5
三、方差和標(biāo)準(zhǔn)差的用途及優(yōu)缺點優(yōu)點:1、反響靈敏2、受抽樣變動影響較小,較穩(wěn)定3、適合于進(jìn)一步代數(shù)運(yùn)算缺點:不太易理解,容易受兩極端數(shù)值影響應(yīng)用:是描述一組數(shù)據(jù)離散程度的最好指標(biāo)四、由各小組的方差求總方差〔4—9〕式中:為各小組方差;為各組次數(shù)為總平均數(shù);為各小組的平均數(shù)例3:某年級4個班,其某科成績?nèi)缦拢阂话啵?5人,平均成績80分,標(biāo)準(zhǔn)差8分;二班:40人,平均成績75分,標(biāo)準(zhǔn)差10分;三班:40人,平均成績78分,標(biāo)準(zhǔn)差9分;四班:37人,平均成績70分,標(biāo)準(zhǔn)差10分;求四個班的平均成績及標(biāo)準(zhǔn)差解:⑴平均成績⑵總標(biāo)準(zhǔn)差:五、標(biāo)準(zhǔn)差的應(yīng)用〔一〕差異系數(shù)也稱變異系數(shù)、相對標(biāo)準(zhǔn)差,用CV表示式中:或S為某樣本的標(biāo)準(zhǔn)差為該樣本的算術(shù)平均數(shù)百分制的考試成績標(biāo)準(zhǔn)差一般要求在5~35之間CV的用途:1、當(dāng)兩種單位不同時;2、單位相同但平均數(shù)差異較大時〔以上兩種情況只能用差異系數(shù)來比擬離散程度〕CV的應(yīng)用條件:1、測量的數(shù)據(jù)要保證具有等距的尺度2、測量工具應(yīng)具備絕對零點3、CV不能進(jìn)行統(tǒng)計推論,只能用于一般的相對差異量的描述例4:某小學(xué)一年級學(xué)生的平均體重為25公斤,體重的標(biāo)準(zhǔn)差是3.7公斤,平均身高110厘米,標(biāo)準(zhǔn)差為6.2厘米,問體重與身高的離散程度哪個大?例5:通過同一個測驗,一年級的學(xué)生的平均分?jǐn)?shù)為60分,標(biāo)準(zhǔn)差為4.02分,五年級學(xué)生的平均分?jǐn)?shù)為80分,標(biāo)準(zhǔn)差為6.04分,問這兩個年級的測驗分?jǐn)?shù)中哪一個分散程度大?〔二〕標(biāo)準(zhǔn)分?jǐn)?shù)〔Z分?jǐn)?shù)〕是以標(biāo)準(zhǔn)差為單位表示一個分?jǐn)?shù)在團(tuán)體中所處位置的相對位置量數(shù)。標(biāo)準(zhǔn)分的概念:廣義:有固定的平均數(shù)與標(biāo)準(zhǔn)差的分?jǐn)?shù),如高考的平均分為500,標(biāo)準(zhǔn)差為100狹義:平均數(shù)為0,標(biāo)準(zhǔn)差為1的Z分?jǐn)?shù)注意:Z分?jǐn)?shù)表示其原分?jǐn)?shù)在以平均數(shù)為中心時的相對位置,不是表示一組數(shù)據(jù)的特征例6:某班平均成績?yōu)?0分,標(biāo)準(zhǔn)差為3分,甲生得94.2分,乙生得89.1分,求甲乙二學(xué)生的Z分?jǐn)?shù)各是多少?解:解釋:甲生的成績高于平均數(shù)1.4個標(biāo)準(zhǔn)差,乙生的成績低于平均數(shù)0.3個標(biāo)準(zhǔn)差Z分?jǐn)?shù)的性質(zhì):1、Z分?jǐn)?shù)的平均數(shù)為0,標(biāo)準(zhǔn)差為12、線性Z分?jǐn)?shù)不改變原始分?jǐn)?shù)的分布形態(tài),〔單科〕Z分?jǐn)?shù)保持原始分的大小順序不變。3、Z的范圍通常在-3與+3之間Z分?jǐn)?shù)的功用:1、比擬不同的觀察值在各自分?jǐn)?shù)分布中的相對位置2、對不同質(zhì)的觀察值求和3、任何其他標(biāo)準(zhǔn)分的轉(zhuǎn)換,都要先將原始分轉(zhuǎn)換為Z分?jǐn)?shù)練習(xí):在一次算術(shù)測驗中,在一次語文測驗中,問甲生在兩次測驗中哪一次成績在班中的位置較高?解:答:兩次測驗中甲生的算術(shù)能力成績在班中的位置較高。2、高考甲、乙兩名考生的成績比擬:如果按總分錄取那么應(yīng)取乙生,假設(shè)按標(biāo)準(zhǔn)分?jǐn)?shù)錄取那么應(yīng)取甲生。因為各科成績難易程度不同,不等價,故用Z分?jǐn)?shù)合成更科學(xué)合理由Z分?jǐn)?shù)到其他標(biāo)準(zhǔn)分的轉(zhuǎn)換例如:韋克斯勒智力量表:IQ=15Z+100高考標(biāo)準(zhǔn)分為:Y=100Z+500高考標(biāo)準(zhǔn)分的平均分、標(biāo)準(zhǔn)差確實定:先確定高考標(biāo)準(zhǔn)分的最高分為900分,最低分為100,中間分?jǐn)?shù)500定為平均數(shù),平均數(shù)與最高或最低分相差400。由于高考人數(shù)眾多,Z可定為-4~+4。由SYZ=400可得SY=100所以,高考標(biāo)準(zhǔn)分的平均分是500,標(biāo)準(zhǔn)差是100,最高分900,最低分為100。根本公式:Y=100Z+500討論:高考標(biāo)準(zhǔn)分的看法由于高考各科的標(biāo)準(zhǔn)差不一樣,高考標(biāo)準(zhǔn)分總分可能會改變原始分總分的順序;在標(biāo)準(zhǔn)差小的科目上,原始分?jǐn)?shù)上下對標(biāo)準(zhǔn)分總分影響很大;高考標(biāo)準(zhǔn)分的局限:對于四平八穩(wěn)、均衡開展的學(xué)生有利,但可能埋沒了某方面的特長生;一般來說,原始分處于中間分?jǐn)?shù)段的〔平均分附近的分?jǐn)?shù)〕,標(biāo)準(zhǔn)分的增減量不大,而原始分為高、低分的,標(biāo)準(zhǔn)分的增減量較大,這樣,難于估分;標(biāo)準(zhǔn)分照顧到全面開展,忽略個體、特長生的開展多科成績的標(biāo)準(zhǔn)分線性合成A、單科高考標(biāo)準(zhǔn)分的計算1、求出各科原始分的平均數(shù)、標(biāo)準(zhǔn)差Sj,由高考原始分,算出考生單科Z分?jǐn)?shù)2、求考生單科標(biāo)準(zhǔn)分:B、綜合分的計算1、求每個考生的單科標(biāo)準(zhǔn)分的平均分:2、求Yi分?jǐn)?shù)的平均數(shù)Y,標(biāo)準(zhǔn)差Sy,然后,求每個考生的綜合Z分?jǐn)?shù)3、求綜合分第二節(jié)其它差異量數(shù)一、全距〔兩極差〕:二、平均差:第五章正態(tài)分布一、正態(tài)分布的密度函數(shù)二、正態(tài)曲線表的編制與使用三、正態(tài)分布理論在測驗上的應(yīng)用正態(tài)分布也稱常態(tài)分布或常態(tài)分配,是連續(xù)隨機(jī)變量概率分布的一種,它是1733年由阿伯拉罕·德莫弗爾發(fā)現(xiàn)的,其他幾位學(xué)者如拉普加斯·高斯對正態(tài)分布的研究也做了奉獻(xiàn),故有時稱正態(tài)分布為高斯分布。正態(tài)分布的密度函數(shù)式中:Y為概率密度,即正態(tài)分布上的縱坐標(biāo);π是圓周率3.14159······;e是自然對數(shù)之底2.71828······;X為隨機(jī)變量,取值-∞<X<∞;μ為理論上的平均數(shù),σ為理論上的標(biāo)準(zhǔn)差所有的正態(tài)分布都可通過轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)分布根據(jù)Z分?jǐn)?shù)的性質(zhì)可知,標(biāo)準(zhǔn)正態(tài)分布的μ=0,б=1標(biāo)準(zhǔn)正態(tài)分布通常寫作N(0,1)正態(tài)分布,其密度函數(shù)為:Y為概率密度:相應(yīng)于各Z值的Y值,可由正態(tài)分布表查得標(biāo)準(zhǔn)正態(tài)曲線的特點:1、曲線在Z=0處為最高點,Y值最大,Y=0.39892、曲線以Z=0為中心,雙側(cè)對稱,曲線下面積為1,對稱軸左右各為0.53、曲線從最高點向左右緩慢下降,并無限伸延,但永不與基線相交,即Y值永不等于04、曲線從最高點向左右伸延時,在正負(fù)1個標(biāo)準(zhǔn)差之內(nèi),既向下又向內(nèi)彎;從正負(fù)1個標(biāo)準(zhǔn)差開始,既向下又向外彎,即拐點位于正負(fù)1個標(biāo)準(zhǔn)差處;5、標(biāo)準(zhǔn)正態(tài)分布曲線下,標(biāo)準(zhǔn)差與概率〔面積〕有一定的數(shù)量關(guān)系如:d(-σ<μ<σ)=68.28%d(-1.96σ<μ<1.96σ)=95%(正負(fù)1.96個標(biāo)準(zhǔn)差之間,包含總面積的95%)d(-2.58σ<μ<2.58σ)=99%二、正態(tài)曲線表的編制與使用〔正態(tài)分布表〕〔一〕表由三欄組成:Z、Y、P。其中Z服從正態(tài)分布μ=0,σ=1[即Z~N〔0,1〕]第一欄為Z:橫坐標(biāo)上某一點與平均數(shù)的差度,以標(biāo)準(zhǔn)差為單位,一般標(biāo)以Z或第二欄為Y:概率密度值,即某一Z分?jǐn)?shù)點上的曲線縱坐標(biāo)的高度第三欄為P:概率值,即不同Z分?jǐn)?shù)點與平均數(shù)之間的面積與總面積之比〔二〕使用1、Z值求概率(1)求(0,Z)區(qū)間面積的概率→直接查表例:P{0<Z<1}P{-1.96<Z<0}=0.34134=0.47500(2)求兩個Z值之間的面積→等于兩個概率的和與差(3)求Z值以上、以下的概率P{Z>1.96}=0.50-P{0<Z<1.96}=0.5-0.475=0.025P{Z<1}=0.50+P{0<Z<1}=0.50+0.3413=0.8413例:P{-1<Z<1}2、概率值〔P〕求Z值〔1〕從平均數(shù)開始的概率值,求Z值→直接查表例:求Z=0以下的0.25面積可到達(dá)的Z值→Z=-0.67〔2〕兩端概率,求Z值例:求上端0.05概率分界點的Z值0.05=0.5-P{0<Z<x}P{0<Z<x}=0.5-0.05=0.45Z=1.65(3)曲線下中央局部的概率求Z值例:求曲線下中央99%的面積到達(dá)的Z值界限0.99÷2=0.495Z=2.58Z=±2.583、概率值或Z值求縱線高Y例:求將曲線下的面積劃分為0.6與0.4兩局部之處的曲線高度.查表P=0.5-0.4=0.1所對應(yīng)的Y值Y=0.386674、服從一般正態(tài)分布的隨機(jī)變量的概率求解不能直接查表,要先將原始分?jǐn)?shù)轉(zhuǎn)換成Z分?jǐn)?shù)例1:X服從正態(tài)分布,μ=168,σ=12,求P{X>187.74}例2:某年齡兒童智商服從μ=100,σ=13的正態(tài)分布,求P{87<X<113}5、內(nèi)插法例1:求Z=0.6745時的P值解:查表,Z1=0.67,P1=0.24857;Z2=0.68,P2=0.25175P=0.24857+(0.25175-0.24857)×〔0.6745-0.67〕÷(0.68-0.67)=0.25018例2:P=0.25,求Z練習(xí):某班48個學(xué)生,語文測驗分?jǐn)?shù)假設(shè)呈正態(tài)分布,其平均分為80分,標(biāo)準(zhǔn)差為10,問:〔1〕從理論上說70分至88分之間應(yīng)當(dāng)在多少人?〔2〕包括中間75%的個案的分?jǐn)?shù)界限是多少分?〔3〕在平均數(shù)上下多少分中間包括95%的學(xué)生?解:〔1〕P{70<X<80}=P{(70—80)/10<Z<(88-80)/10}=P{-1<Z<0.8}=0.3413+0.2881=0.6294理論上的人數(shù)為:48×0.6294=30.21(人)(2)0.75÷2=0.375,查表得Z=1.15∴中央75%面積對應(yīng)的Z值為Z=±1.15將Z分?jǐn)?shù)轉(zhuǎn)換成原始分?jǐn)?shù),得(3)0.95÷2=0.475,查表,得Z=1.96將Z分?jǐn)?shù)轉(zhuǎn)換成原始分?jǐn)?shù),得X=±1.96×10+80X1=99.6X2=60.4三、正態(tài)分布理論在測驗上的應(yīng)用〔一〕將原始分?jǐn)?shù)轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù)〔二〕確定錄取分?jǐn)?shù)線如高考錄取分?jǐn)?shù)線確實定:先求出錄取比率作為正態(tài)分布上端的面積,查表求出Z值,由〔三〕確定等級評定人數(shù)1、6個標(biāo)準(zhǔn)差除以分組數(shù),得到每一個等級應(yīng)占的區(qū)間2、確定各等級應(yīng)占區(qū)間的上、下距〔Z分?jǐn)?shù)界限〕3、查表求各等級所占比例4、各等級比例〔面積〕乘以總?cè)藬?shù),即為各等級人數(shù)(四)等級評定數(shù)量化例:把100人在某能力上分成5個等距的等級,各等級應(yīng)有多少人解:6σ÷5=1.2σ∴每一等級應(yīng)占1.2個標(biāo)準(zhǔn)差的距離,從Z=0至Z=±0.6的距離作為中間等級(三等)查表求得:P1=P5=P{1.8<Z}=0.5-0.4641=0.0359P2=P4=P{0.6<Z<1.8}=0.4641-0.2258=0.2383P3=P{-0.6<Z<0.6}=0.22575×2=0.4515學(xué)生人數(shù):1等、5等:100×0.0359=3.59≈4(人)2等、4等:100×0.2383≈24(人)3等:100×0.4515≈44(人)第六章抽樣分布及總體
平均數(shù)的推斷第一節(jié)抽樣分布第二節(jié)總體平均數(shù)的估計第三節(jié)假設(shè)檢驗的根本原理第四節(jié)總體平均數(shù)的顯著性檢驗第一節(jié)抽樣分布一、抽樣分布的概念區(qū)分以下三種不同性質(zhì)的分布:總體分布:總體內(nèi)個體數(shù)值的頻數(shù)分布樣本分布:樣本內(nèi)個體數(shù)值的頻數(shù)分布抽樣分布:某一種統(tǒng)計量的概率分布抽樣分布的形態(tài):正態(tài)分布、t分布、x2分布、F分布二、隨機(jī)抽樣既然要用樣本代表總體,那么樣本必須具有代表性→隨機(jī)抽樣〔一〕單純隨機(jī)抽樣每個個體被抽到的時機(jī)均等,并且在抽取一個個體之后總體內(nèi)成分不變。1、抽簽法:將每個個體編上號,寫在簽上,混合后從中抽取2、隨機(jī)數(shù)目表法〔二〕機(jī)械抽樣〔三〕分層抽樣〔四〕整群抽樣三、抽樣誤差如果抽樣時,不遵循隨機(jī)原那么,固然不能代表總體。那么,在抽樣過程中嚴(yán)格執(zhí)行隨機(jī)原那么,根據(jù)樣本算出來的統(tǒng)計數(shù),是否與總體參數(shù)完全相同呢?答復(fù)是否認(rèn)的。即使抽取一切可能個樣本,計算出來的某種統(tǒng)計量的值與總體相應(yīng)參數(shù)的真值,大多也是不相同的。因為總體中各個個體存在差異,每次抽樣可能多抽到一些較大或較小的個體,從而造成統(tǒng)計量與參數(shù)有所不同。這種由抽樣而引起的樣本統(tǒng)計數(shù)與總體參數(shù)之間的差異,叫抽樣誤差。這種誤差在抽樣研究中是不可防止的,但只要樣本是隨機(jī)抽取的,抽樣誤差是隨機(jī)的,我們就可以用統(tǒng)計方法來估計其大小,這與錯誤不同。錯誤是由實驗條件造成的〔如技術(shù)錯誤或儀器不準(zhǔn)〕,這是可以防止的。四、標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤是具體描述抽樣誤差的一種指標(biāo)某種統(tǒng)計量在抽樣分布上的標(biāo)準(zhǔn)差稱為該種統(tǒng)計量的標(biāo)準(zhǔn)誤。例:樣本平均數(shù)的標(biāo)準(zhǔn)誤:平均數(shù)抽樣分布的標(biāo)準(zhǔn)差。從同一總體中隨機(jī)抽取同樣大小樣本時,由于抽樣誤差的存在,所得各樣本數(shù)有大有小。如果總體中各變值是呈正態(tài)分布的,那么所抽得的許多樣本平均數(shù)是以總體均數(shù)為中心呈正態(tài)分布,以它們作為變量值,那么可求得說明樣本平均數(shù)離散情況的標(biāo)準(zhǔn)差,為了與一般變量值的標(biāo)準(zhǔn)差相區(qū)別,給它一個專用名詞,叫做標(biāo)準(zhǔn)誤,符號為或這時〔6—1〕同樣,標(biāo)準(zhǔn)差抽樣分布的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)誤;相關(guān)系數(shù)抽樣分布的標(biāo)準(zhǔn)差稱為相關(guān)系數(shù)的標(biāo)準(zhǔn)誤。五、平均數(shù)抽樣分布的幾個定理(P.100)第二節(jié)總體平均數(shù)的參數(shù)估計一、總體參數(shù)估計的根本原理根據(jù)樣本統(tǒng)計量對相應(yīng)總體參數(shù)所作的估計叫總體參數(shù)估計〔一〕點估計定義:用某一樣本統(tǒng)計量的值,亦即線上的一個點作為估計值以估計總體參數(shù)。例:對總體平均數(shù)μ的估計,用樣本平均數(shù);對總體方差σ2的估計,常用樣本方差S2一個良好的估計量的特性:1、無偏性用統(tǒng)計量來估計總體參數(shù)一定會有誤差,有的偏大,有的偏小,不可能恰恰相同。這里說的無偏性是指如果用多個樣本的統(tǒng)計量作為總體參數(shù)的估計值時,其偏差的平均數(shù)為0,那么這種統(tǒng)計量就是總體參數(shù)的無偏估計量。如果用某個統(tǒng)計量估計總體的誤差平均數(shù)大于或小于0,這個統(tǒng)計量就是有偏估計量例:數(shù)理統(tǒng)計證明,樣本平均數(shù)是總體均數(shù)μ的無偏估計量;樣本標(biāo)準(zhǔn)差S是總體標(biāo)準(zhǔn)差σ的有偏估計量,一般偏小,σ的無偏估計量是Sn-1.2、有效性當(dāng)總體參數(shù)不止有一種無偏估計量時,某一種估計量的一切可能樣本值的方差小者為有效性高,方差大者為有效性低。例:、Mo、Md都是μ的無偏估計,但只有的變異最小,故作為總體參數(shù)μ的估計值最有效,這也是為什么在統(tǒng)計分析時,Mo、Md不常用的原因.3、一致性當(dāng)樣本容量無限增大時,估計值越來越接近它所估計的總體參數(shù).當(dāng)N→∞時,→μ,S2n-1→σ2〔二〕區(qū)間估計區(qū)間估計是用數(shù)軸上的一段距離表示未知參數(shù)可能落入的范圍,它雖不具體指出總體參數(shù)等于什么,但能指出總體的未知參數(shù)落入某一區(qū)間的概率有多大。例如,〔P.104〕我們不說全市11000個考生語文的平均分為62分,而說他們的平均分可能落在60至65分之間,同時還要說明總體均數(shù)μ落在這一區(qū)間的概率有多大。成功估計的概率=置信區(qū)間=置信水平=1-α〔α為置信度、顯著性水平,一般α取0.05、0.01,它指犯錯誤的概率)例:.95置信區(qū)間是指總體參數(shù)落在該區(qū)間之內(nèi),估計正確的概率為95%,而出現(xiàn)錯誤的概率為5%〔α=.05〕0.95置信區(qū)間=0.05顯著性水平的置信區(qū)間=0.05置信度的置信區(qū)間顯著性水平在假設(shè)檢驗中,還指拒絕虛無假設(shè)時可能出現(xiàn)的犯錯誤的概率水平現(xiàn)以總體平均數(shù)區(qū)間估計為例,說明總體參數(shù)估計的一般原理如果我們從同一總體中抽取許屢次樣本,求得許多平均數(shù)〔〕,這許多平均數(shù)所構(gòu)成的次數(shù)分布為正態(tài)分布〔N很大〕,這時這個正態(tài)分布的根本構(gòu)成分子不再是X,而是,其離散情形的量數(shù)不是σ,而是標(biāo)準(zhǔn)誤〔或〕,這時,~N〔0,1〕根據(jù)正態(tài)分布的特性,那么有P〔<Zα/2〕=1-αP(-Zα/2·<μ<+Zα/2·)=1-α(6—2〕Zα/2為查〔1-α〕/2概率所得到的Z分?jǐn)?shù)值,也可寫為Z〔1-α〕/2例:令α=0.05,那么查正態(tài)分布表,有Z=1.96,代入公式〔6—2〕,那么有P(-1.96·<μ<+1.96·)=0.95即μ落入平均數(shù)上下1.96個標(biāo)準(zhǔn)差范圍內(nèi)的概率為95%,可寫為:我們有95%的把握保證總體平均數(shù)μ在區(qū)間[-1.96·,+1.96·]內(nèi)總體參數(shù)估計的一般程序:1、計算估計量;2、確定隨時機(jī)變量的分布形式,根據(jù)置信水平〔1-α〕查臨界值λ;3、計算標(biāo)準(zhǔn)誤;4、求出置信區(qū)間[-λ·SE,+λ·SE]二、總體平均數(shù)的區(qū)間估計〔一〕總體方差σ2,對總體平均數(shù)μ的區(qū)間估計1、總體正態(tài)分布,不管n的大小,——正態(tài)分布2、總體非正態(tài)分布,n相當(dāng)大時〔n>30〕——漸近正態(tài)分布——用公式〔6-2〕計算這時,,查正態(tài)表,確定Zα/2,一般情況下顯著性水平α確定為0.05或0.01,因此其Zα/2為1.96或2.58,代入公式〔6—2〕可求得其置信區(qū)間例1:某校10歲女童身高σ=6.25厘米,呈正態(tài)分布,現(xiàn)從某校隨機(jī)抽取27名10歲女童,測得平均身高為134.2厘米,試估計該校10歲女童平均身高0.99的置信區(qū)間.解:∵σ=6.25=134.2n=27α=0.01查正態(tài)表得,Z0.01/2=2.58
∴P(134.2-2.58×≤μ≤134.2+2.58×)=1-0.01P(131.097≤μ≤137.303)=0.9910歲女童平均身高0.99的置信區(qū)間為[131.097,137.303]例2:有一個49名學(xué)生的班級,某學(xué)科歷年考試成績的標(biāo)準(zhǔn)差為5分,又知今年某次考試成績平均分是85分,試推論該班某學(xué)科學(xué)習(xí)的真實成績.解:∵σ=5=85n=49令α=0.05,查正態(tài)表得,Z0.05/2=1.96∴P(85-1.96×≤μ≤85+1.96×)=1-0.05P(83.6≤μ≤86.4)=0.95即該班某科成績的真實分?jǐn)?shù)在83.6—86.4之間,估計正確的概率為0.95(二)σ未知條件下總體平均數(shù)的區(qū)間估計1、總體正態(tài)分布時,不管n之大?。?、總體非正態(tài)分布,但n>30時樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計量呈t分布,方法:查t分布表,自由度df=N-1〔自由度是指總體參數(shù)估計量中變量值獨立自由變化的個數(shù)〕標(biāo)準(zhǔn)誤:(6—3)〔可用〕或因為此時總體方差未知,故可用樣本標(biāo)準(zhǔn)差S來代替σ,假設(shè)用樣本的無偏估計方差計算,那么如果計算的是樣本的有偏估計方差S2那么置信區(qū)間為:-tα/2·<μ<+tα/2·或P〔-tα/2·<μ<+tα/2·〕=1-α〔6—5〕〔tα/2為某種自由度的α顯著性水平的t的臨界值〕查t值表注意是雙側(cè)或是單側(cè)概率例3:某班49人,期末考試成績?yōu)?5分,標(biāo)準(zhǔn)差為6,假設(shè)此項考試能反映學(xué)生的學(xué)習(xí)水平,試推論該班學(xué)生學(xué)習(xí)的真實成績。解:此題總體方差未知,分?jǐn)?shù)分布難于保證正態(tài),但n>30,故可查t分布表進(jìn)行計算,并能夠推論查t(40).05/2=2.021(取df=40的值,因為表中無df=48的t.05/2值).95置信區(qū)間為:85-2.021×0.866<μ<85+2.021×0.86683.25<μ<86.75∴該班學(xué)生的真實成績在83.25——86.75之間。作此結(jié)論正確的概率為95%例3的情況要比例2的情況在實際研究的應(yīng)用中較多出現(xiàn)。故方差未知情況的區(qū)間估計是經(jīng)常被用到的一種統(tǒng)計方法小結(jié):總體平均數(shù)估計:1??傮w正態(tài)分布:A總體方差→正態(tài)分布B總體方差未知→t(n-1)當(dāng)n>30時,也可查正態(tài)表2.總體非正態(tài)分布:A大樣本:〔n>30〕總體方差→漸近正態(tài)分布總體方差未知→t(n-1)B小樣本:無解第三節(jié)假設(shè)檢驗的根本原理假設(shè)檢驗也稱顯著性檢驗,指利用樣本信息,根據(jù)一定概率,對總體參數(shù)或分布的某一假設(shè)作出拒絕或保存的決斷。一、假設(shè)關(guān)于總體參數(shù)或總體分布的某種假設(shè);根據(jù)已有的理論和經(jīng)驗對研究的問題進(jìn)行假設(shè)通常研究者在調(diào)查、實驗之前,要根據(jù)自己的經(jīng)驗和智慧對所研究的問題提出一個假設(shè),然后進(jìn)行調(diào)查或?qū)嶒?,以檢驗假設(shè)的真實性程度如何。這種假設(shè)稱作科學(xué)假設(shè)。如果把科學(xué)假設(shè)再用數(shù)量或統(tǒng)計學(xué)用語加以表達(dá),并對未知總體性質(zhì)做有關(guān)陳述,便是統(tǒng)計假設(shè)。統(tǒng)計假設(shè)一般包括兩個相互對立的假設(shè):零假設(shè)和備擇假設(shè)二、虛無假設(shè)和對立假設(shè)1、備擇假設(shè)〔對立假設(shè)、研究假設(shè)〕直接由科學(xué)假設(shè)轉(zhuǎn)化過來的假設(shè),符號為H1。這是實驗者內(nèi)心所要真正支持的假設(shè)2、虛無假設(shè)〔零假設(shè)、原假設(shè)、無差假設(shè)〕這是直接被檢驗的假設(shè)或待檢驗的假設(shè),符號為H0。在統(tǒng)計學(xué)中不能對H1的真實性直接檢驗,而總是先提出一個與之對立的假設(shè)〔即H0〕,運(yùn)用統(tǒng)計法假設(shè)證明H0為真,那么對立假設(shè)H1成立的可能性減低,研究者的科學(xué)假設(shè)之真實性便值得疑心即H1為假;反之H0為假,那么推翻原假設(shè),支持對立假設(shè),即H1為真。這種“反證法”是統(tǒng)計推論的一個重要特點。三、小概率事件與顯著性水平樣本統(tǒng)計量的值在其抽樣分布上出現(xiàn)的概率小于或等于事先規(guī)定的水平〔一般指0.05、0.01〕,這時就認(rèn)為小概率事件發(fā)生了在統(tǒng)計中,所謂矛盾的現(xiàn)象不是不可能發(fā)生的事發(fā)生了,而是小概率事件發(fā)生了當(dāng)小概率事件發(fā)生了,應(yīng)拒絕零假設(shè)。統(tǒng)計學(xué)中把這種拒絕0假設(shè)的概率稱為顯著性水平,用α=0.05、α=0.01表示。也可以說,顯著性水平是統(tǒng)計推論時,可能犯錯誤的概率。假設(shè)通過檢驗,樣本與總體的差異95%來自抽樣誤差,那么顯著性水平為0.05。因此,虛無假設(shè)檢驗和顯著性水平是從兩個相反方向?qū)ν粏栴}的解釋。四、統(tǒng)計檢驗的一般程序1、提出待檢驗的假設(shè)H0。例:μ1=μ2、σ12=σ22μ≥52、決定待檢驗的統(tǒng)計量并計算其值。也即在成認(rèn)原假設(shè)的前提下,構(gòu)造一個統(tǒng)計量3、指定檢驗值的顯著性水平α,確定拒絕域4、統(tǒng)計決斷用詞:拒絕原假設(shè)〔推翻原假設(shè)〕,差異顯著不能推翻原假設(shè),或接受原假設(shè),差異不顯著五、兩類錯誤假設(shè)檢驗的結(jié)果,不管是接受或拒絕H0,我們都有犯錯誤的可能,只是犯錯誤的概率有大有小而已?!惨弧尝裥湾e誤:α型錯誤、以真作假錯誤當(dāng)H0為真時,我們拒絕H0所犯的錯誤。其概率為α〔二〕Ⅱ型錯誤:β型錯誤、以假作真錯誤當(dāng)H0為假時,我們接受H0所犯的錯誤,其概率用β表示。兩類錯誤的關(guān)系及其控制六、單側(cè)檢驗與雙側(cè)檢驗〔一〕雙側(cè)檢驗只強(qiáng)調(diào)有無差異,而不強(qiáng)調(diào)差異的方向性〔二〕單側(cè)檢驗強(qiáng)調(diào)差異的某一方向性的檢驗,分左側(cè)、右側(cè)檢驗。如問是不是“大于”、“優(yōu)于”、“快于”、“小于”、“慢于”等,用單側(cè)檢驗。第四節(jié)總體平均數(shù)的顯著性檢驗一、總體正態(tài)分布,總體σ0,檢驗H0:μ=μ0——Z檢驗待檢驗的統(tǒng)計量為:平均數(shù)分布的標(biāo)準(zhǔn)誤為:例1:全區(qū)統(tǒng)一考試物理平均分為50分,標(biāo)準(zhǔn)差為10。某校一個班〔40人〕平均成績?yōu)?2.5,問該班成績與全區(qū)成績差異是否顯著?解:假設(shè)H0:μ=μ0=50H1:μ≠50=52.5μ0=50σ0=10n=40令α=0.05,查表得Zα/2=1.96|Z|=1.58<1.96∴P>0.05,差異不顯著∴不能推翻原假設(shè),即該班成績與全區(qū)成績無顯著差異例2:(P.120)某市高中入學(xué)考試數(shù)學(xué)平均分?jǐn)?shù)為68分,標(biāo)準(zhǔn)差為8.6。其中某所中學(xué)參加此次考試的46名學(xué)生的平均分?jǐn)?shù)為63分.過去的資料說明,該校數(shù)學(xué)成績低于全市平均水平,問此次考試該校數(shù)學(xué)平均分?jǐn)?shù)是否仍低于全市的平均分?jǐn)?shù)?解:根據(jù)題意,應(yīng)該用單側(cè)檢驗H0:μ≥68H1:μ<68令α=0.01,查表得Zα=2.33|Z|=3.943>2.33即P<0.01∴原假設(shè)不成立,即該校入學(xué)考試數(shù)學(xué)的平均成績極其顯著地低于全市的平均分?jǐn)?shù)總體正態(tài)分布,總體σ0未知—t檢驗待檢驗的統(tǒng)計量為:或例3:〔P.121〕某區(qū)初三英語統(tǒng)一測驗平均分?jǐn)?shù)為65,該區(qū)某校20份試卷的分?jǐn)?shù)為:72、76、68、78、62、59、64、85、70、75、61、74、87、83、54、76、56、66、68、62。問該校初三英語平均分?jǐn)?shù)與全區(qū)是否一樣?解:假設(shè)H0:μ=65H1:μ≠65df=19,查t值表得t(19)0.05/2=2.039,t(19)0.01/2=2.8612.861>2.266>2.039即0.01<P<0.05∴原假設(shè)不成立,即該校初三英語平均分與全區(qū)不一樣三、總體非正態(tài)分布,大樣本〔n≥30〕
——近似Z檢驗(用Z`表示)由于樣本容量較大,可不用校正例4:某省進(jìn)行數(shù)學(xué)競賽,結(jié)果分布不呈正態(tài),總平均分為43.5分。某縣參賽者168人,平均分為45.1,S=18.7,問該縣平均分與全省平均分是否有顯著差異?解:令H0:μ=435H1:μ≠43.5即P>0.05∴縣平均分與省平均分無顯著差異四、總體非正態(tài)分布,小樣本
——非參數(shù)檢驗第七章相關(guān)分析第一節(jié):相關(guān)系數(shù)第二節(jié):積差相關(guān)第三節(jié):等級相關(guān)第四節(jié):質(zhì)與量的相關(guān)第五節(jié):品質(zhì)相關(guān)第一節(jié)相關(guān)系數(shù)一、相關(guān)的概念事物之間的關(guān)系大概有:因果關(guān)系、共變關(guān)系、相關(guān)關(guān)系相關(guān)關(guān)系:兩類現(xiàn)象在開展變化的方向與大小方面存在一定的關(guān)系,但不能確定哪個是因,哪個是果,也有理由認(rèn)為它們不存在共變關(guān)系相關(guān):指具有相關(guān)關(guān)系的不同現(xiàn)象之間的關(guān)系程度相關(guān)有三種情況:正相關(guān):兩列變量變化的方向相同負(fù)相關(guān):兩列變量變化的方向相反零相關(guān):兩列變量變化的關(guān)系不一定,無一定的規(guī)律二、相關(guān)系數(shù)相關(guān)系數(shù)是兩列變量間相關(guān)程度的數(shù)字表現(xiàn)形式,或者說是表示相關(guān)程度的指標(biāo)。樣本相關(guān)系數(shù)用r表示,總體相關(guān)系數(shù)用ρ表示相關(guān)系數(shù)的取值范圍從-1到+1之間,即0≤︱r︱≤1;〔正負(fù)號表示相關(guān)方向,絕對值大小表示相關(guān)程度〕對相關(guān)系數(shù)的計算和理解時要注意:1、相關(guān)系數(shù)不是等距和比率的數(shù)據(jù),但可用絕對值大小來比擬例:不能說r=0.80是r=0.40的兩倍,也不能說r自0.20增加到0.30等于r自0.40增加到0.502、相關(guān)程度可從相關(guān)系數(shù)上看出來是有條件的:即要看數(shù)據(jù)對的多少。計算相關(guān)系數(shù)的成對數(shù)據(jù)的數(shù)目不應(yīng)該少于303、計算相關(guān)系數(shù)一般要求成對的數(shù)據(jù)成對:對同一被試的兩種不同的測量結(jié)果成對的兩組被試的同一種測量結(jié)果〔天然配對,經(jīng)過測驗來配對〕第二節(jié)積差相關(guān)一、概念及其適用條件〔一〕概念:當(dāng)兩個變量都是正態(tài)連續(xù)變量,而且兩者之間呈線性關(guān)系,表示這兩個變量之間的相關(guān)稱為積差相關(guān)〔二〕使用條件1、必須是成對的數(shù)據(jù),每對數(shù)據(jù)之間相互獨立,數(shù)據(jù)對不得少于302、兩列數(shù)據(jù)必須是由測量獲得的連續(xù)數(shù)據(jù)3、兩個變量的總體呈正態(tài)分布4、兩列變量之間的關(guān)系應(yīng)是直線相關(guān)〔可作相關(guān)散布圖分析,或查閱已有研究結(jié)論〕二、計算積差相關(guān)的公式〔一〕積差相關(guān)的定義公式〔7——1〕n為成對數(shù)據(jù)的數(shù)目SX為X數(shù)列的標(biāo)準(zhǔn)差SY為Y數(shù)列的標(biāo)準(zhǔn)差例1:〔P.232〕=0.780〔二〕積差相關(guān)的其它公式1、用原始數(shù)據(jù)計算〔7—2〕2、用、、、、計算相關(guān)系數(shù)的合成〔求平均的相關(guān)系數(shù)〕1、將各相關(guān)系數(shù)轉(zhuǎn)換成Zr(費舍Z分?jǐn)?shù))方法:①利用費舍的轉(zhuǎn)換公式〔7——4〕②直接查r—Zr轉(zhuǎn)換表〔附表8〕2、求Zr的平均數(shù)3、反查附表8,將轉(zhuǎn)換成例2〔P.242〕
求三個城市數(shù)學(xué)與物理高考成績相關(guān)系數(shù)的平均數(shù)樣本nn-3rZr(n-3)Zr
北京上海廣州11355280110549770.5150.4980.5630.5700.5470.63762.700300.30349.049求和
736
412.052反查r—Z轉(zhuǎn)換表,與=0.560相對應(yīng)的=0.508∴三個城市數(shù)學(xué)與物理高考成績相關(guān)系數(shù)平均數(shù)為0.508四、相關(guān)系數(shù)的顯著性檢驗(一)H0:ρ=0條件下,積差相關(guān)系數(shù)的顯著性檢驗——方法1:進(jìn)行t檢驗,待檢驗的統(tǒng)計量為〔7—6〕例3〔P.244〕150個6歲男童體重和屈臂懸體的相關(guān)系數(shù)為r=-0.35,問從總體來說,6歲男童體重和屈臂懸體之間是否存在相關(guān)?解:令H0:ρ=0令α=0.01,df=150-2=148查附表2,得t0.01/2(148)=2.614︱t︱=4.85>2.614∴P<0.01,拒絕H0所以,r=-0.35極其顯著,即6歲男童體重和屈臂懸體之間存在負(fù)相關(guān)方法2:直接查積差相關(guān)系數(shù)臨界值表〔附表9〕——據(jù)df=n-2和α值,可查出推翻H0〔ρ=0〕的可推翻的r的最小值r`〔假設(shè)r<r`那么不能推翻H0〕如例3:依據(jù)df=150-2=148,查附表9得r0.01/2=0.210︱-0.35︱>0.210∴P<0.01,在0.01顯著性水平上拒絕H0,即6歲男童體重和屈臂懸體之間存在負(fù)相關(guān)(二)H0:ρ=ρ0條件下,積差相關(guān)系數(shù)的顯著性檢驗——費舍Zr轉(zhuǎn)換,進(jìn)行Z檢驗,待檢驗統(tǒng)計量為:〔7—7〕式中:、。分別為r、ρ的Z轉(zhuǎn)換值例4:29個學(xué)生幾何期中與期末考試成績的r=0.30,問全年級幾何期中與期末考試成績的相關(guān)系數(shù)是否為0.64?解:假設(shè)H0:ρ=0.64,H1≠0.64查r值的Zr轉(zhuǎn)換表得:r=0.30→Zr=0.310ρ=0.64→Zρ=0.758∵︱z︱=2.28>Z0.05/2=1.96∴推翻原假設(shè),樣本r=0.30與總體ρ=0.64在0.05顯著性水平上差異顯著,即全年級幾何期中與期末考試成績的相關(guān)系數(shù)極少可能是0.64(三)兩個獨立樣本相關(guān)系數(shù)差異的顯著性檢驗——先進(jìn)行費舍Zr轉(zhuǎn)換,然后進(jìn)行Z檢驗,待檢驗統(tǒng)計量為:〔7—8〕例5:甲班40名學(xué)生,語文與英語成績相關(guān)系數(shù)r1=0.62,乙班36名學(xué)生的r2=0.45,問甲班的這一相關(guān)系數(shù)是否大于乙班?解:假設(shè)H0:ρ1≤ρ2H1:ρ1>ρ2n1=40n2=36查r值的Zr轉(zhuǎn)換表得:r1=0.62→Zr1=0.725r2=0.45→Zr2=0.485∵Z0.05=1.64>1.00∴P>0.05,不能推翻原假設(shè)結(jié)論:不能認(rèn)為甲班的相關(guān)系數(shù)大于乙班第三節(jié)等級相關(guān)等級相關(guān):以等級次序排列或以等級次序表示的變量之間的相關(guān)。等級相關(guān)的各種方法適用以下條件:1、數(shù)據(jù)不是等距數(shù)據(jù)、比例數(shù)據(jù)而是等級數(shù)據(jù)時;2、數(shù)據(jù)雖是等距數(shù)據(jù)、比例數(shù)據(jù)但總體分布不是正態(tài),不滿足求積差相關(guān)的條件一、斯皮爾曼等級相關(guān)〔一〕適用條件1、是兩列相關(guān),且具有線性關(guān)系2、兩列變量是等級變量3、雖是等距〔等比〕數(shù)據(jù),但可按數(shù)值大小賦予等級,不管總體分布是否正態(tài),也不要求N>30,均可求等級相關(guān)〔假設(shè)能求積差相關(guān)最好不用等級相關(guān)〕〔二〕根本公式1、等級中沒有相同之?dāng)?shù)時,相關(guān)系數(shù)的計算〔7——9〕式中:rR----斯皮爾曼等級相關(guān)系數(shù)D:對偶等級差,D=RX-RYRX、RY:X、Y變量的等級N:等級數(shù)目例1:今有10人的視、聽兩種感覺道的反響時〔單位:毫秒,見下表〕,問視、聽反響時是否具有一致性?2、等級中有相同之?dāng)?shù)時,相關(guān)系數(shù)的計算式中:N:全部變量成對數(shù)目n:各變量中相同的等級數(shù)目例2〔P.250〕10名高三學(xué)生潛在能力與自學(xué)能力測驗成績?nèi)缦卤?問兩者相關(guān)情況如何?學(xué)生XYRXRYDD2123456789109084767171716968666432578687109123555789102135.57.547.55.5109-110-0.5-2.51-0.52.5-111100.256.2510.256.2511N=10(三)顯著性檢驗方法一:直接查附表10—斯皮爾曼等級相關(guān)顯著性臨界值表如例2:檢驗rRC=0.889是否顯著?查附表10,有n=10時,rRC〔0.01/2〕=0.794<0.889∴P<0.01到達(dá)非常顯著水平即學(xué)生的學(xué)習(xí)潛力與自學(xué)能力之間的相關(guān)非常顯著方法二:同H0:ρ=0條件下,積差相關(guān)系數(shù)的顯著性檢驗二、肯德爾和諧系數(shù)〔一〕適用條件:適用于多列等級變量求相關(guān)〔二〕公式及計算1、無相同等級時式中:K——評價者數(shù)量n—受評者數(shù)量R——各個受評者所得的等級和例3:4位教師對6個學(xué)生作文競賽的名次排列次序如下表,問評定的一致性程度如何?〔P.254〕解:學(xué)生n=6評價者K=41234RR2計算1234563421431321346565124256561011102292210012110048481484∑841370有相同等級時〔7——12〕式中:m為相同等級數(shù)目〔同一評價者對不同受評者給相同等級〕例4〔P.255〕同一位教師對5份研究生入學(xué)考試政治試卷根據(jù)標(biāo)準(zhǔn)先后3次等級評定結(jié)果如下表.問3次評定結(jié)果的相關(guān)程度如何?學(xué)生n=5先后評定次數(shù)K=3123等級123RR2計算1234553221123224354.522.511332.5344.514.55.558.511.5210.2530.252572.25132.25∑
45470(三)相關(guān)系數(shù)的顯著性檢驗——檢驗待檢驗的統(tǒng)計量為:例3的rW=0.693顯著性檢驗:解:令H0:ρ=0H1:ρ≠0=4×〔6-1〕×0.693=13.86df=n-1=5查表有11.07<13.86<15.09∴P<0.05,推翻H0,即4位教師評定的結(jié)果是一致的〔相關(guān)〕第四節(jié)質(zhì)與量的相關(guān)質(zhì)量相關(guān):一列變量為等比或等距數(shù)據(jù),另一列變量為按性質(zhì)劃分的類別。這兩個變量之間的相關(guān)為質(zhì)與量的相關(guān)。一、二列相關(guān)〔一〕概念及適用條件:二列變量都是屬于正態(tài)分布中的連續(xù)變量,但其中一列變量被人為的分為兩類?!捕彻郊坝嬎?7—13a)(7—13b)P:為某一二分變量在所有二分變量中所占的比率q=1-p:與p對應(yīng)的連續(xù)變量的平均數(shù):與q對應(yīng)的連續(xù)變量的平均數(shù)、:連續(xù)變量的標(biāo)準(zhǔn)差與平均數(shù)Y:p、q分界線處縱線高度,可查正態(tài)分布表得到〔三〕顯著性檢驗——Z檢驗
等檢驗的統(tǒng)計量為:〔7——14〕例1〔P.258〕例1:初三學(xué)生的學(xué)校類別與高中入學(xué)考試英語分?jǐn)?shù)二列相關(guān)系數(shù)計算表學(xué)生序號考試分?jǐn)?shù)X重點中學(xué)1非重點中學(xué)0學(xué)生序號考試分?jǐn)?shù)X重點中學(xué)1非重點中學(xué)016801170
02821
12761354
01371
o473114730561
01571
06751分?jǐn)?shù)總和1063386677772
0人數(shù)總和155108630人數(shù)比率P=0.33333q=0.666679801平均數(shù)70.86777.20067.70010740標(biāo)準(zhǔn)差6.946
二、點二列相關(guān)〔一〕適用條件一列變量為正態(tài)連續(xù)變量,另一列變量是真正的名義變量。〔二〕計算〔7——15a〕〔7——15b〕(三〕顯著性檢驗——方法同積差相關(guān)顯著性檢驗例2:有某一測驗總分值為20分,今選取局部被試實驗結(jié)果如下。文化程度分為文盲〔記0〕、非文盲〔記1〕,問該測驗與文盲非文盲是否有關(guān)?被試測驗得分文化程度計算1234567891011122019178951816151489111000111100
顯著性檢驗:根據(jù)df=12-2=10查積差相關(guān)系數(shù)界值表,有r0.001/2=0.823<︱rpb︱=0.93∴p<0.001,到達(dá)極其顯著水準(zhǔn)結(jié)論:該測驗與文化程度的相關(guān)非常顯著第五節(jié)品質(zhì)相關(guān)品質(zhì)相關(guān):兩個變量都是按性質(zhì)劃分成幾種類別,表示這兩個變量之間的相關(guān)稱為品質(zhì)相關(guān)。類型:四分相關(guān)、Φ相關(guān)、列聯(lián)相關(guān)一、φ相關(guān)〔一〕適用條件兩個變量都是二分名義變量,它們之間的關(guān)系,可用φ相關(guān)表示〔二〕計算公式〔11——16〕〔a、b、c、d為四格表中的實際次數(shù)〕變量變量1
第一類第二類
第一類aba+b第二類cdc+da+cb+d〔三〕顯著性檢驗:檢驗顯著那么rΦ也顯著待檢驗的統(tǒng)計量為:〔7—17〕df=(R-1)(C-1)=(2-1)(2-1)=1R為每一行的分類數(shù)目,C為每一列的分類數(shù)目〔R行C列〕獨立樣本的四格表:R=C=2例1:P.276解:查表有〔1〕0.01=6.63<11.56P<0.01,到達(dá)極顯著水準(zhǔn)∴rΦ顯著,即成績與性別存在非常密切的相關(guān)二、列聯(lián)相關(guān)〔一〕適用條件兩列變量都是類別變量,但分類〔至少有一列〕多于兩類,資料用R×C列聯(lián)表提供,此時計算列聯(lián)相關(guān)〔二〕計算公式〔7——18〕〔7——19〕或〔7——20〕式中:N=總次數(shù)fe:理論次數(shù),fo:實際次數(shù)fx:與fo對應(yīng)的那一行的總數(shù),也稱邊緣次數(shù)fy:與fo對應(yīng)的那
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)勞動合同范本:全員適用版
- 追討合同違約金起訴書范本
- 快遞企業(yè)委托代理合同
- 汽車保險合同模板
- 土地租賃經(jīng)營權(quán)合同書樣本
- 技術(shù)研發(fā)勞動合同規(guī)定
- 機(jī)織服裝的綠色包裝設(shè)計考核試卷
- 無線傳輸技術(shù)在野生動物保護(hù)中的應(yīng)用考核試卷
- 方便食品市場趨勢與消費者需求分析考核試卷
- 批發(fā)商客戶關(guān)系持續(xù)優(yōu)化策略研究考核試卷
- 初中物理競賽及自主招生講義:第7講 密度、壓強(qiáng)與浮力(共5節(jié))含解析
- 高中主題班會 梁文鋒和他的DeepSeek-由DeepSeek爆火開啟高中第一課-高中主題班會課件
- 污水處理設(shè)施運(yùn)維服務(wù)投標(biāo)方案(技術(shù)標(biāo))
- 2024年八年級語文下冊《經(jīng)典常談》第一章《說文解字》練習(xí)題卷附答案
- 華為基建項目管理手冊
- 醫(yī)院入院通知書格式
- 履帶式起重機(jī)負(fù)荷試驗及調(diào)試報告報審表
- 《黑龍江省住房和城鄉(xiāng)建設(shè)系統(tǒng)行政處罰裁量基準(zhǔn)》
- 發(fā)育生物學(xué)1-9章全
- 基于單片機(jī)的交通信號燈模擬控制系統(tǒng)設(shè)計 答辯PPT
- 中國舞蹈家協(xié)會《中國舞蹈考級》 第四版教材
評論
0/150
提交評論