



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、華東師大心理統(tǒng)計(jì)學(xué)大綱教材:教育統(tǒng)計(jì)學(xué)第一章緒論第一節(jié)什么是統(tǒng)計(jì)學(xué)和心理統(tǒng)計(jì)學(xué)一、什么是統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)是研究統(tǒng)計(jì)原理和方法的科學(xué)。具體地說,它是研究如何搜集、整理、 分析反映事物總體信息的數(shù)字資料,并以此為依據(jù),對總體特征進(jìn)行推斷的原理和方法。統(tǒng)計(jì)學(xué)分為兩大類。一類是數(shù)理統(tǒng)計(jì)學(xué)。它主要是以概率論為基礎(chǔ),對統(tǒng)計(jì)數(shù)據(jù)數(shù)量關(guān)系的模式加以解釋,對統(tǒng)計(jì)原理和方法給予數(shù)學(xué)的證明。它是數(shù)學(xué)的一個(gè)分支。另一類是應(yīng)用統(tǒng)計(jì)學(xué)。 它是數(shù)理統(tǒng)計(jì)原理和方法在各個(gè)領(lǐng)域中的應(yīng)用,如數(shù)理統(tǒng)計(jì)的原理和方法應(yīng)用到工業(yè)領(lǐng)域,稱為工業(yè)統(tǒng)計(jì)學(xué);應(yīng)用到醫(yī)學(xué)領(lǐng)域,稱為醫(yī)學(xué)統(tǒng)計(jì)學(xué);應(yīng)用到心理學(xué)領(lǐng)域,稱為心理統(tǒng)計(jì)學(xué),等等。應(yīng)用統(tǒng)計(jì)學(xué)是與研究對象
2、密切結(jié)合的各科專門統(tǒng)計(jì)學(xué)。二、統(tǒng)計(jì)學(xué)和心理統(tǒng)計(jì)學(xué)的內(nèi)容統(tǒng)計(jì)學(xué)和心理統(tǒng)計(jì)學(xué)的研究內(nèi)容,從不同角度來分,可以分為不同的類型。從具體應(yīng)用的角度來分,可以分成描述統(tǒng)計(jì),推斷統(tǒng)計(jì)和實(shí)驗(yàn)設(shè)計(jì)三部分。1描述統(tǒng)計(jì)對已獲得的數(shù)據(jù)進(jìn)行整理、概括,顯示其分布特征的統(tǒng)計(jì)方法,稱為描述統(tǒng)計(jì)。2推斷統(tǒng)計(jì)根據(jù)樣本所提供的信息,運(yùn)用概率的理論進(jìn)行分析、分布特征進(jìn)行估計(jì)、推測, 這種統(tǒng)計(jì)方法稱為推斷統(tǒng)計(jì)。和假設(shè)檢驗(yàn) 兩部分。3實(shí)驗(yàn)設(shè)計(jì)論證,在一定可靠程度上,對總體推斷統(tǒng)計(jì)的內(nèi)容包括 總體參數(shù)估計(jì)實(shí)驗(yàn)者為了揭示試驗(yàn)中自變量和因變量的關(guān)系,在實(shí)驗(yàn)之前所制定的實(shí)驗(yàn)計(jì)劃,稱為實(shí)驗(yàn)設(shè)計(jì)。其中包括選擇怎樣的抽樣方式;如何計(jì)算樣本容量;確定
3、怎樣的實(shí)驗(yàn)對照形式;如何實(shí)現(xiàn)實(shí)驗(yàn)組和對照組的等組化; 如何安排實(shí)驗(yàn)因素和如何控制無關(guān)因素; 用什么統(tǒng)計(jì)方法處理及分析實(shí)驗(yàn)結(jié)果,等等。以上三部分內(nèi)容,不是截然分開,而是相互聯(lián)系的。第二節(jié)統(tǒng)計(jì)學(xué)中的幾個(gè)基本概念一、隨機(jī)變量具有以下三個(gè)特性的現(xiàn)象,成為隨機(jī)變量。第一,一次試驗(yàn)有多中可能結(jié)果,其所有可能結(jié)果是已知的;第二,試驗(yàn)之前不能預(yù)料哪一種結(jié)果會出現(xiàn);第三,在相同的條件下可以重復(fù)試驗(yàn)。 隨機(jī)現(xiàn)象的每一種結(jié)果叫做一個(gè)隨機(jī)事件。 我們把能表示隨機(jī)現(xiàn)象各種結(jié)果的變量稱為隨機(jī)變量。統(tǒng)計(jì)處理的變量都是隨機(jī)變量。二、總體和樣本總體是我們所研究的具有共同特性的個(gè)體的總和。總體中的每個(gè)單位成為個(gè)體。樣本是從總體中
4、抽取的作為觀察對象的一部分個(gè)體。當(dāng)總體所包含的個(gè)數(shù)有限時(shí),這一總體稱為有限總體。 而總體所包含的個(gè)數(shù)無限時(shí), 則稱為無限總體。 樣本中包含的個(gè)體數(shù)目稱為樣本的容量,一般用 n 來表示。一般來說,樣本中個(gè)體數(shù)目大于 30 稱為大樣本,等于或小于30稱為小樣本。在對數(shù)據(jù)進(jìn)行處理時(shí),大樣本和小樣本所用的統(tǒng)計(jì)方法不一定相同。三、統(tǒng)計(jì)量和參數(shù)樣本上的數(shù)據(jù)特征是統(tǒng)計(jì)量。 總體上的各種數(shù)字特征是參數(shù)。 在進(jìn)行統(tǒng)計(jì)推斷時(shí), 就是根據(jù)樣本統(tǒng)計(jì)量來推斷總體相應(yīng)的參數(shù)。心理統(tǒng)計(jì)學(xué)大綱第二章數(shù)據(jù)的初步整理第一節(jié)數(shù)據(jù)的來源、種類及其分類一、統(tǒng)計(jì)資料的來源統(tǒng)計(jì)資料的來源有兩個(gè)方面:1、經(jīng)常性資料2、專題性資料( 1)調(diào)查
5、資料( 2)實(shí)驗(yàn)資料二、數(shù)據(jù)的種類數(shù)據(jù)是隨機(jī)變量的觀察值。 它是用來描述對客觀事物觀察測量的數(shù)值。數(shù)據(jù)的種類不同,統(tǒng)計(jì)處理的方法也不同。根據(jù)統(tǒng)計(jì)數(shù)據(jù)來源可分為點(diǎn)計(jì)數(shù)據(jù)和度量數(shù)據(jù); 按隨機(jī)變量取值情況, 可分為間斷性隨機(jī)變量的數(shù)據(jù)和連續(xù)性隨機(jī)變量的數(shù)據(jù)。1、點(diǎn)計(jì)數(shù)據(jù)和度量數(shù)據(jù)點(diǎn)計(jì)數(shù)據(jù)是指計(jì)算個(gè)數(shù)所獲得的數(shù)據(jù)。 度量數(shù)據(jù)是指用一定的工具或一定的標(biāo)準(zhǔn)測量所獲得的數(shù)據(jù)。2、間斷性隨機(jī)變量的數(shù)據(jù)和連續(xù)性隨機(jī)變量的數(shù)據(jù)取值個(gè)數(shù)有限的數(shù)據(jù), 稱為間斷性隨機(jī)變量的數(shù)據(jù)。 這種數(shù)據(jù)的單位是獨(dú)立的, 兩個(gè)單位之間不能劃分成細(xì)小的單位,一般用整數(shù)表示。取值個(gè)數(shù)無限的(不可數(shù)的)數(shù)據(jù),稱為連續(xù)性隨機(jī)變量的數(shù)據(jù)。 它們
6、可能的取值范圍能連續(xù)充滿某一個(gè)區(qū)間。 數(shù)據(jù)的單位之間可以再劃分成無限多個(gè)細(xì)小的單位。數(shù)據(jù)可以用小數(shù)表示。三、數(shù)據(jù)的統(tǒng)計(jì)分類數(shù)據(jù)的統(tǒng)計(jì)分類,是指按照研究對象的本質(zhì)特征,根據(jù)分析研究的目的、任務(wù),以及統(tǒng)計(jì)分析時(shí)所用統(tǒng)計(jì)方法的可能性,將所獲得的數(shù)據(jù)進(jìn)行分組歸類。它是對數(shù)據(jù)進(jìn)行歸納、整理、簡化、概括的第一步,為進(jìn)一步分析研究打下基礎(chǔ)。分類的標(biāo)志按形式劃分,可分為性質(zhì)類別和數(shù)量類別。性質(zhì)類別是按事物的不同性質(zhì)進(jìn)行分類。 這種分類不表明事物之間的差異。性質(zhì)類別還可以進(jìn)一步分成不同的層次。數(shù)量類別是按數(shù)值大小進(jìn)行分類,并排成順序。在排列順序時(shí), 可以直接按數(shù)值大小進(jìn)行排列,也可以用等級順序進(jìn)行排列。第二節(jié)統(tǒng)
7、計(jì)表一、統(tǒng)計(jì)表的結(jié)構(gòu)及其編制的原則和要求。統(tǒng)計(jì)表一般由標(biāo)題、表號、標(biāo)目、線條、數(shù)字、表注等項(xiàng)構(gòu)成。標(biāo)題標(biāo)題是表的名稱,應(yīng)確切地、簡明扼要地說明表的內(nèi)容。表號表號是表的序號。標(biāo)目標(biāo)目是表格中對統(tǒng)計(jì)數(shù)據(jù)分類的項(xiàng)目。線條線條不宜過多。數(shù)字表內(nèi)數(shù)字必須準(zhǔn)確,一律用阿拉伯?dāng)?shù)字表示,位次對齊,小數(shù)的位數(shù)一致。表注它不是表的必要組成部分。二、統(tǒng)計(jì)表的總類1、簡單表只列出觀察對象的名稱、地點(diǎn)、時(shí)序或統(tǒng)計(jì)指標(biāo)名稱的統(tǒng)計(jì)表為簡單表。2、分組表只按一個(gè)標(biāo)志分組的統(tǒng)計(jì)表為分組表。3、復(fù)合表按兩個(gè)或兩個(gè)以上標(biāo)志分組的統(tǒng)計(jì)表為復(fù)合表。三、頻數(shù)分布表列法1、簡單頻數(shù)分布表( 1)間斷變量的頻數(shù)分布表( 2)連續(xù)變量的頻數(shù)分
8、布表步驟:求全距決定組數(shù)和組距決定組限決定組限登記頻數(shù)2、累積頻數(shù)和累積百分比分布表( 1)累積頻數(shù)分布表用累積頻數(shù)表示的頻數(shù)分布表稱為累積頻數(shù)分布表。( 2)累積百分比分布表累積百分比分布表是累積頻數(shù)分布表的變型。它是用累積百分比表示的頻數(shù)分布表。第三節(jié)統(tǒng)計(jì)圖一、統(tǒng)計(jì)圖的結(jié)構(gòu)及其繪制規(guī)則統(tǒng)計(jì)圖由標(biāo)題、圖號、標(biāo)目、圖形、圖注等項(xiàng)構(gòu)成。下面按其構(gòu)成部分說明繪圖的基本規(guī)則。標(biāo)題圖的名稱應(yīng)簡明扼要,切合圖的內(nèi)容,必要時(shí)可注明時(shí)間、地點(diǎn)。圖號文章中若有幾幅畫,則需按其出現(xiàn)的先后次序編上序號,寫在圖題的作前方。標(biāo)目對于有縱橫軸的統(tǒng)計(jì)圖,應(yīng)在縱橫軸上分別標(biāo)明統(tǒng)計(jì)項(xiàng)目及其尺度。圖形圖形線在圖中為最粗,而且要
9、清晰。圖注圖注不是圖中必要組成部分。二、表示間斷變量的統(tǒng)計(jì)圖1、直條圖直條圖是用直條的長短表示統(tǒng)計(jì)事項(xiàng)數(shù)量的圖形。 它主要是用來比較性質(zhì)相似的間斷性資料。2、圓形圖圓形圖是用來表示間斷性資料構(gòu)成比的圖形。三、表示連續(xù)變量的統(tǒng)計(jì)圖1、線形圖線形圖用來表示連續(xù)性資料。 它能表示兩個(gè)變量之間的函數(shù)關(guān)系; 一種事物隨另一種事物變化的情況;某種事物隨時(shí)間推移的發(fā)展趨勢等。2、頻數(shù)分布圖常用的頻數(shù)分布圖有直方圖、多邊圖和累積多邊圖。( 1)直方圖直方圖用面積表示頻數(shù)分布。用各組上下限上的矩形面積表示各組頻數(shù)。( 2)多邊圖多邊圖以縱軸上的高度表示頻數(shù)的多少。( 3)累積頻數(shù)和累積百分比多邊圖第三章集中量集
10、中量是代表一組數(shù)據(jù)典型水平或幾種趨勢的量。 它能反映頻數(shù)分布中大量數(shù)據(jù)向某一點(diǎn)集中的情況。第一節(jié)算術(shù)平均數(shù)一、算術(shù)平均數(shù)的概念算術(shù)平均數(shù)是所有觀察值得總和除以總頻數(shù)所得之商, 簡稱為平均數(shù)或均數(shù)。 計(jì)算公式為( 3.1 )。算術(shù)平均數(shù)的特征:( 1)觀察值的總和等于算術(shù)平均數(shù)的N 倍;( 2)各觀察值與其算術(shù)平均數(shù)之差的總和等于零;( 3)若一組觀察值是由兩部分(或幾部分)組成,這組觀察值的算術(shù)平均數(shù)可以由組成部分算術(shù)平均數(shù)而求得;二、算術(shù)平均數(shù)的應(yīng)用及其優(yōu)缺點(diǎn)算術(shù)平均數(shù)具備一個(gè)良好的集中量所應(yīng)具備的一些條件:( 1)反應(yīng)靈敏。( 2)嚴(yán)密確定。簡明易懂,計(jì)算方便。( 3)適合代數(shù)運(yùn)算。( 4
11、)受抽樣變動(dòng)的影響較小。除此之外,算數(shù)平均數(shù)還有幾個(gè)特殊的優(yōu)點(diǎn):( 1)只知一組觀察值的總和及總頻數(shù)就可以求出算術(shù)平均數(shù)。( 2)用加權(quán)法可以求出幾個(gè)平均數(shù)的總平均數(shù)。( 3)用樣本數(shù)據(jù)推斷總體集中量時(shí),算術(shù)平均數(shù)最接近于總體集中量的真值,它是總體平均數(shù)的最好估計(jì)值。( 4)在計(jì)算方差、標(biāo)準(zhǔn)差、相關(guān)系數(shù)以及進(jìn)行統(tǒng)計(jì)推斷時(shí),都要用到它。算術(shù)平均數(shù)的缺點(diǎn):( 1)易受兩極端數(shù)值(極大或極?。┑挠绊?。( 2)一組數(shù)據(jù)中某個(gè)數(shù)值的大小不夠確切時(shí)就無法計(jì)算其算術(shù)平均數(shù)。第二節(jié)中位數(shù)一、中位數(shù)的概念中位數(shù)是位于依一定順序排列的一組數(shù)據(jù)中央位置的數(shù)值, 在這一數(shù)值上、 下各有一半頻數(shù)分布著。二、中位數(shù)的計(jì)算
12、方法1、原始數(shù)值計(jì)算方法將一組原始數(shù)據(jù)依大小順序排列后, 若總頻數(shù)為奇數(shù), 就以位于中央的數(shù)據(jù)作為中位數(shù);若總頻數(shù)為偶數(shù),則以最中間的兩個(gè)數(shù)據(jù)的算術(shù)平均數(shù)作為中位數(shù)。2、頻數(shù)分布表計(jì)算法若一組原始數(shù)據(jù)已經(jīng)編成了頻數(shù)分布表,可用內(nèi)插法,通過頻數(shù)分布表計(jì)算中位數(shù)。三、百分位數(shù)的概念及其計(jì)算方法百分位數(shù)是位于依一定順序排列的一組數(shù)據(jù)中某一百分位置的數(shù)值。在心理測量中, 常通過計(jì)算百分位數(shù)來說明、解釋和評價(jià)分?jǐn)?shù)在團(tuán)體中所處的位置。計(jì)算公式為(3.5 )。四、中位數(shù)的應(yīng)用及其優(yōu)缺點(diǎn)中位數(shù)雖然也具備一個(gè)良好的集中量所應(yīng)具備的某些條件,例如比較嚴(yán)格確定、簡明易懂,計(jì)算簡便, 受抽樣變動(dòng)影響較小,但是它不適合
13、進(jìn)一步的代數(shù)運(yùn)算。它適用于以下幾種情況:( 1)一組數(shù)據(jù)中有特大或特小兩極端數(shù)值時(shí);(2)一組數(shù)據(jù)中有個(gè)別數(shù)據(jù)不確切時(shí);(3)資料屬于等級性質(zhì)時(shí)。第三節(jié)眾數(shù)一、眾數(shù)的概念眾數(shù)是集中量的一種指標(biāo)。對眾數(shù)有理論眾數(shù)及粗略眾數(shù)兩種定義方法。理論眾數(shù)是指與頻數(shù)分布曲線最高點(diǎn)相對應(yīng)的橫坐標(biāo)上的一點(diǎn)。 粗略眾數(shù)是指一組數(shù)據(jù)中頻數(shù)出現(xiàn)最多的那個(gè)數(shù)。二、眾數(shù)的計(jì)算方法1、用觀察法直接尋找粗略眾數(shù)粗略眾數(shù)不需要計(jì)算,可通過觀察直接尋得。2、用公式求理論眾數(shù)的近似值(1) 皮爾遜 (K.Person)的經(jīng)驗(yàn)法利用皮爾遜發(fā)現(xiàn)的算術(shù)平均數(shù)、 中位數(shù)、 眾數(shù)三者關(guān)系來求理論眾數(shù)近似值的經(jīng)驗(yàn)公式為( 3.6 )。(2)
14、金氏 (W.I.King) 插補(bǔ)法當(dāng)頻數(shù)分布呈偏態(tài),即眾數(shù)所在組以上各組頻數(shù)總和與以下各組頻數(shù)總和相差較多時(shí),可以用金氏公式計(jì)算眾數(shù),以進(jìn)行比率調(diào)整。其公式為(3.7 )。三、眾數(shù)的應(yīng)用及其優(yōu)缺點(diǎn)眾數(shù)雖然簡明易懂,但是它并不具備一個(gè)良好的集中量的基本條件。它主要在以下情況下使用:( 1)當(dāng)需要快速而粗略地找出一組數(shù)據(jù)的代表值時(shí);( 2)當(dāng)需要利用算術(shù)平均數(shù)、中位數(shù)和眾數(shù)三者關(guān)系來粗略判斷頻數(shù)分布的形態(tài)時(shí);( 3)利用眾數(shù)幫助分析解釋一組頻數(shù)分布是否確實(shí)具有兩個(gè)頻數(shù)最多的集中點(diǎn)時(shí)。第四節(jié)加權(quán)平均數(shù)、幾何平均數(shù)一、加權(quán)平均數(shù)加權(quán)平均數(shù)是不同比重?cái)?shù)據(jù)(或平均數(shù))的平均數(shù)。計(jì)算公式為(3.8 )或(
15、3.9 )。二、幾何平均數(shù)幾何平均數(shù)是N個(gè)數(shù)值連乘積的N 次方根。計(jì)算公式為(3.10 )。當(dāng)一個(gè)數(shù)列的后一個(gè)數(shù)據(jù)是以前一個(gè)數(shù)據(jù)為基礎(chǔ)成比例增長時(shí),要用幾何平均數(shù)求其平均增長率。第四章差異量第一節(jié)全距、四分位距、百分位距(略)第二節(jié)平均差一、平均差的概念所謂平均差, 就是每一個(gè)數(shù)據(jù)與該組數(shù)據(jù)的中位數(shù) (或算術(shù)平均數(shù)) 離差的絕對值的算術(shù)平均數(shù)。二、平均差的計(jì)算方法用原始數(shù)據(jù)計(jì)算平均差的公式為(4.3 )三、平均差的優(yōu)缺點(diǎn)平均差意義明確,計(jì)算容易,每個(gè)數(shù)據(jù)都參加了運(yùn)算,考慮到全部的離差,反應(yīng)靈敏。但計(jì)算要用絕對值,不適合代數(shù)運(yùn)算。第三節(jié)方差和標(biāo)準(zhǔn)差一、方差和標(biāo)準(zhǔn)差的概念方差是指離差平方的算術(shù)平均
16、數(shù)。其定義公式為(4.5 ),計(jì)算公式是(4.7 )。標(biāo)準(zhǔn)差是指離差平方和平均后的方根。即方差的平方根。其定義公式為 ( 4.6 ),計(jì)算公式是( 4.8 )。二、方差和標(biāo)準(zhǔn)差的應(yīng)用及其優(yōu)缺點(diǎn)方差和標(biāo)準(zhǔn)差的優(yōu)點(diǎn):反應(yīng)靈敏, 隨任何一個(gè)數(shù)據(jù)的變化而表示;一組數(shù)據(jù)的方差和標(biāo)準(zhǔn)差有確定的值;計(jì)算簡單; 適合代數(shù)計(jì)算, 不僅求方差和標(biāo)準(zhǔn)差的過程中可以進(jìn)行代數(shù)運(yùn)算,而且可以將幾個(gè)方差和標(biāo)準(zhǔn)差綜合成一個(gè)總的方差和標(biāo)準(zhǔn)差; 用樣本數(shù)據(jù)推斷總體差異量時(shí),方差和標(biāo)準(zhǔn)差是最好的估計(jì)量。第三節(jié)相對差異量一、相對差異量的概念上述全距、 四分位距、 平均差及標(biāo)準(zhǔn)差都是帶有與原觀察值相同單位的名數(shù),差異量。 這種差異量對
17、兩種單位不同,或單位相同而兩個(gè)平均數(shù)相差較大的資料,較差異的大小,必須用相對差異量(即差異系數(shù))進(jìn)行比較。所謂差異系數(shù)是指標(biāo)準(zhǔn)差與其算術(shù)平均數(shù)的百分比。它是沒有單位的相對數(shù)。式是( 4.11 )二、差異系數(shù)的用途1、比較不同單位資料的差異程度稱為絕對都無法比其計(jì)算公2、比較單位相同而平均數(shù)相差數(shù)較大的兩組資料的差異量程度3、可判斷特殊差異情況三、差異系數(shù)的應(yīng)用條件從測驗(yàn)的理論來說, 只有等比量表才使平均數(shù)等于零成為不可能。 也就是說, 用來測量的量尺, 既具有等距的單位, 又具有絕對零點(diǎn), 這時(shí)所測量出的數(shù)據(jù)其平均數(shù)才不可能等于零,這時(shí)才能計(jì)算差異系數(shù)。第五節(jié)偏態(tài)量及峰態(tài)量偏態(tài)量及峰態(tài)量是用以
18、描述數(shù)據(jù)分布特征的統(tǒng)計(jì)量。一、偏態(tài)量1、利用算術(shù)平均數(shù)與眾數(shù)或中位數(shù)的距離來計(jì)算。其公式為(4.12 )。2、根據(jù)動(dòng)差來計(jì)算。其公式為(4.14 )。二、峰態(tài)量1、用兩個(gè)百分位距來計(jì)算。其公式為(4.16 )。2、根據(jù)動(dòng)差來計(jì)算。其公式為(4.17 )。第五章概率及概率分布第一節(jié)概率的一般概念一、概率的定義概率因?qū)で蟮姆椒ú煌袃煞N定義,即后驗(yàn)概率和先驗(yàn)概率。1、后驗(yàn)概率的定義以隨機(jī)事件A 在大量重復(fù)試驗(yàn)中出現(xiàn)的穩(wěn)定頻率制作為隨機(jī)事件尋得的概率稱為后驗(yàn)概率。計(jì)算公式是(5.2 )。2先驗(yàn)概率的定義A 概率的估計(jì)值, 這樣先驗(yàn)概率是通過古典概率模型加以定義的,兩個(gè)條件:( 1)試驗(yàn)的所有可能結(jié)果
19、是有限的;相等。若所有可能結(jié)果的總數(shù)為n,隨機(jī)事件式為( 5.3 )。故又稱為古典概率。古典概率模型要求滿足( 2)每一種可能結(jié)果出現(xiàn)的可能性(概率)A 包括 m個(gè)可能結(jié)果,則事件A 的概率計(jì)算公二、概率的性質(zhì)1、任何隨機(jī)事件A 的概率都是介于0 與 1 之間的正數(shù);2、不可能事件的概率等于0;3、必然事件的概率等于1。三、概率的加法和乘法1、概率的加法在一次試驗(yàn)中不可能同時(shí)出現(xiàn)的事件稱為互不相容的事件。兩個(gè)互不相容事件和的概率,等于這兩個(gè)事件概率之和。用公式表示為 (5.4 )和(5.5 )。2. 概率的乘法A 事件出現(xiàn)的概率不影響B(tài) 事件出現(xiàn)的概率,這兩個(gè)事件為獨(dú)立事件。兩個(gè)獨(dú)立事件的概率
20、,等于這兩個(gè)事件概率的乘積。用公式表示為(5.6 )和( 5.7 )。第二節(jié)二項(xiàng)分布一、二項(xiàng)試驗(yàn)滿足以下條件的試驗(yàn)稱為二項(xiàng)試驗(yàn):( 1)一次試驗(yàn)只有兩種可能結(jié)果,即成功和失??;( 2)各次試驗(yàn)相互獨(dú)立,互不影響; (3)各次試驗(yàn)中成功的概率相等。二、二項(xiàng)分布函數(shù)二項(xiàng)分布是一種離散型隨機(jī)變量的概率分布。用 n 次方的二項(xiàng)展開式來表達(dá)在 n 次二項(xiàng)試驗(yàn)中成功事件出現(xiàn)不同次數(shù) (X=0,1, ,n )的概念分布叫做二項(xiàng)分布。二項(xiàng)展開式的通式( 5.8 )就是二項(xiàng)分布函數(shù),運(yùn)用這一函數(shù)式可以直接求出成功事件恰好出現(xiàn) X 次的概率。三、二項(xiàng)分布圖從二項(xiàng)分布圖可以看出,當(dāng)p=q,不管 n 多大,二項(xiàng)分布呈
21、對稱形。當(dāng)n 很大時(shí),二項(xiàng)分布接近于正態(tài)分布。當(dāng)n 趨近于無限大時(shí),正態(tài)分布是二項(xiàng)分布的極限。四、二項(xiàng)分布的平均數(shù)和標(biāo)準(zhǔn)差當(dāng)二項(xiàng)分布接近于正態(tài)分布時(shí),在 n 次二項(xiàng)實(shí)驗(yàn)中成功事件出現(xiàn)次數(shù)的平均數(shù)和標(biāo)準(zhǔn)差分別可以由公式(5.9 )和( 5.10 )計(jì)算而得。五、二項(xiàng)分布的應(yīng)用二項(xiàng)分布函數(shù)除了用來求成功事件恰好出現(xiàn)X 次的概率之外, 在心理學(xué)中主要用來判斷實(shí)驗(yàn)結(jié)果的機(jī)遇性與真實(shí)性的界限。屬于二項(xiàng)分布的問題,若實(shí)驗(yàn)次數(shù)n 較大,一般都用正態(tài)分布近似處理。第三節(jié)正態(tài)分布正態(tài)分布是一種連續(xù)型隨機(jī)變量的概率分布。一、正態(tài)曲線1正態(tài)曲線函數(shù)正態(tài)曲線的函數(shù)式是公式(5.11)。標(biāo)準(zhǔn)正態(tài)分布的函數(shù)式是公式(5.
22、12 )。2. 正態(tài)曲線的特點(diǎn)( 1)曲線在 Z=0 處為最高點(diǎn)。( 2)曲線以 Z=0 處為中心,雙側(cè)對稱。( 3)曲線從最高點(diǎn)向左右緩慢下降,并無限延伸,但永遠(yuǎn)不與基線相交。( 4)標(biāo)準(zhǔn)正態(tài)分布上的平均數(shù)為0,標(biāo)準(zhǔn)差為 1。( 5)曲線從最高點(diǎn)向左右延伸時(shí),在正負(fù)1 個(gè)標(biāo)準(zhǔn)差是拐點(diǎn)。二、正態(tài)曲線的面積與縱線1、累積正態(tài)分布函數(shù)2、標(biāo)準(zhǔn)正態(tài)分布下面積的求法3、正態(tài)曲線的縱線三、正態(tài)分布在測驗(yàn)計(jì)分方面的應(yīng)用1、將原始分?jǐn)?shù)轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù)標(biāo)準(zhǔn)分?jǐn)?shù)的意義:第一,各科標(biāo)準(zhǔn)分?jǐn)?shù)的單位是絕對等價(jià)的; 第二、標(biāo)準(zhǔn)分?jǐn)?shù)的正負(fù)和大小可以反映出考生在全體考分中所處的地位。2、確定錄用分?jǐn)?shù)線3、確定等級評定的人數(shù)4
23、、品質(zhì)評定數(shù)量化第六章抽樣分布及總體平均數(shù)的推斷第一節(jié)抽樣分布一、抽樣分布的概念要區(qū)分以下三種不同性質(zhì)的分布:1、總體分布:總體內(nèi)個(gè)體數(shù)值的頻數(shù)分布。2、樣本分布:樣本內(nèi)個(gè)體數(shù)值的頻數(shù)分布。3、抽樣分布:某一種統(tǒng)計(jì)量的概率分布。二、平均數(shù)抽樣分布的幾個(gè)定理1、從總體中隨機(jī)抽出容量為n 的一切可能樣本的平均數(shù)之平均數(shù)等于總體的平均數(shù)。公式表示為( 6.1 )。2、容量為n 的平均數(shù)在抽樣分布上的標(biāo)準(zhǔn)差,等于總體標(biāo)準(zhǔn)差除以n 的方根。公式表示為( 6.2 )。3從正態(tài)總體中,隨機(jī)抽取的容量為n 的一切可能樣本平均數(shù)的分布也呈正態(tài)分布。4雖然總體不呈正態(tài)分布,如果樣本容量較大,反映總體 和 的樣本平
24、均數(shù)的抽樣分布,也接近于正態(tài)分布。三、樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計(jì)量的形態(tài)從正態(tài)總體中隨機(jī)抽取的容量為n 的一切可能樣本平均數(shù)為中心呈正態(tài)分布。當(dāng)總體標(biāo)準(zhǔn)差已知時(shí),一切可能樣本平均數(shù)與總體平均數(shù)的離差統(tǒng)計(jì)量呈標(biāo)準(zhǔn)正態(tài)分布(6.3 )??傮w標(biāo)準(zhǔn)差的無偏估計(jì)量S 等于樣本統(tǒng)計(jì)量x乘以貝賽耳氏校正數(shù),公式(6.4 )。從正態(tài)總體中隨機(jī)抽取容量為n 的一切可能樣本平均數(shù)的抽樣分布呈正態(tài)分布。當(dāng)總體標(biāo)準(zhǔn)差 未知,需用估計(jì)值S 來代替,于是平均數(shù)標(biāo)準(zhǔn)誤也被平均數(shù)標(biāo)準(zhǔn)誤的估計(jì)值所代替,這時(shí)一切可能樣本平均數(shù)與總體平均數(shù)的離差統(tǒng)計(jì)量呈t 分布( 6.6 )。t 分布與正態(tài)分布的相似之處:t 分布基線上的t
25、值從 - +;從平均數(shù)等于0 處,左側(cè) t 值為負(fù),右側(cè)t 值為正;曲線以平均數(shù)處為最高點(diǎn)向兩側(cè)逐漸下降,尾部無限延伸,永不與基線相接,呈單峰對稱形。區(qū)別之處在于:t 分布的形態(tài)隨自由度(df=n-1 )的變化呈一簇分布形態(tài)(即自由度不同的t分布形態(tài)也不同,見圖6.1 )。自由度逐漸增大時(shí),t分布逐漸接近正態(tài)分布。自由度是指總體參數(shù)估計(jì)量中變量值獨(dú)立自由變化的個(gè)數(shù)。第二節(jié)總體平均數(shù)的參數(shù)估計(jì)一、總體參數(shù)估計(jì)的基本原理1、點(diǎn)估計(jì)用某一樣本統(tǒng)計(jì)量的值來估計(jì)相應(yīng)總體參數(shù)的值叫總體參數(shù)的點(diǎn)估計(jì)。2、區(qū)間估計(jì)以樣本統(tǒng)計(jì)量的抽樣分布(概率分布)為理論依據(jù), 按一定概率要求, 由樣本統(tǒng)計(jì)量的值估計(jì)總體參數(shù)值
26、的所在范圍,稱為總體參數(shù)的區(qū)間估計(jì)。區(qū)間估計(jì)涉及置信水平和置信區(qū)間。二、已知條件下總體平均數(shù)的區(qū)間估計(jì)當(dāng)總體已知,總體呈正態(tài)分布,樣本容量無論大小時(shí),或者當(dāng)總體已知,總體雖不呈正態(tài)分布,但樣本容量較大(n >30 )時(shí),樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計(jì)量均呈正態(tài)分布。區(qū)間估計(jì)的計(jì)算公式為(6.8 )和( 6.9 )。三、未知條件下總體平均數(shù)的區(qū)間估計(jì)1、 未知條件下總體平均數(shù)的區(qū)間估計(jì)的基本原理當(dāng)總體未知,總體呈正態(tài)分布,樣本容量無論大小時(shí),或者當(dāng)總體未知,總體雖不呈正態(tài)分布,但樣本容量較大(n >30 )時(shí),樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計(jì)量均呈t 分布。區(qū)間估計(jì)的計(jì)算公式為(6.1
27、0 )和( 6.11 )。2、小樣本的情況3、大樣本的情況可以用正態(tài)分布近似處理。第三節(jié)假設(shè)檢驗(yàn)的基本原理利用樣本信息,根據(jù)一定概率,對總體參數(shù)或分布的某一假設(shè)作出拒絕或保留的決斷,稱為假設(shè)檢驗(yàn)。一、假設(shè)假設(shè)檢驗(yàn)一般有兩個(gè)相互對立的假設(shè)。即零假設(shè)(或稱原假設(shè)、虛無假設(shè)、解消假設(shè))和備擇假設(shè)(或稱研究假設(shè)、對立假設(shè)) 。假設(shè)檢驗(yàn)是從零假設(shè)出發(fā),視其被拒絕的機(jī)會,從而得出決斷。二、小概率事件把出現(xiàn)小概率的隨機(jī)事件稱為小概率事件。 小概率事件是否出現(xiàn), 這是對假設(shè)作出決斷的依據(jù)。三、顯著性水平拒絕零假設(shè)的概率稱為顯著性水平。顯著性水平和可靠性程度之間的關(guān)系是:兩者之和為 1。四、統(tǒng)計(jì)決斷的兩類錯(cuò)誤及
28、其控制如果拒絕了屬于真實(shí)的零假設(shè),即如果樣本統(tǒng)計(jì)量的總體參數(shù)正是假設(shè)的總體參數(shù),但是由于樣本統(tǒng)計(jì)量的值落入了拒絕區(qū)域。而零假設(shè)遭到拒絕,這時(shí)就會犯第一類型的錯(cuò)誤。這種錯(cuò)誤的可能性大小正是顯著性水平的大小,故又稱這類錯(cuò)誤為錯(cuò)誤。如果保留了屬于不真實(shí)的零假設(shè),就會犯第二類型的錯(cuò)誤。犯這種“假設(shè)屬偽而被保留”的第二類錯(cuò)誤的概率,等于值,故又稱這類錯(cuò)誤為錯(cuò)誤。要使第一類錯(cuò)誤的概率保持在需要的水平上,而控制第二類錯(cuò)誤的概率,有以下方法:(1)利用已知的實(shí)際總體參數(shù)與假設(shè)參數(shù)值之間的大小關(guān)系,合理安排拒絕領(lǐng)域的位置,選擇雙側(cè)檢驗(yàn)還是單側(cè)檢驗(yàn),左側(cè)檢驗(yàn)還是右側(cè)檢驗(yàn);( 2)加大樣本容量。第四節(jié) 總體平均數(shù)的
29、顯著性檢驗(yàn)總體平均數(shù)的顯著性檢驗(yàn)的適用公式與相應(yīng)的參數(shù)估計(jì)一脈相承。一、已知條件下總體平均數(shù)的顯著性檢驗(yàn)(公式 6.3 )二、未知條件下總體平均數(shù)的假設(shè)檢驗(yàn)1、小樣本的情況(公式 6.16 )2、大樣本的情況(公式6.3 )第七章平均數(shù)差異的顯著性檢驗(yàn)第一節(jié)相關(guān)樣本平均數(shù)差異的顯著性檢驗(yàn)兩個(gè)樣本內(nèi)個(gè)體之間存在著一一對應(yīng)的關(guān)系,這兩個(gè)樣本稱為相關(guān)樣本。相關(guān)樣本有以下兩種情況:( 1)用同一測驗(yàn)對同一組被試在試驗(yàn)前后進(jìn)行兩次測驗(yàn),所獲得的兩組測驗(yàn)結(jié)果是相關(guān)樣本。( 2)根據(jù)某些條件基本相同的原則,把被試一一匹配成對,然后將每對被試隨機(jī)地分入實(shí)驗(yàn)組和對照組,對兩組被試施行不同的實(shí)驗(yàn)處理之后,用同一測
30、驗(yàn)所獲得的測驗(yàn)結(jié)果,也是相關(guān)樣本。相關(guān)樣本平均數(shù)差異的顯著性檢驗(yàn)方法和步驟:( 1)提出假設(shè)( 2)選擇檢驗(yàn)統(tǒng)計(jì)量并計(jì)算其值。在小樣本情況下,其檢驗(yàn)統(tǒng)計(jì)量為公式(7.9 );在大樣本情況下用公式(7.12 )。( 3)確定檢驗(yàn)形式( 4)統(tǒng)計(jì)決斷第二節(jié)獨(dú)立樣本平均數(shù)差異的顯著性檢驗(yàn)兩個(gè)樣本內(nèi)的個(gè)體是隨機(jī)抽取的,它們之間不存在一一的對應(yīng)關(guān)系,這樣的兩個(gè)樣本稱為獨(dú)立樣本。一、獨(dú)立大樣本平均數(shù)差異的顯著性檢驗(yàn)兩個(gè)樣本容量n1 和 n1 都大于 30 的獨(dú)立樣本稱為獨(dú)立大樣本。獨(dú)立大樣本平均數(shù)差異的顯著性檢驗(yàn)所用的公式是(7.17 )。二、獨(dú)立小樣本平均數(shù)差異的顯著性檢驗(yàn)兩個(gè)樣本容量n1 和 n1 均
31、小于 30,或其中一個(gè)小于30 的獨(dú)立樣本稱為獨(dú)立小樣本。獨(dú)立小樣本平均數(shù)差異的顯著性檢驗(yàn)方法:1、方差齊性時(shí)如果兩個(gè)獨(dú)立樣本的總體方差未知,經(jīng)方差齊性檢驗(yàn)表明兩個(gè)總體方差相等,公式為( 7.23 )( 7.25 ),這三個(gè)公式是等價(jià)的。2、方差不齊性時(shí)則統(tǒng)計(jì)量對于方差不齊性的兩個(gè)獨(dú)立樣本平均數(shù)差異顯著性檢驗(yàn),需要用校正的t'作為檢驗(yàn)統(tǒng)計(jì)量,用公式(7.26 ), t' 的臨界值則用公式(7.29 )和( 7.32 )來計(jì)算。第三節(jié)方差齊性檢驗(yàn)一、 F分布若從方差相同的兩個(gè)正態(tài)總體中,隨機(jī)抽取兩個(gè)獨(dú)立樣本,以此為基礎(chǔ), 分別求出兩個(gè)相應(yīng)總體總體方差的估計(jì)值,這兩個(gè)總體方差估計(jì)值
32、的比值稱為F 比值, F 比值的抽樣分布稱為 F 分布。 F 分布的形態(tài)隨F 比值分子和分母中自由度的變化而形成一簇正偏態(tài)分布。一般情況下, 經(jīng)常應(yīng)用的是右側(cè) F 檢驗(yàn),計(jì)算 F 值時(shí),將大的總體方差估計(jì)值作為分子,小的作為分母。二、兩個(gè)獨(dú)立樣本的方差齊性檢驗(yàn)用公式( 7.35 )。三、兩個(gè)相關(guān)樣本的方差齊性檢驗(yàn)用公式( 7.38 )。第八章方差分析第一節(jié)方差分析的基本原理一、方差分析的目的方差分析的基本功能就在于它對多組平均數(shù)差異的顯著性進(jìn)行檢驗(yàn)的作用。二、方差分析的邏輯組間差異對組內(nèi)差異的比值越大, 則各組平均數(shù)的差異就越明顯。 通過對組間差異與組內(nèi)差異比值的分析,來推斷幾個(gè)相應(yīng)平均數(shù)差異
33、的顯著性,這就是方差分析的邏輯。三、以 F 檢驗(yàn)來推斷幾個(gè)平均數(shù)差異的顯著性四、方差分析中的幾個(gè)概念實(shí)驗(yàn)中的自變量稱為因素。只有一個(gè)自變量的實(shí)驗(yàn)稱為單因素實(shí)驗(yàn)。有兩個(gè)或兩個(gè)以上自變量的實(shí)驗(yàn)稱為多因素實(shí)驗(yàn)。某一個(gè)因素的不同情況稱為因素的“水平” 。包括量差或質(zhì)別兩類情況,按各個(gè)“水平”條件進(jìn)行的重復(fù)實(shí)驗(yàn)稱為各種處理。第二節(jié)完全隨機(jī)設(shè)計(jì)的方差分析為了檢驗(yàn)?zāi)骋粋€(gè)因素多種不同水平間的差異的顯著性, 將從同一個(gè)總體中隨機(jī)抽取的被試,再隨機(jī)地分入各實(shí)驗(yàn)組, 施以各種不同的實(shí)驗(yàn)處理以后, 用方差分析法對這多個(gè)獨(dú)立樣本平均數(shù)差異的顯著性進(jìn)行檢驗(yàn),稱為完全隨機(jī)設(shè)計(jì)的方差分析。一、 n 相等的情況用公式( 8.4
34、 ) - ( 8.6 )。二、 n 不相等的情況用公式( 8.7 ) - ( 8.8 )。三、運(yùn)用樣本統(tǒng)計(jì)量進(jìn)行組間與組內(nèi)方差的F 檢驗(yàn)用第 181 頁上的公式。第三節(jié)隨機(jī)區(qū)組設(shè)計(jì)的方差分析用方差分析法對多個(gè)相關(guān)樣本平均數(shù)差異所進(jìn)行的顯著性檢驗(yàn), 稱之為隨機(jī)區(qū)組設(shè)計(jì)的方差分析每一區(qū)組內(nèi)被試的人數(shù)分配有以下三種方式:( 1)一個(gè)被試作為一個(gè)區(qū)組;( 2)每一區(qū)組內(nèi)被試的人數(shù)是實(shí)驗(yàn)處理數(shù)的整數(shù)倍;( 3)區(qū)組內(nèi)以一個(gè)團(tuán)體為一個(gè)基本單元。區(qū)組平方和等數(shù)據(jù)的計(jì)算用公式(8.9 ) - ( 8.11 )。第四節(jié)對多組平均數(shù)的逐對差異檢驗(yàn),一、完全隨機(jī)設(shè)計(jì)的q 檢驗(yàn)公式( 8.14 )或( 8.15 )。
35、二、隨機(jī)區(qū)組設(shè)計(jì)的q 檢驗(yàn)公式( 8.16 )。各個(gè)平均數(shù)差異的顯著性檢驗(yàn)以 Newman-Keul 提出的 q 檢驗(yàn)法(或稱N-K)最為常用。第五節(jié)多組方差的齊性檢驗(yàn)多組方差的顯著性可以用哈特萊(Hartley)所提出的最大F 值檢驗(yàn)法進(jìn)行齊性檢驗(yàn)。公式( 8.17 )。第六節(jié)多因素方差分析簡介一、多因素方差分析的功能多因素方差分析不僅可以檢驗(yàn)各個(gè)因素對因變量作用的顯著性,而且還可以檢驗(yàn)因素與因素間共同結(jié)合對因變量發(fā)生交互作用的顯著性。二、雙因素完全隨機(jī)設(shè)計(jì)方差分析的基本方法計(jì)算時(shí)使用公式(8.18 )- ( 8.20 )和第 204-205 頁上的公式。第九章第一節(jié)總體比率的推斷比率的抽樣
36、分布一、數(shù)據(jù)的特點(diǎn)對點(diǎn)計(jì)數(shù)據(jù)的統(tǒng)計(jì)推斷,應(yīng)采用總體比率的推斷方法或卡方檢驗(yàn)。當(dāng)事物僅被劃分成兩類,可用總體比率的推斷進(jìn)行統(tǒng)計(jì)推斷;當(dāng)事物被劃分為成兩類以上時(shí),則需用卡方檢驗(yàn)進(jìn)行統(tǒng)計(jì)推斷。當(dāng)然卡方檢驗(yàn)也可以對僅有兩種類別的資料進(jìn)行統(tǒng)計(jì)推斷。二、比率的抽樣分布比率的抽樣分布是二項(xiàng)分布。當(dāng)p=q,無論n 的大小,二項(xiàng)分布呈對稱形;當(dāng)p <q 且np5,或 p >q 且 np5時(shí),二項(xiàng)分布已經(jīng)開始接近正態(tài)分布。三、比率的標(biāo)準(zhǔn)誤比率的標(biāo)準(zhǔn)誤是由二項(xiàng)分布的標(biāo)準(zhǔn)差除以n 而獲得。第二節(jié)總體比率的區(qū)間估計(jì)一、正態(tài)近似法公式( 9.3 )( 9.5 )。二、查表法用附表 6。第三節(jié)總體比率的假設(shè)檢驗(yàn)
37、一、正態(tài)近似法公式( 9.6 )( 9.5 )。二、查表法用附表 6。第四節(jié)總體比率差異的顯著性檢驗(yàn)一、兩個(gè)獨(dú)立樣本比率差異的顯著性檢驗(yàn)兩個(gè)獨(dú)立樣本比率差異的標(biāo)準(zhǔn)誤:公式(9.8 )。如果兩個(gè)獨(dú)立樣本的最小頻數(shù)都等于或大于5,兩個(gè)樣本比率之差的抽樣分布也接近于正態(tài),于是可用Z 檢驗(yàn)兩個(gè)比率之差的顯著性。其檢驗(yàn)統(tǒng)計(jì)量為公式(9.11 )。二、兩個(gè)相關(guān)樣本比率差異的顯著性檢驗(yàn)兩個(gè)相關(guān)樣本比率之差的檢驗(yàn)公式為(9.13 )。第十章第一節(jié)卡方檢驗(yàn) 2 及其分布一、卡方檢驗(yàn)的特點(diǎn)卡方檢驗(yàn)是對樣本的頻數(shù)分布所來自的總體分布是否服從某種理論分布或某種假設(shè)分布所作的假設(shè)檢驗(yàn)。即根據(jù)樣本的頻數(shù)分布來推斷總體的分
38、布。它屬于自由分布的非參數(shù)檢驗(yàn)。它可以處理一個(gè)因素分為多種類別,或多種因素各有多種類別的資料。所以, 凡是可以應(yīng)用比率進(jìn)行檢驗(yàn)的資料,都可以用卡方檢驗(yàn)。二、卡方檢驗(yàn)的統(tǒng)計(jì)量卡方檢驗(yàn)統(tǒng)計(jì)量的基本形式為公式(10.1 )。 2 值有以下幾個(gè)特點(diǎn):( 1)2值具有可加性。( 2)2值永遠(yuǎn)是正值。( 3)2值的大小隨實(shí)際頻數(shù)與理論頻數(shù)差的大小而變化。三、 2 的抽樣分布 2 分布有以下幾個(gè)特點(diǎn):( 1)2分布呈正偏態(tài),右側(cè)無限延伸,但永不與基線相交。( 2)2分布隨自由度的變化而形成一簇分布形態(tài)。自由度越小,2 分布偏斜度越大;自由度越大,2分布形態(tài)越趨于對稱。第二節(jié)單向表的卡方檢驗(yàn)把實(shí)得的點(diǎn)計(jì)數(shù)據(jù)按
39、一種分類標(biāo)準(zhǔn)編制成表就是單向表。 對于單向表的數(shù)據(jù)所進(jìn)行的卡方檢驗(yàn)就是單向表的卡方檢驗(yàn),即單因素的卡方檢驗(yàn)。一、按一定比率決定理論頻數(shù)的卡方檢驗(yàn)二、一個(gè)自由度的卡方檢驗(yàn)當(dāng) df=1 ,其中只有一個(gè)組的 ft <5 ,就要運(yùn)用亞茨( Yates )連續(xù)性校正法( 10.2 )。三、頻數(shù)分布正態(tài)性的卡方檢驗(yàn)第三節(jié)雙向表的卡方檢驗(yàn)把實(shí)得的點(diǎn)計(jì)數(shù)據(jù)按兩種分類標(biāo)準(zhǔn)編制成的表就是雙向表。 對雙向表的數(shù)據(jù)進(jìn)行的卡方檢驗(yàn),就是雙向表的卡方檢驗(yàn),即雙因素的卡方檢驗(yàn)。在雙向表的卡方檢驗(yàn)中,如果要判斷兩種分類特征,即兩個(gè)因素之間是否有依從關(guān)系,這種檢驗(yàn)稱為獨(dú)立性卡方檢驗(yàn)。在雙向表卡方檢驗(yàn)中, 如果是判斷幾次重
40、復(fù)實(shí)驗(yàn)的結(jié)果是否相同, 這種卡方檢驗(yàn)稱為同質(zhì)性檢驗(yàn)。雙向表的獨(dú)立性卡方檢驗(yàn)和同質(zhì)性卡方檢驗(yàn),只是檢驗(yàn)的意義不同,而方法完全相同,都應(yīng)用公式( 10.3 )或( 10.4 )。對于同一組數(shù)據(jù)所進(jìn)行的卡方檢驗(yàn),有時(shí)即可以理解為獨(dú)立性卡方檢驗(yàn),又可以理解為同質(zhì)性檢驗(yàn),兩者無本質(zhì)區(qū)別。第四節(jié)四格表的卡方檢驗(yàn)一、獨(dú)立樣本四格表的卡方檢驗(yàn)獨(dú)立樣本四格表的卡方檢驗(yàn),就是雙向表中2*2 表的卡方檢驗(yàn)。 它即可以用縮減公式由實(shí)際頻數(shù)直接計(jì)算2值,又可以用上述求理論頻數(shù)的方法計(jì)算2值。1縮減公式2值的計(jì)算獨(dú)立樣本四格表2 值的縮減公式為(10.6 )。2校正 2值的計(jì)算當(dāng) df=1 ,樣本容量總和N <30
41、 或 N <50 時(shí)(決定于對檢驗(yàn)結(jié)果要求的嚴(yán)格程度),應(yīng)對2值進(jìn)行亞茨連續(xù)性校正。其校正公式為(10.7 )。二、相關(guān)樣本四格表的卡方檢驗(yàn)1縮減公式2值的計(jì)算相關(guān)樣本四格表2 值的縮減公式為(10.8 )。2校正 2值的計(jì)算當(dāng) df=1 ,兩個(gè)相關(guān)樣本四格表中(b+c) <30或 (b+c) <50(決定于對檢驗(yàn)結(jié)果要求的嚴(yán)格程度),應(yīng)對 2值進(jìn)行亞茨連續(xù)性校正。其校正公式(10.9 )。第十一章相關(guān)分析第一節(jié)相關(guān)的意義一、相關(guān)的概念兩個(gè)變量之間不精確、不穩(wěn)定的變化關(guān)系稱為相關(guān)關(guān)系。二、相關(guān)系數(shù)用來描述兩個(gè)變量相互之間變化方向及密切程度的數(shù)字特征量稱為相關(guān)系數(shù)。 一般用 r
42、 表示。相關(guān)系數(shù)的值, 僅僅是一個(gè)比值。它不是由相等單位度量而來 (即不等距),也不是百分比,因此,不能直接作加、減、乘、除。相關(guān)系數(shù)只能描述兩個(gè)變量之間的變化方向及密切程度, 并不能揭示二者之間的內(nèi)在本質(zhì)聯(lián)系。第二節(jié)積差相關(guān)一、概念及其適用范圍1積差相關(guān)的概念當(dāng)兩個(gè)變量都是正態(tài)連續(xù)變量, 而且兩者之間呈線性關(guān)系, 表示這兩個(gè)變量之間的相關(guān)稱為積差相關(guān)。2積差相關(guān)使用的條件( 1)兩個(gè)變量都第十二章回歸分析第一節(jié)一元線性回歸一元線性回歸是指只有一個(gè)自變量的線性回歸。一、回歸線一條最能代表散點(diǎn)圖上分布趨勢的直線, 這條最優(yōu)擬合線即稱為回歸線。 常用的擬合這條回歸線的原則,就是使各點(diǎn)與該線縱向距離
43、的平方和為最小。二、回歸方程確定回歸線的方程稱回歸方程。1用最小二乘方法求回歸系數(shù)公式( 12.2a )或( 12.2b )。2. 求截距公式( 12.3a )或( 12.3b )。三、用原始數(shù)據(jù)計(jì)算回歸系數(shù)公式( 12.4a )或( 12.4b )。第二節(jié)一元線性回歸方程的檢驗(yàn)一、估計(jì)誤差的標(biāo)準(zhǔn)差公式( 12.9 )。二、一元線性回歸方程檢驗(yàn)的方法一元線性回歸方程檢驗(yàn)有三種等效的方法:( 1)對回歸方程進(jìn)行方差分析;( 2)對兩個(gè)變量的相關(guān)系數(shù)進(jìn)行與總體零相關(guān)的顯著性檢驗(yàn);( 3)對回歸系數(shù)進(jìn)行顯著性檢驗(yàn)三、一元線性回歸系數(shù)顯著性檢驗(yàn)方法在回歸線上, 當(dāng)與所有自變量 X 相對應(yīng)的各組因變量
44、Y 的殘值都呈正態(tài)分布, 并且殘值方差為齊性時(shí), 由 X 估計(jì) Y 回歸系數(shù)的標(biāo)準(zhǔn)誤為公式 ( 12.11 )或(12.12 )??梢杂霉剑?2.13 )或公式( 12.14 )進(jìn)行顯著性檢驗(yàn)。三、測定系數(shù)測定系數(shù)指回歸平方和在總平方和中所占比例, 這個(gè)比例越大, 意味著誤差平方和所占比例越小,預(yù)測效果就越好。測定系數(shù)同時(shí)等于相關(guān)系數(shù)的平方。第三節(jié)一元線性回歸方程的應(yīng)用一、用樣本回歸方程推算因變量的回歸值二、對因變量真值的預(yù)測第四節(jié)多元線性回歸簡介一、二元線性回歸方程1二元線性回歸方程的意義二元線性回歸方程是指Y 對 X1 與 X2 的線性回歸方程。2. 二元線性回歸方程的建立原理和一元線性
45、回歸方程一樣,二元線性回歸方程也用最小二乘法來確定回歸系數(shù)。用公式(12.25a )和( 12.25b )。3. 二元線性標(biāo)準(zhǔn)回歸方程為了比較兩個(gè)自變量在估計(jì)預(yù)測因變量時(shí)所起作用的大小, 需要將三個(gè)變量分別轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù), 然后比較由標(biāo)準(zhǔn)分?jǐn)?shù)所建立的標(biāo)準(zhǔn)回歸方程中的兩個(gè)標(biāo)準(zhǔn)回歸系數(shù), 以此判斷兩個(gè)自變量作用的大小。二、二元線性回歸的檢驗(yàn)二元線性回歸的檢驗(yàn)包括兩個(gè)方面: 一是檢驗(yàn)回歸方程的顯著性; 另一是檢驗(yàn)兩個(gè)偏回歸系數(shù)的顯著性。(一)二元線性回歸的檢驗(yàn)二元線性回歸方程的顯著性有兩種等效的檢驗(yàn)方法: 一是方差分析, 二是復(fù)相關(guān)系數(shù)顯著性檢驗(yàn)。復(fù)相關(guān)系數(shù)表示兩個(gè)自變量組合起來與因變量之間的相關(guān)程
46、度。 可通過對二元測定系數(shù)開平方根得到,然后通過查表進(jìn)行顯著性檢驗(yàn)。(二)偏回歸系數(shù)的顯著性檢驗(yàn)兩個(gè)偏回歸系數(shù)的顯著性檢驗(yàn)公式為(12.29a )和( 12.29b )。三、多元線性回歸方程中自變量的選擇1. 從組成回歸方程的所有自變量中選擇最優(yōu)的自變量對所有可能的回歸方程逐一檢驗(yàn),選擇一個(gè)顯著性程度最強(qiáng)的方程。2. 逐步回歸逐步回歸的原理是按每個(gè)自變量對因變量的作用,從大到小逐個(gè)地引入回歸方程,每引入一個(gè)自變量要對回歸方程中的每一個(gè)自變量都進(jìn)行顯著性檢驗(yàn) (即對其偏回歸系數(shù)進(jìn)行顯著性檢驗(yàn))。這樣逐步地引入自變量, 并剔除不顯著的自變量, 直至將所有的自變量都引入,并將不顯著的自變量都剔除為止
47、,最后形成的回歸方程就是最優(yōu)方程。第十三章非參數(shù)檢驗(yàn)假設(shè)檢驗(yàn)的方法有兩種:參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)。在實(shí)際研究工作中, 樣本所屬的總體分布形態(tài)一般是未知的, 所獲得的資料也不一定是等距變量或比率變量, 因此需要采用新的統(tǒng)計(jì)方法進(jìn)行檢驗(yàn)。 這種檢驗(yàn)方法不要求樣本所屬的總體呈正態(tài)分布,一般也不是對總體進(jìn)行檢驗(yàn),故稱之為自由分布的非參數(shù)檢驗(yàn)方法。非參數(shù)檢驗(yàn)不僅適用于非正態(tài)總體名義變量和次序變量的資料, 而且也適用于正態(tài)總體等距變量和比率變量的資料。故應(yīng)用廣泛,但靈敏度和精確度不如參數(shù)檢驗(yàn)。第一節(jié)符號檢驗(yàn)符號檢驗(yàn)是通過多兩個(gè)相關(guān)樣本的每對數(shù)據(jù)之差的符號(正號或負(fù)號) 進(jìn)行檢驗(yàn), 以比較這兩個(gè)樣本差異的顯著
48、性。一、小樣本的情況當(dāng)樣本容量較小,n <25 時(shí),可用查表法進(jìn)行符號檢驗(yàn)。二、大樣本的情況對差數(shù)的正號與負(fù)號差異的檢驗(yàn)本屬于二項(xiàng)分布的問題,當(dāng)樣本容量較大,即n >25時(shí),二項(xiàng)分布接近正態(tài)分布,因此可以用正態(tài)分布近似處理,公式用(13.2 )。第二節(jié)符號秩序檢驗(yàn)威爾科克遜 ( F.Wilcoxon )提出了既考慮差數(shù)符號,又考慮差數(shù)大小的符號秩次檢驗(yàn)法。一、小樣本的情況當(dāng)樣本容量n <25 時(shí),可用查表法進(jìn)行符號秩次檢驗(yàn)。二、大樣本的情況當(dāng)樣本容量n >25 時(shí),二項(xiàng)分布接近與正態(tài)。于是可用正態(tài)分布近似處理。檢驗(yàn)統(tǒng)計(jì)量為公式(13.5 )。第三節(jié)當(dāng)比較兩個(gè)獨(dú)立樣本的差異時(shí),可以采用曼檢驗(yàn)方法。又稱曼- 惠特尼 U 檢驗(yàn)法。一、小樣本的情況當(dāng)兩個(gè)獨(dú)立樣本的容量n1 和 n2 都小于二、大樣本的情況秩和檢驗(yàn)- 惠特尼( Mann-Whitney )兩人提出的秩和10,并且 n1n2 時(shí),可以用查表法。當(dāng)兩個(gè)獨(dú)立樣本的n1 和 n2 都大于 10,T 分布接近與正態(tài),對于兩個(gè)樣本的差異可以用正態(tài)分布的Z 比率進(jìn)行檢驗(yàn)。公式(13.8 )。第四節(jié)中位數(shù)檢驗(yàn)中位數(shù)的檢驗(yàn)方法是將各組樣
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 野生動(dòng)物疫病監(jiān)測與獸醫(yī)公共衛(wèi)生考核試卷
- 軟件測試工程師考試輕松掌握試題及答案
- 焙烤食品制造企業(yè)的營銷渠道與客戶關(guān)系管理考核試卷
- 公路工程生態(tài)設(shè)計(jì)理念試題及答案
- 船舶設(shè)計(jì)與仿真技術(shù)考核試卷
- 嵌入式開發(fā)實(shí)現(xiàn)中的思維方式探討試題及答案
- 現(xiàn)代數(shù)據(jù)庫與網(wǎng)絡(luò)服務(wù)整合試題及答案
- 大學(xué)公寓社區(qū)管理制度
- 公司現(xiàn)場定置管理制度
- 計(jì)算機(jī)二級MySQL實(shí)務(wù)題目及答案
- 濟(jì)南出入境檢驗(yàn)檢疫局國際旅行衛(wèi)生保健中心
- (全冊完整16份)北師大版五年級下冊100道口算題大全
- 維修電工求職簡歷
- 人教版歷史八年級上冊知識點(diǎn)
- 麻醉藥品和精神藥品培訓(xùn)試題
- GB/T 799-2020地腳螺栓
- 非小細(xì)胞肺癌寡轉(zhuǎn)移灶中立體定向放療的運(yùn)用,放射醫(yī)學(xué)論文
- 遠(yuǎn)足拉練動(dòng)員大會課件
- 出租房屋安全檢查記錄
- 夏季養(yǎng)胃知識課件
- 人教版PEP六年級英語下冊單詞聽寫(帶四線格)
評論
0/150
提交評論