《心理統(tǒng)計(jì)學(xué)》總復(fù)習(xí)要點(diǎn)_第1頁
《心理統(tǒng)計(jì)學(xué)》總復(fù)習(xí)要點(diǎn)_第2頁
《心理統(tǒng)計(jì)學(xué)》總復(fù)習(xí)要點(diǎn)_第3頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、心理統(tǒng)計(jì)學(xué)總復(fù)習(xí)要點(diǎn)第一章、第二章基本概念及次數(shù)分布表第一節(jié)基本概念一、基本概念1.連續(xù)變量與離散變量(不連續(xù)變量)變量分為連續(xù)變量與離散變量(不連續(xù)變量)。連續(xù)變量則可以在量表上的任何兩點(diǎn)加以細(xì)分,可以取得無限多個大小不同的數(shù)值。不連續(xù)變量乂稱離散變量或問斷變量,則在量表上的任何兩點(diǎn)中只能取得有限個數(shù)值。是一種只能取特殊值而不能取任何值的變量,它代表一個點(diǎn),而不是一段距離。2. 總體、樣本、個體總體是指具有某一種特征的一類事物的全體,構(gòu)成總體的每一個基本元素稱為個體,在總體中按一定規(guī)則抽取的一部分個體,稱為總體的一個樣本。二、測量水平心理測量的工具一般可以分為四種水平,它們是由測量工具一一量

2、尺的水平?jīng)Q定的,量尺也稱為尺度。()量尺(RatioMeasurement)用這樣的量尺測量出的數(shù)據(jù),可以進(jìn)行加、減、乘和除運(yùn)算。這種測量水平的數(shù)據(jù)特征是有相等單位和絕對零點(diǎn)。用這種量尺測量得到的數(shù)據(jù)變量為比率(或等比)變量。(二)等距量尺(IntervalMeasurement)只有相等單位.沒有絕對零點(diǎn).這種測量工具稱為等距量尺。等距量尺測出的數(shù)據(jù)可以進(jìn)行加和減的運(yùn)算,而不能進(jìn)行乘和除的運(yùn)算。但是,等距數(shù)據(jù)的差值可以進(jìn)行乘、除運(yùn)算,因?yàn)榈染鄶?shù)據(jù)的差值有一個絕對零點(diǎn),兩個數(shù)值相等,差值即為零。用這種量尺測量得到的數(shù)據(jù)變量為等距變量。(三)順序量尺(OrdinalMeasurement)順序量

3、尺乂叫等級量尺,它的特點(diǎn)是:既無絕對零點(diǎn),乂無相等單位。用這種量尺對研究對象進(jìn)行測量,只能給對象排個順序。順序量尺的測量結(jié)果原則上不能進(jìn)行加、減、乘、除四則運(yùn)算。如有必要的話,只能進(jìn)行不等式運(yùn)算。用這種量尺測量得到的數(shù)據(jù)變量為順序變量。(四)分類量尺(NominalMeasurement)分類測量不包含任何類問數(shù)量關(guān)系的假定,僅僅是把測量對象分為相同或相異,但在性質(zhì)上沒有哪一類較大,哪一類較小之分。即無大小之分,也無等級之分。分類標(biāo)準(zhǔn)稱為分類量尺。用這種量尺得到的數(shù)據(jù)變量為分類(或名義)變量。三、常見數(shù)據(jù)的特點(diǎn)1. (一)數(shù)據(jù)分類與特點(diǎn)計(jì)數(shù)數(shù)據(jù)(1) 概念:是指計(jì)算個數(shù)的數(shù)據(jù)。(2) 特點(diǎn):是

4、非連續(xù)的離散數(shù)據(jù)。它的統(tǒng)計(jì)方法具有獨(dú)特性。2. 測量數(shù)據(jù)測量數(shù)據(jù)是指借助于一定測量工具或依據(jù)一定測量標(biāo)準(zhǔn)所獲得的數(shù)據(jù)。(1) 等比數(shù)據(jù):指具有測量的絕對零點(diǎn),乂有相等單位的測量數(shù)據(jù)。(2) 等距數(shù)據(jù):指沒有測量的絕對零點(diǎn),只有相等單位的測量數(shù)據(jù)。(3) 等級數(shù)據(jù):是指只依據(jù)數(shù)據(jù)的大小、高低、快慢等屆性排出順序的數(shù)據(jù)。3. 數(shù)據(jù)特點(diǎn)(1) 隨機(jī)性教育與心理研究中的數(shù)據(jù)具有隨機(jī)性,即在相同的實(shí)驗(yàn)條件下,或同一個人對同一個刺激的反應(yīng)事先無法確定,具有偶然性,而且觀測到的數(shù)據(jù)不止一個,是隨機(jī)波動的。(2) 離散性教育與心理研究中的每一個數(shù)據(jù)都是離散的,并不連續(xù)。即在相同的實(shí)驗(yàn)條件下,或?qū)ν粋€刺激,不

5、同人的反應(yīng)是不同的,數(shù)據(jù)分散。(3) 變異性數(shù)據(jù)的變異性是指數(shù)據(jù)的波動有一定的規(guī)律,在一定范圍內(nèi)波動。因此波動是可以預(yù)測的。四、統(tǒng)計(jì)圖(一) 條形圖(BarCharts)它主要用于表示離散性變量的統(tǒng)計(jì)事項(xiàng)。條形圖用寬度相同的長條的長短表示各事物問數(shù)量的大小與數(shù)量之間的差異。(二) 圓形圖(PieCharts)乂稱作餅圖。適用于問斷性的數(shù)據(jù)資料,它以單位圓內(nèi)各扇形面積所占整個圓形面積的白分比來表示各統(tǒng)計(jì)事項(xiàng)在其總體中所占相應(yīng)比例的一種圖示方法。(三) 線形圖(Line)線形圖是以起伏的折線來表示某種事物的發(fā)展變化及演變趨勢的統(tǒng)計(jì)圖。適用于連續(xù)性資料。(四) 直方圖(Histogram)直方圖是表

6、示連續(xù)性資料的頻數(shù)分配,它是以各組上下限上矩形的面積表示頻數(shù)分配的一種條形圖,是統(tǒng)計(jì)學(xué)中常用而乂有特殊意義的一種統(tǒng)計(jì)圖。(五) 散點(diǎn)圖(Scatter)乂稱點(diǎn)圖,散點(diǎn)圖是用平面直角坐標(biāo)系上點(diǎn)的散布圖形來表示兩種事物之間的相關(guān)性及聯(lián)系模式。散點(diǎn)圖適合于描述二元變量的觀測數(shù)據(jù)。第三節(jié)次數(shù)分布表與次數(shù)分布圖所謂次數(shù)分布,指的是一批數(shù)據(jù)中各個不同數(shù)值所出現(xiàn)的次數(shù)情況,或者是指一批數(shù)據(jù)在量尺上各等距區(qū)組內(nèi)所出現(xiàn)的次數(shù)情況。對數(shù)據(jù)進(jìn)行分組歸類,考察數(shù)據(jù)在量尺上各等距區(qū)組內(nèi)的次數(shù)分布情況,并把這種情況用規(guī)范的表格形式加以體現(xiàn),則為次數(shù)分布表,其實(shí)質(zhì)是反映一批數(shù)據(jù)在各等距區(qū)組內(nèi)的次數(shù)分布結(jié)構(gòu)。若用圖形來表達(dá),

7、那就叫做次數(shù)分布圖。1. 一、次數(shù)分布表次數(shù)分布表的編制步驟求全距(Rang(或兩極差)全距指在一批數(shù)據(jù)中最大數(shù)與最小數(shù)之間的差距,用符號R表示,計(jì)算公式為:2. R=Max-Min定組數(shù)定組數(shù)就是要確定一下把整批數(shù)據(jù)劃分為多少個等距的區(qū)組,用符號K表示,它的大小要看數(shù)據(jù)的多少而定。如果數(shù)據(jù)來自正態(tài)總體,則可利用下述經(jīng)驗(yàn)公式來確定組數(shù):K=1.87(N一1)2/5上述公式中的N為數(shù)據(jù)個數(shù)。3. 定組距4. 組距用符號i表示,其一般原則是取奇數(shù)或5的倍數(shù):i=R/K列出分組區(qū)問(組限)組限是每個組的起始點(diǎn)界限。要求是:(1)高區(qū)間內(nèi)包含最大值,最低區(qū)間包含最小值。(2)最高組和最低組的下限最好是

8、組距的整倍數(shù)。5. 求組中值6. 組中值是各組上下限的中點(diǎn)的數(shù)值,其計(jì)算公式為組中值=(組實(shí)上限十組實(shí)下限)/2登記頻數(shù)設(shè)計(jì)一個表的格式來記錄上述有關(guān)結(jié)果并對數(shù)據(jù)進(jìn)行歸類劃記。(二)相對次數(shù)(頻數(shù))和白分次數(shù)分布表相對次數(shù)就是各組的次數(shù)f與總次數(shù)N之間的比值,若以Rf表示相對次數(shù),則Rf=f/N相對(頻數(shù))分布表包括:組別,組中值,頻數(shù)。相對次數(shù)是一個小數(shù),如果將每個相對次數(shù)乘以白分之白,就可以得到相對應(yīng)的白分次數(shù)。相對次數(shù)分布表的用途:相對次數(shù)分布表主要能反映各組數(shù)據(jù)的白分比結(jié)構(gòu)。(三)實(shí)際累積次數(shù)分布表(Cumulative)累計(jì)次數(shù)分布表分為實(shí)際累積次數(shù)分布表和相對累積次數(shù)分布表。實(shí)際累

9、積次數(shù)分布表乂分為上限以下實(shí)際累積次數(shù)分布表和下限以上實(shí)際累積次數(shù)分布表。(1)上限以下實(shí)際累積次數(shù)分布表從簡單次數(shù)分布表的第一組逐項(xiàng)向上累加,得出每一組的累加值,一直加到最高一組,就構(gòu)成一個累積次數(shù)分布表。(2)下限以上實(shí)際累積次數(shù)分布表方法同上限以下累積次數(shù)分布表,但方向相反。(四)、相對累積次數(shù)分布表累積相對次數(shù)是對相對次數(shù)進(jìn)行累積的結(jié)果。相對累積次數(shù)分布表也分為上限以下相對累積次數(shù)分布表和下限以上相對累積次數(shù)分布表。1. 上限以下相對累積次數(shù)分布表上限以下相對累積次數(shù)分布表是從最低絹.往最高絹.的方向依次把有關(guān)各絹.的相對次數(shù)進(jìn)行累加的結(jié)果。2. 下限以上相對累積次數(shù)分布表下限以上相對

10、累積次數(shù)分布表是從最高絹.往最低絹.的方向依次把有關(guān)各絹.的相對次數(shù)進(jìn)行累加的結(jié)果。二、次數(shù)分布圖次數(shù)直方圖次數(shù)多邊圖累積次數(shù)直方圖累加次數(shù)曲線相對累加次數(shù)曲線第三章集中趨勢的度雖第一節(jié)集中量數(shù)一組數(shù)據(jù)常用兩類統(tǒng)計(jì)量來表現(xiàn)數(shù)據(jù)的特征。一類是表現(xiàn)數(shù)據(jù)的集中性質(zhì)或集中程度;另一類是表現(xiàn)的數(shù)據(jù)離散性質(zhì)或離散程度。(1)集中性質(zhì)數(shù)據(jù)的集中趨勢的度量是指用一組數(shù)據(jù)的中心位置來度量一組數(shù)據(jù)的集中趨勢,或是描述它們的中心位丁何處。描述數(shù)據(jù)集中情況的統(tǒng)計(jì)量有多種,包括算術(shù)平均數(shù)、中數(shù)、眾數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)、加權(quán)平均數(shù)等。(2)離散性質(zhì)離散性反映一組數(shù)據(jù)的分散程度,即次數(shù)分布的離散程度。對其數(shù)量化描述稱

11、為次數(shù)分布變異特性的度量或差異量數(shù)。中心位置相同的次數(shù)分布,其離散程度不一定相同。一、算術(shù)平均數(shù)(Mear)算術(shù)平均數(shù)簡稱為平均數(shù),也稱其為均數(shù)或均值,常用字母u或X表示。算術(shù)平均數(shù)是用以度量連續(xù)變量次數(shù)分布的集中趨勢的最常用的集中量數(shù)。它是“真值”漸近、最佳的估計(jì)值。公式:算術(shù)平均數(shù)的性質(zhì):1.在一組數(shù)據(jù)中每個變量與平均數(shù)之差(稱為離均差)的總和等丁0。2. Ixi=0o在一組數(shù)據(jù)中,每一個數(shù)都加上一常數(shù)C,則所得的平均數(shù)為原來的平均數(shù)加常數(shù)C:3. r(xi+c)=x+CN在一組數(shù)據(jù)中,每一個數(shù)都乘以一個常數(shù)C,則所得的平均數(shù)為原來的平均數(shù)乘以常數(shù)C:I(Xi-C)=CZXi=C-XNN(

12、二)加權(quán)平均數(shù)加權(quán)平均數(shù)計(jì)算公式為:Mw=W1X1+W2X2+WnXn=KWiXiW1+W2+WnMWi式中:Wi為權(quán)重,所謂權(quán)數(shù)是指各變量在構(gòu)成總體中的相對重要性。(三) 幾何平均數(shù)(Geometricmean)幾何平均數(shù)符號記作Mg有時乂稱作對數(shù)平均數(shù)。1. 幾何平均數(shù)的應(yīng)用條件當(dāng)處理的數(shù)據(jù)有以下幾種情形時,一般用幾何平均數(shù)來表示數(shù)據(jù)的集中趨勢:(1) 一組數(shù)據(jù)中任何兩個相鄰數(shù)據(jù)之比接近丁常數(shù),即數(shù)據(jù)按一定的比例關(guān)系變化。例如,在教育與心理研究中,求平均增長率;當(dāng)一組數(shù)據(jù)中存在極端數(shù)據(jù),分布呈偏態(tài)時,算術(shù)平均數(shù)不能很好地反映數(shù)據(jù)的典型情況;對心理學(xué)中的等距與等比量表實(shí)驗(yàn)的數(shù)據(jù)處理均可使用幾

13、何平平均數(shù)或其他集中量數(shù)(如中數(shù)、眾數(shù))來反映數(shù)據(jù)的典型情況。2. 幾何平均數(shù)的基本公式Mg=nX1-X2Xn式中:n數(shù)據(jù)個數(shù);3. X1數(shù)據(jù)變量的值在計(jì)算上常使用對數(shù)方法:lgMg=(lgX1+lgX2+lgXn)=ElgXiNN因此,幾何平均數(shù)乂叫對數(shù)平均數(shù)。(1) 幾何平均數(shù)在教育與心理研究中的應(yīng)用等距與等比量表實(shí)驗(yàn)的數(shù)據(jù)處理教育與心理研究中平均增長率的計(jì)算一組數(shù)據(jù)如果彼此之間變異較大,幾乎是按一定比例關(guān)系變化,如教育經(jīng)費(fèi)的增加,學(xué)習(xí)、閱讀的進(jìn)步,學(xué)校招生人數(shù)的增加等,一般要求的不是平均數(shù),而是增長率,這就需要用幾何平均數(shù)計(jì)算平均比率,而不用算術(shù)平均數(shù)。Mg=nXn/Xi調(diào)和平均數(shù)(Ha

14、rmonicMean)調(diào)和平均數(shù)用符號Mh表示。它的計(jì)算公式是:Mh1_N11一11、1NXiXi公式中:N為數(shù)據(jù)的個數(shù);Xi為變量值,隨實(shí)驗(yàn)研究設(shè)計(jì)不同其含義不同。因在計(jì)算中先將各數(shù)據(jù)取倒數(shù)平均,然后再取倒數(shù),故乂稱倒數(shù)平均數(shù)在研究學(xué)習(xí)速度的實(shí)驗(yàn)設(shè)計(jì)中,一般常取兩種形式:1. 學(xué)習(xí)任務(wù)的工作量相同而所用時間不等學(xué)習(xí)任務(wù)的時間相同而工作量不等、中數(shù)(Median)中數(shù)乂稱中點(diǎn)數(shù),中位數(shù),簡寫為Md或Mdn首先把數(shù)據(jù)資料從大到小排成序列,位丁中間位置的那個數(shù)據(jù)的測量值即為中數(shù)。也就是說,如果將數(shù)據(jù)依大小順序排列,中數(shù)恰丁中問,它將數(shù)據(jù)的數(shù)目分成較大的一半和較小的一半。單歹0數(shù)目的情況單列數(shù)目的情

15、況是指,在一組數(shù)列中,每個數(shù)只有一個,即沒有重復(fù)數(shù)。求中數(shù)步驟:(1) 如果數(shù)據(jù)未排序,先進(jìn)行排序;(2) 按數(shù)據(jù)總數(shù)的奇偶,分別按下列方法求。1. 奇數(shù)目求中數(shù)的方法當(dāng)數(shù)據(jù)總數(shù)為奇數(shù)時,第(N+l)/2的那個數(shù)據(jù)的值即為中數(shù)。2. 偶數(shù)目求中數(shù)的方法當(dāng)數(shù)據(jù)總數(shù)為偶數(shù)時,則取序列為第N/2與第N/2+1這兩個數(shù)據(jù)的均數(shù)為中數(shù)。即將第N/2的數(shù)和第N/2+1的數(shù)據(jù)的值相加,然后將它們的和除以2,所得數(shù)值即為中數(shù)。(一) 重復(fù)數(shù)目的情況重復(fù)數(shù)目是指一組數(shù)據(jù)中有數(shù)值相同的數(shù)。計(jì)算中數(shù)的方法基本同單列數(shù)目,但當(dāng)位丁中間的那幾個數(shù)是重復(fù)數(shù)目時,求中數(shù)的方法就比較復(fù)雜了。具體算法如下:1. 重復(fù)數(shù)目情況下

16、奇數(shù)目求中數(shù)的方法(1) 重復(fù)數(shù)目不在中間位置方法同數(shù)據(jù)總數(shù)為奇數(shù)的求法,即第(N+l)/2的那個數(shù)據(jù)的值即為中數(shù)。(2) 幾個連續(xù)重復(fù)數(shù)目在中間位置取序列中上下各N/2那一點(diǎn)上的數(shù)值為中數(shù)。2. 重復(fù)數(shù)目情況下偶數(shù)目求中數(shù)的方法如果數(shù)據(jù)個數(shù)是偶數(shù),作法也同奇數(shù)基本相同。中數(shù)是將整個數(shù)據(jù)的個數(shù)分作大的一半和小的一半,而不是將數(shù)據(jù)的值分作相等的兩部分,即是個數(shù)的中數(shù),而不是數(shù)值的中數(shù)。(二) 次數(shù)分布表求中數(shù)的方法將原始數(shù)據(jù)整理成次數(shù)分布表后,求中數(shù)的方法同重復(fù)數(shù)目求中數(shù)是一樣的,也是取序列中將N平分為兩半的那一點(diǎn)的值作為中數(shù)。其具體步驟如下:第一步:求N/2,并找到N/2所在的分組區(qū)問;第二步

17、:求含有中數(shù)那一區(qū)間以下各區(qū)間的次數(shù)和(即中數(shù)區(qū)間下限以下的累加次數(shù))記作Fb;第三步:求N/2與Fb之差;第四步:求序列為第N/2那一點(diǎn)的值。求中數(shù)的公式可整理如下:Md=Lb+N/2-Fbfmd同理,用精確上限計(jì)算可寫出下式:Md=La+N/2-FaFmd式中:La為中數(shù)所在分組區(qū)間的精確上限;Fa為該組以上各組的累加次數(shù);i為組距。中數(shù)的意義與應(yīng)用1.優(yōu)點(diǎn):從中數(shù)的計(jì)算可以看出優(yōu)點(diǎn)有以下幾點(diǎn):(1) 計(jì)算簡單,客觀2. 不受極端數(shù)據(jù)的影響缺點(diǎn):中數(shù)也有些不足:(1) 反應(yīng)不夠靈敏(2) 中數(shù)的數(shù)值不穩(wěn)定(3) 中數(shù)不能進(jìn)一步再做代數(shù)運(yùn)算(4) 中數(shù)不能普遍應(yīng)用a. 在一般情況下,中數(shù)只是

18、在以下幾種特殊情況時,才應(yīng)用。這些特殊情況是觀測結(jié)果的兩端出現(xiàn)極端數(shù)次數(shù)分布中的兩端數(shù)據(jù)或個別數(shù)據(jù)不活楚當(dāng)作數(shù)據(jù)集中趨勢的快速估計(jì)值三、眾數(shù)(Mode眾數(shù)乂稱為范數(shù),密集數(shù),通常數(shù)等。常用符號Mo表示。眾數(shù)是指在一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值,或次數(shù)分布中出現(xiàn)次數(shù)最多的那個數(shù)的數(shù)值。(一) 直接觀察求眾數(shù)直接觀察求眾數(shù)的方法很簡單,通過觀察找出出現(xiàn)次數(shù)最多的數(shù)據(jù)就是眾數(shù)。(二) 用公式求眾數(shù)眾數(shù)可用公式計(jì)算,稱為數(shù)理眾數(shù)。1. 皮爾遜的經(jīng)驗(yàn)法當(dāng)數(shù)據(jù)分布接近正態(tài)的情況下可應(yīng)用此種方法。眾數(shù)計(jì)算公式:Mo=3Md-2X式中:M中數(shù);X平均數(shù)。用皮爾遜的經(jīng)驗(yàn)法計(jì)算的眾數(shù),只能作為一個近似值,它不受次數(shù)

19、分布的影響。2. 金氏(W.IKing)插補(bǔ)法M。=Lb+faifa+fb式中:Lb為含眾數(shù)這一區(qū)間的精確下限;fa為眾數(shù)所在組的高一個分組區(qū)間的次數(shù);fb為眾數(shù)所在組的低一個分組區(qū)間的次數(shù)。i為組距。當(dāng)fa=fb時,貝UM=Lb+1/2i,即次數(shù)最多那一分組區(qū)間的組中值。金氏(W.I-King)插補(bǔ)法公式即適合次數(shù)分布比較偏斜的情況,也適用比較接近正態(tài)分布的情況。上述兩個公式所求得的眾數(shù)略有出入。均為近似值。3. 眾數(shù)的意義和應(yīng)用中數(shù)反映了一組數(shù)據(jù)中,哪種數(shù)據(jù)值最多。在某些情況下有一定意義。(1) 眾數(shù)可作集中趨勢的快速估計(jì)值(2) 數(shù)據(jù)同質(zhì)性不好時,可求眾數(shù)(3) 數(shù)據(jù)中有極大或極小的情況

20、4. 用平均數(shù)與眾數(shù)之差估計(jì)次數(shù)分布的形態(tài)眾數(shù)的不足之處(1) 不穩(wěn)定,受分組的影響(2) 反應(yīng)不夠靈敏(3) 數(shù)值不精確,不能作進(jìn)一步的代數(shù)運(yùn)算1. 總數(shù)乘以眾數(shù)與數(shù)據(jù)總數(shù)不相等四、平均數(shù)、中數(shù)、眾數(shù)之間的關(guān)系和比較平均數(shù)、中數(shù)、眾數(shù)之間的關(guān)系在一個正態(tài)分布中,平均數(shù)、中數(shù)、眾數(shù)三者相等,因此在數(shù)軸上三點(diǎn)重合,即M=Md=Mo在正偏態(tài)分布中:MMdMo在負(fù)偏態(tài)分布中:MMdMo一般偏態(tài)情況下,中數(shù)Md離平均數(shù)M較近、而距眾數(shù)Mo較遠(yuǎn)。皮爾遜研究其經(jīng)驗(yàn)關(guān)系得出以下結(jié)論:M與Md的距離占M與Mo距離的1/3,而Md與Mo占2/3,即(M-Md/(M-Mo=1/3。2. 因而推導(dǎo)出:Mo=3Md-

21、2M平均數(shù)、中數(shù)、眾數(shù)之間的比較三種集中量數(shù)中,平均數(shù)是最常用的一種。它的意義最容易理解,也最為人們所熟悉。計(jì)算平均數(shù)時,每一個測量值都加入了計(jì)算,因此比求中數(shù)和眾數(shù)時使用了更多的信息。它還有一些中數(shù)和眾數(shù)不具有的特性。第四章離中趨勢的度量一、離散性質(zhì)對丁數(shù)據(jù)的變異性,或離中趨勢進(jìn)行度量的一組統(tǒng)計(jì)量,就稱作差異量數(shù)。這些差異量數(shù)包括:標(biāo)準(zhǔn)差或方差,全距,平均差,四分差及各種白分差等等。二、離中趨勢的度量1.全距(Range最簡單的差異量數(shù)為全距。全距也稱為兩極差。它是數(shù)據(jù)分散趨勢的最簡單描述指標(biāo)??梢杂米畲笾禍p最小值:R=MAX-MIN如果由分組資料計(jì)算全距,應(yīng)該用最高組的上限減最低組的下限。

22、2. 平均差(AverageDeviation)描述數(shù)據(jù)資料在平均數(shù)周圍離散程度的指標(biāo)一一平均差。平均差常用符號AD表示,它的數(shù)學(xué)公式如下:3. AD=*-X|N方差和標(biāo)準(zhǔn)差(VarianceandStandardDeviation)方差是一組數(shù)據(jù)的離差平方的平均數(shù),乂稱變異數(shù)或均方差,一般用符號S2,或v表小。作為總體參數(shù),常用符號。2表小。(1) 方差和標(biāo)準(zhǔn)差的定義方差的計(jì)算公式為:S=(Xi-X)2=IxL2NN方差的平方根稱為標(biāo)準(zhǔn)差。一般用S,或SD表示。它的公式如下:s=、(Xi-X)2一N(2) 由各小組的標(biāo)準(zhǔn)差求總標(biāo)準(zhǔn)差方差具有可加性,在已知幾個小組的方差或標(biāo)準(zhǔn)差的情況下,可以計(jì)

23、算它們的總方差或總標(biāo)準(zhǔn)差。進(jìn)行這種計(jì)算用下列公式計(jì)算:Sr2=(N1S彳+N2S2+NnSi2i)+(N1d彳+N2d2+Nndn)N1+N2+N3+Nna. 方差和標(biāo)準(zhǔn)差的性質(zhì)每個觀測值Xi加一個常數(shù)C后Yi,得出的標(biāo)準(zhǔn)差Sy等丁原數(shù)據(jù)得出的標(biāo)準(zhǔn)差Sx:b. 若Yi=Xi+C則有Sy=Sx每個觀測值Xi乘一個常數(shù)C后Yi,得出的標(biāo)準(zhǔn)差Sy等丁原數(shù)據(jù)得出的標(biāo)準(zhǔn)差Sx乘以這個常數(shù):若Yi=Xi-C則有Sy=C-SxC.每個觀測值Xi乘一個常數(shù)c(c=0)后,再加一個常數(shù)d,所得出的標(biāo)準(zhǔn)差Sy等丁原數(shù)據(jù)得出的標(biāo)準(zhǔn)差Sx乘以這個常數(shù)c:若Yi=Xi-C+q則有Sy=C-Sx證明:根據(jù)標(biāo)準(zhǔn)差的性質(zhì)1和

24、性質(zhì)2可證明性質(zhì)3。(3) 方差和標(biāo)準(zhǔn)差的意義方差和標(biāo)準(zhǔn)差是表示一組數(shù)據(jù)離散程度的最好指標(biāo)。其值越大,說明次數(shù)分布的離散程度越大;其值越小,說明次數(shù)分布的數(shù)據(jù)比較集中,離散程度越小。方差與標(biāo)準(zhǔn)差具有反應(yīng)靈敏,計(jì)算嚴(yán)密,受抽樣變動的影響較小等良好差異量數(shù)的條件。此外,方差具有可加性,它是對一組數(shù)據(jù)中造成各種變異的總和的測量。統(tǒng)計(jì)實(shí)踐中常利用方差的可加性分解并確定屆丁不同來源的變異性,并進(jìn)一步說明各種變異對總結(jié)果的影響??梢哉f方差是推論統(tǒng)計(jì)最常用的統(tǒng)計(jì)量數(shù)。4. 標(biāo)準(zhǔn)差的相對差異系數(shù)(Coefficientofvariation)當(dāng)遇到以下兩種情況:1. 兩個或兩個以上樣本所測的特質(zhì)不同;兩個或兩

25、個以上樣本所測的特質(zhì)相同,但樣本間的水平相差較大。應(yīng)使用相對差異量數(shù),稱作差異系數(shù),或變異系數(shù),用符號CV表示。計(jì)算公式如下:CV=S/M100%其中:S樣本標(biāo)準(zhǔn)差M樣本平均數(shù)。5. 標(biāo)準(zhǔn)分?jǐn)?shù)(StandardScore,orZScore)(1) 定義標(biāo)準(zhǔn)分?jǐn)?shù)乂稱Z分?jǐn)?shù),或基分?jǐn)?shù),是以標(biāo)準(zhǔn)差為單位表示一個分?jǐn)?shù)在團(tuán)體中所處的位置。它是將某個分?jǐn)?shù)的離均差變?yōu)橐詷?biāo)準(zhǔn)差為單位的一種量數(shù)一相對位置量數(shù)。公式為:rXi-XZ=S式中:X代表原始數(shù)據(jù);X為一組數(shù)據(jù)的平均數(shù);S為標(biāo)準(zhǔn)差。(2) Z分?jǐn)?shù)的意義Z分?jǐn)?shù)的意義,是一個數(shù)與平均數(shù)之差除以標(biāo)準(zhǔn)差所得的商數(shù),無實(shí)際單位。如果一個數(shù)小丁平均數(shù),其值為負(fù)數(shù);如

26、果一個數(shù)的值大丁平均數(shù),其值為正數(shù);如果一個數(shù)的值等丁平均數(shù),其值為零??梢奪分?jǐn)?shù)可以表明原數(shù)在該組數(shù)據(jù)分布中的位置。Z分?jǐn)?shù)的性質(zhì)性質(zhì)1:在一組數(shù)據(jù)中所有由原分?jǐn)?shù)轉(zhuǎn)換得出的z分?jǐn)?shù)之和為零,由此得出其z分?jǐn)?shù)的平均數(shù)亦為零。根據(jù)求平均數(shù)及z分?jǐn)?shù)的公式可推導(dǎo)出這個性質(zhì)。性質(zhì)2:一組數(shù)據(jù)中若Z分?jǐn)?shù)的方差為1,它的標(biāo)準(zhǔn)差也是1。(3) Z分?jǐn)?shù)的應(yīng)用(1) 反映原分?jǐn)?shù)在團(tuán)體分布中的地位;(2) 能使不同分布的各原始分?jǐn)?shù)進(jìn)行比較;(3) 可以進(jìn)行代數(shù)方法的處理。用丁比較不同單位的變量利用Z分?jǐn)?shù)求不同質(zhì)的觀測值的總和或平均值表示標(biāo)準(zhǔn)測驗(yàn)分?jǐn)?shù)轉(zhuǎn)換公式為:正態(tài)標(biāo)準(zhǔn)分?jǐn)?shù)Z=aZ+b(4) Z分?jǐn)?shù)也存在著缺點(diǎn):(1)

27、 若一個數(shù)低丁平均數(shù),則出現(xiàn)負(fù)值;(2) 得出的數(shù)據(jù)多為小數(shù),很麻煩。一般為解決這個問題,常用X100,或X10的方法,舍去小數(shù)。6. 四分差(Quartile)四分差是描述數(shù)據(jù)離差程度的指標(biāo),常用字母Q表示。它的定義為:在一組按大小順序排列的數(shù)據(jù)中,位丁中間50%的數(shù)據(jù)的全距之半。四分差等丁Q3-Q1的一半。用公式表示為:(1) 未分組數(shù)據(jù)求四分差公式:Q=Q3-Q12(2) 在頻數(shù)分布表的計(jì)算公式為:Q1=Lb+N/4-Fb-ifQ1Q3=Lb+3N/4-Fb-ifQ3式中:Lb該四分點(diǎn)所在組的精確下限;Fb該四分點(diǎn)所在組以下的累加次數(shù);fQ1和fQ3該四分點(diǎn)所在組的次數(shù);i組距;N數(shù)據(jù)個

28、數(shù)。7. 白分位差(PercentileDeviation定義:是將一組按大小順序排列的數(shù)據(jù)分為100份。兩個白分位數(shù)之間的距離,即為兩個白分位數(shù)之差,用符號R表示。常用的白分位差有兩種:一種為P10與P90白分位差,中間包括80%勺頻數(shù),另一種為P7與P93白分位差,中間包括86%勺頻數(shù)。(1) 公式:求白分位差的公式如下:Pd=Ph-PlP86=P93-P7,P80=P90-P10求白分位數(shù)的公式如下:P7=Lb+7N/100-cfb-ifP7P93=Lb+93N/100-cfb-ifp93式中:Lb該白分位所在組的精確下限;Cfb該白分位所在組以下的累加次數(shù);fp7和fp93該白分位所在

29、組的次數(shù);i組距;N數(shù)據(jù)個數(shù)。白分位差的值越大,表明數(shù)據(jù)分布的范圍越大,離散程度也大。第五章相關(guān)分析(Correlation)第一節(jié)相關(guān)的基本概念一、相關(guān)的定義相關(guān):兩事物之間相互關(guān)聯(lián)的程度。它反映了兩種現(xiàn)象之間的共連關(guān)系二、相關(guān)的性質(zhì)直線相關(guān)是指兩列變量中的一列變量在增加,而另一列變量隨之而增加,或這一列變量在增加,而另下列變量卻相應(yīng)地減少。它們之間存在一種直線關(guān)系,或線性相關(guān)。直線相關(guān)可用直線擬合,散點(diǎn)成橢圓形分布。2.正相關(guān),負(fù)相關(guān)和零相關(guān)相關(guān)還有三種情況:正相關(guān),負(fù)相關(guān)和零相關(guān)。(1) 正相關(guān)若一歹0變量由大而小、或由小而大變動時,另一歹0變量亦由大而小,或由小而大變動,即二列變量的變

30、動方向相同,這種”同增同減”的關(guān)系,稱為正相關(guān)。(2) 負(fù)相關(guān)若一歹0變量由大而小變動,另一歹0變量卻反由小而大變動,即二歹0變量的變動方向相反,這種”此增彼減”的關(guān)系,稱為負(fù)相關(guān)。(3) 零相關(guān)若一歹0變量由大而小變動;而另一歹0變量則或大或小變動,看不出一定趨勢,即二列變量之間毫無關(guān)系,稱為無相關(guān)或零相關(guān)。2. 強(qiáng)相關(guān)、弱相關(guān)和完全相關(guān)存在相關(guān)的兩個變量,它們的變化關(guān)系除了方向性之外,還有密切程度問題。如果兩個變量值的變化關(guān)系密切,(無論方向是正還是負(fù))稱為強(qiáng)(高)相關(guān)。變化的關(guān)系不密切,稱為弱(低)相關(guān)。強(qiáng)相關(guān)圍繞著直線,分布范圍較小;最強(qiáng)的相關(guān)所有的點(diǎn)都落在直線上,稱完全相關(guān);弱相關(guān)圍

31、繞著直線分布范圍較大。四、相關(guān)的取值及意義表示兩列變量相關(guān)方向和程度的數(shù)量,稱作相關(guān)系數(shù),用符號r代表。相關(guān)系數(shù)的取值總是在+1.00至-1.00之間。r=1.00,完全正相關(guān);r=0,零相關(guān);0|r|1,相關(guān)系數(shù)的絕對值大小表示相關(guān)的程度,其取值不同,表示相關(guān)程度不同。第二節(jié)常用相關(guān)分析方法及其計(jì)算一、積差相關(guān)系數(shù)(PearsonCorrelationCoefficient)積差相關(guān)系數(shù)的概念及計(jì)算條件計(jì)算積差相關(guān)系數(shù)要求變量符合以下條件:(1) 兩列變量都是等距的或等比的測量數(shù)據(jù);(2) 兩列變量所來自的總體必須是正態(tài)的,或近似正態(tài)的對稱單峰分布;即正態(tài)雙變量;(3) 兩列變量必須具備一一

32、對應(yīng)的關(guān)系,即為線性關(guān)系,但對樣本的分布不做要求。1. 積差相關(guān)計(jì)算公式(1) 積差相關(guān)公式(Xi-X)(Yi-Y)xyr=NSxSyNSxSy其中:Sx,&一分別為樣本X和Y變量的標(biāo)準(zhǔn)差;N一城對數(shù)據(jù)的數(shù)目。變式如果不知道標(biāo)準(zhǔn)差,可用標(biāo)準(zhǔn)差公式Sx=Wxr-NX2_仁X)2NY2-TY)2(4) 還可轉(zhuǎn)換成用Z分?jǐn)?shù)求積差相關(guān):、x、ZxZyrNSxSyN二、相關(guān)系數(shù)的合并1. 合并方法(求平均相關(guān)系數(shù))先將各分組的相關(guān)系數(shù)r轉(zhuǎn)換為Z(查FisherZ-r轉(zhuǎn)換表),將Z轉(zhuǎn)換成r后,求平均,然后再將Z平均值(查FisherZ-r轉(zhuǎn)換表)轉(zhuǎn)換成總相關(guān)系數(shù)平均值。.計(jì)算公式Z(ni-3)Zi式中:Z

33、i各樣本ri查Z-r轉(zhuǎn)換表得到;ni各樣本的成對數(shù)目。/N推導(dǎo)出下列公式:、xyr=、xy2(2) 如果直接用原始數(shù)據(jù)計(jì)算,則用下列公式:2. NXYXY相關(guān)系數(shù)合并的條件(1) 合并的各樣本應(yīng)具有同質(zhì)性;(2) 應(yīng)使用相同的測量工具;(3) 各樣本水平接近。1. 三、斯皮爾曼等級相關(guān)(SpearmanCorrelation)等級相關(guān)適用的數(shù)據(jù)資料(1)兩個變量值以等級次序排列,或以等級次序表示;(2)兩個變量的總體分布不一定是正態(tài)分布,或者根本不是正態(tài)分布;2. (3)成對樣本的容量n小丁30時,計(jì)算公式(1)等級相關(guān)公式6寸D2rR=12N(N2-1)式中:D二變量對等級之差:D=X-N等

34、級對的數(shù)目。(2)直接用等級數(shù)計(jì)算直接用等級數(shù)據(jù)計(jì)算,可使用下列公式:R3N-14、RxRyN(N+1)TN+1)式中:R,Ry-一分別為二變量各等級數(shù),相乘后再求和四、計(jì)算有相同等級的等級相關(guān)方法求校正數(shù)隨相同等級數(shù)目減少的數(shù)量規(guī)律可用下式表達(dá),cn(n2-1)C=12式中:C校正數(shù);n相同等級的數(shù)目。在一組數(shù)據(jù)中,有時會有多個相同等級數(shù)出現(xiàn),貝U需將它們累加:1. C八n(2F12求有相同等級的等級相關(guān)計(jì)算公式對有相同等級數(shù)目的變量使用斯皮爾曼等級相關(guān)公式應(yīng)用下帶校正的公式:式中:式中:N對偶數(shù)據(jù)的個數(shù);n相同等級的數(shù)目;D對偶等級差數(shù)。2、X2=N(N21CX、廣、n(n-1)C=、2N

35、(N221)、.八-yCy12六、質(zhì)與量相關(guān)質(zhì)與量的相關(guān)是指一列變量為等比或等距的測量數(shù)據(jù),另一列變量是按性質(zhì)劃分的類別,即為一個分類變量。欲求這樣兩列變量的直線相關(guān),稱之為質(zhì)量相關(guān),它包括:點(diǎn)二歹0相關(guān),二歹0相關(guān)及多系歹0相關(guān)。1.點(diǎn)二歹0相關(guān)(ThePoint-BiserialCorrelationCoefficient)(1)適用資料如果兩列變量中有一列為等距或等比的測量數(shù)據(jù),并且其總體分布為正態(tài),另一列變量只是名義上的變量,而實(shí)際上是按事物的性質(zhì)劃分兩類的變量。這類變量被稱作“二分”名義變量。有時一個變量是雙峰分布,也可劃分為名義變量。(2)公式及計(jì)算計(jì)算點(diǎn)二列相關(guān)的公式是Xp*,頃

36、=-.p,qSt式中:X是與一個二分變量p對應(yīng)的連續(xù)變量的平均數(shù);Xq是與另一個二分變量q對應(yīng)的連續(xù)變量的平均數(shù);St是連續(xù)變量的標(biāo)準(zhǔn)差;p與q是二分變量各自所占的比率,p+q=1。(1) 點(diǎn)二列相關(guān)系數(shù)的取值在-1.00至1.00之間。相關(guān)越高,絕對值越接近1.00二歹0相關(guān)(TheBiserialCorrelationCoefficient)適用資料二列相關(guān)適用的資料是兩列均屆丁態(tài)分布。但其中一列變量為等距或等比的測量數(shù)據(jù),另一列變量雖然也呈正態(tài)分布,但它被人為地劃分為兩類。(2) 公式及計(jì)算計(jì)算二列相關(guān)有兩個公式:bXp-Xq兇StXp-XtrBu式中:X與二分變量中p變量對應(yīng)的連續(xù)變量

37、的平均數(shù);Xq與二分變量中q變量對應(yīng)的連續(xù)變量的平均數(shù);St連續(xù)變量的標(biāo)準(zhǔn)差;p某一二分變量在所有二分變量中所占的比率;q另一二分變量在所有二分變量中所占的比率;y正態(tài)曲線中,p面積與q面積交界處y軸的高度。在求出p值后,可查正態(tài)分布表得到y(tǒng)值。二列相關(guān)系數(shù)的取值范圍在:-1.00-+1.00之間。絕對值越接近1.00,其相關(guān)程度越高。(1) 七、多系列相關(guān)(Multi-serialCorrelation)適用資料多系列相關(guān)適用的資料為兩列正態(tài)變量,其中一列為等距或等比的測量數(shù)據(jù)稱為連續(xù)變量,另一列正態(tài)變量被人為地分成多種類別,稱為名義變量。(2) 公式及計(jì)算多系列相關(guān)系數(shù)的計(jì)算公式:、(yl

38、-)又rs=q一、(yl-yh)STpi式中:Pi每系列的次數(shù)比率;Y I每一名義變量下限的正態(tài)曲線高度,由Pi查正態(tài)表給出;Y h每一名義變量上限的正態(tài)曲線高度,由Pi查正態(tài)表給出;Xi與每一名義變量對偶的連續(xù)變量的平均數(shù);St連續(xù)變量的標(biāo)準(zhǔn)差。多系歹0相關(guān)系數(shù)也介丁-1.00T.00之間,相關(guān)系數(shù)絕對值越接近1,表小其相關(guān)程度越高。八、偏相關(guān)(PartialCorrelation)偏相關(guān)與簡相關(guān)相比可能反映的是真正兩變量之間的本質(zhì)聯(lián)系,故偏相關(guān)也稱作純相關(guān)。偏相關(guān)按因變量歹0數(shù)的多少而分級。在三歹0變量中,一歹0除外的偏相關(guān)系數(shù)稱第一級偏相關(guān)系數(shù);在四列變量中,二列除外的偏相關(guān)系數(shù)稱第二級

39、偏相關(guān)系數(shù)。余此類推。計(jì)算偏相關(guān)的基本公式第一級偏相關(guān)的公式_12一1323式中:r12第一,二個變量(X1,X2)的簡相關(guān)系數(shù);r13第一,三個變量(X1,X3)的簡相關(guān)系數(shù);r23第二,三個變量(X1,X2)的簡相關(guān)系數(shù);第二級偏相關(guān)的公式_r2.3-r14.3r24.3心一.1-式中:ri2.3第一,二變量(X1,X2)的簡相關(guān)系數(shù),排除第三個變量;r14.3第一,四變量(Xi,X3)的簡相關(guān)系數(shù),排除第三個變量;1. r24.3第二,四個變量(Xi,X2)的簡相關(guān)系數(shù),排除第三個變量;小結(jié):各相關(guān)分析的條件一、常用相關(guān)分析統(tǒng)計(jì)方法皮爾遜積差相關(guān)計(jì)算積差相關(guān)系數(shù)要求變量符合以下條件:(1

40、) 兩列變量都是等距的或等比的測量數(shù)據(jù);(2) 兩列變量所來自的總體必須是正態(tài)的,或近似正態(tài)的對稱單峰分布;(3) 兩列變量為線性關(guān)系,對樣本的分布不做要求。(4) 兩列變量樣本數(shù)大于,或等于30。2. 斯皮爾曼等級相關(guān)等級相關(guān)適用的數(shù)據(jù)資料:(1) 兩個變量值以等級次序排列,或以等級次序表示;(2) 兩個變量的總體分布不要求一定是正態(tài)分布,或者根本不是正態(tài)分布;(3)成對樣本的容量n可小于30;(4) 有相同等級數(shù)據(jù)時,則需在等級相關(guān)公式中加修正系數(shù)。3. 肯德爾W系數(shù)肯德爾W系數(shù)的適用數(shù)據(jù)資料:適用于一般取自采用等級評定的方法得出的數(shù)據(jù),對K個評價(jià)者的一致性進(jìn)行統(tǒng)計(jì)分析。有相同等級數(shù)據(jù)時,

41、則需在等級相關(guān)公式中加修正系數(shù)。4. 肯德爾U系數(shù)若采用對偶比較法獲得數(shù)據(jù),對K個評價(jià)者的一致性進(jìn)行統(tǒng)計(jì)分析時,用肯德爾U系數(shù)。二、質(zhì)與量相關(guān)1點(diǎn)二列相關(guān)兩列變量中有一列為等距或等比的測量數(shù)據(jù),并且其總體分布為正態(tài),另一列只是名義上的變量,而實(shí)際上是按事物的性質(zhì)劃分兩類的變量。1. 二歹0相關(guān)兩列變量均來自正態(tài)分布總體,但其中一列變量為等距或等比的測量數(shù)據(jù),另一列變量雖然也呈正態(tài)分布,但被人為地劃分為兩類。2. 多系列相關(guān)兩列來自正態(tài)總體的變量,其中一列為等距或等比的測量數(shù)據(jù),為連續(xù)變量,另一列被人為地分成多種類別為名義變量。三、偏相關(guān)排除其他因素的影響,求兩列變量之間純粹的相關(guān)關(guān)系時,采用偏

42、相關(guān)分析。四、相關(guān)的合并由同質(zhì)的分組相關(guān)求總相關(guān)時,通過r-乙Z-r轉(zhuǎn)換求其相關(guān)平均值。第六章概率與概率分布第一節(jié)隨機(jī)事件和隨機(jī)變量一、隨機(jī)事件的定義隨機(jī)事件:在給定的條件下,一個事件可能發(fā)生,也可能不發(fā)生,這樣的事件稱作隨機(jī)事件。隨機(jī)事件具有或然性。2個特例:絕對不可能發(fā)生的事件稱為“不可能事件,用大寫V表??;必定要發(fā)生的事件稱為必然事件,用大寫U表示。二、隨機(jī)變量的定義隨機(jī)變量:在一定范圍內(nèi),任意取多個值,取每個值的可能性用概率表達(dá),這樣的取值稱作隨機(jī)變量。隨機(jī)變量有兩種:1. 離散型隨機(jī)變量,取值是問斷的;連續(xù)變量,取值是無限的。第二節(jié)概率一、概率的定義概率也稱作機(jī)率,或然率及可能率。概

43、率公式:P(A)=m/n二、概率的類型概率分為兩種:1. 先驗(yàn)概率或古典概率(1) 定義:1. 每次試驗(yàn)中,可能出現(xiàn)的基本事件的個數(shù)是有限的。II.每次試驗(yàn)中,每個基本事件出現(xiàn)的可能性是相等的,即每個基本事件發(fā)生的概率相等。(2) 古典概率的特點(diǎn):事先就已知某個事件出現(xiàn)的事實(shí),在實(shí)驗(yàn)或研究之前就可算出該事件發(fā)生的概率,故乂稱作先驗(yàn)概率。2. 后驗(yàn)概率在進(jìn)行多次觀測時,按觀測結(jié)果計(jì)算的概率稱作后驗(yàn)概率。觀測的次數(shù)越多,越接近先驗(yàn)概率。2. 三、概率的基本性質(zhì)1.必然事件發(fā)生的概率為1,P(U)=1(必然要發(fā)生的事件)不可能事件的概率為0,P(V)=0(絕對不可能發(fā)生的事件)事件A發(fā)生的概率:滿足

44、:0沖(A)勺即概率的數(shù)值在:01之間。3. 逆事件的概率:1. PCA)p(A)=1P(A)=1-P(A)四、概率的基本定理概率的加法定理若A,B是2個相互獨(dú)立的事件,貝UA和B至少有一個發(fā)生的概率為:P(A+B)=P(A)+P(B)(或的關(guān)系)推廣到有限多個相互獨(dú)立事件,則A1,A2,An至少有一個發(fā)生的概率為:2. P(A1+A2+An)=P(A1)+P(A2)+P(An)概率的乘法定理若A,B是兩個相互獨(dú)立的事件,則A和B同時發(fā)生的概率為:P(A-B)=P(A)-P(B)(與的關(guān)系)若推廣到有限個獨(dú)立事件情況,則有:若A1,A2,,An是有限個獨(dú)立事件,WJA1,A2,,An同時發(fā)生的

45、概率為:P(A1-A2An)=P(A1)P(A2)P(An)第三節(jié)二項(xiàng)分布(BinomialDistribution)一、獨(dú)立試驗(yàn)序列概型二項(xiàng)式定理二項(xiàng)式展開后可用組合數(shù)來表示:nn0n*1nJ1nJ1nJnn%cxxn_x(pq)=CnPCnPqCnpqCnq=LCnPqx=02.二項(xiàng)式的性質(zhì)(1)(2)(X=0,1,n正整數(shù))展開式共有n+1項(xiàng);(3)(4)(n-1)+1=n)p按降籍排歹0,指數(shù)從n逐項(xiàng)減1直到0;(卜0)q按升籍排列,指數(shù)從0逐項(xiàng)增1直到n;(0Tn)各項(xiàng)p,q的次數(shù)之和等丁二項(xiàng)式的次數(shù)。(pn-1q1T從第一項(xiàng)開始,各項(xiàng)系數(shù)依次為:C0C1ncnCn,Cn,*Cn,C

46、n(5)(6)最大。如果一個單次試驗(yàn)的概率保持包定不變,重復(fù)進(jìn)行多次獨(dú)立試驗(yàn),事件成功的概率總是等丁二項(xiàng)展開式中的某一項(xiàng)。以上這些性質(zhì)可利用揚(yáng)輝三角形來表示二項(xiàng)展開式各項(xiàng)系數(shù)的分配規(guī)律。由組合的性質(zhì)1知,由兩端起,等距項(xiàng)的系數(shù)相等;3. 當(dāng)項(xiàng)數(shù)為奇數(shù)時,中間一項(xiàng)的系數(shù)最大;當(dāng)項(xiàng)數(shù)為偶數(shù)時,中間二項(xiàng)的系數(shù)相等且二項(xiàng)式定理一般適用的情況:設(shè)單次試驗(yàn)中某事件A發(fā)生的概率為P0p1,如果將此試驗(yàn)重復(fù)n次,求A發(fā)生r次的概率(r=0,1,2,n),就記為:pX=r,Mrrntp(x=r=Cnpq(q=1-p)上式為事件A發(fā)生r次的概率。這種概率模型稱為獨(dú)立試驗(yàn)序列概型。二、二項(xiàng)分布二項(xiàng)分布描述的是性質(zhì)不

47、同的兩個群體的概率分布,每個變量都可歸丁兩個不同性質(zhì)中的一個,它們之間是對立的,因而二項(xiàng)分布乂可說是兩個對立事件的概率分布。1. 定義及公式如果隨機(jī)變量X的分布為Rx=r=C;prqn“(r=0,1,2,n)(0P1,q=1-p)則稱X服從二項(xiàng)分布,記作b(x,n,p)2.特點(diǎn)(1) 有n次試驗(yàn),且各次試驗(yàn)相互獨(dú)立;(2) 每次試驗(yàn)只有二種結(jié)果,成功與失敗。如果記P為單次試驗(yàn)中成功的概率,q則為單次試驗(yàn)中失敗的概率,其取值為:0p1,q=1-p,或記作A與A(3) 各次試驗(yàn)是完全重復(fù)的,P保持包定不變,即成功的概率在第一次試驗(yàn)中為P(A),在第n次試驗(yàn)中也是P(A)。3. 二項(xiàng)分布的性質(zhì)二項(xiàng)分

48、布是離散型分布,X取值為不連續(xù)變量,作圖時可采用條形圖描述。二項(xiàng)分布具有如下性質(zhì):當(dāng)p=q時圖形為對稱圖形,即單次試驗(yàn)中,成功與失敗的概率相等,此時,二項(xiàng)分布是對稱的,p=q=1/2。(1) 當(dāng)p和時圖形呈偏態(tài),pq的偏斜方向相反。P與q的值相差越大,偏斜程度也越大,隨著n的逐漸加大,偏斜程度也逐漸降低,分布形式逐漸對稱。當(dāng)n足夠大時,二項(xiàng)分布接近丁正態(tài)分布。一般規(guī)定:當(dāng)pq,且np芝5(或nq冬)時,可用正態(tài)分布概率作為近似值。4. 二項(xiàng)分布的平均數(shù)和標(biāo)準(zhǔn)差(1)公式當(dāng)二項(xiàng)分布滿足pq),np_5(nq_5)條件時,二項(xiàng)分布接近正態(tài)分布,此時,二項(xiàng)分布中X變量的均值卜(成功數(shù)的平均數(shù))和標(biāo)準(zhǔn)

49、差。(成功數(shù)的標(biāo)準(zhǔn)差)分別為:=np二一=npq5. 式中:n為獨(dú)立試驗(yàn)次數(shù)p為成功事件的概率,q=1-p二項(xiàng)分布的應(yīng)用二項(xiàng)分布主要用丁實(shí)驗(yàn)結(jié)果可能是由丁猜測而造成的含有機(jī)遇性質(zhì)的問題。1. 三、小結(jié)二項(xiàng)式定理二項(xiàng)分布的數(shù)學(xué)基礎(chǔ)來自二項(xiàng)式定理,而二項(xiàng)式定理的展開式則為概率和排列組合表達(dá)式。nnxxn項(xiàng)2. (pq)=CnpqxX二項(xiàng)分布二項(xiàng)分布是一種離散型隨機(jī)變量分布,也是一種基本隨機(jī)變量分布。數(shù)據(jù)變量是獨(dú)宜取值,按數(shù)據(jù)特征劃分。二項(xiàng)分布描述的是性質(zhì)不同的兩個群體的概率分布,每個變量都可歸丁兩個不同性質(zhì)中的一個,它們之間是對立的,因而二項(xiàng)分布乂可說是兩個對立事件的概率分布。利用二項(xiàng)式定理可求某

50、一點(diǎn)的概率(二項(xiàng)式的某一項(xiàng)),也可求某一段區(qū)間的概率(二項(xiàng)式定理展開式的某一段)。3. nxxn_xb(x,n,p)八Cnpqx=0二項(xiàng)分布的平均數(shù)和標(biāo)準(zhǔn)差當(dāng)pq,orpq,ng時,=np-_npq第五節(jié)正態(tài)分布(NormalDistribution)、正態(tài)分布X服從正態(tài)分布,記為XN(已。2)。當(dāng)b=1時,Y值最大,Z,P均為0。2、正態(tài)分布的特征正態(tài)曲線是完全對稱的曲線對稱軸是X=H,沿X=H將曲線折疊,左右兩邊完全重合+X和-X有相同的y值。正態(tài)分布是一族分布正態(tài)分布曲線有不同的形狀和位置,是一族分布:I .相同的標(biāo)準(zhǔn)差,不同的均值,使曲線形狀相同,所處位置不同。II .相同的均值,不同的標(biāo)準(zhǔn)差,使曲線位置相同,形狀不同。與X軸無限趨近,永不相交這條曲線從中央最高點(diǎn)逐漸向兩側(cè)降低,但曲線永遠(yuǎn)不與X軸相交。X軸為正態(tài)分布曲線方程的漸近線。(1) 參數(shù)H=0,=1的正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布。標(biāo)準(zhǔn)正態(tài)分布通常寫作:N(0,1),(2) 正態(tài)分布曲線下,標(biāo)準(zhǔn)差與概率的關(guān)系用Z分?jǐn)?shù)可以估計(jì)出一個數(shù)距離平均數(shù)的位置。Z=1,則表明這個數(shù)的位置在全部數(shù)據(jù)的一半以上,概率為50%+34.13%=84.13%;Z=0,則表明這個數(shù)的位置正好在一半,其概率為50%在-1Z+1之間,發(fā)生的概率P為:P(-1Z41(t)=0.6826P(-2(TZ+2)=0.9545P(-3(TZ+3(t

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論