首師大教育統(tǒng)計(jì)學(xué)課件05概率分布_第1頁
首師大教育統(tǒng)計(jì)學(xué)課件05概率分布_第2頁
首師大教育統(tǒng)計(jì)學(xué)課件05概率分布_第3頁
首師大教育統(tǒng)計(jì)學(xué)課件05概率分布_第4頁
首師大教育統(tǒng)計(jì)學(xué)課件05概率分布_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五章概率分布問題假設(shè)對(duì)1000名報(bào)考某高中的學(xué)生進(jìn)行分班考試,若要按能力將這些學(xué)生分為A、B、C、D、E五個(gè)組(或等級(jí)),且每組能力組距相等。根據(jù)正態(tài)分布的理論,每一等級(jí)應(yīng)分布多少學(xué)生??

某套測(cè)驗(yàn)中有10道正誤判斷題,若要了解學(xué)生對(duì)所測(cè)內(nèi)容在什么情況下是真正領(lǐng)會(huì)了,或什么情況下屬猜測(cè)的成分多,應(yīng)如何分析?第一節(jié)概率的基本概念

一、概率的定義隨機(jī)事件:指在一定條件下可能出現(xiàn),也可能不出現(xiàn)的事件概率:表示隨機(jī)事件出現(xiàn)可能性大小的客觀指標(biāo)。一、概率的定義后驗(yàn)概率(或統(tǒng)計(jì)概率)

隨機(jī)事件的頻率當(dāng)n無限增大時(shí),隨機(jī)事件A的頻率會(huì)穩(wěn)定在一個(gè)常數(shù)P,這個(gè)常數(shù)就是隨機(jī)事件A的概率。(6.1)先驗(yàn)概率(古典概率)古典概率模型要求滿足兩個(gè)條件:⑴試驗(yàn)的所有可能結(jié)果是有限的;⑵每一種可能結(jié)果出現(xiàn)的可能性相等。(6.2)二.概率的公理系統(tǒng)1.任何隨機(jī)事件A的概率都是在0與1之間的正數(shù),即0≤P(A)≤12.不可能事件的概率等于零,即P(A)=03.必然事件的概率等于1,即P(A)=1

三.概率的加法定理和乘法定理概率的加法定理若事件A發(fā)生,則事件B就一定不發(fā)生,這樣的兩個(gè)事件為互不相容事件。兩互不相容事件和的概率,等于這兩個(gè)事件概率之和,即(6.3)(6.4)概率的乘法定理若事件A發(fā)生不影響事件B是否發(fā)生,這樣的兩個(gè)事件為互相獨(dú)立事件。兩個(gè)互相獨(dú)立事件積的概率,等于這兩個(gè)事件概率的乘積,即(9.5)(9.6)例1:某一學(xué)生從5個(gè)試題中任意抽取一題,進(jìn)行口試。如果抽到每一題的概率為1/5,則抽到試題1或試題2的概率是多少?如果前一個(gè)學(xué)生把抽過的試題還回后,后一個(gè)學(xué)生再抽,則4個(gè)學(xué)生都抽到試題1的概率是多少?

計(jì)算抽到第一題或第二題的概率應(yīng)為抽到第一題的概率和抽到第二題的概率之和,即四個(gè)學(xué)生都抽到第一題即四個(gè)學(xué)生同時(shí)抽到第一題,其概率應(yīng)為抽到第一題的概率的乘積,即例2:從30個(gè)白球和20個(gè)黑球共50個(gè)球中隨機(jī)抽取兩次(放回抽樣),問抽出一個(gè)黑球和一個(gè)白球的概率是多少?抽出一個(gè)白球的概率為3/5,抽出一個(gè)黑球的概率為2/5。抽出一個(gè)黑球和一個(gè)白球的情況應(yīng)包括先抽出一個(gè)黑球、后抽出一個(gè)白球和先抽出一個(gè)白球、后抽出一個(gè)黑球兩種情況。因此:四、概率分布類型概率分布(probabilitydistribution)是指對(duì)隨機(jī)變量取不同值時(shí)的概率的描述,一般用概率分布函數(shù)進(jìn)行描述。依不同的標(biāo)準(zhǔn),對(duì)概率分布可作不同的分類。1、離散型分布與連續(xù)型分布依隨機(jī)變量的類型,可將概率分布分為離散型概率分布與連續(xù)型概率分布。心理與教育統(tǒng)計(jì)學(xué)中最常用的離散型分布是二項(xiàng)分布,最常用的連續(xù)型分布是正態(tài)分布。

2、經(jīng)驗(yàn)分布與理論分布依分布函數(shù)的來源,可將概率分布分為經(jīng)驗(yàn)分布與理論分布。經(jīng)驗(yàn)分布(empiricaldistribution)是指根據(jù)觀察或?qū)嶒?yàn)所獲得的數(shù)據(jù)而編制的次數(shù)分布或相對(duì)頻率分布。理論分布(theoreticaldistribution)是按某種數(shù)學(xué)模型計(jì)算出的概率分布。3、基本隨機(jī)變量分布與抽樣分布依所描述的數(shù)據(jù)的樣本特性,可將概率分布分為基本隨機(jī)變量分布與抽樣分布(samplingdistribution)。基本隨機(jī)變量分布是隨機(jī)變量各種不同取值情況的概率分布,抽樣分布是從同一總體內(nèi)抽取的不同樣本的統(tǒng)計(jì)量的概率分布。例如:統(tǒng)計(jì)資料表明:汽車事故經(jīng)常發(fā)生在離家不遠(yuǎn)的地方,是否意味著在離家遠(yuǎn)的地方開車比在城里開車更安全。統(tǒng)計(jì)資料表明:大多數(shù)汽車事故出在中速行駛的過程中,極少事故是出在150/小時(shí)高速行駛過程中,是否意味著高速行駛比較安全?統(tǒng)計(jì)資料表明:一個(gè)國(guó)家喝牛奶和死于癌癥的人比例都很高,是否說明牛奶引起癌癥呢?第二節(jié)正態(tài)分布正態(tài)分布(normaldistribution)也稱為常態(tài)分布,是連續(xù)型隨機(jī)變量概率分布的一種,是在數(shù)理統(tǒng)計(jì)的理論與實(shí)際應(yīng)用中占有最重要地位的一種理論分布。正態(tài)分布由棣.莫弗于1733年發(fā)現(xiàn)的。拉普拉斯、高斯對(duì)正態(tài)分布的研究也做出了貢獻(xiàn),故有時(shí)稱正態(tài)分布為高斯分布。1.正態(tài)分布曲線函數(shù)正態(tài)分布曲線函數(shù)又稱概率密度函數(shù),其一般公式為公式所描述的正態(tài)曲線,由σ和μ兩個(gè)參數(shù)決定。(公式6-1)均值相同,標(biāo)準(zhǔn)差不同的正態(tài)形式正態(tài)分布的特點(diǎn)面積:p=1中央點(diǎn)最高,雙側(cè)對(duì)稱

一簇分布

→形狀,→位置

2.標(biāo)準(zhǔn)正態(tài)分布曲線將標(biāo)準(zhǔn)分?jǐn)?shù)代入正態(tài)曲線函數(shù)并且,令σ=1則公式變換為標(biāo)準(zhǔn)正態(tài)分布函數(shù):以Z為橫坐標(biāo),以Y為縱坐標(biāo),可繪制標(biāo)準(zhǔn)正態(tài)分布曲線。標(biāo)準(zhǔn)正態(tài)分布曲線的縱線高度Y為概率密度,曲線下的面積為概率。3.標(biāo)準(zhǔn)正態(tài)分布曲線的特點(diǎn)⑴.曲線在Z=0處達(dá)到最高點(diǎn)⑵.曲線以Z=0處為中心,雙側(cè)對(duì)稱⑶.曲線從最高點(diǎn)向左右緩慢下降,向兩側(cè)無限延伸,但永不與基線相交。⑷.標(biāo)準(zhǔn)正態(tài)分布曲線的平均數(shù)為0,標(biāo)準(zhǔn)差為1。從Z=-3至Z=+3之間幾乎分布著全部數(shù)據(jù)。⑸.曲線的拐點(diǎn)為正負(fù)一個(gè)標(biāo)準(zhǔn)差處。三.標(biāo)準(zhǔn)正態(tài)分布表及使用1.標(biāo)準(zhǔn)正態(tài)分布表利用積分公式可求出正態(tài)曲線下任何區(qū)間的面積,但需要計(jì)算,非常麻煩。統(tǒng)計(jì)學(xué)家已編制好了標(biāo)準(zhǔn)正態(tài)分布表,使其使用非常方便。正態(tài)曲線表正態(tài)曲線表:以σ為測(cè)量面積的單位,用積分法則算出Z所對(duì)應(yīng)的各個(gè)部分的面積(P)及y值,制成的曲線表。正態(tài)曲線表的三個(gè)數(shù)值面積值:p高度值:y刻度值:Z三個(gè)值的求解1、Z→P求均數(shù)(0)與某個(gè)Z值間的P值:查表法。例:Z=0~Z=1P=0.34134

Z=1.96P=0.475求Z值以上或以下的概率例:Z=1.96以上的概率P=0.5-0.475=0.025求任何兩個(gè)Z值間的P值例:-1.2σ~2.4σ0.6σ~1.5σ2P→Z

查表:近似結(jié)果例:P=0.30,Z=0.85

3、P→Y

查表法:近似結(jié)果例:P=0.30,Y=0.27798幾個(gè)常用值1.±1σ:2.±2σ:3.±3σ:

4.±1.96σ:5.±2.58σ:

正態(tài)理論的應(yīng)用一求分布中特定分?jǐn)?shù)間個(gè)體數(shù)量例:假設(shè)500名學(xué)生的數(shù)學(xué)成績(jī)分布符合正態(tài)分布。且已知平均分70,標(biāo)準(zhǔn)差5分。試問60分以下,60~80分,80分以上,這三個(gè)分?jǐn)?shù)段中,學(xué)生的人數(shù)分布各為多少?已知:N=500,M=70,SD=5P←Z←M,SD,X解題步驟①

XZ

②ZP:③求各段的P60~80:

80以上:

④求各區(qū)間的人數(shù):

60以下:60~80:80以上:

二確定能力分組或等級(jí)評(píng)定人數(shù)

例:假設(shè)對(duì)100名報(bào)考大學(xué)的學(xué)生進(jìn)行分班考試,要按能力將這些學(xué)生分為A、B、C、D、E五個(gè)小組(或等級(jí)),每組能力組距相等,若考試成績(jī)所測(cè)得的分?jǐn)?shù)是正態(tài)的,問A、B、C、D、E各組應(yīng)當(dāng)分布幾名學(xué)生?

解題步驟①確定Z值的范圍

②ZP

A=0.49865-0.46407=0.03458B=0.464017-0.22575=0.23832C=0.22575×2=0.4515D=B=0.23832E=A=0.03458(或0.03593)③求各組人數(shù):

三分析試題的相對(duì)難度例:在一次共有四個(gè)試題的考試中,學(xué)生答對(duì)每題的人數(shù)百分比分別為:70%,50%,30%,10%。試問各題的難度如何?各題間的難度差一樣嗎?為什么?

①PZ:

試題答對(duì)率PZ

1.70.7-.5=.2-0.522.50.5-.5=00.003.30.3-.5=.20.524.10.1-.5=.41.28②求難度差

③線性轉(zhuǎn)換:試題答對(duì)率QP’ZDP

1.70.30.20-0.52.524.482.50.50.000.00.525.003.30.70.200.52.765.524.10.90.401.28-6.28四品質(zhì)評(píng)定數(shù)量化

例:三位教師對(duì)100名學(xué)生的學(xué)習(xí)能力進(jìn)行了等級(jí)評(píng)價(jià)。

教師對(duì)學(xué)生的評(píng)定

等級(jí)甲乙丙

A51020B252025C404035D252015E5105∑100100100

3名學(xué)生的所獲得的評(píng)定等級(jí)

學(xué)生教師甲教師乙教師丙

1BAA2ABA3DCC試比較其中三位學(xué)生學(xué)習(xí)能力的高低是否一樣?

解題 思路11、問題分析

①是否等值?②能否轉(zhuǎn)化?2、分析過程

甲教師評(píng)定結(jié)果

表7-3甲教師評(píng)定結(jié)果RnPA50.05B250.25C400.40D250.25E50.05∑1001.00⑵求各等級(jí)比率的中間值

①確定位置

②確定中間值

③確定查表值

A:P’=.05/2+.45=.475PF=.05/2+.95=.975

B:P’=.25/2+.2=.325PF=.25/2+.7=.825

C:P’=0PF=.5

⑶PZ

甲教師評(píng)定的相對(duì)結(jié)果

RnPP中值P’

Z

A50.050.9750.4751.96B250.250.8250.3250.93C400.40.50.0000.00D250.250.1750.3250.93E50.050.0250.4751.93∑100

由此可以得到三位老師的評(píng)定的Z分?jǐn)?shù)等級(jí)教師甲教師乙教師丙A1.961.651.28B0.940.840.45C00-0.32D-0.94-0.84-1.15E-1.96-1.65-1.96練習(xí)某區(qū)要在2500名初三學(xué)生中選50名學(xué)生參加全市初中物理競(jìng)賽。已知該區(qū)初三上學(xué)期物理考試成績(jī)近似正態(tài)分布,且平均數(shù)57分,標(biāo)準(zhǔn)差16分。若以這次考試為準(zhǔn)來選拔參加競(jìng)賽的學(xué)生,分?jǐn)?shù)線應(yīng)定為多少?

分析結(jié)果

①求入選率:②確定P’:③PZ:④ZX:第三節(jié)二項(xiàng)分布二項(xiàng)分布(bionimaldistribution)是一種具有廣泛用途的離散型隨機(jī)變量的概率分布,它是由貝努里創(chuàng)始的,因此又稱為貝努里分布。1.二項(xiàng)試驗(yàn)滿足以下條件的試驗(yàn)稱為二項(xiàng)試驗(yàn):一次試驗(yàn)只有兩種可能的結(jié)果,即成功和失敗;各次試驗(yàn)相互獨(dú)立,即各次試驗(yàn)之間互不影響;各次試驗(yàn)中成功的概率相等,失敗的概率也相等。2.二項(xiàng)分布函數(shù)二項(xiàng)分布是一種離散型隨機(jī)變量的概率分布。數(shù)學(xué)模型

二項(xiàng)展開式的通式(即二項(xiàng)分布函數(shù)):(6.7)二項(xiàng)展開式的要點(diǎn):項(xiàng)數(shù):二項(xiàng)展開式中共有n+1項(xiàng)。方次:p的方次,從n→0為降冪;q的方次從0→n為升冪。每項(xiàng)p與q方次之和等于n。系數(shù):各項(xiàng)系數(shù)是成、敗總?cè)藬?shù)的組合數(shù)。項(xiàng)數(shù)為奇數(shù)時(shí):中間系數(shù)最大;項(xiàng)數(shù)為偶數(shù)時(shí):中間兩項(xiàng)系數(shù)相等例10個(gè)硬幣拋一次,或一個(gè)硬幣拋十次,問五次或五次以上正面向上的概率是多少?P177例3:從男生占2/5的學(xué)校中隨機(jī)抽?。秱€(gè)學(xué)生,問正好抽到4個(gè)男生的概率是多少?最多抽到2個(gè)男生的概率是多少?解:將n=6,p=2/5,q=3/5,X=4代入(6.7)式,則恰好抽到4個(gè)男生的概率為最多抽到2個(gè)男生的概率,等于1個(gè)也沒有抽到、抽到1個(gè)和抽到兩個(gè)男生的概率之和,即3.二項(xiàng)分布圖以成功事件出現(xiàn)的次數(shù)為橫坐標(biāo),以成功事件出現(xiàn)不同次數(shù)的概率為縱坐標(biāo),繪制直方圖或多邊圖,即為二項(xiàng)分布圖。二項(xiàng)分布是離散型分布,其概率直方圖是躍階式。二項(xiàng)分布的性質(zhì)從概率直方圖可以看到,二項(xiàng)分布有如下性質(zhì):①.當(dāng)p=q時(shí),圖形是對(duì)稱的。②.當(dāng)p≠q時(shí),直方圖呈偏態(tài)。p>q與p<q時(shí)的偏斜方向相反。4.二項(xiàng)分布的平均數(shù)和標(biāo)準(zhǔn)差如果二項(xiàng)分布滿足p>q且nq≥5(或者p<q且np≥5時(shí),二項(xiàng)分布接近于正態(tài)分布??捎孟旅娴姆椒ㄓ?jì)算二項(xiàng)分布的平均數(shù)和標(biāo)準(zhǔn)差。二項(xiàng)分布的平均數(shù)為二項(xiàng)分布的標(biāo)準(zhǔn)差為(6.8)(6.9)5.二項(xiàng)分布的應(yīng)用二項(xiàng)分布函數(shù)除了用來求成功事件恰好出現(xiàn)X次的概率之外,在教育中主要用來判斷試驗(yàn)結(jié)果的機(jī)遇性與真實(shí)性的界限。1二項(xiàng)分布的均數(shù)與標(biāo)準(zhǔn)差;應(yīng)用前提

平均數(shù)

標(biāo)準(zhǔn)差

應(yīng)用——猜測(cè)性

例:某測(cè)驗(yàn)中有10道正誤選擇題,試分析學(xué)生的掌握情況或猜測(cè)的可能性。

①條件分析

②求均數(shù)和標(biāo)準(zhǔn)差③確定一定可信度時(shí)的掌握程度P=95%P=99%④結(jié)果解釋:練習(xí)1、某測(cè)驗(yàn)有30個(gè)正誤題,試問學(xué)生要做對(duì)多少題,才屬掌握了所學(xué)的內(nèi)容。

K=μ+1.96σ=202、設(shè)有10個(gè)正誤判斷題和10個(gè)選擇題(每題4個(gè)備選答案中只有一個(gè)正確),試比較兩套試題的優(yōu)劣(假設(shè)學(xué)生答對(duì)了8題)。

1)條件分析

2)正誤題的概率3)選擇題的概率

4)解釋

第四節(jié)樣本分布

樣本分布指樣本統(tǒng)計(jì)量的分布,是統(tǒng)計(jì)推論的重要依據(jù)。正態(tài)分布及漸近正態(tài)分布t分布F分布2分布q分布

統(tǒng)計(jì)術(shù)語1、隨機(jī)樣本抽樣原則:隨機(jī)性要求:機(jī)會(huì)均等彼此獨(dú)立2、抽樣誤差定義:由抽樣的隨機(jī)性引起的樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異。

一正態(tài)分布及漸進(jìn)正態(tài)分布是指樣本統(tǒng)計(jì)量為正態(tài)分布或接近正態(tài)分布,可根據(jù)正態(tài)分布的概率進(jìn)行統(tǒng)計(jì)推論。1樣本平均數(shù)的分布若總體正態(tài),方差已知,則從中抽取容量為n的一切可能樣本的均數(shù)分布也呈正態(tài);其中σx被稱為標(biāo)準(zhǔn)誤或者平均數(shù)的標(biāo)準(zhǔn)誤符號(hào):SE(StandardError

解釋:SE越小,樣本統(tǒng)計(jì)量與總體參數(shù)越接近,樣本對(duì)總體的代表性越好,用樣本統(tǒng)計(jì)量推斷總體也越可靠??傮w分布為非正態(tài),但方差已知,只要n足夠大,樣本均數(shù)的分布接近正態(tài)分布。

意義:

闡明了樣本均數(shù)的分布;

給出樣本均數(shù)分布的兩個(gè)重要參數(shù)的計(jì)算方法。

標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差的異同同:都是離中趨勢(shì)的指標(biāo)。異:

S:一般變量值離中趨勢(shì)的指標(biāo)。

SE:樣本統(tǒng)計(jì)量離中趨勢(shì)的指標(biāo)。2方差及標(biāo)準(zhǔn)差的分布總體分布為正態(tài),樣本容量為n,n足夠大,樣本方差及標(biāo)準(zhǔn)差的分布趨于正態(tài),其分布的平均數(shù)與標(biāo)準(zhǔn)差與母總體的關(guān)系:(二)t分布1定義:由小樣本統(tǒng)計(jì)量形成的概率分布t分布與自由度(n-1)有關(guān)注:統(tǒng)計(jì)學(xué)上的自由度是指當(dāng)以樣本的統(tǒng)計(jì)量來估計(jì)總體的參數(shù)時(shí),樣本中獨(dú)立或能自由變化的自變量的個(gè)數(shù),稱為該統(tǒng)計(jì)量的自由度。t分布的特點(diǎn)平均值為0,以平均值0左右對(duì)稱的分布,左側(cè)為負(fù)值,右側(cè)為正值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論