教育統(tǒng)計與分析_第1頁
教育統(tǒng)計與分析_第2頁
教育統(tǒng)計與分析_第3頁
教育統(tǒng)計與分析_第4頁
教育統(tǒng)計與分析_第5頁
已閱讀5頁,還剩285頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

教育統(tǒng)計與分析第一頁,共二百九十頁,編輯于2023年,星期日

第一章描述性統(tǒng)計§1.1怎樣獲取數(shù)據(jù)§1.2頻數(shù)分布§1.3集中量數(shù)§1.4差異量數(shù)END第二頁,共二百九十頁,編輯于2023年,星期日§1.1怎樣獲取數(shù)據(jù)統(tǒng)計學(xué)是一門研究數(shù)據(jù)的搜集、整理、分析與推斷方法的科學(xué),單純對一組數(shù)據(jù)的面貌特征進(jìn)行分析研究稱為描述性統(tǒng)計。選取樣本,通過對樣本的描述來推斷整體的特性,統(tǒng)計學(xué)上稱此為推斷性統(tǒng)計,簡稱為統(tǒng)計推斷。當(dāng)我們根據(jù)樣本信息進(jìn)行統(tǒng)計推斷時,勢必要冒導(dǎo)致錯誤結(jié)論的風(fēng)險,因?yàn)闃颖静⒎强偸桥c總體一致。這樣我們就需要研究如何抽取樣本?什么樣的樣本較為合適?同時,還要考慮如何有效的處理和分析數(shù)據(jù)?如何設(shè)計最佳試驗(yàn)方案以減少導(dǎo)致錯誤結(jié)論的風(fēng)險,并應(yīng)用數(shù)學(xué)理論計算出出現(xiàn)這種風(fēng)險可能性的大小,描述這種可能性大小的數(shù)量指標(biāo)稱為概率。運(yùn)用概率論來研究統(tǒng)計學(xué)的學(xué)科稱為數(shù)理統(tǒng)計。第三頁,共二百九十頁,編輯于2023年,星期日

教育統(tǒng)計學(xué)是運(yùn)用數(shù)理統(tǒng)計方法去研究教育現(xiàn)象的一門應(yīng)用學(xué)科。教育學(xué)與心理學(xué)中許多問題借助于統(tǒng)計學(xué)都可以予以量化,從而揭示教育規(guī)律和心理規(guī)律。每個教育工作者都應(yīng)該掌握這門科學(xué)方法,這對于改進(jìn)教育管理水平,培養(yǎng)教育科研能力,正確開展教育與心理實(shí)驗(yàn),提高教學(xué)質(zhì)量和實(shí)際工作效率都將是十分必要的。

我們把搜集記錄下來的數(shù)量依據(jù)稱為數(shù)據(jù)。實(shí)際工作中,一般采用抽樣調(diào)查的方法來取得數(shù)據(jù),我們以一個例子來說明這種方法:“某地區(qū)初中一年級學(xué)生每星期約看幾小時電視?”是個需要統(tǒng)計的問題,某地區(qū)擁有眾多學(xué)校,不可能一一調(diào)查,因此我們只能從全地區(qū)所有初中一年級學(xué)生中抽出部分學(xué)生展開調(diào)查來獲取數(shù)據(jù),統(tǒng)計學(xué)上稱此為抽樣調(diào)查。我們所考慮對象的全體統(tǒng)計學(xué)上稱為總體或母體,其中每一個對象稱為個體,而從總體中抽取的一部分個體稱為樣本或子樣,樣本中所含個體的數(shù)目稱為樣本容量,通常用字母n表示。樣本分為大樣本(n≥30)與小樣本(n<30),樣本容量的選取取決于實(shí)驗(yàn)的條件和精度,樣本越大,反映總體的信息越充足,但計算量也越大,故樣本容量最好適當(dāng)。第四頁,共二百九十頁,編輯于2023年,星期日

在抽樣調(diào)查中要求樣本具有下面兩個特征:1、能充分反映總體的信息。即每個個體被抽到的可能性相同,個體與個體之間互不影響,數(shù)學(xué)上稱為個體互相獨(dú)立;2、每個個體具有和總體相同的本質(zhì)特性。即樣本具有某種代表性,數(shù)學(xué)上稱此為與總體同分布。滿足以上兩條的樣本稱為隨機(jī)樣本;從總體中抽出一個隨機(jī)樣本,稱為隨機(jī)抽樣。第五頁,共二百九十頁,編輯于2023年,星期日一、簡單隨機(jī)抽樣1、隨機(jī)數(shù)表法

隨機(jī)數(shù)表是根據(jù)數(shù)理統(tǒng)計的原理,由許多隨機(jī)數(shù)字排列起來的數(shù)字表,表中數(shù)字的構(gòu)造方法是:利用計算機(jī)使0,1,…,9十個數(shù)字號碼中每次自動出現(xiàn)一個號碼,用這種方式得到一串?dāng)?shù),編排成組(一般四個數(shù)為一組)。我們?nèi)砸浴澳车貐^(qū)初中一年級學(xué)生每星期約看幾小時電視”為例,如某地區(qū)有3000名初中一年級學(xué)生,需抽出容量為40的一個樣本。先將3000人從0000號編到3000號,第一步,閉上眼睛用鉛筆在表上任意劃一個點(diǎn),規(guī)定如點(diǎn)到奇數(shù)則查第一頁,如點(diǎn)到偶數(shù)則查第二頁;第二步,在選定的那一頁上再點(diǎn)一次,由點(diǎn)中的數(shù)字決定從哪一行開始;最后再點(diǎn)一次決定從哪一個數(shù)起,然后以此為起點(diǎn),開始以四位數(shù)字為一節(jié)讀下去,小于等于3000的選中,大于3000的舍去,直到取滿40個數(shù)據(jù)為止,這40個數(shù)據(jù)對應(yīng)的學(xué)生即為選中的隨機(jī)樣本。第六頁,共二百九十頁,編輯于2023年,星期日2、抽簽法:抽簽法是將所有個體編號打亂次序用類似于抽簽的方法從中來獲取隨機(jī)樣本。例如,把寫有全班學(xué)生編號的卡片放進(jìn)一只盒子里,把盒子搖幾搖使卡片混雜,再從盒中抽中5張卡片,卡片所對應(yīng)學(xué)生的編號即為選中的隨機(jī)樣本。二、分層抽樣

分層抽樣是按一定標(biāo)志把總體內(nèi)的每個個體劃分為若干層,使相互差異小的個體集中在一層內(nèi),從而可以縮小各層內(nèi)個體之間的差異程度,使樣本中各個個體在總體中散布更均勻。分層抽樣時,從各層抽取的樣本個數(shù)可以與各層個體數(shù)成比例。第七頁,共二百九十頁,編輯于2023年,星期日

具體做法是:把總體中個個體劃分為個不相重疊的部分,使每一部分包含的個體數(shù)分別為,且,則第層所含的樣本個體數(shù)為(1.1.1),其中為樣本容量,為第層的層權(quán)數(shù)。例如,要從某校210名7至9歲兒童中抽出三分之一進(jìn)行智力測驗(yàn)。已知該校7歲兒童有63人,8歲兒童有112人,9歲兒童有35人,現(xiàn)在用分層抽樣法確定各年齡組兒童入數(shù)。由(1.1.1)式得

(7歲組)=(210/3)×(63/210)=21(人),(8歲組)=(210/3)×(112/210)=37(人),(9歲組)=(210/3)×(35/210)=12(人)。第八頁,共二百九十頁,編輯于2023年,星期日三、等距抽樣

所謂等距抽樣法是把所有個體按順序排列起來,然后以確定的相等距離抽取隨機(jī)樣本。例如,某大學(xué)抽查部分學(xué)生作業(yè)進(jìn)行檢查,先確定學(xué)生學(xué)號中的一個數(shù),例如末位是3的學(xué)號,然后依次取各系各班學(xué)號末位是3的學(xué)生作業(yè)為樣本。顯然,這種方法人為地規(guī)定了距離,故抽樣的隨機(jī)性有所減弱。抽樣分有放回抽樣(從總體中抽出一個個體記下其特征后再放回總體,然后進(jìn)行第二次抽樣)和無放回抽樣(從總體中抽出一個個體后不再放回去,再抽第二次)兩種方式。當(dāng)總體內(nèi)個體數(shù)目較多時,這兩種抽樣方式?jīng)]有本質(zhì)區(qū)別。教育統(tǒng)計中一般采用無放回抽樣,但由于有放回抽樣能簡化某些計算,故當(dāng)總體內(nèi)個體數(shù)目較多時,我們可以看做是有放回抽樣。通過抽樣獲取數(shù)據(jù)離不開求實(shí)的科學(xué)態(tài)度和認(rèn)真的工作作風(fēng),數(shù)據(jù)如果不準(zhǔn)確、不完整、或有遺漏,不僅數(shù)據(jù)本身失去價值,而且以此進(jìn)行分析推斷還會導(dǎo)致錯誤的結(jié)論。第九頁,共二百九十頁,編輯于2023年,星期日§1.2頻數(shù)分布

一、數(shù)據(jù)的基本類型二、頻數(shù)分布表三、累積頻數(shù)分布表四、頻數(shù)分布圖五、累積頻數(shù)分布曲線圖第十頁,共二百九十頁,編輯于2023年,星期日一、數(shù)據(jù)的基本類型

1、離散型數(shù)據(jù)

離散型數(shù)據(jù)一般指取整數(shù)值的數(shù)量指標(biāo),是計數(shù)性的,數(shù)據(jù)之間不能再劃分為更小的單位。例如學(xué)生的人數(shù);有些教育現(xiàn)象的指標(biāo)是按屬性來劃分的,例如學(xué)生能力分為優(yōu)、良、中、差,用5代表優(yōu)、4代表良、3代表中,2代表差,這樣得到的數(shù)據(jù)仍然是離散型的。第十一頁,共二百九十頁,編輯于2023年,星期日2、連續(xù)型數(shù)據(jù)連續(xù)型數(shù)據(jù)一般指經(jīng)過度量和測定而得到的數(shù)量指標(biāo)。這類數(shù)據(jù)取值可以連續(xù)變化,盡管數(shù)據(jù)本身仍然是數(shù)軸上的點(diǎn),但數(shù)據(jù)與數(shù)據(jù)之間可以無限細(xì)分,也就是數(shù)據(jù)的取值范圍可以充滿一個區(qū)間。例如學(xué)生的考試成績。連續(xù)型數(shù)據(jù)通常以小數(shù)形式出現(xiàn),雖然有時也會以整數(shù)形式出現(xiàn),但當(dāng)提高精度后總會出現(xiàn)小數(shù)。如某學(xué)生期末語文成績?yōu)?0分,我們可以記為90.0分。確定了數(shù)據(jù)類型,我們進(jìn)一步利用頻數(shù)分布表和頻數(shù)分布圖來研究數(shù)據(jù)的變化規(guī)律。第十二頁,共二百九十頁,編輯于2023年,星期日二、頻數(shù)分布表

一組數(shù)據(jù)中每個數(shù)據(jù)出現(xiàn)的次數(shù)稱為這個數(shù)據(jù)的頻數(shù)。按頻數(shù)分類列出的一覽表稱為頻數(shù)分布表。1、離散型數(shù)據(jù)的頻數(shù)分布表例1某幼兒園測定5歲組兒童智力,共7個項(xiàng)目。全園30名5歲兒童中有1人答對1項(xiàng)、3人答對2項(xiàng)、4人答對3項(xiàng)、8人答對4項(xiàng)、7人答對5項(xiàng)、5人答對6項(xiàng)、2人答對7項(xiàng)。我們列出頻數(shù)分布表如下:答對題數(shù)頻數(shù)答對題數(shù)頻數(shù)11572365347248總和30表1.130名兒童智力測定分布第十三頁,共二百九十頁,編輯于2023年,星期日2、連續(xù)型數(shù)據(jù)的頻數(shù)分布表

68.079.080.083.062.059.080.081.061.583.067.097.063.593.076.097.584.564.075.088.091.078.567.094.081.070.086.572.085.094.078.091.060.075.582.091.095.052.076.580.0例2附中初二年級實(shí)驗(yàn)班40名同學(xué)期末數(shù)學(xué)統(tǒng)考測驗(yàn)得分如下:第十四頁,共二百九十頁,編輯于2023年,星期日這一組數(shù)據(jù)中最大值是97.5,最小值是52.0,可見數(shù)據(jù)分布很散,項(xiàng)數(shù)較多。因此我們將它們分組,組的范圍稱為組區(qū)間,每組的起止分別稱為組下限和組上限,每組的大小稱為組距,各組組距一般是相同的。

分組的原則是:100個以上的數(shù)據(jù)分為12~20組,數(shù)據(jù)較少則分為8~10組。組距為便于計算一組取為3、5、10較為合適,本例分為10組,組距取5。我們將組號放在表的第一列,組區(qū)間放在第二列,組中值記為,放在第三列,(上限+下限),然后數(shù)出各組的頻數(shù)放在第四列。第二組為(56.55~61.55),我們可以提高一位分點(diǎn)或降低一位分點(diǎn),通常我們?nèi)《恍?shù),因此61.5應(yīng)放在第二組。第十五頁,共二百九十頁,編輯于2023年,星期日

有了組頻數(shù),當(dāng)然也可以算出組頻率(每組組頻數(shù)與總頻數(shù)之比),為了以后的方便,我們把頻率放在表的最后一列(表1.2),我們從中可以看出數(shù)據(jù)所呈現(xiàn)的統(tǒng)計規(guī)律性。表1.2附中初二年級實(shí)驗(yàn)班期末數(shù)學(xué)統(tǒng)考測驗(yàn)成績分布組號組區(qū)間組中值頻數(shù)頻率151.55-56.5554.0511/40256.55-61.5559.0533/40361.55-66.5564.0533/40466.55-71.5569.0244/40571.55-76.5574.555/40676.55-81.5579.0588/40781.55-86.5584.0566/40886.55-91.5589.0544/40991.56-96.5594.544/401096.55-100.0098.2522/40總和

401.00第十六頁,共二百九十頁,編輯于2023年,星期日

綜上,對于分組數(shù)據(jù)編制頻數(shù)分布表歸納為以下幾步:

第一步找極差,最大值-最小值,由大致了解數(shù)據(jù)的差異范圍。第二步定組距,一般為便于計算,多取為2、3、5、10等。第三步定組數(shù),一般數(shù)據(jù)在100個以上,分為12~20組,數(shù)據(jù)較少則分為8-10組,也可以借用下面公式確定近似組數(shù)。組數(shù),其中方括號為的整數(shù)部分,為組距,

例2中,。第四步定分點(diǎn),通常使分點(diǎn)比原測量精度多一位或少一位,要注意的是最低組的上、下限應(yīng)能包括最小值,最高組的上、下限應(yīng)能包括最大值。第五步數(shù)頻數(shù),根據(jù)組限歸類,數(shù)出全體數(shù)據(jù)落入每一組的個數(shù)。頻數(shù)分布表也有其缺點(diǎn),我們在下一節(jié)會看到計算描述一組數(shù)據(jù)特征的數(shù)據(jù)依賴于各組的組中值,因而出現(xiàn)了誤差。但是在理論上我們一般假定各組內(nèi)頻數(shù)分布是均勻的,因而各組的誤差會相互抵償,使總誤差減少。第十七頁,共二百九十頁,編輯于2023年,星期日

三、累積頻數(shù)分布表

累積頻數(shù)分布表的列法是在頻數(shù)分布表上添加一列累積頻數(shù)。具體方法是:從數(shù)值最小的一組開始,逐組累加頻數(shù)至數(shù)值最大的一組,最后累加的頻數(shù)與總頻數(shù)相等。把累積頻數(shù)除以總頻數(shù),得到相應(yīng)的累積頻率;把累積頻率乘以100,得到相應(yīng)的累積百分比。下表是例2中數(shù)據(jù)的累積頻數(shù)、累積頻率,累積百分比分布表。第十八頁,共二百九十頁,編輯于2023年,星期日組號組區(qū)間組中值頻數(shù)頻率累積頻數(shù)累積頻率累積百分比151.55-56.5554.0510.02510.0252.5256.55-61.5559.0530.07540.10010.0361.55-66.5564.0530.07570.17517.5466.55-71.5569.0540.100110.27527.5571.55-76.5574.0550.125160.40040.0676.55-81.5579.0580.200240.60060.0781.55-86.5584.0560.150300.75075.0886.55-91.5589.0540.100340.85085.0991.56-96.5594.0540.100380.95095.01096.5-100.0098.2520.050401.00100.00總和

401.000

表1.3附中初二年級實(shí)驗(yàn)班期末數(shù)學(xué)統(tǒng)考累積頻數(shù)分布表第十九頁,共二百九十頁,編輯于2023年,星期日四、頻數(shù)分布圖

通常我們用頻數(shù)分布圖來表示數(shù)據(jù)的規(guī)律性,常見的頻數(shù)分布圖為直方圖。直方圖是在橫軸上標(biāo)出組距,縱軸上標(biāo)出頻率與組距之比,然后以每組組距為底邊,相應(yīng)的頻率與組距之比為高作矩形。顯然,每個矩形的面積恰好等于數(shù)據(jù)落在該矩形所對應(yīng)組內(nèi)的頻率,這樣所有矩形面積總和為總頻率1。直方圖是利用各個矩形的高低來描繪頻數(shù)分布情況的。圖1.1是例2中數(shù)據(jù)的直方圖,圖中斷裂號表示由0至51.55之間的距離是縮短了的。有時為了簡單,橫軸上只標(biāo)出組中值,包括組中值在內(nèi)的區(qū)間即為本組組距。54.05

59.05

64.05

69.05

74.05

79.05

84.05

89.05

94.05

98.25

0.01

0.02

0.03

0.04

頻率組距

圖1.4初二年級實(shí)驗(yàn)班期末數(shù)學(xué)統(tǒng)考測驗(yàn)成績直方圖第二十頁,共二百九十頁,編輯于2023年,星期日

五、累積頻數(shù)分布曲線圖累積頻數(shù)分布曲線圖橫軸取每組上限,縱軸取累積頻數(shù),在相交處畫點(diǎn),順次連續(xù)各點(diǎn)成一上升曲線,又稱S型或肩型曲線,曲線的最低點(diǎn)應(yīng)與基線相接。以累積頻率為縱軸上點(diǎn),重復(fù)上述過程則得到累積頻率分布曲線圖。再把累積頻率乘以100,則得到累積百分比,以累積百分比為縱軸上點(diǎn),重復(fù)上述過程,則得到累積百分比分布曲線圖。為了方便,一般把累積頻數(shù)分布曲線和累積百分比分布曲線放在一張圖上,左邊縱軸為累積頻數(shù),右邊縱軸為累積百分比。作圖時要求兩縱軸平行等長,左邊按總頻數(shù)劃分,右邊因?yàn)槔鄯e百分比最大是100,故劃分為100等份。圖1.3是例2中數(shù)據(jù)的累積頻數(shù),累積百分比分布曲線圖。第二十一頁,共二百九十頁,編輯于2023年,星期日56..55

61..55

66..55

71..55

76..55

81..55

86..55

91..55

96..55

10

20

30

40

50

60

70

80

90

100

累積百分比

累積頻數(shù)

5

10

15

20

25

30

35

40

圖1.3累積頻數(shù)、累積百分比曲線圖第二十二頁,共二百九十頁,編輯于2023年,星期日

這種曲線分布圖有一定的實(shí)用價值,可以從圖中插值,回答小于或大于某值的頻數(shù)有多少,或回答占總頻數(shù)百分之幾的頻數(shù)小于或大于某值。例如橫軸上給出81.55分,可以從此點(diǎn)向上作垂直于橫軸的直線和曲線相交于一點(diǎn),再由這一點(diǎn)向右作平行于橫軸的直線與縱軸右側(cè)交于一點(diǎn)為60,這表明81.55分位于百分之六十的位置上,說明有百分之六十的學(xué)生得分低于81.55分。反之,如果知道右側(cè)縱軸上的百分位置,在橫軸上也能找到相應(yīng)的分?jǐn)?shù),這個分?jǐn)?shù)在下一節(jié)稱為百分位數(shù),例如,如有百分之六十的學(xué)生成績在某學(xué)生之下,那么該生得分大約為81.55分。第二十三頁,共二百九十頁,編輯于2023年,星期日§1.3集中量數(shù)我們需要計算出描述一組數(shù)據(jù)特征的某些量數(shù)。例如,一組數(shù)據(jù)向何處集中?出現(xiàn)最多的數(shù)值是什么?其中間數(shù)值在哪里?這些能夠反映一組數(shù)據(jù)集中趨勢或一般水平的數(shù)值,統(tǒng)計學(xué)上稱為集中量數(shù)或水平值。常見的集中量數(shù)有平均數(shù)、眾數(shù)、中數(shù)。一、平均數(shù)平均數(shù)表示一組數(shù)據(jù)集中的位置,又稱為均值。1、算術(shù)平均數(shù)算術(shù)平均數(shù)是所有數(shù)據(jù)之和除以數(shù)據(jù)個數(shù)的商,記為.讀為“杠”。①不分組數(shù)據(jù)求算術(shù)平均數(shù)(1.3.1)其中為第個數(shù)據(jù)為數(shù)據(jù)總個數(shù)。第二十四頁,共二百九十頁,編輯于2023年,星期日

例1某校射擊隊5名隊員在一次射擊中,射中的環(huán)數(shù)分別為6,7,8,9,10,求平均射中環(huán)數(shù)。

解:由(1.3.1)式(環(huán))。如果數(shù)據(jù)中有重復(fù)數(shù),我們采用加權(quán)形式求算術(shù)平均數(shù)?!皺?quán)”為所占的比重,比率,頻率都可以看做為一種“權(quán)”。例如,某校射擊隊5名隊員在一次射擊中射中的環(huán)數(shù)分別為6,6,8,10,10,則把上式一般化得到,其中為第個數(shù)的頻數(shù),為第個數(shù)的頻率。我們稱由(1.3.2)式定義的為以頻率為權(quán)的加權(quán)平均數(shù),顯然,權(quán)均為1/N的加權(quán)平均數(shù)為算術(shù)平均數(shù)。第二十五頁,共二百九十頁,編輯于2023年,星期日②分組數(shù)據(jù)求算術(shù)平均數(shù)(組中值法)對于分組數(shù)據(jù)先要列出頻數(shù)分布表,再把每組的各個數(shù)據(jù)都看作與組中值相同的數(shù),這是因?yàn)槊拷M內(nèi)各個數(shù)據(jù)雖然有大有小,但其相對于組中值的誤差最終趨于抵消,故可以把每組的組中值做為每組的代表值,由此得到簡記為(1.3.3),其中為第組的組中值,其中為組數(shù),為第組的組頻數(shù)。

我們稱由(1.3.3)式求平均數(shù)的方法為組中值法,由于我們假定每組中數(shù)據(jù)都與每組組中值相同,因此所得平均數(shù)結(jié)果不可能與將所有數(shù)據(jù)相加再除以數(shù)據(jù)總個數(shù)所得結(jié)果相同,利用組中值法求出的平均數(shù)只是一個近似值。第二十六頁,共二百九十頁,編輯于2023年,星期日例2求§1.2例2中數(shù)據(jù)的算術(shù)平均數(shù)。解:把表1.2中數(shù)據(jù)代入(1.3.3)式得到③的基本性質(zhì)常數(shù)性為常數(shù);(1.3.4)齊次性(1.3.5)可加性(1.3.6)特別(1.3.7)第二十七頁,共二百九十頁,編輯于2023年,星期日2、加權(quán)平均數(shù)幾個作用在不同比重上的平均數(shù)再進(jìn)行平均稱為加權(quán)平均數(shù)。例如,是個數(shù)的平均數(shù),是個數(shù)的平均數(shù),是個數(shù)的平均數(shù),則(1.3.8),如果則(1.3.9)顯然,以頻率為權(quán)的加權(quán)平均數(shù)公式(1.3.2)是(1.3.9)的特殊情形,這是因?yàn)橛善骄鶖?shù)的常數(shù)性,,對于分組數(shù)據(jù)用加權(quán)形式求,公式(1.3.3)中相當(dāng)于第個數(shù)的平均數(shù)。第二十八頁,共二百九十頁,編輯于2023年,星期日例3大學(xué)南路小學(xué)一年級實(shí)驗(yàn)班40名學(xué)生期末數(shù)學(xué)測驗(yàn)平均分?jǐn)?shù)為82.59,對比班45名學(xué)生期末數(shù)學(xué)測驗(yàn)平均分?jǐn)?shù)為69.68,求全年級期末數(shù)學(xué)測驗(yàn)平均成績。解:由公式(1.3.8)(分).

例4某??疾鞂W(xué)生成績,期末考試占全學(xué)期的85%,平時成績(包括作業(yè),期中考試),占全學(xué)期的15%.如果某學(xué)生期末成績?yōu)?5分,平時成績?yōu)?0分,求該生全學(xué)期平均成績。解由公式(1.3.8)(分)第二十九頁,共二百九十頁,編輯于2023年,星期日3、幾何平均數(shù)幾何平均數(shù)是一組數(shù)據(jù)中個數(shù)據(jù)連乘積的次方根,記為,其計算公式為

(1.3.10)例5某校1999年至2001年招生人數(shù)如表1.4,求該校平均每年招生增長速度。表1.4某校1999年至2001年招生人數(shù)年份招生人數(shù)增長比率19999000200011001100/900200112001200/1100第三十頁,共二百九十頁,編輯于2023年,星期日解:由(1.3.10)式.故該校招生平均年增長速度為15%.實(shí)際應(yīng)用中,如果N≥3,可以利用對數(shù)簡化計算,方法是對兩邊取對數(shù),得到,查常用對數(shù)表得到,再查反對數(shù)表得到。第三十一頁,共二百九十頁,編輯于2023年,星期日二、眾數(shù)數(shù)據(jù)集合中出現(xiàn)次數(shù)最多的那個數(shù)稱為眾數(shù),用表示。1、觀察法①離散型數(shù)據(jù)求眾數(shù)

例如,調(diào)查全班40名學(xué)生業(yè)余愛好,有20人參加體育小組,15人參加音樂小組,5人參加無線電小組。如果用1表示參加體育小組,2表示參加音樂小組,3表示參加無線電小組,則1出現(xiàn)次數(shù)最多,因此眾數(shù)就是1。②分組數(shù)據(jù)求眾數(shù)

首先列出頻數(shù)分布表,再用每組組中值表示該組一般水平,則頻數(shù)最多一組的組中值即為眾數(shù)。顯然,此眾數(shù)是較為粗略的。第三十二頁,共二百九十頁,編輯于2023年,星期日2、公式法如果用分別表示眾數(shù)所在組下限和上限,表示與眾數(shù)所在組的下限相鄰組的頻數(shù),表示與眾數(shù)所在組的上限相鄰組的頻數(shù),如果眾數(shù)是自眾數(shù)所在組的下限向上擠,則眾數(shù)所在位置是再加上區(qū)間長度(組距)的倍處,這是由于在相鄰組總頻數(shù)中占

的比重。反過來,如果眾數(shù)是自眾數(shù)所在組的上限向下擠,那么眾數(shù)所在位置是再減去區(qū)間長度的倍處。由此,我們得到求眾數(shù)的近似公式為(1.3.13)(1.3.14)第三十三頁,共二百九十頁,編輯于2023年,星期日三、中數(shù)中數(shù)指一組依次序排列的數(shù)據(jù)中位于正中間的數(shù),它正好分全體頻數(shù)為相等的兩部分,用表示。1、不分組數(shù)據(jù)求中數(shù)①數(shù)據(jù)個數(shù)為奇數(shù)求例7某校男子體操隊9名隊員5項(xiàng)比賽總積分分別為:47,49,42,39,45,41,37,46,40,求這9個數(shù)據(jù)的中數(shù)。解:把9個數(shù)據(jù)依大小次序排列為:37,39,40,41,42,45,46,47,49。顯然,正中的42為中數(shù),因?yàn)?2左右各有4個數(shù)。由此,我們得到數(shù)據(jù)個數(shù)為奇數(shù)時,中數(shù)為第個數(shù)目的數(shù)值。第三十四頁,共二百九十頁,編輯于2023年,星期日②數(shù)據(jù)個數(shù)為偶數(shù)求例8求42,45,50,54,57,58的中數(shù)。解:由于N=6,由中數(shù)定義,中數(shù)應(yīng)在50與54中間,自然我們?nèi)∑淦骄鶖?shù)為中數(shù),即

由此,數(shù)據(jù)個數(shù)為偶數(shù)時,以最中間兩個數(shù)的平均數(shù)為中數(shù)。第三十五頁,共二百九十頁,編輯于2023年,星期日

2、分組數(shù)據(jù)求中數(shù)例9下表給出25個數(shù)據(jù)的頻數(shù)分布,求中數(shù)。表1.525個數(shù)據(jù)的頻數(shù)分布組區(qū)間組中值頻數(shù)75-8077.5170-7572.5365-7067.5560-6562.51055-6057.5450-4552.52第三十六頁,共二百九十頁,編輯于2023年,星期日

解由于N=25,因此中數(shù)為第13個數(shù),在(60-65)這一組,而這一組以下有6個數(shù)據(jù),須再向上數(shù)7個數(shù),才能到達(dá)第13個數(shù)。而每個區(qū)間的長度(組距)為5,如果(60-65)這一組內(nèi)10個數(shù)據(jù)是均勻分布的,那么為到達(dá)第13個數(shù),需要在中數(shù)所在組的下限處加上區(qū)間長度的十分之七,即中數(shù)應(yīng)為因此,我們得到(1.3.15)。如果取中數(shù)所在組上限U,相應(yīng)有(1.3.16)。其中,為中數(shù)所在組以上累積頻數(shù),為中數(shù)所在組以下累積頻數(shù)。第三十七頁,共二百九十頁,編輯于2023年,星期日

在§1.2,我們接觸到了百分位數(shù),介紹了通過累積百分比分布圖找百分位數(shù)的方法,實(shí)際上,中數(shù)也是一個百分位數(shù),它正好位于百分之五十的位置上。一般的百分位數(shù)用表示,稱為百分之分位數(shù),它表示在此百分位數(shù)以下的頻數(shù)占總頻數(shù)的百分之。由公式(1.3.15)(1.3.16),我們類似可得

(1.3.17)

(1.3.18)其中為所在組下限,為所在組上限,為所在組以下累積頻數(shù),為所在組以上累積頻數(shù),為所在組頻數(shù),i為組距。例9中如求,由(1.3.17)式得第三十八頁,共二百九十頁,編輯于2023年,星期日

四、三種集中量數(shù)的比較

集中量數(shù)的作用是指出一組數(shù)據(jù)中有代表性的數(shù)值,同一組數(shù)值的三種集中量其值一般是不同的,故其實(shí)際意義也是有區(qū)別的。例如,某中學(xué)數(shù)學(xué)教研室教師年齡分別為22,24,24,25,55(歲),現(xiàn)在問哪一年齡具有代表性?顯然,平均數(shù)30不能作為水平值,這是因?yàn)槠骄鶖?shù)與每一個數(shù)據(jù)有關(guān),故受極端值55的影響而失去代表性。因此,選擇中數(shù)或眾數(shù)24作為這個教研室教師年齡的一般水平較為合適。又如在一次測驗(yàn)中,某小組9名學(xué)生中有5個80分,3個85分,1個90分.如果用中數(shù)或眾數(shù)80分來作為一般水平值是不合適的,這是因?yàn)檫@次測驗(yàn)的成績分布較為特殊,且每個分?jǐn)?shù)相差不大。因此,在這種情形要用平均數(shù)82.5分作為集中趨勢的度量。第三十九頁,共二百九十頁,編輯于2023年,星期日

三種集中量的共性是反映了一組數(shù)據(jù)的集中位置,指出了一組數(shù)據(jù)中有典型意義的數(shù)。平均數(shù)應(yīng)用最為廣泛,因?yàn)樗紤]到了每一個數(shù)據(jù),且便于用公式表示,其缺點(diǎn)是當(dāng)數(shù)據(jù)極端出現(xiàn)較大或較小數(shù)時,作為衡量集中趨勢的度量會受到較大影響。中數(shù)是位于一組數(shù)據(jù)正中的一個數(shù),它不受極端值的影響,但如果數(shù)據(jù)集中成明顯不同且差異很大的幾組時,則不易反映數(shù)據(jù)的集中趨勢。中數(shù)不與具體某個數(shù)有關(guān),而只是與數(shù)據(jù)的個數(shù)有關(guān),因此,只要中間數(shù)值不改變,排列順序不改變,其兩邊數(shù)值任意改變并不影響中數(shù)的值。眾數(shù)由于出現(xiàn)頻數(shù)最多,往往被認(rèn)為是一組數(shù)據(jù)中最典型的一個。但在確定眾數(shù)時不受其它數(shù)據(jù)的影響,這是眾數(shù)最大的缺陷,而且,如果一組數(shù)據(jù)中有幾個數(shù)同時符合眾數(shù)定義時,數(shù)則失去代表性。眾數(shù)可以消除極端數(shù)值的影響,但計算眾數(shù)大多是粗略的,因此,作為集中趨勢的度量,價值較小。第四十頁,共二百九十頁,編輯于2023年,星期日英國統(tǒng)計學(xué)家皮爾遜(Pearson)根據(jù)多年經(jīng)驗(yàn),發(fā)現(xiàn)當(dāng)頻數(shù)分布完全對稱時,平均數(shù),中數(shù),眾數(shù)重合.在頻數(shù)分布不對稱時,這三種量數(shù)的關(guān)系為即這樣,知道其中兩個,可以近似求出第三個。第四十一頁,共二百九十頁,編輯于2023年,星期日§1.4差異量數(shù)描述一組數(shù)據(jù)集中趨勢的水平值只是從一個側(cè)面反映了一組數(shù)據(jù)的特征。在實(shí)際統(tǒng)計工作中我們不僅要考察一組數(shù)據(jù)的集中位置,還要考察其分散程度,這種用來衡量一組數(shù)據(jù)分散程度(集中程度)的量稱為差異量數(shù)。常見的差異量數(shù)有:極差、四分位差、平均差、標(biāo)準(zhǔn)差。一、極差極差又稱為全距,是一組數(shù)據(jù)中最大值與最小值的差,用R表示。R=最大值-最小值(1.4.1)極差是衡量一組數(shù)據(jù)分散程度粗略的度量值。在繪制頻數(shù)分布表時我們已經(jīng)看到,通過極差可以大致看出一組數(shù)據(jù)的范圍。第四十二頁,共二百九十頁,編輯于2023年,星期日

對于分組數(shù)據(jù),R取最高一組的上限與最低一組的下限之差。由于極差只取決于兩個極端數(shù)據(jù),不能反映其它數(shù)據(jù)的分散情況,因此,在大多數(shù)情形極差不適用于衡量一組數(shù)據(jù)的分散程度。

例1兩個小組學(xué)生身高(米)分別為:甲方1.80,1.53,1.52,1.51,1.50乙方1.80,1.79,1.78,1.77,1.50顯然,兩組數(shù)據(jù)的極差都是0.30,但這兩組數(shù)據(jù)有很大的差異

第四十三頁,共二百九十頁,編輯于2023年,星期日二、四分位差四分位差指與之差的一半,用來描述頻數(shù)分布中間數(shù)值的分散程度,用表示。都是百分位數(shù),顯然,再加上(中數(shù))正好分總頻數(shù)為相等的四部分,為了方便有時把記為,稱為第一四分位數(shù),以下占總頻數(shù)的四分之一;把記為,稱為第二四分位數(shù),以下占總頻數(shù)的四分之二;把記為,稱為第三四分位數(shù),以下占總頻數(shù)的四分之三,這樣,的計算公式為顯然,四分位差是相對于中數(shù)來衡量一組數(shù)據(jù)分散程度的。這是因?yàn)?,如果一組數(shù)據(jù)頻數(shù)分布對稱,則有第四十四頁,共二百九十頁,編輯于2023年,星期日由求百分位數(shù)公式(1.3.17)類似可得其中分別為第一,第三四分位數(shù)所在組下限,分別為第一,第三四分位數(shù)所在組以下累積頻數(shù),分別為第一,第三四分位數(shù)所在組頻數(shù),i為組距。如果數(shù)據(jù)未分組,只須把每個數(shù)據(jù)依大小順序排列,用總頻數(shù)N除以4,即可得到四分位。第四十五頁,共二百九十頁,編輯于2023年,星期日例2求20名學(xué)生一次語文測驗(yàn)成績的四分位差。解把20個數(shù)據(jù)按大小排列為66,67,67,69,70

71,72,73,74,76

Q1

Q2

85,86,88,88,90

92,94,97,98,90

Q3

則66,67,67,69,70

71,72,73,74,76

Q1

Q2

85,86,88,88,90

92,94,97,98,90

Q3

第四十六頁,共二百九十頁,編輯于2023年,星期日三、平均差我們設(shè)想找到一個相對于平均數(shù)來衡量一組數(shù)據(jù)分散程度的差異量,這就是平均差,用M·D表示。例3兩個女聲小合唱隊身高(米)分別為:甲隊1.60,1.62,1.59,1.60,1.59乙隊1.80,1.60,1.50,1.50,1.60顯然,。但乙隊隊員較甲隊隊員身高波動大,這是因?yàn)槊總€隊員的身高相對于平均數(shù)都有一個離差,離差越小,越集中于,但離差有正有負(fù),如果將全部離差加起來,由于,那么即正、負(fù)離差相抵消,故我們在考慮總離差時,可以將每個離差取絕對值再加起來。這樣并不影響每個數(shù)據(jù)偏離平均數(shù)的程度,因?yàn)殡x差的長度為了使所有離差再集中,我們再取其平均得到

(1.4.5)第四十七頁,共二百九十頁,編輯于2023年,星期日如果數(shù)據(jù)已分組,類似有

(1.4.6)例3中,可見,乙隊隊員身高平均差大大高于甲隊,因此,乙隊隊員身高差異較甲隊大,即分散程度較甲隊大。采用平均差來衡量數(shù)據(jù)的分散程度要對離差取絕對值,但絕對值運(yùn)算復(fù)雜且不便于代數(shù)方法處理。如果給每個離差平方,并不影響其分散程度,且可以避免總離差為零。因此,我們引入另一個衡量一組數(shù)據(jù)分散程度的差異量——標(biāo)準(zhǔn)差。第四十八頁,共二百九十頁,編輯于2023年,星期日四、標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差是方差的平方根,又稱為均方差,用S表示。方差是各個數(shù)據(jù)與平均數(shù)離差的平方的算術(shù)平均數(shù),用表示。公式為(1.4.7)

(1.4.8)對于分組數(shù)據(jù),類似有

(1.4.9)其中為第i組的組頻數(shù),為第i組的組中值。第四十九頁,共二百九十頁,編輯于2023年,星期日計算還可利用以下簡化公式:(1.4.10)這是因?yàn)閷τ诜纸M數(shù)據(jù),類似簡化公式為(1.4.11)其中a為假定平均數(shù),即頻數(shù)最多一組的組中值。第五十頁,共二百九十頁,編輯于2023年,星期日例4某區(qū)50名6歲男童身高(單位:cm)分組數(shù)據(jù)如表1.6:表1.650名6歲男童身高分布組區(qū)間頻數(shù)組區(qū)間頻數(shù)108.5以下1118.5-120.511108.5-110.53120.5-122.59110.5-112.51122.5-124.55112.5-114.52124.5-126.53114.5-116.56126.5以上2116.5-118.57

求標(biāo)準(zhǔn)差S.第五十一頁,共二百九十頁,編輯于2023年,星期日解N=50,取a=119.5,由公式(1.4.11)得到標(biāo)準(zhǔn)差是衡量一組數(shù)據(jù)分散程度最有效的量數(shù),標(biāo)準(zhǔn)差越小,這組數(shù)據(jù)越向平均數(shù)集中,即分布的差異越小;標(biāo)準(zhǔn)差越大,這組數(shù)據(jù)偏離平均數(shù)的程度越大,即分布的差異也越大。故第五十二頁,共二百九十頁,編輯于2023年,星期日五、差異系數(shù)差異系數(shù)也稱為相對差異量,常用倍數(shù)式百分?jǐn)?shù)表示,它從相對意義上來衡量一組數(shù)據(jù)的分散程度。而受其計量單位、水平值影響的差異量稱為絕對差異量,極差,四分位差,平均差,標(biāo)準(zhǔn)差都是絕對差異量,簡稱為差異量數(shù)。

常用的差異系數(shù)有:極差系數(shù),標(biāo)準(zhǔn)差系數(shù),四分位差系數(shù)等。第五十三頁,共二百九十頁,編輯于2023年,星期日1)極差系數(shù)極差系數(shù)為一組數(shù)據(jù)中最大值與最小值的倍數(shù),即極差系數(shù)=最大值/最小值(1.4.12)例5某班數(shù)學(xué)統(tǒng)編教材與實(shí)驗(yàn)教材測驗(yàn)成績?nèi)缦卤?,試用極差系數(shù)比較這兩組數(shù)據(jù)的差異大小。表1.7某班數(shù)學(xué)統(tǒng)編教材與實(shí)驗(yàn)教材測驗(yàn)成績

最高分最低分極差極差系數(shù)統(tǒng)編教材10080201.25實(shí)驗(yàn)教材8060201.33由表1.7可見,盡管極差一樣,但由于統(tǒng)編教材得分普遍高,因此相對來說,其差異程度要低于實(shí)驗(yàn)教材。第五十四頁,共二百九十頁,編輯于2023年,星期日2)標(biāo)準(zhǔn)差系數(shù)標(biāo)準(zhǔn)差系數(shù)為標(biāo)準(zhǔn)差與其算術(shù)平均數(shù)的比值的百分?jǐn)?shù),記為C·V.(1.4.13)顯然,標(biāo)準(zhǔn)差系數(shù)實(shí)際上是以為單位來衡量分散程度的。由于化成了百分?jǐn)?shù)形式,故是一個無單位限制的抽象數(shù)值。C·V越小,說明分散程度越小。例6某幼兒園學(xué)前班6歲男童平均體重為20.50kg,平均身高為118.20cm,體重的標(biāo)準(zhǔn)差為1.80kg,身高的標(biāo)準(zhǔn)差為4.20cm,試用標(biāo)準(zhǔn)差系數(shù)比較體重與身高的差異程度。解由公式(1.4.13),體重身高可見,體重的差異程度高于身高的差異程度。第五十五頁,共二百九十頁,編輯于2023年,星期日例7某班學(xué)生第一次外語測驗(yàn)平均分?jǐn)?shù)為70.2分,標(biāo)準(zhǔn)差為18.5分。經(jīng)采取補(bǔ)習(xí)措施,不及格率有所下降,第二次測驗(yàn)平均分?jǐn)?shù)為78.5分,標(biāo)準(zhǔn)差為12.2分,試用標(biāo)準(zhǔn)差系數(shù)比較兩次外語測驗(yàn)成績的差異程度。解由公式(1.4.13),第一次測驗(yàn)第二次測驗(yàn).可見,第二次測驗(yàn)成績的差異程度較小,說明經(jīng)補(bǔ)習(xí)后,不但平均成績有所提高,而且較第一次測驗(yàn)成績相對于平均數(shù)更為集中。關(guān)于四分位差系數(shù),由于是相對于中數(shù)來衡量分散程度的,故類似于標(biāo)準(zhǔn)差系數(shù)公式(1.4.13),四分位差系數(shù)公式為四分位差系數(shù)=(1.4.14)其中Q為四分位差,為中數(shù)。第五十六頁,共二百九十頁,編輯于2023年,星期日六、幾種差異量數(shù)的比較

差異量數(shù)是相對于集中量數(shù)來定義的,因此,選用合適的差異量數(shù)首先要注意到集中量數(shù)的選取。例如,集中量數(shù)選為中數(shù),則差異量數(shù)選為四分位差;如果集中量數(shù)選為平均數(shù),則差異量數(shù)選為平均差或標(biāo)準(zhǔn)差。其次,由于各種差異量數(shù)受其一定范圍的限制,在選用時既要考慮到能夠較為理想的反映一組數(shù)據(jù)的分散程度,又要便于計算,下面對幾種差異量數(shù)作一簡單比較。第五十七頁,共二百九十頁,編輯于2023年,星期日

極差只是在大范圍內(nèi)粗略的衡量分散程度,且受極端數(shù)值的影響較大,不能反映全部數(shù)據(jù)的分散程度,一般不適用,但由于計算簡單,可以作為一種衡量分散程度的大致估計。四分位差相對于中數(shù)來考慮分散程度,意義明確,較好地反映了中間數(shù)據(jù)偏離中數(shù)的程度。但是,四分位差不能考慮兩端數(shù)據(jù)偏離中數(shù)的程度,也就是說沒有反映全部數(shù)據(jù)的分散情況。因此,只有當(dāng)集中量數(shù)選為中數(shù)時,用四分位差來衡量一組數(shù)據(jù)的分散程度較為合適。

標(biāo)準(zhǔn)差是最常用、最為理想的差異量,原因有三條:①相對衡量指標(biāo)平均數(shù)是最常用的集中量;②標(biāo)準(zhǔn)差考慮每一數(shù)據(jù)與平均數(shù)離差的大小,因此能夠全面考察一組數(shù)據(jù)的分散程度;③標(biāo)準(zhǔn)差寫成差方和的形式便于進(jìn)行代數(shù)處理。當(dāng)頻數(shù)分布完全對稱時,各種差異量數(shù)有以下關(guān)系式:S=1.2533M?D,Q=0.6745S,Q=0.8453M?D.第五十八頁,共二百九十頁,編輯于2023年,星期日第二章概率論基礎(chǔ)§2.1事件與概率§2.2隨機(jī)變量及常見分布§2.3抽樣分布定理END第五十九頁,共二百九十頁,編輯于2023年,星期日§2.1事件與概率

現(xiàn)代統(tǒng)計學(xué)的重要工作之一是要通過部分(樣本)來推斷總體,由于樣本僅僅是總體的一部分,因此進(jìn)行統(tǒng)計推斷勢必要冒導(dǎo)致錯誤結(jié)論的風(fēng)險,描述這種風(fēng)險出現(xiàn)可能性大小的數(shù)量指標(biāo)稱為概率。一、事件二、概率第六十頁,共二百九十頁,編輯于2023年,星期日一、事件(一)隨機(jī)試驗(yàn)對于一個試驗(yàn)E,如果在相同條件下可以重復(fù)進(jìn)行,而且試驗(yàn)的結(jié)果事先不能準(zhǔn)確預(yù)言,我們稱試驗(yàn)E為隨機(jī)試驗(yàn),簡稱為試驗(yàn)。(二)隨機(jī)事件

隨機(jī)試驗(yàn)的某些結(jié)果所構(gòu)成的集合稱為隨機(jī)事件,簡稱為事件,用大寫英文字母A、B、C等表示。基本事件是最簡單的事件,不可再分的事件,例如擲一顆骰子出現(xiàn)1點(diǎn)。必然事件指隨機(jī)試驗(yàn)必然會發(fā)生的結(jié)果,用大寫希臘字母Ω表示,例如擲一顆骰子出現(xiàn)不大于6點(diǎn)。

第六十一頁,共二百九十頁,編輯于2023年,星期日不可能事件指隨機(jī)試驗(yàn)不可能發(fā)生的結(jié)果,用希臘字母表示,例如擲一顆骰子出現(xiàn)小于1點(diǎn)。我們把所有基本事件構(gòu)成的集合稱為樣本空間,也用Ω表示。進(jìn)行一次試驗(yàn)必然會出現(xiàn)樣本空間Ω中的一個基本結(jié)果,這意味著樣本空間Ω是一個必然事件。(三)事件的關(guān)系

由于樣本空間Ω是所有基本事件構(gòu)成的集合,我們自然可以把事件A看成是Ω的一個子集合,把不可能事件看成一個空集合,把基本事件看成Ω中的一個元素。這樣,事件的關(guān)系和運(yùn)算可以歸結(jié)為集合的關(guān)系和運(yùn)算。第六十二頁,共二百九十頁,編輯于2023年,星期日1、包含關(guān)系,若A發(fā)生必定導(dǎo)致事件B發(fā)生,稱B包含A,或A被B包含,記為AB。例如,擲一顆骰子,A為出現(xiàn)2點(diǎn),B為出現(xiàn)偶數(shù)點(diǎn),則A發(fā)生必定導(dǎo)致B發(fā)生,則AB。如果AB,BA,則稱A與B相等,記為A=B。2、事件的并(和),若事件由A與B至少發(fā)生一個的事件所組成,稱為A與B的并,記為A∪B或(A+B)。事件A與B的并也可說成是:或者A發(fā)生,或者B發(fā)生。例如,擲一顆骰子,A為出現(xiàn)3點(diǎn),B為出現(xiàn)偶數(shù)點(diǎn),則A∪B={2,3,4,6}。第六十三頁,共二百九十頁,編輯于2023年,星期日3、事件的交(積),若事件由A、B同時發(fā)生的事件組成,稱為A與B的交,記為A∩B或(A·B),即集A與集B的公共部分,顯然,A∩Ω=A,A∩=。例如,擲一顆骰子,A為出現(xiàn)奇數(shù)點(diǎn),B為出現(xiàn)1點(diǎn),則A∩B={1}。4、事件的差,使事件A發(fā)生而事件B不發(fā)生的事件稱為A與B的差,記為A-B。例如,擲一顆骰子,A為出現(xiàn)偶數(shù)點(diǎn),B為出現(xiàn)4及4以上點(diǎn),則A-B={2}。5、事件的互斥(互不相容),若事件A與事件B不能同時發(fā)生,即集A與集B的交為一空集,稱A與B互斥,記為A∩B=。例如,擲一顆骰子,A為出現(xiàn)2點(diǎn),B為出現(xiàn)奇數(shù)點(diǎn),則A∩B=,即A,B互斥。

第六十四頁,共二百九十頁,編輯于2023年,星期日如果有n個事件,它們中的任意兩個事件互斥,即,,稱這n個事件兩兩互斥。同樣,兩個事件并與交的概念也可推廣到任意多個事件上去。6、事件的逆,使事件不發(fā)生的事件,稱為的逆事件或?qū)α⑹录?,記?如果,,稱與互逆。顯然,=Ω-A,兩個互逆事件A,B滿足關(guān)系式:A∪B=Ω,A∩B=。由此,我們立刻可以得出結(jié)論,兩個互逆事件一定互斥,反之未必。例如,擲一顆骰子,A為出現(xiàn)奇數(shù)點(diǎn),B為出現(xiàn)偶數(shù)點(diǎn),則=B,=A即A,B互逆。第六十五頁,共二百九十頁,編輯于2023年,星期日二、概率

概率就是某事件出現(xiàn)可能性大小的一個數(shù),記為P(A)。(一)概率的統(tǒng)計定義設(shè)A為某測驗(yàn)下的一個事件,若將此試驗(yàn)重復(fù)n次,事件A出現(xiàn)了m次,稱比值m/n為n次試驗(yàn)中A出現(xiàn)的頻率記為Q(A)=(2.1.1)頻率Q從某種意義上也反映了某事件出現(xiàn)可能性的大小,但頻率Q隨試驗(yàn)次數(shù)n在變化,因此,用頻率來描述事件出現(xiàn)可能性的大小是不能令人滿意的。第六十六頁,共二百九十頁,編輯于2023年,星期日當(dāng)多次重復(fù)這種試驗(yàn)時,就會呈現(xiàn)出某種規(guī)律性。例如,歷史上有人多次拋擲一枚硬幣,其正面出現(xiàn)的頻率穩(wěn)定在0.5左右,我們把頻率的這種特性稱為穩(wěn)定性,把數(shù)值0.5稱為穩(wěn)定值,記為p。某事件A的概率P(A)與Q(A)有著密切聯(lián)系,當(dāng)試驗(yàn)次數(shù)相當(dāng)多時,接近于,而頻率的穩(wěn)定性從客觀上表明這個數(shù)是存在的。因此,我們稱頻率的穩(wěn)定值為事件的統(tǒng)計概率,記為(2.1.2)實(shí)際應(yīng)用中,統(tǒng)計概率的精確值是不易求得的,一般,當(dāng)試驗(yàn)次數(shù)n適當(dāng)大時,我們?nèi)☆l率Q為概率P的近似值。第六十七頁,共二百九十頁,編輯于2023年,星期日(二)概率的古典定義

“從編上號的30名學(xué)生中隨機(jī)抽一人,有30個可能的基本結(jié)果,而且抽到每一名學(xué)生的機(jī)會均等,即抽到每一名學(xué)生的可能性都是1/30”。所進(jìn)行的試驗(yàn)有以下兩個特征:1)隨機(jī)試驗(yàn)有有限多個基本結(jié)果,即2)每個基本結(jié)果出現(xiàn)是等可能的,即我們稱具有上述特征的試驗(yàn)為古典型試驗(yàn),有關(guān)古典型試驗(yàn)中的概率模型稱為古典概型。例如,從裝有4份考題的袋中任抽一份進(jìn)行測驗(yàn),有4個基本結(jié)果,由于抽取是隨機(jī)的,各份考題外觀一樣,誰也不比誰特殊,那么抽到任意一份考題當(dāng)然是等可能的,即抽到任意一份考題的概率為1/4。第六十八頁,共二百九十頁,編輯于2023年,星期日對于古典概型,若事件A由m個基本事件復(fù)合而成,即,那么(2.1.3)其中為基本事件總數(shù),為A所包含基本事件數(shù)。我們稱(2.1.3)式為概率的古典定義。例1書架上有5本中文書,3本外文書,某人從書架上任取3本,求其中恰有2本中文書的概率。解:設(shè)從書架上任取3本書恰有2本中文書為A,則由公式(2.1.3),顯然有第六十九頁,共二百九十頁,編輯于2023年,星期日例2某班52名學(xué)生分為4個組,每組13人.如果來訪記者找該班任意4名學(xué)生談話,求(1)這4名學(xué)生都是第一組學(xué)生的概率;(2)每組各有1名學(xué)生的概率。解:從52名學(xué)生中任抽4人的組合數(shù)為設(shè)4名學(xué)生都是第一組學(xué)生為A,而有利于A的組合數(shù)為,由公式(2.1.3)(2)設(shè)每組各有1名學(xué)生為B,而有利于B的組合數(shù)為由公式(2.1.3)第七十頁,共二百九十頁,編輯于2023年,星期日(三)概率的數(shù)學(xué)定義

從統(tǒng)計概型、古典概型的實(shí)際意義出發(fā),事件的概率滿足以下三條基本公理:

1、非負(fù)性P(A)≥0(2.1.4)2、規(guī)范性P(Ω)=1(2.1.5)3、可加性兩兩互斥(2.1.6)我們稱滿足以上三條公理的集合的函數(shù)為概率,這種定義事件概率的方法稱為概率的數(shù)學(xué)定義或公理化定義.第七十一頁,共二百九十頁,編輯于2023年,星期日概率具有以下性質(zhì):性質(zhì)1減法公式(2.1.7)證:從而有性質(zhì)2一般加法公式(2.1.8)證:

第七十二頁,共二百九十頁,編輯于2023年,星期日例3某學(xué)生從10道試題中任抽一題口試,如果抽到每一道題是等可能的,求抽到第一題或第二題的概率。解:設(shè)抽到第一題為事件A,抽到第二題為事件B,則抽到第一題或第二題為A+B。因?yàn)锳,B互斥,由可加性第七十三頁,共二百九十頁,編輯于2023年,星期日性質(zhì)3逆事件概率公式(2.1.9)證:從而有。性質(zhì)4(2.1.10)證:從而有性質(zhì)5P(AB)=P(A)P(B),A與B獨(dú)立(即A的概率與B發(fā)生與否無關(guān))(2.1.11)第七十四頁,共二百九十頁,編輯于2023年,星期日例4某學(xué)生從5個試題中任抽一題口試,抽取采用有放回方式,求該學(xué)生兩次都抽到試題1的概率。解:設(shè)該學(xué)生第一次抽到試題1為A,第二次抽到試題1為B,由于A,B獨(dú)立,則有第七十五頁,共二百九十頁,編輯于2023年,星期日§2.2隨機(jī)變量及常見分布一、隨機(jī)變量二、二項(xiàng)分布三、正態(tài)分布

第七十六頁,共二百九十頁,編輯于2023年,星期日一、隨機(jī)變量用“X=0”,“X=1”分別表示擲一枚硬幣出現(xiàn)正面,擲一枚硬幣出現(xiàn)反面。這樣,樣本空間中的每一結(jié)果都唯一對應(yīng)X的一個實(shí)數(shù)值,由此我們給出隨機(jī)變量的定義如下:定義2.2.1對于隨機(jī)試驗(yàn)E的每一可能結(jié)果,唯一對應(yīng)于一個實(shí)數(shù)值,稱為隨機(jī)變量,簡記為X。由于數(shù)據(jù)有離散和連續(xù)之分,隨機(jī)變量也分為離散型和連續(xù)型兩種。(一)離散型隨機(jī)變量及概率分布列如果隨機(jī)變量X取有限或可數(shù)多個值,我們稱X為離散型隨機(jī)變量,所謂可數(shù)即X的取值個數(shù)和自然數(shù)的個數(shù)是對等的。第七十七頁,共二百九十頁,編輯于2023年,星期日定義2.2.2散型隨機(jī)變量X取值為;相應(yīng)取這些值的概率為,稱為的概率分布列,分布列也可用下表來表示:表2.1離散型變量的概率分布…………其中滿足①(2.2.1)②(2.2.2)第七十八頁,共二百九十頁,編輯于2023年,星期日

例1某學(xué)生憑機(jī)遇做一道正誤選擇題,則做對題數(shù)X為一隨機(jī)變量,其概率分布列為01其中X=0表示做錯,X=1表示做對。一般,稱具有分布列(2.2.3)的隨機(jī)變量X為服從0—1分布的隨機(jī)變量,顯然,(2.2.3)式滿足分布列性質(zhì)①,②。第七十九頁,共二百九十頁,編輯于2023年,星期日例2某學(xué)生參加一項(xiàng)智力競賽,共回答3個問題,求該生答對題數(shù)的概率分布列。解:設(shè)答對題數(shù)為k,k=0,1,2,3由于P(X=k)=,故分布列為X01231/83/83/81/8第八十頁,共二百九十頁,編輯于2023年,星期日(二)連續(xù)型隨機(jī)變量及概率密度函數(shù)如果隨機(jī)變量X取值充滿數(shù)軸的某個區(qū)間,也就是說,X的取值是連續(xù)變化的,我們稱這樣的隨機(jī)變量X為連續(xù)型隨機(jī)變量。由于連續(xù)型隨機(jī)變量取值充滿某個區(qū)間,我們往往關(guān)心的是X取值于某個區(qū)間的概率。連續(xù)型隨機(jī)變量X取值于一個區(qū)間的概率分布情況是用概率密度函數(shù)來描述的。第八十一頁,共二百九十頁,編輯于2023年,星期日定義2.2.3設(shè)連續(xù)型隨機(jī)變量X取值于區(qū)間為任意實(shí)數(shù),如果存在非負(fù)可積函數(shù),則(2.2.4)成立。我們稱p(x)為X的概率密度函數(shù),簡稱為概率密度,且p(x)滿足①(2.2.5)②(2.2.6)由(2.2.4)式,顯然有,這表明連續(xù)型隨機(jī)變量取單點(diǎn)值的概率為零.由此,我們得到

P(a≤X<b)=P(a<X<b)=P(a<X≤b)=P(a≤X≤b)。第八十二頁,共二百九十頁,編輯于2023年,星期日例33路公共汽車每5分鐘來一趟,其乘客候車時間X為一隨機(jī)變量,求:①概率密度p(x);②候車時間不超過3分鐘的概率。解:①由于候車時間X在5分鐘內(nèi)是等可能出現(xiàn)的,故其概率密度為一常值C,由概率密度性質(zhì)(2.2.6)有,從而C=②由(2.2.4)式得我們稱例3中的隨機(jī)變量X在區(qū)間(0,5)內(nèi)服從均勻分布,或等概分布。一般,若隨機(jī)變量X在區(qū)間(a,b)內(nèi)服從均勻分布,則概率密度為(2.2.7)第八十三頁,共二百九十頁,編輯于2023年,星期日(三)隨機(jī)變量的分布函數(shù)定義2.2.4設(shè)X為一隨機(jī)變量,稱(2.2.8)為X的分布函數(shù)。

分布函數(shù)F(x)具有以下性質(zhì):①對任意實(shí)數(shù)x有(2.2.9)②F(x)是非降函數(shù),當(dāng)x1<x2時有(2.2.10)

③F(x)在數(shù)軸的每一個點(diǎn)處是左連續(xù)的,即當(dāng)時有(2.2.11)第八十四頁,共二百九十頁,編輯于2023年,星期日若X為離散型隨機(jī)變量,則X的分布函數(shù)為(2.2.12)若X為連續(xù)型隨機(jī)變量,p(x)為概率密度,則X的分布函數(shù)為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論