概率與抽樣分布_第1頁
概率與抽樣分布_第2頁
概率與抽樣分布_第3頁
概率與抽樣分布_第4頁
概率與抽樣分布_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

關(guān)于概率與抽樣分布第一頁,共五十八頁,編輯于2023年,星期二Section3.1

RandomVariables

隨機變量第二頁,共五十八頁,編輯于2023年,星期二

事件的實際發(fā)生率稱為頻率。設(shè)在相同條件下,獨立重復(fù)進(jìn)行n次試驗,事件A出現(xiàn)f次,則事件A出現(xiàn)的頻率為f/n。

概率:隨機事件發(fā)生的可能性大小,用大寫的P表示;取值[0,1]。一、頻率與概率frequencyandprobability第三頁,共五十八頁,編輯于2023年,星期二

1.樣本頻率總是圍繞概率上下波動

2.樣本含量n越大,波動幅度越小,頻率越接近概率。頻率與概率的關(guān)系:調(diào)查株數(shù)(n)52550100200500100015002000受害株數(shù)(a)212153372177351525704棉株受害頻率(a/n)0.400.480.300.330.360.3540.3510.3500.352表在相同條件下盲蝽象在某棉田危害程度的調(diào)查結(jié)果一、頻率與概率frequencyandprobability第四頁,共五十八頁,編輯于2023年,星期二一、頻率與概率frequencyandprobability

小概率原理若事件A發(fā)生的概率較小,如小于0.05或0.01,則認(rèn)為事件A在一次試驗中不太可能發(fā)生,這稱為小概率事件實際不可能性原理,簡稱小概率原理。這里的0.05或0.01稱為小概率標(biāo)準(zhǔn),農(nóng)業(yè)試驗研究中通常使用這兩個小概率標(biāo)準(zhǔn)。第五頁,共五十八頁,編輯于2023年,星期二二、隨機變量用以記錄隨機試驗結(jié)果(outcome)的變量,稱為隨機變量(randomvariable),用大寫英文字母X,Y等代表。隨機變量X的概率分布,表達(dá)X的可能取值和取這些值的概率規(guī)則。第六頁,共五十八頁,編輯于2023年,星期二離散型和連續(xù)型隨機變量隨機變量的可能取值是離散的數(shù)字,如計數(shù)型或分類型等,稱為離散型隨機變量(discreterandomvariable)。{0,1,…,9}。20次實驗中成功的次數(shù),二項式分布。隨機變量的可能取值是某一實數(shù)的區(qū)間,如“大于0”或“-2~2之間”等,稱為連續(xù)型隨機變量(continuousrandomvariable)。正態(tài)隨機變量二、隨機變量第七頁,共五十八頁,編輯于2023年,星期二三、離散型隨機變量的概率分布X=xix1,x2

,…

,xnP(X=xi)=pip1,p2

,…

,pn列出離散型隨機變量X的所有可能取值列出隨機變量取這些值的概率通常用下面的表格來表示P(X=xi)=pi稱為離散型隨機變量的概率函數(shù)第八頁,共五十八頁,編輯于2023年,星期二四、連續(xù)型隨機變量的概率密度若觀察資料數(shù)量夠大,則直方圖(組數(shù)適當(dāng)增加)的整體形態(tài)可用一近似的平滑曲線顯示。直方圖中縱軸改為次數(shù)比例,則該平滑曲線稱為密度曲線(densitycurve)。第九頁,共五十八頁,編輯于2023年,星期二概率密度曲線第十頁,共五十八頁,編輯于2023年,星期二密度曲線的性質(zhì)曲線都在水平線上(密度函數(shù)>=0)。曲線下所涵蓋的全部面積正好為1(所有可能性為1)。曲線下任何范圍所涵蓋的面積,為觀察值落在該范圍的比例(概率)。密度曲線可視為是觀察變量的理論分布圖形。

四、連續(xù)型隨機變量的概率密度第十一頁,共五十八頁,編輯于2023年,星期二隨機變量X的一切可能取值的完備組中,各可能取值xi與其相對應(yīng)的概率pi乘積之和描述隨機變量取值的集中程度計算公式為五、隨機變量的數(shù)學(xué)期望第十二頁,共五十八頁,編輯于2023年,星期二隨機變量X的每一個取值與期望值的離差平方和的數(shù)學(xué)期望,記為D(X)描述離散型隨機變量取值的分散程度計算公式為六、隨機變量的方差第十三頁,共五十八頁,編輯于2023年,星期二Section3.2

TheBinomialDistributions

二項分布第十四頁,共五十八頁,編輯于2023年,星期二一、二項分布設(shè)定

TheBinomialSetting固定的觀察次數(shù)n。n次的觀察都獨立,每次的觀察都不會對其他觀察提供任何信息。每次的觀察都只有兩種可能的結(jié)果,多假設(shè)為“成功”或“失敗”兩種。每次的觀察“成功”的概率都一樣,設(shè)定為p。第十五頁,共五十八頁,編輯于2023年,星期二二、二項分布

BinomialDistribution滿足二項分布設(shè)定的試驗,以X記錄n次觀察中“成功”的次數(shù),則稱X的分布為參數(shù)為n與p的二項分布(binomial),記為B(n,p)。X的所有可能取值為{0,1,…,n}。對應(yīng)的概率函數(shù)為P(X=x)=P(x)。第十六頁,共五十八頁,編輯于2023年,星期二[例1]某種昆蟲在某地區(qū)的死亡率為40%,即p=0.4,現(xiàn)對這種害蟲用一種新藥進(jìn)行治療試驗,每次抽樣10頭作為一組治療。試問如新藥無療效,則在10頭中死3頭、2頭、1頭,以及全部愈好的概率為多少?按上述二項分布概率函數(shù)式計算

7頭愈好,3頭死去概率:8頭愈好,2頭死去概率:9頭愈好,1頭死去概率:10頭全部愈好的概率:三、示例第十七頁,共五十八頁,編輯于2023年,星期二

若問10頭中不超過2頭死去的概率為多少?則應(yīng)該應(yīng)用累積函數(shù),即三、示例第十八頁,共五十八頁,編輯于2023年,星期二四、二項分布的期望值與標(biāo)準(zhǔn)差期望值:E(X)=np方差: Var(X)=np(1-p)標(biāo)準(zhǔn)差:第十九頁,共五十八頁,編輯于2023年,星期二Section3.3

NormalDistributions

正態(tài)分布第二十頁,共五十八頁,編輯于2023年,星期二一、特點正態(tài)曲線所有正態(tài)曲線都有相同的外型具有對稱、單峰及鐘形的特性。正態(tài)曲線所代表的分布即為正態(tài)分布(normaldistribution)每一正態(tài)分布都有其平均值μ

與標(biāo)準(zhǔn)差σ

第二十一頁,共五十八頁,編輯于2023年,星期二ms一、特點第二十二頁,共五十八頁,編輯于2023年,星期二正態(tài)曲線σ較大ms一、特點第二十三頁,共五十八頁,編輯于2023年,星期二正態(tài)曲線的拐點拐點落在一個σ處拐點落在-σ處一、特點第二十四頁,共五十八頁,編輯于2023年,星期二二、為什么這么重要Gooddescriptionsforsomedistributionsofrealdata身高,體重,考試成績GoodapproximationstotheresultsofmanykindsofchanceoutcomesTossingacoinmanytimesManystatisticalinferenceproceduresarebasedonnormaldistributions第二十五頁,共五十八頁,編輯于2023年,星期二三、68-95-99.7規(guī)則正態(tài)分布有其特定的數(shù)據(jù)分布規(guī)則:平均值為μ,標(biāo)準(zhǔn)差為σ的正態(tài)分布68%的觀察資料落在m的1σ之內(nèi)95%的觀察資料落在m的2σ之內(nèi)99.7%的觀察資料落在m的3σ之內(nèi)第二十六頁,共五十八頁,編輯于2023年,星期二0123-1-2-3mm+sm+2sm+3sm-sm-2sm-3s68%的資料95%的資料99.7%的資料三、68-95-99.7規(guī)則第二十七頁,共五十八頁,編輯于2023年,星期二四、變量標(biāo)準(zhǔn)化(Standardization)令觀察值x服從平均值為μ,標(biāo)準(zhǔn)差為σ的分布,則x的標(biāo)準(zhǔn)化值(standardizedvalue)定義為標(biāo)準(zhǔn)化值又稱為z-值(z-score)。第二十八頁,共五十八頁,編輯于2023年,星期二標(biāo)準(zhǔn)化變量可以證明z的平均值為0z的標(biāo)準(zhǔn)差為1

四、變量標(biāo)準(zhǔn)化(Standardization)第二十九頁,共五十八頁,編輯于2023年,星期二五、標(biāo)準(zhǔn)正態(tài)分布變量X服從平均值為μ,標(biāo)準(zhǔn)差為σ的正態(tài)分布,簡記為X~N(μ,σ2)。X經(jīng)過標(biāo)準(zhǔn)化后為Z(=(X-μ)/s),則Z也服從正態(tài)分布,并且平均值為0,標(biāo)準(zhǔn)差為1,即Z~N(0,1)。我們稱Z服從標(biāo)準(zhǔn)正態(tài)(standardnormal)。第三十頁,共五十八頁,編輯于2023年,星期二六、標(biāo)準(zhǔn)正態(tài)表z表列數(shù)字是z左邊的面積z=-0.44z左邊的面積為0.33-0.440.33第三十一頁,共五十八頁,編輯于2023年,星期二z表列數(shù)字是z左邊的面積z=0.44z左邊的面積為0.67六、標(biāo)準(zhǔn)正態(tài)表第三十二頁,共五十八頁,編輯于2023年,星期二七、雙側(cè)臨界值在標(biāo)準(zhǔn)正態(tài)曲線圖下,右方與左方的面積和為a,則稱為標(biāo)準(zhǔn)正態(tài)分布概率為a

的雙側(cè)臨界值??刹楸?。m=0面積為a/2面積為a/2第三十三頁,共五十八頁,編輯于2023年,星期二八、單側(cè)臨界值在標(biāo)準(zhǔn)正態(tài)曲線圖下,右方的面積為a,則稱為標(biāo)準(zhǔn)正態(tài)分布概率為a

的單側(cè)臨界值。可查表。m=0面積為a第三十四頁,共五十八頁,編輯于2023年,星期二

[例2]假定y是一隨機變數(shù)具有正態(tài)分布,平均數(shù)

=30,標(biāo)準(zhǔn)差=5,試計算小于26,小于40的概率,介乎26和40區(qū)間的概率以及大于40的概率。首先計算:先將x轉(zhuǎn)換為u值

九、計算第三十五頁,共五十八頁,編輯于2023年,星期二同理可得:

FN(40)=0.9773

所以:P(26<x≤40)=FN(40)-FN(26)=0.9773-0.2119=0.7654

P(x>40)=1-P(x≤40)=1-0.9773=0.0227

查附表,當(dāng)u=-0.8時,F(xiàn)N(26)=0.2119,說明這一分布從-∞到26范圍內(nèi)的變量數(shù)占全部變量數(shù)的21.19%,或者說,x≤26概率為0.2119.九、計算第三十六頁,共五十八頁,編輯于2023年,星期二[例3]在應(yīng)用正態(tài)分布時,經(jīng)常要討論隨機變數(shù)x離其平均數(shù)的差數(shù)大于或小于若干個值的概率。例如計算離均差絕對值等于小于和等于大于1

的概率為:也可以簡寫為

九、計算第三十七頁,共五十八頁,編輯于2023年,星期二

相應(yīng)地,離均差絕對值等于小于2

、等于大于2

、等于小于3

和等于大于3

的概率值為:九、計算第三十八頁,共五十八頁,編輯于2023年,星期二[例4]計算正態(tài)分布曲線的中間概率為0.99時,其y或u值應(yīng)等于多少?

因為正態(tài)分布是對稱的,故在曲線左邊從-∞到-

u的概率和在曲線右邊從u到∞的概率都應(yīng)等于1/2(1-0.99)=0.005。查表,u=-2.58時,fN(x)

=0.00494≈0.005。于是知,當(dāng)±2.58時,在其范圍內(nèi)包括99%的變量,僅有1%變量在此范圍之外。上述結(jié)果寫作:九、計算第三十九頁,共五十八頁,編輯于2023年,星期二同理可求得:九、計算第四十頁,共五十八頁,編輯于2023年,星期二同理,亦可寫成:

以上

乃正態(tài)曲線下左邊一尾x從-∞到

上的面積和右邊一尾y從到∞上的面積之和,亦可寫成:九、計算第四十一頁,共五十八頁,編輯于2023年,星期二Section3.4

SamplingDistributions

抽樣分布第四十二頁,共五十八頁,編輯于2023年,星期二一、總體與樣本

populationandsample總體:根據(jù)研究目的確定的同質(zhì)研究對象的全體(集合)。分有限總體與無限總體樣本:從總體中隨機抽取的部分研究對象

第四十三頁,共五十八頁,編輯于2023年,星期二二、總體容量與樣本容量populationsizeandsamplesize總體容量(N):總體中所包含的個體數(shù)目。根據(jù)N大小,總體分有限總體和無限總體樣本(n):從總體中隨機抽取的部分研究對象

第四十四頁,共五十八頁,編輯于2023年,星期二三、隨機抽樣randomsampling為了保證樣本的可靠性和代表性,需要采用隨機的方法抽取樣本(在總體中每個個體具有相同的機會被抽到)。第四十五頁,共五十八頁,編輯于2023年,星期二四、參數(shù)與統(tǒng)計量parameterandstatistic參數(shù):總體的統(tǒng)計指標(biāo),如總體均數(shù)、標(biāo)準(zhǔn)差,采用希臘字母分別記為μ、σ。固定的常數(shù)

總體樣本抽取部分觀察單位

統(tǒng)計量

參數(shù)

推斷inference統(tǒng)計量:樣本的統(tǒng)計指標(biāo),如樣本均數(shù)、標(biāo)準(zhǔn)差,采用英文字母分別記為。參數(shù)附近波動的隨機變量。第四十六頁,共五十八頁,編輯于2023年,星期二五、總體均值、方差與標(biāo)準(zhǔn)差總體均值總體方差總體標(biāo)準(zhǔn)差第四十七頁,共五十八頁,編輯于2023年,星期二六、樣本均值、方差與標(biāo)準(zhǔn)差總體均值總體方差總體標(biāo)準(zhǔn)差第四十八頁,共五十八頁,編輯于2023年,星期二七、樣本的概率分布統(tǒng)計量(為樣本的函數(shù)),亦為隨機變量,其概率分布稱為抽樣分布(samplingdistribution)。一般統(tǒng)計量的抽樣分布,則多根據(jù)重復(fù)抽樣(實驗)結(jié)果來了解其概率分布。的抽樣分布大數(shù)法則,中心極限定理第四十九頁,共五十八頁,編輯于2023年,星期二八、大數(shù)法則由具有有限(finite)平均數(shù)m

的總體隨機抽樣,隨著樣本容量的增加,樣本平均數(shù)越接近總體的均數(shù)m。樣本平均數(shù)的這種行為稱為大數(shù)法則(lawoflargenumbers)。第五十頁,共五十八頁,編輯于2023年,星期二以代表樣本容量為n的資料平均數(shù),逐漸增加樣本容量,將n及對應(yīng)的圖示如后。八、大數(shù)法則第五十一頁,共五十八頁,編輯于2023年,星期二Numberofobservations,n前n個樣本的均數(shù)2223242526272829303132331510501005001000500010000八、大數(shù)法則第五十二頁,共五十八頁,編輯于2023年,星期二九、樣本平均數(shù)的均數(shù)與標(biāo)準(zhǔn)差令為樣本容量為n的一組SRS的平均數(shù),其總體平均數(shù)為m

與標(biāo)準(zhǔn)差為s。則的分布平均數(shù)為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論