統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)_第1頁
統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)_第2頁
統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)_第3頁
統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)_第4頁
統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)_第5頁
已閱讀5頁,還剩103頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)統(tǒng)計(jì)學(xué)研究對(duì)象:收集數(shù)據(jù);分析數(shù)據(jù)

我該什么時(shí)間上網(wǎng)?收集數(shù)據(jù)時(shí)間上網(wǎng)比例時(shí)間上網(wǎng)比例時(shí)間上網(wǎng)比例0點(diǎn)14.50%8點(diǎn)11.80%16點(diǎn)31.20%1點(diǎn)5.60%9點(diǎn)22.50%17點(diǎn)27.70%2點(diǎn)4.20%10點(diǎn)24.60%18點(diǎn)22.10%3點(diǎn)2.60%11點(diǎn)22.60%19點(diǎn)31.30%4點(diǎn)2.50%12點(diǎn)22.60%20點(diǎn)44.00%5點(diǎn)1.60%13點(diǎn)24.30%21點(diǎn)43.90%6點(diǎn)1.70%14點(diǎn)28.60%22點(diǎn)35.00%7點(diǎn)2.70%15點(diǎn)31.40%23點(diǎn)22.20%互聯(lián)網(wǎng)的用戶人數(shù)及分布、信息流量分布、域名注冊(cè)等信息以及用戶每月實(shí)際花費(fèi)的上網(wǎng)費(fèi)用、用戶平均每周上網(wǎng)時(shí)間、用戶通常在什么時(shí)間上網(wǎng)等資料都可以從電訊局或網(wǎng)絡(luò)公司的業(yè)務(wù)記錄中獲得。整理數(shù)據(jù)用戶通常上網(wǎng)時(shí)間

展示數(shù)據(jù)?;ヂ?lián)網(wǎng)上各時(shí)間段的使用比例

分析數(shù)據(jù):晚上的八九點(diǎn)鐘是上網(wǎng)的高潮,而清晨五六點(diǎn)鐘則上網(wǎng)的人最少。

作出決策:為高效率改變一下習(xí)慣,早點(diǎn)起就可享受到在網(wǎng)上飛馳的感覺

統(tǒng)計(jì)學(xué)應(yīng)用領(lǐng)域:

統(tǒng)計(jì)學(xué)為有史以來最大的公共健康試驗(yàn)——1954年脊髓灰質(zhì)炎疫苗試驗(yàn)提供了有效的試驗(yàn)設(shè)計(jì),為人類首次攻克脊髓灰質(zhì)炎作出貢獻(xiàn)。

天氣預(yù)報(bào)就是應(yīng)用大氣變化的規(guī)律,根據(jù)當(dāng)前及近期的天氣形勢(shì),對(duì)未來一定時(shí)期內(nèi)的天氣狀況進(jìn)行預(yù)測(cè),這種預(yù)測(cè)不過是未來天氣狀況的概率分布。1981年,首屆國際《紅樓夢(mèng)》研討會(huì)在美國召開,威斯康星大學(xué)講師陳炳藻獨(dú)樹一幟,宣讀了題為《從詞匯上的統(tǒng)計(jì)論〈紅樓夢(mèng)〉作者的問題》的論文。他從字、詞出現(xiàn)頻率入手,通過計(jì)算機(jī)進(jìn)行統(tǒng)計(jì)、處理、分析,對(duì)《紅樓夢(mèng)》后40回系高鶚?biāo)鬟@一流行看法提出異議,認(rèn)為120回均系曹雪芹所作。(語言統(tǒng)計(jì)學(xué))

大仲馬有很多私生子,往往成為別人取笑譏諷的對(duì)象,最使他頭痛的是巴黎統(tǒng)計(jì)學(xué)會(huì)的秘書長(zhǎng)李昂納,每次舉統(tǒng)計(jì)數(shù)字的例子,總是說大仲馬的情婦和私生子有多少。有一年該統(tǒng)計(jì)學(xué)會(huì)開年會(huì),大仲馬估計(jì),李昂納又要大放厥詞,說他的壞話了。于是他請(qǐng)求參加年會(huì),獲得了批準(zhǔn),果然不出大仲馬所料,李昂納又舉他的情婦和私生子的例子。李昂納報(bào)告完畢,請(qǐng)大仲馬致詞。一向不愿在大庭廣眾之下發(fā)表演講的大仲馬,這次卻破例登臺(tái)說:“所有統(tǒng)計(jì)數(shù)字都是撒謊的,包括有關(guān)本人的數(shù)字在內(nèi)?!甭牨姾逄么笮?。

統(tǒng)計(jì)學(xué)家調(diào)侃數(shù)學(xué)家:你們不是說若X=Y且Y=Z,則X=Z嗎!那么想必你若喜歡一個(gè)女孩,那么這個(gè)女孩喜歡的男生你也喜歡吧?數(shù)學(xué)家的幽默

數(shù)學(xué)家反問道:那么你把左手放到一鍋100℃的開水中,右手放到一鍋0℃的冰水里想來也沒事吧!因?yàn)樗鼈兤骄贿^是50℃而已!”

統(tǒng)計(jì)學(xué)的內(nèi)容

從統(tǒng)計(jì)方法的構(gòu)成來分,統(tǒng)計(jì)學(xué)可以分為描述統(tǒng)計(jì)學(xué)和推斷統(tǒng)計(jì)學(xué)

1.描述統(tǒng)計(jì)學(xué)(DescriptiveStatistics)

描述統(tǒng)計(jì)學(xué)研究如何取得反映客觀現(xiàn)象的數(shù)據(jù),并通過圖表形式對(duì)所收集的數(shù)據(jù)進(jìn)行加工處理和顯示,進(jìn)而通過綜合、概括與分析得出反映客觀現(xiàn)象的規(guī)律性數(shù)量特征。內(nèi)容包括統(tǒng)計(jì)數(shù)據(jù)的收集方法、數(shù)據(jù)的加工處理方法、數(shù)據(jù)的顯示方法、數(shù)據(jù)分布特征的概括與分析方法等。2.推斷統(tǒng)計(jì)學(xué)(InferentialStatistics)

推斷統(tǒng)計(jì)學(xué)是研究如何根據(jù)樣本數(shù)據(jù)去推斷總體數(shù)量特征的方法,它是在對(duì)樣本數(shù)據(jù)進(jìn)行描述的基礎(chǔ)上,對(duì)統(tǒng)計(jì)總體的未知數(shù)量特征作出以概率形式表述的推斷。第一節(jié):統(tǒng)計(jì)學(xué)基本概念一、總體和樣本總體:同質(zhì)事物的全體,通計(jì)學(xué)上的總體指的是包含所有個(gè)體某種性狀觀測(cè)值的集合??傮w容量(N):總體所包含個(gè)體數(shù)目的多少。無限總體:總體所包含的個(gè)體數(shù)目有無窮多個(gè)有限總體:由有限個(gè)個(gè)體構(gòu)成的總體樣本總體中抽取的若干個(gè)個(gè)體組成的集合。樣本容量(n):樣本所包含個(gè)體數(shù)目的多少大樣本:n>30小樣本:n<30二、參數(shù)和統(tǒng)計(jì)數(shù)參數(shù):有總體中的觀測(cè)值計(jì)算得到的特征數(shù),它反映的是總體的特征和規(guī)律。比如總體平均數(shù)、總體方差、總體標(biāo)準(zhǔn)差等統(tǒng)計(jì)數(shù):有樣本中的觀測(cè)值計(jì)算得到的特征數(shù),它反映的是樣本的特征和規(guī)律。比如;樣本平均數(shù)、樣本方差、樣本標(biāo)準(zhǔn)差等三、數(shù)據(jù)和變量數(shù)據(jù):組成總體或樣本的觀測(cè)值變量:相同性質(zhì)的事物間表現(xiàn)出差異性和差異特征的數(shù)據(jù),它們?cè)谝欢ǚ秶鷥?nèi)波動(dòng)。變量:隨機(jī)性變量:由于偶然因素引起數(shù)據(jù)產(chǎn)生波動(dòng)性。非隨機(jī)性變量:由于非偶然因素引起數(shù)據(jù)產(chǎn)生變化。變量:連續(xù)性變量:在一定范圍內(nèi)可以抽取所有可能取值的變量離散性變量:只能取固定數(shù)值的變量。四、誤差和錯(cuò)誤誤差:觀測(cè)值與真實(shí)值之間的差。誤差偶然誤差:無法控制的偶然因素所引起的誤差。無法預(yù)知,不可避免,只能減小,不能完全消除。系統(tǒng)誤差:有某些固定因素引起的誤差,大小、符號(hào)、方向基本相同。校正后可以完全消除。錯(cuò)誤:人為因素所引起的差錯(cuò)。四、準(zhǔn)確性和精確性準(zhǔn)確性:統(tǒng)計(jì)數(shù)與參數(shù)之間的相符性。精確性:樣本內(nèi)各觀測(cè)值之間的接近程度。準(zhǔn)確性與精確性之間有何關(guān)系?第二節(jié)統(tǒng)計(jì)特征數(shù)的計(jì)算一、集中性的度量(一)算術(shù)平均數(shù):總體或樣本中各個(gè)觀察值的總和除以觀察值個(gè)數(shù)所得的商數(shù)。加權(quán)平均數(shù)

某農(nóng)場(chǎng)有5塊小麥地,其面積分別是10、20、40、15、15畝,其產(chǎn)量分別是300、250、200、150、300公斤/畝,整個(gè)農(nóng)場(chǎng)的平均產(chǎn)量是多少公斤/畝算術(shù)平均數(shù)的性質(zhì):算術(shù)平均數(shù)的作用:1、指出了總體或樣本中觀測(cè)值的中心位置。2、可以作為總體或樣本的代表與其它的總體或樣本作比較。(二)中數(shù):將資料內(nèi)所有觀察值從大到小排序,居中間位置的觀察值稱為中數(shù)(median),計(jì)作Md。如觀察值個(gè)數(shù)為偶數(shù),則以中間二個(gè)觀察值的算術(shù)平均數(shù)為中數(shù)。(三)眾數(shù)資料中最常見的一數(shù),或次數(shù)最多一組的中點(diǎn)值,稱為眾數(shù)(mode),計(jì)作MO。如棉花纖維檢驗(yàn)時(shí)所用的主體長(zhǎng)度即為眾數(shù)。(四)幾何平均數(shù)如有n個(gè)觀察值,其相乘積開n次方,即為幾何平均數(shù)(geometricmean),用G代表。(五)調(diào)和平均數(shù)如有n個(gè)觀察值,觀測(cè)值倒數(shù)平均數(shù)的倒數(shù)。例:土壤水分在毛細(xì)管中的上升速率,從土壤表面下30cm量起,第一個(gè)10cm、第二個(gè)10cm、第三個(gè)10cm土壤毛管水的上升速率分別為:8cm/min、6cm/min、4cm/min,求毛管水的平均上升速率。驗(yàn)證:二、變異性的度量X18.99.49.69.79.910.410.911.011.2X22.93.13.85.19.910.017.018.021.2這兩個(gè)樣本具有相同的算術(shù)平均數(shù):10.11;相同的中數(shù):9.9,都沒有眾數(shù)。(一)極差(range):又稱全距,記作R,是資料中最大觀察值與最小觀察值的差數(shù)。

極差在一定程度上反映了數(shù)據(jù)的變異程度,但它只受兩個(gè)極端值的影響,并不能反映其它觀測(cè)值的變異程度,所以用極差來反映數(shù)據(jù)的變異程度是粗糙的,有缺陷的。(二)方差:平均離均差平方和。某一個(gè)觀測(cè)值的變異程度所有觀測(cè)值總的變異程度平均下來每一個(gè)觀測(cè)值變異程度。自由度(df):是指樣本內(nèi)獨(dú)立而能自由變動(dòng)的觀測(cè)值個(gè)數(shù)。

例如一個(gè)有5個(gè)觀察值的樣本,因?yàn)槭芙y(tǒng)計(jì)數(shù)的約束,在5個(gè)離均差中,只有4個(gè)數(shù)值可以在一定范圍之內(nèi)自由變動(dòng)取值,而第五個(gè)離均差必須滿足。如一樣本為(3,4,5,6,7),平均數(shù)為5,前4個(gè)離差為-2,-1,0和1,則第5個(gè)離均差為前4個(gè)離均差之和的變號(hào)數(shù),即-(-2)=2。一般地,樣本自由度等于觀察值的個(gè)數(shù)(n)減去約束條件的個(gè)數(shù)(k)。。sample1X18.99.49.69.79.910.410.911.011.2sample2X22.93.13.85.19.910.017.018.021.2(三)標(biāo)準(zhǔn)差(四)變異系數(shù)例:比較甲乙兩個(gè)生產(chǎn)單位的小麥產(chǎn)量的均衡性。甲:400430370kg/畝乙:175200225kg/畝MicrosoftExcel

對(duì)統(tǒng)計(jì)特征數(shù)的計(jì)算集中性度量的計(jì)算算術(shù)平均數(shù):AVERAGE中數(shù):MEDIAN眾數(shù):MODE幾何平均數(shù):GEOMEAN調(diào)和平均數(shù):HARMAN變異性度量的計(jì)算極差:MAX(最大值)-MIN(最小值)方差(樣本):VAR方差(總體):VARP標(biāo)準(zhǔn)差(樣本):STDEV標(biāo)準(zhǔn)差(總體):STDEVP和:SUM離均差平方和:DEVSQ第三節(jié)次數(shù)分布

觀測(cè)值如果不加整理,很難看出其中的規(guī)律,如果吧觀測(cè)值按大小或數(shù)據(jù)類別進(jìn)行分組,制成觀測(cè)值的次數(shù)分布表或次數(shù)分布圖,能初步明確觀測(cè)值所蘊(yùn)含的內(nèi)部規(guī)律。一、離散型變量的次數(shù)分布例.現(xiàn)以某小麥品種的每穗小穗數(shù)為例,隨機(jī)采取100個(gè)麥穗,計(jì)數(shù)每穗小穗數(shù),未加整理的資料列成表。18151719161520181917171817161820191716181716171918181717171818151618181817201918171915171717161718181719191719171816181717191616171717151716181918181919201716191817182019161819171615161817181717161917100個(gè)麥穗的每穗小穗數(shù)

每穗小穗數(shù)在15—20的范圍內(nèi)變動(dòng),把所有觀察值按每穗小穗數(shù)多少加以歸類,共分為6組,組與組間相差為1小穗,稱為組距。

每穗小穗數(shù)(

y

)次數(shù)(f)1561615173218251917205總次數(shù)(

n

)100100個(gè)麥穗每穗小穗數(shù)的次數(shù)分布表

如每穗小穗數(shù)主要分布在17~18個(gè),以17個(gè)為最多200個(gè)稻穗每穗粒數(shù)的次數(shù)分布表每穗粒數(shù)(

y

)次數(shù)(即穗數(shù)f)26—30131—35336—401041—452146—503251—554156—603861—652566—701671—75876—80381—852合計(jì)200每穗粒數(shù)的變異幅度為27—83粒。這樣的資料如以每一觀察值為一組,則組數(shù)太多,資料的規(guī)律性就顯示不出來。如每組包含若干粒數(shù)的幅度,例如以5粒為一組,則可使組數(shù)適當(dāng)減少。經(jīng)初步整理后分為12組(這里要求組距相等),資料的規(guī)律性就較明顯,

二、連續(xù)性變量的次數(shù)分布100行水稻試驗(yàn)的產(chǎn)量為例,說明整理方法。17721519797123159245119119131149152167104161214125175219118192176175951361991161652149515883137801381511871261961342061379897129143179174159165136108101141148168163176102194145173751301491501611551111581311899114214015415216312320514915513120918397119181149187131215111186118150155197116254239160172179151198124179135184168169173181188211197175122151171166175143190213192231163159158159177147194227141169124159140行水稻產(chǎn)量(單位:克)

1.數(shù)據(jù)排序(sort)首先對(duì)數(shù)據(jù)按從小到大排列(升序)或從大到小排列(降序)

2.求極差(range)所有數(shù)據(jù)中的最大觀察值和最小觀察值的差數(shù),稱為極差,亦即整個(gè)樣本的變異幅度。從表查到最大觀察值為254g,最小觀察值為75g,極差為254-75=179g。3.確定組數(shù)和組距(classinterval)

根據(jù)極差分將資料為若干組,每組的距離相等,稱為組距。組數(shù)和組距是相互決定的,組距小則組數(shù)多;組距大,則組數(shù)少。

(1)觀察值個(gè)數(shù)的多少;(2)極差的大??;(3)便于計(jì)算;(4)能反映出資料的真實(shí)面貌等方面。觀察值數(shù)目分組時(shí)的組數(shù) 50 5—10 100 8—16 200 10—20 300 12—24 500 15—30 1000 20—40 樣本容量與組數(shù)多少的關(guān)系在確定組數(shù)和組距時(shí)應(yīng)考慮:140行水稻產(chǎn)量為例,樣本內(nèi)觀察值的個(gè)數(shù)為140,查表可分為8—16組,假定分為12組,則組距為179/12=14.9g,為分組方便起見,可以15g作為組距。4.確定組限和組中值

組限的精度應(yīng)該比觀測(cè)值高一位:避免觀測(cè)值正好落在組限上而無法歸組。

第一組的下限應(yīng)該比最小的觀測(cè)值要小,最好是最小觀測(cè)值接近或等于第一組的組中值:避免第一組中觀測(cè)值較多。

每一組都有上限和下限,前一組的上限是后一組的下限,每一組的上限=下限+組距,每一組的組中值=(下限+上限)/2。確定組限組限的小數(shù)點(diǎn)最后一位最好是5分位或10分位數(shù)值:便于計(jì)算第一組:最小觀測(cè)值是75,可以把它當(dāng)做第一組的組中值。第一組的組限:67.5~82.5第二組的組限:82.5~97.5第三組的組限:97.5~112.5組別組限第1組67.5—82.5第2組82.5—97.5第3組97.5—112.5第4組112.5—127.5第5組127.5—142.5第6組142.5—157.5第7組157.5—172.5第8組172.5—187.5第9組187.5—202.5第10組202.5—217.5第11組217.5—232.5第12組232.5—247.5第13組247.5—262.5確定組中值組別組限組中值第1組67.5—82.575第2組82.5—97.590第3組97.5—112.5105第4組112.5—127.5120第5組127.5—142.5135第6組142.5—157.5150第7組157.5—172.5165第8組172.5—187.5180第9組187.5—202.5195第10組202.5—217.5210第11組217.5—232.5225第12組232.5—247.5240第13組247.5—262.52555、統(tǒng)計(jì)觀測(cè)值落入每個(gè)區(qū)間的次數(shù),制作次數(shù)分布表組別組限組中值次數(shù)(f)第1組67.5—82.5752第2組82.5—97.5907第3組97.5—112.51057第4組112.5—127.512013第5組127.5—142.513517第6組142.5—157.515020第7組157.5—172.516525第8組172.5—187.518021第9組187.5—202.519513第10組202.5—217.52109第11組217.5—232.52253第12組232.5—247.52402第13組247.5—262.52551n140140行水稻產(chǎn)量的次數(shù)分布表6、制作次數(shù)分布圖第四節(jié)無偏估計(jì)

從容量N=3的總體,P={3,4,5},進(jìn)行獨(dú)立有放回的隨機(jī)抽樣,抽取所有容量n=2的樣本。抽樣結(jié)果樣本平均數(shù)的平均數(shù)樣本方差S2的平均數(shù)樣本方差S2的平均數(shù)

從總體中隨機(jī)抽取一定容量的所有可能樣本,如果所有可能樣本的某一樣本統(tǒng)計(jì)數(shù)的平均值就(數(shù)學(xué)期望)等于總體的相應(yīng)參數(shù),稱該統(tǒng)計(jì)數(shù)為相應(yīng)參數(shù)的無偏估計(jì)值。無偏估計(jì)第五節(jié)概率和概率分布一、概率(一)事件必然事件:U不可能事件:V隨機(jī)事件:A,B,C…簡(jiǎn)單事件復(fù)合事件事件的運(yùn)算

事件的包含:事件A的發(fā)生必然導(dǎo)致事件B的發(fā)生,稱事件A包含于B,計(jì)作AB

事件的和:事件A和事件B至少有一個(gè)發(fā)生而構(gòu)成的新事件稱為A和B得和計(jì)作

事件的積:事件A和事件B同時(shí)發(fā)生而構(gòu)成的新事件稱為A和B得積計(jì)作互斥事件:對(duì)立事件:獨(dú)立事件:事件A的發(fā)生不受事件B的影響,反之亦然,稱事件A和事件B是獨(dú)立的。(二)頻率

事件A在n次試驗(yàn)中出現(xiàn)了m次,m/n稱為事件A發(fā)生的頻率,計(jì)作(三)概率概率的統(tǒng)計(jì)學(xué)定義:某事件A在n次獨(dú)立重復(fù)試驗(yàn)中出現(xiàn)m次,當(dāng)試驗(yàn)次數(shù)n不斷增大,事件A發(fā)生的頻率就越來越接近某一固定數(shù)值p,那么p就是時(shí)間A發(fā)生的概率。種子數(shù)(n)1020502005001000發(fā)芽數(shù)(m)91947186458920發(fā)芽率(m/n)0.9000.9500.9400.9180.9160.920種子的發(fā)芽情況

某一隨機(jī)試驗(yàn),其基本事件空間是U={u1,u2,‥‥un},共有n個(gè)有限的基本事件,而且每一個(gè)事件都是等可能事件,而時(shí)間A在其中包含m個(gè)基本事件,那么時(shí)間A發(fā)生的概率:古典概率定義:例:一次投擲兩枚硬幣,計(jì)算至少有一枚正面向上的概率。(五)概率的運(yùn)算法則互斥事件的和事件的概率等于各事件的概率之和。獨(dú)立事件的積事件的概率等于各事件的概率之積。例:播種玉米種子時(shí),每穴播種兩粒,玉米種子的發(fā)芽率為90%,計(jì)算兩粒都發(fā)芽的概率,一粒發(fā)芽的概率,至少有一粒發(fā)芽的概率。對(duì)立事件發(fā)生的概率與不發(fā)生的概率之和等于1。二、大數(shù)定律(一)伯努利大數(shù)定律

設(shè)m是n次獨(dú)立試驗(yàn)中事件A出現(xiàn)的次數(shù),p是每次試驗(yàn)中事件A發(fā)生的概率,那么對(duì)于無論多么小的一個(gè)正數(shù)ξ存在下列關(guān)系。(二)辛欽大數(shù)定理

設(shè)x1,x2‥‥xn是來自同一總體的隨機(jī)變量,對(duì)于任意小的一個(gè)正整數(shù)ξ,存在:

總體上講,只要樣本容量足夠大,樣本統(tǒng)計(jì)數(shù)就越接近總體參數(shù),所以大數(shù)定律是樣本推斷總體的基礎(chǔ)。第六節(jié)概率分布一、離散型隨機(jī)變量的概率分布(一)離散型隨機(jī)變量的概率分布函數(shù)和概率累積函數(shù)概率分布函數(shù)

設(shè)X是離散型隨機(jī)變量,x是X的任何一個(gè)可能取值,X取x時(shí)的概率P(X=x)稱為離散型隨機(jī)變量X的概率分布函數(shù),計(jì)作f(x)。概率累積函數(shù)

設(shè)X是離散型隨機(jī)變量,x是X的任何一個(gè)可能取值,X≤x時(shí)的概率P(X≤x)稱為離散型隨機(jī)變量X的概率累積函數(shù),計(jì)作F(X)。

設(shè)一箱子中有10件產(chǎn)品,4件次品6件合格品,從中抽取4件,計(jì)算抽得次品的概率分布情況。抽得次品數(shù)離散型隨機(jī)變量xx01234f(x)0.07140.38100.42860.11430.0047F(x)0.07140.45240.88100.99531.0000概率分布表(二)離散型隨機(jī)變量的數(shù)學(xué)期望和方差數(shù)學(xué)期望次數(shù)

離散型隨機(jī)變量X的概率分布函數(shù),x是X的任何一個(gè)取值,那么定義為離散型隨機(jī)變量X的數(shù)學(xué)期望(均值),計(jì)作E(X)。數(shù)學(xué)期望就是總體的平均數(shù),是一個(gè)參數(shù),反應(yīng)的是總體的特征。數(shù)學(xué)期望的性質(zhì):方差平均離均差平方和。次數(shù)方差的性質(zhì):二項(xiàng)式分布對(duì)立事件:只能出現(xiàn)非此既彼得對(duì)立結(jié)果的事件。比如種子發(fā)芽與不發(fā)芽、硬幣正面向上與反面向上、缺素癥出現(xiàn)于不出現(xiàn)。例.投擲n枚硬幣,計(jì)算其中x枚正面向上的概率正面向上事件A某一種情況下x枚正面向上的概率X枚N-X枚(三)離散型隨機(jī)變量的理論分布從n枚硬幣中抽出x枚的組合方式:投擲n枚硬幣,計(jì)算其中x枚正面向上的概率二項(xiàng)式分布:在n次獨(dú)立重復(fù)試驗(yàn)中所有可可能出現(xiàn)的次數(shù)所組成的集合,成為二項(xiàng)總體x={0、1、2……n},其概率分布函數(shù):對(duì)立事件A二項(xiàng)式分布的形狀和參數(shù)例:某批玉米種子的發(fā)芽率為90%,同時(shí)播下5粒種子,計(jì)算種子發(fā)芽的概率分布。

種子發(fā)芽情況概率分布例:某小麥品種在田間出現(xiàn)自然變異植株的概率為0.0045,試計(jì)算(1)調(diào)查100株,獲得兩株或兩株以上植株的概率?(2)期望有99%的概率獲得1株或1株以上變異植株,至少要調(diào)查多少株?出現(xiàn)變異植株的概率不出現(xiàn)變異植株的概率(二)泊松分布

在生物學(xué)研究中,有許多事件出現(xiàn)的概率很?。╬很小,p<0.1)要觀察到這類稀有事件,抽樣次數(shù)或試驗(yàn)次數(shù)勢(shì)必很大(n很大),利用二項(xiàng)式分布計(jì)算這類稀有事件出現(xiàn)的概率很困難。

例:某稀有事件出現(xiàn)的概率p=0.02,進(jìn)行300次抽樣,該稀有事件出現(xiàn)兩次的概率有多大。

法國數(shù)學(xué)家poisson研究發(fā)現(xiàn),在二項(xiàng)總體中,當(dāng)n很大,p或q很小時(shí),二項(xiàng)式分布趨近于另外一種分布——poission分布。二項(xiàng)式分布概率分布函數(shù)的極限。對(duì)立事件A進(jìn)行n次獨(dú)立重復(fù)試驗(yàn),當(dāng)n很大,p或q很小時(shí),事件A在n次試驗(yàn)中出現(xiàn)的次數(shù),可以看成一個(gè)離散型隨機(jī)變量X,X={0,1,2‥‥n},X服從poisson分布。泊松分布的概率分布函數(shù)只取決于一個(gè)參數(shù)前例:MicrosoftExcel下的EXP函數(shù)可返回e的n次方。調(diào)查100株,獲得兩株或兩株以上變異植株的概率。期望有99%的概率獲得1株或1株以上的變異植株,至少要調(diào)查多少株。MicrosoftExcel下的LN函數(shù)可返回某數(shù)值的自然對(duì)數(shù)值。泊松分布的兩個(gè)參數(shù)

不同λ值的泊松分布

泊松分布的形狀完全由λ決定,λ很小時(shí),泊松分布是偏斜的,隨著λ的增加,逐漸對(duì)稱,逐漸趨近正態(tài)分布。二、連續(xù)性隨機(jī)變量的概率分布——正態(tài)分布正態(tài)分布的概率密度函數(shù)正態(tài)分布的概率累積函數(shù)正態(tài)分布曲線的特性

1.正態(tài)分布曲線是以x=為對(duì)稱軸,向左右兩側(cè)作對(duì)稱分布。2、x=μ時(shí),f(x)最大,曲線處在最高點(diǎn),︱x-μ︱越小,f(x)越大,︱x-μ︱越大,f(x)越小,3、f(x)>0,曲線位于軸上方。4、正態(tài)分布是一個(gè)曲線系統(tǒng)正態(tài)分布概率計(jì)算

標(biāo)準(zhǔn)正態(tài)分布:變量Z的兩個(gè)參數(shù)標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)標(biāo)準(zhǔn)正態(tài)分布的概率累積函數(shù)正態(tài)分布的概率計(jì)算向標(biāo)準(zhǔn)正態(tài)分布概率計(jì)算的轉(zhuǎn)化例:某土壤有機(jī)質(zhì)含量x~N(1.08,0.132),計(jì)算土壤有機(jī)質(zhì)含量落入[1.08,1.21]及[0.95,1.21]之間的概率。幾個(gè)特殊區(qū)間的概率95%99%小概率原理統(tǒng)計(jì)學(xué)上把發(fā)生概率小于5%的事件成為小概率事件,小概率事件在一次試驗(yàn)中是幾乎不可能發(fā)生的。第七節(jié)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論