版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第一章緒論
1試驗設(shè)計與統(tǒng)計分析在食品科學研究中的作用
下一張
主頁
退出
上一張
為了推動食品科學的發(fā)展,常常要進行科學研究。進行科學研究離不開調(diào)查或試驗。進行調(diào)查或試驗必須解決兩個問題:(1)如何合理地進行調(diào)查或試驗設(shè)計;(2)如何科學地整理、分析所收集的具有變異的數(shù)據(jù)資料,揭示出隱藏在其內(nèi)部的規(guī)律性。下一張
主頁
退出
上一張
食品試驗設(shè)計與統(tǒng)計分析總體上講屬于生物統(tǒng)計學(Biometrics)范疇。合理地進行調(diào)查或試驗設(shè)計、科學地整理、分析所收集得來的資料是生物統(tǒng)計的根本任務(wù)。食品試驗設(shè)計與統(tǒng)計分析是數(shù)理統(tǒng)計原理和方法在食品科學研究中的具體應(yīng)用。它在食品科學研究中的作用主要體現(xiàn)在兩方面:下一張
主頁
退出
上一張
(1)提供試驗或調(diào)查設(shè)計的方法試驗設(shè)計有廣義與狹義之分。
廣義的試驗設(shè)計是指試驗研究的課題設(shè)計,也就是指整個試驗計劃的擬定。主要包含課題名稱、試驗?zāi)康摹⒀芯恳罁?jù)、內(nèi)容以及預(yù)期達到的效果,試驗方案,經(jīng)濟效益或社會效益的估計,已具備的研究條件,參加研究人員的分工,試驗時間、地點、進度安排和經(jīng)費預(yù)算,成果鑒定,學術(shù)論文撰寫等等內(nèi)容。下一張
主頁
退出
上一張
狹義的試驗設(shè)計主要是指試驗單位(試驗單元)的選取、重復(fù)數(shù)目的確定、試驗單位的分組和試驗處理的安排。通常講的試驗設(shè)計主要指狹義的試驗設(shè)計。合理的試驗設(shè)計能控制和降低試驗誤差,提高試驗的精確性,為統(tǒng)計分析獲得試驗處理效應(yīng)和試驗誤差的無偏估計提供必要的數(shù)據(jù)。食品試驗研究中常用的試驗設(shè)計方法有完全隨機設(shè)計、隨機區(qū)組設(shè)計、正交設(shè)計、均勻設(shè)計、回歸正交設(shè)計和混料設(shè)計等。下一張
主頁
退出
上一張
調(diào)查設(shè)計也有廣義與狹義之分:
廣義的調(diào)查設(shè)計是指整個調(diào)查計劃的制定,包括調(diào)查研究的目的、對象與范圍,調(diào)查項目及調(diào)查表,抽樣方法的選取,抽樣單位、抽樣數(shù)量的確定,數(shù)據(jù)處理方法,調(diào)查組織工作,調(diào)查報告撰寫與要求,經(jīng)費預(yù)算等內(nèi)容。下一張
主頁
退出
上一張
狹義的調(diào)查設(shè)計主要包含抽樣方法的選取,抽樣單位、抽樣數(shù)目的確定等等。通常講的調(diào)查設(shè)計主要是指狹義的調(diào)查設(shè)計。合理的調(diào)查設(shè)計能控制與降低抽樣誤差,提高調(diào)查的精確性,為獲得總體參數(shù)的可靠估計提供必要的數(shù)據(jù)。
試驗或調(diào)查設(shè)計主要解決合理地收集必要而有代表性資料的問題。下一張
主頁
退出
上一張
(2)提供整理、分析數(shù)據(jù)資料的方法整理資料的基本方法是根據(jù)資料的特性將其整理成統(tǒng)計表、繪制成統(tǒng)計圖。通過統(tǒng)計表、圖可以大致看到所得資料集中、離散的情況,并利用所收集得來的數(shù)據(jù)計算樣本統(tǒng)計量,以表示該資料的數(shù)量特征、估計相應(yīng)的總體參數(shù)。下一張
主頁
退出
上一張
統(tǒng)計分析的主要內(nèi)容有兩方面:
①統(tǒng)計分析最重要的內(nèi)容是差異顯著性檢驗,即統(tǒng)計假設(shè)檢驗。通過抽樣調(diào)查或控制試驗,獲得的是具有變異的資料。那么產(chǎn)生變異的原因是什么?是由于處理間(例如不同原料、不同工藝、不同配比間)的實質(zhì)性差異所引起的,還是由于無法控制的偶然因素所引起的?顯著性檢驗的目的就在于承認并盡量排除這些無法控制的偶然因素的干擾,將處理間是否存在本質(zhì)差異揭示出來。下一張
主頁
退出
上一張
t檢驗——主要用于檢驗兩個處理平均數(shù)差異是否顯著;
方差分析——主要用于檢驗多個處理平均數(shù)間差異是否顯著(F檢驗);
檢驗——
主要用于由質(zhì)量性狀得來的次數(shù)資料的顯著性檢驗等。下一張
主頁
退出
上一張
顯著性檢驗的方法很多,常用的有:
②統(tǒng)計分析的另一個重要內(nèi)容是對變量(試驗指標或性狀)間的關(guān)系進行研究。研究它們之間的聯(lián)系性質(zhì)和程度,或者尋求它們之間的聯(lián)系形式,即進行相關(guān)分析與回歸分析。通過對資料進行相關(guān)、回歸分析,可以揭示出試驗指標或性狀間的內(nèi)在聯(lián)系,為食品新產(chǎn)品的研制開發(fā)、產(chǎn)品質(zhì)量的預(yù)測和控制提供理論依據(jù)。下一張
主頁
退出
上一張
③
還有一類統(tǒng)計分析方法:不考慮資料的分布類型,也不事先對有關(guān)總體參數(shù)進行估計,這類統(tǒng)計分析方法叫非參數(shù)檢驗法。非參數(shù)檢驗法計算簡便。當通常的檢驗方法對某些試驗或調(diào)查資料無能為力時,非參數(shù)檢驗法是比較好的統(tǒng)計方法。下一張
主頁
退出
上一張
2試驗設(shè)計與統(tǒng)計學發(fā)展概況古典記錄統(tǒng)計學階段近代描述統(tǒng)計學階段現(xiàn)代推斷統(tǒng)計學階段為什么要試驗?實踐是檢驗真理的唯一標準!原理論試驗
新理論高級試驗假設(shè)理論驗證、檢驗總結(jié)、發(fā)現(xiàn)新結(jié)果科學研究的實際過程-試驗本門課程的主要內(nèi)容及框架結(jié)構(gòu)食品試驗設(shè)計與統(tǒng)計分析數(shù)理統(tǒng)計分析試驗設(shè)計常用統(tǒng)計軟件簡介統(tǒng)計資料的整理與分析理論分布與抽樣分布統(tǒng)計假設(shè)檢驗與參數(shù)估計方差分析回歸分析試驗設(shè)計基礎(chǔ)全面試驗設(shè)計正交試驗設(shè)計均勻試驗設(shè)計回歸正交試驗設(shè)計Excel、SAS、SPSS1數(shù)理統(tǒng)計中的常用術(shù)語
1.1總體與樣本
總體:根據(jù)研究目的確定的研究對象的全體稱為總體(population);個體:總體中的每一個研究單位稱為個體(individual);
樣本:依據(jù)一定方法由總體中抽取部分個體所組成的集合稱為樣本(sample);
有限總體:含有有限個個體的總體稱為有限總體;
無限總體:包含有無限多個個體的總體稱為無限總體;下一張
主頁
退出
上一張
樣本容量:樣本中所包含的個體數(shù)目叫樣本容量或大小(samplesize),樣本容量常記為n。通常把n≤30的樣本叫小樣本,n>30的樣本叫大樣本。試驗研究的目的:了解總體,然而能觀測到的卻是樣本,通過樣本來推斷總體是統(tǒng)計分析的基本特點。下一張
主頁
退出
上一張
為了能可靠地從樣本來推斷總體,要求樣本具有一定的含量和代表性。如何獲取有代表性的樣本?采用隨機抽取。所謂隨機抽取(randomsampling)是指總體中的每一個個體都有同等的機會被抽取到樣本中。樣本畢竟只是總體的一部分,盡管樣本具有一定的含量也具有代表性,通過樣本來推斷總體也不可能是百分之百的正確。有很大的可靠性但有一定的錯誤率這是統(tǒng)計分析的特點。下一張
主頁
退出
上一張
1.2參數(shù)與統(tǒng)計量為了表示總體和樣本的數(shù)量特征,需要計算特征數(shù)。
參數(shù):由總體計算的特征數(shù)叫參數(shù)(parameter);常用希臘字母表示參數(shù),例如用μ表示總體平均數(shù),用σ表示總體標準差;統(tǒng)計量:由樣本計算的特征數(shù)叫統(tǒng)計量(staistic)。常用拉丁字母表示統(tǒng)計量,例如用表示樣本平均數(shù),用s表示樣本標準差,用R表示極差。
下一張
主頁
退出
上一張
總體樣本參數(shù)
統(tǒng)計量sμσσ2方差s2標準差平均數(shù)R極差抽樣推斷、估計為了了解總體分布、特征構(gòu)造
總體參數(shù)由相應(yīng)的統(tǒng)計量來估計,例如用估計μ,用S估計σ等。
1.3準確性與精確性
準確性(accuracy)也叫準確度,指觀測值與其真值的接近程度。設(shè)某一試驗指標或性狀的真值為μ,觀測值為
x,若x與μ相差的絕對值|x-μ|越小,則觀測值x的準確性越高;反之則低。下一張
主頁
退出
上一張
精確性(precision)也叫精確度,指同一試驗指標或性狀的重復(fù)觀測值彼此接近的程度。若觀測值彼此接近,即任意二個觀測值xi
、xj
相差的絕對值|xi-xj|越小,則觀測值精確性越高;反之則低。準確性、精確性的意義見圖2-1。下一張
主頁
退出
上一張
圖2-1準確性與精確性的關(guān)系示意圖隨機誤差也叫抽樣誤差(samplingerror),是由于許多無法控制的內(nèi)在和外在的偶然因素所造成的。隨機誤差帶有偶然性質(zhì),在試驗中,即使十分小心的進行試驗操作也難以消除。隨機誤差不可避免,但可減少。隨機誤差影響試驗的精確性。下一張
主頁
退出
上一張
1.4
隨機誤差(randomerror)與系統(tǒng)誤差(systematicerror)
統(tǒng)計上的試驗誤差是指隨機誤差。這種誤差愈小,試驗的精確性愈高。
系統(tǒng)誤差也叫片面誤差(lopsidederror),這是由于試驗對象相差較大,測量的儀器不準、標準試劑未經(jīng)校正,以及觀測、記載、抄錄、計算中的錯誤等等所引起。系統(tǒng)誤差可以通過改進方法、正確試驗設(shè)計來避免、消除。系統(tǒng)誤差影響試驗的準確性。下一張
主頁
退出
上一張
正確地進行試驗數(shù)據(jù)資料的分類是統(tǒng)計資料整理的前提。在調(diào)查或試驗中,由觀察、測量所得的數(shù)據(jù)資料按其性質(zhì)的不同,一般可以分為數(shù)量性狀資料、質(zhì)量性狀資料和半定量(等級)資料三大類。下一張
主頁
退出
上一張
2統(tǒng)計資料的分類
數(shù)量性狀(quantitativecharacter)是指能夠以測量、計量或計數(shù)的方式表示其特征的性狀。觀察測定數(shù)量性狀而獲得的數(shù)據(jù)就是數(shù)量性狀資料數(shù)量性狀資料的獲得有測量和計數(shù)兩種方式,因而數(shù)量性狀資料又分為計量資料和計數(shù)資料兩種。下一張
主頁
退出
上一張
2.1數(shù)量性狀資料
用測量方式獲得的數(shù)量性狀資料,即用度、量、衡等計量工具直接測定獲得的數(shù)量性狀資料。其數(shù)據(jù)是用長度、容積、重量等來表示。這種資料的各個觀測值不一定是整數(shù),兩個相鄰的整數(shù)間可以有帶小數(shù)的任何數(shù)值出現(xiàn),其小數(shù)位數(shù)的多少由度量工具的精度而定,它們之間的變異是連續(xù)性的。因此,計量資料也稱為連續(xù)性變異資料。下一張
主頁
退出
上一張
2.1.1計量資料
2.1.2計數(shù)資料
指用計數(shù)方式獲得的數(shù)量性狀資料。在這類資料中,它的各個觀察值只能以整數(shù)表示,在兩個相鄰整數(shù)間不得有任何帶小數(shù)的數(shù)值出現(xiàn)。這些觀察值只能以整數(shù)來表示,各觀察值是不連續(xù)的,因此該類資料也稱為不連續(xù)性變異資料或間斷性變異資料。下一張
主頁
退出
上一張
2.2質(zhì)量性狀資料
質(zhì)量性狀(qualitativecharacter)是指能觀察到而不能直接測量的,只能用文字來描述其特征的性狀,如食品顏色、風味等等。這類性狀本身不能直接用數(shù)值表示,要獲得這類性狀的數(shù)據(jù)資料,須對其觀察結(jié)果作數(shù)量化處理,其方法有以下兩種:下一張
主頁
退出
上一張
2.2.1統(tǒng)計次數(shù)法
在一定的總體或樣本中,根據(jù)某一質(zhì)量性狀的類別統(tǒng)計其次數(shù),以次數(shù)作為質(zhì)量性狀的數(shù)據(jù)。例如,蘋果中全紅果個數(shù)與半紅果個數(shù)。由質(zhì)量性狀數(shù)量化而得來的資料又叫次數(shù)資料。下一張
主頁
退出
上一張
2.2.2評分法
對某一質(zhì)量性狀,因其類別不同,分別給予評分。例如,分析面包的質(zhì)量,可以按照國際面包評分細則進行打分,綜合評價面包質(zhì)量。新產(chǎn)品開發(fā)中的評價打分等等。
2.3半定量(等級)資料
半定量或等級資料(semi-quantitativeorrankeddata)是指將觀察單位按所考察的性狀或指標的等級順序分組,然后清點各組觀察單位的次數(shù)而得的資料。這類資料既有次數(shù)資料的特點,又有程度或量的不同。如某種果實的褐變程度是視果實變色面積將其分組,然后統(tǒng)計各級別果數(shù)。
三種不同類型的資料相互間是有區(qū)別的,但有時可根據(jù)研究的目的和統(tǒng)計方法的要求將一種類型資料轉(zhuǎn)化成另一種類型的資料。例如,酸奶中的乳桿菌總數(shù)得到的資料屬于計數(shù)資料,根據(jù)化驗的目的,可按乳桿菌總數(shù)正?;虿徽7譃閮山M,清點各組的次數(shù),計數(shù)資料就轉(zhuǎn)化為質(zhì)量性狀次數(shù)資料;如果按乳桿菌總數(shù)過高、正常、過低分為三組,清點各組次數(shù),就轉(zhuǎn)化成了半定量資料。下一張
主頁
退出
上一張
3數(shù)據(jù)資料的整理3.1數(shù)據(jù)資料的檢查與核對目的:在于確保原始資料的完整性和正確性。所謂完整性是指原始資料無遺缺或重復(fù)。所謂正確性是指原始資料的測量和記載無差錯或未進行不合理的歸并。檢查中要特別注意特大、特小和異常數(shù)據(jù)(可結(jié)合專業(yè)知識作出判斷)。對于有重復(fù)、異常或遺漏的資料,應(yīng)予以刪除或補齊;對有錯誤、相互矛盾的資料應(yīng)進行更正,必要時進行復(fù)查或重新試驗。下一張
主頁
退出
上一張
未整理的資料為原始資料,是零星的、孤立的和雜亂無章,無規(guī)律可循,通過科學的整理和分析,可發(fā)現(xiàn)其規(guī)律性,揭示事物內(nèi)在本質(zhì)。3.2數(shù)據(jù)資料的整理方法當觀測值不多(n≤30)時,不必分組,可直接進行統(tǒng)計分析。當觀測值較多(n>30)時,宜將觀測值分成若干組,以便統(tǒng)計分析。將觀測值分組后,制成次數(shù)分布表,即可看到資料的集中和變異情況。
下一張
主頁
退出
上一張
3.2連續(xù)性資料(計量資料)的整理
連續(xù)性資料的整理,需要先確定全距、組數(shù)、組距、組中值及組限,然后將全部觀測值計數(shù)歸組?!纠?.1】為了分析某生產(chǎn)廠的罐頭質(zhì)量,現(xiàn)隨機抽取100聽罐頭樣品,分別稱取其凈重,數(shù)據(jù)資料見表2-1。下一張
主頁
退出
上一張
342.1340.7348.4346.0343.4342.7346.0341.1344.0348.0346.3346.0340.3344.2342.2344.1345.0340.5344.2344.0343.5344.2342.6343.7345.5339.3350.2337.3345.3358.2344.2345.8331.2342.1342.4340.5350.0343.2347.0340.2344.0353.3340.2336.3348.9340.2356.1346.0345.6346.2340.6339.7342.3352.8342.6350.3348.5344.0350.0335.1340.3338.2345.5345.6349.0336.7342.0338.4343.9343.7341.1347.1342.5350.0343.5345.6345.0348.6344.2341.1346.8350.2339.9346.6339.9344.3346.2338.0341.1347.3347.2339.8344.4347.2341.0341.0343.3342.3339.5343.0表2-1100聽罐頭樣品的凈重g
1、求全距
R
全距是數(shù)據(jù)資料中的最大值與最小值之差,又稱為極差(range),用R表示。即
R=Max(xi)-Min(xi)xi為觀測值
本例Max=358.2Min=331.2
R=358.2-331.2=27.0下一張
主頁
退出
上一張
2、確定組數(shù)
k
組數(shù)的多少視樣本含量及資料的變動范圍大小而定,一般以達到既簡化資料又不影響反映資料的規(guī)律性為原則。組數(shù)要適當,不宜過多,亦不宜過少。分組越多所求得的統(tǒng)計量越精確,但增大了運算量;若分組過少,資料的規(guī)律性就反映不出來,計算出的統(tǒng)計量的精確性也較差。一般組數(shù)的確定,可參考表2-2。下一張
主頁
退出
上一張
下一張
主頁
退出
上一張
樣本含量(n)組數(shù)60-1007-10100-2009-12200-50012-17500以上17-30本例中,n=100,初步確定組數(shù)為9組。表2-2樣本含量與組數(shù)3、確定組距i
每一組中的最大值與最小值之差稱為組距(Classinterval),記為i。分組時一般要求各組的組距相等。組距(i)=全距R/組數(shù)k
本例
i=27/9=3下一張
主頁
退出
上一張
4、確定組限及組中值
各組的最大值與最小值稱為組限。最小值稱為下限,最大值稱為上限。每一組的中點值稱為組中值,它是該組的代表值。組中值與組限、組距的關(guān)系如下:組中值=(組下限+組上限)/2=組下限+1/2組距=組上限-1/2組距
下一張
主頁
退出
上一張
組距確定后,首先要選定第一組的組中值。在分組時為了避免第一組中觀察值過多,一般第一組的組中值以接近或等于資料中的最小值為好。第一組組中值確定后,該組組限即可確定,其余各組的組中值和組限也可相繼確定。注意:最末一組的上限應(yīng)大于資料中的最大值。
表2-1中,最小值為331.2,第一組的組中值取331.0,因組距為3.0,因此第一組的下限應(yīng)為:
331.0-(1/2)×3.0=329.5;第一組的上限也就是第二組的下限應(yīng)為:
329.5+3.0=332.5;第二組的上限也就是第三組的下限為:
332.5+3.0=335.5,……,依此類推,一直到某一組的上限大于資料中的最大值為止。依次類推分組為:
329.5-332.5,332.5-335.5,……
下一張
主頁
退出
上一張
將正好等于前一組上限和后一組下限的數(shù)據(jù),一般約定將其歸入后一組。通常將上限略去不寫。第一組記為36.0
,第二組記為39.0
,
……
5、制作次數(shù)分布表分組結(jié)束后,將資料中的每一觀測值逐一歸組,統(tǒng)計每組內(nèi)所包含的觀測值個數(shù),制作次數(shù)分布表。下一張
主頁
退出
上一張
表2-3100聽罐頭凈重的次數(shù)分布下一張
主頁
退出
上一張
組限組中值(x)次數(shù)(f)329.5-331.0332.5-334.0335.5-337.0338.5-340.0341.5-343.0344.5-346.0347.5-349.0350.5-352.0353.5-355.0356.5-358.011621322312211100聽罐頭的單聽凈重多數(shù)集中在343g,約占觀測值總個數(shù)的1/3,用它來描述罐頭單聽凈重的平均水平,有較強的代表性。由次數(shù)分布表可以看出,每聽罐頭凈重小于332.5g及大于356.5g的為極少數(shù)。100聽罐頭凈重分布基本以343.0g為中心,向兩邊做遞減對稱分布。
表2-4100盒鮮棗每盒檢出不合格棗數(shù)下一張
主頁
退出
上一張
3.3間斷性資料(計數(shù)資料)的整理
以100盒鮮棗每盒檢出不合格棗數(shù)為例,說明間斷性資料的整理。18291924221924222220232021232126222324222324252422242324222523252623222523202225262526262526242321262123222424212324242122232022232623242224262824272324222623202625252625252625242225262524252625252728
計數(shù)資料觀察值較多時,變異范圍較大,若以每一觀察值為一組,則組數(shù)太多,而每組內(nèi)包含的觀察值太少,資料的規(guī)律性顯示不出來。對于這樣的資料,可擴大為以幾個相鄰觀察值為一組,適當減少組數(shù),這樣資料的規(guī)律性就較明顯,對資料進一步計算分析也比較方便。下一張
主頁
退出
上一張
表2-5100盒鮮棗每盒檢出不合格棗數(shù)次數(shù)分布表下一張
主頁
退出
上一張
不合格棗數(shù)次數(shù)(f)18-19320-211122-233124-253526-271728-2933.4質(zhì)量性狀資料、半定量(等級)資料的整理對于質(zhì)量性狀資料、半定量(等級)資料,可按性狀或等級進行分組,分別統(tǒng)計各組的次數(shù),然后制成次數(shù)分布表。下一張
主頁
退出
上一張
3.5常用統(tǒng)計表與統(tǒng)計圖3.5.1統(tǒng)計表(1)統(tǒng)計表的結(jié)構(gòu)和要求統(tǒng)計表由標題、橫標目、縱標目、線條、數(shù)字及合計構(gòu)成,其基本格式如下表:下一張
主頁
退出
上一張
表號標題編制統(tǒng)計表的總原則:結(jié)構(gòu)簡單,層次分明,內(nèi)容安排合理,重點突出,數(shù)據(jù)準確,便于理解和比較分析。下一張
主頁
退出
上一張
統(tǒng)計表編制具體要求如下:
①
標題標題要簡明扼要、準確地說明表的內(nèi)容,有時須注明時間、地點。
②標目標目分橫標目和縱標目兩項。橫標目列在表的左側(cè),用以表示被說明事物的主要標志;縱標目列在表的上端,說明橫標目各統(tǒng)計指標內(nèi)容,并注明計算單位,如%、kg、cm等等。
③數(shù)字一律用阿拉伯數(shù)字,數(shù)字以小數(shù)點對齊,小數(shù)位數(shù)一致,無數(shù)字的用“─”表示,數(shù)字是“0”的,則填寫“0”。
④線條表的上下兩條邊線略粗,縱、橫標目間及合計用細線分開,表的左右邊線可省去,表的左上角一般不用斜線。
下一張
主頁
退出
上一張
(2)統(tǒng)計表的種類
統(tǒng)計表可根據(jù)縱、橫標目是否有分組分為簡單表和復(fù)合表兩類。
①
簡單表由一組橫標目和一組縱標目組成,縱橫標目都未分組。此類表適于簡單資料的統(tǒng)計,如表2-6。下一張
主頁
退出
上一張
②復(fù)合表由兩組或兩組以上的橫標目與一組縱標目結(jié)合而成,或由一組橫標目與兩組或兩組以上的縱標目結(jié)合而成,或由兩組或兩組以上的橫、縱標目結(jié)合而成。此類表適用于復(fù)雜資料的統(tǒng)計,如表2-11。下一張
主頁
退出
上一張
表2-11幾種動物性食品的營養(yǎng)成分3.5.2統(tǒng)計圖常用的統(tǒng)計圖有長條圖
(barchart)、園餅圖(piechart)、線圖(linearchart)、直方圖(histogram)和折線圖(broken-linechart)等。一般情況下,計量資料采用直方圖和折線圖,計數(shù)資料、質(zhì)量性狀資料、半定量(等級)資料常用長條圖、線圖或園餅圖。下一張
主頁
退出
上一張
統(tǒng)計圖繪制的基本要求
1、標題簡明扼要,列于圖的下方。
2、縱、橫兩軸應(yīng)有刻度,注明單位。
3、橫軸由左至右、縱軸由下而上,數(shù)值由小到大;圖形長寬比例約5:4或6:5。
4、圖中需用不同顏色或線條代表不同處理、樣品等時,應(yīng)有圖例說明。下一張
主頁
退出
上一張
Excel軟件應(yīng)用工具-加載宏-分析數(shù)據(jù)庫數(shù)據(jù)分析方差分析回歸分析統(tǒng)計假設(shè)檢驗直方圖描述統(tǒng)計4.1平均數(shù)(mean,average)下一張
主頁
退出
上一張
4統(tǒng)計資料的特征數(shù)
平均數(shù)是統(tǒng)計學中最常用的統(tǒng)計量,反映數(shù)據(jù)資料的相對集中位置。平均數(shù)主要包括有:
算術(shù)平均數(shù)(arithmeticmean)中位數(shù)(median)眾數(shù)(mode)
幾何平均數(shù)(geometricmean)
調(diào)和平均數(shù)(harmonicmean)
4.1.1算術(shù)平均數(shù)(arithmeticmean)
算術(shù)平均數(shù)是指資料中各觀測值的總和除以觀測值個數(shù)所得的商,簡稱平均數(shù)或均數(shù),記為。算術(shù)平均數(shù)可根據(jù)樣本大小及分組情況而采用直接法或加權(quán)法計算。
1.直接法
主要用于樣本含量n≤30以下、未經(jīng)分組資料平均數(shù)的計算。下一張
主頁
退出
上一張
設(shè)某一資料包含n個觀測值:x1、x2、…、xn,則樣本平均數(shù)可通過下式計算:(2-1)
其中,Σ為總和符號;表示從第一個觀測值x1累加到第n個觀測值xn。當在意義上已明確時,可簡寫為Σx,(3-1)式可改寫為:下一張
主頁
退出
上一張
例:對食品科學專業(yè)2004級1班10位同學的體重進行測定,測定結(jié)果分別為50.0、52.0、53.5、56.0、58.5、60.0、48.0、51.0、50.5、49.0(kg),求其平均數(shù)。由于Σx=50.0+52.0+53.5+56.0+58.5+60.0+48.0+51.0+50.5+49.0=528.5,
n=10
下一張
主頁
退出
上一張
那么
10位同學的平均體重為52.85kg。
2.加權(quán)法對于樣本含量n≥30以上且已分組的資料,可以在次數(shù)分布表的基礎(chǔ)上采用加權(quán)法計算平均數(shù),計算公式為:(2-2)下一張
主頁
退出
上一張
式中:—第i組的組中值;
—第i組的次數(shù);
—分組數(shù)第i組的次數(shù)fi是權(quán)衡第i組組中值xi在資料中所占的比重大小,因此將fi
稱為是xi的“權(quán)”,加權(quán)法也由此而得名?!纠?00聽罐頭凈重(單位:kg)資料整理成次數(shù)分布表如下,求其加權(quán)數(shù)平均數(shù)。下一張
主頁
退出
上一張
表2-3100聽罐頭凈重的次數(shù)分布下一張
主頁
退出
上一張
組限組中值(x)次數(shù)(f)329.5-331.01332.5-334.03335.5-337.010338.5-340.026341.5-343.031344.5-346.017347.5-349.08350.5-352.02353.5-355.01356.5-358.01
利用加權(quán)法計算平均數(shù)公式計算:
100聽罐頭每聽凈重的加權(quán)平均數(shù)為342.67g。
注意:計算若干個來自同一總體的樣本平均數(shù)的平均數(shù)時,如果樣本含量不等,也應(yīng)采用加權(quán)法計算。
下一張
主頁
退出
上一張
【例】某牛群有黑白花奶牛1500頭,其平均體重為750kg,而另一牛群有黑白花奶牛1200頭,平均體重為725kg,如果將這兩個牛群混合在一起,其混合后平均體重為多少?此例兩個牛群所包含的牛的頭數(shù)不等,要計算兩個牛群混合后的平均體重,應(yīng)以兩個牛群牛的頭數(shù)為權(quán),求兩個牛群平均體重的加權(quán)平均數(shù),即下一張
主頁
退出
上一張
即兩個牛群混合后平均體重為738.89kg。3.平均數(shù)的基本性質(zhì)(1)樣本各觀測值與平均數(shù)之差的和為零,即離均差之和等于零?;蚝唽懗上乱粡?/p>
主頁
退出
上一張
(2)樣本各觀測值與平均數(shù)之差的平方和為最小,即離均差平方和為最小。
(xi-)2<(xi-a)2
(常數(shù)a≠)或簡寫為:<
對于總體而言,通常用μ表示總體平均數(shù),有限總體的平均數(shù)為:下一張
主頁
退出
上一張
(2-3)式中,N表示總體所包含的個體數(shù)
當一個統(tǒng)計量的數(shù)學期望等于所估計的總體參數(shù)時,則稱此統(tǒng)計量為該總體參數(shù)的無偏估計量。統(tǒng)計學中常用樣本平均數(shù)()作為總體平均數(shù)(μ)的估計量,并已證明樣本平均數(shù)是總體平均數(shù)μ的無偏估計量。下一張
主頁
退出
上一張
4.1.2中位數(shù)(median)
將資料內(nèi)所有觀測值由小到大依次排列,位于中間的那個觀測值,稱為中位數(shù),記為Md。
當觀測值的個數(shù)是偶數(shù)時,則以中間兩個觀測值的平均數(shù)作為中位數(shù)。當所獲得的數(shù)據(jù)資料呈偏態(tài)分布時,中位數(shù)的代表性優(yōu)于算術(shù)平均數(shù)。下一張
主頁
退出
上一張
(1)當觀測值個數(shù)n為奇數(shù)時,第(n+1)/2位置的觀測值,即x(n+1)/2為中位數(shù):
Md=
(2)當觀測值個數(shù)為偶數(shù)時,第n/2和第(n/2+1)位置的兩個觀測值之和的1/2為中位數(shù),即:
下一張
主頁
退出
上一張
(2-4)
【例】對9個小麥品種的容重進行測定,測定結(jié)果為750、760、767、769、773、775、778、780、800(已排序),求其中位數(shù)。此例n=9,為奇數(shù),則:
Md==773(g)即九個小麥品種的中位數(shù)為773g。下一張
主頁
退出
上一張
4.1.3幾何平均數(shù)(geometricmean)
n個觀測值相乘之積開n次方所得的方根,稱為幾何平均數(shù),記為G。它主要應(yīng)用于科學研究中的動態(tài)分析,如微生物的增長率、人口的增長率等等。當觀測值呈幾何級數(shù)變化時,用幾何平均數(shù)比用算術(shù)平均數(shù)更能代表其平均水平。其計算公式如下:
下一張
主頁
退出
上一張
(2-6)
為了計算方便,可將各觀測值取對數(shù)后相加除以n,得lgG,再求lgG的反對數(shù),即得G值,即
下一張
主頁
退出
上一張
4.1.4眾數(shù)(mode)
資料中出現(xiàn)次數(shù)最多的那個觀測值或次數(shù)最多一組的組中值,稱為眾數(shù),記為M0。
下一張
主頁
退出
上一張
4.1.5調(diào)和平均數(shù)(harmonicmean)
,資料中各觀測值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),稱為調(diào)和平均數(shù),記為H,即(2—8)計算平均速率4.2變異數(shù)
變異數(shù)的意義
用平均數(shù)作為樣本的代表,其代表性的強弱受樣本資料中各觀測值變異程度的影響。僅用平均數(shù)對一個資料的特征作統(tǒng)計描述是不全面的,還需引入度量資料中觀測值變異程度大小的統(tǒng)計量。常用的表示變異程度的統(tǒng)計量有全距、方差、標準差和變異系數(shù)。下一張
主頁
退出
上一張
4.2.1全距(Range)
全距(極差)是表示資料中各觀測值變異程度大小最簡便的統(tǒng)計量。
R=Max-MinR值越大,平均數(shù)的代表性越差。但是全距只利用了資料中的最大值和最小值,沒有充分利用全部資料,并不能準確表達資料中各觀測值的變異程度,是比較粗略的。當資料很多而又要迅速對資料的變異程度作出判斷時,可以利用全距這個統(tǒng)計量。下一張
主頁
退出
上一張
為了準確地表示樣本內(nèi)各個觀測值的變異程度,人們首先會考慮到以平均數(shù)為標準,求出各個觀測值與平均數(shù)的離差,(),稱為離均差。雖然離均差能表示一個觀測值偏離平均數(shù)的性質(zhì)和程度,但因為離均差有正、有負,離均差之和為零,即=0,因而不能用離均差之和Σ()來表示資料中所有觀測值的總偏離程度。下一張
主頁
退出
上一張
4.2.2方差(Variance)
為了解決離均差有正、有負,離均差之和為零的問題,可先求離均差的絕對值并將各離均差絕對值之和除以觀測值個數(shù)n求得平均絕對離差,即Σ||/n。雖然平均絕對離差可以表示資料中各觀測值的變異程度,但由于平均絕對離差包含絕對值符號,使用很不方便,在統(tǒng)計學中未被采用。
采用將離均差平方的辦法來解決離均差有正、有負,離均差之和為零的問題。先將各個離均差平方,即()2
,再求離均差平方和,即,簡稱平方和,記為SS;由于離差平方和常隨樣本大小而改變,為了消除樣本大小的影響,用平方和除以樣本大小,即,求出離均差平方和的平均數(shù);下一張
主頁
退出
上一張
為了使所得的統(tǒng)計量是相應(yīng)總體參數(shù)的無偏估計量,統(tǒng)計學證明,在求離均差平方和的平均數(shù)時,分母不用樣本含量n,而用自由度n-1,所以,我們采用統(tǒng)計量表示資料的變異程度。統(tǒng)計量稱為均方(meansquare縮寫為MS),又稱樣本方差,記為S2,即
S2=(2—9)下一張
主頁
退出
上一張
相應(yīng)的總體參數(shù)叫總體方差,記為σ2。對于有限總體而言,σ2的計算公式為:(2—10)
統(tǒng)計學上把樣本方差S2的平方根叫做樣本標準差,記為S,即:下一張
主頁
退出
上一張
4.2.3標準差(Standdeviation)(2-11)
由于所以(2-11)式可改寫為:下一張
主頁
退出
上一張
相應(yīng)的總體參數(shù)叫總體標準差,記為σ。對于有限總體而言,σ的計算公式為:(2-12)在統(tǒng)計學中,常用樣本標準差S估計總體標準差σ。
下一張
主頁
退出
上一張
4.2.4標準差的計算方法1.直接法
對于未分組或小樣本資料,可直接利用定義公式來計算標準差。
【例】10瓶罐頭的凈重(g)分別為450,450,500,500,500,550,550,550,600,600,650,計算標準差。由已知,計算:Σx=5400,Σx2=2955000,代入公式得:
10瓶罐頭凈重的標準差為65.828g。下一張
主頁
退出
上一張
(g)2.加權(quán)法
對于已制成次數(shù)分布表的大樣本資料,可利用次數(shù)分布表,采用加權(quán)法計算標準差。計算公式為:下一張
主頁
退出
上一張
式中,fi為各組次數(shù);xi為各組的組中值;Σfi
=n為總次數(shù)。
【例】由次數(shù)分布計算100聽罐頭凈重的標準差。下一張
主頁
退出
上一張
=4.43g3.標準差的特性
(1)標準差的大小,受資料中每個觀測值的影響,如觀測值間變異大,求得的標準差也大,反之則小。(2)計算標準差時,在各觀測值加上或減去一個常數(shù),其數(shù)值不變。(3)每個觀測值乘以或除以一個常數(shù)a,則所得的標準差是原來標準差的a倍或1/a倍。下一張
主頁
退出
上一張
(4)在資料服從正態(tài)分布的條件下,資料中約有68.26%的觀測值在平均數(shù)左右一倍標準差(±S)范圍內(nèi);約有95.43%的觀測值在平均數(shù)左右兩倍標準差(±2S)范圍內(nèi);約有99.73%的觀測值在平均數(shù)左右三倍標準差(±3S)范圍內(nèi)。也就是說全距近似地等于6倍標準差,可用(全距/6)來粗略估計標準差。下一張
主頁
退出
上一張
熟記4.2.5變異系數(shù)Coefficientofvariation)
變異系數(shù)是衡量資料中各觀測值變異程度的另一個統(tǒng)計量。標準差與平均數(shù)的比值稱為變異系數(shù),記為C·V。變異系數(shù)可以消除單位和(或)平均數(shù)的影響,可以比較不同樣本資料的相對變異程度。下一張
主頁
退出
上一張
變異系數(shù)的計算公式為:下一張
主頁
退出
上一張
性狀x/μmS/μmCV/%果皮厚49.64.99.9角質(zhì)層厚6.20.812.9(2—13)表2-8贊皇大棗果皮厚、角質(zhì)層厚測量結(jié)果角質(zhì)層相對變異程度大指
標平均值標準差變幅變異系數(shù)%物理性狀水分
%13.000.6711.75-14.505.18容重
g/L766.025.0694-8433百粒重
g34.485.9714.59-44.8617.30百粒體積ml28.064.8711.0-35.817.34籽粒密度
g/ml1.230.031.14-1.332.81營養(yǎng)品質(zhì)淀粉
%69.551.3563.82-72.061.95粗蛋白
%10.970.928.63-13.888.39粗脂肪
%4.511.162.89-9.6925.63灰分
%1.460.111.20-1.787.38粗纖維
%2.190.291.58-2.8513.31
注意:變異系數(shù)的大小,同時受平均數(shù)和標準差兩個統(tǒng)計量的影響,因而在利用變異系數(shù)表示資料的變異程度時,最好將平均數(shù)和標準差也列出。下一張
主頁
退出
上一張
1事件與概率1.1事件1.1.1必然現(xiàn)象與隨機現(xiàn)象
在自然界與生產(chǎn)實踐和科學試驗中,人們會觀察到各種各樣的現(xiàn)象,把它們歸納起來,大體上分為兩大類:下一張
主頁
退出
上一張
必然現(xiàn)象:可預(yù)言其結(jié)果的,即在保持條件不變的情況下,重復(fù)進行試驗,其結(jié)果總是確定的,必然發(fā)生的(或必然不發(fā)生)。這類現(xiàn)象稱為必然現(xiàn)象(inevitablephenomena)或確定性現(xiàn)象(definitephenomena)。隨機現(xiàn)象:另一類是事前不可預(yù)言其結(jié)果的,即在保持條件不變的情況下,重復(fù)進行試驗,其結(jié)果未必相同。這類在個別試驗中其結(jié)果呈現(xiàn)偶然性、不確定性現(xiàn)象,稱為隨機現(xiàn)象(randomphenomena)或不確定性現(xiàn)象(indefinitephenomena)。下一張
主頁
退出
上一張
隨機現(xiàn)象或不確定性現(xiàn)象,有如下特點:在一定的條件實現(xiàn)時,有多種可能的結(jié)果發(fā)生,事前人們不能預(yù)言將出現(xiàn)哪種結(jié)果;對一次或少數(shù)幾次觀察或試驗而言,其結(jié)果呈現(xiàn)偶然性、不確定性;但在相同條件下進行大量重復(fù)試驗時,其試驗結(jié)果卻呈現(xiàn)出某種固有的、特定的規(guī)律性——頻率的穩(wěn)定性,通常稱之為隨機現(xiàn)象的統(tǒng)計規(guī)律性。下一張
主頁
退出
上一張
1.1.2隨機試驗與隨機事件1隨機試驗通常我們把根據(jù)某一研究目的,在一定條件下對自然現(xiàn)象所進行的觀察或試驗統(tǒng)稱為試驗(trial)。當一個試驗如果滿足下述三個特性,則稱其為一個隨機試驗(randomtrial),簡稱試驗。下一張
主頁
退出
上一張
(1)試驗可以在相同條件下多次重復(fù)進行;(2)每次試驗的可能結(jié)果不止一個,并且事先知道會有哪些可能的結(jié)果;(3)每次試驗總是恰好出現(xiàn)這些可能結(jié)果中的一個,但在一次試驗之前卻不能肯定這次試驗會出現(xiàn)哪一個結(jié)果。下一張
主頁
退出
上一張
2隨機事件
隨機試驗的每一種可能結(jié)果,在一定條件下可能發(fā)生,也可能不發(fā)生,稱為隨機事件(randomevent),簡稱事件(event),通常用A、B、C等來表示。(1)基本事件
我們把不能再分的事件稱為基本事件(elementaryevent),也稱為樣本點(samplepoint)。下一張
主頁
退出
上一張
例如,從編號為1、2、3、…、10的十個籃球中隨機抽取1個籃球,有10種不同的可能結(jié)果:“取得一個編號是1”、“取得一個編號是2”、…、“取得一個編號是10”,這10個事件都是不可能再分的事件,它們都是基本事件。由若干個基本事件組合而成的事件稱為復(fù)合事件(compoundevent)。如“取得一個編號是2的倍數(shù)”是一個復(fù)合事件,它由“取得一個編號是2”、“是4”、“是6、“是8”、“是10”5個基本事件組合而成。下一張
主頁
退出
上一張
(2)必然事件
把在一定條件下必然會發(fā)生的事件稱為必然事件(certainevent),用Ω表示。例如,一個大氣壓下,水加熱到100C,水會沸騰;種瓜得瓜、種豆得豆下一張
主頁
退出
上一張
(3)不可能事件
在一定條件下不可能發(fā)生的事件稱為不可能事件(impossibleevent),用ф表示。例如,在滿足一定孵化條件下,從石頭孵化出小雞,就是一個不可能事件。
必然事件與不可能事件實際上是確定性現(xiàn)象,它們不是隨機事件,但是為了方便起見,我們把它們看作為兩個特殊的隨機事件。1.2概率1.2.1概率統(tǒng)計定義研究隨機試驗,僅知道可能發(fā)生哪些隨機事件是不夠的,還需了解各種隨機事件發(fā)生的可能性大小,以揭示這些事件的內(nèi)在的統(tǒng)計規(guī)律性,從而指導(dǎo)實踐。這就要求有一個能夠刻劃事件發(fā)生可能性大小的數(shù)量指標,這個指標應(yīng)該是事件本身所固有的,且不隨人的主觀意志而改變,人們稱之為概率(probability)。事件A的概率記為P(A)。下一張
主頁
退出
上一張
概率:刻劃事件發(fā)生可能性大小的數(shù)量指標
概率統(tǒng)計定義:
在相同條件下進行n次重復(fù)試驗,如果隨機事件A發(fā)生的次數(shù)為m,那么m/n稱為隨機事件A的頻率(frequency);當試驗重復(fù)數(shù)n逐漸增大時,隨機事件A的頻率越來越穩(wěn)定地接近某一數(shù)值p,那么就把p稱為隨機事件A的概率。下一張
主頁
退出
上一張
如此定義的概率稱為統(tǒng)計概率(statisticsprobability),或者稱后驗概率(posteriorprobability)。
表3-1拋擲一枚硬幣發(fā)生正面朝上的試驗記錄下一張
主頁
退出
上一張
例如為了確定拋擲一枚硬幣出現(xiàn)正面朝上這個事件的概率,歷史上有人作過成千上萬次拋擲硬幣的試驗。在表3—1中列出了他們的試驗記錄。
從表3-1可看出,隨著實驗次數(shù)的增多,正面朝上這個事件發(fā)生的頻率越來越穩(wěn)定地接近0.5,我們就把0.5作為這個事件的概率。在一般情況下,隨機事件的概率p是不可能準確得到的。通常以試驗次數(shù)n充分大時隨機事件A的頻率作為該隨機事件概率的近似值。即P(A)=p≈m/n
(n充分大)(3-1)下一張
主頁
退出
上一張
1.2.2概率的性質(zhì)
(1)對于任何事件A,有0≤P(A)≤1;(2)必然事件的概率為1,即P(Ω)=1;(3)不可能事件的概率為0,即P(ф)=0。2概率分布
事件的概率表示了一次試驗?zāi)骋粋€結(jié)果發(fā)生的可能性大小。若要全面了解試驗,則必須知道試驗的全部可能結(jié)果及各種可能結(jié)果發(fā)生的概率,即必須知道隨機試驗的概率分布(probabilitydistribution)。為了深入研究隨機試驗,我們先引入隨機變量(randomvariable)的概念。下一張
主頁
退出
上一張
2.1隨機變量
下一張
主頁
退出
上一張
2004年奶粉事件“大頭娃”
描述隨機事件的變量稱為隨機變量。隨機變量的取值在一次試驗前不能確定,具有隨機性。作一次試驗,其結(jié)果有多種可能。每一種可能結(jié)果都可用一個數(shù)來表示,把這些數(shù)作為變量x的取值,則試驗結(jié)果可用變量x來表示?!纠繉?0種品牌袋裝奶粉進行質(zhì)量檢測,其可能結(jié)果是“0種合格”、“1種合格”、“2種合格”、“…”、“10種袋裝奶粉都合格”。若用x表示袋裝奶粉合格品牌數(shù),則x的取值為0、1、2、…、10。【例】食品加工中高溫殺菌可能結(jié)果只有兩種,即“全部殺死細菌”與“未能全部殺死細菌”。若用變量x表示試驗的兩種結(jié)果,則可令x=0表示“未能全部殺死細菌”,x=1表示“全部殺死細菌”?!纠繙y定關(guān)中地區(qū)不同小麥品種的蛋白質(zhì)含量,其蛋白質(zhì)含量在9.3-13.5%之間,如用x表示測定結(jié)果,那么x值可以是這個范圍內(nèi)的任何實數(shù)。下一張
主頁
退出
上一張
離散型隨機變量:如果表示試驗結(jié)果的變量x,其可能取值為可列個,且以各種確定的概率取這些不同的值,則稱x為離散型隨機變量
(discreterandomvariable);連續(xù)型隨機變量:如果表示試驗結(jié)果的變量x,其可能取值為某范圍內(nèi)的任何數(shù)值,且x在其取值范圍內(nèi)的任一區(qū)間中取值時,其概率是確定的,則稱x為連續(xù)型隨機變量
(continuousrandomvariable)。
下一張
主頁
退出
上一張
試驗結(jié)果和取此結(jié)果的概率可以一一列出。不能列出試驗結(jié)果和取此結(jié)果的概率,只能給出一定范圍和在此范圍內(nèi)取值的概率。2.2離散型隨機變量的概率分布要了解離散型隨機變量x的統(tǒng)計規(guī)律,就必須知道它的一切可能值xi及取每種可能值的概率pi。如果我們將離散型隨機變量x的一切可能取值xi
(i=1,2,…),及其對應(yīng)的概率pi,記作
P(x=xi)=pi
i=1,2,…
(3—3)
則稱(3—3)式為離散型隨機變量x的概率分布或分布。常用分布列(distributionseries)來表示:下一張
主頁
退出
上一張
x1x2
…xn
….p1p2
…pn
…
從分布列可以一目了然看出隨機變量X的可能取值及取這些值的概率。離散型隨機變量的概率分布具有pi≥0和Σpi=1這兩個基本性質(zhì)。2.3連續(xù)型隨機變量的概率分布
連續(xù)型隨機變量(如身高、體重等)的概率分布不能用分布列來表示,因為其可能取值是不可數(shù)的,不能一一列出。改用隨機變量x在某個區(qū)間內(nèi)取值的概率P(a≤x<b)來表示。下面通過頻率分布密度曲線予以說明。下一張
主頁
退出
上一張
圖4—1為數(shù)據(jù)資料的頻率分布直方圖,圖中縱座標取頻率與組距的比值??梢栽O(shè)想,如果樣本取得越來越大(n→+∞),組分得越來越細(i→0),某一范圍內(nèi)的頻率將趨近于一個穩(wěn)定值-概率。這時,頻率分布直方圖各個直方上端中點的連線-頻率分布折線將逐漸趨向于一條曲線。下一張
主頁
退出
上一張
當n→+∞、i→0時,頻率分布折線的極限是一條穩(wěn)定的函數(shù)曲線。對于樣本是取自連續(xù)型隨機變量的情況,這條函數(shù)曲線將是光滑的。這條曲線排除了抽樣和測量的誤差,完全反映了數(shù)據(jù)資料的變動規(guī)律。這條曲線叫概率分布密度曲線,相應(yīng)的函數(shù)叫概率分布密度函數(shù),簡稱分布密度。下一張
主頁
退出
上一張
(3—4)式為連續(xù)型隨機變量x在區(qū)間[a,b)上取值概率的表達式??梢姡B續(xù)型隨機變量的概率由概率分布密度函數(shù)確定。
若變量X概率分布密度函數(shù)記為f(x),則x取值于區(qū)間[a,b)的概率為圖中陰影部分的面積,即
P(a≤x<b)=(3-4)
連續(xù)型隨機變量概率分布的性質(zhì):
1、分布密度函數(shù)總是大于或等于0,即f(x)≥0;
2、當隨機變量x取某一特定值時,其概率等于0;即
(c為任意實數(shù))
所以,對于連續(xù)型隨機變量,僅研究其在某一個區(qū)間內(nèi)取值的概率,而不去討論取某一個值(點)的概率。下一張
主頁
退出
上一張
連續(xù)型隨機變量某一點的概率為0。3、隨機變量x取值在-∞<x<+∞范圍內(nèi),所以下一張
主頁
退出
上一張
(3-5)(3—5)式表示分布密度曲線與橫軸所圍成的區(qū)間全部面積為1。P(a≤x<b)=4、隨機變量X取〔a,b)區(qū)間值的概率為:3理論分布
3.1二項分布
3.1.1貝努利試驗及其概率公式貝努利試驗:對于n次獨立的試驗,如果每次試驗結(jié)果出現(xiàn)且只出現(xiàn)對立事件A與之一,在每次試驗中出現(xiàn)A的概率是常數(shù)p(0<p<1),因而出現(xiàn)對立事件的概率是1-p=q,則稱這一串重復(fù)的獨立試驗為n重貝努利試驗,簡稱貝努利試驗(Bernoullitrials)。
下一張
主頁
退出
上一張
重要的離散型分布只有兩種可能結(jié)果的隨機試驗稱為貝努利試驗食品抽樣中,產(chǎn)品合格或不合格,種子發(fā)芽或不發(fā)芽,施藥后害蟲死或活等等。貝努利試驗的概率公式
在貝努利試驗中,事件A可能發(fā)生,也可能不發(fā)生,用隨機變量x表示貝努利試驗的兩種結(jié)果,記A發(fā)生時取1,A不發(fā)生時取0。那么,貝努利試驗的概率公式可以表示為:P(x=1)=pP(x=0)=q其中x=1,A事件發(fā)生,成功0,A事件未發(fā)生,失敗也稱為兩點分布(3-6)在n重貝努利試驗中,事件A可能發(fā)生0,1,2,…,n次,現(xiàn)在我們來求事件A
恰好發(fā)生k(0≤k≤n)次的概率Pn(k)。事件A在n次試驗中正好發(fā)生k次共有種情況。由貝努利試驗的獨立性可知,A在k次實驗中發(fā)生,而在其余n-k次試驗中不發(fā)生的概率為下一張
主頁
退出
上一張
3.1.2二項分布的定義及其特點
一般,在n重貝努利試驗中,事件A恰好發(fā)生k(0≤k≤n)次的概率為下一張
主頁
退出
上一張
k=0,1,2…,n(3-7)若把(3-7)式與二項展開式相比較就可以發(fā)現(xiàn),在n重貝努利試驗中,事件A發(fā)生k次的概率恰好等于展開式中的第k+1項,所以也把(3-7)式稱作二項概率公式。1.二項分布定義
設(shè)隨機變量x所有可能取的值為零和正整數(shù):0,1,2,…,n,且有
=k=0,1,2…,n
其中p>0,q>0,p+q=1,則稱隨機變量x服從參數(shù)為n和p的二項分布
(binomialdistribution),記為
x~B(n,p)。下一張
主頁
退出
上一張
二項分布是一種離散型隨機變量的概率分布。參數(shù)n稱為離散參數(shù),只能取正整數(shù);p是連續(xù)參數(shù),它能取0與1之間的任何數(shù)值(q由p確定,故不是另一個獨立參數(shù))。下一張
主頁
退出
上一張
(3-10)(5)(3)(4)(3-8)(3-9)(m1<m2)2.二項分布的特點具有概率分布的一切性質(zhì),即:(1)P(x=k)=Pn(k)≥0(k=0,1,…,n)
(2)二項分布的概率之和等于1,即圖3-1n值不同的二項分布比較
(2)當p值趨于0.5時,分布趨于對稱,如圖所示;(3)對于固定的n及p,當k增加時,Pn(k)先隨之增加并達到其極大值,以后又下降。(4)在n較大,np、nq較接近時,二項分布接近于正態(tài)分布;當n→∞時,二項分布的極限分布是正態(tài)分布。下一張
主頁
退出
上一張
二項分布由n和p兩個參數(shù)決定,其特點是:(1)當p值較小且n不大時,分布是偏倚的。但隨著n的增大,分布逐漸趨于對稱,如圖所示;圖3-2p值不同的二項分布比較3.1.3二項分布的概率計算及應(yīng)用條件(1)已知隨機變量x~
B(n,p),求x正好有k次發(fā)生的概率?!纠齪43】有一批食品,其合格率為0.85,今在該批食品中隨機抽取6份該食品,求正好有5份食品合格的概率?由題意可知,食品抽檢結(jié)果有兩種可能,合格與不合格,合格率為0.85,即P(A)=0.85,相應(yīng)不合格率為P()=1-0.85=0.15,由概率公式得,正好有5個合格產(chǎn)品的概率為:下一張
主頁
退出
上一張
(2)已知隨機變量x~
B(n,p),求x最多發(fā)生k次的概率。例:同上例,問最多有4個合格的概率是多少?當產(chǎn)品最多有k個合格時,即可能的合格數(shù)為0,1,2,…,k,那么為最多有k個合格產(chǎn)品的概率。在本例中,下一張
主頁
退出
上一張
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2030年中國大型振動試驗機行業(yè)市場分析報告
- 2024-2030年中國即時通訊(im)行業(yè)競爭格局及投資創(chuàng)新模式分析報告
- 眉山職業(yè)技術(shù)學院《電子商務(wù)概論》2023-2024學年第一學期期末試卷
- 2024年度食品代加工與產(chǎn)品質(zhì)量追溯協(xié)議3篇
- 2024年標準化物業(yè)租賃協(xié)議模板匯編版B版
- 2024年物聯(lián)網(wǎng)農(nóng)業(yè)技術(shù)開發(fā)與合作合同
- 2024年標準股權(quán)轉(zhuǎn)讓協(xié)議一
- 馬鞍山師范高等??茖W?!冬F(xiàn)場節(jié)目主持實踐》2023-2024學年第一學期期末試卷
- 2024年城市綜合體土地房屋股權(quán)轉(zhuǎn)讓與建設(shè)合同范本3篇
- 2024年度特色民宿商品房承包銷售合同3篇
- 三年級上冊英語教案-Module 8 Unit 2 Wheres the cat 外研三起
- YY/T 0471.4-2004接觸性創(chuàng)面敷料試驗方法 第4部分:舒適性
- YY/T 0251-1997微量青霉素試驗方法
- YC/T 559-2018煙草特征性成分生物堿的測定氣相色譜-質(zhì)譜聯(lián)用法和氣相色譜-串聯(lián)質(zhì)譜法
- GB/T 29309-2012電工電子產(chǎn)品加速應(yīng)力試驗規(guī)程高加速壽命試驗導(dǎo)則
- 齊魯工業(yè)大學信息管理學成考復(fù)習資料
- 公務(wù)員面試-自我認知與職位匹配課件
- 中頻電治療儀操作培訓課件
- 柔弱的人課文課件
- 動物寄生蟲病學課件
- 電梯曳引系統(tǒng)設(shè)計-畢業(yè)設(shè)計
評論
0/150
提交評論