GB/T 3358.1-2009統(tǒng)計(jì)學(xué)詞匯及符號第1部分:一般統(tǒng)計(jì)術(shù)語與用于概率的術(shù)語_第1頁
GB/T 3358.1-2009統(tǒng)計(jì)學(xué)詞匯及符號第1部分:一般統(tǒng)計(jì)術(shù)語與用于概率的術(shù)語_第2頁
GB/T 3358.1-2009統(tǒng)計(jì)學(xué)詞匯及符號第1部分:一般統(tǒng)計(jì)術(shù)語與用于概率的術(shù)語_第3頁
GB/T 3358.1-2009統(tǒng)計(jì)學(xué)詞匯及符號第1部分:一般統(tǒng)計(jì)術(shù)語與用于概率的術(shù)語_第4頁
GB/T 3358.1-2009統(tǒng)計(jì)學(xué)詞匯及符號第1部分:一般統(tǒng)計(jì)術(shù)語與用于概率的術(shù)語_第5頁
已閱讀5頁,還剩107頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

代替GB/T3358.1-1993統(tǒng)計(jì)學(xué)詞匯及符號一般統(tǒng)計(jì)術(shù)語與用于概率的術(shù)語2009-10-15發(fā)布中華人民共和國國家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局發(fā)布IGB/T3358.1—2009/ISO3534-1:2006前言 范圍 1一般統(tǒng)計(jì)術(shù)語 12用于概率的術(shù)語 附錄A(資料性附錄)符號 附錄B(資料性附錄)統(tǒng)計(jì)概念圖 附錄C(資料性附錄)概率概念圖 41附錄D(資料性附錄)定義標(biāo)準(zhǔn)中的術(shù)語所使用的方法 參考文獻(xiàn) 48索引 漢語拼音索引 49英文對應(yīng)詞索引 ⅢGB/T3358《統(tǒng)計(jì)學(xué)詞匯及符號》分為以下部分:--第1部分:一般統(tǒng)計(jì)術(shù)語與用于概率的術(shù)語;-—第2部分:應(yīng)用統(tǒng)計(jì);——第3部分:實(shí)驗(yàn)設(shè)計(jì)。本部分為GB/T3358的第1部分,等同采用ISO3534-1:2006《統(tǒng)計(jì)學(xué)詞匯及符號第1部分:一般統(tǒng)計(jì)術(shù)語與用于概率的術(shù)語》。與ISO3534-1:2006相比,訂正了原文的錯誤,修正原文中概念表——刪去了1.24原文中的注1;——2.38示例中變異系數(shù)的計(jì)算式“0.99/0.995=0.99497”更正為“0.995/0.9=1.10556”;為便于使用,本部分作了下列編輯性修改:——刪去了ISO前言;——為術(shù)語的簡練起見,在少數(shù)術(shù)語中,使用中括號表示其中可省略部分。例如:2.5中,[事件A的]概率(probability[ofancventA]),表示此術(shù)語實(shí)際定義的是“概率(probability)”,其中“事件A的”在許多場合可省略。又如2.34“r階[原點(diǎn)]矩(momentoforderr)”表示原文的“γ階矩(momentoforderr)”也稱為“r階原點(diǎn)矩”。本部分代替GB/T3358.1—1993《統(tǒng)計(jì)學(xué)術(shù)語第一部分一般統(tǒng)計(jì)術(shù)語》,與GB/T3358.1-- 對術(shù)語條目作了較大的調(diào)整;增加了一般統(tǒng)計(jì)術(shù)語及用于概率的術(shù)語;將GB/T3358.1-1993中第4章“觀測和測試結(jié)果的一般術(shù)語”及第5章“抽樣方法的一般術(shù)語”中的內(nèi)容移至GB/T3358的第2部分;——增加了大量的示例及注釋; 增加了術(shù)語概念圖(附錄B、附錄C)及定義標(biāo)準(zhǔn)中的術(shù)語所使用的方法的附錄D,并將關(guān)于符號的附錄A改為資料性附錄。本部分由全國統(tǒng)計(jì)方法應(yīng)用標(biāo)準(zhǔn)化技術(shù)委員會提出并歸口。本部分于1993年首次發(fā)布,本次為第一次修訂。目前版本的GB/T3358.1和GB/T3358.2是兼容的,其共同目標(biāo)是在一致、準(zhǔn)確而簡潔的前提下,將定義所需的數(shù)學(xué)程度限制在最低水平。由于GB/T3358.1是概率和統(tǒng)計(jì)的基礎(chǔ)術(shù)語,所以有必要用相對嚴(yán)格而復(fù)雜的數(shù)學(xué)語言來表述。考慮到GB/T3358.2及其他統(tǒng)計(jì)方法應(yīng)用標(biāo)準(zhǔn)的使用者有時需要查詢GB/T3358.1中術(shù)語的定義,因此本部分的術(shù)語盡可能用通俗的方式來描述,并輔以注釋及示例。盡管這些非正式的描述并不能取代正式的定義,但為統(tǒng)計(jì)專業(yè)以外的人員提供了有效的概念性的定義,能滿足這些術(shù)語標(biāo)準(zhǔn)的大多數(shù)用戶的需要。為了進(jìn)一步適應(yīng)經(jīng)常使用GB/T3358.2或GB/T6379等標(biāo)準(zhǔn)的用戶,通過注釋和示例使GB/T3358.1更易于理解。一套明確定義的,且相對完整的概率統(tǒng)計(jì)術(shù)語對統(tǒng)計(jì)標(biāo)準(zhǔn)的編制及有效使用是必需的。定義必須足夠準(zhǔn)確、且具備數(shù)學(xué)意義上的嚴(yán)格性,使在編制其他統(tǒng)計(jì)標(biāo)準(zhǔn)時避免出現(xiàn)概念模糊。當(dāng)然,對概念的更詳細(xì)的解釋、背景和應(yīng)用領(lǐng)域可在初等概率統(tǒng)計(jì)教材中找到。資料性附錄B與附錄C分別為一般統(tǒng)計(jì)術(shù)語與用于概率的術(shù)語提供了系列概念框圖。其中一般統(tǒng)計(jì)術(shù)語包含六個概念圖;用于概率的術(shù)語包含四個概念圖。某些術(shù)語同時出現(xiàn)在幾個不同的框圖中,從而起到一組概念與另一組概念的聯(lián)系作用。附錄D提供了關(guān)于概念圖的簡要介紹及其解釋。這些框圖有助于本次修訂,因?yàn)樗鼈冇兄诿枋霾煌g(shù)語之間的相互聯(lián)系。這些框圖也有助于標(biāo)準(zhǔn)文本的翻譯。除非另有說明,本標(biāo)準(zhǔn)中大部分術(shù)語均在一維(單變量)場合下定義。這避免了許多術(shù)語在類似條件下進(jìn)行重復(fù)定義。1統(tǒng)計(jì)學(xué)詞匯及符號用于概率的術(shù)語GB/T3358的本部分規(guī)定了用于標(biāo)準(zhǔn)起草的一般統(tǒng)計(jì)術(shù)語、用于概率的術(shù)語的定義及部分術(shù)語的本部分中的術(shù)語分為:a)一般統(tǒng)計(jì)術(shù)語(第1章);b)用于概率的術(shù)語(第2章)。附錄A列出了本部分推薦使用的符號。附錄B和附錄C是本部分所有術(shù)語條目的概念框圖。1一般統(tǒng)計(jì)術(shù)語所考慮對象的全體。注1:總體可是真實(shí)有限或無限的,也可是完全虛構(gòu)的。有時,特別是在調(diào)查抽樣中也使用“有限總體”;在一些流注2:對于虛構(gòu)的總體,允許人們想象在不同假定條件下的數(shù)據(jù)所具有的屬性。因此,虛構(gòu)總體在統(tǒng)計(jì)研究的設(shè)計(jì)階段,特別是確定適宜樣本量時非常有用。虛構(gòu)總體所含對象數(shù)目可以是有限的也可以是無限的。在統(tǒng)計(jì)推斷中,這是一個對評價(jià)統(tǒng)計(jì)研究證據(jù)強(qiáng)度特別有用的概念。注3:下面的例子能幫助理解總體這一概念:若有三個村莊被選中作人口統(tǒng)計(jì)或健康研究,總體即由這三個村莊的全體居民構(gòu)成;若這三個村莊是從某個特定區(qū)域中的所有村莊中隨機(jī)抽選出來的,則總體由該區(qū)域中的所有居民構(gòu)成。抽樣單元samplingunit總體(1.1)劃分成若干部分中的每一部分。由一個或者多個抽樣單元(1.2)組成的總體(1.1)的子集。注1:根據(jù)所研究總體的情況,樣本中的每個單元可是真實(shí)或抽象的個體,也可是具體的數(shù)值。注2:在GB/T3358.2關(guān)于樣本的定義中,包括一個抽樣框的示例。抽樣框在從有限總體中抽取隨機(jī)樣本時是必須的。由樣本(1.3)中每個單元獲得的相關(guān)特性的值。2注2:本定義并沒有指明值的來源或如何被獲得。觀測值可表示某隨機(jī)變量(2.10)的一次實(shí)現(xiàn),但并不一定如此。它可以是相繼用于統(tǒng)計(jì)分析的若干值中的一個。正確的推斷需要一定的統(tǒng)計(jì)假定,但首先要做的是對觀測值的計(jì)算概括或圖形描述。僅當(dāng)需要解決進(jìn)一步的問題,如確定觀測值落人某一指定集合的概率,統(tǒng)計(jì)機(jī)制才是重要而本質(zhì)的。觀測值分析的初始階段通常稱為數(shù)據(jù)分析。描述性統(tǒng)計(jì)量descriptivestatistics觀測值(1.4)的圖形、數(shù)值或其他概括性描述。示例1:數(shù)值描述包括樣本均值(1.15)、樣本極差(1.10)、樣本標(biāo)準(zhǔn)差(1.17)等。示例2:圖形描述包括箱線圖、示意圖、Q-Q圖、正態(tài)分位圖、散隨機(jī)樣本randomsample由隨機(jī)抽取的方法獲得的樣本(1.3)。注1:本定義比GB/T3358.2給出的定義限制要少,樣本允許來自無限總體。注2:當(dāng)從有限樣本空間(2.1)中抽取n個抽樣單元組成樣本時,n個抽樣單元的任意一種組合都會以特定的概率(2.5)被抽中。對于調(diào)查抽樣方案而言,每一種可能組合被抽中的概率可事先計(jì)算。注3:對有限樣本空間的調(diào)查抽樣,隨機(jī)樣本可以通過不同的抽樣方法得到,如分層隨機(jī)抽樣、隨機(jī)起點(diǎn)的系統(tǒng)抽樣、整群抽樣、與輔助變量的大小成比例的概率抽樣以及其他可能的抽樣。注4:本定義一般是指實(shí)際觀測值(1.4)。這些觀測值被認(rèn)為是隨機(jī)變量(2.10)的實(shí)現(xiàn),其中每個觀測值都對應(yīng)于一個隨機(jī)變量。當(dāng)由隨機(jī)樣本構(gòu)造估計(jì)量(1.12)、統(tǒng)計(jì)檢驗(yàn)(1.48)的檢驗(yàn)統(tǒng)計(jì)量或置信區(qū)間(1.28)時,本定義是指從樣本中的抽象個體得到的隨機(jī)變量而不是這些隨機(jī)變量的實(shí)際觀測值。注5:無限總體中的隨機(jī)樣本一般是從樣本空間中重復(fù)抽取產(chǎn)生的。根據(jù)注4的解釋,此時樣本由獨(dú)立同分布的隨機(jī)變量組成。簡單隨機(jī)樣本simplerandomsample〈有限總體>給定樣本量的每個子集都有相等的被抽選概率的隨機(jī)樣本(1.6)。注:此處的定義與GB/T3358.2中的定義是一致的,僅在措辭上稍有不同。由隨機(jī)變量(2.10)完全確定的函數(shù)。注1:在1.6注4的意義下,統(tǒng)計(jì)量是隨機(jī)樣本(1.6)中隨機(jī)變量的函數(shù)。注2:按注1,若(X?,X?,…,X.》是來自未知均值(2.35)μ和未知標(biāo)準(zhǔn)差(2.37)o的正態(tài)分布(2.50)的隨機(jī)樣本,則樣本均值(1.15)(X?+X?+…+X,)/n是一個統(tǒng)計(jì)量;而[(X?+X?+…+X,)/n]-μ不是統(tǒng)計(jì)量,因?yàn)樗宋粗獏?shù)(2.9)p。注3:相應(yīng)于數(shù)理統(tǒng)計(jì)中的表述,此處給出的是統(tǒng)計(jì)量的一種技術(shù)性定義。英語中,統(tǒng)計(jì)量(statistic)的復(fù)數(shù)形式就是統(tǒng)計(jì)學(xué)(statistics),它是一門包括了統(tǒng)計(jì)方法應(yīng)用標(biāo)準(zhǔn)中所敘述的分析方法的技術(shù)學(xué)科。次序統(tǒng)計(jì)量orderstatistic由隨機(jī)樣本(1.6)中的隨機(jī)變量(2.10)的值,依非降次序排列所確定的統(tǒng)計(jì)量(1.8)。示例:假設(shè)樣本觀測值為9,13,7,6,13,7,19,6,10,7,則次序統(tǒng)計(jì)量的觀測值為:6,6,7,7,7,9,10,13,13,19。這些值是Xa),…,X(ao)的一次實(shí)現(xiàn)。注1:假設(shè)隨機(jī)樣本(1.6)的觀測值(1.4)為《x?,x?,…,x,},按非降的次序排列為xu≤…≤x?≤…≤x,則(xu),…,Zuy,…,Z()是次序統(tǒng)計(jì)量(Xu),…,Xa,…,X(w)的觀測值,xa。為第k個次序統(tǒng)計(jì)量的觀測值。注2:在實(shí)際應(yīng)用中,為獲得一組數(shù)據(jù)的次序統(tǒng)計(jì)量,即是將數(shù)據(jù)按照注1中所述方式進(jìn)行排序。將一組數(shù)據(jù)按上述方法排序后,還可獲得其他幾個術(shù)語定義的有用的統(tǒng)計(jì)量,如1.10、1.11等。注3:次序統(tǒng)計(jì)量涉及按照非降次序排列后的位置來識別的樣本值。正如示例所示,將樣本值(隨機(jī)變量的實(shí)現(xiàn))排序比將未觀測的隨機(jī)變量排序更容易理解。它可以通過按照非降次序排列的隨機(jī)樣本(1.6)來理解隨機(jī)變3量。比如,n個隨機(jī)變量的最大值可以先于它的實(shí)現(xiàn)值來研究。注4:單個次序統(tǒng)計(jì)量是隨機(jī)變量的一個特定函數(shù)。這個函數(shù)可以簡單地由其在隨機(jī)變量排序集合中的位置或序次(稱為秩)來確定。注6:排序按照隨機(jī)變量的實(shí)數(shù)值進(jìn)行,而不是按照其絕對值進(jìn)行。注7:次序統(tǒng)計(jì)量(Xu,…,Xa,…,X()組成n維隨機(jī)變量,n是樣本中觀測值的個數(shù)。注8:次序統(tǒng)計(jì)量的分量也是次序統(tǒng)計(jì)量,而且保持其在原樣本排序中的位置標(biāo)識。注9:最小值,最大值以及樣本量為奇數(shù)時的樣本中位數(shù)(1.13)都是特殊的次序統(tǒng)計(jì)量。比如樣本量為11,那么最大次序統(tǒng)計(jì)量(1.9)與最小次序統(tǒng)計(jì)量的差。示例:在1.9中的示例中,樣本極差的觀測值為19-6=13。注:在統(tǒng)計(jì)過程控制中,尤其當(dāng)樣本量相對比較小時,樣本極差通常用來監(jiān)測過程的離散程度隨時間的變化。最大和最小次序統(tǒng)計(jì)量(1.9)的平均值(1.15)。示例:1.9的示例中,中程數(shù)的觀測值為(6+19)/2=12.5。注:中程數(shù)能夠?qū)^小數(shù)據(jù)集的中心提供一種快捷而簡單的估計(jì)。δ用于對參數(shù)0估計(jì)(1.36)的統(tǒng)計(jì)量(1.8)。注1:樣本均值(1.15)是總體均值(2.35)μ的一個估計(jì)量。例如,對于正態(tài)分布(2.50),樣本均值是總體均值μ的估計(jì)量。注2:要估計(jì)總體的特征(如一維(元)分布(2.16)的眾數(shù)(2.27)),一個合適的估計(jì)量可以是分布參數(shù)估計(jì)量的函注3:此處所講的“估計(jì)量”是一個寬泛的概念。它包括某參數(shù)的點(diǎn)估計(jì),也包括用于預(yù)測的區(qū)間估計(jì)。估計(jì)量也包括該估計(jì)量和其他特殊形式的統(tǒng)計(jì)量。另見1.36注的討論。樣本中位數(shù)samplemedian若樣本量(見GB/T3358.2—2009,1.2.26)n為奇數(shù),則是第(n+1)/2個次序統(tǒng)計(jì)量(1.9);若樣本量n是偶數(shù),則是第n/2與第(n/2)+1個次序統(tǒng)計(jì)量之和除以2。示例:續(xù)1.9的示例,8為樣本中位數(shù)的一個實(shí)現(xiàn),此時樣本量為10(偶數(shù)),第5和第6個次序統(tǒng)計(jì)量分別為7和9,其平均值為8。盡管嚴(yán)格來說樣本中位數(shù)是作為一個隨機(jī)變量來定義的,但在實(shí)際中也說“樣本中位數(shù)為8”。注1:對于樣本量為n的隨機(jī)樣本(1.6),其隨機(jī)變量(2.10)按照非降順序從1到n排列,如果樣本量為奇數(shù),則樣本中位數(shù)為第(n+1)/2個隨機(jī)變量,如果樣本量為偶數(shù),則樣本中位數(shù)為第(n/2)個與第(n+1)/2個隨機(jī)注2:從概念上講,對一個沒有觀測到的隨機(jī)變量進(jìn)行排序似乎是不可能的。但不經(jīng)觀測也可理解次序統(tǒng)計(jì)量的結(jié)構(gòu)。在實(shí)際中,通過獲得觀測值并對其進(jìn)行排序,從而得到次序統(tǒng)計(jì)量的實(shí)現(xiàn)。這些實(shí)現(xiàn)值可用于解釋次序注3:樣本中位數(shù)是分布中間位置的一個估計(jì),各有一半的樣本單元大于等于或小于等于它。注4:樣本中位數(shù)在實(shí)際問題中是有用的,它提供了一個對數(shù)據(jù)極端值不敏感的估計(jì)量。例如,中位收入和中位房價(jià)都是常用的統(tǒng)計(jì)指標(biāo)。4GB/T3358.1—2009/ISO隨機(jī)樣本(1.6)中隨機(jī)變量(2.10)的k次冪的和除以和中的項(xiàng)數(shù)。注1:對于樣本量為n的隨機(jī)樣本《X?,X?,…,X。},k階樣本矩為:注2:本術(shù)語也稱為k階樣本原點(diǎn)矩。注3:一階樣本矩即為樣本均值(1.15)。注4:雖然本定義中k可取任意值,但在實(shí)際中常用的是k=1[樣本均值(1.15)],k=2[與樣本方差(1.16)和樣本標(biāo)準(zhǔn)差(1.17)有關(guān)],k=3[與樣本偏度系數(shù)(1.20)有關(guān)]和k=4[與樣本峰度系數(shù)(1.21)有關(guān)]的情形。樣本均值samplemean平均數(shù)average隨機(jī)樣本(1.6)中隨機(jī)變量(2.10)的和除以和中的項(xiàng)數(shù)。示例:續(xù)1.9中的示例,觀測值的和為97,樣本量為10,樣本均值的實(shí)現(xiàn)為9.7。注1:在1.8中注3的意義下,樣本均值作為統(tǒng)計(jì)量是隨機(jī)樣本中隨機(jī)變量的函數(shù)。必須區(qū)分統(tǒng)計(jì)量與由隨機(jī)樣本中觀測值(1.4)計(jì)算得出的樣本均值的數(shù)值。注2:樣本均值作為統(tǒng)計(jì)量,常用作總體均值(2.35)的估計(jì)量。算術(shù)平均值是它的同義詞。注3:對樣本量為n的隨機(jī)樣本{X?,X?,…,X,},樣本均值為:注4:樣本均值就是一階樣本矩。注5:樣本量為2時,樣本均值、樣本中位數(shù)(1.13)和中程數(shù)(1.11)皆相同。S2隨機(jī)樣本(1.6)中隨機(jī)變量(2.10)與樣本均值(1.15)差的平方和用和中項(xiàng)數(shù)減1除。示例:續(xù)1.9中的示例,樣本觀測值與樣本均值差的平方和為158.10,樣本量10減1為9,計(jì)算得樣本方差為注1:樣本方差S2作為統(tǒng)計(jì)量(1.8),是隨機(jī)樣本中隨機(jī)變量的函數(shù)。必須區(qū)分這個統(tǒng)計(jì)量與根據(jù)隨機(jī)樣本觀測值(1.4)計(jì)算得出的樣本方差的數(shù)值,該值稱為經(jīng)驗(yàn)樣本方差或觀測樣本方差,通常記作s2。注2:對樣本量為n的隨機(jī)樣本{X?,X?,…,X,},樣本均值為X,則注3:樣本方差作為一個統(tǒng)計(jì)量“差不多”等于該隨機(jī)變量(2.10)與樣本均值(1.15)差的平方的平均數(shù)(其中“差不多”是指這里平均用n-1而不是用n作分母),用n-1作分母是為總體方差(2.36)提供一個無偏估計(jì)量注4:n-1稱為自由度(2.54)。注5:樣本方差可以近似認(rèn)為是中心化樣本隨機(jī)變量(2.31)的二階樣本矩(僅以n-1代替n)。S樣本方差(1.16)的非負(fù)平方根。示例:續(xù)1.9中的示例,觀測樣本方差為17.57,觀測樣本標(biāo)準(zhǔn)差為4.192。注1:實(shí)際中樣本標(biāo)準(zhǔn)差用來估計(jì)總體標(biāo)準(zhǔn)差(2.37)。再次強(qiáng)調(diào)S也是一個隨機(jī)變量(2.10),而并不是隨機(jī)樣本(1.6)的實(shí)現(xiàn)。注2:樣本標(biāo)準(zhǔn)差是分布(2.11)離散程度的一個度量。5GB/T3358.1—2009/ISO3534-1:2006樣本變異系數(shù)samplecoefficientofvariation樣本標(biāo)準(zhǔn)差(1.17)除以非零樣本均值(1.15)的絕對值。注:變異系數(shù)通常表示成百分?jǐn)?shù)。標(biāo)準(zhǔn)化樣本隨機(jī)變量standardizedsamplerandomvariable隨機(jī)變量(2.10)與其樣本均值(1.15)的差除以樣本標(biāo)準(zhǔn)差(1.17)。示例:續(xù)1.9中的示例,觀測樣本均值為9.7,觀測樣本標(biāo)準(zhǔn)差為4.192,觀測標(biāo)準(zhǔn)化隨機(jī)變量(表示為兩位小數(shù))為:一0.17;0.79;-0.64;一0.88;0.79;一0.64;2.22,-0.88;0.07;-0.62。注1:標(biāo)準(zhǔn)化樣本隨機(jī)變量應(yīng)區(qū)別于理論上的標(biāo)準(zhǔn)化隨機(jī)變量(2.33)。將隨機(jī)變量標(biāo)準(zhǔn)化的目的在于使得其均值為0、標(biāo)準(zhǔn)差為1,便于解釋和比較。注2:標(biāo)準(zhǔn)化樣本觀測值的觀測樣本均值為0,觀測樣本標(biāo)準(zhǔn)差為1。樣本偏度系數(shù)samplecoefficientofskewness隨機(jī)樣本(1.6)的標(biāo)準(zhǔn)化樣本隨機(jī)變量(1.19)三次冪的算術(shù)平均值。示例:續(xù)1.9中的示例,觀測樣本偏度系數(shù)的計(jì)算結(jié)果為0.97188。如本例中的樣本量為10的情形,樣本偏度系數(shù)不夠穩(wěn)定,因此應(yīng)謹(jǐn)慎使用。根據(jù)注1給出的另一公式計(jì)算出的值為1.34983。注1:對應(yīng)于定義中公式為:有些統(tǒng)計(jì)軟件里使用下面的公式修正樣本偏度系數(shù)的偏倚(1.33):其中:當(dāng)樣本量很大時,兩個公式的差別可以忽略。當(dāng)n=10,100,1000時,修偏估計(jì)值與定義中的估計(jì)值之比分別為1.389,1.031,1.003。注2:偏度系數(shù)是對分布不對稱性的度量,如果偏度系數(shù)接近0意味著真實(shí)分布近似對稱。偏度系數(shù)不為零時意味著在某一側(cè)尾部可能有極端值。有偏的數(shù)據(jù)也會在樣本均值(1.15)與樣本中位數(shù)(1.13)的差異上體現(xiàn)出來。正偏(右偏)數(shù)據(jù)表明可能有少數(shù)大的極端值。同樣,負(fù)偏(左偏)數(shù)據(jù)表明可能有少數(shù)小的極端值。注3:樣本偏度系數(shù)也是標(biāo)準(zhǔn)化樣本隨機(jī)變量(1.19)的三階樣本矩。樣本峰度系數(shù)samplecoefficientofkurtosis隨機(jī)樣本(1.6)的標(biāo)準(zhǔn)化樣本隨機(jī)變量(1.19)四次冪的算術(shù)平均值。示例:續(xù)1.9中的示例,觀測樣本峰度系數(shù)的計(jì)算結(jié)果為2.67419。如本例中的樣本量為10的情形,樣本峰度系數(shù)極不穩(wěn)定,因此應(yīng)謹(jǐn)慎使用。統(tǒng)計(jì)軟件包在計(jì)算樣本峰度系數(shù)時常進(jìn)行了各種修正(參見2.40中的注3)。應(yīng)用注1中的另一公式計(jì)算的值為0.43605。不能直接比較2.67419和0.43605這兩個數(shù)值。為此,應(yīng)將2.67419減去3(正態(tài)分布的峰度系數(shù)為3),其差為一0.32581,這個數(shù)值可與0.43605進(jìn)行比較。注1:與定義對應(yīng)的公式是:一些統(tǒng)計(jì)軟件包使用下面公式來修正樣本峰度系數(shù)的偏倚(1.33),它表示對正態(tài)分布峰度系數(shù)(等于3)的偏離:6其中:當(dāng)n充分大時,上式第二項(xiàng)近似為3。有時為了強(qiáng)調(diào)與正態(tài)分布的比較,峰度表示為如2.40中定義的值減去3。顯然,實(shí)際應(yīng)用者需要注意到統(tǒng)計(jì)軟件包中是否包含任何修正。注2:峰度描述了(單峰)分布的重尾程度。對正態(tài)分布(2.50),由于抽樣隨機(jī)性,樣本峰度系數(shù)一般只近似,而不是恰好為3。在實(shí)際應(yīng)用中正態(tài)的峰度提供了一個基準(zhǔn)值:峰度值小于3的分布(2.11)有比正態(tài)輕的尾部;峰度值大于3的分布有比正態(tài)重的尾部。注3:對于峰度觀測值大于3很多的情形,一種可能是因?yàn)檎鎸?shí)分布的尾部比正態(tài)尾部重,另一可能是分布中存在潛在的離群值。注4:樣本峰度系數(shù)可認(rèn)為是標(biāo)準(zhǔn)化隨機(jī)變量的四階樣本矩。隨機(jī)樣本(1.6)中兩個隨機(jī)變量(2.10)對各自樣本均值(1.15)的離差的乘積之和被求和項(xiàng)數(shù)減示例1:考慮下列三個變量的10組觀測值。在這個示例中,只考慮x和y。表1示例1的觀測結(jié)果i123456789ZyzX的觀測樣本均值是46.1,Y的觀測樣本均值是75.4,X與Y的樣本協(xié)方差等于,示例2:在上例的表中,考慮y和z,Z的觀測樣本均值是31.3,Y與Z的樣本協(xié)方差等于,=-54.356注1:作為統(tǒng)計(jì)量(1.8),樣本協(xié)方差是樣本量為n的隨機(jī)變量對:(X?,Y?),(X?,Y?),…,(X,,Y)義下的函數(shù)。這個統(tǒng)計(jì)量需要與隨機(jī)樣本中由抽樣單元(1.2)(x?,y?),(x?,y?),…,(x,,y)得到樣本協(xié)方差的數(shù)值相區(qū)別。后者稱為經(jīng)驗(yàn)樣本協(xié)方差或觀測樣本協(xié)方差。注2:樣本協(xié)方差Sxy由下式給出:在(1.6)注3意的觀測值計(jì)算注3:用n-1除是為總體協(xié)方差(2.43)提供一個無偏估計(jì)量(1.34)。注4:表1的示例包含3個變量,而協(xié)方差定義中只涉及2個變量。在實(shí)際應(yīng)用中經(jīng)常會遇到多個變量的情況。樣本相關(guān)系數(shù)samplecorrelationcoefficientrzy樣本協(xié)方差(1.22)用相應(yīng)樣本標(biāo)準(zhǔn)差(1.17)的乘積來除。示例1:續(xù)1.22中的示例1。X的觀測標(biāo)準(zhǔn)差為12.945,Y的觀測標(biāo)準(zhǔn)差為21.329。從而X和Y的觀測樣本相關(guān)系數(shù)為:示例2:繼續(xù)1.22的示例2,Y的觀測標(biāo)準(zhǔn)差為21.329,Z的觀測標(biāo)準(zhǔn)差為4.165。從而Y和Z的觀測樣本相關(guān)系數(shù)為:7注1:樣本相關(guān)系數(shù)的計(jì)算公式如下:這個表達(dá)式等價(jià)于樣本協(xié)方差與兩方差乘積的平方根的比。有時用r。表示樣本相關(guān)系數(shù)。觀測樣本相關(guān)系數(shù)是基于實(shí)現(xiàn)值(x?,y?),(x?,y?),…,(x.,y.)的。注2:觀測樣本相關(guān)系數(shù)取值在[-1,1]之間。取值接近于1表示強(qiáng)的正相關(guān);取值接近于一1表示強(qiáng)的負(fù)相關(guān)。取值接近于1或-1表明數(shù)據(jù)點(diǎn)近似在一條直線上。標(biāo)準(zhǔn)誤差standarderror估計(jì)量(1.12)à的標(biāo)準(zhǔn)差(2.37)。示例:如果以樣本均值(1.15)作為總體均值(2.35)的一個估計(jì),且隨機(jī)變量(2.10)的標(biāo)準(zhǔn)差為σ,則樣本均值的標(biāo)準(zhǔn)誤差為σ/√π,其中n是樣本中觀測值的個數(shù)。標(biāo)準(zhǔn)誤差的一個估計(jì)是S/√π,其中S是樣本標(biāo)準(zhǔn)差(1.17)。注:不存在反義詞“非標(biāo)準(zhǔn)”誤差。通常在應(yīng)用中,標(biāo)準(zhǔn)誤差特指樣本均值的標(biāo)準(zhǔn)差,記為σx,此時也常簡稱為“標(biāo)由一個上限統(tǒng)計(jì)量和一個下限統(tǒng)計(jì)量(1.8)所界定的區(qū)間。注1:區(qū)間的一個端點(diǎn)可以是+驚,-m或是參數(shù)值的一個自然界限。如“0”是總體方差(2.36)區(qū)間估計(jì)的一個自然下限。在此情形,區(qū)間稱為是單側(cè)的。注2:區(qū)間估計(jì)可結(jié)合參數(shù)(2.9)估計(jì)(1.36)給出。區(qū)間估計(jì)通常是以假定在重復(fù)抽樣下,區(qū)間包含所估計(jì)的參數(shù)確定比例或其他某種概率意義下給出的。注3:區(qū)間估計(jì)通常有三種:參數(shù)的置信區(qū)間(1.28),對未來觀測的預(yù)測區(qū)間(1.30)和分布(2.11)被包含一個確定比例的統(tǒng)計(jì)容忍區(qū)間(1.26)。在規(guī)定置信水平下,由隨機(jī)樣本(1.6)確定的至少覆蓋抽樣總體(1.1)的指定比例的區(qū)間。注:這里“置信”一詞是指在大量重復(fù)意義下,所構(gòu)造區(qū)間應(yīng)至少包含抽樣總體的指定比例。統(tǒng)計(jì)容忍限statisticaltolerancelimit表示統(tǒng)計(jì)容忍區(qū)間(1.26)端點(diǎn)的統(tǒng)計(jì)量(1.8)。注:統(tǒng)計(jì)容忍限可為以下兩種情況的一種: 單側(cè)容忍限,即單側(cè)的統(tǒng)計(jì)容忍上限或單側(cè)的統(tǒng)計(jì)容忍下限,此時另一個容忍限為隨機(jī)變量的自然界限——雙側(cè)容忍限,此時有兩個統(tǒng)計(jì)容忍限,置信區(qū)間confidenceinterval參數(shù)(2.9)0的區(qū)間估計(jì)(1.25)(T。,T?),其中作為區(qū)間限的統(tǒng)計(jì)量(1.8)T。,T?,滿足P[T。<注1:置信度反映了在同一條件下大量重復(fù)隨機(jī)抽樣(1.6)中,置信區(qū)間包含參數(shù)真值的比例。置信區(qū)間并不能反映觀測到的區(qū)間包含參數(shù)真值的概率(2.5)(觀測到的區(qū)間只能是要么包含要么不包含參數(shù)真值)。注2:一個與置信區(qū)間相關(guān)的量是100(1-a)%,稱為置信系數(shù)或置信水平,其中α是一個小的數(shù)。對任意確定但置信系數(shù)通常取為95%或99%。8其中一個端點(diǎn)固定為+騖,-0或某個自然確定邊界的置信區(qū)間(1.28)。注1:這是將定義1.28應(yīng)用在To=-或T?=+時的情形。單側(cè)置信區(qū)間出現(xiàn)在只對一個方向感興趣的情形。例如在移動電話安全音量測試中,關(guān)心的是安全上限。安全上限表示在假定安全條件下產(chǎn)生的音量的上界。注2:另一種單側(cè)置信區(qū)間的情況出現(xiàn)在參數(shù)有自然邊界(例如為0)的情形中。在用泊松分布(2.47)作為顧客投訴次數(shù)的模型時,0是自然下限。又如,一個電子元件可靠度的置信區(qū)間可以為(0.98,1),其中1是可靠度的自然上限。由一個可連續(xù)觀測的總體中抽取的隨機(jī)樣本(1.6)值所確定的,以一定置信水平使得來自同一總體(1.1)的未來隨機(jī)樣本值落在其中的變量取值范圍。注:預(yù)測通常關(guān)注的是來自相同總體的單個未來觀測值。另一個實(shí)際背景是回歸分析中由一系列獨(dú)立觀測值構(gòu)造響應(yīng)變量的預(yù)測區(qū)間。估計(jì)量(1.12)的觀測值(1.4)。注:估計(jì)值是從觀測值中獲得的數(shù)值。對于一個假定的概率分布(2.11)中參數(shù)(2.9)的估計(jì)(1.36),估計(jì)量是指為了估計(jì)參數(shù)的統(tǒng)計(jì)量(1.8),而估計(jì)值是在估計(jì)量中使用觀測值的結(jié)果。有時在估計(jì)的前面加形容詞“點(diǎn)”,即估計(jì)誤差errorofestimation估計(jì)值(1.31)與待估計(jì)的參數(shù)(2.9)或總體特性值的差。注1:總體特性值可以是參數(shù)的函數(shù)或某個與概率分布(2.11)有關(guān)的量。注2:估計(jì)誤差可由抽樣、測量的不確定性、數(shù)值修約或其他原因引起。事實(shí)上,估計(jì)誤差表示實(shí)際工作者所關(guān)心性能的底線。確定估計(jì)誤差的來源是質(zhì)量改進(jìn)努力的關(guān)鍵。偏倚bias估計(jì)誤差(1.32)的期望(2.12)。注1:本定義與GB/T3358.2—2009(3.3.2)和VIM:1993(5.25和5.28)有所不同。這里的偏倚正如1.34的注所注2:實(shí)際中偏倚的存在可能導(dǎo)致不幸的結(jié)果。例如低估材料的強(qiáng)度的偏倚可能導(dǎo)致設(shè)備的失效。在調(diào)查抽樣中的偏倚導(dǎo)致根據(jù)民意測驗(yàn)結(jié)果引起決策的失誤。偏倚(1.33)為0的估計(jì)量(1.12)。示例1:一個由n個獨(dú)立隨機(jī)變量(2.10)組成的隨機(jī)樣本(1.6),每個服從均值(2.35)為μ,標(biāo)準(zhǔn)差(2.37)為o的正態(tài)分布(2.50)。樣本均值(1.15)X和樣本方差(1.16)S2分別是均值μ和方差(2.36)d2的無偏估計(jì)量。示例2:如1.37的注1所述的方差o2的極大似然估計(jì)(1.35)中,分母用n-1代替n,則它是無偏估計(jì)量。在應(yīng)用中也經(jīng)常使用樣本標(biāo)準(zhǔn)差(1.17),注意使用n-1作為除數(shù)的樣本方差的平方根并不是總體標(biāo)準(zhǔn)差(2.37)的無偏估計(jì)量。示例3:一個由n個獨(dú)立隨機(jī)變量組成的隨機(jī)樣本,每一對都服從協(xié)方差(2.43)為poxo,的二維正態(tài)分布(2.65),則樣本協(xié)方差(1.22)是總體協(xié)方差的無偏估計(jì)量。而協(xié)方差的的極大似然估計(jì)中,分母用的是n,而不是n-1,因此它是有偏估計(jì)量。9GB/T3358.1—2009/ISO3534-1:2006注1:無偏估計(jì)是在平均意義下,給出了正確的值。無偏估計(jì)量為尋求總體參數(shù)的“最優(yōu)”估計(jì)提供了一個有用的初始值。這里給出的定義是無偏估計(jì)量的一種統(tǒng)計(jì)特征。注2:在日常應(yīng)用中,實(shí)際工作者通過某種機(jī)制,例如保證隨機(jī)樣本對總體的代表性,來努力避免可能出現(xiàn)的偏倚。極大似然估計(jì)量maximumlikelihoodestimator使似然函數(shù)(1.38)達(dá)到或趨近最大值的參數(shù)(2.9)的估計(jì)量(1.12)。注1:當(dāng)分布(2.11)(如正態(tài)分布(2.50)、伽瑪分布(2.56)、威布爾分布(2.63)等)確定時,極大似然估計(jì)方法是獲得參數(shù)估計(jì)值的一種成熟方法。極大似然估計(jì)量具有許多優(yōu)良的統(tǒng)計(jì)性質(zhì)(如在單調(diào)變換下不變),對許多情形是一種可選擇的估計(jì)方法。如果極大似然估計(jì)量有偏,有時需要進(jìn)行簡單的偏倚(1.33)修正。如1.34示例2所述的正態(tài)分布方差(2.36)的極大似然估計(jì)量是有偏,但偏倚隨著樣本量的增加而減少,若將分母n改為n—1,即可將有偏的估計(jì)量修正為無偏的。注2:極大似然估計(jì)量和極大似然估計(jì)通常都簡寫成MLE,應(yīng)隨上下文適當(dāng)選用。估計(jì)estimation通過從總體(1.1)中抽取的隨機(jī)樣本(1.6),獲得對該總體的一種統(tǒng)計(jì)表示的方法。注1:特別地,估計(jì)程序包含由估計(jì)量(1.12)到具體估計(jì)值(1.31)的過程。注2:估計(jì)是一個相當(dāng)廣泛的概念,包括點(diǎn)估計(jì)、區(qū)間估計(jì)或總體性質(zhì)的估計(jì)。注3:統(tǒng)計(jì)表示經(jīng)常是指假定模型下,參數(shù)(2.9)或參數(shù)函數(shù)的估計(jì)。更一般地,總體表示可以不完全確定,例如有關(guān)自然災(zāi)難影響的統(tǒng)計(jì)(應(yīng)急管理者所希望得到的傷亡人數(shù)、財(cái)產(chǎn)損失或農(nóng)業(yè)損失等的估計(jì))。注4:通過對描述性統(tǒng)計(jì)量(1.5)的研究,可能揭示假定模型是否對數(shù)據(jù)提供了不適當(dāng)?shù)慕y(tǒng)計(jì)表示。如對模型擬合基于極大似然估計(jì)量(1.35)進(jìn)行的估計(jì)(1.36)。注1:對正態(tài)分布(2.50),樣本均值(1.15)是參數(shù)(2.9)μ的極大似然估計(jì)量。分母用n(而不是n-1)的樣本方差(1.16)是σ2的極大似然估計(jì)量。一般情況下,樣本方差分母使用n—1,是為了得到σ2的一個無偏估計(jì)量注2:極大似然估計(jì)有時用來描述從似然函數(shù)導(dǎo)出(極大似然)估計(jì)量(1.12)的過程。注3:盡管在某些情況下似然方程可以有顯式解,但是很多情況下極大似然估計(jì)量是一組方程的迭代解。注4:極大似然估計(jì)量和極大似然估計(jì)值通常簡寫成MLE,需隨上下文來合理選擇。似然函數(shù)likelihoodfunction在觀測值(1.4)處,將概率密度函數(shù)(2.26)看作分布族(2.8)中參數(shù)(2.9)的函數(shù)。示例1:考慮從一個非常大的總體(1.1)中隨機(jī)抽取10個個體,發(fā)現(xiàn)其中3個具有指定的特征。對這個樣本,總體中具有指定特征的比例的一個直觀估計(jì)值(1.31)是0.3(10個中有3個)。在二項(xiàng)分布(2.46)模這也可通過畫出二項(xiàng)分布(2.46)的概率函數(shù)120p3(1一p)’關(guān)于p的圖形進(jìn)一步驗(yàn)證。示例2:對正態(tài)分布(2.50),可以證明,當(dāng)標(biāo)準(zhǔn)差(2.37)已知時,似然函數(shù)在μ等于樣本均值時達(dá)到最大值。剖面似然函數(shù)profilelikelihoodfunction其余參數(shù)取使其極大化,而僅作為一個單參數(shù)(2.9)的似然函數(shù)(1.38)。H關(guān)于總體(1.1)的陳述。注:通常這個命題與分布族(2.8)中的一個或幾個參數(shù)(2.9),或與此分布族本身有關(guān)。用統(tǒng)計(jì)檢驗(yàn)(1.48)方法來檢驗(yàn)的假設(shè)(1.40)。示例1:在獨(dú)立同分布正態(tài)隨機(jī)變量(2.10)的隨機(jī)樣本(1.6)中,均值(2.35)和標(biāo)準(zhǔn)差(2.37)未知,對均值μ的一個原假設(shè)是:“均值小于或等于某給定值μ”。上述原假設(shè)一般寫成形式:H?:μ≤A?。示例2:原假設(shè)也可為:“總體(1.1)的統(tǒng)計(jì)模型是正態(tài)分布”。對此原假設(shè),均值和標(biāo)準(zhǔn)差可以不確定。示例3:原假設(shè)也可為:“總體的統(tǒng)計(jì)模型是對稱分布”。對此原假設(shè),分布形式可以不確定。注1:顯然,原假設(shè)可以由所有可能的概率分布的子集組成。注2:本定義應(yīng)與備擇假設(shè)(1.42)和統(tǒng)計(jì)檢驗(yàn)(1.48)聯(lián)合考慮。注3:在實(shí)際中,從不說“證明”了原假設(shè),而是說在給定條件下,不足以拒絕原假設(shè)。進(jìn)行假設(shè)檢驗(yàn)的原始目的很可能是對于當(dāng)前問題,希望檢驗(yàn)結(jié)果支持一個指定的備擇假設(shè)。注4:不拒絕原假設(shè)并不是“證明”了它真的成立,而只是說沒有足夠的證據(jù)拒絕它。此時原假設(shè)也許真的成立(或近似成立);也許由于樣本的原因(如樣本量不夠大)而未能檢出其中的差異。注5:有時,最初的興趣是原假設(shè),但對原假設(shè)的偏離也有意義。適當(dāng)?shù)臉颖玖亢蜋z驗(yàn)指定的偏離或備擇假設(shè)的功效能用來構(gòu)造出合適評估原假設(shè)的檢驗(yàn)方法。注6:與“不能拒絕原假設(shè)”相反,“接受備擇假設(shè)”是一個肯定的結(jié)果,它支持所感興趣的猜測。與諸如“這次不能拒注7:原假設(shè)是構(gòu)造相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量(1.52)的出發(fā)點(diǎn),該統(tǒng)計(jì)量用于對原假設(shè)的評估。注8:原假設(shè)通常記為H?。注9:若有可能,原假設(shè)與備擇假設(shè)的命題應(yīng)互斥,參見1.48的注2和1.49的示例。備擇假設(shè)alternativehypothesisH?,H?對從所有不屬于原假設(shè)(1.41)的可能容許概率分布(2.11)中選擇的一個集合或其子集的陳述。示例1:在1.41示例1中,對應(yīng)原假設(shè)的備擇假設(shè)是“均值(2.35)大于該給定值”,表示為:H?:μ>M。示例2:在1.41示例2中,對應(yīng)原假設(shè)的備擇假設(shè)是“總體的統(tǒng)計(jì)模型不是正態(tài)分布(2.50)”。示例3:在1.41示例3中,對應(yīng)原假設(shè)的備擇假設(shè)為“總體的統(tǒng)計(jì)模型是由非對稱分布構(gòu)成的”。對這個備擇假設(shè),非對稱分布的具體形式?jīng)]有確定。注1:在需要特別指定備擇假設(shè)時,一般將原假設(shè)的補(bǔ)作為備擇假設(shè)。注2:備擇假設(shè)既可以記為H?,也可以記為H?,不存在優(yōu)先選用的問題。注3:備擇假設(shè)是與原假設(shè)相對立的一種陳述。對應(yīng)的檢驗(yàn)統(tǒng)計(jì)量(1.52)用于在原假設(shè)和備擇假設(shè)之間進(jìn)行抉擇。注4:不能脫離原假設(shè)和統(tǒng)計(jì)檢驗(yàn)(1.48)來考慮備擇假設(shè)。注5:與“不能拒絕原假設(shè)”相比,“接受備擇假設(shè)在一個分布族(2.8)中,指定了某單個分布(2.11)的假設(shè)(1.40)。注1:簡單假設(shè)是選定的子集只由單個概率分布(2.11)組成的原假設(shè)(1.41)或備擇假設(shè)(1.42)。注2:根據(jù)從均值(2.35)未知、標(biāo)準(zhǔn)差σ已知的正態(tài)分布(2.50)總體中獨(dú)立抽取的隨機(jī)樣本(1.6),對均值μ的簡單假設(shè)是均值等于一個給定值x。,通常表示為如下形式:H?:μ=r?。注3:簡單假設(shè)完全確定了概率分布(2.11)。在一個分布族(2.8)中,指定了多于一個分布(2.11)的假設(shè)(1.40)。示例1:1.41和1.42給出的原假設(shè)(1.41)和備擇假設(shè)(1.42)都是復(fù)合假設(shè)的例。示例2:1.48示例3中情形3的原假設(shè)是簡單假設(shè),示例4中的原假設(shè)也是簡單假設(shè),1.48中其他假設(shè)都是復(fù)合假設(shè)。注:復(fù)合假設(shè)是所選定的子集由一個以上的概率分布組成原假設(shè)或備擇假設(shè)。α注:如果原假設(shè)是一個簡單假設(shè)(1.43),則當(dāng)原假設(shè)為真時,拒絕它的概率是一個確定的值。第一類錯誤TypeIerror拒絕事實(shí)上為真的原假設(shè)(1.41)的錯誤。注1:事實(shí)上,第一類錯誤是一種不正確的判定。因此,要使這種不正確判定的概率(2.5)盡可能小。要使犯第一類錯誤的概率為0,只有永不拒絕原假設(shè),而不管證據(jù)如何。當(dāng)然,這是不可能的。注2:在有些情況下(如檢驗(yàn)二項(xiàng)參數(shù)p),由于結(jié)果的離散性,有可能達(dá)不到預(yù)先設(shè)定的顯著性水平,如0.05。第二類錯誤TypeⅡerror沒有拒絕事實(shí)上不為真的原假設(shè)(1.41)的錯誤。注:事實(shí)上,第二類錯誤是一種不正確的判定。因此,要使這種不正確判定的概率(2.5)盡可能小。第二類錯誤通常是在當(dāng)樣本量不夠大,因而不足以揭示與原假設(shè)的偏離時發(fā)生。判斷是否拒絕原假設(shè)(1.41),支持備擇假設(shè)(1.42)的方法。示例1:作為例子,如果一個實(shí)際的連續(xù)隨機(jī)變量(2.29)在一心到+騖之間取值,懷疑它的真實(shí)的概率分布不是正態(tài)分布(2.50),則可以按以下步驟構(gòu)造假設(shè):——考慮所有在一到+m上取值的連續(xù)概率分布(2.23);—-猜測真實(shí)的概率分布不是正態(tài)分布;—備擇假設(shè)為:概率分布不是正態(tài)分布。示例2:如果隨機(jī)變量服從正態(tài)分布,標(biāo)準(zhǔn)差(2.37)已知,懷疑它的期望值μ與給定的值μ?有偏離,則可以按示例3中的情形3的步驟構(gòu)造假設(shè)。示例3:本例考慮統(tǒng)計(jì)檢驗(yàn)的三種可能情形。情形1:猜測過程均值大于目標(biāo)均值A(chǔ)?。這個猜測導(dǎo)致如下假設(shè):情形2:猜測過程均值小于目標(biāo)均值x?。這個猜測導(dǎo)致如下假設(shè):情形3:猜測過程均值與目標(biāo)均值不相容,但方向不確定。這個猜測導(dǎo)致如下假設(shè):在這三個情形中,假設(shè)的形成是從考慮備擇假設(shè)和基本條件偏離的猜測導(dǎo)出的,示例4:本例考慮兩批產(chǎn)品(1和2)中的不合格品的比例p?和p?,范圍皆介于0和1之間。懷疑兩批產(chǎn)品是不同的,因此猜測兩個批不合格品率也不同。這個猜測導(dǎo)致如下假設(shè):注1:統(tǒng)計(jì)檢驗(yàn)是一個方法,利用樣本觀測值來判斷真實(shí)的概率分布是屬于原假設(shè)還是備擇假設(shè),在一定條件下,這注2:在實(shí)施統(tǒng)計(jì)檢驗(yàn)之前,首先要在可利用信息基礎(chǔ)上確定概率分布的可能集合。其次,在研究猜測的基礎(chǔ)上,確認(rèn)由可能為真的概率分布組成備擇假設(shè)。最后,用備擇假設(shè)的補(bǔ)來組成原假設(shè)。在很多情形下,概率分布的可能集(即原假設(shè)和備擇假設(shè))可以用相關(guān)參數(shù)值的集合來確定。注3:因?yàn)榕袛嗍窃跇颖居^測的基礎(chǔ)上作的,這可能導(dǎo)致第一類錯誤(1.46),即原假設(shè)為真時拒絕原假設(shè);或第二類注4:上面示例3中情形1和情形2是單側(cè)檢驗(yàn)的例子。情形3是雙側(cè)檢驗(yàn)的例子。在這三個情形中,檢驗(yàn)是單側(cè)持備擇假設(shè)判定的檢驗(yàn)統(tǒng)計(jì)量的區(qū)域,即臨界域。但它可能并不能像情形1,2,3那樣,對參數(shù)空間的直接、簡單的描述。注5:在應(yīng)用統(tǒng)計(jì)檢驗(yàn)時,必須注意應(yīng)該遵循的基本假定。在偏離基本假定情形下,仍能做出穩(wěn)定推斷的統(tǒng)計(jì)檢驗(yàn)稱為是穩(wěn)健的。例如對均值的單個樣本t檢驗(yàn)就是在非正態(tài)分布下非常穩(wěn)健的一個例子。而對方差齊性的在原假設(shè)(1.41)為真時,獲得檢驗(yàn)統(tǒng)計(jì)量(1.52)的觀測值及更不支持原假設(shè)的其他值的概率示例1:考慮1.9中引入的數(shù)值例,為解釋方便,假定這些觀測值來自一個標(biāo)稱均值為12.5的過程,并且從先前經(jīng)驗(yàn)看,相關(guān)的工程技術(shù)人員認(rèn)為過程是一致低于該標(biāo)稱值。為研究,收集了一個樣本量為10的隨機(jī)樣本,樣本數(shù)據(jù)由1.9給出。合適的假設(shè)是:樣本均值是9.7,正如所猜測的那樣,比標(biāo)稱值小。但是它是否距12.5足夠遠(yuǎn),從而可以支持猜測?本例中,檢驗(yàn)統(tǒng)計(jì)量(1.52)值為一1.9764,相應(yīng)的p值為0.040。這表明如果過程的真實(shí)的均值等于12.5時,則在100次觀測中,最多有4次機(jī)會使檢驗(yàn)統(tǒng)計(jì)量的值等于或低于一1.9764。如果預(yù)先設(shè)定的顯著性水平是0.05,則據(jù)此拒絕原假設(shè),支持備擇假設(shè)。若將對此問題稍作不同的考慮。想象所關(guān)心的是過程偏離了目標(biāo)值12.5,但偏大還是偏小不定,這導(dǎo)致以下假設(shè):假定從隨機(jī)樣本中收集到相同數(shù)據(jù),檢驗(yàn)統(tǒng)計(jì)量也一樣,其值為一1.9764。對這個備擇假設(shè),感興趣的問題是“看到這樣一個極端值或更極端的概率是多少?”在這種情形下,有兩個相關(guān)的區(qū)域:一個是檢驗(yàn)統(tǒng)計(jì)量值小于或等于-1.9764;另一個是統(tǒng)計(jì)量值大于或等于1.9764。t檢驗(yàn)統(tǒng)計(jì)量落在這兩個區(qū)域中的一個的概率是0.08(單側(cè)值的兩倍)。也就是說原假設(shè)為真時,檢驗(yàn)統(tǒng)計(jì)量在100次觀測中大約會有8次機(jī)會取此極端值或更極端的值。因此在0.05注1:若p值為0.029,則在原假設(shè)為真的條件下,每100次觀測中,僅有不到3次的機(jī)會使檢驗(yàn)統(tǒng)計(jì)量的值取此極為0.05,而p值0.029小于0.05,因而拒絕原假設(shè)。注2:有人將p值稱為顯著概率,但它不能與顯著性水平(1.45)混淆,后者在應(yīng)用中是指定的常值。檢驗(yàn)功效powerofatest1減去犯第二類錯誤(1.47)的概率(2.5)。注2:在大多數(shù)有實(shí)際意義的情形中,增加樣本量會增加檢驗(yàn)的功效。換句話說,當(dāng)備擇假設(shè)(1.42)為真時,拒絕原假設(shè)的概率隨著樣本量的增加而增加,從而減小了犯第注3:在檢驗(yàn)情形下,人們愿意樣本量變得足夠大,這樣即使距原假設(shè)有小的偏離也應(yīng)該能被檢測到,從而拒絕原假設(shè)。換句話說,當(dāng)樣本量變得足夠大時,對每個對應(yīng)原假設(shè)的備擇假設(shè),檢驗(yàn)功效都接近于1。這樣的檢驗(yàn)稱的。對相合性和有效性有更正式的數(shù)學(xué)描述,這超出了GB/T3358本部分的范圍(可參考各種統(tǒng)計(jì)百科全書或數(shù)理統(tǒng)計(jì)教材)。功效曲線powercurve表示作為分布族(2.8)中總體參數(shù)(2.9)函數(shù)的檢驗(yàn)功效(1.50)值的曲線。注:功效函數(shù)等于1減去操作特性值。檢驗(yàn)統(tǒng)計(jì)量teststatistic用于統(tǒng)計(jì)檢驗(yàn)(1.48)的統(tǒng)計(jì)量(1.8)。注:檢驗(yàn)統(tǒng)計(jì)量用來評判考察的概率分布(2.11)是否與原假設(shè)(1.41)或備擇假設(shè)(1.42)相符。圖形描述性統(tǒng)計(jì)量graphicaldescriptivestatistics圖形形式的描述性統(tǒng)計(jì)量(1.5)。注:描述性統(tǒng)計(jì)量的目的一般是將大量的數(shù)據(jù)減少到容易控制的數(shù)量或者用一種直觀的方式來展現(xiàn)數(shù)據(jù)。圖形概數(shù)值描述性統(tǒng)計(jì)量numericaldescriptivestatistics數(shù)值形式的描述性統(tǒng)計(jì)量(1.5)。〈定性特性>來自樣本(1.3)的某些個體的集合。<有序特性〉有序尺度下一個或者多個相鄰類別的集合。〈定量特性〉實(shí)數(shù)軸上的區(qū)間。組限classlimits;classboundaries<定量特征>定義組(1.55.3)的上、下邊界值。注:本定義指定量特性組的邊界。組中值mid-pointofclass〈定量特征>上、下組限(1.56)的平均數(shù)(1.15)。組距classwidth〈定量特征>組(1.55.3)的上限減去其下限。給定類(組)(1.55)中,特定事件發(fā)生的次數(shù)或觀測值(1.4)的個數(shù)。GB/T3358.1—2009/ISO3534-1:2006類(組)(1.55)與其中特定事件發(fā)生的次數(shù)或觀測值(1.4)的個數(shù)之間的經(jīng)驗(yàn)關(guān)系。頻數(shù)分布(1.60)的一種圖形表示,由一些相鄰的長方形組成,每個長方形的底寬等于組距(1.58),注:要注意從不等組距的組中產(chǎn)生數(shù)據(jù)的情況。由一組寬度相同、高度與頻數(shù)(1.59)成比例的長方形組成的,表示名義特性頻數(shù)分布(1.60)的注1:有時為了美觀,將長方形畫成三維圖形,但這并不會增加任何信息,所以不推薦使用。條形圖中的長方形并不需要相鄰。注2:由于現(xiàn)成軟件大都沒有按此處的定義繪制,現(xiàn)在直方圖和條形圖的差別越來越模糊。給定界限以下所有類(組)的頻數(shù)(1.59)之和。注:本定義只適用于對應(yīng)于組限(1.56)的給定界限值。用事件或者觀測值(1.4)發(fā)生的總數(shù)目除頻數(shù)(1.59)。用事件或者觀測值(1.4)發(fā)生的總數(shù)目除累積頻數(shù)(1.63)。Ω示例1:考慮某消費(fèi)者所購買電池的壽命(失效時間)。若電池一開始使用時就失效,其壽命為0;若電池開始能工本例在本章中經(jīng)常會用到,在2.68還將對它作進(jìn)一步的討論。示例2:一個盒子里裝有標(biāo)著1,2,3,4,5,6,7,8,9,10的10個電阻。如果從盒中不放回地隨機(jī)抽出兩個電阻,則樣本空間包含以下45個結(jié)果:(1,2),(1,3),(1,4),(1,5),(1,6),(1,7),(1,8),(1,9),(1,10),(2,3),(2,4),(2,5),(2,6),(2,7),(2,8),(2,9),(2,10),(3,4),(3,5),(3,6),(3,7),(3,8),(3,9),(3,10),(4,5),(4,6),(4,7),(4,8),(4,9),(4,10),(5,6),(5,7),(5,8),(5,9),(5,10),(6,7),(6,8),(6,9),(6,10),(7,8),(7,9),(7,10),(8,9),(8,10),(9,10)。事件(1,2)認(rèn)為與事件(2,1)是相同的,此時不考慮抽取電阻的次序。如果考慮抽樣次序,則認(rèn)為事件(1,2)與事件(2,1)是不同的,在這種情況下,樣本空間中共有90個結(jié)果。示例3:在上例中,如果允許放回抽樣,那么事件(1,1),(2,2),(3,3),(4,4),(5,5),(6,6),(7,7),(8,8),(9,9),(10,10)也應(yīng)包含在樣本空間中。若不考慮抽樣次序,樣本空間中有55個結(jié)果;若考慮抽樣次序,則樣本空間中有100個結(jié)果。注1:結(jié)果可以由一個實(shí)際的實(shí)驗(yàn)或一個完全假設(shè)的實(shí)驗(yàn)得到,這些結(jié)果可以明確列出,例如可由正整數(shù){1,2,3,…}組成的可列集,也可能是整個實(shí)數(shù)軸。注2:樣本空間是概率空間(2.68),的第一要素。A樣本空間(2.1)的子集。示例1:續(xù)2.1中的示例1。以下都為事件的例子:{0},(0,2),{5,7},(7,+彆),分別表示電池一開始就失效,開始能工作但壽命不到2h,壽命恰好為5h或7h,壽命等于或大于7h。{0}和{5,7}都只包含單個數(shù)值的集合;(0,2)為實(shí)數(shù)軸上的開區(qū)間;(7,+騖)為實(shí)數(shù)軸上左閉右開的一個無限區(qū)間。示例2:續(xù)2.1中的示例2??紤]不放回抽樣且不考慮抽樣次序情形。定義事件A為{樣本中至少包含電阻1或者電阻2},該事件有17個結(jié)果(1,2),(1,3),(1,4),(1,5),(1,6),(1,7),(1,8),(1,9),(1,10),(2,3),(2,4),(2,5),(2,6),(2,7),(2,8),(2,9)和(2,10)。定義事件B為{樣本中不包含電阻8,9或10},該事件有21個結(jié)果(1,2),(1,3),(1,4),(1,5),(1,6),(1,7),(2,3),(2,4),(2,5),(2,6),(2,7),(3,4),(3,5),(3,6),(3,7),(4,5),(4,6),(4,7),(5,6),(5,示例3:續(xù)示例2。事件A和B的交集(即至少包含電阻1或2中的一個,又不包含電阻8,9和10中的任一個),有11個結(jié)果:(1,2),(1,3),(1,4),(1,5),(1,6),(1,7),(2,3),(2,4),(2,5),(2,6),(2,7)。事件A和B的并集(即或至少包含電阻1或2中的一個,或不包含電阻8,9和10中的任一個),有27個結(jié)果:(1,2),(1,3),(1,4),(1,5),(1,6),(1,7),(1,8),(1,9),(1,10),(2,3),(2,4),(2,5),(2,6),(2,7),(2,8),(2,9),(2,10),(3,4),(3,5),(3,6),(3,7),(4,5),(4,6),(4,7),(5,6),(5,7),(6,7)。順便指出,事件A和B的并集中的結(jié)果數(shù)為事件A中的結(jié)果數(shù)加上事件B中的結(jié)果數(shù)減去事件A和B交集中的結(jié)果數(shù),即17+21—11=27。注:對確定的事件和一個實(shí)驗(yàn)結(jié)果,如果該實(shí)驗(yàn)結(jié)果屬于這個事件,則稱該事件發(fā)生。實(shí)際感興趣的事件屬于事件σ代數(shù)(2.69),后者是概率空間(2.68)的第二個要素。在賭博游戲(如撲克、輪盤賭等)中,所感興趣的事件包含的結(jié)果數(shù)決定了它發(fā)生機(jī)會的大小。對立事件complementaryeventA?示例1:續(xù)2.1中的示例1。事件{0}的對立事件為(0,+驚),即事件“電池一開始就失效”的對立事件是“電池開始能工作”。事件(0,3)為電池一開始就失效或壽命小于3h,它的對立事件是(3,+騖),即電池壽命達(dá)到或超過3h。示例2:續(xù)2.2中的示例2。通過考慮B的對立事件:{至少包含電阻8,9,10中的一個},容易得到事件B中的實(shí)驗(yàn)結(jié)果數(shù)目。B的對立事件有7+8+9=24個結(jié)果,即(1,8),(2,8),(3,8),(4,8),(5,8),(6,8),(7,8),(1,9),(2,9),(3,9),(4,9),(5,9),(6,9),(7,9),(8,9),(1,10),(2,10),(3,10),(4,10),(5,10),(6,10),(7,10),(8,10),(9,10)。由于整個樣本空間有45個結(jié)果,因此事件B有45—24=21個結(jié)果:(1,2),(1,3),(1,4),(1,5),(1,6),(1,7),(2,3),(2,4),(2,5),(2,6),(2,7),(3,4),(3,5),(3,6),(3,7),(4,5),(4,6),(4,7),(5,6),(5,7),(6,7)。注1:對立事件是相應(yīng)事件在樣本空間的補(bǔ)集。注2:對立事件也是一個事件。注3:對給定的事件A,A的對立事件通常記為A‘。注4:有時計(jì)算對立事件的概率比計(jì)算事件本身的概率要容易。例如,事件:“從一個包含有1000個產(chǎn)品,不合格品率為1%的總體中隨機(jī)抽取10個產(chǎn)品,至少有一個不合格品”包含非常多可能的結(jié)果,此時計(jì)算其對立事件“沒有不合格品”的概率要容易得多。其交的概率(2.5)等于各自事件概率乘積的兩個事件(2.2)。示例1:考慮投擲一紅一白兩枚正六面體的均勻骰子,可能結(jié)果有36個,每個發(fā)生的概率都是1/36。記D:為兩枚骰子點(diǎn)數(shù)之和為i的事件,W為白色骰子點(diǎn)數(shù)為1的事件,則事件W與事件D,相互獨(dú)立,但事件W與事件D.(i=2,3,4,5,6)不獨(dú)立。不獨(dú)立的事件也稱為相依事件。示例2:在應(yīng)用中,獨(dú)立事件和相依事件容易判斷。在事件或者環(huán)境相依的情形下,知道與其相關(guān)事件的結(jié)果是相手術(shù)失敗引起的死亡是相依的。作為對照,死亡似乎和病人出生在星期幾是獨(dú)立的。在可靠性問題中,有相同失效原因的元件的失效時間是不獨(dú)立的。例如,反應(yīng)堆中的燃料棒發(fā)生爆裂概率很低,但在有一根燃料棒爆裂的條件下,其毗鄰的燃料棒隨著發(fā)生爆裂的概率就會大為增加。示例3:續(xù)2.2中的示例2。假定抽樣是一個簡單隨機(jī)抽樣,每個結(jié)果發(fā)生的概率都為1/45,則P(A)=17/45=0.3778,P(B)=21/45=0.4667,P(A∩B)=11/45=0.2444。由于P(A)P(B)=(17/45)×(21/45)=0.1763,并不等于0.2444,所以事件A和事件B不獨(dú)立。注:本定義是關(guān)于兩個事件的,可以將其推廣到多個事件情形。對事件A和B,獨(dú)立的條件為P(A∩B)=P(A)P(B)。三個事件A,B,C相互獨(dú)立的條件是:更一般地,多于兩個事件的事件組A?,A?,…,A,稱為相互獨(dú)立,如果對于事件組任意給定子集中事件交的概率等于子集中每個事件概率的乘積。此條件要求對事件組中的任一子集均成立??梢詷?gòu)造這樣的例子:每對事賦予事件(2.2)閉區(qū)間[0,1]中的一個實(shí)數(shù)。示例:續(xù)2.1中示例2。事件的概率可通過計(jì)算構(gòu)成該事件的所有結(jié)果的概率求得。如果45個結(jié)果具有相同的概率,每個結(jié)果發(fā)生的概率為1/45,那么某個事件發(fā)生的概率等于該事件所包含的結(jié)果數(shù)除以45。注1:概率測度(2.70)對所有事件都賦予了[0,1]上的實(shí)數(shù)值,而事件的概率只是概率測度賦予該事件的特定值。注2:本定義中的概率指的是某個特定事件的概率。概率可能與事件在長期試驗(yàn)中發(fā)生的頻率有關(guān),或是對一個事件A可能發(fā)生的相信程度。通常事件A發(fā)生的概率用P(A)表示,當(dāng)需要考慮概率空間(2.68)時,用O(A)表示事件A發(fā)生的概率。P(A|B)事件A與事件B交的概率(2.5)除以事件B的概率。示例1:續(xù)2.1中示例1??紤]事件(2.2)A={電池壽命至少為3h》,即(3,+α),設(shè)事件B=《電池一開始就有電》,即(0,+鈮),給定事件B下事件A發(fā)生的條件概率P(A|B)是指一開始就有電的電池中,其壽命至少為3h的概率。示例2:續(xù)2.1中示例2。設(shè)抽樣是不放回的,在第一次抽取到電阻2的條件下,第二次再抽到電阻2的概率等于0。如果所有電阻被抽取的概率相等,第一次未抽到電阻2的條件下,第二次抽到電阻2的概率為0.1111。示例3:續(xù)2.1中示例2。如果抽取是放回的,且所有電阻在每次抽取中被抽中的概率相等,則電阻2在第一次不論被抽到與否,第二次抽到它的概率都是0.1。因此第一次抽出的結(jié)果和第二次抽出的結(jié)果是獨(dú)立事件。注1:事件B發(fā)生的概率要求大于0。注2:“給定B下A的”可更完整地表述為“給定事件B發(fā)生條件下的事件A”。注3:如果給定事件B發(fā)生條件下事件A的條件概率等于事件A發(fā)生的概率,則事件A與事件B相互獨(dú)立。也就是說,事件B發(fā)生與否不影響事件A的發(fā)生。[隨機(jī)變量X的]分布函數(shù)distributionfunction[ofarandomvariableX]隨機(jī)變量(2.10)X的取值落在(-o,x)上這一事件(2.2)發(fā)生的概率(2.5)。注1:隨機(jī)變量X的分布函數(shù)是x的函數(shù),它給出了隨機(jī)變量X值小于或等于z這一事件的概率,即F(z)=P(X≤x)。GB/T3358.1—2009/ISO3534-1:2006注2:分布函數(shù)F(x)關(guān)于x是非降的。注3:對多維分布(2.17),分布函數(shù)是指多維分布中每個隨機(jī)變量小于或等于指定值的概率(2.5)。多維分布函數(shù)定義為:F(x?,x?,…,x.)=P(x?≤x?,x?≤x?,…,x.≤x.)注4:分布和隨機(jī)變量是離散型的或是連續(xù)型,取決于其分布函數(shù)的分類。通常,分布函數(shù)分為離散型分布函數(shù)(2.22)和連續(xù)型分布函數(shù)(2.23),但也有其他的可能。對2.1中電池的示例,電池壽命的一個可能的分布函數(shù)為:由該分布函數(shù)可知:電池壽命是非負(fù)的,有10%的可能性它一開始就不能工作,若開始能正常工作,則壽命服從均值為1h的指數(shù)分布(2.58)。注5:通常分布函數(shù)縮寫為cdf(cumulativedistributionfunction,即累積分布函數(shù))。分布族familyofdistributions概率分布(2.11)的集合。注1:概率分布族一般用概率分布的參數(shù)(2.9)來標(biāo)記。注2:通常,概率分布的均值(2.35)和/或方差(2.36)常用作分布族的標(biāo)記,當(dāng)參數(shù)多于兩個時,它們也可能為分布族的部分標(biāo)記。在其他情形,均值和方差不一定是分布族的顯式參數(shù),而是參數(shù)的函數(shù)。分布族(2.8)的標(biāo)記。注1:參數(shù)可以是一維的也可以是多維的。注2:某些參數(shù)可作為位置參數(shù),特別當(dāng)該參數(shù)對應(yīng)分布族的均值時;某些參數(shù)可作為刻度參數(shù),特別當(dāng)該參數(shù)恰好是與分布的標(biāo)準(zhǔn)差(2.37)成正比。既不是位置參數(shù)又不是刻度參數(shù)的參數(shù)通常視為形狀參數(shù)。示例:續(xù)2.1中電池的示例。樣本空間由如下事件生成:《電池開始使用時即失效,或開始能正常,但在x小時失效}。這些事件難以用數(shù)學(xué)進(jìn)行處理。因此自然地把每個事件與電池壽命(一個實(shí)數(shù))相聯(lián)系。當(dāng)隨機(jī)變量取值為零時,表示電池開始使用時即失效。當(dāng)隨機(jī)變量取值大于零時,可以理解為電池一開始正常工作,然后突然在一個特定值時失效。應(yīng)用隨機(jī)變量使我們可以回答諸如“電池壽命超過它保證使用時間(比如6h)的概率是多少?”這樣的問題。注1:通常隨機(jī)變量有個維數(shù)k。若k=1,稱為一維隨機(jī)變量:當(dāng)k>1時,稱為多維隨機(jī)變量。在實(shí)際中,當(dāng)維數(shù)為指定的k時,稱該隨機(jī)變量為k維的。注2:一維隨機(jī)變量是定義在樣本空間(2.1)上的實(shí)值函數(shù)。注3:取值于二元有序?qū)崝?shù)的隨機(jī)變量稱為二維隨機(jī)變量。注4:k元有序?qū)崝?shù)的例:(x,,x,,…,x?)。一個k元有序?qū)崝?shù)就是一個k維向量(行向量或列向量)。注5:k維隨機(jī)變量的第j個分量對應(yīng)于k元有序?qū)崝?shù)中第j個分量的隨機(jī)變量。2.11概率分布probabilitydistrib分布distribution由隨機(jī)變量(2.10)導(dǎo)出的概率測度(2.70)。示例:續(xù)2.1中的示例。電池的壽命分布完整地描述在所有指定時間失效的概率,我們不可能確切知道給定電池的失效時間,也不知道(事先去檢驗(yàn))電池開始工作后是否能繼續(xù)工作。概率分布完全刻畫了一個不確定結(jié)果的概率性質(zhì)。在2.7的注4中,給出了概率分布的一種表示方法,即分布函數(shù)。注1:對一個分布,有許多等價(jià)的數(shù)學(xué)表達(dá),包括分布函數(shù)(2.7),概率密度函數(shù)(2.26)(如果存在的話),及特征函數(shù)。盡管難易程度不同,這些表達(dá)都使我們能確定隨機(jī)變量在給定區(qū)域內(nèi)取值的概率。注2:隨機(jī)變量是樣本空間子集到實(shí)直線上的一個函數(shù),比如,一個隨機(jī)變量能取任意實(shí)數(shù)這一事件的概率為1,就是一例。對電池的例子而言,P(X≥0)=1。在許多情況下,用隨機(jī)變量和它測度更容易處理。但是概率測度保證了從一種表達(dá)方式到另一種表達(dá)方式時的一致性。注3:只有一個分量的隨機(jī)變量稱為一維或單變量(一元)概率分布。如果一個隨機(jī)變量有兩個分量,我們稱為二維或二變量(二元)概率分布,如果這個隨機(jī)變量有不少于兩個分量,則隨機(jī)變量(2.10)的函數(shù)關(guān)于概率測度(2.70)在樣本空間(2.1)上的積分。注1:隨機(jī)變量X的函數(shù)g(X)的期望用E[g(X)]表示,可以按下式計(jì)算:其中F(x)是對應(yīng)的分布函數(shù)。實(shí)線映射的一個算子或函數(shù)。本身(例如事件用文字?jǐn)⑹鼋o出)。第二個積分描述了在R*上的計(jì)算,這種表達(dá)更常用。注4:在許多實(shí)際應(yīng)用場合中,上面積分中的被積函數(shù)都有具體形式。例如在r階矩(2.34)的注中g(shù)(x)=x′,均值(2.35)的注中g(shù)(x)=x以及方差(2.36)的注中g(shù)(x)=[x-E(X)]?。注5:本定義并不局限于前面的示例和注中所提到的一維積分。高維情況見2.43。注6:對離散隨機(jī)變量(2.28),注1中的第二個積分用求和號代替。見2.35的示例。示例1:考慮二項(xiàng)分布(2.46),表2給出參數(shù)n=6,p=0.3的二項(xiàng)分布的概率函數(shù)。分布的某些p分位數(shù)為:x?.zs=1I?.γs=3x?.go=3Z?,gs=4x?.gg=5Z?.9gg=5由于二項(xiàng)分布是離散的,它的p分位數(shù)都是整數(shù)。表2二項(xiàng)分布的示例-P(X=x)P(X≤x)P(X>x)00.1176490.117649088235110.3025260.4201750.57982520.3241350.7443100.25569030.1852200.9295300.07047040.0595350.9890650.01093550.01020609992710.00072960.0007290.000000示例2:考慮標(biāo)準(zhǔn)正態(tài)分布(2.51),表3是對分布函數(shù)的某些數(shù)值及對應(yīng)的p分位數(shù):表3標(biāo)準(zhǔn)正態(tài)分布示例p由于X的分布是連續(xù)的,第二列的標(biāo)題也可以寫為:滿足P(X<x)=p的x。注1:對于連續(xù)分布(2.23),如果p是0.5,則0.5分位數(shù)即為中位數(shù)(2.14)。對p等于0.25,相應(yīng)的0.25分位數(shù)被稱為下四分位數(shù)。對于連續(xù)分布,分布的25%低于0.25分位數(shù)而分布的75%高于0.25分位數(shù)。當(dāng)p等于0.75,相應(yīng)的0.75分位數(shù)被稱為上四分位數(shù)。注2:通常,分布的100p%小于p分位數(shù);分布的100(1-p)%大于p分位數(shù)。但很難確定離散分布的中位數(shù),因?yàn)闀泻芏嘀禎M足定義。注3:如果F是連續(xù)且嚴(yán)格遞增的,則p分位數(shù)是F(x)=p注4:如果分布函數(shù)在某一個區(qū)間上都等于常數(shù)p,則這個區(qū)間上的所有值都是這個分布的p分位數(shù)。注5:p分位數(shù)的定義僅適用于一維分布(2.16)。0.5分位數(shù)(2.13)。示例:在2.7注4的示例中,通過解x的方程0.1+0.9[1-exp(-x)]=0.5,可得中位數(shù)為0.5878。注1:中位數(shù)是在實(shí)際中最常用的p分位數(shù)(2.13)之一。連續(xù)一維分布(2.16)的中位數(shù)滿足:總體(1.1)的一半大注2:中位數(shù)的定義僅適用于一維分布(2.16)。0.25分位數(shù)(2.13)或0.75分位數(shù)。示例:續(xù)2.14中的示例??梢宰C明0.25分位數(shù)是0.1823以及0.75分位數(shù)是1.2809。注1:0.25分位數(shù)稱為下四分位數(shù);而0.75分位數(shù)稱為上四分位數(shù)。注2:分位數(shù)的定義僅適用于一維分布(2.16)。2.16一維分布univariatedistribution單個隨機(jī)變量(2.10)的概率分布(2.11)。注:一維[概率]分布是關(guān)于單個隨機(jī)變量的,故也稱為單變量分布。二項(xiàng)分布(2.46),泊松分布(2.47),正態(tài)分布(2.50),伽瑪分布(2.56),t分布(2.53),威布爾分布(2.63)以及貝塔分布(2.59)都是一維分布的例子。多維概率分布multivariateprobabilitydistribution變量的概率分布,可以明確地稱為一維分布或單變量分布(2.16)。由于單變量場合有明顯的優(yōu)勢,因此除非另有說明通常都假設(shè)是單變量的。注2:多維概率分布有時也稱為聯(lián)合分布。注3:多項(xiàng)分布(2.45),二維正態(tài)分布(2.65),多維正態(tài)分布(2.64)是GB/T3358中提到的部分多維概率分布的例子。k維隨機(jī)變量(2.10)所有分量的非空真子集的概率分布(2.11)。示例1:三個隨機(jī)變量X,Y和Z的概率分布,有三個二維邊緣分布即(X,Y)的分布,(X,Z)的分布和(Y,Z)的分布,有三個單變量的邊緣分布即X的分布,Y的分布和Z的分布。示例2:若(X,Y)的分布為二維正態(tài)分布(2.65),則分別考慮X和Y的分布都是邊緣分布,且都是正態(tài)分布示例3:對多項(xiàng)分布(2.45),如果k>3,(X?,X?)的分布是邊緣分布。分別考慮x?,x?,…,x,中每個變量的分布也注1:在一個k維聯(lián)合分布中,包含k?(k?<k)個隨機(jī)變量的概率分布是邊緣分布。注2:給定一個用概率密度函數(shù)(2.26)表示的多維連續(xù)概率分布(2.23),其邊緣概率分布的概率密度函數(shù),可以通過概率密度函數(shù)對不屬于邊緣分布中的變量積分得到。注3:給定一個用概率函數(shù)(2.24)表示的多維離散概率分布(2.22),其邊緣概率分布的概率函數(shù),可以通過概率函數(shù)對不屬于邊緣分布中的變量求和得到。2.19條件概率分布conditionalprobabilitydistribution條件分布conditionaldistribution將樣本空間(2.1)限制在其一個非空子集上,且將受限制的樣本空間的概率調(diào)整為1的概率分布示例1:在2.7注4的示例中,給定電池一開始能工作的電池條件壽命分布為指數(shù)分布(2.58)。示例2:對二維正態(tài)分布(2.65),給定X=x,Y的條件概率分布反映了已知X的信息對Y的影響。示例3:考慮隨機(jī)變量X,它刻畫了每年某地由于毀滅性的颶風(fēng)事件造成的保險(xiǎn)損失的分布。因?yàn)樵诮o定一年中某地可能沒有任何颶風(fēng)發(fā)生,所以這個分布在0損失點(diǎn)可能存在一個非0的概率,因此感興趣的研究是在某地颶風(fēng)發(fā)生的年份中損失的條件分布。注1:在具有兩個隨機(jī)變量X和Y的分布中,既有X的條件分布也有Y的條件分布。X在Y=y下的條件分布稱注2:邊緣概率分布(2.18)可認(rèn)為是無條件分布。注3:上面的示例1說明了存在下面的情形:一個單變量的條件分布經(jīng)過設(shè)定條件后被調(diào)整為另一個單變量的分分布仍為具有相同參數(shù)的指數(shù)分布。注4:條件分布可用于某些特定結(jié)果是不可能時的離散分布。例如,在考慮腫瘤病人總體中,泊松分布可以作為在病人數(shù)嚴(yán)格為正(沒有腫瘤的人不作為病人)的條件下,腫瘤病人數(shù)的模型。注5:條件分布出現(xiàn)在把樣本空間限制在一個特定子集的情況下。對服從二維正態(tài)分布(2.65)的(X,Y),可能會對發(fā)生的事件必須落在單位正方形[0,1]×[0,1]上的(X,Y)的條件分布感興趣,也可能只是對給定X2+給定隨機(jī)變量X=x的條件下,隨機(jī)變量(2.10)Y的條件概率分布(2.19)的期望(2.12)值的集合。注:此處,回歸曲線是在(X,Y)服從一個二維分布(見2.17的注1)的框架下定義的,因此不同于通?;貧w分析中所討論的Y與自變量的某個確定集合的關(guān)系。給定隨機(jī)變量X?=x,和X?=x?的條件下,隨機(jī)變量(2.10)Y的條件概率分布(2.19)的期望注:如同2.20,此處的回歸曲面是在(Y,X?,X?)服從一個多維分布(2.17)的框架下定義的。因此也與回歸曲線一樣,此處的回歸曲面也是與回歸分析和響應(yīng)面方法中所用概念不同。樣本空間(2.1)是有限的或可列無限多的概率分布(2.11)。示例:離散分布的示例有多項(xiàng)分布(2.45)、二項(xiàng)分布(2.46)、泊松分布(2.47)、超幾何分布(2.48)和負(fù)二項(xiàng)分布注1:“離散”意味著樣本空間是有限的,或是無限可列的,其中序列是顯式的,如缺陷數(shù)為:0,1,2,…。例如,二項(xiàng)分布對應(yīng)于一個有限的樣本空間{0,1,2,…,n};而泊松分布對應(yīng)于一個可列無限的樣本空間{0,1,2,…}。注2:驗(yàn)收抽樣中的計(jì)數(shù)數(shù)據(jù)涉

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論