【位置參數(shù)估計(jì)及其應(yīng)用探究16000字(論文)】_第1頁
【位置參數(shù)估計(jì)及其應(yīng)用探究16000字(論文)】_第2頁
【位置參數(shù)估計(jì)及其應(yīng)用探究16000字(論文)】_第3頁
【位置參數(shù)估計(jì)及其應(yīng)用探究16000字(論文)】_第4頁
【位置參數(shù)估計(jì)及其應(yīng)用探究16000字(論文)】_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

位置參數(shù)估計(jì)及其應(yīng)用研究[摘要]本論文主要討論位置參數(shù)估計(jì)及其應(yīng)用。這里的位置參數(shù)是指均值,中位數(shù)或p分位數(shù)等,可以用來描述總體位置。對于位置參數(shù)的估計(jì),可以分為參數(shù)統(tǒng)計(jì)方法和非參數(shù)統(tǒng)計(jì)方法,參數(shù)統(tǒng)計(jì)方法和非參數(shù)統(tǒng)計(jì)方法的區(qū)別在于樣本的分布類型是否已知,若已知,則使用參數(shù)統(tǒng)計(jì)方法,若未知,則使用非參數(shù)統(tǒng)計(jì)方法,兩種方法各有優(yōu)勢。對于參數(shù)統(tǒng)計(jì)方法,本文主要總結(jié)了位置參數(shù)估計(jì)的一般方法。對于非參數(shù)統(tǒng)計(jì)方法,本文主要討論了非參數(shù)統(tǒng)計(jì)方法下分位點(diǎn)的點(diǎn)估計(jì)和區(qū)間估計(jì),除此以外還介紹了基于兩種非參數(shù)檢驗(yàn)方法的中位數(shù)估計(jì)方法,并探討了在實(shí)際問題中的應(yīng)用。[關(guān)鍵詞]位置參數(shù)區(qū)間估計(jì)點(diǎn)估計(jì)非參數(shù)統(tǒng)計(jì)參數(shù)統(tǒng)計(jì)位置參數(shù)檢驗(yàn)?zāi)夸?51501位置參數(shù)的研究背景 417021.1位置參數(shù)的類型 4401.2研究的目的和意義 6295902參數(shù)統(tǒng)計(jì)方法下的位置參數(shù)估計(jì) 6241582.1正態(tài)分布位置參數(shù)估計(jì) 7245742.1.1點(diǎn)估計(jì) 786122.1.2區(qū)間估計(jì) 991652.2三參數(shù)威布爾分布位置參數(shù)估計(jì) 11143213非參數(shù)統(tǒng)計(jì)方法下的位置參數(shù)估計(jì) 1371293.1位置參數(shù)估計(jì)的非參數(shù)統(tǒng)計(jì)方法 13324033.1.1總體分位數(shù)的估計(jì) 1473643.1.2中位數(shù)的估計(jì) 15230473.1.3一般中心位置參數(shù)的估計(jì) 17230203.2非參數(shù)位置參數(shù)檢驗(yàn) 17301153.2.1單樣本位置參數(shù)檢驗(yàn)方法 18186813.2.2雙樣本和多樣本位置參數(shù)檢驗(yàn)方法 22126574實(shí)證分析 2337874.1分位數(shù)在天然氣產(chǎn)量中的應(yīng)用 23143104.1.1數(shù)據(jù)收集及預(yù)處理 23104464.1.2分位數(shù)的估計(jì)和檢驗(yàn) 24169904.1.3基于符號檢驗(yàn)的中位數(shù)區(qū)間估計(jì) 26240664.1.4基于Wilcoxon符號秩檢驗(yàn)的中位數(shù)區(qū)間估計(jì) 2627014.2位置參數(shù)檢驗(yàn)方法在平穩(wěn)過程中的應(yīng)用 2774824.2.1數(shù)據(jù)收集及預(yù)處理 2761994.2.2均值函數(shù)的位置參數(shù)檢驗(yàn) 29231374.2.3相關(guān)函數(shù)的位置參數(shù)檢驗(yàn) 31引言位置參數(shù)一般指的是均值,中位數(shù)或p對于參數(shù)統(tǒng)計(jì)方法,本文主要總結(jié)了位置參數(shù)估計(jì)的一般方法——最大似然估計(jì)、矩估計(jì)法、相關(guān)系數(shù)法。對于非參數(shù)統(tǒng)計(jì)方法,本文主要討論了非參數(shù)統(tǒng)計(jì)方法下分位點(diǎn)的點(diǎn)估計(jì)和區(qū)間估計(jì),除此以外還介紹了基于兩種符號檢驗(yàn)和Wilcoxon符號秩檢驗(yàn)法的中位數(shù)估計(jì)方法。在實(shí)證分析中,對我國天然氣每月產(chǎn)量的分位數(shù)進(jìn)行了估計(jì)和檢驗(yàn),以及探討了單樣本下的位置參數(shù)檢驗(yàn)方法在平穩(wěn)過程中的應(yīng)用。1位置參數(shù)的研究背景1.1位置參數(shù)的類型對于位置參數(shù)的估計(jì),我們通常將其分為點(diǎn)估計(jì)和區(qū)間估計(jì),估計(jì)的對象又可以分為中心位置和分位數(shù)。在一般情況下,人們習(xí)慣用平均數(shù)來表示數(shù)據(jù)的中心位置,當(dāng)直方圖鐘形對稱時(shí),只用平均數(shù)是可以的,但如果直方圖是右偏或者左偏時(shí),只用平均數(shù)顯然是不夠的。如果數(shù)據(jù)中有異常值的話,平均數(shù)就容易受到異常值的影響,不能夠很準(zhǔn)確的代表數(shù)據(jù)的中心位置。相對平均數(shù)而言,切尾平均數(shù)就可以較好地反映一些有異常值的樣本數(shù)據(jù)的真實(shí)情況。α%切尾平均值指的是各去掉大的一頭和小的一頭的α%個(gè)數(shù)據(jù)后的平均數(shù),我們熟知的去掉一個(gè)最大值和一個(gè)最小值后的平均數(shù),就是切尾平均數(shù)。和切尾平均數(shù)類似的還有Winsor化平均數(shù),Winsor化平均數(shù)是指去掉兩端的異常值后,在兩端補(bǔ)上個(gè)端頭值,再計(jì)算個(gè)數(shù)據(jù)的平均數(shù)。除了以上介紹的幾種平均數(shù)以外,由于中位數(shù)不容易受到異常值的影響,它也能較好的反映數(shù)據(jù)的中心位置,例如一個(gè)樣本容量為12的數(shù)據(jù),去掉最大值和最小值之后的中位數(shù)和沒去掉之前的中位數(shù)相等,這就反映了中位數(shù)具有穩(wěn)健性,所以中位數(shù)也可以用來描述數(shù)據(jù)的中心位置。另外,眾數(shù)也可以用來描述數(shù)據(jù)的中心位置,對于一些定性數(shù)據(jù)的中心位置,計(jì)算平均數(shù)和中位數(shù)是沒有什么意義的,所以對于此類數(shù)據(jù),眾數(shù)能夠較好的描述數(shù)據(jù)的情況。所以我們建議使用平均數(shù)、中位數(shù)和眾數(shù),從不同的角度來表達(dá)數(shù)據(jù)的中心位置,還可以對數(shù)據(jù)的分布情況做出大致的描述。為什么平均數(shù)和中位數(shù)能夠表示數(shù)據(jù)的中心位置呢?“對于數(shù)據(jù)的中心位置,我們要求他到每個(gè)數(shù)據(jù)點(diǎn)的距離的和比較小。度量兩個(gè)點(diǎn)之間的距離通常有兩種方法:平方值距離和絕對值距離。不同的距離度量方法導(dǎo)出了描述數(shù)據(jù)中心位置的不同位置。平方值距離法導(dǎo)出的是平均數(shù),絕對值距離法導(dǎo)出的是中位數(shù),所以就這個(gè)意義而言,平均數(shù)和中位數(shù)同等重要。如果用平方值距離法,則一個(gè)點(diǎn)a到各個(gè)數(shù)據(jù)點(diǎn)x1,x2,?,xi=1n上式表示平均數(shù)這一點(diǎn)到個(gè)個(gè)數(shù)據(jù)點(diǎn)的平方值距離和最短,在使用平方值距離法時(shí),平均數(shù)就是數(shù)據(jù)的中心位置。如果用絕對值距離法,則一個(gè)點(diǎn)a到各個(gè)數(shù)據(jù)點(diǎn)x1,xi=1nx上式中表示中位數(shù)這一點(diǎn)到個(gè)個(gè)數(shù)據(jù)點(diǎn)的絕對值距離和最短,在使用絕對值距離法時(shí),中位數(shù)就是數(shù)據(jù)的中心位置?!盵1]數(shù)據(jù)總體的中心位置既可以用總體均值來表示,也可以用總體中位數(shù)或眾數(shù)來表示。除了中心位置以外,p分位數(shù)也是我們常關(guān)注的位置參數(shù),我們稱ξp為分位數(shù),如果它滿足:設(shè)ξp為分布函數(shù)的唯一p分位點(diǎn),則有F(ξp對于這些位置參數(shù)的估計(jì),我們將在下面內(nèi)容展開詳細(xì)敘述。1.2研究的目的和意義通過1.1節(jié)中對位置參數(shù)類型的介紹和分析,其中均值、中位數(shù)和分位數(shù)常用來描述總體的位置,所以本文將主要以這三種位置參數(shù)作為代表,重點(diǎn)將非參數(shù)中分位數(shù)和中位數(shù)以及一般中心位置的估計(jì)和檢驗(yàn)方法進(jìn)行歸納,并探討了它們在實(shí)際問題中的應(yīng)用,針對不同數(shù)據(jù)的類型,使用相對應(yīng)的方法,從而使位置參數(shù)的應(yīng)用更有實(shí)際意義。我們遇到的實(shí)際問題分布往往是未知的,此時(shí)非參數(shù)方法就顯現(xiàn)出了優(yōu)勢,我們想要得到某個(gè)位置參數(shù)的點(diǎn)估計(jì)或者區(qū)間估計(jì),或者是對于某個(gè)估計(jì)結(jié)果進(jìn)行檢驗(yàn),且對于不同的數(shù)據(jù),不同的方法的效果可能不同,基于這些考慮,本文對均值、中位數(shù)和分位數(shù)的估計(jì)和應(yīng)用進(jìn)行一個(gè)詳細(xì)的分析,使得對位置參數(shù)有更深刻的認(rèn)識。2參數(shù)統(tǒng)計(jì)方法下的位置參數(shù)估計(jì)在參數(shù)統(tǒng)計(jì)中,我們將不帶參數(shù)的統(tǒng)計(jì)量g(X1,X2,?,Xn),觀測值gx1,x2,?,xP則稱θ,本部分以正態(tài)分布和三參數(shù)威布爾分布為代表,介紹參數(shù)統(tǒng)計(jì)方法下的位置參數(shù)估計(jì)。2.1正態(tài)分布位置參數(shù)估計(jì)正態(tài)分布是數(shù)理統(tǒng)計(jì)中最重要的一個(gè)分布,由中心極限定理我們可知,一個(gè)隨機(jī)變量如果是由大量微小的、獨(dú)立的隨機(jī)因素疊加的結(jié)果,那么這個(gè)變量一般都可以認(rèn)為是服從正態(tài)分布。因此很多隨機(jī)變量的大樣本都可以用近似正態(tài)來描述,例如年降雨量、產(chǎn)品重量等都可以用正態(tài)分布描述,這一點(diǎn)從本文第三部分的非參數(shù)統(tǒng)計(jì)中也可以體現(xiàn),本節(jié)主要概括了正態(tài)分布的均值、分位點(diǎn)的點(diǎn)估計(jì)和區(qū)間估計(jì)。2.1.1點(diǎn)估計(jì)本小節(jié)討論了最大似然估計(jì)法和矩估計(jì)法,并運(yùn)用這兩種估計(jì)方法,對正態(tài)分布的均值進(jìn)行點(diǎn)估計(jì),對于分位點(diǎn)和中位數(shù)的估計(jì),本文將在3.1節(jié)具體展開介紹。最大似然估計(jì)法估計(jì)均值最大似然估計(jì)法基本原理“最大似然估計(jì)法的基本原理為:在隨機(jī)試驗(yàn)中,概率最大的事件最可能出現(xiàn)?!盵2]對于離散總體,設(shè)有樣本觀測值,該觀測值出現(xiàn)的概率依賴于某參數(shù)θ,將概率看作θ的函數(shù)L(θ),又稱為似然函數(shù),即L求最大似然估計(jì)量就是找到θ的估計(jì)量θ=θ(對于連續(xù)總體,我們可以用聯(lián)合概率密度函數(shù)來表示隨機(jī)變量在觀測值附近出現(xiàn)的可能性大小,并將其成為似然函數(shù),以下給出似然函數(shù)定義:定義2.1[3]設(shè)總體的概率函數(shù)為,,其中是一個(gè)未知參數(shù)或幾個(gè)未知參數(shù)組成的參數(shù)向量,是參數(shù)空間,是來自該總體的樣本,將樣本的聯(lián)合概率函數(shù)看成的函數(shù),用表示,簡記為,成為樣本的似然函數(shù),如果某統(tǒng)計(jì)量滿足則稱是的最大似然估計(jì),簡記為(maximumlikelihoodestimate).下面我們利用最大似然估計(jì)法來估計(jì)正態(tài)分布位置參數(shù)用最大似然法估計(jì)正態(tài)分布位置參數(shù)例1對于正態(tài)分布,概率密度函數(shù)為f設(shè)有樣本,則似然函數(shù)取對數(shù)后的結(jié)果為將方程右邊關(guān)于兩個(gè)分量分別求偏導(dǎo)并令其等于0,則可以得到似然方程組,對其進(jìn)行求解就可以得到的最大似然估計(jì)為矩估計(jì)法估計(jì)均值矩估計(jì)法基本原理“1900年英國統(tǒng)計(jì)學(xué)家皮爾遜提出了一個(gè)替換原理,后來人們將此方法稱為矩法,替換原理常指如下兩句話:用樣本矩替換總體矩,這里的矩可以是原點(diǎn)矩,也可以是中心矩。用樣本矩的函數(shù)替換相應(yīng)的總體矩的函數(shù)。”[3]用矩估計(jì)法估計(jì)正態(tài)分布位置參數(shù)對于正態(tài)分布,概率密度函數(shù)為f設(shè)有樣本,求正態(tài)分布的矩估計(jì)。我們知道,則。用來估計(jì),那么就是μ的矩估計(jì)。2.1.2區(qū)間估計(jì)本部分介紹了正態(tài)分布下當(dāng)方差已知和未知的情況下均值的置信區(qū)間,以及p分位數(shù)的置信區(qū)間,另外介紹了兩個(gè)正態(tài)總體的均值差的區(qū)間估計(jì)和一種特殊情況的區(qū)間估計(jì)——基于不完全數(shù)據(jù)的區(qū)間估計(jì)。均值置信區(qū)間設(shè)服從標(biāo)準(zhǔn)正態(tài)分布,是標(biāo)準(zhǔn)正態(tài)分布的上分位數(shù),如果滿,即也可以通過查標(biāo)準(zhǔn)正態(tài)分布表求出上分位數(shù)。當(dāng)時(shí),就是標(biāo)準(zhǔn)正態(tài)分布的中位數(shù)。已知,的置信區(qū)間由標(biāo)準(zhǔn)正態(tài)分布的對稱性和上分位數(shù)的定義,均值的置信區(qū)間為未知,的置信區(qū)間由于方差未知,我們不能繼續(xù)用方差已知時(shí)的方法來估計(jì)均值,已知樣本函數(shù)服從自由度為的分布,不依賴于任何參數(shù),這時(shí)由分布的對稱性和上分位數(shù)的定義,均值的置信區(qū)間為基于不完全數(shù)據(jù)的區(qū)間估計(jì)在產(chǎn)品的壽命試驗(yàn)中,常常存在截尾的不完全數(shù)據(jù),知網(wǎng)文獻(xiàn)[4]討論了在小樣本和大樣本情況下的位置參數(shù)的置信區(qū)間,并且此方法還適用于樣本中存在異常值的情況,具有一定的穩(wěn)健性。其推導(dǎo)過程如下:構(gòu)造樞軸量設(shè)X1,X2,Hr=X定理2.1[4]公式(2-5)定義的Hr的概率分布與參數(shù)μ,以Hr為樞軸量對位置參數(shù)進(jìn)行區(qū)間估計(jì),只需要知道樣本的順序統(tǒng)計(jì)量中關(guān)于其中心對稱的兩個(gè)順序統(tǒng)計(jì)量X構(gòu)造Monte-Carlo置信區(qū)間樞軸量Hr是在以12(X(r)定理2.2[4]設(shè)總體X~N(μ,σ2)nn其中φ(x),?(x)分別是標(biāo)準(zhǔn)正態(tài)分布函數(shù)和分布密度函數(shù)。利用Monte-Carlo方法,設(shè)置信水平為1?α(0<α<1),樣本容量為,查表可得相應(yīng)的上側(cè)分位數(shù)?α2,則μ在置信水平為11構(gòu)造大樣本的近似置信區(qū)間由文獻(xiàn)[4]可知,Hr近似服從N0,p2nφ122.2三參數(shù)威布爾分布位置參數(shù)估計(jì)威爾布分布是可靠性領(lǐng)域中一種十分重要的分布,應(yīng)用十分廣泛,對于參數(shù)估計(jì),人們提出了例如最大似然估計(jì)、最佳線性無偏估計(jì)、圖估計(jì)法、杜貝估計(jì)發(fā)等。但這些方法僅針對于形狀參數(shù)和尺度參數(shù)的估計(jì),對于位置參數(shù)的估計(jì),有幾種方法可用,但是相對誤差較大或難以計(jì)算,由文獻(xiàn)[5]可知,由相關(guān)系數(shù)法,得到的位置參數(shù)估計(jì)精度高,算法簡單,且易于實(shí)現(xiàn),與其他方法相比,簡便了許多,也提高了精度,其簡單推導(dǎo)的過程如下:用相關(guān)系數(shù)法估計(jì)位置參數(shù)基本原理威爾布分布的分布函數(shù):F(t)=1?e?其中:-形狀參數(shù),;-尺度參數(shù),;-位置參數(shù),;-產(chǎn)品壽命,;-分布函數(shù),。對(2-1)進(jìn)行變形處理,可以得到以下的式子:lnln1令Y則(2-2)可以變?yōu)閅=mX?可以看出(2-3)是一個(gè)直線方程,當(dāng)估計(jì)正確時(shí),X和Y呈線性關(guān)系,根據(jù)回歸直線,就可以求出和,但如果估計(jì)不正確時(shí),X和Y之間的線性關(guān)系就會(huì)被破壞,回歸方程不再是一條直線,而是一條曲線,當(dāng)?shù)墓烙?jì)偏差越大,則曲線彎曲越嚴(yán)重,回歸求解和表現(xiàn)為X和Y的相關(guān)系數(shù)減小,估計(jì)偏差越大,相關(guān)系數(shù)越小。的估計(jì)值與相關(guān)系數(shù)的關(guān)系是當(dāng)最大時(shí),是位置參數(shù)的最佳估計(jì)值。用相關(guān)系數(shù)法估計(jì)位置參數(shù)的計(jì)算公式設(shè)容量為的樣本來自威爾布分布母體,其樣本觀察值從小到大排序?yàn)閠1≤t2R其中:x令S則可簡化為R對于威爾布分布恒有,故求對的一階導(dǎo)數(shù)與求對的一階導(dǎo)數(shù)對求而言是等價(jià)的,這里僅計(jì)算對的一階導(dǎo)數(shù)。令v=(n求導(dǎo)后可以得到方程u由于y0≠0,v≠0,所以要使(nS至此,求解γ的方程已給出,在給定樣本觀察值之后,公式(2-4)只含有γ這一個(gè)未知量,那么γ則可以很容易求得。3非參數(shù)統(tǒng)計(jì)方法下的位置參數(shù)估計(jì)非參數(shù)統(tǒng)計(jì)是相對于參數(shù)統(tǒng)計(jì)而出現(xiàn)的,經(jīng)典的參數(shù)統(tǒng)計(jì)要求數(shù)據(jù)是分布已知的或者服從正態(tài)分布,如果假設(shè)條件和真實(shí)數(shù)據(jù)不符,那么其正確性就會(huì)受到影響,而非參數(shù)統(tǒng)計(jì)不要求總體分布要服從某個(gè)具體的分布,即使真實(shí)模型與假定理論有所偏差,非參數(shù)統(tǒng)計(jì)方法仍然能維持較好的性質(zhì),至少不會(huì)變得太差,所以可以使用的領(lǐng)域十分廣泛,故非參數(shù)統(tǒng)計(jì)方法具有的優(yōu)點(diǎn)是:適用面廣、假定條件較少、具有穩(wěn)健性。接下來引入非參數(shù)方法下的位置參數(shù)估計(jì),以及檢驗(yàn)方法。3.1位置參數(shù)估計(jì)的非參數(shù)統(tǒng)計(jì)方法我們假設(shè)X1,X2,?,Xn來自總體X,X下面將一些位置參數(shù)的非參數(shù)點(diǎn)估計(jì)方法和區(qū)間估計(jì)方法分述如下。3.1.1總體分位數(shù)的估計(jì)本小節(jié)分為總體分位數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì),區(qū)間估計(jì)分為小樣本和大樣本兩種情況。點(diǎn)估計(jì)設(shè)ξp為分布函數(shù)的唯一p分位點(diǎn),則有F(ξp)=p,即Px≤ξp=p。當(dāng)F(x)為嚴(yán)格單調(diào)時(shí),其ξ特別地,當(dāng)p=1ξ定理3.1[6]設(shè)簡單樣本X1,X2,?,XnP區(qū)間估計(jì)小樣本的情況設(shè)X(1)≤X(2)≤?≤W且有PWk由樣本X1,XX1,X2,P可見,給定n,i,j值即可計(jì)算此概率值,所以給定置信水平1?1在n不太大時(shí),可由二項(xiàng)分布表查出相對應(yīng)的i和j,就可以得到唯一的p分位數(shù),ξp的置信度為1?α的置信區(qū)間X(i),X(j);當(dāng)n較大時(shí),較小的p值可采用泊松分布近似計(jì)算得到,較大的p值可以通過正態(tài)分布近似計(jì)算得到。當(dāng)要求中位數(shù)時(shí),令大樣本的情況“當(dāng)n比較大時(shí),對于給定的置信水平1?m其中,fn代替,其中為樣本落在區(qū)間內(nèi)的個(gè)數(shù),為小區(qū)間長度,具體長度可由數(shù)據(jù)區(qū)間若干等分得到?!盵6]3.1.2中位數(shù)的估計(jì)點(diǎn)估計(jì)通常我們會(huì)直接使用樣本中位數(shù)來估計(jì)總體中位數(shù),即3.1.1節(jié)中總體分位數(shù)估計(jì)中當(dāng)時(shí)的特殊情況,下面我們介紹一種基于Wilcoxon符號秩檢驗(yàn)的點(diǎn)估計(jì)方法,Wilcoxon符號秩檢驗(yàn)法的原理將在3.2中具體展開介紹?;赪ilcoxon符號秩檢驗(yàn)的點(diǎn)估計(jì)[7]為了更大程度的利用數(shù)據(jù),可以通過求每兩個(gè)數(shù)的平均值(Xi+Xj)/2,i≤j(一共有(n(n+1))/2個(gè))來擴(kuò)大樣本的數(shù)目,這樣的平均叫做Walsh平均,令W+=#(區(qū)間估計(jì)關(guān)于總體中位數(shù)的區(qū)間估計(jì),在3.1.1節(jié)中,我們介紹了一般分位點(diǎn)的區(qū)間估計(jì)方法,當(dāng)時(shí),即為總體中位數(shù)的區(qū)間估計(jì),接下來我們介紹兩種特別的區(qū)間估計(jì)方法——基于符號檢驗(yàn)、Wilcoxon符號秩檢驗(yàn)的中位數(shù)區(qū)間估計(jì)?;诜枡z驗(yàn)的中位數(shù)區(qū)間估計(jì)此方法是基于符號檢驗(yàn)法提出的,具體方法如下:給定一個(gè)置信水平,并且令置信區(qū)間的下限為,上限為,設(shè)X1,X2,?,計(jì)算值。由于符號檢驗(yàn)的本質(zhì)是二項(xiàng)分布,大于中位數(shù)的觀測值記為正號,小于中位數(shù)的觀測值記為負(fù)號,并且正號和負(fù)號出現(xiàn)的概率應(yīng)該相等,即0.05,那么我們有其中n為樣本容量。于是查二項(xiàng)分布表就可以得到相應(yīng)的值,值是二項(xiàng)分布中當(dāng)樣本容量為n時(shí),出現(xiàn)正號或者符號的最大個(gè)數(shù)。將樣本觀測值編秩,在給定的顯著性水平的置信區(qū)間為,則大樣本近似法。若樣本容量時(shí),則可以使用大樣本近似法估計(jì)區(qū)間,其中基于Wilcoxon符號秩檢驗(yàn)的中位數(shù)區(qū)間估計(jì)[7]此方法是基于Wilcoxon符號秩檢驗(yàn)法提出的,我們知道Wilcoxon符號秩檢驗(yàn)法要求樣本分布是對稱的,那么基于此方法的區(qū)間估計(jì)也必須滿足這個(gè)條件,第二部分我們介紹了基于Wilcoxon符號秩檢驗(yàn)法的中位數(shù)點(diǎn)估計(jì),使用了Walsh平均來估計(jì)總體中位數(shù),接著我們按照升冪排列Walsh平均,記為W那么就可以得到置信水平為1?α下的置信區(qū)間為W當(dāng)樣本是小樣本時(shí),k可查表得到,當(dāng)樣本容量時(shí)為大樣本,k可以近似為:k=3.1.3一般中心位置參數(shù)的估計(jì)設(shè)是來自同一總體,根據(jù)來估計(jì)中心位置。中心位置可以用樣本中位數(shù)、樣本均值估計(jì),也可以用切尾均值和Winsor化均值估計(jì),Winsor化均值是指去掉兩端的異常值后,再在兩端補(bǔ)上個(gè)端頭值,在計(jì)算個(gè)數(shù)據(jù)的平均值。3.2非參數(shù)位置參數(shù)檢驗(yàn)在參數(shù)統(tǒng)計(jì)中,最常用的位置參數(shù)是均值,所以關(guān)于位置參數(shù)的檢驗(yàn)大多是關(guān)于均值的檢驗(yàn)問題,但對于非參數(shù)統(tǒng)計(jì),在抽取一樣本數(shù)據(jù)后,我們常常較關(guān)心總體的中心位置或者分位點(diǎn),中位數(shù)就是二分之一分位點(diǎn),也較常用,所以大部分的位置參數(shù)的檢驗(yàn)方法是圍繞中位數(shù)或其他分位點(diǎn)的檢驗(yàn)展開的,但其思想方法是通用的,以下介紹的方法亦適用于均值,根據(jù)對象的不同,可能會(huì)得到不同的p值。本節(jié)我們主要介紹了單樣本情況下的位置參數(shù)檢驗(yàn)方法,如符號檢驗(yàn)、游程檢驗(yàn)、Wilcoxon符號秩檢驗(yàn),以及雙樣本、多樣本情況下位置參數(shù)檢驗(yàn)方法。3.2.1單樣本位置參數(shù)檢驗(yàn)方法單樣本數(shù)據(jù)中中位數(shù)、均值均可以表示中心的位置,對于中位數(shù)進(jìn)行點(diǎn)估計(jì)得到的是樣本中位數(shù),對均值進(jìn)行點(diǎn)估計(jì)得到是樣本均值,如果數(shù)據(jù)是對稱的單峰數(shù)據(jù),那么中位數(shù)和均值的差別不大,但如果是非對稱分布,中位數(shù)比均值更穩(wěn)健。下面我們介紹三種單樣本位置參數(shù)檢驗(yàn)方法:符號檢驗(yàn)、游程檢驗(yàn)、Wilcoxon符號秩檢驗(yàn)。隨機(jī)游程檢驗(yàn)如果一個(gè)總體,可以分成兩類,并用字母A,B或者數(shù)字10來表示,當(dāng)樣本按某種順序呈現(xiàn),一個(gè)或多個(gè)連續(xù)出現(xiàn)時(shí),就稱之為游程,一個(gè)游程中包含的符號的個(gè)數(shù)就是游程的長度,例如111000110的游程數(shù)就是4,其中有一個(gè)長度為3的1游程,一個(gè)長度為3的0游程,一個(gè)長度為2的1游程,一個(gè)長度為1的0游程。游程檢驗(yàn)的基本方法是:如果想要判斷一個(gè)有序數(shù)列的排列是否是隨機(jī)的,可以將假設(shè)組設(shè)為:H如果是像判斷某種傾向的話,假設(shè)組可以設(shè)為:H或者H將一類的符號的個(gè)數(shù)記為,另一類即為,則,引入統(tǒng)計(jì)量游程總數(shù)目。如果原假設(shè)是真的,那么兩類符號出現(xiàn)的可能性相等,在序列中交互出現(xiàn),如果游程的總數(shù)目過少,就說明有一段游程的長度多長,即同一種符號連續(xù)出現(xiàn)的個(gè)數(shù)很多,則序列有成群的傾向;反之,如果游程總數(shù)過多,則說明序列有混合的傾向。不管是過多還是過少,都說明原假設(shè)是假的,即序列不是隨機(jī)的。在原假設(shè)成立的情況下,檢驗(yàn)統(tǒng)計(jì)量的條件分布為:當(dāng)是偶數(shù)時(shí),設(shè),則P(U=2k)=當(dāng)U是奇數(shù)時(shí),設(shè),則P在這里我們規(guī)定個(gè)數(shù)大的記為m,反之個(gè)數(shù)小的記為n。根據(jù)上面的計(jì)算公式可以得到在原假設(shè)成立時(shí)P(R≥r)或P(R≤r)的值,并根據(jù)p值做出判斷。但對于大樣本情況,上面給出的公式難以計(jì)算,所以我們利用正態(tài)近似作檢驗(yàn)統(tǒng)計(jì)量Z=于是可以查正態(tài)分布表得到相應(yīng)的p值并做出判斷。符號檢驗(yàn)“符號檢驗(yàn)又分為廣義符號檢驗(yàn)和狹義符號檢驗(yàn),那么廣義符號檢驗(yàn)指的是針對所有的分位點(diǎn)的檢驗(yàn),而狹義的符號檢驗(yàn)是指僅對中位數(shù)進(jìn)行的檢驗(yàn)?!盵7]假定檢驗(yàn)的原假設(shè)是H0:Qπ=記樣本中小于q0的數(shù)據(jù)的個(gè)數(shù)為S?,而大于q0的數(shù)據(jù)的個(gè)數(shù)為S+,記n=S?+S+,K=min(S+,S?),按照原假設(shè)的情況,S?和n表3-1p值計(jì)算表(Qπ原假設(shè)備擇假設(shè)p值使檢驗(yàn)有意義的條件HHPQHH1QHH2當(dāng)n比較小時(shí),我們可以通過計(jì)算二項(xiàng)分布的公式來計(jì)算p值(p值計(jì)算表如表3-1所示),但當(dāng)樣本量過大時(shí),計(jì)算存在困難,所以我們利用正態(tài)近作檢驗(yàn)統(tǒng)計(jì)量Z=于是可以查正態(tài)分布表得到相應(yīng)的p值并做出判斷。Wilcoxon符號秩檢驗(yàn)[8]符號檢驗(yàn)是將樣本觀測值和假設(shè)的對稱中心的符號來進(jìn)行檢驗(yàn),但是并沒有很好的利用差(絕對值)的大小所蘊(yùn)含的信息,僅代表了對稱中心的兩邊,卻沒有表明該點(diǎn)距離中心的遠(yuǎn)近,其檢驗(yàn)思想為:首先把樣本數(shù)據(jù)按照其絕對值X1,X2,...,X(1)Xi?M(2)將Xi(3)令W+為Xi?M0>0的Xi?(4)對于雙邊檢驗(yàn)H0:M=M0?H1:M≠M(fèi)0,對于原假設(shè)W?和W+應(yīng)該差不多,如果不符合的話,則說明應(yīng)該拒絕原假設(shè)。對于雙邊假設(shè),W應(yīng)該?。?)根據(jù)W值,查表可以得到p值,再根據(jù)p值的大小選擇是否接受原假設(shè)?!盵7]小樣本情況下p值可以查表得到,但如果是大樣本情況,可以利用正態(tài)近似來構(gòu)造漸近正態(tài)統(tǒng)計(jì)量Z=再通過正態(tài)分布查表得到p值。對于此檢驗(yàn),要求總體是連續(xù)對稱分布,如果不是的話,則不能使用,應(yīng)該選擇符號檢驗(yàn)。如果是打結(jié)的情況,則無法進(jìn)行精確的Wilcoxon符號秩檢驗(yàn)的計(jì)算。符號檢驗(yàn)和Wilcoxon符號秩檢驗(yàn)比較前面的介紹我們可以看出符號檢驗(yàn)和Wilcoxon符號秩檢驗(yàn)的異同之處,Wilcoxon符號秩檢驗(yàn)在符號檢驗(yàn)的基礎(chǔ)上,利用了樣本與中心位置的距離(即絕對值),再對符號秩進(jìn)行求和,根據(jù)兩種符號秩的大小,來判斷是否要拒絕原假設(shè),那么這兩種檢驗(yàn)在實(shí)際應(yīng)用中的效果如何呢?符號檢驗(yàn)可以用于判斷位置參數(shù),也可以應(yīng)用在成對數(shù)據(jù)中,我們知道,成對數(shù)據(jù)問題中符號檢驗(yàn)是配對檢驗(yàn)的簡化,在一般成對數(shù)據(jù)的問題中,如果配對t檢驗(yàn)和符號檢驗(yàn)都可以使用,配對檢驗(yàn)更有效,但對于定性數(shù)據(jù)的問題,配對t檢驗(yàn)就無法使用,符號檢驗(yàn)就體現(xiàn)出了優(yōu)勢。此外符號檢驗(yàn)也廣泛的應(yīng)用于其他領(lǐng)域,例如文獻(xiàn)[9]在研究圖像中值濾波及其快速算法中使用了符號檢驗(yàn),提高了圖像處理速度;文獻(xiàn)[10]將符號檢驗(yàn)改進(jìn)后應(yīng)用于模型檢驗(yàn)問題。我們可以很容易地發(fā)現(xiàn),Wilcoxon符號秩檢驗(yàn)是在符號檢驗(yàn)的基礎(chǔ)上做的了一些改進(jìn)的檢驗(yàn)方法,但需要在對稱分布的情況下才可以使用,Wilcoxon符號秩檢驗(yàn)也廣泛應(yīng)用于實(shí)際問題的解決,例如文獻(xiàn)[11][12]中使用Wilcoxon符號秩檢驗(yàn)來檢驗(yàn)培訓(xùn)有效性、產(chǎn)品質(zhì)檢、績效等問題。文獻(xiàn)[13]中,對黃石國家公園間歇式溫泉噴發(fā)時(shí)間位置參數(shù)的檢驗(yàn)使用了符號檢驗(yàn)和Wilcoxon符號秩檢驗(yàn),但卻得到了相反的判斷結(jié)果,從其他圖表可以看出,該樣本的數(shù)據(jù)并不是對稱的,但Wilcoxon符號秩檢驗(yàn)只適用于對稱數(shù)據(jù),這樣我們可以得知,盡管Wilcoxon符號秩檢驗(yàn)更大程度的利用了樣本數(shù)據(jù)提供的信息,在處理非對稱分布的問題時(shí),符號檢驗(yàn)比Wilcoxon秩和檢驗(yàn)要可靠。文獻(xiàn)[14]中,對一配對數(shù)據(jù),比較兩種流速生產(chǎn)無水醇的含醇率,同樣使用了符號檢驗(yàn)和Wilcoxon符號秩檢驗(yàn),得到了不同的判斷結(jié)果,但通過驗(yàn)證,在近似正態(tài)分布的條件下,使用配對比較t檢驗(yàn)的結(jié)果和Wilcoxon符號秩檢驗(yàn)的結(jié)果是一致的,且直方圖沒有顯示該樣本分布不是對稱的,說明此時(shí)Wilcoxon符號秩檢驗(yàn)此時(shí)是可用的,且Wilcoxon符號秩檢驗(yàn)比符號檢驗(yàn)效果更好。可見,在不同的情況下,不同的檢驗(yàn)方法檢驗(yàn)的效果可能不同,每種方法都各有其優(yōu)缺點(diǎn),和適用的范圍,在解決實(shí)際的問題時(shí),不妨都使用再進(jìn)行比較分析。符號檢驗(yàn)和游程檢驗(yàn)比較從前面的理論介紹我們可以知道,符號檢驗(yàn)和游程檢驗(yàn)思想上是有相同點(diǎn)的,他們都只利用樣本數(shù)據(jù)和位置參數(shù)的差的符號進(jìn)行判斷。符號檢驗(yàn)的應(yīng)用前面已經(jīng)介紹過,游程檢驗(yàn)一般是應(yīng)用于時(shí)間序列的隨機(jī)性檢驗(yàn),游程檢驗(yàn)又可以分為游程個(gè)數(shù)檢驗(yàn)和游程長度檢驗(yàn),游程個(gè)數(shù)檢驗(yàn)可以判斷判斷樣本數(shù)據(jù)是否是隨機(jī)出現(xiàn)的,也可以用于判斷兩組樣本是否有顯著差異,游程長度檢驗(yàn)可以判斷一段時(shí)間序列是否有上升或者下降的趨勢。所以許多和時(shí)間序列有關(guān)的問題都可以進(jìn)行游程檢驗(yàn),可以應(yīng)用在一些醫(yī)療領(lǐng)域的問題中,例如在流行病學(xué)應(yīng)用中,“游程個(gè)數(shù)檢驗(yàn)適用于疾病發(fā)展趨勢、發(fā)病時(shí)間聚集性或周期性、發(fā)病空間聚集性、成組資料差異顯著性檢驗(yàn)等,游程長度檢驗(yàn)更適用于干預(yù)或控制的效果評價(jià)等局部時(shí)間范圍內(nèi)疾病發(fā)展趨勢判定”[15];游程檢驗(yàn)也常用于金融領(lǐng)域中股票市場或證券市場問題的分析。3.2.2雙樣本和多樣本位置參數(shù)檢驗(yàn)方法雙樣本位置參數(shù)檢驗(yàn)方法有Brown-Mood中位數(shù)檢驗(yàn)和Mann-Whitney-Wilcoxon秩和檢驗(yàn),其中Brown-Mood中位數(shù)檢驗(yàn)是符號檢驗(yàn)在雙樣本情況下的推廣,而Mann-Whitney-Wilcoxon秩和檢驗(yàn)是Wilcoxon符號秩檢驗(yàn)在雙樣本情況下的推廣。多樣本位置參數(shù)檢驗(yàn)方法有Kruskal-Wallis檢驗(yàn)和Jonckheere-Terpstra檢驗(yàn),其中Kruskal-Wallis檢驗(yàn)是Mann-Whitney-Wilcoxon秩和檢驗(yàn)在多樣本情況下的推廣,用于檢驗(yàn)三個(gè)或三個(gè)以上的樣本分布是否相同,即多樣本位置參數(shù)的無方向問題,而Jonckheere-Terpstra檢驗(yàn)用于檢驗(yàn)三個(gè)或以上的樣本分布是否有相同的上升或者下降的趨勢,即多樣本位置參數(shù)的有方向問題。[16]4實(shí)證分析前面我們介紹了位置參數(shù)的估計(jì)方法和檢驗(yàn)方法,本章我們利用位置參數(shù)估計(jì)方法和檢驗(yàn)方法來探討一些實(shí)際應(yīng)用。4.1分位數(shù)在天然氣產(chǎn)量中的應(yīng)用在實(shí)際情況中,我們常常想要知道某個(gè)樣本數(shù)據(jù)的總體位置情況如何,那么這就需要對分位數(shù)進(jìn)行估計(jì),又或者我們想知道某個(gè)位置參數(shù)估計(jì)的效果如何,那么就需要用到檢驗(yàn)方法,接下來,我們以我國天然氣每月產(chǎn)量為例,探討分位點(diǎn)的應(yīng)用。4.1.1數(shù)據(jù)收集及預(yù)處理我們收集了近幾年我國月度天然氣產(chǎn)量的數(shù)據(jù)(除每年1、2月),數(shù)據(jù)引用自國家數(shù)據(jù)網(wǎng),我國2017-2020年天然氣每月產(chǎn)量當(dāng)期值如表4-1所示,記為,對我國天然氣每月產(chǎn)量的中位數(shù)進(jìn)行估計(jì)。表4-1我國2017-2020年天然氣每月產(chǎn)量當(dāng)期值時(shí)間2017.32017.42017.52017.62017.7當(dāng)期值(億立方米)135.8122.0119.9115.5117.4時(shí)間2017.82017.92017.102017.112017.12當(dāng)期值(億立方米)119.5111.5124.1126.3136.1時(shí)間2018.32018.42018.52018.62018.7當(dāng)期值(億立方米)135.2128.9126.2121.8129.6時(shí)間2018.82018.92018.102018.112018.12當(dāng)期值(億立方米)129.0121.8134.2142.7152.5時(shí)間2019.32019.42019.52019.62019.7當(dāng)期值(億立方米)150.6140.8144.2139.2139.0時(shí)間2019.82019.92019.102019.112019.12當(dāng)期值(億立方米)138.1135.2145.6150.8160.2時(shí)間2020.32020.42020.52020.62020.7當(dāng)期值(億立方米)168.6161.4159.4151.9142.4時(shí)間2020.82020.92020.102020.112020.12當(dāng)期值(億立方米)142.1145.9163.2168.6187.1使用SPSS軟件作樣本觀測值的簡單直方圖(如圖4-1所示),考察樣本是否是對稱分布,由直方圖可以看出,沒有明顯的證據(jù)表明樣本數(shù)據(jù)是非對稱分布,且由于我們的樣本容量為40,由正態(tài)曲線我們可以看出,我們可以將樣本看作近似正態(tài)。那么下面我們分為三個(gè)部分,第一部分對分位數(shù)進(jìn)行估計(jì),并使用符號檢驗(yàn)法對估計(jì)結(jié)果進(jìn)行檢驗(yàn),后兩個(gè)部分應(yīng)用基于符號檢驗(yàn)和Wilcoxon符號秩檢驗(yàn)的方法對我國天然氣每月產(chǎn)量的中位數(shù)進(jìn)行區(qū)間估計(jì)并進(jìn)行比較。圖4-1天然氣每月產(chǎn)量當(dāng)期值直方圖4.1.2分位數(shù)的估計(jì)和檢驗(yàn)點(diǎn)估計(jì):根據(jù)3.1.1小節(jié)介紹的分位數(shù)估計(jì)方法,以樣本分位點(diǎn)作為總體分位數(shù)的估計(jì),那么分位數(shù)和分位數(shù)分別為再使用符號檢驗(yàn)對兩個(gè)分位點(diǎn)的估計(jì)結(jié)果進(jìn)行檢驗(yàn),通過SPSS軟件得到結(jié)果如表4-2和表4-3所示表4-21/4分位點(diǎn)符號檢驗(yàn)結(jié)果檢驗(yàn)量(1/4分位點(diǎn))126.2小于1/4分位點(diǎn)的個(gè)數(shù)10大于1/4分位點(diǎn)的個(gè)數(shù)30總數(shù)40符號檢驗(yàn)值0.584表4-33/4分位點(diǎn)符號檢驗(yàn)結(jié)果檢驗(yàn)量(3/4分位點(diǎn))150.6小于1/4分位點(diǎn)的個(gè)數(shù)30大于1/4分位點(diǎn)的個(gè)數(shù)10總數(shù)40符號檢驗(yàn)值0.560可以看出兩個(gè)分位數(shù)符號檢驗(yàn)的值都大于給定的顯著性水平0.05,所以可以認(rèn)為我們將樣本分位數(shù)作為總體分位數(shù)的估計(jì)是有效的。區(qū)間估計(jì):根據(jù)3.1.1小節(jié)介紹的大樣本情況下分位數(shù)估計(jì)方法,可以講區(qū)間[110,188]六等分,則每個(gè)區(qū)間的長度為13,即,以剛剛我們作的分位數(shù)點(diǎn)估計(jì)結(jié)果作為總體分位數(shù)和的估計(jì),它們所在的區(qū)間的頻數(shù)分別為11和7,通過計(jì)算可以得到在置信水平為95%的情況下,和的置信區(qū)間分別為同理我們也可以計(jì)算得到中位數(shù)的置信區(qū)間為補(bǔ)!?。。。。?.1.3基于符號檢驗(yàn)的中位數(shù)區(qū)間估計(jì)由于樣本容量為40,那么使用大樣本近似法,假定置信水平為95%計(jì)算得到取,則中位數(shù)的置信區(qū)間為通過R軟件可以得到相同的結(jié)果,我們可以精確的置信水平為96.2%,即使用符號檢驗(yàn)法估計(jì)的我國天然氣每月產(chǎn)量的中位數(shù)在置信水平為96.2%下的置信區(qū)間為。4.1.4基于Wilcoxon符號秩檢驗(yàn)的中位數(shù)區(qū)間估計(jì)由于樣本容量為40,可以使用大樣本近似法,計(jì)算得到由于Walsh平均值的個(gè)數(shù)有820個(gè),所以我們使用R軟件可以得到,置信區(qū)間為,置信水平為95%,那么我們可以得知,使用Wilcoxon符號秩檢驗(yàn)法估計(jì)的我國天然氣每月產(chǎn)量的中位數(shù)在置信水平為95%下的置信區(qū)間為,可以看出在置信水平差不多的情況下,基于Wilcoxon符號秩檢驗(yàn)估計(jì)的區(qū)間比符號檢驗(yàn)短得多,可以認(rèn)為基于Wilcoxon符號秩檢驗(yàn)估計(jì)的區(qū)間效果更好。通過比較我們可以得知,在總體分布是對稱的情況下,使用Wilcoxon符號秩檢驗(yàn)法估計(jì)的效果比符號檢驗(yàn)法要好,但如果總體分布是非對稱的,則只能只用符號檢驗(yàn),類似的,若想對數(shù)據(jù)進(jìn)行區(qū)間估計(jì),需要先對分布進(jìn)行判斷,在選擇相應(yīng)的方法。4.2位置參數(shù)檢驗(yàn)方法在平穩(wěn)過程中的應(yīng)用如果一類過程,處于某種平穩(wěn)狀態(tài),其主要性質(zhì)只和變量之間的時(shí)間間隔有關(guān),與所考察的起始點(diǎn)無關(guān),那么這樣的過程叫做平穩(wěn)過程,以下給出平穩(wěn)過程嚴(yán)格定義兩條:定義4.1[17]如果隨機(jī)過程Xt,t∈T對任意的t1,t2,?,tnX則稱該過程為嚴(yán)平穩(wěn)的,對于嚴(yán)平穩(wěn)過程而言,有限維分布關(guān)于時(shí)間是平移不變的,但嚴(yán)平穩(wěn)過程條件很強(qiáng)不容易驗(yàn)證,所以引入了另一種寬平穩(wěn)過程。定義4.2[17]如果隨機(jī)過程Xt4.2.1數(shù)據(jù)收集及預(yù)處理接下來我們引用一個(gè)時(shí)間序列實(shí)例,,某條河流上的一個(gè)水文觀測站從1915年到1973年記錄了每年最大徑流量共59個(gè)數(shù)據(jù)x1,x2,?,序號i12345678910x156008960104001060010820988098501090088109960序號i11121314151617181920x122007510864063806810882014400744072406430序號i21222324252627282930x11100731092605290913074806980965072608750序號i31323334353637383940x99007310904073108850784010700619096107580序號i41424344454647484950x99906150825060308980618096309490231011100序號i515253545556575859x509010900649012600664074306760100009300表4-4最大徑流量首先,根據(jù)時(shí)間序列數(shù)據(jù)畫出時(shí)間序列圖和自相關(guān)系數(shù)圖以及直方圖(如圖4-2和圖4-3所示)圖4-2圖4-3從時(shí)間序列圖我們可以看出該序列在某一值附近波動(dòng)且無明顯上升和下降趨勢,可以初步判斷該序列是平穩(wěn)的,再看直方圖,可以大致判斷該序列是單峰對稱序列。我們知道嚴(yán)平穩(wěn)條件太強(qiáng)難以證明,那么當(dāng)能夠證明某時(shí)間序列是寬平穩(wěn)過程時(shí),就可以認(rèn)為這個(gè)序列是平穩(wěn)的,寬平穩(wěn)過程需要滿足兩個(gè)條件:1、均值函數(shù)μx2、相關(guān)函數(shù)RX(τ)=EX(s)X(s+τ)只與時(shí)間差那么下面我們分兩個(gè)部分來證明:4.2.2均值函數(shù)的位置參數(shù)檢驗(yàn)由已知數(shù)據(jù),我們可以求得樣本均值,將樣本均值作為總體均值的估計(jì),再將樣本觀測值與樣本均值作比較,如果樣本觀測值都在樣本均值附近波動(dòng),那么我們就可以認(rèn)為均值函數(shù)是固定的常數(shù),由于均值屬于常用位置參數(shù),我們自然可以使用單樣本中的位置參數(shù)檢驗(yàn)方法,下面我們使用單樣本位置參數(shù)中的符號檢驗(yàn)、Wilcoxon符號秩檢驗(yàn)、游程檢驗(yàn)這三種方法來進(jìn)行驗(yàn)證:建立原假設(shè)原假設(shè)均值函數(shù)是常數(shù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量計(jì)算可得樣本均值x=1Ni=1方法1:符號檢驗(yàn)令樣本中大于均值的數(shù)據(jù)為“+”,小于均值的數(shù)據(jù)為“-”,統(tǒng)計(jì)得到正號的個(gè)數(shù)s+為32,負(fù)號的個(gè)數(shù)sZ=查正態(tài)分布表得到p值為0.2578到0.2546之間,顯然大于給定的顯著性水平0.05。方法2:Wilcoxon符號秩檢驗(yàn)由直方圖我們可以看出,沒有明顯的證據(jù)表明該數(shù)據(jù)是非對稱的,所以我們也不妨使用Wilcoxon符號秩檢驗(yàn)。通過EXCEL對樣本數(shù)據(jù)進(jìn)行編制并計(jì)算秩和,得到結(jié)果W+=838,Z=查表得到p值大約在0.3632-0.3594之間,那么雙邊檢驗(yàn)的p值也一定大于置信水平0.05。方法3:游程檢驗(yàn)游程總數(shù)目U=35,大于均值的個(gè)數(shù)m=32,小于均值的個(gè)數(shù)n=27,總數(shù)N=59,計(jì)算大樣本情況下的檢驗(yàn)統(tǒng)計(jì)量Z=查正態(tài)分布表得到p值為0.8925到0.8944之間,大于給定的顯著性水平0.05。根據(jù)結(jié)果,作出判斷根據(jù)三種檢驗(yàn)方法得到的值,我們可以得到相同的判斷結(jié)果,無法拒絕原假設(shè),也就是認(rèn)為均值函數(shù)是常數(shù)。運(yùn)用SPSS軟件可以得到精確p值(如表4-5所示):表4-5SPSS軟件運(yùn)行結(jié)果檢驗(yàn)量(均值)8669.3220小于均值的個(gè)數(shù)27大于均值的個(gè)數(shù)32總數(shù)59符號檢驗(yàn)值0.603Wilcoxon符號檢驗(yàn)值0.723游程檢驗(yàn)值0.2134.2.3相關(guān)函數(shù)的位置參數(shù)檢驗(yàn)已知相關(guān)函數(shù)RX(τ)=EX(s)X(s+τ)就是兩個(gè)時(shí)間差為τ的變量乘積的期望,那么在此基礎(chǔ)上,在給定的樣本觀測值中取不同的時(shí)間差,就能得到相應(yīng)的期望,再對期望進(jìn)行位置參數(shù)檢驗(yàn),就能夠證明相關(guān)函數(shù)只與時(shí)間差有關(guān),建立假設(shè)檢驗(yàn)原假設(shè)H計(jì)算檢驗(yàn)統(tǒng)計(jì)量相關(guān)函數(shù)RX(τ)=EX(s)X(s+τ),其中當(dāng)時(shí)間取1-10年時(shí),相關(guān)函數(shù)值如表4-6所示表4-6相關(guān)函數(shù)值時(shí)間差τ/年12345678910相關(guān)函數(shù)1728477527529229572901929751759357353368073934243732786967200

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論