基于核估計(jì)的多變量非參數(shù)隨機(jī)模型初步研究_第1頁(yè)
基于核估計(jì)的多變量非參數(shù)隨機(jī)模型初步研究_第2頁(yè)
基于核估計(jì)的多變量非參數(shù)隨機(jī)模型初步研究_第3頁(yè)
基于核估計(jì)的多變量非參數(shù)隨機(jī)模型初步研究_第4頁(yè)
基于核估計(jì)的多變量非參數(shù)隨機(jī)模型初步研究_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于核估計(jì)的多變量非參數(shù)隨機(jī)模型初步研究王文圣i, 丁晶i(1.四川大學(xué)水利水電學(xué)院,四川成都610065)摘要:本文基于核估計(jì)理論構(gòu)造了多變量非參數(shù)模型。該模型是數(shù)據(jù)驅(qū)動(dòng)的、不需識(shí)別和假定序 列相依形式和概率分布形式的一類(lèi)隨機(jī)模型,克服了多變量參數(shù)模型的不足。實(shí)例統(tǒng)計(jì)試驗(yàn)表明, 建議的多變量非參數(shù)模型是有成效的,為隨機(jī)水文學(xué)發(fā)展提供了一些新思路。關(guān)鍵詞:核估計(jì);多變量非參數(shù)模型;隨機(jī)模擬;實(shí)用性檢驗(yàn) 中圖分類(lèi)號(hào):p333. 9文獻(xiàn)標(biāo)識(shí)碼:a流域水資源的開(kāi)發(fā)利用,不僅需要單站水文信息,而且需要流域內(nèi)各站的水 文信息。進(jìn)行多站水文序列模擬的一個(gè)重要手段就是建立多站(變量)隨機(jī)模型。目 前,多變量

2、隨機(jī)模型1比較成熟的有自回歸模型和解集模型。這兩類(lèi)模型的共同點(diǎn) 是用有限個(gè)參數(shù)的線(xiàn)性函數(shù)關(guān)系描述水文現(xiàn)象。因此簡(jiǎn)便實(shí)用,能表征水文序列的 統(tǒng)計(jì)特性和一般變化規(guī)律,但缺點(diǎn)也明顯:水文序列是一時(shí)間不可逆過(guò)程,而參 數(shù)模型描述的是可逆過(guò)程,因此大多數(shù)參數(shù)模型難以反映其漲落不對(duì)稱(chēng)性;水文 現(xiàn)象受流域下墊面、人類(lèi)活動(dòng)、氣候等多因素影響而變化錯(cuò)綜,是一個(gè)高度復(fù)雜的 非線(xiàn)性系統(tǒng),而多數(shù)參數(shù)模型僅能表征變量及變量之間的線(xiàn)性相依結(jié)構(gòu),忽略了占 據(jù)重要位置的非線(xiàn)性性;水文變量概率密度函數(shù)復(fù)雜r未知,某一指定概率分布 與真實(shí)分布存在著差異。如圖1、2所示,正態(tài)分布、p-iii型分布都與直方圖相差甚 遠(yuǎn),但才檢驗(yàn)并不

3、拒絕ptii型分布和正態(tài)分布;而核估計(jì)和k最近鄰估計(jì)與直方圖 比較接近。即概率分布具有不確定性;模型參數(shù)由于抽樣誤差和估計(jì)方法不同具 有不確定性。為克服參數(shù)模型之不足,文獻(xiàn)2提出了單變量非參數(shù)模型,徑流模擬表明 是滿(mǎn)意的。在此基礎(chǔ)上,本文基于核估計(jì)理論構(gòu)造了多變量非參數(shù)模型。該模型避 開(kāi)了序列相依形式和模型結(jié)構(gòu)的假設(shè),不涉及模型參數(shù)估計(jì),能反映各種復(fù)雜關(guān)系, 較參數(shù)模型優(yōu)越。以中國(guó)金沙江流域屏山站和宜賓一屏山區(qū)間兩站fi流量過(guò)程隨機(jī) 模擬為例,對(duì)建議模型進(jìn)行了應(yīng)用研究。1核估計(jì)理論1.1多維核估計(jì)定義 設(shè)x為d維隨機(jī)變量,x., x2,x.為x的一樣本。x的概 率密度函數(shù)f(x)的核估計(jì)定義如

4、下::"'一i 41-盡)-忑弔鏟召畀p式中:x=(x1, x2,,xd) xi=(xii, xi2,xid)t(i=l, 2,,n) ; k()為核函數(shù),是一 給定概率密度函數(shù);h為帶寬系數(shù);n為樣木容量;s是x的dxd維對(duì)稱(chēng)樣木協(xié)方 差矩陣。1.2 核估計(jì)精度評(píng)價(jià) 核估計(jì)既同樣本有關(guān),乂與k()和h的選取有關(guān)。在給 定樣本后,核估計(jì)的精度取決于k()及h的選取是否適當(dāng)。常采用枳分均方誤差 準(zhǔn)則-mzs® =進(jìn)行度量。mise由偏差和方差組成。當(dāng)k()固定時(shí),若h選得過(guò)大,偏差較大,但降低了方差,故(x)對(duì)f(x)有較大的平滑,使 得f(x)的某些特征被掩蓋起來(lái);

5、若h選得過(guò)小,偏差減小了,但增大了方差,貝9(x) 有較大的波動(dòng)。顯然同時(shí)減少偏差和方差是不可能的。1.3k()和h的確定依潘涅契科夫和scott通過(guò)統(tǒng)計(jì)試驗(yàn)發(fā)現(xiàn),當(dāng)給定帶寬系 數(shù),不同核函數(shù)對(duì)mise的影響是很小的。實(shí)際工作中,選擇滿(mǎn)足一定條件的核函數(shù) 即可。本文釆用標(biāo)準(zhǔn)高斯函數(shù)。h隨n增大而減小。h的確定還要考慮數(shù)據(jù)的密集程度,在數(shù)據(jù)密集區(qū),h 選小一點(diǎn);在數(shù)據(jù)稀疏區(qū),h選大一點(diǎn)。h的具體計(jì)算方法很多。這里使用lscv法。 lscv是基于積分平方誤差(integrated square error (ise)最小準(zhǔn)則的一種計(jì)算方 法。對(duì)多維隨機(jī)變量x, tse為:式(2)中最后一項(xiàng)與h無(wú)關(guān)

6、。lscv就是取式(2)中前兩項(xiàng)進(jìn)行最小化,即1+c1)ee(-見(jiàn)4-2杰必式中:昶處町“一兀疔當(dāng)lscv(h)最小時(shí),h即為所求。2 基于核估計(jì)的多變量非參數(shù)隨機(jī)模型2.1模型建立所謂多變量,可以是同-測(cè)站的幾個(gè)水文變量,也可以是不同測(cè)站上 的一種或幾種變量。設(shè)xj n(t可以是年,也可以是季、月、日)為多變量相依時(shí) 間序列,兒依賴(lài)于前p個(gè)值xtxm,,x®取vt=(xt-i, xt-2,xt-p)t, xt的條件概 率密度函數(shù)為:式中:&珂即.孑疔尸為變量個(gè)數(shù), 牌為j變量 t時(shí)刻水文變量值;f (xt, v.)為m(p+l)維聯(lián)合密度函數(shù),fv(vt)為mp維邊緣密度函

7、數(shù)。由多維核估計(jì)知=其中(7)式中:s為(xt,vj的樣本協(xié)方差矩陣;,為xt的mxm階對(duì)稱(chēng)樣本方差陣;sxv為九 與嘰的mxmp階樣本協(xié)方差陣;sv為x的mpxmp階對(duì)稱(chēng)樣本方差陣。vi=(xi, xy, x.-p)r, xl(xi,xi,,xa, x和x(二p+l,p+2,n)來(lái)自實(shí)測(cè)樣本。當(dāng)det (sv) ho時(shí)(一般滿(mǎn)足),s可分解為:s =x9匕設(shè)sx-sxvs_1vstxv=a,則s可作如下變化:計(jì)屮)但y應(yīng)-叫t1的-應(yīng)1將式、(9)代入式(5)整理得:公耳)=占 £ &嚴(yán) z嚴(yán) h嚴(yán) *同也(10)再將式、(10)代入式(4)可得:其中,l 乜滬制/備*(1

8、2)乞略“ 8.=應(yīng)+;識(shí)-£)c“g% -広上略)s-m由式(11)知,條件密度函數(shù)(xi/vj是n-p個(gè)m維高斯函數(shù)(均值向量bi,方差矩陣 c)的加權(quán)(權(quán)重為wj平均和。用式(11)可隨機(jī)模擬人,其模擬式為:xt=b.+det(13)式中:d為mxm階標(biāo)準(zhǔn)差矩陣,c=ddr; et是均值0,方差1的m維獨(dú)立高 斯隨機(jī)變量。在條件v下,模擬序列x,是來(lái)自條件概率密度函數(shù)式仃1)的一個(gè)樣本。 到此,多變量p階非參數(shù)模型建立完畢。2.2模型階數(shù)p的確定 在k()給定后,建立非參數(shù)模型的關(guān)鍵是尋求最優(yōu)h和確 定p。p可由aic準(zhǔn)則確定。2.3模型算法算法:從實(shí)測(cè)資料中構(gòu)造xi和vi(i

9、二p+l,p+2,n);計(jì)算協(xié)方 差矩陣s;給vi賦初值;給定譏,由式(12)計(jì)算抽樣概率wi;以概率wi抽樣 xi;按式(13)模擬x,;給比重新賦值,轉(zhuǎn)向第步,繼續(xù)模擬;滿(mǎn)足模擬數(shù)時(shí) 停止。3多變量非參數(shù)隨機(jī)模型在日流量隨機(jī)模擬中的應(yīng)用3.1流域及資料情況 溪洛渡水電站的修建不僅要涉及自身的防洪安全,而且還要兼 顧下游城市宜賓的安危,因此研究溪洛渡洪水(屏山站)和宜賓一屏山區(qū)間(簡(jiǎn)稱(chēng)宜- 屏區(qū)間)洪水將至關(guān)重要。屏山站有48年(19401987)日流量過(guò)程,宜-屏區(qū)間日流 量由岷江高場(chǎng)站實(shí)測(cè)日流量(19401987)按面積比獲得。以上述兩站口流量過(guò)程為 例嘗試將多變量非參數(shù)隨機(jī)模型用于徑流

10、隨機(jī)模擬研究,以檢驗(yàn)該類(lèi)模型的可行性 和有效性。3.2模型建立 唱吩(i二1,2,,48; j二1,2,,365)表示屏山站、宜-屏區(qū) 間日流量。計(jì)算各截口(天)斜方差矩陣s,建立各截口兩變量非參數(shù)模型。經(jīng)計(jì)算,p=l,汛期(5月1日10月31 h)h=0. 532,非汛期(11月1日次年4月30 s)h=0 379o構(gòu)造各截口對(duì)應(yīng)的xi, vi。當(dāng)jm2時(shí),兒二(4起),曙(zg*殆*)(二1,2,48);當(dāng) j二1 時(shí),x =(z«bzj)v;=( z8g,zj*)t(i=2,3,,48)。由模型算法便可對(duì)屏山站日流量和宜-屏區(qū) 間日流量同時(shí)進(jìn)行隨機(jī)模擬。3.3模型檢驗(yàn) 建立各截

11、口兩變量非參數(shù)模型,隨機(jī)模擬100個(gè)模擬樣本(模擬樣 本容量與實(shí)測(cè)樣本相同),用短序列法1對(duì)模型進(jìn)行實(shí)用性檢驗(yàn)。3.3. 1日流量過(guò)程截口統(tǒng)計(jì)參數(shù)檢驗(yàn) 截口統(tǒng)計(jì)參數(shù)有截口均值、s、g、0、滯時(shí)1、 2的自相關(guān)系數(shù)ri,r2和最大值(max)、最小值(min)o統(tǒng)計(jì)了各統(tǒng)計(jì)量在不同站(區(qū)) 不同模型情況下,在兩個(gè)均方差檢驗(yàn)標(biāo)準(zhǔn)下的通過(guò)率,結(jié)果載于表1。表中顯示截 口各統(tǒng)計(jì)參數(shù)的通過(guò)率是很理想的,表明各模型能很好地反映實(shí)測(cè)口流量過(guò)程的截 口統(tǒng)計(jì)特性。表1截口各統(tǒng)計(jì)參數(shù)通過(guò)率(%)站名均值sc、csrimaxmin屏山10010097.887. 510010010098.9宜-屏97.3100100

12、9& 410010096.791.83. 3.2時(shí)段量統(tǒng)計(jì)參數(shù)檢驗(yàn) 檢驗(yàn)時(shí)段有1、3、7、15、30d共5種,檢驗(yàn)參數(shù)有時(shí) 段量均值、c、c“成果載于表2中,可以看出:均值、c、cs兒乎都控制在一個(gè)均 方差檢驗(yàn)標(biāo)準(zhǔn)下??梢?jiàn)模型對(duì)各站(區(qū))時(shí)段量統(tǒng)計(jì)參數(shù)都保持得很好。3. 3.3月徑流統(tǒng)計(jì)參數(shù)檢驗(yàn) 為進(jìn)一步驗(yàn)證模型的實(shí)用性,本文對(duì)510月徑流統(tǒng)計(jì) 參數(shù)進(jìn)行了檢驗(yàn)。成果載于表3中。該表顯示:除極個(gè)別g控制在兩個(gè)均方差檢驗(yàn) 標(biāo)準(zhǔn)下外,其余都控制在一個(gè)均方差檢驗(yàn)標(biāo)準(zhǔn)下。說(shuō)明各模型能保持好月徑流統(tǒng)計(jì) 參數(shù)。3. 3.4年最大日流量季節(jié)性變化檢驗(yàn) 分別模擬4800年日流量過(guò)程,統(tǒng)計(jì)年最大口 流量在

13、各月出現(xiàn)的百分比,載于表4。由表4看出,各模型能反映各站(區(qū))年最大 日流量季節(jié)性變化特性。表2時(shí)段洪量統(tǒng)計(jì)參數(shù)實(shí)用性檢驗(yàn)時(shí)段洪量w10/1ovw3a/iowwtb/iowwis0/ioww3o0/low參數(shù)均值c' cs均值cvcs均值cvcs均值c. cs均值cv cs屏樣本14. 80. 24 0. 79 42. 9 0. 23 0. 7893. 4 0. 23 0. 89182 0. 22 0. 87321 0. 22 0. 79山均值 14. 90. 23 0. 50 43. 0 0- 23 枚均方擬0.5 0. 02 0. 37 1.3 0. 02差0. 5393.80.

14、230. 581830. 220. 423270. 22 0. 30站0. 402.80. 020.415.40. 020. 349.50. 02 0. 30宜樣本 16.90.27 1. 36 40. 7 0. 281.5274. 50. 251.521320. 241.412270.21 1. 36均值 17.20. 25 0. 63 41.3 0. 26 模均方擬0.6 0. 02 0. 35 1.5 0. 030. 9476.60. 251.231350. 231. 132300. 20 1. 08屏0.412.90. 040. 674.90. 040.617.20. 03 0. 54

15、表3 5-10月徑流統(tǒng)計(jì)參數(shù)實(shí)用性檢驗(yàn)時(shí)段洪站曰5月6月7月8月9月10月參數(shù)均值cvc,均值ac,均值a c,均值g cs均值cv cs均值cv cs樣本 22180. 210. 3149010. 260. 7494100. 270. 63101680. 301. 09 9942 0. 240. 5465410. 250. 92 屏均值22270. 230. 1848990. 290. 2294560. 300. 38100360. 320. 67102300. 250. 2766000. 260. 58 山模均方站擬斗 73. 40. 030. 37 207 0. 030. 22 373

16、0. 020. 27 427 0. 030. 29 314 0. 020. 36 242 0. 020. 34 差樣本 24660. 200. 0346320. 190. 3674540. 221. 29 6878 0. 260. 79 5879 0. 240. 0938730. 19(). 54 宜均值24590. 210. 0445620. 210. 0973650. 261. 23 6830 0. 250. 36 5901 0. 240. 0938620. 200. 56 模均方屏擬 77. 60. 020. 28 144 0. 020. 28 296 0. 040. 72 233 0.

17、 020. 33 174 0. 020. 26 111 0. 020. 26 差表4年最大日流量在各月岀現(xiàn)的冇分比(%)站名月份5月6月7月8月9月10月樣本0.02.626.339.526.74.8屏山模擬0.02.020.246.229.81.9樣本0.06.350.035.48.30.0宜-屏模擬0.05.242.93& 713. 10. 1總之,上述檢驗(yàn)表明,非參數(shù)模型隨機(jī)模擬兩站日流量過(guò)程是可行的。該模 型同樣適合于多站(多變量)各種時(shí)間尺度的隨機(jī)變量。模擬序列來(lái)源于但不同于實(shí) 測(cè)樣本,能充分利用己有的全部信息。而參數(shù)模型僅能利用實(shí)測(cè)資料中的一部分信 息。4結(jié)語(yǔ)鑒于參數(shù)模型的缺陷,本文基于核估計(jì)理論提出了多變量非參數(shù)隨機(jī)模型。 該模型避免了模型結(jié)構(gòu)(線(xiàn)性或非線(xiàn)性)選擇和參數(shù)不確定性問(wèn)題,同時(shí)借助于核估 計(jì)理論避開(kāi)了序列概率分布形式的假定。通過(guò)實(shí)例分析計(jì)算表明,多變量非參數(shù)模 型適合水文水資源系統(tǒng)。參考文獻(xiàn):1 丁晶,鄧育仁隨機(jī)水文學(xué)皿成都:成都科技大學(xué)出版社,1988.2 王文圣,丁晶,袁鵬.單變量核密度估計(jì)模型及其在徑流隨機(jī)模擬中的應(yīng)用j.水科學(xué)進(jìn)展, 2001, 25(3).3 陳希儒,柴根象.非參數(shù)統(tǒng)計(jì)教材m.上海:華東師范大學(xué)出版社,1993.4 epanechnikov v a. nonparametric

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論