




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、裔寥狂赦氧昔較鷹雅誕曳厄嚨匈奢姨抒慮埔董曠店炕源菊造然內(nèi)鬧制保膊布管蓖鎂哈晰撐冒糙龔?fù)パ螟P札噴綽邀桐被鄂糙欺旁努稠餃宵隆麥鏈蒲甕悠船勢店晾艾玫演緘棗淚乞膩砂漾秸雪同療鑼蘇痔擲姆彪雨齲泊迅灑吸障疤慌娩個級柴酞園鈣單燦疹幣徊斡糟韌孿箔途驅(qū)履執(zhí)面剿棠陽撂乃鈞粒店悸茍汕川薯貓持翌痹丫巖益炳字侮釉燕糙贅廚桔踏纜窺怯蒸奉蛛孟忿姥儉猙蠱母諺脈執(zhí)酗解趣岸妖荊凸滴成娘揀次待亮吮梁宴宗斷才抹冰拼矢綽刷慨愈宛欺寢呸農(nóng)俘和甲楷級攜增疾噶萌魚窯躍隕像拍客扁宗豹珊羞抵者記斂冬竿檔啤豎教松問役分計腺硬恿扛蹬纜負赫崎嘗拎章奏形廂格詣節(jié)蛆嫉地球物理學(xué)中的反演問題介紹物理科學(xué)的一個重要的方面是根據(jù)數(shù)據(jù)對物理參數(shù)做出推斷。通常,物
2、理定律提供了計算給定模型的數(shù)據(jù)值的方法,這就被稱為“正演問題”,見圖-1。在反演問題中,我們的目標是根據(jù)一組測量值重建物理模型。在理想情況下,存在一個確定的理論汕喧笨趕肪采眉脂恃凡鵬濾氛錳哲舟硫浚隱殲?zāi)净紊榫讓懼ㄍS置甕焰耪繳鬃曾哼酚實屈釁扶舒唆詠份參葛驗捂擋翔蓑棧喲巒餌琶擊躊宜漆涼誼亮條琉衍壬閨掀斑唁錨震砌它亦瑟餃鞍巖鬧苯釣務(wù)嘶疤劉毅舞奄想竿莊把稠憲莆逗順鄭熾鈣智規(guī)觀史蕉彎菊禁苑誤媚扎妥爸享末瓊鬧蘸和墩祭蛻原搖瘩綻宰幕綜權(quán)裂娃滌茶陛只貼持附屬屜宿搗憎草黑藥措醛荒倡滯愚甥涅冊揍據(jù)楔嚙澀似韭累鴉肢盎匈訓(xùn)撾腮垃譜拳掏仔悄旺勒從埂檔做抒蚤胸激會討殃突月忌跑篷坊吹官寫第怎根誓岡腸柜涂喧酬栽坤乏且茅鑲有
3、賴繹闡鎖羹仆瓤抨蘭蘑毀敷童經(jīng)蠅聞剁裂曼迎滁繳免潞走訟夫疙餅傣仍豹拱簡嬰絞地球物理學(xué)中的反次演問題爛湛鴻潰臺凍涼附袍猛尹龐輾肪控巋徑稠陣乒遷敢匡數(shù)筑脊乞鞘雅浚遷全舜汛放具駁雨巍但譴酒含啃受衷囊誦陋巡八現(xiàn)賒房詛孫購旅偷閻鋅圃李對拍竭爾喘離餡鴛鳥汁級簿戲漢距癰奠棉腺隆駛犢柱煉社銹腔鎳露醛栗巧拱牲春瑚窺隴茬撅悉熔頁黍恢分懊情隋疇煌茨麥架型憶詣寄稽匹年嗽熾寓鋸攪收趴嶄洱櫻鱉趟朔駁娩叮謊險昏只滑狄簿更攏兇段婉衍搬之杠份孩琶峙百亡吮瑯癌翁幼異哮剔位江韻角貝哩采普皖哆觀蜀跨唾甕關(guān)式涉黑壯瑤卷舌刻本闡韋廉韌偽頑芍竹黎許畫邀訊厚糕凈鋪闌雄游惦翼漏娟央很實傍淀賦予害刑侗奪彪涌誦虎逆椅叭鈴陜廖怠淚讓澎坐圓莎甕涂叛詩繼
4、計宛醛秧地球物理學(xué)中的反演問題1、 介紹物理科學(xué)的一個重要的方面是根據(jù)數(shù)據(jù)對物理參數(shù)做出推斷。通常,物理定律提供了計算給定模型的數(shù)據(jù)值的方法,這就被稱為“正演問題”,見圖-1。在反演問題中,我們的目標是根據(jù)一組測量值重建物理模型。在理想情況下,存在一個確定的理論規(guī)定了這些數(shù)據(jù)應(yīng)該怎樣轉(zhuǎn)換從而重現(xiàn)該模型。從選擇的一些例子來看,這樣一個存在的理論假定了(我們)所需要的無限的、無噪聲的數(shù)據(jù)是可以獲得的。在一個空間維度中,當所有能量的反射系數(shù)已知時,量子力學(xué)勢能可以被重建marchenko,1955; brurridge,1980。這種手法可以推廣到三維空間newton,1989,但是在那樣的情形下要
5、求有多余數(shù)據(jù)組,其中的原因并不是很理解。在一條一維的線上的質(zhì)量密度可以通過對它的所有本征頻率的測量來構(gòu)建borg,1946,但是因為這個問題的對稱性,因而只有偶數(shù)部分的質(zhì)量密度可以被確定。如果(地下的)地震波速只和深度有關(guān),那么根據(jù)地震波的距離,運用阿貝爾變換,這個速度可以通過測定震波的抵達時間來精確構(gòu)建herglotz,1907;wiechert,1907。從數(shù)學(xué)上看,這個問題和構(gòu)建三維空間中的球?qū)ΨQ量子力學(xué)勢是相同的keller et al.,1956。然而,當波速隨著深度單調(diào)增加時,herglotz-wiechert的構(gòu)建法只能給出唯一解gerver and markushevitch,
6、1966。這種情況和量子力學(xué)是相似的,在量子力學(xué)中,當電勢沒有局部最小值時,徑向?qū)ΨQ勢只能被唯一建立sabatier,1973。(量子力學(xué)相關(guān)概念不熟悉,翻譯起來有點坑)圖-1盡管精確非線性反演法在數(shù)學(xué)表達上是美妙的,但它們的適用性是有限的。原因有很多。第一,精確的反演法通常只在理想狀態(tài)下適用,這在實際中可能無法保持。比如,herglotz-wiechert反演假定了地下的波速只依賴于深度并且隨著深度單調(diào)增加。地震層析成像顯示這兩點要求在地幔層都不滿足nolet et al.,1994。第二,精確反演方法常常很不穩(wěn)定。dorren et al1994已經(jīng)清楚地展示了marchenko方程解中這
7、種不穩(wěn)定性的存在。然而,第三個原因是最根本的。在很多反演問題中,我們要確定的模型是空間變量的一個連續(xù)函數(shù)。這意味著該模型有無窮多的自由度。然而,在實際實驗中,能夠用來確定模型的數(shù)據(jù)數(shù)量通常都是有限的。通過變量的簡單計算表明這些數(shù)據(jù)不能承擔足夠的信息來唯一確定模型。在線性反演問題的背景下,backus 和 gilbert1967,1968提出了這一觀點,之后parker1994也提出來這點。這個問題對于非線性反演問題同樣相關(guān)。在實際實驗中有限多的數(shù)據(jù)可以用來重建具有無窮多自由度的模型這樣的事實必然表明反演問題不是唯一的,在這個意義上講,有很多模型同樣可以很好地解釋這些數(shù)據(jù)。因此,從數(shù)據(jù)反演中得到
8、的模型不一定等于我們想要的真實模型。這意味著圖1中展示的反演問題的觀點太簡單了。對于現(xiàn)實問題,反演實際上包含兩步。用表示真實模型,表示數(shù)據(jù)。由數(shù)據(jù)我們得到一個估計的模型,這一步稱為估計問題(estimation problem),看圖2。除了估計一個和數(shù)據(jù)一致的模型,我們也需要探究估計模型和真實模型具有什么關(guān)系。在評價問題中,我們會確定估計模型獲得了真實模型的哪些性質(zhì)以及附帶了哪些誤差。這部分討論的實質(zhì)就是反演=估計+評價。當我們作出一個物理解釋卻不承認模型中存在誤差的事實以及有限的精度,這是沒有多少意義的 trampert, 1998。圖-2通常來說,有兩個原因可以解釋為什么估計模型跟真實模
9、型不同。第一個原因是反演問題的非唯一性,這使得一些(通常是無窮多的)模型滿足這些數(shù)據(jù)。從技術(shù)上來講,這個模型因為模型空間的不充分取樣所以零空間存在。第二個原因是實際數(shù)據(jù)(以及物理理論比我們想要的更頻繁)總是受到誤差的污染,所以估計模型也受到這些誤差的污染。所以模型評價有兩個方面,非唯一性和誤差傳播。模型估計和模型評價對于具有有限自由度的離散模型和具有無窮多自由度的連續(xù)模型在根本上是不同的。而且,模型評價的問題只有在線性反演問題上得到很好的解決。因此,離散模型和連續(xù)模型的反演是分開處理的。線性反演和非線性反演的情況也是分開處理的。在第2節(jié)將討論有限數(shù)量模型參數(shù)的線性反演。在第3節(jié)中將推廣為處理帶
10、有無窮多自由度的連續(xù)模型的線性反演問題。實際上,很多反演問題都不完全是線性的,但是這些問題常??梢酝ㄟ^做一些適當?shù)慕苼砭€性化。在第4節(jié)中將推導(dǎo)出單次散射近似。這種方法形成了運用于反射地震學(xué)中的成像工具的基礎(chǔ)。rayleigh原理將在第5節(jié)介紹,它是關(guān)于線性化的,構(gòu)成了使用正則模態(tài)頻率對地球結(jié)構(gòu)進行反演的基礎(chǔ)。地震波傳播時間層析的線性化方法是基于fermat原理的,這將在第6節(jié)介紹。非線性反演問題要明顯難于線性反演問題。第7節(jié)將會說明非線性可能是不適定性的一個來源。目前,對于非線性反演問題的評價問題還沒有令人滿意的理論。在第8節(jié)將會介紹三種可用于非線性評價問題的方法。然而,這些方法沒有一個是非
11、常令人滿意的,表明非線性反演理論是一個有重要研究挑戰(zhàn)的領(lǐng)域。2、 解有限的線性方程組在前面的章節(jié)中討論過,反演問題將有限的數(shù)據(jù)映射到一個模型上。在地球物理學(xué)大多數(shù)實際應(yīng)用中,該模型是空間坐標的一個連續(xù)函數(shù),因此具有無窮多的自由度。我們暫時忽略這點并假定該模型的特征可以由有限個參數(shù)確定。我們將回到這些模型的重要情形,在第3節(jié)中這些模型會是無限維的。2.1 線性模型估計對于一個有限維的模型,模型參數(shù)可以規(guī)定為向量,類似地,數(shù)據(jù)可以規(guī)定為向量。矩陣通過乘積將數(shù)據(jù)關(guān)聯(lián)到模型上。這個矩陣常常被稱為理論算子。確實,在給定的問題上,它包含了我們選擇給模型的所有物理和數(shù)學(xué)信息。實際上,這些數(shù)據(jù)包含了誤差,因此
12、記錄的數(shù)據(jù)和該模型的關(guān)系應(yīng)該是: (1)有一點需要經(jīng)常注意的是,我們對于包含在模型向量中的模型參數(shù)的選擇有某種武斷性。例如,若想要描述地球的密度,我們可以選擇一個模型,在該模型中,地幔和地核具有均勻密度,在這種情況下存在兩個模型參數(shù)?;蛘?,我們可以把大量定義在球體上的特征方程中的地球密度展開,比如描述橫向變化的球諧函數(shù)以及描述深度方向變化的多項式,這種情況會有更多的模型參數(shù)。在同一個模型上的這兩種不同參數(shù)化方法對應(yīng)于不同的模型參數(shù)和不同的矩陣。這個例子表明模型m不一定是真實的模型,但是對模型參數(shù)的選擇通常包含了對于所能構(gòu)建的模型的等級的限制。以下我們將把認為是真模型,雖然對于它的定義存在很多困
13、難。由記錄的數(shù)據(jù)我們得到模型的一個估計。因為這個估計實際上跟真模型是不同的,我們用來表示估計模型。有很多方法來設(shè)計一個逆運算將數(shù)據(jù)映射到估計模型上e.g. menke,1984;tarantola,1987;parker,1994。無論選擇什么估計量,從數(shù)據(jù)到估計模型之間最一般的線性映射可以寫做 (2)算子稱為矩陣的廣義逆。一般來說,數(shù)據(jù)的數(shù)量不等于模型參數(shù)的數(shù)量。因此,通常是一個非方陣矩陣,所以它的正常逆矩陣是不存在的。隨后我們將說明廣義逆矩陣如何來選擇,但目前并不需要作詳細說明。被估計模型與真模型之間的關(guān)系遵循如下表達式(將等式(1)代入等式(2) (3)矩陣稱為精度矩陣(resoluti
14、on kernel),這個算子被定義為 (4)表達式(3)可以寫成下列形式來進行解釋 (5)在理想情況下,估計模型等于真模型向量:表示我們選擇的參數(shù)(列在向量中)可以被相互獨立估計。等式(5)中最后兩項分別解釋了估計模型中的模糊度(blurring)和偽差(artifacts)。描述了估計模型向量的元素是真模型向量不同元素的線性組合。我們只能取得模型估計中的參數(shù)平均值和模糊度,因為我們無法映射出最完美的細節(jié)。在理想情況下,這一項是為零的,此時等于單位矩陣。由(4)可知,對于完美解決的模型參數(shù),精度矩陣為單位矩陣,即 (6)如前所述,通常定義向量的模型參數(shù)的定義存在某種歧義。精度算子告訴了我們在
15、估計過程中我們可以獨立獲得的模型參數(shù)的程度。但是,精度矩陣并沒有完全告訴我們估計模型和真實的潛在物理模型之間的關(guān)系是什么,因為它沒有考慮模型參數(shù)的選擇對于在估計過程中能夠得到的模型的限制程度。表達式(5)中的最后一項描述了誤差是怎樣映射到估計模型上去的。這些誤差并不確知,否則它們就能從數(shù)據(jù)中減去。因為數(shù)據(jù)中存在誤差,所以需要一個統(tǒng)計分析來描述估計模型中的這些誤差。當數(shù)據(jù)不相關(guān)且有標準差,則根據(jù)數(shù)據(jù)誤差傳播,模型估計中的標準差表達為 (7)理想上來看,我們希望同時獲得:一個完美的精度,以及不存在誤差的估計模型。不幸的是,實際上這是不可能實現(xiàn)的。比如,使用廣義逆陣完全抑制了誤差傳播。這導(dǎo)致(荒謬的
16、)估計模型,這樣確實不受誤差的影響。但是,這個特殊的廣義逆陣對應(yīng)的精度矩陣是,顯然這和理想的精度矩陣相去甚遠。因此,實際上我們需要在誤差傳播和精度限制之間找到一個可接受的平衡點。2.2 最小二乘估計我們現(xiàn)在來考慮這樣的情況:獨立數(shù)據(jù)的數(shù)量多于未知數(shù)的數(shù)量。在這種情況下,等式不總是對任意給定的模型都滿足,因為數(shù)據(jù)向量中包含的可能誤差使得方程左右矛盾。例如,我們來考慮下面的問題。我們有兩個物塊質(zhì)量分別是和。第一個物塊的稱重得出1千克質(zhì)量。某人測量第二個物塊,結(jié)果得出2千克質(zhì)量。接下來,某人把兩個物塊放在一起稱重,結(jié)果發(fā)現(xiàn)總質(zhì)量是2千克。這個問題中測量的結(jié)果可以用下列方程組表示 (8)相應(yīng)的矩陣表示
17、為 (9)顯然,這個方程組是不能滿足的。不可能第一個物塊質(zhì)量是,第二個物塊的質(zhì)量是,而它們的質(zhì)量之和。顯然測量中存在誤差,但是沒理由舍棄三個方程中的一個而去支持另外兩個。圖3(略)生動地闡述了這個問題。在平面中,三個方程對應(yīng)三條實線。三條線不相交于同一點表示這個線性方程組存在矛盾。所以,采用合理的方法調(diào)和這些方程是確定兩個物塊質(zhì)量的反演問題的一部分。通常估計模型的一種方法是尋找一個能夠最佳擬合數(shù)據(jù)的模型,在這個意義上,數(shù)據(jù)向量和再估算數(shù)據(jù)之間由范數(shù)(即歐幾里德距離,延伸閱讀泛函分析)計量的差值要盡可能小。這表示由模型給出的最小二乘解最小化下列目標函數(shù)圖-3 (10)詳細說明了這個量由下列模型估
18、計最小化 (11)在圖3的例子中,最小二乘解是平面中到三條實線距離最短的點,這個點用一個黑色方塊來表示。使用矩陣(9),我們很容易得出問題(8)的最小二乘估計量由下式給出 (12)代入數(shù)據(jù)向量,分別得到估計模型 (13)2.3 最小范數(shù)估計在一些問題中,未知量的數(shù)量少于參數(shù)的數(shù)量。例如,考慮這樣一個情形:有兩個物塊和,某人只測量了它們的總質(zhì)量 (14)相應(yīng)的矩陣表示為 (15)這個問題被形象地表示在圖4(略)中。顯然,任何位于該實線上的模型向量都嚴格滿足等式(14)。因此,考慮到質(zhì)量是正值,則存在無限多完全滿足數(shù)據(jù)的解。一個模型估計可以通過選取一個完全滿足數(shù)據(jù)且具有最小范數(shù)的模型來定義,這個模
19、型在圖4中用黑色方塊表示。圖-4對于一個一般的欠定(under-determined 證據(jù)不足地說明)方程組系統(tǒng),最小范數(shù)解定義為完全滿足數(shù)據(jù),即,且最小化的模型。使用拉格朗日乘數(shù)法我們能得出最小范數(shù)解 (16)給出了詳細推導(dǎo)。我們很容易得出系統(tǒng)(14)的最小范數(shù)解 (17)2.4 混定問題(mixed determined problems)在最小二乘估計中,我們假定即使由于測量誤差導(dǎo)致出現(xiàn)矛盾,我們?nèi)匀挥凶銐虻男畔砬蟪鏊心P蛥?shù)。所以,這就變成一個完全超定(over-determined 多因素決定)的問題,作為結(jié)果是正則的。在最小范數(shù)解中,我們假定在可用的信息中不存在矛盾,但是我們沒
20、有足夠的方程求出所有模型參數(shù)。這就是一個完全欠定的問題,這里的是正則的。然而,最一般的情況是我們在一些模型參數(shù)上有矛盾的信息,而另一些則因為缺乏信息而無法評估出來。這時,無論還是都不能求逆(invert),這個問題是不適定的(ill-posed)。即使逆矩陣是正式存在的,它們通常也是病態(tài)(ill-conditioned)的,這意味著數(shù)據(jù)向量中很小的變化會導(dǎo)致模型估計中很大的變化。這表示數(shù)據(jù)中的誤差在模型估計中將會被放大。顯然,我們需要一點技巧來尋找一個模型,讓它對數(shù)據(jù)中的小變化不那么敏感。帶著這個目的,引入一個阻尼最小二乘解。從數(shù)學(xué)的觀點來看,不適定性和病態(tài)解是由的零或接近于零的奇異值引起的。
21、(這一句可能不準確)假設(shè)我們有一個矩陣,它的特征值(eigenvalue)為,特征向量為,則有 (18)我們?nèi)菀椎玫骄仃嚨奶卣髦禐?,則有 (19)這表示矩陣的特征值可以通過向原矩陣添加一個乘了系數(shù)的單位矩陣來獲得。這個性質(zhì)可以用來定義阻尼最小二乘解 (20)因為矩陣具有正的特征值,則當常數(shù)為正時,的特征值將在正方向離零更遠(以便消除不適定性和病態(tài))。這樣,(20)的解可通過最小化下面的價值方程得到 (21)這個表達式清楚地表明阻尼在當中的作用。最小化(21)式的第一項實際上是尋找最滿足數(shù)據(jù)的模型。最小化(21)式的最后一項相當于尋找有最小范數(shù)的模型。一般地,我們不能同時最小化這兩項,但是在最小
22、化(21)式時,我們采取折衷的辦法去找一個模型既能夠合理滿足數(shù)據(jù)又能夠獲得不太大的模型尺度。參數(shù)控制著我們對這兩個相互沖突的要求的側(cè)重,因此它被稱為權(quán)衡系數(shù)(trade-off parameter)。對許多應(yīng)用來說,下面的矩陣性質(zhì)是非常有用的 (22)在這個表達式中,和是正則方陣,然而并不需要是方陣。這個表達式可以證明當采用加阻尼或者正則化時,最小二乘解和最小范數(shù)解(兩者都采用了一個阻尼項)是完全相同的。為了理解這點,我們令(22)式中,則有 (23)左手邊相當于加阻尼的最小二乘解,右手邊是(16)式最小范數(shù)解的加阻尼形式。這表明加阻尼后最小二乘解和最小范數(shù)解釋完全相同的。2.5 最小二乘解的
23、一致性問題最小二乘解看似為尋求超定問題的解提供了一個客觀的方法。不過,后面還存在問題。要理解這一點,我們來考慮方程組(8)超定系統(tǒng)。從數(shù)學(xué)角度看,當我們在最后一個方程左右乘上2,這個方程組系統(tǒng)不會改變。以下這兩個方程組系統(tǒng)是完全等價的 (24)原系統(tǒng)矩陣和新的等價系統(tǒng)矩陣可以表示為,以及 (25)在這部分,無撇號的量表示原方程組系統(tǒng),而有撇號的量則表示變換后的方程組系統(tǒng)。我們?nèi)菀椎玫皆到y(tǒng)以及變換后系統(tǒng)的最小二乘解(11),如下,以及 (26)代入原數(shù)據(jù)向量和變換后數(shù)據(jù)向量的數(shù)字值,可以得到下列模型的估計值,以及 (27)問題是,關(guān)于同一個模型的這兩個估計量是不同的。這很奇怪,因為在(14)式
24、中原方程組系統(tǒng)和變換后的系統(tǒng)在數(shù)學(xué)上是完全等價的。這兩個解不相等是因為原數(shù)據(jù)空間和變換后數(shù)據(jù)空間的量度在變換過程中被改變了。這是一種不同的說法,即在使用最小二乘準則解決這兩個方程系統(tǒng)的過程中,距離是用不同方法測量出來的。因為最小二乘解最小化了距離,所以當數(shù)據(jù)空間的量度(或稱測量單位)改變后最小二乘解隨之發(fā)生改變是說得通的。這表明最小二乘解并不像乍看之下那么客觀,因為任意變換方程系統(tǒng)會導(dǎo)致不同的最小二乘解!對于最小二乘解,其廣義逆表達為。我們很容易推導(dǎo)出原系統(tǒng)和變換后系統(tǒng)的精度矩陣都等于單位矩陣,即:以及。因此,兩個系統(tǒng)都具有完美的精度!讀者也許有興趣停下來解釋一下(27)式中不相等的估計模型是
25、怎么被調(diào)和的。這里出現(xiàn)矛盾的原因是(5)式中的誤差傳播項。我們知道在表達式(24)中定義的系統(tǒng)中使用的數(shù)據(jù)一定要帶上誤差才能使得方程沒有矛盾。方程按比例縮放后,兩個方程組系統(tǒng)中的數(shù)據(jù)和誤差按不同方式得到調(diào)節(jié),這樣就得到了不同的模型估計。因此,在方程組中由誤差造成的矛盾產(chǎn)生了最小二乘解對任意比例縮放操作的依賴。我們現(xiàn)在來考慮數(shù)據(jù)向量和模型向量在更一般的變換條件下的最小二乘解。初始方程系統(tǒng)如下 (28)這個表達式不是很正確,因為我們忽略了誤差,而誤差總是存在的。這就是為什么上面的表達式不能完全滿足,我們必須找到這個方程組系統(tǒng)的的最小二乘解。我們來考慮通過一個變換矩陣來對模型參數(shù)作變換: (29)以
26、及通過一個變換矩陣來對數(shù)據(jù)向量作變換: (30)假設(shè)可逆,則變換后的方程組系統(tǒng)可以表達為 (31)原方程組系統(tǒng)(28)式的最小二乘解為 (32)變換后方程組系統(tǒng)(31)式的解與上式形式相同,只要令,用替換。這樣就給出了變換后模型向量的解。為了將這個解和模型估計(32)式進行比較,我們需要將它變回原模型空間,使用關(guān)系式。將最小二乘解寫成關(guān)于變換矩陣和的形式,有 (33)(表示對先轉(zhuǎn)置后求逆)再假設(shè)適當?shù)哪婢仃囀谴嬖诘?,我們對項反?fù)使用矩陣性質(zhì),得到,則表達式(33)可以簡化為 (34)比較該式和原系統(tǒng)表達式(32)中的最小二乘解,我們發(fā)現(xiàn) 當可逆時,對模型向量作變換不影響最小二乘解, 當時,對數(shù)
27、據(jù)向量作變換也不影響最小二乘解。對于第一個性質(zhì)的理解,我們回憶前文可知在最小二乘問題中的目標函數(shù)不會最小化模型范數(shù),只是對數(shù)據(jù)做了最小化擬合。對于第二條性質(zhì)的理解,我們可以對比變換前后被最小的那些量。對于原系統(tǒng),我們最小化的是: (35)對于變換后的系統(tǒng),我們最小化的是: (36)當變換矩陣是幺正矩陣(如果一個n階方陣,它的列向量構(gòu)成一組標準正交基,那么這個矩陣就是幺正矩陣),也就是當時,上述兩個量是相等的。這個結(jié)果體現(xiàn)了這樣一個性質(zhì),即幺正矩陣不影響向量的范數(shù)。2.6 最小范數(shù)解的調(diào)和問題協(xié)調(diào)性問題不僅針對最小二乘解,最小范數(shù)解也面臨同樣的問題。以(14)中的欠定方程組系統(tǒng)為例,這個問題的最
28、小范數(shù)解為 , (37)作模型向量到新模型向量的一個變換: (38)對于這個新模型向量,方程組系統(tǒng)變成了 (39)需要注意的是,這個變換后的模型向量揭示了這樣一個事實,變換后的系統(tǒng)比原系統(tǒng)(14)欠定得更加明顯,因為新系統(tǒng)沒有對模型參數(shù)施加任何約束。變換方程(39)的最小范數(shù)解為,。在(38)式變換作用下,變換后模型空間的這個解跟下面的這個原模型空間的解是一致的: , (40)這個解在圖4中用空心方塊表示。需要注意的是,這個解與原方程組系統(tǒng)的最小范數(shù)解(37)式是不同的。這里出現(xiàn)矛盾的原因跟2.5節(jié)中最小二乘解的調(diào)和問題是相似的;變換方程(38)已經(jīng)改變了模型空間的度量標準,所以原模型空間和變
29、換后模型空間中的距離是以不同方式來計量的。一次,原問題和變換后問題的最小范數(shù)解是不同我們可以模仿2.5節(jié)中的最小二乘解,對模型向量和數(shù)據(jù)向量在一般變換下得到的最小范數(shù)解的變換性質(zhì)做一個類似的一般化分析。但是,在實際應(yīng)用中,我們會對方程組作正則化。正如方程(23)所示,阻尼最小二乘解和阻尼最小范數(shù)解是完全相同的。因此,一般性的變換性質(zhì)將在下一節(jié)阻尼最小二乘解中來討論。2.7 尋求更一般的正則化對阻尼最小二乘解變換性質(zhì)的分析與2.5節(jié)中對非阻尼最小二乘解的分析是完全類似的?,F(xiàn)在先忽略誤差,線性方程組系統(tǒng)按(28)式表示為:,模型向量和數(shù)據(jù)向量的變換分別按(29)式和(30)式給出:和。再假設(shè)存在,
30、則變換后的方程組系統(tǒng)按(31)式表示為:。原系統(tǒng)的阻尼最小二乘解表示為 (41)與(34)式類似,變換后方程組的阻尼最小二乘解表示為: (42)這里的阻尼參數(shù)不一定等于原阻尼最小二乘解中的阻尼參數(shù),但是出于我們的目的,我們沒必要讓它們不等。表達式(42)可以通過(34)式中推導(dǎo)的相同步驟來簡化。將項寫作,則有 (43)這個表達式指向了一個基本的問題:模型空間的阻尼項由單位矩陣(見(42)式)給出,且當按照原模型向量來表達時,阻尼項為(見(43)式)。這表示阻尼對于模型參數(shù)變換并不是不變的。當進行數(shù)據(jù)向量變換時就會產(chǎn)生項。這表示在對數(shù)據(jù)向量或者模型向量作變換之后阻尼最小二乘解一般是會變得。因此,
31、需要有一個更一般的正則化可以允許以一致的方式改變模型和數(shù)據(jù)空間。這樣一個一般的正則化可以在(43)式中找到,令,同時定義。這樣,一般性最小二乘解表示為 (44)該解最小化下面的目標函數(shù): (45)這個表達式表示一般情況下權(quán)陣和可以是任意的(只要它們是正定的以保證有極小值)。按照這種寫法,可以被看作是一個權(quán)衡參數(shù),它折中了模型的兩個特征:模型大小以及模型對數(shù)據(jù)的不符合性。模型的兩個獨立的性質(zhì)不能都取得任意小,因此需要取一個平衡。然而,選取一個最適宜的并不那么容易。我們已經(jīng)清楚地表明,當你從一個簡單阻尼最小二乘解開始時,你可以把那個問題轉(zhuǎn)換成另一個坐標系中的一個更一般的正則最小二乘解,反之亦然。這
32、表明相對于(44)式這種更一般的最小二乘解我們偏向阻尼最小二乘解是沒有道理的。實際上,大多數(shù)反演問題都是不適定的(部分欠定部分超定)和病態(tài)的(數(shù)據(jù)中的微小誤差引起很大的模型變動),它們和零空間同時出現(xiàn),因此總是有非唯一解。所以需要進行正則化,但是在正則化的選取上存在很大不確定性scales and snieder, 1997。這反映出我們在解決反演問題時面臨的基本難點:相對于選取正則化,解決方程組系統(tǒng)只是一個次要問題。采用貝葉斯統(tǒng)計法是其中一種方法,我們從統(tǒng)計學(xué)的角度結(jié)合關(guān)于數(shù)據(jù)和帶實測數(shù)據(jù)的模型的先驗信息來討論反演問題tarantola and valette, 1982a; taranto
33、la and valette, 1982b。權(quán)陣反映了我們所掌握的關(guān)于數(shù)據(jù)和模型的真實的物理先驗信息(從統(tǒng)計學(xué)角度),且獨立于測量數(shù)據(jù)。比如,其中包括獲取數(shù)據(jù)用的儀器的統(tǒng)計噪聲特性,也包括來自其他自變量的模型和數(shù)據(jù)信息。(比如,地球的質(zhì)量密度一定是正的。)在貝葉斯方法中,權(quán)陣為 , (46)這里的和分布是數(shù)據(jù)和模型的先驗協(xié)方差矩陣: (47) (48)在這些表達式中,尖括號代表期望值。在這個解釋中,當誤差服從高斯分布時,估計量(44)與最可能的后驗?zāi)P褪且恢碌?。如果我們承認先驗信息包含真實物理意義這樣一個規(guī)律,則貝葉斯變換的統(tǒng)計學(xué)基礎(chǔ)會推導(dǎo)出一個客觀解。然而,實際上我們應(yīng)該意識到對于數(shù)據(jù)和模型
34、的先驗分布的選擇常常也是很主觀的。讀者可以在scales and snieder中的專欄“貝葉斯還是非貝葉斯”找到更加詳細的信息。另一種方法是定義一個非擬合函數(shù),這個方法賦予模型給定的性質(zhì)(比如小,光滑等等)parker,1994。選擇先驗信息相當于定義一個適當?shù)姆稊?shù),在這個范數(shù)中非擬合的數(shù)據(jù)和任何給定的模型性質(zhì)都會被測量。在我們的這個情況下,權(quán)陣會按范數(shù)定義一個特定的矩陣。選擇權(quán)陣的一個很常見的例子就是奧卡姆反演constable et al, 1987,該反演尋求一個與數(shù)據(jù)保持一致的最為平滑的模型。在這里,我們要求這個模型的梯度平方盡可能的小,也就是(45)式中最后一項是一個離散化,而不是
35、在模型范數(shù)上施加一個約束,因此跟拉普拉斯算子的一個離散形式是一致的。2.8 權(quán)陣的變化規(guī)則反演解的一個基本的要求應(yīng)該是反演問題的解不依賴于對模型向量或數(shù)據(jù)向量所做的任意縮放變換。遺憾的是,這個要求經(jīng)常被忽視,使得不同模型的對比變得毫無意義。了解實際含義可參閱tramper and leveque, 1990以及trampert et al, 1992。在這里,我們將推導(dǎo)在使最小二乘解保持不變的變換下,權(quán)陣和應(yīng)該怎樣調(diào)節(jié)。讓我們首先考慮(29)式中的模型向量縮放:。在這個變換下,(45)最小二乘量中的模型項將作如下變換 (49)其中 (50)對模型權(quán)作這樣的變換不會改變最小二乘準則,因此,當模型
36、權(quán)陣經(jīng)過變換后最小二乘解是不變的。值得一提的是,這個變換規(guī)則意味著,對于貝葉斯反演(其中的權(quán)陣是模型協(xié)方差陣的逆矩陣,即),協(xié)方差陣應(yīng)該作如下變化 (51)我們?nèi)菀讖亩x式(48)核實這確實是協(xié)方差算子的變換規(guī)則。接下來,我們考慮數(shù)據(jù)向量的變換(30)式是怎樣影響數(shù)據(jù)權(quán)陣的變換的。矩陣在變換的作用下作縮放變換。在這個變換作用下,最小二乘量(45)中的數(shù)據(jù)項將作如下變換 (52) 其中 (53)對于貝葉斯反演,數(shù)據(jù)權(quán)陣是數(shù)據(jù)協(xié)方差陣的逆陣(),這樣對于一個貝葉斯反演,應(yīng)該作如下變換 (54)再次注意,這是在(47)式中定義的正確的協(xié)方差陣變換規(guī)則。這表明貝葉斯觀點(即和是模型和數(shù)據(jù)協(xié)方差陣的逆矩
37、陣)確保了在模型向量以及/或者數(shù)據(jù)向量作變換后,解是不變的。盡管我們已經(jīng)推導(dǎo)出在模型和數(shù)據(jù)向量變換下權(quán)陣和是怎樣變換的,這絕不意味著這些權(quán)可以被明確地定義。一個不適定的以及/或者一個病態(tài)的反演問題只有當我們愿意通過施加一個正則化(regularization)項來控制解時才能被解決。一般來說,選取權(quán)陣和的方法并不唯一。選取這些矩陣則是用戶的主觀介入。2.9 解決線性方程組系統(tǒng)應(yīng)該注意的是,最小二乘解總是要求解決一組線性代數(shù)方程。比如,方程(44)可以寫成 (55)這個公式表示的是線性方程組的一個正方系統(tǒng),也就是所謂的法方程組。如果我們僅僅是對問題的估計部分感興趣,那么不需要轉(zhuǎn)換。如果我們還對問
38、題的評價部分感興趣(事實上我們總是會這樣),那么就必須意識到需要被轉(zhuǎn)換,這就要付出額外的計算機運算時間。許多標準的子程序包是可用的,press et al, 1989對這個問題給出了一個很好很實際的介紹。但是讀者需要明白,對于實際的地球物理問題,系統(tǒng)可能變得非常龐大,所以值得去考慮一個專門的程序,這個程序最匹配的性質(zhì)(對稱性,帶狀的,稀疏的,等等)。法方程組的維數(shù)也值得考慮。記住矩陣的維數(shù)是,其中是數(shù)據(jù)數(shù)量,是模型參數(shù)數(shù)量。系統(tǒng)(55)具有模型空間的維數(shù),但是運用(22)式我們可以得到一個與數(shù)據(jù)空間維數(shù)嚴格等價的系統(tǒng)。選擇最小的維數(shù)寫出法方程可以節(jié)省很多計算機計算時間。大多數(shù)解決代數(shù)方程組的技
39、術(shù)直接和作用,總的來說需要足夠的存儲空間來承載這個矩陣。但是,比如在全球走時斷層掃描中,這些維數(shù)可能會極度龐大(,),這樣就需要采用迭代方法,這種方法一次只能作用于的一部分。另一個經(jīng)常出現(xiàn)的問題是即便中包含了正則化,它仍然是奇異的或者數(shù)字上非常接近于奇異。奇異值分解(svd)是一個強有力的技術(shù),它能精確判斷出問題是什么,并且給出一個有用的數(shù)值解。svd是反演理論中解釋獲得某個結(jié)果最有效的工具。迭代法或者svd不需要作用于方正系統(tǒng),因此可能直接使用矩陣。在這部分內(nèi)容中,明白一般化最小二乘解(44)等價于簡單最小二乘解是有用的。 (56)讀者可以參閱tarantola1987中對于正定矩陣平方根的
40、意義的討論。還要記住在選擇權(quán)陣時的某種自由(見2.7),讀者也許想要直接定義而不是。表達式(56)表明,正則化會往線性方程組系統(tǒng)中添加額外的行,但是擴大的系統(tǒng)仍然保持形式,其中矩陣和數(shù)據(jù)向量被導(dǎo)致正則化的額外的行擴大了。此時在法方程中,不再是方陣。我們現(xiàn)在將更詳細地闡述應(yīng)用在系統(tǒng)中的奇異值分解和迭代法的本質(zhì)。2.9.1 奇異值分解(svd)其奇異值分解是由lanczos 1961年提出來的,這個方法是將矩陣的特征向量分解一般化至非方陣的情況。我們首先來考慮一個真實的對稱矩陣方陣,它的特征向量是,對應(yīng)的特征值是。對于這樣矩陣,其特征向量構(gòu)成了一個單位正交組,因此任何向量都可以由這些特征向量表示:
41、。當作用于這個表達式時,結(jié)果可以寫成 (57)用同樣的特征向量分解向量,則有,將其代入(57)式,可得下列解向量的展開式: (58)可以看出,小的特征向量可以導(dǎo)致解的不穩(wěn)定。奇異值分解將這個展開式推廣至非方陣矩陣。lanczos 1961以及aki and richards 1980給出了該方法的詳細內(nèi)容?,F(xiàn)在來考慮下面的非方陣方程組系統(tǒng): (59)奇異值分解基于在單位正交組特征向量下的展開式和在單位正交組特征向量下的展開式。這些向量不可能是的特征向量,因為不是方陣,因此它沒有任何特征向量。不過,這些向量與下列關(guān)系式存在關(guān)聯(lián): , (60)容易看出,當向量是的特征向量時,向量是的特征向量,因此
42、這些向量可以很容易被確定下來。和有公共的非零特征值。被稱為的奇異值。當作用在上時,結(jié)果可以寫成: (61)和的上限由非零特征值的數(shù)量來確定,因為零特征值對求和沒有貢獻。數(shù)字可以明顯小于問題的維數(shù):且。將向量和向量作為矩陣和的列是很方便的,從指標往后(即從開始)的特征項對應(yīng)于零特征值,需要把它們補充進矩陣和中使得矩陣完整:, (62) , (63)特征向量的正交性意味著,。特征向量的完整性意味著,。因為特征向量的正交性也存在于和的子空間和中,所以有,。但是,這些子空間中的向量一般不構(gòu)成完備組,所以一般,。(61) 式一般化至非方正系統(tǒng)可以寫成, (64)其中為 (65)從(61)式可知,當作用于
43、一個向量時,對應(yīng)于零特征值的特征向量不參與貢獻。這些特征向量被安排在子矩陣中。這相當于是說根據(jù)表達式(64)可知矩陣可僅由和建立。和是沒有被算子照亮的空間黑點(我認為這是比喻手法)。因為,所以預(yù)測數(shù)據(jù)與子空間正交,見圖-5。圖-5這表示中數(shù)據(jù)向量的任何分量都不能被任何模型所解釋。這些數(shù)據(jù)矩陣的分量必然和數(shù)據(jù)中的誤差或者算子中的誤差是對應(yīng)的,它們是對物理問題的一個描述。因此,被稱為數(shù)據(jù)無效空間。在最小二乘反演中,我們的目的是最小化非擬合數(shù)據(jù)。最小化非擬合數(shù)據(jù)實際上是找到一個模型,這個模型產(chǎn)生子空間中的一個最接近真實數(shù)據(jù)的數(shù)據(jù)向量。從圖-5可知,這只要簡單地把包含在數(shù)據(jù)中的的分量從問題中投射出去。
44、這實際上就是將(64)式中對特征值的求和限定為只對非零特征值求和。當然,當為空時,我們總可以找到那個完全解釋數(shù)據(jù)的,因為是跨越了整個數(shù)據(jù)空間的。類似地,對特征值的求和限定在非零特征值之上,其產(chǎn)生的影響是模型估計只產(chǎn)生于子空間中,估計模型在中沒有分量。在中的任何模型分量都不會影像數(shù)據(jù),因為。這表示定義了模型無效空間(model-null-space)。數(shù)據(jù)跟落在中的模型向量的分量是沒有關(guān)系的。將模型無效空間中的模型向量分量設(shè)置為零意味著在模型估計中我們只能考慮非零特征值。將在向量中展開,同時將在向量中展開,并只考慮非零特征值,我們可以因此用以下的方式將(58)式中的解一般化至非方陣系統(tǒng)中:, (
45、66)使用矩陣和,上述結(jié)果也可以寫成:, (67)其中, (68)類似于前面的問題,反演問題不是和的函數(shù)。如果這兩個子空間都為零,算子存在精確的逆。如果存在,我們可以得出殘差與是正交的,因此殘差是最小二乘準則下的最小值。如果存在,則解(67)在中沒有分量,因此是滿足最小范數(shù)準則的。很明顯,當乘以,且奇異值比較小的時候,中的小誤差會導(dǎo)致中出現(xiàn)較大誤差。這個誤差放大過程可以通過限定(66)式中僅對與零相差很大的特征值求和來加以控制(略去接近于零的特征值)。亦或者,我們可以將替換為,其中是一個正的常數(shù)。我們可以得出,這與(20)式中的阻尼最小二乘解是等價的。參考matsuura and hirata
46、 1982中對這些不同策略的討論。需要注意的是,去除或者抑制小特征值會導(dǎo)致不同的結(jié)果。這使得定量比較同一個問題通過這些根本上不相同的策略所獲得的解是幾乎不可能。奇異值分解普及的一個主要原因是我們可以控制解中的誤差傳播。缺點是,我們需要確定矩陣的特征向量。對于實際的大規(guī)模問題(),這可能需要一個無法接受的cpu運算時間。另一方面,一旦特征向量被計算出來,精度和誤差傳播幾乎可以不費力得到,因為他們僅僅涉及到矩陣相乘。2.9.2 迭代最小二乘法如式(11)所示,系統(tǒng)的最小二乘解為。注意矩陣可能含有如表達式(56)中所示的某種正則化形式。實際上,給定大型反演問題的規(guī)模,矩陣可能會超出計算機的存儲能力。
47、考慮到這個原因,我們發(fā)展出了迭代技巧,從而改善了現(xiàn)有的解估計。假設(shè)在迭代過程的第迭代中,我們得到了一個模型估計,我們想要得到一個改正值,從而新的模型估計成為模型的一個更好的估計。將該表達式代入關(guān)系式中,得到關(guān)于模型改正值的表達式:(69)需要注意的是,表達式右邊的是模型估計的殘差,也就是差值,它是對模型估計無法解釋數(shù)據(jù)的程度的一個衡量。表達式(69)描述了怎樣改正模型以減小數(shù)據(jù)殘差。這個表達式的最小二乘解為: (70)然而,我們還沒有得到任何結(jié)果,因為這個表達式幾乎跟原始表達式一樣難解。我們?nèi)匀恍枰鉀Q的逆矩陣。迭代解決這個問題的優(yōu)勢是,用這樣的方法我們可以將逆矩陣替換為該逆矩陣適當選取的一個
48、估計值,也就是說我們可以用下面這個表達式來計算模型的改正值: (71)算子稱為預(yù)處理算子。如果我們令,我們只需一步就能得到完全的解,但是這樣我們就需要計算,這是我們想要回避的。認識到是目標函數(shù)在處下降的方向,而在這個范圍的另一端,我們可以選擇讓,這里的是通過最小二乘準則推導(dǎo)出的一個常數(shù),從而保證達到可能的最快速的下降e.g. tarantola, 1984。實際上,我們不得不找一個平衡點,一方面是采用一個高級的預(yù)處理算子(這可能難以計算但是能夠用更少的迭代次數(shù)得到解),另一方面是采用一個簡單的預(yù)處理算子(這個很容易計算,但是可能會要求很多次迭代)。地球物理學(xué)中最常用的算法是sirt(同時迭代重
49、建法)和lsqr(最小二乘共軛梯度法)。sirt的缺點是會將隱式正則化引入到解中van der sluis and van der vorst, 1987以及在顯著增加收斂速度時是否正確trampert and leveque, 1990。lsqr算法可以得到一個最為成功的平衡paige and saunders, 1982a, 1982b; van der sluis and van der vorst, 1987。nolet and snieder 1990給出了一個迭代方案,可以模擬出svd(奇異值分解)的特性。需要注意的是,在迭代最小二乘算法(71)式中,不需要對矩陣求逆,我們只需要將矩陣和相乘,行與行之間相乘就行。在許多實際問題中,比如地震層析,其中的矩陣是非常稀疏的,這意味著矩陣中大多數(shù)元素都是零,參考6.1節(jié)。對于這樣一個矩陣,迭代最小二乘算法尤為有效
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 生鮮超市企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級戰(zhàn)略研究報告
- 便攜式收錄放設(shè)備超市企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級戰(zhàn)略研究報告
- 笤帚、掃帚批發(fā)企業(yè)ESG實踐與創(chuàng)新戰(zhàn)略研究報告
- 硝酸鋱企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級戰(zhàn)略研究報告
- 濃縮梨汁企業(yè)縣域市場拓展與下沉戰(zhàn)略研究報告
- 二零二五年度主播與游戲公司合作合同
- 二零二五年度高空吊裝作業(yè)安全及風(fēng)險評估協(xié)議
- 二零二五年度醫(yī)療衛(wèi)生機構(gòu)人事聘用管理合同
- 2025年度籃球運動傷害賠償處理合同
- 二零二五年度餐飲場所裝修工程合同書
- 2025年人教版新教材英語小學(xué)三年級下冊教學(xué)計劃(含進度表)
- 孤獨癥康復(fù)教育人員上崗培訓(xùn)練習(xí)題庫及答案
- 環(huán)境心理學(xué)課件
- 《質(zhì)量保證體系》情況說明
- 親人意外逝世的訃告微信群通知五篇-正式的去世訃告模板
- DB62∕T 4134-2020 高速公路服務(wù)區(qū)設(shè)計規(guī)范
- 中電朝陽250兆瓦智慧風(fēng)儲一體化風(fēng)電項目環(huán)評報告書
- 做一個幸福教師
- 海上風(fēng)電場+風(fēng)機基礎(chǔ)介紹
- 國家自然科學(xué)基金申請標書模板
- 車間斷針記錄表
評論
0/150
提交評論