地球物理學(xué)中的反次演問題_第1頁
地球物理學(xué)中的反次演問題_第2頁
地球物理學(xué)中的反次演問題_第3頁
地球物理學(xué)中的反次演問題_第4頁
地球物理學(xué)中的反次演問題_第5頁
已閱讀5頁,還剩24頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、裔寥狂赦氧昔較鷹雅誕曳厄嚨匈奢姨抒慮埔董曠店炕源菊造然內(nèi)鬧制保膊布管蓖鎂哈晰撐冒糙龔?fù)パ螟P札噴綽邀桐被鄂糙欺旁努稠餃宵隆麥鏈蒲甕悠船勢店晾艾玫演緘棗淚乞膩砂漾秸雪同療鑼蘇痔擲姆彪雨齲泊迅灑吸障疤慌娩個(gè)級柴酞園鈣單燦疹幣徊斡糟韌孿箔途驅(qū)履執(zhí)面剿棠陽撂乃鈞粒店悸茍汕川薯貓持翌痹丫巖益炳字侮釉燕糙贅廚桔踏纜窺怯蒸奉蛛孟忿姥儉猙蠱母諺脈執(zhí)酗解趣岸妖荊凸滴成娘揀次待亮吮梁宴宗斷才抹冰拼矢綽刷慨愈宛欺寢呸農(nóng)俘和甲楷級攜增疾噶萌魚窯躍隕像拍客扁宗豹珊羞抵者記斂冬竿檔啤豎教松問役分計(jì)腺硬恿扛蹬纜負(fù)赫崎嘗拎章奏形廂格詣節(jié)蛆嫉地球物理學(xué)中的反演問題介紹物理科學(xué)的一個(gè)重要的方面是根據(jù)數(shù)據(jù)對物理參數(shù)做出推斷。通常,物

2、理定律提供了計(jì)算給定模型的數(shù)據(jù)值的方法,這就被稱為“正演問題”,見圖-1。在反演問題中,我們的目標(biāo)是根據(jù)一組測量值重建物理模型。在理想情況下,存在一個(gè)確定的理論汕喧笨趕肪采眉脂恃凡鵬濾氛錳哲舟硫浚隱殲?zāi)净紊榫讓懼ㄍS置甕焰耪繳鬃曾哼酚實(shí)屈釁扶舒唆詠份參葛驗(yàn)捂擋翔蓑棧喲巒餌琶擊躊宜漆涼誼亮條琉衍壬閨掀斑唁錨震砌它亦瑟餃鞍巖鬧苯釣務(wù)嘶疤劉毅舞奄想竿莊把稠憲莆逗順鄭熾鈣智規(guī)觀史蕉彎菊禁苑誤媚扎妥爸享末瓊鬧蘸和墩祭蛻原搖瘩綻宰幕綜權(quán)裂娃滌茶陛只貼持附屬屜宿搗憎草黑藥措醛荒倡滯愚甥涅冊揍據(jù)楔嚙澀似韭累鴉肢盎匈訓(xùn)撾腮垃譜拳掏仔悄旺勒從埂檔做抒蚤胸激會討殃突月忌跑篷坊吹官寫第怎根誓岡腸柜涂喧酬栽坤乏且茅鑲有

3、賴?yán)[闡鎖羹仆瓤抨蘭蘑毀敷童經(jīng)蠅聞剁裂曼迎滁繳免潞走訟夫疙餅傣仍豹拱簡嬰絞地球物理學(xué)中的反次演問題爛湛鴻潰臺凍涼附袍猛尹龐輾肪控巋徑稠陣乒遷敢匡數(shù)筑脊乞鞘雅浚遷全舜汛放具駁雨巍但譴酒含啃受衷囊誦陋巡八現(xiàn)賒房詛孫購旅偷閻鋅圃李對拍竭爾喘離餡鴛鳥汁級簿戲漢距癰奠棉腺隆駛犢柱煉社銹腔鎳露醛栗巧拱牲春瑚窺隴茬撅悉熔頁黍恢分懊情隋疇煌茨麥架型憶詣寄稽匹年嗽熾寓鋸攪收趴嶄洱櫻鱉趟朔駁娩叮謊險(xiǎn)昏只滑狄簿更攏兇段婉衍搬之杠份孩琶峙百亡吮瑯癌翁幼異哮剔位江韻角貝哩采普皖哆觀蜀跨唾甕關(guān)式涉黑壯瑤卷舌刻本闡韋廉韌偽頑芍竹黎許畫邀訊厚糕凈鋪闌雄游惦翼漏娟央很實(shí)傍淀賦予害刑侗奪彪涌誦虎逆椅叭鈴陜廖怠淚讓澎坐圓莎甕涂叛詩繼

4、計(jì)宛醛秧地球物理學(xué)中的反演問題1、 介紹物理科學(xué)的一個(gè)重要的方面是根據(jù)數(shù)據(jù)對物理參數(shù)做出推斷。通常,物理定律提供了計(jì)算給定模型的數(shù)據(jù)值的方法,這就被稱為“正演問題”,見圖-1。在反演問題中,我們的目標(biāo)是根據(jù)一組測量值重建物理模型。在理想情況下,存在一個(gè)確定的理論規(guī)定了這些數(shù)據(jù)應(yīng)該怎樣轉(zhuǎn)換從而重現(xiàn)該模型。從選擇的一些例子來看,這樣一個(gè)存在的理論假定了(我們)所需要的無限的、無噪聲的數(shù)據(jù)是可以獲得的。在一個(gè)空間維度中,當(dāng)所有能量的反射系數(shù)已知時(shí),量子力學(xué)勢能可以被重建marchenko,1955; brurridge,1980。這種手法可以推廣到三維空間newton,1989,但是在那樣的情形下要

5、求有多余數(shù)據(jù)組,其中的原因并不是很理解。在一條一維的線上的質(zhì)量密度可以通過對它的所有本征頻率的測量來構(gòu)建borg,1946,但是因?yàn)檫@個(gè)問題的對稱性,因而只有偶數(shù)部分的質(zhì)量密度可以被確定。如果(地下的)地震波速只和深度有關(guān),那么根據(jù)地震波的距離,運(yùn)用阿貝爾變換,這個(gè)速度可以通過測定震波的抵達(dá)時(shí)間來精確構(gòu)建herglotz,1907;wiechert,1907。從數(shù)學(xué)上看,這個(gè)問題和構(gòu)建三維空間中的球?qū)ΨQ量子力學(xué)勢是相同的keller et al.,1956。然而,當(dāng)波速隨著深度單調(diào)增加時(shí),herglotz-wiechert的構(gòu)建法只能給出唯一解gerver and markushevitch,

6、1966。這種情況和量子力學(xué)是相似的,在量子力學(xué)中,當(dāng)電勢沒有局部最小值時(shí),徑向?qū)ΨQ勢只能被唯一建立sabatier,1973。(量子力學(xué)相關(guān)概念不熟悉,翻譯起來有點(diǎn)坑)圖-1盡管精確非線性反演法在數(shù)學(xué)表達(dá)上是美妙的,但它們的適用性是有限的。原因有很多。第一,精確的反演法通常只在理想狀態(tài)下適用,這在實(shí)際中可能無法保持。比如,herglotz-wiechert反演假定了地下的波速只依賴于深度并且隨著深度單調(diào)增加。地震層析成像顯示這兩點(diǎn)要求在地幔層都不滿足nolet et al.,1994。第二,精確反演方法常常很不穩(wěn)定。dorren et al1994已經(jīng)清楚地展示了marchenko方程解中這

7、種不穩(wěn)定性的存在。然而,第三個(gè)原因是最根本的。在很多反演問題中,我們要確定的模型是空間變量的一個(gè)連續(xù)函數(shù)。這意味著該模型有無窮多的自由度。然而,在實(shí)際實(shí)驗(yàn)中,能夠用來確定模型的數(shù)據(jù)數(shù)量通常都是有限的。通過變量的簡單計(jì)算表明這些數(shù)據(jù)不能承擔(dān)足夠的信息來唯一確定模型。在線性反演問題的背景下,backus 和 gilbert1967,1968提出了這一觀點(diǎn),之后parker1994也提出來這點(diǎn)。這個(gè)問題對于非線性反演問題同樣相關(guān)。在實(shí)際實(shí)驗(yàn)中有限多的數(shù)據(jù)可以用來重建具有無窮多自由度的模型這樣的事實(shí)必然表明反演問題不是唯一的,在這個(gè)意義上講,有很多模型同樣可以很好地解釋這些數(shù)據(jù)。因此,從數(shù)據(jù)反演中得到

8、的模型不一定等于我們想要的真實(shí)模型。這意味著圖1中展示的反演問題的觀點(diǎn)太簡單了。對于現(xiàn)實(shí)問題,反演實(shí)際上包含兩步。用表示真實(shí)模型,表示數(shù)據(jù)。由數(shù)據(jù)我們得到一個(gè)估計(jì)的模型,這一步稱為估計(jì)問題(estimation problem),看圖2。除了估計(jì)一個(gè)和數(shù)據(jù)一致的模型,我們也需要探究估計(jì)模型和真實(shí)模型具有什么關(guān)系。在評價(jià)問題中,我們會確定估計(jì)模型獲得了真實(shí)模型的哪些性質(zhì)以及附帶了哪些誤差。這部分討論的實(shí)質(zhì)就是反演=估計(jì)+評價(jià)。當(dāng)我們作出一個(gè)物理解釋卻不承認(rèn)模型中存在誤差的事實(shí)以及有限的精度,這是沒有多少意義的 trampert, 1998。圖-2通常來說,有兩個(gè)原因可以解釋為什么估計(jì)模型跟真實(shí)模

9、型不同。第一個(gè)原因是反演問題的非唯一性,這使得一些(通常是無窮多的)模型滿足這些數(shù)據(jù)。從技術(shù)上來講,這個(gè)模型因?yàn)槟P涂臻g的不充分取樣所以零空間存在。第二個(gè)原因是實(shí)際數(shù)據(jù)(以及物理理論比我們想要的更頻繁)總是受到誤差的污染,所以估計(jì)模型也受到這些誤差的污染。所以模型評價(jià)有兩個(gè)方面,非唯一性和誤差傳播。模型估計(jì)和模型評價(jià)對于具有有限自由度的離散模型和具有無窮多自由度的連續(xù)模型在根本上是不同的。而且,模型評價(jià)的問題只有在線性反演問題上得到很好的解決。因此,離散模型和連續(xù)模型的反演是分開處理的。線性反演和非線性反演的情況也是分開處理的。在第2節(jié)將討論有限數(shù)量模型參數(shù)的線性反演。在第3節(jié)中將推廣為處理帶

10、有無窮多自由度的連續(xù)模型的線性反演問題。實(shí)際上,很多反演問題都不完全是線性的,但是這些問題常??梢酝ㄟ^做一些適當(dāng)?shù)慕苼砭€性化。在第4節(jié)中將推導(dǎo)出單次散射近似。這種方法形成了運(yùn)用于反射地震學(xué)中的成像工具的基礎(chǔ)。rayleigh原理將在第5節(jié)介紹,它是關(guān)于線性化的,構(gòu)成了使用正則模態(tài)頻率對地球結(jié)構(gòu)進(jìn)行反演的基礎(chǔ)。地震波傳播時(shí)間層析的線性化方法是基于fermat原理的,這將在第6節(jié)介紹。非線性反演問題要明顯難于線性反演問題。第7節(jié)將會說明非線性可能是不適定性的一個(gè)來源。目前,對于非線性反演問題的評價(jià)問題還沒有令人滿意的理論。在第8節(jié)將會介紹三種可用于非線性評價(jià)問題的方法。然而,這些方法沒有一個(gè)是非

11、常令人滿意的,表明非線性反演理論是一個(gè)有重要研究挑戰(zhàn)的領(lǐng)域。2、 解有限的線性方程組在前面的章節(jié)中討論過,反演問題將有限的數(shù)據(jù)映射到一個(gè)模型上。在地球物理學(xué)大多數(shù)實(shí)際應(yīng)用中,該模型是空間坐標(biāo)的一個(gè)連續(xù)函數(shù),因此具有無窮多的自由度。我們暫時(shí)忽略這點(diǎn)并假定該模型的特征可以由有限個(gè)參數(shù)確定。我們將回到這些模型的重要情形,在第3節(jié)中這些模型會是無限維的。2.1 線性模型估計(jì)對于一個(gè)有限維的模型,模型參數(shù)可以規(guī)定為向量,類似地,數(shù)據(jù)可以規(guī)定為向量。矩陣通過乘積將數(shù)據(jù)關(guān)聯(lián)到模型上。這個(gè)矩陣常常被稱為理論算子。確實(shí),在給定的問題上,它包含了我們選擇給模型的所有物理和數(shù)學(xué)信息。實(shí)際上,這些數(shù)據(jù)包含了誤差,因此

12、記錄的數(shù)據(jù)和該模型的關(guān)系應(yīng)該是: (1)有一點(diǎn)需要經(jīng)常注意的是,我們對于包含在模型向量中的模型參數(shù)的選擇有某種武斷性。例如,若想要描述地球的密度,我們可以選擇一個(gè)模型,在該模型中,地幔和地核具有均勻密度,在這種情況下存在兩個(gè)模型參數(shù)。或者,我們可以把大量定義在球體上的特征方程中的地球密度展開,比如描述橫向變化的球諧函數(shù)以及描述深度方向變化的多項(xiàng)式,這種情況會有更多的模型參數(shù)。在同一個(gè)模型上的這兩種不同參數(shù)化方法對應(yīng)于不同的模型參數(shù)和不同的矩陣。這個(gè)例子表明模型m不一定是真實(shí)的模型,但是對模型參數(shù)的選擇通常包含了對于所能構(gòu)建的模型的等級的限制。以下我們將把認(rèn)為是真模型,雖然對于它的定義存在很多困

13、難。由記錄的數(shù)據(jù)我們得到模型的一個(gè)估計(jì)。因?yàn)檫@個(gè)估計(jì)實(shí)際上跟真模型是不同的,我們用來表示估計(jì)模型。有很多方法來設(shè)計(jì)一個(gè)逆運(yùn)算將數(shù)據(jù)映射到估計(jì)模型上e.g. menke,1984;tarantola,1987;parker,1994。無論選擇什么估計(jì)量,從數(shù)據(jù)到估計(jì)模型之間最一般的線性映射可以寫做 (2)算子稱為矩陣的廣義逆。一般來說,數(shù)據(jù)的數(shù)量不等于模型參數(shù)的數(shù)量。因此,通常是一個(gè)非方陣矩陣,所以它的正常逆矩陣是不存在的。隨后我們將說明廣義逆矩陣如何來選擇,但目前并不需要作詳細(xì)說明。被估計(jì)模型與真模型之間的關(guān)系遵循如下表達(dá)式(將等式(1)代入等式(2) (3)矩陣稱為精度矩陣(resoluti

14、on kernel),這個(gè)算子被定義為 (4)表達(dá)式(3)可以寫成下列形式來進(jìn)行解釋 (5)在理想情況下,估計(jì)模型等于真模型向量:表示我們選擇的參數(shù)(列在向量中)可以被相互獨(dú)立估計(jì)。等式(5)中最后兩項(xiàng)分別解釋了估計(jì)模型中的模糊度(blurring)和偽差(artifacts)。描述了估計(jì)模型向量的元素是真模型向量不同元素的線性組合。我們只能取得模型估計(jì)中的參數(shù)平均值和模糊度,因?yàn)槲覀儫o法映射出最完美的細(xì)節(jié)。在理想情況下,這一項(xiàng)是為零的,此時(shí)等于單位矩陣。由(4)可知,對于完美解決的模型參數(shù),精度矩陣為單位矩陣,即 (6)如前所述,通常定義向量的模型參數(shù)的定義存在某種歧義。精度算子告訴了我們在

15、估計(jì)過程中我們可以獨(dú)立獲得的模型參數(shù)的程度。但是,精度矩陣并沒有完全告訴我們估計(jì)模型和真實(shí)的潛在物理模型之間的關(guān)系是什么,因?yàn)樗鼪]有考慮模型參數(shù)的選擇對于在估計(jì)過程中能夠得到的模型的限制程度。表達(dá)式(5)中的最后一項(xiàng)描述了誤差是怎樣映射到估計(jì)模型上去的。這些誤差并不確知,否則它們就能從數(shù)據(jù)中減去。因?yàn)閿?shù)據(jù)中存在誤差,所以需要一個(gè)統(tǒng)計(jì)分析來描述估計(jì)模型中的這些誤差。當(dāng)數(shù)據(jù)不相關(guān)且有標(biāo)準(zhǔn)差,則根據(jù)數(shù)據(jù)誤差傳播,模型估計(jì)中的標(biāo)準(zhǔn)差表達(dá)為 (7)理想上來看,我們希望同時(shí)獲得:一個(gè)完美的精度,以及不存在誤差的估計(jì)模型。不幸的是,實(shí)際上這是不可能實(shí)現(xiàn)的。比如,使用廣義逆陣完全抑制了誤差傳播。這導(dǎo)致(荒謬的

16、)估計(jì)模型,這樣確實(shí)不受誤差的影響。但是,這個(gè)特殊的廣義逆陣對應(yīng)的精度矩陣是,顯然這和理想的精度矩陣相去甚遠(yuǎn)。因此,實(shí)際上我們需要在誤差傳播和精度限制之間找到一個(gè)可接受的平衡點(diǎn)。2.2 最小二乘估計(jì)我們現(xiàn)在來考慮這樣的情況:獨(dú)立數(shù)據(jù)的數(shù)量多于未知數(shù)的數(shù)量。在這種情況下,等式不總是對任意給定的模型都滿足,因?yàn)閿?shù)據(jù)向量中包含的可能誤差使得方程左右矛盾。例如,我們來考慮下面的問題。我們有兩個(gè)物塊質(zhì)量分別是和。第一個(gè)物塊的稱重得出1千克質(zhì)量。某人測量第二個(gè)物塊,結(jié)果得出2千克質(zhì)量。接下來,某人把兩個(gè)物塊放在一起稱重,結(jié)果發(fā)現(xiàn)總質(zhì)量是2千克。這個(gè)問題中測量的結(jié)果可以用下列方程組表示 (8)相應(yīng)的矩陣表示

17、為 (9)顯然,這個(gè)方程組是不能滿足的。不可能第一個(gè)物塊質(zhì)量是,第二個(gè)物塊的質(zhì)量是,而它們的質(zhì)量之和。顯然測量中存在誤差,但是沒理由舍棄三個(gè)方程中的一個(gè)而去支持另外兩個(gè)。圖3(略)生動地闡述了這個(gè)問題。在平面中,三個(gè)方程對應(yīng)三條實(shí)線。三條線不相交于同一點(diǎn)表示這個(gè)線性方程組存在矛盾。所以,采用合理的方法調(diào)和這些方程是確定兩個(gè)物塊質(zhì)量的反演問題的一部分。通常估計(jì)模型的一種方法是尋找一個(gè)能夠最佳擬合數(shù)據(jù)的模型,在這個(gè)意義上,數(shù)據(jù)向量和再估算數(shù)據(jù)之間由范數(shù)(即歐幾里德距離,延伸閱讀泛函分析)計(jì)量的差值要盡可能小。這表示由模型給出的最小二乘解最小化下列目標(biāo)函數(shù)圖-3 (10)詳細(xì)說明了這個(gè)量由下列模型估

18、計(jì)最小化 (11)在圖3的例子中,最小二乘解是平面中到三條實(shí)線距離最短的點(diǎn),這個(gè)點(diǎn)用一個(gè)黑色方塊來表示。使用矩陣(9),我們很容易得出問題(8)的最小二乘估計(jì)量由下式給出 (12)代入數(shù)據(jù)向量,分別得到估計(jì)模型 (13)2.3 最小范數(shù)估計(jì)在一些問題中,未知量的數(shù)量少于參數(shù)的數(shù)量。例如,考慮這樣一個(gè)情形:有兩個(gè)物塊和,某人只測量了它們的總質(zhì)量 (14)相應(yīng)的矩陣表示為 (15)這個(gè)問題被形象地表示在圖4(略)中。顯然,任何位于該實(shí)線上的模型向量都嚴(yán)格滿足等式(14)。因此,考慮到質(zhì)量是正值,則存在無限多完全滿足數(shù)據(jù)的解。一個(gè)模型估計(jì)可以通過選取一個(gè)完全滿足數(shù)據(jù)且具有最小范數(shù)的模型來定義,這個(gè)模

19、型在圖4中用黑色方塊表示。圖-4對于一個(gè)一般的欠定(under-determined 證據(jù)不足地說明)方程組系統(tǒng),最小范數(shù)解定義為完全滿足數(shù)據(jù),即,且最小化的模型。使用拉格朗日乘數(shù)法我們能得出最小范數(shù)解 (16)給出了詳細(xì)推導(dǎo)。我們很容易得出系統(tǒng)(14)的最小范數(shù)解 (17)2.4 混定問題(mixed determined problems)在最小二乘估計(jì)中,我們假定即使由于測量誤差導(dǎo)致出現(xiàn)矛盾,我們?nèi)匀挥凶銐虻男畔砬蟪鏊心P蛥?shù)。所以,這就變成一個(gè)完全超定(over-determined 多因素決定)的問題,作為結(jié)果是正則的。在最小范數(shù)解中,我們假定在可用的信息中不存在矛盾,但是我們沒

20、有足夠的方程求出所有模型參數(shù)。這就是一個(gè)完全欠定的問題,這里的是正則的。然而,最一般的情況是我們在一些模型參數(shù)上有矛盾的信息,而另一些則因?yàn)槿狈π畔⒍鵁o法評估出來。這時(shí),無論還是都不能求逆(invert),這個(gè)問題是不適定的(ill-posed)。即使逆矩陣是正式存在的,它們通常也是病態(tài)(ill-conditioned)的,這意味著數(shù)據(jù)向量中很小的變化會導(dǎo)致模型估計(jì)中很大的變化。這表示數(shù)據(jù)中的誤差在模型估計(jì)中將會被放大。顯然,我們需要一點(diǎn)技巧來尋找一個(gè)模型,讓它對數(shù)據(jù)中的小變化不那么敏感。帶著這個(gè)目的,引入一個(gè)阻尼最小二乘解。從數(shù)學(xué)的觀點(diǎn)來看,不適定性和病態(tài)解是由的零或接近于零的奇異值引起的。

21、(這一句可能不準(zhǔn)確)假設(shè)我們有一個(gè)矩陣,它的特征值(eigenvalue)為,特征向量為,則有 (18)我們?nèi)菀椎玫骄仃嚨奶卣髦禐椋瑒t有 (19)這表示矩陣的特征值可以通過向原矩陣添加一個(gè)乘了系數(shù)的單位矩陣來獲得。這個(gè)性質(zhì)可以用來定義阻尼最小二乘解 (20)因?yàn)榫仃嚲哂姓奶卣髦担瑒t當(dāng)常數(shù)為正時(shí),的特征值將在正方向離零更遠(yuǎn)(以便消除不適定性和病態(tài))。這樣,(20)的解可通過最小化下面的價(jià)值方程得到 (21)這個(gè)表達(dá)式清楚地表明阻尼在當(dāng)中的作用。最小化(21)式的第一項(xiàng)實(shí)際上是尋找最滿足數(shù)據(jù)的模型。最小化(21)式的最后一項(xiàng)相當(dāng)于尋找有最小范數(shù)的模型。一般地,我們不能同時(shí)最小化這兩項(xiàng),但是在最小

22、化(21)式時(shí),我們采取折衷的辦法去找一個(gè)模型既能夠合理滿足數(shù)據(jù)又能夠獲得不太大的模型尺度。參數(shù)控制著我們對這兩個(gè)相互沖突的要求的側(cè)重,因此它被稱為權(quán)衡系數(shù)(trade-off parameter)。對許多應(yīng)用來說,下面的矩陣性質(zhì)是非常有用的 (22)在這個(gè)表達(dá)式中,和是正則方陣,然而并不需要是方陣。這個(gè)表達(dá)式可以證明當(dāng)采用加阻尼或者正則化時(shí),最小二乘解和最小范數(shù)解(兩者都采用了一個(gè)阻尼項(xiàng))是完全相同的。為了理解這點(diǎn),我們令(22)式中,則有 (23)左手邊相當(dāng)于加阻尼的最小二乘解,右手邊是(16)式最小范數(shù)解的加阻尼形式。這表明加阻尼后最小二乘解和最小范數(shù)解釋完全相同的。2.5 最小二乘解的

23、一致性問題最小二乘解看似為尋求超定問題的解提供了一個(gè)客觀的方法。不過,后面還存在問題。要理解這一點(diǎn),我們來考慮方程組(8)超定系統(tǒng)。從數(shù)學(xué)角度看,當(dāng)我們在最后一個(gè)方程左右乘上2,這個(gè)方程組系統(tǒng)不會改變。以下這兩個(gè)方程組系統(tǒng)是完全等價(jià)的 (24)原系統(tǒng)矩陣和新的等價(jià)系統(tǒng)矩陣可以表示為,以及 (25)在這部分,無撇號的量表示原方程組系統(tǒng),而有撇號的量則表示變換后的方程組系統(tǒng)。我們?nèi)菀椎玫皆到y(tǒng)以及變換后系統(tǒng)的最小二乘解(11),如下,以及 (26)代入原數(shù)據(jù)向量和變換后數(shù)據(jù)向量的數(shù)字值,可以得到下列模型的估計(jì)值,以及 (27)問題是,關(guān)于同一個(gè)模型的這兩個(gè)估計(jì)量是不同的。這很奇怪,因?yàn)樵冢?4)式

24、中原方程組系統(tǒng)和變換后的系統(tǒng)在數(shù)學(xué)上是完全等價(jià)的。這兩個(gè)解不相等是因?yàn)樵瓟?shù)據(jù)空間和變換后數(shù)據(jù)空間的量度在變換過程中被改變了。這是一種不同的說法,即在使用最小二乘準(zhǔn)則解決這兩個(gè)方程系統(tǒng)的過程中,距離是用不同方法測量出來的。因?yàn)樽钚《私庾钚』司嚯x,所以當(dāng)數(shù)據(jù)空間的量度(或稱測量單位)改變后最小二乘解隨之發(fā)生改變是說得通的。這表明最小二乘解并不像乍看之下那么客觀,因?yàn)槿我庾儞Q方程系統(tǒng)會導(dǎo)致不同的最小二乘解!對于最小二乘解,其廣義逆表達(dá)為。我們很容易推導(dǎo)出原系統(tǒng)和變換后系統(tǒng)的精度矩陣都等于單位矩陣,即:以及。因此,兩個(gè)系統(tǒng)都具有完美的精度!讀者也許有興趣停下來解釋一下(27)式中不相等的估計(jì)模型是

25、怎么被調(diào)和的。這里出現(xiàn)矛盾的原因是(5)式中的誤差傳播項(xiàng)。我們知道在表達(dá)式(24)中定義的系統(tǒng)中使用的數(shù)據(jù)一定要帶上誤差才能使得方程沒有矛盾。方程按比例縮放后,兩個(gè)方程組系統(tǒng)中的數(shù)據(jù)和誤差按不同方式得到調(diào)節(jié),這樣就得到了不同的模型估計(jì)。因此,在方程組中由誤差造成的矛盾產(chǎn)生了最小二乘解對任意比例縮放操作的依賴。我們現(xiàn)在來考慮數(shù)據(jù)向量和模型向量在更一般的變換條件下的最小二乘解。初始方程系統(tǒng)如下 (28)這個(gè)表達(dá)式不是很正確,因?yàn)槲覀兒雎粤苏`差,而誤差總是存在的。這就是為什么上面的表達(dá)式不能完全滿足,我們必須找到這個(gè)方程組系統(tǒng)的的最小二乘解。我們來考慮通過一個(gè)變換矩陣來對模型參數(shù)作變換: (29)以

26、及通過一個(gè)變換矩陣來對數(shù)據(jù)向量作變換: (30)假設(shè)可逆,則變換后的方程組系統(tǒng)可以表達(dá)為 (31)原方程組系統(tǒng)(28)式的最小二乘解為 (32)變換后方程組系統(tǒng)(31)式的解與上式形式相同,只要令,用替換。這樣就給出了變換后模型向量的解。為了將這個(gè)解和模型估計(jì)(32)式進(jìn)行比較,我們需要將它變回原模型空間,使用關(guān)系式。將最小二乘解寫成關(guān)于變換矩陣和的形式,有 (33)(表示對先轉(zhuǎn)置后求逆)再假設(shè)適當(dāng)?shù)哪婢仃囀谴嬖诘模覀儗?xiàng)反復(fù)使用矩陣性質(zhì),得到,則表達(dá)式(33)可以簡化為 (34)比較該式和原系統(tǒng)表達(dá)式(32)中的最小二乘解,我們發(fā)現(xiàn) 當(dāng)可逆時(shí),對模型向量作變換不影響最小二乘解, 當(dāng)時(shí),對數(shù)

27、據(jù)向量作變換也不影響最小二乘解。對于第一個(gè)性質(zhì)的理解,我們回憶前文可知在最小二乘問題中的目標(biāo)函數(shù)不會最小化模型范數(shù),只是對數(shù)據(jù)做了最小化擬合。對于第二條性質(zhì)的理解,我們可以對比變換前后被最小的那些量。對于原系統(tǒng),我們最小化的是: (35)對于變換后的系統(tǒng),我們最小化的是: (36)當(dāng)變換矩陣是幺正矩陣(如果一個(gè)n階方陣,它的列向量構(gòu)成一組標(biāo)準(zhǔn)正交基,那么這個(gè)矩陣就是幺正矩陣),也就是當(dāng)時(shí),上述兩個(gè)量是相等的。這個(gè)結(jié)果體現(xiàn)了這樣一個(gè)性質(zhì),即幺正矩陣不影響向量的范數(shù)。2.6 最小范數(shù)解的調(diào)和問題協(xié)調(diào)性問題不僅針對最小二乘解,最小范數(shù)解也面臨同樣的問題。以(14)中的欠定方程組系統(tǒng)為例,這個(gè)問題的最

28、小范數(shù)解為 , (37)作模型向量到新模型向量的一個(gè)變換: (38)對于這個(gè)新模型向量,方程組系統(tǒng)變成了 (39)需要注意的是,這個(gè)變換后的模型向量揭示了這樣一個(gè)事實(shí),變換后的系統(tǒng)比原系統(tǒng)(14)欠定得更加明顯,因?yàn)樾孪到y(tǒng)沒有對模型參數(shù)施加任何約束。變換方程(39)的最小范數(shù)解為,。在(38)式變換作用下,變換后模型空間的這個(gè)解跟下面的這個(gè)原模型空間的解是一致的: , (40)這個(gè)解在圖4中用空心方塊表示。需要注意的是,這個(gè)解與原方程組系統(tǒng)的最小范數(shù)解(37)式是不同的。這里出現(xiàn)矛盾的原因跟2.5節(jié)中最小二乘解的調(diào)和問題是相似的;變換方程(38)已經(jīng)改變了模型空間的度量標(biāo)準(zhǔn),所以原模型空間和變

29、換后模型空間中的距離是以不同方式來計(jì)量的。一次,原問題和變換后問題的最小范數(shù)解是不同我們可以模仿2.5節(jié)中的最小二乘解,對模型向量和數(shù)據(jù)向量在一般變換下得到的最小范數(shù)解的變換性質(zhì)做一個(gè)類似的一般化分析。但是,在實(shí)際應(yīng)用中,我們會對方程組作正則化。正如方程(23)所示,阻尼最小二乘解和阻尼最小范數(shù)解是完全相同的。因此,一般性的變換性質(zhì)將在下一節(jié)阻尼最小二乘解中來討論。2.7 尋求更一般的正則化對阻尼最小二乘解變換性質(zhì)的分析與2.5節(jié)中對非阻尼最小二乘解的分析是完全類似的?,F(xiàn)在先忽略誤差,線性方程組系統(tǒng)按(28)式表示為:,模型向量和數(shù)據(jù)向量的變換分別按(29)式和(30)式給出:和。再假設(shè)存在,

30、則變換后的方程組系統(tǒng)按(31)式表示為:。原系統(tǒng)的阻尼最小二乘解表示為 (41)與(34)式類似,變換后方程組的阻尼最小二乘解表示為: (42)這里的阻尼參數(shù)不一定等于原阻尼最小二乘解中的阻尼參數(shù),但是出于我們的目的,我們沒必要讓它們不等。表達(dá)式(42)可以通過(34)式中推導(dǎo)的相同步驟來簡化。將項(xiàng)寫作,則有 (43)這個(gè)表達(dá)式指向了一個(gè)基本的問題:模型空間的阻尼項(xiàng)由單位矩陣(見(42)式)給出,且當(dāng)按照原模型向量來表達(dá)時(shí),阻尼項(xiàng)為(見(43)式)。這表示阻尼對于模型參數(shù)變換并不是不變的。當(dāng)進(jìn)行數(shù)據(jù)向量變換時(shí)就會產(chǎn)生項(xiàng)。這表示在對數(shù)據(jù)向量或者模型向量作變換之后阻尼最小二乘解一般是會變得。因此,

31、需要有一個(gè)更一般的正則化可以允許以一致的方式改變模型和數(shù)據(jù)空間。這樣一個(gè)一般的正則化可以在(43)式中找到,令,同時(shí)定義。這樣,一般性最小二乘解表示為 (44)該解最小化下面的目標(biāo)函數(shù): (45)這個(gè)表達(dá)式表示一般情況下權(quán)陣和可以是任意的(只要它們是正定的以保證有極小值)。按照這種寫法,可以被看作是一個(gè)權(quán)衡參數(shù),它折中了模型的兩個(gè)特征:模型大小以及模型對數(shù)據(jù)的不符合性。模型的兩個(gè)獨(dú)立的性質(zhì)不能都取得任意小,因此需要取一個(gè)平衡。然而,選取一個(gè)最適宜的并不那么容易。我們已經(jīng)清楚地表明,當(dāng)你從一個(gè)簡單阻尼最小二乘解開始時(shí),你可以把那個(gè)問題轉(zhuǎn)換成另一個(gè)坐標(biāo)系中的一個(gè)更一般的正則最小二乘解,反之亦然。這

32、表明相對于(44)式這種更一般的最小二乘解我們偏向阻尼最小二乘解是沒有道理的。實(shí)際上,大多數(shù)反演問題都是不適定的(部分欠定部分超定)和病態(tài)的(數(shù)據(jù)中的微小誤差引起很大的模型變動),它們和零空間同時(shí)出現(xiàn),因此總是有非唯一解。所以需要進(jìn)行正則化,但是在正則化的選取上存在很大不確定性scales and snieder, 1997。這反映出我們在解決反演問題時(shí)面臨的基本難點(diǎn):相對于選取正則化,解決方程組系統(tǒng)只是一個(gè)次要問題。采用貝葉斯統(tǒng)計(jì)法是其中一種方法,我們從統(tǒng)計(jì)學(xué)的角度結(jié)合關(guān)于數(shù)據(jù)和帶實(shí)測數(shù)據(jù)的模型的先驗(yàn)信息來討論反演問題tarantola and valette, 1982a; taranto

33、la and valette, 1982b。權(quán)陣反映了我們所掌握的關(guān)于數(shù)據(jù)和模型的真實(shí)的物理先驗(yàn)信息(從統(tǒng)計(jì)學(xué)角度),且獨(dú)立于測量數(shù)據(jù)。比如,其中包括獲取數(shù)據(jù)用的儀器的統(tǒng)計(jì)噪聲特性,也包括來自其他自變量的模型和數(shù)據(jù)信息。(比如,地球的質(zhì)量密度一定是正的。)在貝葉斯方法中,權(quán)陣為 , (46)這里的和分布是數(shù)據(jù)和模型的先驗(yàn)協(xié)方差矩陣: (47) (48)在這些表達(dá)式中,尖括號代表期望值。在這個(gè)解釋中,當(dāng)誤差服從高斯分布時(shí),估計(jì)量(44)與最可能的后驗(yàn)?zāi)P褪且恢碌?。如果我們承認(rèn)先驗(yàn)信息包含真實(shí)物理意義這樣一個(gè)規(guī)律,則貝葉斯變換的統(tǒng)計(jì)學(xué)基礎(chǔ)會推導(dǎo)出一個(gè)客觀解。然而,實(shí)際上我們應(yīng)該意識到對于數(shù)據(jù)和模型

34、的先驗(yàn)分布的選擇常常也是很主觀的。讀者可以在scales and snieder中的專欄“貝葉斯還是非貝葉斯”找到更加詳細(xì)的信息。另一種方法是定義一個(gè)非擬合函數(shù),這個(gè)方法賦予模型給定的性質(zhì)(比如小,光滑等等)parker,1994。選擇先驗(yàn)信息相當(dāng)于定義一個(gè)適當(dāng)?shù)姆稊?shù),在這個(gè)范數(shù)中非擬合的數(shù)據(jù)和任何給定的模型性質(zhì)都會被測量。在我們的這個(gè)情況下,權(quán)陣會按范數(shù)定義一個(gè)特定的矩陣。選擇權(quán)陣的一個(gè)很常見的例子就是奧卡姆反演constable et al, 1987,該反演尋求一個(gè)與數(shù)據(jù)保持一致的最為平滑的模型。在這里,我們要求這個(gè)模型的梯度平方盡可能的小,也就是(45)式中最后一項(xiàng)是一個(gè)離散化,而不是

35、在模型范數(shù)上施加一個(gè)約束,因此跟拉普拉斯算子的一個(gè)離散形式是一致的。2.8 權(quán)陣的變化規(guī)則反演解的一個(gè)基本的要求應(yīng)該是反演問題的解不依賴于對模型向量或數(shù)據(jù)向量所做的任意縮放變換。遺憾的是,這個(gè)要求經(jīng)常被忽視,使得不同模型的對比變得毫無意義。了解實(shí)際含義可參閱tramper and leveque, 1990以及trampert et al, 1992。在這里,我們將推導(dǎo)在使最小二乘解保持不變的變換下,權(quán)陣和應(yīng)該怎樣調(diào)節(jié)。讓我們首先考慮(29)式中的模型向量縮放:。在這個(gè)變換下,(45)最小二乘量中的模型項(xiàng)將作如下變換 (49)其中 (50)對模型權(quán)作這樣的變換不會改變最小二乘準(zhǔn)則,因此,當(dāng)模型

36、權(quán)陣經(jīng)過變換后最小二乘解是不變的。值得一提的是,這個(gè)變換規(guī)則意味著,對于貝葉斯反演(其中的權(quán)陣是模型協(xié)方差陣的逆矩陣,即),協(xié)方差陣應(yīng)該作如下變化 (51)我們?nèi)菀讖亩x式(48)核實(shí)這確實(shí)是協(xié)方差算子的變換規(guī)則。接下來,我們考慮數(shù)據(jù)向量的變換(30)式是怎樣影響數(shù)據(jù)權(quán)陣的變換的。矩陣在變換的作用下作縮放變換。在這個(gè)變換作用下,最小二乘量(45)中的數(shù)據(jù)項(xiàng)將作如下變換 (52) 其中 (53)對于貝葉斯反演,數(shù)據(jù)權(quán)陣是數(shù)據(jù)協(xié)方差陣的逆陣(),這樣對于一個(gè)貝葉斯反演,應(yīng)該作如下變換 (54)再次注意,這是在(47)式中定義的正確的協(xié)方差陣變換規(guī)則。這表明貝葉斯觀點(diǎn)(即和是模型和數(shù)據(jù)協(xié)方差陣的逆矩

37、陣)確保了在模型向量以及/或者數(shù)據(jù)向量作變換后,解是不變的。盡管我們已經(jīng)推導(dǎo)出在模型和數(shù)據(jù)向量變換下權(quán)陣和是怎樣變換的,這絕不意味著這些權(quán)可以被明確地定義。一個(gè)不適定的以及/或者一個(gè)病態(tài)的反演問題只有當(dāng)我們愿意通過施加一個(gè)正則化(regularization)項(xiàng)來控制解時(shí)才能被解決。一般來說,選取權(quán)陣和的方法并不唯一。選取這些矩陣則是用戶的主觀介入。2.9 解決線性方程組系統(tǒng)應(yīng)該注意的是,最小二乘解總是要求解決一組線性代數(shù)方程。比如,方程(44)可以寫成 (55)這個(gè)公式表示的是線性方程組的一個(gè)正方系統(tǒng),也就是所謂的法方程組。如果我們僅僅是對問題的估計(jì)部分感興趣,那么不需要轉(zhuǎn)換。如果我們還對問

38、題的評價(jià)部分感興趣(事實(shí)上我們總是會這樣),那么就必須意識到需要被轉(zhuǎn)換,這就要付出額外的計(jì)算機(jī)運(yùn)算時(shí)間。許多標(biāo)準(zhǔn)的子程序包是可用的,press et al, 1989對這個(gè)問題給出了一個(gè)很好很實(shí)際的介紹。但是讀者需要明白,對于實(shí)際的地球物理問題,系統(tǒng)可能變得非常龐大,所以值得去考慮一個(gè)專門的程序,這個(gè)程序最匹配的性質(zhì)(對稱性,帶狀的,稀疏的,等等)。法方程組的維數(shù)也值得考慮。記住矩陣的維數(shù)是,其中是數(shù)據(jù)數(shù)量,是模型參數(shù)數(shù)量。系統(tǒng)(55)具有模型空間的維數(shù),但是運(yùn)用(22)式我們可以得到一個(gè)與數(shù)據(jù)空間維數(shù)嚴(yán)格等價(jià)的系統(tǒng)。選擇最小的維數(shù)寫出法方程可以節(jié)省很多計(jì)算機(jī)計(jì)算時(shí)間。大多數(shù)解決代數(shù)方程組的技

39、術(shù)直接和作用,總的來說需要足夠的存儲空間來承載這個(gè)矩陣。但是,比如在全球走時(shí)斷層掃描中,這些維數(shù)可能會極度龐大(,),這樣就需要采用迭代方法,這種方法一次只能作用于的一部分。另一個(gè)經(jīng)常出現(xiàn)的問題是即便中包含了正則化,它仍然是奇異的或者數(shù)字上非常接近于奇異。奇異值分解(svd)是一個(gè)強(qiáng)有力的技術(shù),它能精確判斷出問題是什么,并且給出一個(gè)有用的數(shù)值解。svd是反演理論中解釋獲得某個(gè)結(jié)果最有效的工具。迭代法或者svd不需要作用于方正系統(tǒng),因此可能直接使用矩陣。在這部分內(nèi)容中,明白一般化最小二乘解(44)等價(jià)于簡單最小二乘解是有用的。 (56)讀者可以參閱tarantola1987中對于正定矩陣平方根的

40、意義的討論。還要記住在選擇權(quán)陣時(shí)的某種自由(見2.7),讀者也許想要直接定義而不是。表達(dá)式(56)表明,正則化會往線性方程組系統(tǒng)中添加額外的行,但是擴(kuò)大的系統(tǒng)仍然保持形式,其中矩陣和數(shù)據(jù)向量被導(dǎo)致正則化的額外的行擴(kuò)大了。此時(shí)在法方程中,不再是方陣。我們現(xiàn)在將更詳細(xì)地闡述應(yīng)用在系統(tǒng)中的奇異值分解和迭代法的本質(zhì)。2.9.1 奇異值分解(svd)其奇異值分解是由lanczos 1961年提出來的,這個(gè)方法是將矩陣的特征向量分解一般化至非方陣的情況。我們首先來考慮一個(gè)真實(shí)的對稱矩陣方陣,它的特征向量是,對應(yīng)的特征值是。對于這樣矩陣,其特征向量構(gòu)成了一個(gè)單位正交組,因此任何向量都可以由這些特征向量表示:

41、。當(dāng)作用于這個(gè)表達(dá)式時(shí),結(jié)果可以寫成 (57)用同樣的特征向量分解向量,則有,將其代入(57)式,可得下列解向量的展開式: (58)可以看出,小的特征向量可以導(dǎo)致解的不穩(wěn)定。奇異值分解將這個(gè)展開式推廣至非方陣矩陣。lanczos 1961以及aki and richards 1980給出了該方法的詳細(xì)內(nèi)容?,F(xiàn)在來考慮下面的非方陣方程組系統(tǒng): (59)奇異值分解基于在單位正交組特征向量下的展開式和在單位正交組特征向量下的展開式。這些向量不可能是的特征向量,因?yàn)椴皇欠疥嚕虼怂鼪]有任何特征向量。不過,這些向量與下列關(guān)系式存在關(guān)聯(lián): , (60)容易看出,當(dāng)向量是的特征向量時(shí),向量是的特征向量,因此

42、這些向量可以很容易被確定下來。和有公共的非零特征值。被稱為的奇異值。當(dāng)作用在上時(shí),結(jié)果可以寫成: (61)和的上限由非零特征值的數(shù)量來確定,因?yàn)榱闾卣髦祵η蠛蜎]有貢獻(xiàn)。數(shù)字可以明顯小于問題的維數(shù):且。將向量和向量作為矩陣和的列是很方便的,從指標(biāo)往后(即從開始)的特征項(xiàng)對應(yīng)于零特征值,需要把它們補(bǔ)充進(jìn)矩陣和中使得矩陣完整:, (62) , (63)特征向量的正交性意味著,。特征向量的完整性意味著,。因?yàn)樘卣飨蛄康恼恍砸泊嬖谟诤偷淖涌臻g和中,所以有,。但是,這些子空間中的向量一般不構(gòu)成完備組,所以一般,。(61) 式一般化至非方正系統(tǒng)可以寫成, (64)其中為 (65)從(61)式可知,當(dāng)作用于

43、一個(gè)向量時(shí),對應(yīng)于零特征值的特征向量不參與貢獻(xiàn)。這些特征向量被安排在子矩陣中。這相當(dāng)于是說根據(jù)表達(dá)式(64)可知矩陣可僅由和建立。和是沒有被算子照亮的空間黑點(diǎn)(我認(rèn)為這是比喻手法)。因?yàn)椋灶A(yù)測數(shù)據(jù)與子空間正交,見圖-5。圖-5這表示中數(shù)據(jù)向量的任何分量都不能被任何模型所解釋。這些數(shù)據(jù)矩陣的分量必然和數(shù)據(jù)中的誤差或者算子中的誤差是對應(yīng)的,它們是對物理問題的一個(gè)描述。因此,被稱為數(shù)據(jù)無效空間。在最小二乘反演中,我們的目的是最小化非擬合數(shù)據(jù)。最小化非擬合數(shù)據(jù)實(shí)際上是找到一個(gè)模型,這個(gè)模型產(chǎn)生子空間中的一個(gè)最接近真實(shí)數(shù)據(jù)的數(shù)據(jù)向量。從圖-5可知,這只要簡單地把包含在數(shù)據(jù)中的的分量從問題中投射出去。

44、這實(shí)際上就是將(64)式中對特征值的求和限定為只對非零特征值求和。當(dāng)然,當(dāng)為空時(shí),我們總可以找到那個(gè)完全解釋數(shù)據(jù)的,因?yàn)槭强缭搅苏麄€(gè)數(shù)據(jù)空間的。類似地,對特征值的求和限定在非零特征值之上,其產(chǎn)生的影響是模型估計(jì)只產(chǎn)生于子空間中,估計(jì)模型在中沒有分量。在中的任何模型分量都不會影像數(shù)據(jù),因?yàn)?。這表示定義了模型無效空間(model-null-space)。數(shù)據(jù)跟落在中的模型向量的分量是沒有關(guān)系的。將模型無效空間中的模型向量分量設(shè)置為零意味著在模型估計(jì)中我們只能考慮非零特征值。將在向量中展開,同時(shí)將在向量中展開,并只考慮非零特征值,我們可以因此用以下的方式將(58)式中的解一般化至非方陣系統(tǒng)中:, (

45、66)使用矩陣和,上述結(jié)果也可以寫成:, (67)其中, (68)類似于前面的問題,反演問題不是和的函數(shù)。如果這兩個(gè)子空間都為零,算子存在精確的逆。如果存在,我們可以得出殘差與是正交的,因此殘差是最小二乘準(zhǔn)則下的最小值。如果存在,則解(67)在中沒有分量,因此是滿足最小范數(shù)準(zhǔn)則的。很明顯,當(dāng)乘以,且奇異值比較小的時(shí)候,中的小誤差會導(dǎo)致中出現(xiàn)較大誤差。這個(gè)誤差放大過程可以通過限定(66)式中僅對與零相差很大的特征值求和來加以控制(略去接近于零的特征值)。亦或者,我們可以將替換為,其中是一個(gè)正的常數(shù)。我們可以得出,這與(20)式中的阻尼最小二乘解是等價(jià)的。參考matsuura and hirata

46、 1982中對這些不同策略的討論。需要注意的是,去除或者抑制小特征值會導(dǎo)致不同的結(jié)果。這使得定量比較同一個(gè)問題通過這些根本上不相同的策略所獲得的解是幾乎不可能。奇異值分解普及的一個(gè)主要原因是我們可以控制解中的誤差傳播。缺點(diǎn)是,我們需要確定矩陣的特征向量。對于實(shí)際的大規(guī)模問題(),這可能需要一個(gè)無法接受的cpu運(yùn)算時(shí)間。另一方面,一旦特征向量被計(jì)算出來,精度和誤差傳播幾乎可以不費(fèi)力得到,因?yàn)樗麄儍H僅涉及到矩陣相乘。2.9.2 迭代最小二乘法如式(11)所示,系統(tǒng)的最小二乘解為。注意矩陣可能含有如表達(dá)式(56)中所示的某種正則化形式。實(shí)際上,給定大型反演問題的規(guī)模,矩陣可能會超出計(jì)算機(jī)的存儲能力。

47、考慮到這個(gè)原因,我們發(fā)展出了迭代技巧,從而改善了現(xiàn)有的解估計(jì)。假設(shè)在迭代過程的第迭代中,我們得到了一個(gè)模型估計(jì),我們想要得到一個(gè)改正值,從而新的模型估計(jì)成為模型的一個(gè)更好的估計(jì)。將該表達(dá)式代入關(guān)系式中,得到關(guān)于模型改正值的表達(dá)式:(69)需要注意的是,表達(dá)式右邊的是模型估計(jì)的殘差,也就是差值,它是對模型估計(jì)無法解釋數(shù)據(jù)的程度的一個(gè)衡量。表達(dá)式(69)描述了怎樣改正模型以減小數(shù)據(jù)殘差。這個(gè)表達(dá)式的最小二乘解為: (70)然而,我們還沒有得到任何結(jié)果,因?yàn)檫@個(gè)表達(dá)式幾乎跟原始表達(dá)式一樣難解。我們?nèi)匀恍枰鉀Q的逆矩陣。迭代解決這個(gè)問題的優(yōu)勢是,用這樣的方法我們可以將逆矩陣替換為該逆矩陣適當(dāng)選取的一個(gè)

48、估計(jì)值,也就是說我們可以用下面這個(gè)表達(dá)式來計(jì)算模型的改正值: (71)算子稱為預(yù)處理算子。如果我們令,我們只需一步就能得到完全的解,但是這樣我們就需要計(jì)算,這是我們想要回避的。認(rèn)識到是目標(biāo)函數(shù)在處下降的方向,而在這個(gè)范圍的另一端,我們可以選擇讓,這里的是通過最小二乘準(zhǔn)則推導(dǎo)出的一個(gè)常數(shù),從而保證達(dá)到可能的最快速的下降e.g. tarantola, 1984。實(shí)際上,我們不得不找一個(gè)平衡點(diǎn),一方面是采用一個(gè)高級的預(yù)處理算子(這可能難以計(jì)算但是能夠用更少的迭代次數(shù)得到解),另一方面是采用一個(gè)簡單的預(yù)處理算子(這個(gè)很容易計(jì)算,但是可能會要求很多次迭代)。地球物理學(xué)中最常用的算法是sirt(同時(shí)迭代重

49、建法)和lsqr(最小二乘共軛梯度法)。sirt的缺點(diǎn)是會將隱式正則化引入到解中van der sluis and van der vorst, 1987以及在顯著增加收斂速度時(shí)是否正確trampert and leveque, 1990。lsqr算法可以得到一個(gè)最為成功的平衡paige and saunders, 1982a, 1982b; van der sluis and van der vorst, 1987。nolet and snieder 1990給出了一個(gè)迭代方案,可以模擬出svd(奇異值分解)的特性。需要注意的是,在迭代最小二乘算法(71)式中,不需要對矩陣求逆,我們只需要將矩陣和相乘,行與行之間相乘就行。在許多實(shí)際問題中,比如地震層析,其中的矩陣是非常稀疏的,這意味著矩陣中大多數(shù)元素都是零,參考6.1節(jié)。對于這樣一個(gè)矩陣,迭代最小二乘算法尤為有效

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論