實驗數(shù)據(jù)分析方法誤差理論與最小二乘法_第1頁
實驗數(shù)據(jù)分析方法誤差理論與最小二乘法_第2頁
實驗數(shù)據(jù)分析方法誤差理論與最小二乘法_第3頁
實驗數(shù)據(jù)分析方法誤差理論與最小二乘法_第4頁
實驗數(shù)據(jù)分析方法誤差理論與最小二乘法_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

實驗數(shù)據(jù)分析方法誤差理論與最小二乘法1第一頁,共六十二頁,編輯于2023年,星期五第五章誤差理論與最小二乘法

天文學的諸多理論是以天文觀測為基礎(chǔ)的,如地球自轉(zhuǎn)理論、人造衛(wèi)星運動理論等都離不開天文觀測。人們通過對某一天文量(靜態(tài)的或動態(tài)的)的直接或間接觀測,獲得大量的數(shù)據(jù)。而任何觀測都不可避免的含有誤差。因此,當我們在利用觀測結(jié)果時,必須分析這些數(shù)據(jù)的可靠程度:只有當它們的誤差在我們允許的范圍之內(nèi)時,我們才能放心大膽的去使用它,否則則不能使用。

誤差的研究無論是對生產(chǎn)實踐還是基礎(chǔ)理論研究都有著重要意義!2第二頁,共六十二頁,編輯于2023年,星期五

例1:由于牛頓在其最初計算中使用了具有較大誤差的地球半徑值,使得他測得的月球加速度的值和理論計算值相差約10%,因而推遲了20年發(fā)表他的引力理論!

例2:愛因斯坦廣義相對論的觀測證明:1916年愛因斯坦在德國《物理學紀事》上發(fā)表了具有劃時代意義的重要文獻《廣義相對論基礎(chǔ)》。文章指出,當光線行經(jīng)太陽附近時,光線產(chǎn)生彎曲,其彎曲曲率預計為

=1.”75,而1911年他用經(jīng)典方法得到=0.”9,相差兩倍。如果觀測能測得在1.”75附近,這將證明他的廣義相對論是正確的,如果測得的值是在經(jīng)典值附近,則將否定其理論。幸好1919年英國天文學家愛丁頓爵士在西非幾內(nèi)亞灣的普林西比島的日全食觀測中測得=1.”610.”30;與此同時有人在巴西東北海岸外索伯雷爾的日食觀測中測得=1.”980.”12。這兩個結(jié)果與廣義相對論的預言值相近,遠大于經(jīng)典理論值,強有力的證明了廣義相對論的正確性!如果他們當時的觀測誤差很大,置信度很低,以致于和理論值相差甚遠,那么也就很難由此來驗證這個理論了。由此可見,觀測和誤差分析對基礎(chǔ)理論的研究起了一個不可估量的作用!3第三頁,共六十二頁,編輯于2023年,星期五

最小二乘法是用來處理具有誤差的觀測數(shù)據(jù)的一種有效的方法,也是最早用于天文觀測資料處理的一種數(shù)學工具。早在l794年,高斯為了利用小行星坐標的多次觀測準確地推算小行星的軌道,第一次應(yīng)用了最小二乘法。1805年勒讓德應(yīng)用測量平差方法確定了彗星的軌道和地球子午線弧長。1809年高斯又推證了誤差的概率定律,從而使最小二乘法高度完善化,成為數(shù)據(jù)處理中應(yīng)用最廣的一個分支。隨著概率統(tǒng)計學和矩陣理論的發(fā)展以及電子計算機的廣泛應(yīng)用,最小二乘法進入了近代數(shù)據(jù)處理方法的行列。4第四頁,共六十二頁,編輯于2023年,星期五誤差是實驗科學術(shù)語,指測量結(jié)果偏離真值的程度。對任何一個物理量進行的測量都不可能得出一個絕對準確的數(shù)值,即使采用測量技術(shù)所能達到的最完善的方法,測出的數(shù)值也和真實值存在差異,這種測量值和真實值的差異稱為誤差。(fromWiki)誤差按其表達形式分:絕對誤差、相對誤差誤差按其性質(zhì)及產(chǎn)生原因分:系統(tǒng)誤差、隨機誤差、過失(人為)誤差

誤差不僅存在于測量值中,計算時采用近似的理論模型,計算中一些理論常數(shù)的不準確以及數(shù)值計算中取位的多少等也會在計算結(jié)果中產(chǎn)生誤差?!?.1誤差的定義與分類5第五頁,共六十二頁,編輯于2023年,星期五5.1.1絕對誤差和相對誤差一個量值的給出值的絕對誤差定義為該量值的給出值與其真值之差,或用公式表示為:

絕對誤差=給出值-真值公式中的給出值如果是被測量的觀測結(jié)果,則相應(yīng)的誤差為觀測誤差;如果給出值是某量的計算近似值,則相應(yīng)的誤差為計算近似值的誤差。式中的真值是被測量本身的真實大小,它是一個理想的概念:一般說來,真值是未知的,通常用約定值來代替。例如某一系統(tǒng)的天文常數(shù)也可看作相應(yīng)量值的真值。從絕對誤差的定義式不難看出,絕對誤差和被測量具有相同的量綱。因此,若說一顆星其位置誤差為0."1,測時的記錄誤差為0."0001,都是指的絕對誤差。6第六頁,共六十二頁,編輯于2023年,星期五我們把誤差的反號值定義為修正值,則可得:真值=給出值-誤差=給出值+修正值這表明,帶有誤差的給出值加上修正值后可消除或減小誤差的影響。在有些情況下用絕對誤差來表示測量的精度是不恰當?shù)模喝缒壳靶l(wèi)星激光測距的準確度(測量值與被測量真值之間的偏離程度)已達cm級,衛(wèi)星的距離一般為103km量級;但如果我們測定的是恒星的距離(這里指離太陽在20pc以內(nèi)的恒星),用三角視差法一般可準確到0.”02,相當于2pc的測距誤差,顯然它和衛(wèi)星的測距誤差是無法直接比較的!但如果我們引入相對誤差的概念,它們的測距誤差就有了可比性。7第七頁,共六十二頁,編輯于2023年,星期五被測量的絕對誤差?與其真值a之比定義為這個量的相對誤差,并用下式表示:當誤差較小時,相對誤差式中真值a可用給定值代替。對于上面的例子,它們測距的相對誤差分別為1×10和1×10-1。

即三角視差測量的相對誤差反而要比衛(wèi)星激光測距的相對誤差??!8第八頁,共六十二頁,編輯于2023年,星期五

由觀測的環(huán)境因素差異、儀器性能、不同的觀測者等因素造成的按某一確定的規(guī)律變化的誤差稱為系統(tǒng)誤差。系統(tǒng)誤差的大小和符號在多次重復觀測中幾乎相同,通常使觀測值往一個方向偏離。另外,這種誤差可以歸結(jié)為某一因素或某幾個因素的函數(shù),而這種函數(shù)通??梢杂媒馕龉奖磉_出來。人們總是設(shè)法找出代表系統(tǒng)誤差的解析表達式,然后在觀測結(jié)果中扣除。由某些難以控制的隨機因素造成的,絕對值和符號的變化時大時小、時正時負,以不可預測的方式變化的誤差稱為隨機誤差。雖然就其個體而言,隨機誤差沒有規(guī)律、不可預料,但就其總體而言,隨著觀測次數(shù)的增加,它又服從某種統(tǒng)計規(guī)律。下面我們將從概率論的角度出發(fā)討論隨機誤差所滿足的統(tǒng)計規(guī)律。

5.1.2系統(tǒng)誤差、隨機誤差和過失誤差

9第九頁,共六十二頁,編輯于2023年,星期五古典誤差理論認為,隨機誤差服從正態(tài)分布,因此我們可以用正態(tài)分布密度曲線來表征隨機誤差,隨機誤差的分布密度曲線可表為:

其被稱為高斯誤差方程,其相應(yīng)圖形也常被稱為高斯誤差曲線。式中稱為精密度指數(shù),=x-a,

為隨機誤差的均方差。高斯誤差方程的一般表達式:10第十頁,共六十二頁,編輯于2023年,星期五

隨機誤差有下列統(tǒng)計特征,當觀測樣本足夠大時:(1)絕對值相等、符號相反的正負誤差近于相等。因此,隨機誤差的算術(shù)平均值隨著觀測次數(shù)的增加愈來愈小,以零為極限。(2)誤差的概率與誤差的大小有關(guān),絕對值小的誤差出現(xiàn)的概率比絕對值大的誤差出現(xiàn)的概率大,絕對值很大的誤差出現(xiàn)的概率很小。

根據(jù)隨機誤差的這些特征,當不存在系統(tǒng)誤差的影響時,多次測量結(jié)果的平均值將更接近于真值。隨機誤差產(chǎn)生的原因很多,觀測時環(huán)境因素的微小變化,設(shè)備中的熱噪聲等都是產(chǎn)生隨機誤差的重要原因。11第十一頁,共六十二頁,編輯于2023年,星期五實際上,系統(tǒng)誤差和隨機誤差之間并沒有明顯的界限有時,我們把一些具有復雜規(guī)律但暫末掌握的系統(tǒng)誤差都當作隨機誤差處理。而隨著人們對誤差及其規(guī)律的認識的加深,就有可能把這些以往認識不到因而歸之于隨機誤差的這類誤差確認為系統(tǒng)誤差。反之,在一個較短時期內(nèi)可能呈現(xiàn)出某種規(guī)律,故而歸為系統(tǒng)誤差,但經(jīng)過一段較長時間的觀測,發(fā)現(xiàn)這種變化規(guī)律破壞了,并呈現(xiàn)出隨機性,這就是說,隨著時間的推移,兩種不同性質(zhì)的誤差有可能互相轉(zhuǎn)化。過失(人為)誤差是指測量結(jié)果與事實明顯不符的一種誤差。如觀測時對錯星或觀測過程中望遠鏡/記錄儀器的小故障等過失原因造成的結(jié)果異常。這種誤差一般比較容易發(fā)現(xiàn),而且只要觀測人員認真細致,基本上是可以避免的。12第十二頁,共六十二頁,編輯于2023年,星期五

數(shù)據(jù)處理中一個很重要的方面是評定一列觀測值的可靠程度。它是指觀測結(jié)果與真值的一致程度,是觀測結(jié)果中系統(tǒng)誤差和隨機誤差大小的綜合度量,常用準確度這個詞來表征。在消除了系統(tǒng)誤差之后,觀測的可靠程度由隨機誤差的大小來衡量。一列觀測值精度高低必須從全列觀測值的誤差來衡量,而不能只根據(jù)個別值的誤差來判斷。另外,觀測的目的是要從一列觀測值中確定(直接地或間接地)被測量的真值,但由于觀測手段和觀測次數(shù)的限制,真值實際上是測不到的,只能得到它的一個近似值或估計值。在天文學中通常把最接近于被測量的真值的一個近似值稱為它們的最或然值,因此,數(shù)據(jù)處理的又一個重要的問題是給出被測量的最或然值及其精度。最或然值的精度是衡量觀測結(jié)果的精度和處理方法有效性的綜合指標?!?.2觀測精度13第十三頁,共六十二頁,編輯于2023年,星期五標準偏差(又稱均方誤差)是用來衡量一列觀測值精度高低的一個較好指標。設(shè)為被測量的一組觀測值,a為被測量的真值,且{xi}中只包含隨機誤差,則稱為{xi}的真誤差,我們定義真誤差的平方的算術(shù)平均值的平方根為這列觀測值的標準偏差或標準誤差,天文上又常稱之為中誤差,并用表示,即:

這里定義的標準誤差和統(tǒng)計學中從方差的正平方根定義的標準差是一致的,因為從概率論的角度來說,xi的真值可用其數(shù)學期望表示。5.2.1精度標準14第十四頁,共六十二頁,編輯于2023年,星期五下面我們來說明標準偏差的大小為什么可以用來衡量一列觀測值的精度高低:由正態(tài)分布的性質(zhì)可知,觀測值xi在(a,a+)區(qū)間上的概率,或說i出現(xiàn)在(,+)范圍內(nèi)的概率為68.3%,已知1

2.則區(qū)間(a1,a+1)小于(a2,a+2),也就是說

=1的觀測數(shù)據(jù)在a

周圍的分布較密集,而

=2的觀測值在a

周圍的分布較分散,即標準偏差

的大小可以衡量一列觀測值在真值周圍分布的密度程度,而這種密集程度是具有概率含義的,即誤差在(,+)內(nèi)的置信水平是68.3%。15第十五頁,共六十二頁,編輯于2023年,星期五下表列出了一些常用的置信水平誤差限:置信水平誤差限置信水平誤差限50.0%68.3%95.0%0.6741.01.9695.5%99.0%99.7%22.583

可見,誤差落在3中的概率為99.7%,亦即絕對值大于3的誤差僅有0.3%,這顯然是一個小概率事件。所以在有限次觀測中,誤差值大于3的觀測值可能含有過失誤差,應(yīng)考慮舍去該觀測值;當然,也有可能這個值并不含有過失誤差,如舍去它會犯“棄真”錯誤,但這種誤差的最大概率也只有0.3%。這種取舍觀測值的原則稱為拉依達準則或簡稱為3準則。

16第十六頁,共六十二頁,編輯于2023年,星期五高斯函數(shù)的性質(zhì)17第十七頁,共六十二頁,編輯于2023年,星期五在比較兩個觀測結(jié)果時,應(yīng)在相同的置信水平上比較它們的誤差限,誤差限較小的觀測較精確,為了說明觀測的精度,通常把觀測結(jié)果報導為

(置信水平)。凡是沒有注明置信水平的,一般均指=68.3%,相應(yīng)的誤差限即為標準誤差。

在上述各式中,真值a(或x)通常是未知的,因此真誤差也是未知的,通常用被測量的最或然值或真值的估計值代替真值,觀測值與其最或然值之差稱為觀測值的殘差或離差。標準誤差不取決于觀測中個別誤差的符號,對觀測值中較大誤差和較小誤差比較靈敏,是表示精度的較好方法。實際應(yīng)用中,有時也常用平均誤差離差絕對值的算術(shù)平均值來表示精度;也有時采用概率誤差:即絕對值比它大的誤差和絕對值比它小的誤差出現(xiàn)的可能性一樣大,將誤差絕對值按大小順序排列,序列的中位數(shù)即為概率誤差。平均誤差和概率誤差只有當N較大時才較可靠。天體物理中還經(jīng)常采用半峰寬度來表示觀測的精度,所謂半峰寬度,即觀測值分布曲線在極大值半高度處的全寬(FullWidthatHalfMaximum)。18第十八頁,共六十二頁,編輯于2023年,星期五

在很多實際問題中,待求量往往不能直接觀測得到,但它們可通過對其它量的觀測,再利用它們之間的函數(shù)關(guān)系換算求得:這種情況就稱為間接觀測。間接觀測在天文觀測中是普遍存在的,例如:在人造衛(wèi)星的定軌預報中要測的是衛(wèi)星在某一歷元的軌道根數(shù),但它們不能直接測得而只能通過測定衛(wèi)星的赤經(jīng)、赤緯換算而得到。對于間接觀測的情況,應(yīng)首先由直接觀測量求出間接觀測量的最或然值,然后由直接觀測量的精度估計出間接觀測量的精度。通常用下面的式子表示間接觀測量y與m個直接觀測量xk(k=1m)的關(guān)系:5.2.2誤差傳遞公式19第十九頁,共六十二頁,編輯于2023年,星期五為了求得間接觀測時誤差傳遞的關(guān)系,需要對上式進行線性化處理如果直接觀測量的誤差相對于它們的觀測值來說是較小的量,則非線性函數(shù)可以在各個觀測值的鄰近點上展開成泰勒級數(shù),然后取誤差的一階項而略去一切高階誤差項:式中為觀測量xk的離差,我們把它記為νk。若對xk(k=1m)各進行了N次觀測,設(shè)間接觀測量任一次觀測的離差為νy=y(tǒng)y0,y0=f(x10,x20,…,xm0),將y=νy+y0,νk=xkxk0

代入上式,可得:直接觀測量xk的誤差以的形式出現(xiàn)在間接觀測量y的誤差中,或說間接觀測量y的誤差是m個直接觀測量的誤差加權(quán)和,權(quán)重因子稱為y的誤差傳遞系數(shù)。

20第二十頁,共六十二頁,編輯于2023年,星期五設(shè)m個直接觀測量的標準偏差為,根據(jù)標準偏差的定義及隨機變量方差的運算法則,可得間接觀測量y的標準偏差為:

式中kj為第k個觀測量與第j個觀測量的相關(guān)系數(shù)。當各個直接觀測量相互獨立時,有kj=0,則有:

上式通常稱為獨立觀測量的誤差合成定理。若間接觀測量與直接觀測量的關(guān)系為線性關(guān)系時,即:。則有:此式即為線性情況下的標準偏差傳遞公式。21第二十一頁,共六十二頁,編輯于2023年,星期五例:利用IRAF進行測光時,其會根據(jù)誤差傳遞以如下的公式給出測光誤差:

根據(jù)信噪比的定義:S/N=Flux/Err,故1/Merr≈S/N,即IRAF里給出的測光誤差的倒數(shù)即為信噪比。除了信噪比會引起測光誤差外,還有很多其他的因素也會帶來誤差,如減本底、除平場、減暗流等過程都會帶來附加的誤差:一般平場的精度可以達到千分之五左右。目標源的測光誤差可以按如下形式給出:

Eref為多顆比較星測光誤差的平均值,Eobj為目標源測光誤差,Eothers為其他誤差,根據(jù)不同的情況確定,比如誤差小于千分之五的時候“其他誤差”就可能需要包括平場誤差,再比如比較星的定標誤差等。22第二十二頁,共六十二頁,編輯于2023年,星期五

觀測精度的高低是由觀測條件決定的,它包括觀測的手段、儀器的精度、觀測的次數(shù)、觀測者技術(shù)熟練的程度等,因此我們按觀測時的條件把觀測分成兩大類:如果某一列觀測是在完全相同的條件下進行的,則為等精度觀測,所得到的序列稱為等精度觀測列;如果某一列觀測是在不同的條件下進行的,稱為非等精度觀測,相應(yīng)的觀測序列為非等精度觀測列。

等精度觀測列的標準偏差對于等精度觀測列,可以用全列觀測值的標準偏差來衡量這列觀測值的精度。但是,由于觀測值的真誤差一般是未知的,為此通常用觀測值的殘差代替真誤差。而對于一列等精度觀測值來說,被測量的最或然值就是這列觀測值的算術(shù)平均值,則有殘差,而真誤差為:5.2.3等精度觀測和非等精度觀測

23第二十三頁,共六十二頁,編輯于2023年,星期五

為算術(shù)平均值的真誤差,對上式兩邊求平方和,得:并有:

由線性情況下的標準偏差傳遞公式,并將算術(shù)平均值的標準偏差代入上式則得:

整理后得到一等精度觀測列用殘差表示的標準偏差公式(這里用高斯符號[]表示求和):24第二十四頁,共六十二頁,編輯于2023年,星期五

權(quán)與非等精度觀測列處理非等精度觀測序列的情況在天文學中是很普遍的:例如利用觀測星表編制基本星表就是一個典型的例子。各種星表中的星位都具有誤差;即使是在同一星表中,它所包含的星位也不都具有相同的標準偏差。它們大多數(shù)和觀測次數(shù)的多少有關(guān),故而大多數(shù)星表中有一欄同時列出了各恒星觀測的次數(shù),相應(yīng)的精度隨所用的觀測數(shù)目的增加而增加。因此,在編制基本星表時,需根據(jù)它們精度的高低區(qū)別對待。在數(shù)據(jù)處理中,通常用數(shù)值pi表示對某一觀測結(jié)果xi的重視程度,并稱之為權(quán)。觀測值精度的高低是和其誤差大小密切相關(guān)的:誤差越大,觀測值精度就越低,對它的重視程度也應(yīng)相應(yīng)減小。在觀測值只包含隨機誤差的情況下,通常定義權(quán)與標準偏差的平方成反比。25第二十五頁,共六十二頁,編輯于2023年,星期五設(shè)非等精度觀測列的標準偏差分別為1,2…,N

,通常把和最大的標準偏差對應(yīng)的觀測值的權(quán)定為1,設(shè)1=maxi(i=1N),則標準偏差為i的觀測值xi的權(quán)為:不難看出p1=1,故x1被稱為單位權(quán)觀測值。對非等精度觀測序列被測量的最或然值需要加權(quán)平均,即:

標準偏差公式為:

權(quán)只是從相對意義上表示一個量的精確程度:我們同樣可以取和最小的i對應(yīng)的觀測值為單位權(quán)觀測值;這時雖然各個觀測值權(quán)的數(shù)值和原來不同了,但這些觀測值權(quán)的比值并未改變。有時為了使所有觀測值的權(quán)均為整數(shù),可以根據(jù)要求選取單位權(quán)觀測值。26第二十六頁,共六十二頁,編輯于2023年,星期五由于被測量的真值在有限次觀測中是無法得到的,數(shù)據(jù)處理的任務(wù)是通過對被測量的有限次觀測求出被測量的最接近于真值的量,即被測量的最或然值?!?.3直接觀測量的最或然值及其精度5.3.1最小二乘準則

最小二乘法是求解被測量最或然值的基本方法。按照最或然值的定義,它是最接近于真值的值。設(shè)一組觀測值為x1,x2,…,xN

,待求的最或然值為x*,則它們的殘差為νi=xi-x*(i=1N),最小二乘準則就是選擇x*,使得殘差平方和為最小。即x*必須滿足:27第二十七頁,共六十二頁,編輯于2023年,星期五對于一列等精度觀測列,設(shè)由最小二乘準則求出的最或然值為x*,由N個觀測值可得N個殘差方程:

νi=xi-x*(i=1N)

根據(jù)最小二乘準則,最或然值x*應(yīng)滿足:由極值原理,有:于是得:設(shè)觀測值的標準偏差為,則由上式并利用標準偏差的傳遞公式得:5.3.2等精度觀測列的最或然值及精度

多次觀測取平均可以減小觀測結(jié)果的隨機誤差!28第二十八頁,共六十二頁,編輯于2023年,星期五設(shè)x1,x2,…,xN為一非等精度觀測列,x*為被測量的最或然值,由于各個xi的精度不同,不能像處理等精度觀測列那樣直接應(yīng)用來求解x*,而必須先將它轉(zhuǎn)化為等精度觀測列,再利用等精度觀測列的最小二乘準則來求最或然值及其精度。設(shè)觀測值xi的權(quán)為pi,可以證明,只要將每個觀測值乘以相應(yīng)的權(quán)的平方根,就可以把原來的非等精度觀測列轉(zhuǎn)化為一等精度觀測列,與之對應(yīng)的殘差序列為。由最小二乘準則有:5.3.3非等精度觀測列的最或然值及精度

則非等精度觀測列的加權(quán)平均值為29第二十九頁,共六十二頁,編輯于2023年,星期五非等精度觀測列的最或然值的標準偏差為:由于非等精度觀測列中每個觀測值的標準偏差可表示為,則上式又可寫為:

其中為單位權(quán)標準偏差,它可按等精度觀測列的標準偏差公式計算,但它對應(yīng)的殘差是,最后得:

實例30第三十頁,共六十二頁,編輯于2023年,星期五間接觀測中一種較普遍的情況是觀測量為待求量的線性函數(shù)。設(shè)對直接觀測量進行了N次觀測,待求的未知量為xk

(k=1m),則可得N個觀測方程:如果li沒有誤差且各方程是獨立的,則由其中m(m<N)個方程可以解出m個未知量的真值。但實際上觀測值總會有誤差。如果我們用未知量的最或然值代入上式,則觀測量li與待求量的最或然值的關(guān)系可表示成如下的方程組:§5.4間接觀測量的最或然值及其精度5.4.1誤差方程

式中ν1,ν2,…,νN

分別為l1,l2,…,lN

的殘差。31第三十一頁,共六十二頁,編輯于2023年,星期五通常稱以上方程組為誤差方程或條件方程,在這個方程組中有N個方程,m+N個未知量,即使不考慮vi

的影響,也不能找出嚴格滿足所有方程的解,更何況殘差νi必須要考慮,但它又是未知的。因此,要求出未知量必須要有附加條件,而使用最小二乘準則能得到這個方程圓滿的解。根據(jù)最小二乘準則,在等精度觀測列的情況下,未知量的最或然值是使殘差平方和最小的那些值,即由極值原理,xk

(k=1

m)

應(yīng)滿足:5.4.2正態(tài)方程

32第三十二頁,共六十二頁,編輯于2023年,星期五

即:經(jīng)過簡單整理并引用高斯符號,則由此可得到線性方程組常稱以上方程組為正態(tài)方程或法方程。33第三十三頁,共六十二頁,編輯于2023年,星期五

間接觀測另一種常見的情況是觀測值是待求量的非線性函數(shù)。例如,人造衛(wèi)星的軌道改正中,觀測量是某一歷元衛(wèi)星的球面坐標,待求量是相應(yīng)歷元的六個軌道根數(shù),它們之間的關(guān)系是很復雜的非線性關(guān)系;利用甚長基線(VLBI)觀測測定地球自轉(zhuǎn)參數(shù),觀測量是來自射電源同一波前到達VLBI兩個測站的鐘面時之差即幾何延遲,待求量是地球自轉(zhuǎn)參數(shù),它們之間的關(guān)系也是很復雜的非線性關(guān)系;又如,利用食雙星的光變曲線確定其軌道要素是目前測定食雙星軌道要素的惟一方法,而食雙星的光變曲線不僅和軌道根數(shù)有關(guān),還依賴于其它一些因素:包括兩顆子星的大小、光度、形狀等…因此,利用光變曲線得到食雙星的軌道要素(稱為食雙星的測光軌道解)是一個典型的復雜非線性間接觀測問題。34第三十四頁,共六十二頁,編輯于2023年,星期五觀測量yi與待求量xk

(k=1m)之間的非線性關(guān)系可寫為設(shè)x0k為xk的近似值(或初值),并用xk表示xk與其近似值之差。則由上式可以算出已知待求量近似值的函數(shù)y0k,并記yi

=y(tǒng)i

–y0i,對上式在x0k(k=1~m)上進行泰勒展開,并略去xk的二次及二次以上的項,這樣可得:其中(k=1m)當x0k給定時為己知系數(shù),下面我們用bik(k=1m)表示。因為觀測值yi有誤差,因此必須考慮yi中的誤差,故而得到誤差方程:35第三十五頁,共六十二頁,編輯于2023年,星期五利用最小二乘準則,可得到法方程:

解此方程得到xk(k=1m),分別加上近似值x0k(k=1m),就可得待求量的最或然值。當|xk|較大時,可將得到的xk代替原來的近似值x0k重新算出系數(shù)bik

和yi并解法方程得到新的xk。這種過程可以反復迭代,直到最后的|xk|值小于給定的誤差限為止,這時最后得到的xk即為所求。這種算法常被稱為高斯—牛頓法或泰勒展開法,此法在求解過程中需反復迭代和修正,逐次迭代的結(jié)果將使最后的xk更接近真解。當初值選得較好時,隨著迭代次數(shù)的增加,修正值|k|將越來越小,即為迭代“收斂”;否則稱迭代“發(fā)散”:迭代得到的新值可能比原來的值更遠離真解,而這種情況在實際應(yīng)用中時有發(fā)生,所以初值的選取是至關(guān)重要的。36第三十六頁,共六十二頁,編輯于2023年,星期五為了求最或然值的標準偏差,必須要知道它們與觀測值li的標準偏差之間的關(guān)系以及l(fā)i的標準偏差;要求li的標準偏差,首先要求出li的殘差,而這只要將從法方程解得的未知量的最或然值代入誤差方程便可得到。(由殘差求標準偏差的公式推導請詳見書中敘述)觀測值的標準偏差為:其中,N-m稱為自由度,意思是指求解m個未知量只需在m個不同條件下測得m個觀測值;但現(xiàn)有N>m個測得值,故而多測了N-m個值。從上面的推導可知,用最小二乘法求解未知量時,為了得到較小的標準偏差;通常要求N-

m越大越好。5.4.3最或然值的標準偏差

=37第三十七頁,共六十二頁,編輯于2023年,星期五有了觀測值的標準偏差后,就可以求m個最或然值的標準偏差。設(shè)m個最或然值的標準偏差為對應(yīng)的權(quán)分別為,則由非等精度觀測列的標準偏差公式可以得到:式中按觀測值標準偏差公式計算。pxk的計算可借助法方程求得,即只要將法方程右端項[b1l],[b2l],···,[bml]改為1,0,0,···0,解此法方程得到的x1即為;若把法方程右端項分別改為0,1,···,0則由可解得px2。依次類推……

38第三十八頁,共六十二頁,編輯于2023年,星期五§5.5最小二乘曲線擬合

天文工作中常遇到達樣兩個問題,其一是:y和x是可被觀測的天文量,且y是x的函數(shù),它們的函數(shù)關(guān)系由公式(曲線):y=f(x,ck)(k=1~m)給出,但式中含有m個未知參數(shù)ck

(k

=1~m)。我們的任務(wù)是根據(jù)y和x的N組觀測值尋求參數(shù)ck的最佳估計?k,進而得到以上公式(曲線)具體形式的最佳估計;另一問題是:y和x之間的函數(shù)形式未知,而需要利用對y和x的觀測求出y和x之間關(guān)系的一個經(jīng)驗公式(或經(jīng)驗曲線)。39第三十九頁,共六十二頁,編輯于2023年,星期五

由于觀測值總含有誤差,通常只能用曲線擬合的方法由y和x的觀測值(yi,

xi)[i=1N],求得理論曲線或經(jīng)驗曲線中參數(shù)的估計值。曲線擬合的特點在于,被確定的曲線原則上并不特別要求真正通過給定的所有觀測點,而只要盡可能在絕大多數(shù)觀測點附近通過。這對于含有誤差的觀測來說較之過所有點的曲線擬合更合理,并有利于減小對未知數(shù)據(jù)進行預測時的偏差*。確定表達式中的參數(shù)是曲線擬合中的基本問題。另外,經(jīng)驗公式的確定又是參數(shù)估計的基礎(chǔ),但它與客觀實際聯(lián)系緊密,必須結(jié)合專業(yè)知識并依據(jù)經(jīng)驗才能得到較好的解決。40第四十頁,共六十二頁,編輯于2023年,星期五41第四十一頁,共六十二頁,編輯于2023年,星期五最小二乘法(又稱最小平方法)是一種數(shù)學優(yōu)化技術(shù),它通過最小化誤差的平方和找到一組數(shù)據(jù)的最佳函數(shù)匹配;其是用最簡的方法求得一些絕對不可知的真值,而令誤差平方之和為最小;最小二乘法通常用于曲線擬合。很多其他的優(yōu)化問題也可通過最小化能量或最大化熵用最小二乘形式表達。1801意大利天文學家朱賽普·皮亞齊發(fā)現(xiàn)了第一顆小行星谷神星,在40天的跟蹤觀測后,谷神星運行至太陽背后。皮亞齊失去了谷神星的位置。隨后全世界的科學家通過皮亞齊的觀測數(shù)據(jù)開始了尋找谷神星的行動。但是大多數(shù)的計算都沒有結(jié)果,只有當時年僅24歲的高斯成功計算出了谷神星的軌道,奧地利天文學家海因里希·奧爾伯斯在高斯計算出的軌道上重新發(fā)現(xiàn)了谷神星,從此高斯聞名世界。他的這個最小二乘的方法發(fā)表在1809年的著作《天體運動論》中。法國科學家勒讓德也于1806年獨立發(fā)明最小二乘法。1829年,高斯提供了這個方法較其它方法為優(yōu)的證明:最小二乘法在很大方面上優(yōu)化效果強于其它方法,被稱為高斯-莫卡夫定理。42第四十二頁,共六十二頁,編輯于2023年,星期五理論曲線(或經(jīng)驗公式)中參數(shù)的估計問題可用如下的數(shù)學語言描述:若y是關(guān)于自變量x和待定參數(shù)ck(k=1m)的形式已知的函數(shù):y=f(x,c)。今給出(x,y)的N對觀測值(xi,yi)(i=1N),要確定參數(shù)ck(k=1m),使某個目標函數(shù)

取極值(極大值或極小值)。因此曲線擬合就是對目標函數(shù)進行最優(yōu)化計算,尋求使目標函數(shù)d取極值的一組參數(shù)值。目標函數(shù)的具體形式可根據(jù)具體問題的要求來選取,可以在非最小二乘意義下確定c使得:5.5.1目標函數(shù)和最優(yōu)化43第四十三頁,共六十二頁,編輯于2023年,星期五

達到極小。也可以在最小二乘意義下求解c,即使目標函數(shù):達到極小。我們稱這種選取各觀測點的殘差平方和作為目標函數(shù)的擬合為最小二乘曲線擬合最小二乘曲線擬合用擬合的2量:

作為目標函數(shù)。尋求使2最小的參數(shù)c作為參數(shù)的估計值。其中pi為觀測值yi的權(quán)重因子:5.5.2最小二乘曲線擬合44第四十四頁,共六十二頁,編輯于2023年,星期五滿足最小二乘準則的參數(shù)值?可由下列方程組解出,即由:解此參數(shù)的最小二乘估計?k(k=1~m)。—

線性情況:

理論曲線是未知參數(shù)的線性情況時,它的一般形式可表示為對于N組觀測值(xi,yi),把線性函數(shù)代入上述方程組,則可得到未知參數(shù)c的線性方程組:45第四十五頁,共六十二頁,編輯于2023年,星期五例如在m=2且為等精度的情況下(2個未知參數(shù)),方程組化為:

已知:y=y0(x)+c1f1(x)+c2f2(x)c1f1(xi)f1(xi)+c2f2(xi)f1(xi)=[yi-y0(xi)]f1(xi)c1f1(xi)f2(xi)+c2f2(xi)f2(xi)=[yi-y0(xi)]f2(xi)解之便可以得到c1和c2的最佳估計值46第四十六頁,共六十二頁,編輯于2023年,星期五把參數(shù)估計值代入理論關(guān)系式,可以得到對應(yīng)各個自變量xi的y的估計值:線性情況最典型的例子是:這是標準的線性模型,形式簡單。但是有些看來較復雜的模型,常??梢酝ㄟ^變量代換的方法簡化成這樣的形式。下面我們給出幾個例子:例1:是一個多項式模型,盡管觀測值y對自變量而言是非線性的,但它對參數(shù)是線性的,因此仍屬線性問題。只要作變量代換:則多項式即可化為標準的線性形式47第四十七頁,共六十二頁,編輯于2023年,星期五例2:觀測量y對自變量x及參數(shù)均為非線性,但通過變量代換仍可化為線性問題來處理。即對兩邊取導數(shù),得令,得例3:

這是標準的直線模型,解出C0,Cl后,用逆變換求c0,c1:

式中Aj,j

(j=1,2)分別為周期函數(shù)的振幅和初相位,它們都是擬合過程中待估計的參數(shù)pj為已知的周期。48第四十八頁,共六十二頁,編輯于2023年,星期五這個函數(shù)形式是非線性的,但我們亦可以通過變量變換將其轉(zhuǎn)化為線性的:這是以c1,c2,c3,c4參數(shù)的標準化模型。由線性情況的最小二乘擬合的參數(shù)估計公式解得參數(shù)c1,c2,c3,c4

后可得周期函數(shù)的擬合參數(shù)

將它們代入周期函數(shù)公式中即得周期函數(shù)擬合曲線

變量變換的方法可以把看來較復雜的模型化簡,且變換既適用于待定參數(shù)也適用于觀測量和自變量。這種能通過變量代換的方法化為線性模型的理論或經(jīng)驗公式稱為廣義線性模型。49第四十九頁,共六十二頁,編輯于2023年,星期五思考:若把觀測量y和x進行調(diào)換,最終由上式得到的最小二乘擬合結(jié)果是否不變??—

對dy—

對dx—

對(dx2+dy2)1/250第五十頁,共六十二頁,編輯于2023年,星期五實例:測定星系中心大質(zhì)量黑洞的質(zhì)量UsingRBLRthecentralmassis:VistheBLRcloudsvelocity(eitherfromFWHMorsLINE)fisadimensionlessfactorthatdependsonthegeometryandkinematicsoftheBLR.

如何測定

RBLR?Findingthecentral(blackhole)massisoneofthe“holygrails”ofreverberationmappinginthepastdecade….

(butthesamplemightbebiased….)第五十一頁,共六十二頁,編輯于2023年,星期五Continuumluminosityvary.BLRrespondtothevariations(viaphotoionization).測定RBLR:ReverberationMappingTheentireBLRdoesnotrespondatthesametime.AcloudatadistanceRfromthecentralsourceandangleq

tothelineofsightwillappeartorespondafteratime:qLine

ContinuumForathickshellBLRtheresponsetoacontinuumflashwillbe:TimeLineflux52第五十二頁,共六十二頁,編輯于2023年,星期五TimeLightcurvesLineFluxContinuumFluxHbKaspietal.200053第五十三頁,共六十二頁,編輯于2023年,星期五BLRsize(RBLR)vs.Luminosity—Botharefundamentalmeasuredquantities.Petersonetal.(2004)compiledallstudiestodate.35objectswithBalmer(mainlyHb)linestimelag.CharacteristicBLRsize=TimeLag*speedoflight.LuminositiesintheOptical,UV,andX-rays.BLRsizefromaveragingallBalmerlinestimelagsperobject.BLRSize–LuminosityRelation測定

RBLR

進而計算黑洞質(zhì)量的更普適方法54第五十四頁,共六十二頁,編輯于2023年,星期五LinearRegressionUncertaintiesinbothquantitiesandIntrinsicscatterintherelationTworegressionmethods:1.FITEXYfromPressetal.(1992)implementedbyTremaineetal.(2002).2.BCES(BivariateCorrelatedErrorsandintrinsicScatter)byAkritas&Bershady(1996).…andalsooutlierpoints…55第五十五頁,共六十二頁,編輯于2023年,星期五HbRBLR–Opticalluminosity(5100A)RBLR

[lLl(5100?)](0.69±0.05)Kaspietal.200556第五十六頁,共六十

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論