數(shù)學(xué)地質(zhì)第七章有序地質(zhì)量最優(yōu)分割法_第1頁
數(shù)學(xué)地質(zhì)第七章有序地質(zhì)量最優(yōu)分割法_第2頁
數(shù)學(xué)地質(zhì)第七章有序地質(zhì)量最優(yōu)分割法_第3頁
數(shù)學(xué)地質(zhì)第七章有序地質(zhì)量最優(yōu)分割法_第4頁
數(shù)學(xué)地質(zhì)第七章有序地質(zhì)量最優(yōu)分割法_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第七章 有序地質(zhì)量最優(yōu)分割法楊永國中國礦業(yè)大學(xué)資源與地球科學(xué)學(xué)院 內(nèi)容提要:n第一節(jié) 概述n第二節(jié) 單元有序數(shù)據(jù)的最優(yōu)分割n第三節(jié) 多元有序數(shù)據(jù)的最優(yōu)分割n第四節(jié) 最優(yōu)分割法的計算步驟第一節(jié) 概述n 地質(zhì)數(shù)據(jù)中有相當(dāng)多是有序的。這些按一定順序排列的地質(zhì)變量,叫做有序地質(zhì)量。例如,沿地層露頭剖面采集的巖石標(biāo)本;鉆孔取出的巖芯樣品; n 這類數(shù)據(jù)的特點是樣品的前后次序不能變更。所以,一些不考慮樣品排列順序的數(shù)學(xué)處理方法,對此不適用。有序地質(zhì)量最優(yōu)分割法,就是對一批有序數(shù)據(jù)(地質(zhì)體)進(jìn)行分段的統(tǒng)計方法。 第一節(jié) 概述n設(shè)有n個按順序排列的樣品,每個樣品測得p個變量,這批數(shù)據(jù)可用數(shù)據(jù)矩陣的形式表示為p

2、nnpnnppilxxxxxxxxxxX212222111211ilx其中, 表示第 i個樣品第l個變量的取值。第一節(jié) 概述 若對以上n個有序樣品進(jìn)行分割(分段),可能有 種劃分方法,每一種分法稱為一種分割。 對n個樣品分段并使組內(nèi)離差平方和最小的分割方法,稱為最優(yōu)分割法。樣品變量總離差平方和的分解式為: T=W+B (7-1)式中,T為總離差平方和;W為組內(nèi)離差平方和;B為組間離差平方和。121112211nnnnnccc第一節(jié) 概述n由式(7-1)可知,如果n個樣品分為K段,每段的樣品個數(shù)為nk,若每個樣品只取一個變量,則 n KknikikkxxW112)(KkkkKknikxxnxxB

3、k12112)()(7-2)(7-3)第一節(jié) 概述 因此,尋求最優(yōu)分割,就是用計算的方法找出使組內(nèi)離差平方和(W)最小的那些分割點。這與判別分析中費歇準(zhǔn)則相似,所以有序地質(zhì)量最優(yōu)分割法,有人又稱為“F-分割法”或“有序樣品的聚類分析”。 第二節(jié) 單元有序數(shù)據(jù)的最優(yōu)分割n主要內(nèi)容:n一、最優(yōu)二段分割n二、最優(yōu)三段分割n三、最優(yōu)K段分割第二節(jié) 單元有序數(shù)據(jù)的最優(yōu)分割 若有n個有序樣品,每個樣品只取一個變量,則有n個有序數(shù)據(jù)序列,為 現(xiàn)在試圖將這n個樣品按順序分割為K段,使段(組)內(nèi)離差平方和盡可能小,而組間離差平方盡可能大。為此,用 xi,xi+1,xj表示從第i個樣品數(shù)據(jù)開始至第j個樣品數(shù)據(jù)為止

4、的某段樣品,其中 1ijn 該段樣品變量的離差平方和為,21nxxxXjaajixxjid12),(),((7-4)第二節(jié) 單元有序數(shù)據(jù)的最優(yōu)分割n式中n 愈小,表示段內(nèi)各樣品之間差異性愈??;反之, 愈大,表示段內(nèi)各樣品之間的差異愈大。因此,又把 稱為 i,j段的段直徑。 jiaaxijjix11),(),(jid),(jid),(jid第二節(jié) 單元有序數(shù)據(jù)的最優(yōu)分割 在實際應(yīng)用時,往往事先不知道n個有序樣品客觀上究竟能劃分成幾段。因此,必須從最優(yōu)分成二段、三段、K段進(jìn)行分析。第二節(jié) 單元有序數(shù)據(jù)的最優(yōu)分割一、最優(yōu)二段分割 若把n個有序樣品 分為兩段,則有如下n-1種不同的分法,即 nxxx,

5、21,121543214321321nnnnnxxxxxxxxxxxxxxxxxxx第二節(jié) 單元有序數(shù)據(jù)的最優(yōu)分割 在n個有序樣品中,對任意一個j(1jn-1)都可以確定一個二段分割,即1,jj+1,n。若把對n個樣品在第j個樣品處進(jìn)行的二段分割的組內(nèi)離差平方和記為 式中,n表示被分割的樣品數(shù);2表示把n個樣品分為二段;j表示以第j個樣品為分割點。), 1(), 1 (); 2(njdjdjWn第二節(jié) 單元有序數(shù)據(jù)的最優(yōu)分割二、最優(yōu)三段n若把n個有序樣品 分為三段,其中必有兩個分割點。假設(shè)第 和第j個樣品為分割點,則三段分割為n若把三段分割的組內(nèi)離差平方和記為:n其中a1,j為兩個分割點(1

6、a1j-1, 2jn-1),則n顯然,如果有 為最優(yōu)三段分割,則 必為最優(yōu)二段分割 。,21nxxx)(1ja,11axx ,11jaxx1,jnxx); 3(1jaWn), 1(); 2(), 1(), 1(), 1 (); 3(1111njdaWnjdjadadjaWjn); 3(1jaWn); 2(1aWjn因此,如果對n個有序數(shù)據(jù)進(jìn)行最優(yōu)三段分割,必須對任意一個j(2jn-1),即前j個數(shù)據(jù)先求出其最優(yōu)二段分割,為n若n則前j個樣品的最優(yōu)二段分割為), 1()(, 1 )(; 2111jadjadjaWj1)(111)(; 2min); 2(1jjjajjaWaW,11axx ,11j

7、axx第二節(jié) 單元有序數(shù)據(jù)的最優(yōu)分割三、最優(yōu)K段分割 若對n個有序樣品數(shù)據(jù) 進(jìn)行最優(yōu)K段分割,可先找出前j(K-1jn-1)個樣品的最優(yōu)K-1段最優(yōu)分割,即,21nxxx),; 1(221kjaaaKW 應(yīng)當(dāng)指出,分割的段數(shù)K一直可做到所要求的段數(shù)K為止;或者可以預(yù)先給定一個小正數(shù) ,使K段分割的組內(nèi)離差平方和 后為止。這樣得出的K就是最后的分割的段數(shù)。 121( ;,)nkW K a aa第二節(jié) 單元有序數(shù)據(jù)的最優(yōu)分割 n 由圖7-1所示組內(nèi)離差平方和是隨分段段數(shù)K的增加而單調(diào)地減少。所以當(dāng)K=n時,組內(nèi)離差平方和為零。因此,可根據(jù)組內(nèi)離差平方和隨段數(shù)增加而下降到比較穩(wěn)定的時候(即圖中曲線平

8、緩時)再確定分段段數(shù)。 圖圖7-1 組內(nèi)離差平組內(nèi)離差平方和(方和(W)與分)與分段數(shù)(段數(shù)(K)關(guān)系圖)關(guān)系圖第三節(jié) 多元有序數(shù)據(jù)的最優(yōu)分割 為了分層,有時需要匯集樣品更多的信息,采用多個變量指標(biāo)。例如,采集n個有序樣品,每個樣品測得p個變量,原始數(shù)據(jù)可構(gòu)成一個階矩陣,為pnnpnnppxxxxxxxxxX212221111211第三節(jié) 多元有序數(shù)據(jù)的最優(yōu)分割 在多變量情況下,人們自然會聯(lián)想到是否能將單元有序數(shù)據(jù)最優(yōu)分割原理引伸到多元數(shù)據(jù)中來,以此對n個有序樣品進(jìn)行分割,一般最簡單有效的辦法就是把一段樣品多個變量合并為一個變量來處理,統(tǒng)一定義“段直徑”。但是,為了使不同變量具有共同的數(shù)據(jù)基礎(chǔ)

9、,事先要對各個變量進(jìn)行數(shù)據(jù)規(guī)格化處理,如使數(shù)據(jù)作正規(guī)化變換。原始數(shù)據(jù)矩陣中元素記為: ,則正規(guī)化數(shù)據(jù)為 ), 2 , 1;, 2 , 1(plnixil)minmax()min(111ilniilniilniililxxxxx(7-8)第三節(jié) 多元有序數(shù)據(jù)的最優(yōu)分割得正規(guī)化數(shù)據(jù)矩陣pnnpnnppzzzzzzzzzZ212222111211第三節(jié) 多元有序數(shù)據(jù)的最優(yōu)分割n根據(jù)正規(guī)化數(shù)據(jù),將樣品段 i,,j的段直徑定義為n (7-9)n式中n(1 ijn, =1,2,p) (7-10)jiapjizzjid12),(),(jizijjiz11),(第三節(jié) 多元有序數(shù)據(jù)的最優(yōu)分割n若n個有序樣品分

10、為K段,每段內(nèi)有nk個樣品,則多元有序數(shù)據(jù)最優(yōu)分割的原理與單元有序數(shù)據(jù)最優(yōu)分割一樣,使組內(nèi)離差平方和n應(yīng)當(dāng)指出,樣品的段直徑除了用式(7-9)定義外,還可用其它方法定義。),(,),(),(;min),(),(),(),(),;(2211111221121jjajajaKwjizzjidjidjidaaaKWKnnjKKknipkkKKnk第四節(jié) 最優(yōu)分割法的計算步驟1、數(shù)據(jù)正規(guī)化設(shè)原始數(shù)據(jù)矩陣為pnnpnnppxxxxxxxxxX212221111211第四節(jié) 最優(yōu)分割法的計算步驟n將X中的元素xil變換為n(i=1,2,,n;l=1,2,p)n得正規(guī)化數(shù)據(jù)矩陣)minmax()min(11

11、1ilniilniilniililxxxxzpnnpnnppzzzzzzzzzZ212222111211第四節(jié) 最優(yōu)分割法的計算步驟n2、計算段直徑矩陣Dn其中n因為jiapnjijizzjid121 ),(),(jizijjiz11),()(),()(0),(jiijdjijid第四節(jié) 最優(yōu)分割法的計算步驟n故只須計算 個 ,得2) 1( nn),(jidnnnndnddndddD),(), 2()2 , 2(), 1 ()2 , 1 () 1 , 1 (第四節(jié) 最優(yōu)分割法的計算步驟3、計算全部分割的組內(nèi)離差平方和(或段直徑和)及各種分段的最優(yōu)分割1)最優(yōu)二段分割 由D矩陣對每一個m=n,n

12、-1,2計算相應(yīng)的組內(nèi)離差平方和,為找出最小值,確定響應(yīng)的最優(yōu)二段分割點,即) 1, 2 , 1(), 1(), 1 (); 2(mjmjdjdjWm); 2(min)(; 2111jWmaWmmjm第四節(jié) 最優(yōu)分割法的計算步驟 2)最優(yōu)三段分割 根據(jù)D矩陣及最優(yōu)二段分割結(jié)果,對每一個m=n,n-1,3計算相應(yīng)的三段分割的組內(nèi)離差平方和,為然后求出最小值,并確定相應(yīng)的最優(yōu)三段分割點,為3 , 1,1, 3 , 2), 1()(; 2),(; 311nnmmjmjdjaWjjaWjm),(; 3min)(),(; 311221jjaWmamaWmmjm第四節(jié) 最優(yōu)分割法的計算步驟3)最優(yōu)K段分割

13、 根據(jù)矩陣D及最優(yōu)K-1段分割計算結(jié)果,對于每一個m=n,n-1,K分別計算相應(yīng)的K段分割的組內(nèi)離差平方和,為找出最小值,并確定相應(yīng)的最優(yōu)K段分割點,即KnnmmKKjnjdjajajaKWjajajaKWKjKm, 1,1, 1), 1()(,),(),(; 1,),(),(;221221),(,),(),(;min)(,),(),(;22111121jjajajaKWmamamaKWKmmjKKm第四節(jié) 最優(yōu)分割法的計算步驟4 繪制W-K曲線 在W-K曲線上,選擇曲線拐點對應(yīng)的K值(取整)作為最終分段數(shù)。第四節(jié) 最優(yōu)分割法的計算步驟 例7-1 某煤礦所采煤層的煤質(zhì)牌號為主焦煤。在煤巷中見一

14、火成巖墻侵入煤層,致使煤質(zhì)發(fā)生變化,為弄清楚煤質(zhì)變化情況,從火成巖附近每隔0.5m依次取一煤樣,獲得6個有序煤樣的鏡煤最大反射率數(shù)據(jù)為 試進(jìn)行最優(yōu)分割。45. 1 ,50. 1 ,80. 1 ,35. 2 ,95. 2 ,20. 3,(%)6543210 xxxxxxR第四節(jié) 最優(yōu)分割法的計算步驟 此樣本的可能分割法共有25-1=31種,今要在這31種分割中找出一種最優(yōu)的分割(類內(nèi)差別小,類間差別大)。其作法如下:(1)對原始數(shù)據(jù)進(jìn)行正規(guī)化變換后得正規(guī)化數(shù)據(jù),為(2)計算直徑矩陣D,即0 ,0286. 0 ,2000. 0 ,5143. 0 ,8571. 0 ,0000. 1Z第四節(jié) 最優(yōu)分割

15、法的計算步驟00004. 000234. 00147. 001673. 01214. 00494. 005280. 04000. 02161. 00588. 00091336880. 03861. 01246. 00102. 00)6 , 6()6 , 5()5 , 5()6 , 4()5 , 4()4 , 4()6 , 3()5 , 3()4 , 3()3 , 3()6 , 2(5 , 2()4 , 2()3 , 2()2 , 2()6 , 1 ()5 , 1 ()4 , 1 ()3 , 1 ()2 , 1 () 1 , 1 (dddddddddddddddddddddD第四節(jié) 最優(yōu)分割法的

16、計算步驟(3)最優(yōu)二段分割。由D對于m=6,5,4,3,2時,計算) 1, 2 , 1(), 1(), 1 (); 2(mjnjdjdjWm第四節(jié) 最優(yōu)分割法的計算步驟第四節(jié) 最優(yōu)分割法的計算步驟第四節(jié) 最優(yōu)分割法的計算步驟第四節(jié) 最優(yōu)分割法的計算步驟 從而得到6個樣品的最優(yōu)二段分割為: 其中, 為分割點。(4)最優(yōu)三段分割。即對于m=6,5,4,3時,計算當(dāng)m=6時,則分割點為: ,654321xxxxxx3x1, 2 , 1), 1()(; 2),(; 311mjmjdjaWjjaWjm1316. 0)6 , 6()5(; 25),5(; 31516daWaW0600. 0)6 , 5()

17、4(; 24),4(; 31416daWaW0336. 0)6 , 4()3(; 23),3(; 31316daWaW1673. 0)6 , 3()2(; 22),2(; 31216daWaW0336. 0 3),3(; 3),(; 3min)6(),6(; 3161652216aWjjaWaaWj; 2) 3()6(11 aa3)6(2a第四節(jié) 最優(yōu)分割法的計算步驟第四節(jié) 最優(yōu)分割法的計算步驟第四節(jié) 最優(yōu)分割法的計算步驟第四節(jié) 最優(yōu)分割法的計算步驟(5)最優(yōu)四段分割。即對于m=6,5,4時,計算當(dāng)m=6時,則1, 4 , 3), 1()(),(; 3),(),(; 42121mjmjdjajaWjjajaWjm第四節(jié) 最優(yōu)分割法的計算步驟第四節(jié) 最優(yōu)分割法的計算步驟第四節(jié) 最優(yōu)分割法的計算步驟(6)最優(yōu)五段分割。即對于m=6,5時,計算5 , 4), 1()(),(),(; 4),(),(),(; 5321321jmjdjajajaWjjajajaWjm第四節(jié) 最優(yōu)分割法的計算步驟當(dāng)m=5時,則其中則其分割點為: 0)5 , 5()4(),4(),4(; 44),4(),4(),4(; 532143215daaaWaaaW04),4(),4(),4(; 5)5(),5(),5(),5(; 5321543215aaaWaaaaW; 1)4(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論