地球化學數(shù)據(jù)處理培訓_第1頁
地球化學數(shù)據(jù)處理培訓_第2頁
地球化學數(shù)據(jù)處理培訓_第3頁
地球化學數(shù)據(jù)處理培訓_第4頁
地球化學數(shù)據(jù)處理培訓_第5頁
已閱讀5頁,還剩141頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 地球化學數(shù)據(jù)處理地球化學數(shù)據(jù)處理提 綱n地球化學信息的采集與資料收集n地球化學數(shù)據(jù)處理基本概念n地球化學數(shù)據(jù)初步處理n背景值和異常值的確定n常用的統(tǒng)計分析方法n圖件數(shù)據(jù)處理n地球化學推斷解譯一、地球化學信息的采集一、地球化學信息的采集與資料收集與資料收集 地球化學數(shù)據(jù)的誤差分析地球化學數(shù)據(jù)的誤差分析1 1取樣產生誤差取樣產生誤差 取樣產生的誤差是影響地球化學數(shù)據(jù)質量的最重要的也是最不易被發(fā)現(xiàn)的誤差。產生這種誤差的途徑可能有:1)錯誤地將同一空間產出的不同單元作為同一單元。2)不能準確區(qū)分蝕變與原巖的界線。3)判別風化巖石和新鮮巖石的界線不準確。4)沒有查明污染層的廣度與深度。5)土壤剖面分層

2、不準確。6)采集水樣的時間或季節(jié)不當。7)對礦化與非礦石巖石的區(qū)分不當。8)未能消除因斷層等構造對原巖中元素活化遷移的影響。9)取樣工具、器具及取樣方法不當。n2制備樣品產生誤差制備樣品產生誤差 1)沒有將整個樣品全部粉碎過篩,而僅粉碎了其易碎部分,難碎部分棄掉而造成粉碎的樣品不代表整個樣品。 2)樣品分選不徹底。 3)篩網的原料不當,如不少樣品不能用銅網或鐵網篩。 4)碎樣工具和篩具清理不凈,造成樣品污染。 5)樣品縮分方法不當,未按縮分樣品程序進行縮分而隨意分取一部分樣品。n3分析測試產生誤差分析測試產生誤差 1)分析方法本身的原因,即分析的精度和靈敏度; 2)分析測試人員因操作的原因而產

3、生誤差; 3)所用器具清洗不凈產生誤差; 4)儀器設備的精密度和分析結果的再現(xiàn)性達不到有關要求而產生誤差; 5)化學試劑達不到分析要求或試劑選取不當產生誤差; 6)標準達不到要求產生誤差; 7)分析測試環(huán)境產生誤差。地球化學數(shù)據(jù)質量的控制地球化學數(shù)據(jù)質量的控制 1 1、內、內 檢檢 2 2、外、外 檢檢 3 3、雙樣品分析、雙樣品分析二、地球化學數(shù)據(jù)處理二、地球化學數(shù)據(jù)處理基本概念基本概念1 1、基本概念、基本概念 總體、個體、樣本總體、個體、樣本 總體總體是指我們要研究的對象的全體; 個體個體(或叫樣品)是指總體中的一個單位; 樣本樣本(或叫子樣)是指總體中取出的一部分個體。 樣本所包含的個

4、體數(shù)目。叫做樣本的大小(或 叫樣本容量樣本容量)。1、基本概念、基本概念均均 值值 (1)算術平均值 (2)加權平均值 (3)幾何平均值 x n1( x1 + x2 + + xn) = niixn11 x n1(1y1 + 2y2 + + kyk) kiiiyn11 kiiiy1n kiiiy1f xGnnxxx21(niix1) (xi0) 1、基本概念、基本概念極值與方差極值與方差 (1)數(shù)據(jù)的極小值與極大值 極小值 A min x1,x2,xn 極大值 B maxx1,x2,xn (2)方差、標準差n4變異系數(shù)s2 11n( x1-x)2 + ( x2-x)2 + + ( xn-x)2

5、= 11n21)(niixx s )(211xxin Cv xs 100 Cv100%很大起伏。一、基本概念一、基本概念真值、中位數(shù)真值、中位數(shù)準確度和精密度準確度和精密度 準確度:表示分析結果與真實值接近的程度。 精密度:表示各次分析結果相互接近的程度。 常用重復性和再現(xiàn)性表示不同情況下 的精密度。誤差和偏差誤差和偏差 誤差:測定結果與真實值之間的差值。 偏差:測定結果與平均結果之間的差值。檢出限檢出限 某一分析方法或分析儀器能可靠測試出樣品中某一元素的最小質量。靈敏度(檢出下限)靈敏度(檢出下限) 一定條件下,某一分析方法能可靠測出的相對最低含量。 地球化學標樣地球化學標樣一、基本概念一、

6、基本概念2 2、元素異常濃度特征、元素異常濃度特征 異常濃度特征是指形成異常的指標在異常區(qū)域范圍內的數(shù)值特征,主要包括異常下限、異常特征值、異常強度、異常襯度、富集系數(shù)、異常濃度分帶等特征參數(shù)。 異常下限異常下限 區(qū)域地球化學異常是相對于區(qū)域地球化學背景而言的。區(qū)域地球化學背景不是一個確定的含量值,而是一個含量范圍,將背景含量范圍的最大值稱為背景上限,當元素含量(或其他指標數(shù)據(jù))超過區(qū)域背景上限時稱其為異常,因此異常下限就等于背景上限。 異常特征值異常特征值 異常特征值是異常區(qū)域內數(shù)據(jù)的描繪統(tǒng)計參數(shù)量,主要包括中位數(shù)、算術平均值與標準離差或幾何均值與幾何標準離差。 2 2、元素異常濃度特征、元

7、素異常濃度特征 變異系數(shù)變異系數(shù) 反映區(qū)域內數(shù)據(jù)的變化程度,區(qū)域內標準差/平均值。 異常強度異常強度 異常含量的高低或異常含量超過背景值的程度??梢杂卯惓5姆逯?、平均值、襯度等表示。 異常元素分帶特征異常元素分帶特征 異常分帶指地球化學異常在空間上存在的指標之間或同一指標在量值上有規(guī)律的演變的現(xiàn)象。 2 2、元素異常濃度特征、元素異常濃度特征 濃度梯度濃度梯度 在地球化學分散暈中,元素含量(由高到低)對距離的變化率。在地球化學分散暈中,元素含量(由高到低)對距離的變化率。 異常襯度異常襯度 異常內元素平均含量與背景值之比異常內元素平均含量與背景值之比 。 富集系數(shù)富集系數(shù) 各種風化產物中元素含

8、量與其在母巖中含量的比值。各種風化產物中元素含量與其在母巖中含量的比值。 異常濃度分帶異常濃度分帶 根據(jù)異常元素含量變化,在空間上劃分的若干連續(xù)的濃度區(qū)間。根據(jù)異常元素含量變化,在空間上劃分的若干連續(xù)的濃度區(qū)間。 3、箱圖、箱圖上中下三條線分別表示變量值的第上中下三條線分別表示變量值的第7575、5050、2525百分位數(shù);百分位數(shù);異常值所用的標記為異常值所用的標記為“0 0”。箱體上方。箱體上方的標記,其變量超過了第的標記,其變量超過了第7575百位數(shù)加百位數(shù)加第第7575百位分數(shù)減第百位分數(shù)減第2525百位分數(shù)差值的百位分數(shù)差值的1.51.5倍。下方標記,其值小于第倍。下方標記,其值小于

9、第2525百百分位數(shù)減第分位數(shù)減第7575百位分數(shù)與第百位分數(shù)與第2525百位分百位分數(shù)差值的數(shù)差值的1.51.5倍;倍;標記為標記為“* *”。上極值點的變量值超。上極值點的變量值超過了第過了第7575百分位數(shù)加第百分位數(shù)加第7575百位數(shù)與第百位數(shù)與第2525百分位數(shù)差值的百分位數(shù)差值的3 3倍,下極值點的倍,下極值點的變量值小于第變量值小于第2525百分位數(shù)減第百分位數(shù)減第7575百分百分位數(shù)差值的位數(shù)差值的3 3倍。倍。三、地球化學數(shù)據(jù)初步分析三、地球化學數(shù)據(jù)初步分析l數(shù)據(jù)處理的目的數(shù)據(jù)處理的目的 使數(shù)據(jù)集盡可能地滿足某種分布(如正態(tài)分布),便使數(shù)據(jù)集盡可能地滿足某種分布(如正態(tài)分布)

10、,便于解釋其分布規(guī)律;于解釋其分布規(guī)律; 統(tǒng)一不同元素量綱和數(shù)據(jù)水平,便于疊加分析或累加統(tǒng)一不同元素量綱和數(shù)據(jù)水平,便于疊加分析或累加等運算;等運算; 元素間的非線性關系變?yōu)榫€性關系;元素間的非線性關系變?yōu)榫€性關系; 突出綜合變量,化減變量數(shù);突出綜合變量,化減變量數(shù); 突出地質、礦產特征信息;突出地質、礦產特征信息; 1、數(shù)據(jù)的統(tǒng)計分組、列表與作圖、數(shù)據(jù)的統(tǒng)計分組、列表與作圖n 對觀察數(shù)據(jù)分組、列表與作圖使我們對數(shù)值和頻率分布、數(shù)值集中位置和離散程度等性質有了一個直觀了解。 CD.69.63.56.50.44.38.31.25.19.13CDFrequency100806040200Std.

11、 Dev = .10 Mean = .21N = 168.00CR140.0130.0120.0110.0100.090.080.070.060.050.040.030.020.0CRFrequency50403020100Std. Dev = 13.37 Mean = 79.5N = 168.00土壤中元素分布頻率圖AS26.024.022.020.018.016.014.012.010.08.06.0ASFrequency3020100Std. Dev = 5.08 Mean = 13.2N = 168.00PB320.0300.0280.0260.0240.0220.0200.0180.

12、0160.0140.0120.0100.080.060.040.020.0PBFrequency140120100806040200Std. Dev = 33.28 Mean = 50.8N = 168.00土壤中元素分布頻率圖2、頻數(shù)分布、頻數(shù)分布Analyze Descriptive Statistics Frequencies選擇輸出統(tǒng)計量對話框選擇輸出統(tǒng)計量對話框Quartiles:輸出四位數(shù),顯示第25、50、75百位數(shù)值;Cut points for equal groups:輸出等份點的百位數(shù);Percentile(s):自定義百分位數(shù)圖形參數(shù)選擇對話框圖形參數(shù)選擇對話框選擇圖形

13、類型None:不輸出圖形; Bar charts:條形圖;Pie charts:輸出餅圖;Histogram:直方圖Statistics1514151037.524-.168.063.063-.786.710.126.12632.0012.0041.0012.0060.0015.00(4) Valid(5) Missing(3) N(6) Skewness(7) Std. Error of Skewness(8) Kurtosis(9) Std. Error of Kurtosis255075(10) Percentiles(1) Age ofRespondent(2) Highest Yea

14、rof SchoolCompleted(6)Age的偏度統(tǒng)計量為0.524,說明age左偏,有一個較長的右尾,變量educ偏度值為0.168,右偏;(8)峰度值,變量age的峰低值為負,低于標準正態(tài)分布的峰,變量educ有一個高于標準正態(tài)的峰。在正態(tài)分布數(shù)據(jù)中,68的觀測數(shù)據(jù)量落在均數(shù)周圍1個標準差的范圍內,95的觀測量落在均數(shù)周圍2個標準差范圍內。age變量的直方圖變量的直方圖educ變量直方圖變量直方圖Descriptive Statistics5014.80.5015.30342.906.85803.84805032.403.6036.00780.8015.61607.348250436

15、.806.50443.305075.50101.510091.193450272.0021.00293.006771.00135.420068.1697501467.00286.001753.0046540.00930.8000361.0498502856.00694.003550.0097182.001943.6400709.829350800.0078.00878.0018393.00367.8600199.609550MURDERRAPEROBBERYASSAULTBURGLARYLARCENYAUTOTHEFTValid N (listwise)NRangeMinimumMaximum

16、SumMeanStd.Deviation數(shù)據(jù)描述統(tǒng)計數(shù)據(jù)描述統(tǒng)計Descriptive Statistics305103.94104.20104.0650.0592130530.5630.7530.6604.04598305.153.59.5380.36364305.1720.804.33101.8705430515.30178.8041.888521.5286630519.00647.10111.981664001327.00372.1115158.9801030595.001020.00240.0066111.10308305258.0013700.001077.

17、6721030.9182730530.701830.0081.7111127.028983053.8412.449.41951.086983055.4616.058.95301.561883051.00105.005.23539.276883055.0016.727.40921.29261305.942.811.4678.266113051.213.281.7497.31190305110.006289.00741.9377369.17525305.054.211.3486.335973051067.0010301.002159.498769.459913056906.00106045.059

18、521.1916421.8106830525.9450.8134.93563.737303052737.009160.004145.413567.58006305-9.30237.2051.332531.14579305.9712.404.50031.62583305XYHGCDASCRPBCUZNNIAL2O3CAOCOTFE2O3K2OMGOMNNA2OPSSIO2TIVSEValid N (listwise)NMinimumMaximumMeanStd. DeviationS St ta at ti is st ti ic cs s3092973042942972863102638314

19、138492528.611.63232.9427280. 98110. 3831.83535. 3640.7001.12405.1850455. 50177. 2042.72966. 0042.9501.31205.7375511. 75200. 0046.001103. 90V al i dM i ssi ngNM ean9095Percent i l esA sHgCdPbCrNiZn: :指實際上能測量到的數(shù)字指實際上能測量到的數(shù)字。(1 1)表示數(shù)目表示數(shù)目( (非測量值非測量值):):如測定次數(shù)如測定次數(shù);倍數(shù)倍數(shù);系數(shù)系數(shù);分分數(shù)數(shù)(2 2)測量值或計算值測量值或計算值。數(shù)據(jù)的位數(shù)

20、與測定的準確度有關數(shù)據(jù)的位數(shù)與測定的準確度有關。 記錄的數(shù)字不僅表示數(shù)量的大小記錄的數(shù)字不僅表示數(shù)量的大小,還要正確地反映還要正確地反映測量的精確程度測量的精確程度。 結果 絕對誤差 相對誤差 有效數(shù)字位數(shù) 0.32400 0.00001 0.002% 5 0.3240 0.0001 0.002% 4 0.324 0.001 0.2% 32 2數(shù)字零在數(shù)據(jù)中具有雙重作用:數(shù)字零在數(shù)據(jù)中具有雙重作用:(1 1)若作為普通數(shù)定使用,是有效數(shù)字)若作為普通數(shù)定使用,是有效數(shù)字 如如 0.3180 4 0.3180 4位有效數(shù)字位有效數(shù)字 3.180 3.180 10 10 -1-1 (2 2)若只起

21、定位作用,不是有效數(shù)字。)若只起定位作用,不是有效數(shù)字。 如如 0.0318 3 0.0318 3位有效數(shù)字位有效數(shù)字 3.18 3.18 10 10 -2-2 3 3改變單位不改變有效數(shù)字的位數(shù):改變單位不改變有效數(shù)字的位數(shù): 如如 19.02mL 19.02mL為為19.0219.02 10 10 -3-3 L L 幾個數(shù)據(jù)相加或相減時,它們的和或差的有效數(shù)字的保留,應依小數(shù)點后位數(shù)最少的數(shù)據(jù)為根據(jù),即取決于絕對誤差最大的那個數(shù)據(jù)。 0.0122 0.0001 25.64 0.01 1.051 0.001 25.7032 0.0121+25.64+1.057 = 25.70 幾個數(shù)據(jù)的乘除

22、運算中,所得結果的有效數(shù)字的位數(shù)取決于有效數(shù)字位數(shù)最少的那個數(shù),即相對誤差最大的那個數(shù)。:(:( 0.0325 0.0325 5.103 5.103 )/ 139.8 = 0.00119/ 139.8 = 0.00119 :0.0325 0.0325 0.0001/0.0325 0.0001/0.0325 100% = 100% =0.3% 0.3% 5.103 5.103 0.001 /5.103 0.001 /5.103 100% = 100% =0.02% 0.02% 9.8 9.8 0.1 /139.8 0.1 /139.8 100% = 100% =0.07%0.07%3、異常值的檢

23、驗、異常值的檢驗n異常值是指分析數(shù)據(jù)中特別高或特別低的含量值。n特異值產生的原因:n(1)異常值:與特殊地質背景、土壤類型或用地類型相關,往往有一定的分布規(guī)律;n(2)分析數(shù)據(jù)錯誤:常呈單點出現(xiàn),特高或特低。3、異常值的檢驗、異常值的檢驗n可以使用Excel的數(shù)據(jù)分析功能繪制直方圖、累計頻率圖等圖件,由直方圖可以較清晰的分辨出母體的多重性,以及離群值的分布狀況。直方圖的繪制與簡要讀圖直方圖的繪制與簡要讀圖4、 質量分析質量分析n項目收到成果資料后,應將重復樣品的分析成果篩選出來,并按樣品類型進行排列,即第一次采樣第一次分析、第一次采樣第二次分析,第二次采樣第一次分析、第二次采樣第二次分析,分別

24、計算分析的偏差。計算公式為:%100)(21)(%BABARE1)重復樣品分析成果處理)重復樣品分析成果處理4、 質量分析質量分析n設因素A具有n個不同的水平,如有n個不同的采樣點A1,A2An。因素B具有m個不同的水平,如每個采樣點重復采樣m次或每個樣重復分析m次,或有m個單位各分析一次等,即B1,B2Bm。n兩因素方差分析的數(shù)學模型為:nXij=+i+j+ij (i=1,2,n),(j=1,2,m)n式中Xij第i個采樣點第j次分析結果(或第j次采樣);某元素含量的總平均值(即數(shù)學期望值);i第i個采樣點的真值與實測平均值之差; j第j次分析(或第j次采樣)間的系統(tǒng)誤差;ij第i個采樣點第

25、j次分析(或第j次重復采樣)的偶然誤差。2 2)兩因素方差分析)兩因素方差分析(1)首先計算各離差平方和)首先計算各離差平方和nSS總 稱為總離差平方和,其自由度f總 = nm1nSSA稱為A因素離差平方和(如采樣點間的離差平方和,它反映的是元素的自然變化,即與重復采樣和樣品多次分析無關,其自由度fA = n1nSSB稱為B因素離差平方和(如多次重復采樣的離差平方和或多次重復分析的離差平方和或多個分析單位間離差平方和等,它與采樣的具體地點無關)。其自由度 fB=m1nSSE稱為剩余離差平方和(常常反映偶然誤差平方和或分析及偶然誤差離差平方和,即除A和B兩個因素之外的因素)。其自由度 fE =

26、f總fAfB =(n1)(m1) SS總 mjijnixx121)(mjmjijniijnixnmx1211211 SSA nimjijnimjijniixnmxmxxm11211212.)(1)(1)( SSB nimjijmjniijmjjxnmxnxxn11211212.)(1)(1)( SSEBA總12.1SSSSSS)(nijiijmjxxxx 計算步驟計算步驟(2)計算樣本方差)計算樣本方差 1nSSfSSSMSAAA2AA1mSSfSSSMSBBB2BB1)1)(m(nSSfSSSMSEEE2EE (3)作)作F檢驗檢驗)f ,(fFSSMSMSF)f ,(fFSSMSMSFEB

27、2E2BEB2EA2E2AEA1(1)作統(tǒng)計量F1,F(xiàn)2對于給定信度,設 1)1)(m(n1,nFF01, 1)1)(m(n1,mFF02 4、 質量分析質量分析3 3)三因素方差分析)三因素方差分析計計算算步步驟驟l常規(guī)地球化學數(shù)據(jù)處理常規(guī)地球化學數(shù)據(jù)處理 數(shù)據(jù)變換數(shù)據(jù)變換 在地球化學綜合解釋中,由于數(shù)據(jù)的分布與量綱的不一致,對數(shù)據(jù)的處理、分析、綜合將會有很大的影響。因此往往需要首先對數(shù)據(jù)進行變換處理,通常采用對原始數(shù)據(jù)進行標準化、極差化、或均勻化的變換。對于偏態(tài)分布的原始數(shù)據(jù)通過對數(shù)變換、平方根變換、反余弦變換、或反正弦變換可使其近于正態(tài)分布。對非線性相關數(shù)據(jù),可通過作散點圖、分布趨勢圖、

28、擬合趨勢曲線,然后采用相關的擬合方程作適當變換,使變換后的數(shù)據(jù)集大致成線性關系。 l常規(guī)地球化學數(shù)據(jù)處理常規(guī)地球化學數(shù)據(jù)處理 數(shù)據(jù)變換數(shù)據(jù)變換 1.1.標準化變換標準化變換 式中Xij為原始觀察值。為第j變量的算術平均值,Sj為第j變量的標準差。i=1,2,n為標本數(shù),j=1,2p為變量數(shù)。 變換后的變量其平均數(shù)為0,方差為1。各變量處于同一量綱,兩個變量在變換前后的相關程度不變。從幾何意義上,標準化變換相當于將坐標原點移至重心(平均數(shù))位置。這種變換適合于量綱和數(shù)量大小不一的連續(xù)型原始數(shù)據(jù),如品位數(shù)據(jù),巖石化學分析數(shù)據(jù)等。 l常規(guī)地球化學數(shù)據(jù)處理常規(guī)地球化學數(shù)據(jù)處理 數(shù)據(jù)變換數(shù)據(jù)變換 2.2

29、.極差化極差化 (正規(guī)化變換(正規(guī)化變換 ) 式中Xij為原始數(shù)據(jù);Xjmin為第j變量的最小值;X-jmax為第j變量的最大值。i=1,2n為標本數(shù);j=1,2, p為變量數(shù)。 變換后數(shù)據(jù)處于統(tǒng)一量綱,其最大值為1,最小值為0,所有數(shù)據(jù)變化在01之間。變換前后變量間相關程度不變,其幾何意義相當于把坐標軸原點移至變量最小值的位置。適合于量綱和數(shù)量大小不一的連續(xù)型原始數(shù)據(jù)的變換。 l常規(guī)地球化學數(shù)據(jù)處理常規(guī)地球化學數(shù)據(jù)處理 數(shù)據(jù)變換數(shù)據(jù)變換 3.3.均勻化均勻化 式中Xij為原始數(shù)據(jù),為第j變量的平均數(shù)。所以,均勻化變換亦是為了統(tǒng)一量綱,將原始數(shù)據(jù)變換為都在1附近的相對數(shù)值。變換后的某一變量的數(shù)

30、學期望為1,而變量與平均數(shù)之差的期望為0。此變換適合于比例變量,如長度 、體積、質量等數(shù)據(jù)。 l常規(guī)地球化學數(shù)據(jù)處理常規(guī)地球化學數(shù)據(jù)處理 數(shù)據(jù)變換數(shù)據(jù)變換 4.4.對數(shù)變換對數(shù)變換 其中c為常數(shù)。 變換適用于服從對數(shù)正態(tài)分布的數(shù)據(jù),由于這類數(shù)據(jù)分布是最偏斜的,很肯能出現(xiàn)近零的值,當取對數(shù)時,這些值可能呈大的負值,為了避免這個缺點,故在取對數(shù)前首先對所有數(shù)據(jù)加上一個常數(shù)c。 l常規(guī)地球化學數(shù)據(jù)處理常規(guī)地球化學數(shù)據(jù)處理 數(shù)據(jù)變換數(shù)據(jù)變換 5.5.閾值化閾值化 其中:i=0,1,2,n 劃分的級次數(shù),ki為閾值。 將原始的觀測數(shù)據(jù)xi按照給定的閾值ki轉化為0至n的多元狀態(tài);轉化后的f(xi)為0,

31、1,2,n的分級,并且無量綱表示,常用于變化范圍較大的數(shù)據(jù)和圖形化。l常規(guī)地球化學數(shù)據(jù)處理常規(guī)地球化學數(shù)據(jù)處理 數(shù)據(jù)變換數(shù)據(jù)變換 6.6.其他變換其他變換 反正弦和反余弦變換;平方根變換; 雙曲變換;冪函數(shù)變換;指數(shù)函數(shù)變換;四、背景值和異常下限值的確定四、背景值和異常下限值的確定背景值和異常下限值的確定背景值和異常下限值的確定n一、圖解法一、圖解法1剖面圖解法背景值和異常下限值的確定背景值和異常下限值的確定一一 圖解法圖解法 2 直方圖法Mo的橫坐標值,即為所求的背景值c。(或背景值的對數(shù)值)。由頻率(或頻數(shù))的極大值的0.6倍處,作一平行橫坐標的直線,與曲線一側相交,其橫坐標長度即為均方差

32、Sx。 由Mo向右量取23倍的Sx,該處所指示的含量(或其對數(shù)值)即為異常下限值(或其對數(shù)值)。背景值和異常下限值的確定背景值和異常下限值的確定一一 圖解法圖解法3概率格紙圖解法概率格紙圖解法也是建立在元素在地質體中呈正態(tài)分布(或對數(shù)正態(tài)分布)的基礎上的。 直線的斜率即為均方差 累計頻率50處與頻率曲線交點的橫坐標(中位數(shù)Me)即為背景值C0(或背景值的對數(shù)值lgC0)。累計頻率84.1或15.9與頻率曲線的交點的橫坐標與中位數(shù)的差值即為Sx(或其對數(shù)值),以累計頻率97.7處在橫坐標上的對應值為異常下限(或異常下限的對數(shù)值)。 異常下限的確定異常下限的確定 (1)累頻方式 將數(shù)據(jù)從小到大排序

33、,取85%頻數(shù)的值作為異常下限值。采用90%、95%頻數(shù)值將異常劃分為弱、中、強3級濃度分帶。 (2)均值標準差方式 對于近似正態(tài)分布的數(shù)據(jù),采用平均值3倍標準差的界限循環(huán)剔除離異數(shù)據(jù)點后,采用平均值+2倍標準差來確定異常下限值。采用平均值+2-3倍標準差和平均值+2.7倍標準差值將異常劃分為弱、中、強3級濃度分帶。 在省域范圍內依據(jù)局部區(qū)域內定值異常下限值以及異常濃度分帶值分別建立異常下限趨勢面、中異常值趨勢面和強異常值趨勢面。 l 地球化學異常分析地球化學異常分析 分形法分形法確定異常下限確定異常下限 地球化學數(shù)據(jù)應用分形的方法 適用于以下模型:含量-個數(shù)、含量-頻數(shù)含量-面積、含量-周長

34、 等模型 作用:1、檢驗地球化學場元素的分布類型正態(tài)與對數(shù)正態(tài);分形與多重分形2、確定元素的異常下限 分形法分形法確定異常下限確定異常下限 1101001000C (mg/kg)110100100010000100000Nsc126W110100100010000C (mg/kg)110100100010000100000621Sn10100100010000C (mg/kg)110100100010000100000Nsc916Pb10100100010000100000C (ng/kg)1101001000100001000003366Ag1101001000C (mg/kg)110100

35、100010000Nsc26Ni1001000C (mg/kg)110100100010000287Ba異常下限異常下限分界點明顯前端呈直線1.01.21.41.61.82.0Theoretical Quantiles1.01.21.41.61.82.0log A sNorm al Q-Q Plot of AsThreshold-1.0-0.50.00.5log Hg-1.0-0.50.00.5Theoretical QuantilesNorm al Q-Q Plot of HgThreshold-0.250.000.250.500.751.001.25Log Cd-0.20.00.20.40

36、.60.81.01.2Theoretical QuantilesNorm al Q-Q Plot of CdThreshold1.41.61.82.02.22.42.62.8log Cr1.41.61.82.02.22.42.62.8Theoretical QuantilesNorm al Q-Q Plot of CrThreshold2.02.53.0log Pb2.02.53.0Theoretical QuantilesNorm al Q-Q Plot of PbThreshold1.01.21.41.61.82.0log Ni1.21.41.61.8Theoretical Quantil

37、esNorm al Q-Q Plot of NiThreshold五、常用的統(tǒng)計分析方法五、常用的統(tǒng)計分析方法1、 回歸分析研究變量(指標)之間關系的一種統(tǒng)計方法,也就是要建立一個變量和另一個變量(或幾個變量)之間的數(shù)學表達式。一元線性回歸一元線性回歸bSEbt aSEat 對斜率檢驗的假設是,總體回歸系數(shù)對斜率檢驗的假設是,總體回歸系數(shù)b=0。檢驗該假設的。檢驗該假設的t值計算公式是:值計算公式是: 對截距檢驗的假設是,總體回歸方程截距對截距檢驗的假設是,總體回歸方程截距a=0。檢驗該假設的。檢驗該假設的t值計算公式是:值計算公式是:在兩公式中,在兩公式中,SEb是回歸系數(shù)的標準誤。是回歸系

38、數(shù)的標準誤。SEa是截距的標準誤。是截距的標準誤。1 一元線性回歸方程一元線性回歸方程最優(yōu)線性回歸方程:bxay常用的方法是最小二乘法,也就是使直線與各點的縱向距離最小,即使實測值y與 之差的平方和 達到最小,因此,求回歸方程問題,歸根結底就是求 最小時a和b的問題。A稱為截距,b為回歸直線的斜率,它們又稱為回歸系數(shù)。y 2) (yy2) (yy2 一元回歸方程的檢驗一元回歸方程的檢驗(1 1)回歸系數(shù)的顯著性檢驗)回歸系數(shù)的顯著性檢驗一元線性回歸一元線性回歸(2 2)R R2 2判定系數(shù)判定系數(shù) 22)()(2yyyyRii(3 3)方差分析)方差分析 )1/()(/)(22pnyypyyF

39、殘差均方回歸均方 表明判定系數(shù)等于回歸平方和在總平方和中所占的比率,體現(xiàn)了回歸模型所解釋的因變量變異的百分比。如果R2 0.775,說明變異中又77.5是由變量x引起的。 R2 1表明因變量與自變量為函數(shù)關系。 R2 0,表示自變量與因變量無線性關系。 (a) (b) (c) (d)(e) (f) (g)一元線性回歸一元線性回歸各種殘差與預測值關系示意圖各種殘差與預測值關系示意圖以預測值為橫軸,測定值與預測值之間的誤差(殘差)為縱軸,繪制殘差的散點圖n例:例:在某鉑礦氧化帶的探槽中,采集了18個樣品,分析其中鉑與砷含量,其結果見表n由圖可見,它們之間呈現(xiàn)線性關系nY=a+bX n若用則實測值Y

40、與Yi間,就會有誤差:最小二乘法原理:誤差平方和達到最小的回歸直線是最好的。-0.500.000.501.001.50X0.001.002.003.00YC Co oe ef ff fi ic ci ie en nt ts sa a.433.2291.888.0772.146.388.8105.527.000(Constant)XModel1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: Ya. 回歸方程:Y=0.433+2.146X n回歸分析是研究隨機變量對其

41、它變量(可以是隨機變量,也可以回歸分析是研究隨機變量對其它變量(可以是隨機變量,也可以是確定性變量)的依賴關系的一種統(tǒng)計分折方法。雖然回歸分析是確定性變量)的依賴關系的一種統(tǒng)計分折方法。雖然回歸分析與相關分析之間有微小的區(qū)別,人們常常把它們統(tǒng)稱為回歸分析與相關分析之間有微小的區(qū)別,人們常常把它們統(tǒng)稱為回歸分析或相關分析?;蛳嚓P分析。n回歸分析主要解決以下幾方面的問題:回歸分析主要解決以下幾方面的問題: (1 1)建立回歸方程)建立回歸方程 b b0 0b b1 1X X1 1b b2 2X X2 2b bp pX Xp p (2 2)討論回歸方程中各自變量的作用,或者說檢驗)討論回歸方程中各自

42、變量的作用,或者說檢驗 每個自變量對回歸的貢獻大小。每個自變量對回歸的貢獻大小。 (3 3)最優(yōu)回歸方程的選擇。)最優(yōu)回歸方程的選擇。 (4 4)對因變量)對因變量y y的預測或控制。的預測或控制。多元回歸分析多元回歸分析多元線性回歸的概念多元線性回歸的概念1 1 多元回歸分析的模型多元回歸分析的模型 nnxbxbxbby22110(1 1)校正)校正R R2 2判定系數(shù)的公式判定系數(shù)的公式 1/) 1/() (1 Adjusted222nyyknyyR其中其中k k為自變量的個數(shù),為自變量的個數(shù),n n為觀測量數(shù)目為觀測量數(shù)目 偏回歸系數(shù)和常數(shù)項的偏回歸系數(shù)和常數(shù)項的t t檢驗的公式檢驗的公

43、式 偏回歸系數(shù)的標準誤偏回歸系數(shù)t常數(shù)項的標準誤常數(shù)項t2 多元線性回歸分析中的統(tǒng)計指標多元線性回歸分析中的統(tǒng)計指標(2)ZeroOrder(3)Part Correlation(4) Partial Correlation回歸菜單回歸菜單線性回歸主對話框線性回歸主對話框Dependent:因變量Independent:自變量Enter:強行進入法,候選自變量全部納入模型,不作任何篩選。Stepwise:逐步法Remove:強制剔除法Backward:向后法Forward:向前法WLS Weight:加權最小二乘法的回歸分析設定運算規(guī)則對話框設定運算規(guī)則對話框選入一個篩選變量,并利用右選入一個

44、篩選變量,并利用右側的側的RulesRules鈕建立一個選擇條鈕建立一個選擇條件,這樣,滿足該條件的記錄件,這樣,滿足該條件的記錄才會進入回歸分析。才會進入回歸分析。當然,也可以通過當然,也可以通過DataData菜單中菜單中的的Select CaseSelect Case過程來選擇記過程來選擇記錄,兩者功能是等價的。錄,兩者功能是等價的。$0$20,000$40,000$60,000$80,000$100,000$120,000$140,000Current Salary$0$20,000$40,000$60,000$80,000Beginning Salary散點圖示例散點圖示例n例:例:

45、 四川某鉑族元素礦區(qū),該礦區(qū)內的基性、超基性巖漿巖具有明顯的鉑族元素礦化特征,請用逐步回歸分析方法,求出Pt含量與其它元素的回歸方程。Cu Ni S FeOT MgO H2O+ CO2 Au Ag Pd Pt 109 200 50 11.07 10.83 3.3 0.58 1.39 57 7 20.4 84 54 20 11.43 9.43 7.52 0.21 2.59 146 7.32 54.9 134 93 20 9.08 6.86 6.74 4.09 1.27 265 9.86 24.5 43 33 40 10.7 7.84 7.14 0.13 0.38 72 0.43 10 382 9

46、69 640 11.42 20 6.17 4.3 12.9 239 105 139 2316 2964 40 12.05 13.91 8.4 5.97 18.4 463 73 97.1 154 873 3540 10.97 19.61 5.48 5.44 6.54 80 13.7 44.9 295 1857 50 11.42 16.94 8.3 5.91 4.55 538 32.9 57.8 233 980 110 11.69 20.98 7.78 1.34 4.67 128 47.3 62.9 203 1029 40 10.93 16.86 7.45 5.8 5.95 259 28.2 40

47、 142 332 20 10.79 11.07 7.4 4.01 1.71 110 7.51 70.5 113 200 8190 10.7 11.37 0.68 0.24 1.73 85 6.06 310 147 900 1400 10.79 24.8 5.12 0.45 4.68 105 5.83 73.6 6088 9922 41200 16.28 24.2 4.58 0.27 179 2336 162 512 290 298 130 12.06 9.32 4.72 0.22 1.02 64 1.28 136 61 37 70 11.15 7.44 4.86 0.2 0.83 55 2.26 25.8 43 14 80 10.44 7.92 2.58 0.21 0.51 37 6.47 133 350 121 800 15.21 5.48 1.48 0.54 4.24 154 9.33 86.8 210 52 1150 12.05 4.59 1.85 1.02 3.66 149 13.54 266 單位:ppm 單位:% 單位:ppb 回歸系數(shù) 未標準化系數(shù) 標準化系數(shù) 模型 系數(shù)b Std. Error 系數(shù) T值 P值 常數(shù) 80.294 16

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論