多元統(tǒng)計課程報告 劉輝_第1頁
多元統(tǒng)計課程報告 劉輝_第2頁
多元統(tǒng)計課程報告 劉輝_第3頁
多元統(tǒng)計課程報告 劉輝_第4頁
多元統(tǒng)計課程報告 劉輝_第5頁
已閱讀5頁,還剩10頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、中國地質(zhì)大學研究生課程論文封面課程名稱實用多元統(tǒng)計分析教師姓名向東進研究生姓名劉輝研究生學號120121825研究生專業(yè)石油天然氣工程所在院系 資源學院類別碩 士日期2012.12.11平時成績:課程論文成績:總成績:評閱人簽名:注:1、無評閱人簽名成績無效;2、必須用鋼筆或圓珠筆批閱,用鉛筆閱卷無效;3、如有平時成績,必須在上面評分表中標出,并計算入總成績。多元統(tǒng)計方法在地層巖性識別研究中的應用以北部灣盆地海中凹陷HZ1井為例一、案例研究背景北部灣盆地位于歐亞板塊內(nèi),屬板內(nèi)裂谷盆地,由于近板塊邊緣,也受到板塊碰撞、分離的 影響,其構(gòu)造活動比內(nèi)陸盆地要強一些。整個盆地的構(gòu)造演化可大致分為古新世

2、及始新世的 斷陷期、漸新世的拗陷期。區(qū)域上,北部灣盆地以及其北的萬山隆起區(qū),其南的海南隆起區(qū)為 一級構(gòu)造單元。在北部灣盆地中又劃分出北部坳陷、企西隆起,中部坳陷、徐聞隆起、南部 坳陷五個二級構(gòu)造單元。北部灣盆地是在海西一印支褶皺帶上發(fā)育的中、新生代斷陷盆地,盆地基底為上古生界碳 酸鹽巖、碎屑巖。在此基礎(chǔ)上發(fā)育中、新生界以陸相為主的陸相及海相碎屑巖。在勘查區(qū)內(nèi) 除潿西南凹陷的部分地區(qū)漸新統(tǒng)潿洲組被抬升剝蝕外,其它地層均有分布。此次案例研究研 究區(qū)僅涉及到海中凹陷(中西部)。海中凹陷地處盆地西部,位于北部坳陷南段,其東北接潿西南凹陷,南西為企西隆起, 為一北斷南超的箕狀凹陷。凹陷長約80km,寬約

3、40km,面積約3694km2。凹陷油氣勘探 和地質(zhì)研究程度相對較低,所掌握的區(qū)域資料也較少,大致可劃分出北部陡坡、南部斜坡等 次級構(gòu)造單元。目前已在海中凹陷內(nèi)發(fā)現(xiàn)了 HZ1井含油氣構(gòu)造。HZ1井位于北部灣盆 地海中凹陷中部地區(qū),測井資料顯示其電性特征表現(xiàn)為自然伽瑪曲線較平直,呈低值小齒狀, 電阻率曲線也較平直,為高值小齒狀。所在地層厚度變化較大,在凸起上往往缺失,在凹陷 較厚??碧絽^(qū)塊內(nèi)的HZ1井揭示該套地層厚達1710m,地震資料揭示深凹部位可達1800m。二、案例研究目的本文旨在采用多用統(tǒng)計分析方法中的聚類分析和因子分析,提取鉆井地層地球質(zhì)信息, 指導探區(qū)內(nèi)油氣勘探工作。聚類分析又稱群分

4、析,是對多個樣本(或指標)進行定量分類的一種多元統(tǒng)計分析方法。 對樣本進行分類稱為Q型聚類分析,對指標進行分類稱為R型聚類分析。本案例運用R型 聚類分析方法,通過對地層和測井曲線進行分析,并結(jié)合其他的一些地質(zhì)佐證,能夠了解探 區(qū)內(nèi)地層巖性類型,以及地層沉積環(huán)境,從而為找到探區(qū)內(nèi)油氣藏的圈閉空間分布規(guī)律提供 有用的信息。因子分析是一種研究分類和成因的數(shù)學地質(zhì)方法。它從原始變量的相關(guān)矩陣出發(fā),通過 對大量數(shù)據(jù)的濃縮,提煉出新的起主導作用的獨立變量(因子),據(jù)此來揭示變量之間、樣品 之間以及與地質(zhì)作用之間的相互關(guān)系,為研究變量分類和成因提供依據(jù)。由于因子分析方法 根據(jù)現(xiàn)象的內(nèi)在聯(lián)系將變量進行綜合歸結(jié)

5、,能夠歸納和提煉元素的組合,從而將混合型的原 始數(shù)據(jù)形態(tài)轉(zhuǎn)換為反映不同地質(zhì)成因的數(shù)據(jù)形態(tài)。因此,在地質(zhì)學領(lǐng)域中,因子分析已被廣 泛應用于礦產(chǎn)資源勘探等方面的研究。三、案例研究過程本次研究收集了海中凹陷HZ-1井各個層段的不同類別的測井曲線數(shù)據(jù),選用比較有 代表性的33個層段以及18類測井曲線數(shù)據(jù)進行研究,根據(jù)樣品的不同層段的測井曲線的數(shù) 據(jù)進行初步的分類,分作砂巖、細砂巖、粉砂巖、泥巖等方面的分類,通過對變量測井曲線 進行聚類,得出了 HZ-1井不同層段巖性的組合特點。3.1聚類分析3.1.1聚類分析的基本思想認為所研究的樣品或指標之間存在著程度不同的相似性,根據(jù)一批樣品的多個觀測指 標,找出

6、能夠度量樣品或變量之間相似程度的統(tǒng)計量,并以此為依據(jù),采用某種聚類法,將 所有的樣品或變量分別聚合到不同的類中,使同一類中的個體有較大的相似性,不同類中的 個體差異較大。3.1.2聚類分析的步驟:列出原始數(shù)組表。為了消除量綱和數(shù)量級的影響,對數(shù)據(jù)進行標準化變換。選擇合適的聚類方法(系統(tǒng)聚類、快速聚類)。選擇合適的統(tǒng)計量和聚類的參數(shù)。得出聚類分析結(jié)果。作出初步的地質(zhì)解釋。3.1.3、R型聚類分析的過程選取了海中凹陷 HZ1 井 33 個層段,AC、AZIM、CAL1、CAL2、CNL、DEN、DEVI、GR、ILD、ILM、LL8、SP、SH、MAGT、SWO、POR、Q 和 CL18 類測井曲

7、線數(shù)據(jù)做定量分析測試工作,得到了 33X18的原始數(shù)據(jù)矩陣,見表1-1:表1 HZ1井測井曲線數(shù)據(jù)分析結(jié)果矩陣檢測項目及結(jié)果號層段ACAZIMCAL1CAL2CNLDENDEVIGRILDILMLL8SPSHMAGTSWOPORQCL150m7.98.4128475.52.7122228.10.663.2680.0664.99.70.014.211.060.4102100 m8.814.238399.12.615.82911.80.432.781.50.0575.211.80.0093.990.980.3103150 m30.723.251.7606.42.822.94234.20.693.5

8、126.60.1177.317.20.00921.91.380.3114200 m39.491.548.7461.925.319.73878.20.573.41081.2186.516.20.1541.31.630.3105250 m740.2136.43127.73.34.41097.50.772.18.42.65237.64.10.555.41.462.2106300 m78.5110.3171.2585.424.120.24820.60.543.9111.60.995.212.40.0430.21.30.3107350 m59.527.533.6527.618.921.53290.20.

9、583.7101.70.1591.316.30.00928.51.470.3108400 m27.618.278.1627.817.715.62812.20.73.677.40.2687.5130.009221.680.3109450 m14.2560.4439.611.211.32269.30.542.761.50.0864.29.50.009201.690.31010500 m32.65350.9491.713.414.52730.40.57372.70.2580.2130.00931.31.680.3101112550 m600 m13650 m14700 m15750 m16800 m

10、17850 m18900 m19950 m201000 m211050 m221100 m22101.46.212.84165.310.252.530.97.429.96.161.522.729.322.247.235.140.245.526.617.140.712.7201.146.43528.637.860.2103.594.859.871.2384.72710.91217.7609575.1251.1527.6595.810000508.3791.9572.518.33.237.32.82.62.72.52.93.28.34.228.522.823.914.327.1267.319.72

11、1.929.723881293.96117.84684.95382.52168.26211.759192376.81692.94989.86767.21.280.762.960.880.710.580.762.123.082.340.740.71231150 m 16.7 6.78.4 3541.9 3.26.2 1937.5 0.64241200 m37.320.244.4544.819.8265990.60.532.91.93.33.22.43.24.12.83.42.91.23.449.78.3116.6113.8105.581.5135.8140.313.642.6137.5100.5

12、10.9126127.251250 m 65.5 21.3 45.4 712.5 13.6 21.8 5576.5 0.53 3.5261300 m 10.6618.1 7509.754.59670.641.65.9271350 m 10.6 25.555516.5 2.84.1677.2 0.65 1.1281400 m46.5702.515.51823.226.852.69243.60.854.4291450 m165.22.11091719.432.722.44029.13.85301500 m20.441.2864.139.818.75106.81.47311550 m12.135.4

13、2519.748.515.31377.31.513.7321600 m98.749.21056.763.818.83540.61.576.2331650 m35.214.2213.5814.424.510.520371.023.20.210.30.9685.535.4284.56.93.918.50.1160.312.80.0675.114.40.0549.510.60.288.217.60.2117.1.723102.130.086466.5.80.20.10.080.190.420.125132.10.70.050.0090.090.0090.0090.0090.0090.0090.270

14、.2331.219.637.716.734.93.1224.431.840.233.92.131.323.861.430.991.222.42.371.910.880.30.30.30.30.40.30.30.30.30.4101010101511111210163246.890.5122.1148.274.3186.5 0.095224.61.97524.684.847.614.10.00926.90.940.31620.60.0093.280.760.3173.316.414.92.62.24.280.231.751.271.30.16247.30.8206.13.920.329.825.

15、544.316.214.414.50.320.210.0090.0090.0091.220.357.631.74.720.043.3123.228.11.73.1546.944.577.469.271.622.80.890.3101.10.3121.040.4130.80.3170.891.051.087.544.226.251.080.30.30.30.30.30.30.615141427151812從表1中可以看出,原始數(shù)據(jù)差別較大,為了消除量綱和數(shù)量級的影響,將數(shù)據(jù)做了標 準化變換,得到標準化數(shù)據(jù)矩陣。將標準化數(shù)據(jù)輸入Spass,采用系統(tǒng)聚類法進行R型聚類分析,通過嘗試不同的的方法, 發(fā)

16、現(xiàn)采用組內(nèi)連接方法中的類平均距離度量標準與地質(zhì)解釋更吻合,所以采用了這種方法。 聚類的時候選擇標定距離為1525位置,將變量曲線元素分為24類,根據(jù)相關(guān)距離系數(shù) 差異的顯著性分為若干組,最后得出聚類譜系圖(圖1)。從聚類譜系圖(圖1)中可以看出在距離系數(shù)為10的水平下,可以將變量分為三類, 第一類為 DEN、SH、DEVI、ILM,第二類 ILD、AZIM,第三類為 MAGT、POR、CNL、 SWO、CL。根據(jù)這三類曲線組合的特點,我們可以看出第一類曲線組合主要是反映出在一些淺源的 偏砂類物質(zhì)當中曲線變化特征明顯;第二類曲線組合主要反映在細沙類巖性當中曲線變化較 明顯,這兩類曲線主要反映了再

17、砂巖性環(huán)境下曲線的變化規(guī)律。第三類曲線組合,主要反映 在沉積水動力環(huán)境較安靜、埋藏比較深的條件下生成的泥巖物質(zhì)對應的測井曲線變化規(guī)律。Rescaled Distance CIuster Comb i neCASE 05152025Label Num i11111AC6 AZIM13 CAL17ijCAL210 CNL9 DEN2 DEVI11 _GR4 ILD16 ILM 5 l_l LI815 SP18 SH1 MAGT8 SWO3 POR12 Q4CL17 圖1: R型聚類譜系圖從上述分析中我們可以看出測井曲線與不同層段巖性變化的對應關(guān)系:(1)受構(gòu)造作用、氣候變化、沉積物的供給速率以及可

18、容空間變化的影響,在盆地形 成演化作用發(fā)展的不同階段,生成的沉積物在測井曲線上能夠識別出其巖性類別。不同的巖 性在某些測井曲線上有不同于其它類別的顯著變化特征,根據(jù)這一變化特征進而也能夠從地 質(zhì)學角度分析出不同巖性對應的古沉積環(huán)境特征。3.2因子分析由于前面所采用的R型聚類分析只是粗略的反映曲線的組合特征,再實際問題研究當 中有太大的誤差,因此以下采用了因子分析,希望通過R型因子分析能夠找出反映沉積巖 特征類別的主成因子,以此揭示測井曲線在油氣勘查過程中,尤其是在判斷巖性以及不同巖 性所處的沉積環(huán)境和恢復古地貌特征方面發(fā)揮著重要的作用。3.2.1、因子分析的基本思想:根據(jù)相關(guān)性大小把變量分組,

19、使得同組內(nèi)的變量之間相關(guān)性較高,不同組的變量之間相 關(guān)性較低。每組變量代表一個基本結(jié)構(gòu),這個基本結(jié)構(gòu)稱為主因子或公共因子。對于所研究 的問題,就可試圖用最少個數(shù)的不可測的所謂公共因子的線性函數(shù)與特殊因子之和來描述原 來觀測的每一分量。3.2.2、因子分析的步驟:(1)列出原始數(shù)據(jù)表;(2)將原始數(shù)據(jù)標準化;(3)求變量間的相關(guān)系數(shù),列出相關(guān)矩陣R;(4)求R的全部特征值;(5)確定公因子個數(shù)m(6)求因子載荷,計算因子載荷矩陣A,對A作正交旋轉(zhuǎn)(7)作出初步地質(zhì)解釋;3.2.3、因子分析的過程:將進行標準化變換后的曲線測試數(shù)據(jù)作為變量,應用spass進行R型因子分析。因子 載荷矩陣的求解方法采

20、用主成分分析,得出曲線之間的相關(guān)系數(shù)矩陣(表2)。表2相關(guān)矩陣ACAZIMCAL1CAL2CNLDENDEVIGRILDILMLL8SPSHMAGTSWOPORQCL相AC1.000.104.347-.233.524.410.364.599.567.333.048.215.351.090.354.183-.160.033關(guān)AZIM.1041.000-.091-.006.138.662.530-.036.264.556.742.269.584.026.184-.115-.028.002CAL1.347-.0911.000-.089.184-.014.008.387.297-.034.068.17

21、9-.006-.124.132.009.326-.203CAL2-.233-.006-.0891.000-.164-.445-.392.266-.431-.559.225.153-.513-.034-.049-.075.096.054CNL.524.138.184-.1641.000.233.161.329.658.118.391-.178.370.633.736.727-.137.360DEN.410.662-.014-.445.2331.000.919.094.624.910.366.247.949.079.225.054-.262.160DEVI.364.530.008-.392.161

22、.9191.000.051.558.904.307.111.861.115.183.101-.247.177GR.599-.036.387.266.329.094.0511.000.265-.127.145.299.032.164.430.299-.073.153ILD.567.264.297-.431.658.624.558.2651.000.631.294-.064.680.296.542.480-.187.082ILM.333.556-.034-.559.118.910.904-.127.6311.000.231.047.873-.007.100.001-.270.005LL8.048.

23、742.068.225.391.366.307.145.294.2311.000.153.379.411.625.315.369.183SP.215.269.179.153-.178.247.111.299-.064.047.1531.000.120-.254-.068-.319.196.104SH.351.584-.006-.513.370.949.861.032.680.873.379.1201.000.196.326.195-.269.194MAGT.090.026-.124-.034.633.079.115.164.296-.007.411-.254.1961.000.690.880-

24、.025.765SWO.354.184.132-.049.736.225.183.430.542.100.625-.068.326.6901.000.738.223.426POR.183-.115.009-.075.727.054.101.299.480.001.315-.319.195.880.7381.000-.078.550Q-.160-.028.326.096-.137-.262-.247-.073-.187-.270.369.196-.269-.025.223-.0781.000-.123CL.033.002-.203.054.360.160.177.153.082.005.183.

25、104.194.765.426.550-.1231.000KMO和Bartlett的檢驗取樣足夠度的.537Kaiser-Meyer-Olkin 度量。Bartlett的球形度檢驗 近似卡方631.097df153Sig.000對相關(guān)矩陣進行KMO檢驗與Bartlett球度檢驗(表3)。一般要求KMO值與1越接近 越好,當小到一定程度時認為不能認可;Bartlett檢驗偏相關(guān)矩陣是否為一單位陣,若是單 位矩陣,則認為不能接受。表中KMO=0.537,按照KMO置的要求,認為大于0.50.7就可 以做因子分析。0.5375,認為可以做因子分析。Bartlett值為631.097, p0.01,表

26、明相關(guān) 陣不是一個單位矩陣,可以接受。利用相關(guān)系數(shù)矩陣進行因子分析,計算其特征值及貢獻率,選擇特征值大于1作為提取 因子的參數(shù),從中提取了5個主因子(表4)。旋轉(zhuǎn)后最大主成分特征值為6.036,最小值為1.38; 根據(jù)樣本數(shù)據(jù)和累計率大于一般要求的一般原則,累積因子特征值占總方差的83.51%,由 于地質(zhì)事件的耦合因素太多,結(jié)合實際問題認為這一結(jié)果可以接受,顯示這5個主因子承載 了大多數(shù)變量的全部信息,信息丟失量極少。故我們可取出因子個數(shù)為5。表4解釋的總方差成份初始特征值提取平方和載入旋轉(zhuǎn)平方和載入合計方差的%累積%合計方差的%累積%合計方差的%累積%16.03633.53433.5346.

27、03633.53433.5345.08928.27128.27123.53419.63453.1683.53419.63453.1684.07322.62850.90032.14511.91465.0822.14511.91465.0822.42113.45364.35241.95910.88475.9661.95910.88475.9661.7269.59073.94251.3587.54583.5111.3587.54583.5111.7239.56983.5116.9315.17088.6817.5152.86091.5418.4312.39793.9379.3151.74795.685

28、10.2601.44697.13111.170.94498.07512.135.74798.82313.083.46099.28314.055.30799.59015.032.17799.76716.024.13399.89917.011.06199.96018.007.040100.000計算其因子載荷矩陣,因子載荷反映了變量與公因子之間的相關(guān)程度,公因子的地質(zhì)意 義是由載荷較大的元素表征的。通過嘗試發(fā)現(xiàn)未旋轉(zhuǎn)的因子載荷矩陣特表5表6成份矩陣a成份12345SH.875-.382-.107.049.003DEN.840-.499.006.082.117ILD.829.019.048-.333

29、-.195DEVI.784-.466-.074.053.090ILM.746-.602-.151-.015-.070CNL.665.551-.013-.195-.090SWO.646.626.134.115-.171AC.559.040.405-.526.197POR.518.746-.272-.070-.049MAGT.495.721-.342.186.041CL.366.488-.292.245.436CAL1.112.093.651-.402-.341SP.064-.236.638.211.415GR.282.384.587-.297.431LL8.540.208.313.683-.21

30、9AZIM.545-.371.198.590.002CAL2-.404.343.326.421.391Q-.192.200.476.348-.590成份中國地質(zhì)大學(武漢)資源學:院1234 2)12512.11DEN.973.066.115-.065.080ILM.951-.050.035-.072-.182現(xiàn)對初始因子載荷矩陣進行正交旋轉(zhuǎn)得到正SH.934.194.092-.039-.071交旋轉(zhuǎn)矩陣(表6),各公因子的載荷向兩極分化,DEVI.909.078.072-.097.008有的變量載荷接近于1,而另一些接近于0,公因AZIM.726.021-.170.366.363子的地質(zhì)意義

31、更加明確。從表中可以看出,DEN、ILD.596.374.502.030-.300ILM、SH、DEVI、AZIM、ILD 在第一主因子 F1MAGT.027.952-.095.011-.041上有較大的載荷;MAGT、POR、SWO、CNL、CLPOR-.012.922.135-.018-.194第一主因子F2上有較大載荷,AC、CAL1、GR在SWO.160.799.295.346.013第二主因子F上有較大載荷;Q、LL8在四主因CNL.183.753.403.054-.164子F4上有較大的載荷,CAL2、SP在第五主因子CL.069.726-.176-.251.283f5上有較大的載

32、荷。AC.321.156.791-.186.071表7為變量的共同度,它的大小表示變量的信Pb-.070-.130.746.365-.100息被公因子所提取的方差,反映了公因子對變量GR-.074.284.728-.120.464的影響。例如DEN的共同度為0.976,說明5個公Q-.253-.073.051.836.021因子反映了變量DEN信息的97%。CL最小為LL8.391.439-.069.695.3390.707,說明GR曲線表征的信息還有近30%不能被SP.183-.265.257.086.712公因子說明。CAL2-.476.060-.137.113.676表7公因子方差初始提

33、取AC1.000.793AZIM1.000.822CAL11.000.722CAL21.000.718CNL1.000.793DEN1.000.976DEVI1.000.848GR1.000.846ILD1.000.839ILM1.000.947LL81.000.948SP1.000.683SH1.000.926MAGT1.000.918SWO1.000.870POR1.000.906Q1.000.772CL1.000.707為了更直觀的看出各因子對變量信息的承載情況,做了旋轉(zhuǎn)因子三維空間載荷分布圖,從 因子旋轉(zhuǎn)的空間分布圖可以看出,它所反應的信息與解釋因子總方差所反應的信息很吻合。圖2:因子

34、旋轉(zhuǎn)空間分布圖3.2.4、因子分析結(jié)果解釋根據(jù)Spas s提取的五個主因子,并結(jié)合因子旋轉(zhuǎn)的空間分布圖,根據(jù)已掌握的其他地質(zhì) 資料可以得出以下地質(zhì)解釋:第一,第一主因子DEN、ILM、SH、DEVI、AZIM、ILD等6個類別的測井曲線組成, 這一主因子都是在沉積物含砂量比較大的情況下,其值得變化比較明顯;同時這一因子也指 示出沉積物是在較強的沉積環(huán)境下生成的。我們可以將這一主因子命名為砂巖沉積物指示特 征因子。從因子分析結(jié)果還可以看出曲線的相關(guān)性,做出第一主因子曲線相關(guān)性地質(zhì)解釋。曲線 群投點在空間載荷分布圖中心點的左下方,各曲線之間的點距較小,呈較緊密的分布,顯示 本群曲線具有很強的相關(guān)性,其相關(guān)系數(shù)通常大于0.9,最高可達0.949。第二因子為MAGT、POR、SWO、CNL、等4個類別的曲線組成。該類別的曲線全部對應 泥質(zhì)沉積物質(zhì),沉積環(huán)境弱水動力環(huán)境。我們將這一因子命名泥巖沉積物指示因子。該曲線群投點在空間載荷分布圖中心點的右上方。各曲線點之間的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論