版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
調(diào)查數(shù)據(jù)挖掘和模式識別技術(shù)對土壤數(shù)據(jù)挖掘摘要:數(shù)據(jù)挖掘已經(jīng)成為主要的研究方向之一域,在近數(shù)十年來,以提取隱含的和有用的數(shù)據(jù)。這種知識可以被人類輕松認(rèn)知。最初,這方面的知識提取和計算評估采用手工統(tǒng)計技術(shù)。隨后,半自動數(shù)據(jù)挖掘技術(shù)的出現(xiàn),因為進(jìn)步的技術(shù)。這樣的進(jìn)步也是在形式存儲從而提高分析的需求。在這樣的情況下,半自動化的技術(shù)已成為低效率的。因此,自動化的數(shù)據(jù)挖掘技術(shù)引入到合成知識有效。數(shù)據(jù)現(xiàn)有文獻(xiàn)的調(diào)查挖掘和模式識別土壤數(shù)據(jù)挖掘呈現(xiàn)本文。在農(nóng)業(yè)土壤中的數(shù)據(jù)集的數(shù)據(jù)挖掘是一個比較新的研究領(lǐng)域。有效的技術(shù)可開發(fā)和專為解決在使用數(shù)據(jù)挖掘復(fù)雜的土壤數(shù)據(jù)集。關(guān)鍵詞:數(shù)據(jù)挖掘,模式識別,土壤數(shù)據(jù)挖掘一、引言這個數(shù)據(jù)挖掘的軟件應(yīng)用包括各種已經(jīng)開發(fā)了商業(yè)方法和研究中心。這些技術(shù)已被用于工業(yè),商業(yè)和科學(xué)用途。例如,數(shù)據(jù)挖掘技術(shù)已經(jīng)被用來分析大數(shù)據(jù)集和建立有用的分類和模式的數(shù)據(jù)集。農(nóng)業(yè)和生物研究的研究中使用的各種數(shù)據(jù)分析的技術(shù),包括,天然樹,統(tǒng)計機器學(xué)習(xí)和其它分析方法。本文研究的,如果新的數(shù)據(jù)挖掘可以建立技術(shù)將改善的有效性和準(zhǔn)確性大型數(shù)據(jù)集的土壤分類。在特別地,本研究工作的目的是比較數(shù)據(jù)的性能在土壤局限性和土壤條件挖掘算法方面的以下特點:酸度,堿度與鈉含量,鹽分,低陽離子交換容量,磷的固定,有開裂和溶脹性能,深度,土壤密度和營養(yǎng)素含量。使用標(biāo)準(zhǔn)的統(tǒng)計分析技術(shù)是既費時又昂貴。如果可以發(fā)現(xiàn)替代的技術(shù),以改善這個過程中,在土壤中的分類的改進(jìn)可能結(jié)果。農(nóng)業(yè)是每個國家都以其核心競爭力。但是在印度然而,它只占17%總的國內(nèi)生產(chǎn)總值。隨著城市化進(jìn)程加快,這將是糧食生產(chǎn)的挑戰(zhàn)越來越多的人用更少的土地和水。農(nóng)業(yè)或養(yǎng)殖是任何國家的脊梁經(jīng)濟(jì)性,因為大量人口生活在農(nóng)村地區(qū),是直接或間接依賴農(nóng)業(yè)為生。來自農(nóng)業(yè)收入形成了養(yǎng)殖的主要來源社區(qū)。
作物收割的基本要求是水資源和資金購買種子,化肥,農(nóng)藥,勞動力等多數(shù)農(nóng)民通過提高資本要求犧牲其他必要的支出,而當(dāng)它是仍然不足,他們求助于信貸從銀行等渠道和民間金融機構(gòu)。
在這種情況下,該還款取決于作物的成功。
如果作物由于多種因素失敗即使一次時,如不良的天氣、土壤類型不好,過度和過早應(yīng)用這兩種化肥和農(nóng)藥;摻假的種子和農(nóng)藥等,然后他推入嚴(yán)重危機造成了嚴(yán)重的壓力。此外,該植物生長取決于多種因素,如土壤類型、作物類型和天氣。由于缺乏植物生長信息和專家建議,大多數(shù)農(nóng)民無法獲得良好的收益。土壤性質(zhì)的知識大多來源于土壤調(diào)查努力。土壤調(diào)查,或土壤制圖,是確定土壤類型或土壤覆蓋的其他屬性在一個過程,并將其映射為他人理解并使用。對于土壤調(diào)查主要數(shù)據(jù)通過實地采集采樣和遙感支持。利用從收集的這項研究工作的測試數(shù)據(jù)集世界土壤信息-ISRIC(國際土壤參考和信息中心)。在ISRIC-WISE3.1版土壤的排放數(shù)據(jù)庫(WISE3世庫存勢)是從一個大范圍的土壤剖面并且遵從許多專業(yè)人士從世界各地收集到的數(shù)據(jù)。從而主土壤數(shù)據(jù)和任何二級數(shù)據(jù)導(dǎo)出他們可以利用地理信息系統(tǒng)的空間單位掛鉤世界土壤圖以及更近的土壤和地形(SOTER)數(shù)據(jù)庫通過土壤傳說中的代碼。WISE3是關(guān)系數(shù)據(jù)庫,使用編譯MS-ACCESS。它可以處理數(shù)據(jù):(一)土壤分類;(二)土天邊的數(shù)據(jù);(三)數(shù)據(jù)的來源;和用于方法確定分析數(shù)據(jù)。在WISE3檔案數(shù)據(jù)來源于來自260多個不同的來源,模擬和數(shù)字。的型材大約有40%是從輔助提取數(shù)據(jù)集,包括各種土壤和地形數(shù)據(jù)庫和FAO土壤數(shù)據(jù)庫,持有多種來源的數(shù)據(jù)整理。WISE3持有選定的屬性數(shù)據(jù)10253個土壤剖面,有些47800個視野,來自149個國家。在未來,這些數(shù)據(jù)集與各種數(shù)據(jù)挖掘的分析技術(shù)可能產(chǎn)生的成果有助于研究人員。二、材料和方法在數(shù)據(jù)挖掘的技術(shù)迅速增長是由于(ⅰ)大型存儲設(shè)備的成本下降,提高易用性采集的數(shù)據(jù)通過網(wǎng)絡(luò),(二)穩(wěn)健發(fā)展,高效的機器學(xué)習(xí)算法來處理這些數(shù)據(jù),并(三)計算能力的成本下降,從而利用密集計算的方法對數(shù)據(jù)進(jìn)行分析。數(shù)據(jù)挖掘僅僅代表一組從原始數(shù)據(jù)中提取模式目的的特定的方法和算法。
在DM過程已經(jīng)發(fā)展由于巨大必須被處理的區(qū)域更容易,如數(shù)據(jù)的量:商業(yè),醫(yī)療行業(yè),天文學(xué),遺傳學(xué)。
此外,成功的超常規(guī)發(fā)展硬件技術(shù)使得存儲的大容量硬盤的出現(xiàn),事實上許多挑戰(zhàn)的出現(xiàn)問題在操作數(shù)據(jù)的巨大的量。當(dāng)然,這里最重要的方面是對快速增長互聯(lián)網(wǎng)。DM過程的核心在于應(yīng)用方法和為了算法發(fā)現(xiàn)和提取模式存儲的數(shù)據(jù),但在此之前的步驟的數(shù)據(jù)必須進(jìn)行預(yù)處理。眾所周知,簡單的使用DM算法無法產(chǎn)生了良好的效果。因此,發(fā)現(xiàn)的整個過程在原始數(shù)據(jù)有用的知識包括順序應(yīng)用以下步驟:在應(yīng)用領(lǐng)域,創(chuàng)造一個目標(biāo)數(shù)據(jù)集的基礎(chǔ)上通過集中的一個子集選擇數(shù)據(jù)的一種智能的方式變量或數(shù)據(jù)樣本,數(shù)據(jù)清洗和預(yù)處理,數(shù)據(jù)縮減和投影,選擇數(shù)據(jù)挖掘任務(wù),選擇的數(shù)據(jù)挖掘算法,數(shù)據(jù)挖掘步驟,解釋挖掘模式與可能返回的任何一個前面的步驟和鞏固知識的發(fā)現(xiàn)。在DM包含許多研究領(lǐng)域,如機器學(xué)習(xí),數(shù)據(jù),數(shù)據(jù)庫,統(tǒng)計模式識別,人工智能,數(shù)據(jù)采集專家系統(tǒng)和數(shù)據(jù)可視化。
這里最重要的目標(biāo)是從數(shù)據(jù)和模式中提取帶來有用的知識成可以理解的形式。這是建議獲得的信息是淺顯的,以解釋的使用的容易性。
整個過程的目的是獲得從低級別的數(shù)據(jù)的高級數(shù)據(jù)。數(shù)據(jù)挖掘涉及到裝修款或確定從模式的觀測數(shù)據(jù)。擬合模型發(fā)揮作用推斷的知識。
通常情況下,一個數(shù)據(jù)挖掘算法構(gòu)成以下三種組件。(模型:該模型的功能(例如,分類,聚類)和它的代表性形式(如線性判別,神經(jīng)網(wǎng)絡(luò))。模型包含的是從該數(shù)據(jù)確定參數(shù)。(選擇標(biāo)準(zhǔn):一個基礎(chǔ)的偏好一個模型或一組對另一參數(shù),取決于給定的數(shù)據(jù)。(搜索算法:一個規(guī)范算法尋找特定的模式,參數(shù),給出的數(shù)據(jù),模型(s)和一個優(yōu)先標(biāo)準(zhǔn)。一個特定的數(shù)據(jù)挖掘算法通常是為實例模型/偏好/搜索組件。在當(dāng)前的數(shù)據(jù)挖掘比較常見的模式功能做法包括:1、分類:分類一數(shù)據(jù)項到幾個預(yù)定義分類。2、回歸:一個數(shù)據(jù)項映射到實值的預(yù)測變量。3、聚類:映射一個數(shù)據(jù)項分成幾個集群之一,其中,集群是數(shù)據(jù)項的自然分組基于相似性指標(biāo)或概率密度模型。4、規(guī)則產(chǎn)生:提取從數(shù)據(jù)分類規(guī)則。5、關(guān)聯(lián)規(guī)則挖掘:描述了在不同的關(guān)聯(lián)關(guān)系屬性。6、聚合:提供一緊湊描述為數(shù)據(jù)的子集。7、依靠建模:介紹顯著變量之間的相關(guān)性。8、序列分析:連續(xù)模式模式,如時間序列分析。
我們的目標(biāo)是模型的過程中產(chǎn)生的狀態(tài)序列或提取和報告偏差和趨勢隨著時間的推移。雖然,有很多技術(shù)在數(shù)據(jù)可用,如人工神經(jīng)網(wǎng)絡(luò),K近鄰,K指的做法。人工神經(jīng)網(wǎng)絡(luò):人工神經(jīng)網(wǎng)絡(luò)(ANN)的靈感來自于人腦的研究體系,人工神經(jīng)網(wǎng)絡(luò)(ANN)網(wǎng)絡(luò)中每個節(jié)點代表一個神經(jīng)元,每個鏈接表示方式兩個神經(jīng)元相互作用。每個神經(jīng)元執(zhí)行非常簡單的任務(wù),而該網(wǎng)絡(luò)的代表其所有的神經(jīng)元的工作是能夠執(zhí)行更復(fù)雜的任務(wù)。神經(jīng)網(wǎng)絡(luò)是一個相互聯(lián)系的一套輸入/輸出單元,其中每個連接的重與之相關(guān)聯(lián)。該網(wǎng)絡(luò)通過學(xué)習(xí)微調(diào)權(quán)重,以便能夠預(yù)測輸入樣本的呼叫標(biāo)簽在測試階段。人工神經(jīng)網(wǎng)絡(luò)是一個新的在洪水預(yù)報中使用的技術(shù)。ANN的優(yōu)點在造型的降雨量方法和流失的關(guān)系在傳統(tǒng)技術(shù)洪水預(yù)報。神經(jīng)網(wǎng)絡(luò)具有比在常規(guī)方法的幾個優(yōu)點計算。有更多的時間用于獲取任何問題解決方案,ANN是非常適合的狀態(tài),神經(jīng)網(wǎng)絡(luò)方法成功地提前一周預(yù)測了病蟲害發(fā)生率攻。提前一周函數(shù)提供由一種替代從更容易獲得的土壤估計土壤參數(shù)數(shù)據(jù)。所使用的兩種常見的方法來開發(fā)的PTF是多線性回歸方法和神經(jīng)網(wǎng)絡(luò)。多元線性回歸和神經(jīng)網(wǎng)絡(luò)模型(前饋回來傳播網(wǎng)絡(luò))被雇用開發(fā)此特區(qū)),第207-216,1993年5月。[3]AlahakoonD.,HalgamugeSK和斯里尼瓦桑B,動態(tài)的自我組織圖與知識發(fā)現(xiàn)控制生長,IEEE交易神經(jīng)網(wǎng)絡(luò),卷。
11,第601-614,2000。[4]阿尼什C.Turlapaty,情人節(jié)Anantharaj,尼古拉斯·H.尤南,空間-對AMSR-E土壤水分?jǐn)?shù)據(jù)使用時間一致性分析基于小波變換的特征提取和一類SVM,在年會馬里蘭州巴爾的摩市,三月9-訴訟13,2009。[5]金WH和陳KCC,一個有效的算法發(fā)現(xiàn)在關(guān)系數(shù)據(jù)庫中模糊規(guī)則,在訴訟IEEE國際會議模糊系統(tǒng)FUZZIEEE98,(阿拉斯加州),第1314至1319年,1998年5月。[6]班納吉男,米特拉S,和好朋友SK,粗糙模糊MLP:知識編碼和分類,神經(jīng)網(wǎng)絡(luò)的IEEE交易,第一卷。
9,第1203至16年,1998。[7]博斯克P.,PivertO.和UghettoL.,數(shù)據(jù)庫挖掘發(fā)現(xiàn)擴展函數(shù)依賴,在NAFIPS99論文集,(美國紐約),第580-584,1999年6月。[8]裴EN,LoughheadA.后起之秀-[R...提取土壤景觀規(guī)則從以前的土壤調(diào)查。
澳大利亞熱帶亞熱帶植物學(xué)報,37:495508,1999。[9]塞爾尼五,A熱動力學(xué)方法旅行商問題:一個高效的仿真算法。雜志優(yōu)化理論與應(yīng)用,45:41-51,1985。[10]蔣DA,周LR,王YF,挖掘時間序列數(shù)據(jù)進(jìn)行模糊語言總結(jié)制度,“模糊集和系統(tǒng),卷。
112,第419-432,2000。[11]克里斯托弗·J·莫蘭和Elsabeth裴N.,空間數(shù)據(jù)挖掘增強土壤地圖建模。
在國際的訴訟。地理信息科學(xué)學(xué)院,2002年。[12]西謝爾斯基V和PalstraG,使用了混合神經(jīng)/專家系統(tǒng)數(shù)據(jù)庫挖掘市場調(diào)查數(shù)據(jù)顯示,在PROC。
第二屆國際會議知識發(fā)現(xiàn)和數(shù)據(jù)挖掘(KDD-96),波特蘭,OR),第
38,AAAI出版社,8月2日至4日,1996年。[13]ColorniA.,多里戈等M.,Maniezzo五,分布式通過優(yōu)化蟻群,actes德拉首映發(fā)布會歐元通心粉河畔拉爭奪artificielle,法國巴黎,愛思唯爾出版,134-142,1991。[14]哥斯達(dá)黎加A.和英雄AO測地線熵圖的尺寸和熵估計流形習(xí)。在IEEE的訴訟交易信號處理,音量52,2210至21年的網(wǎng)頁,2004年。[15]哥斯達(dá)黎加JA和英雄AO,III。分類約束降維。在IEEE國際會議聲學(xué)語音和信號處理,5卷,1077-1080頁,2005年3月。[16]坎寧安S.J和福爾摩斯G.在開發(fā)創(chuàng)新應(yīng)用農(nóng)業(yè)利用數(shù)據(jù)挖掘,在東南亞的訴訟地區(qū)計算機聯(lián)合會會議,1999年[17]多里戈M.,優(yōu)化,學(xué)習(xí)和自然算法,博士論文中,米蘭理工大學(xué),意大利,1992年。[18]Fayadd,U.,Piatesky-夏皮羅,G.,和史密斯,P,數(shù)據(jù)挖掘數(shù)據(jù)庫知識發(fā)現(xiàn),AAAI新聞/麻省理工學(xué)院出版社,麻省理工學(xué)院。ISBN0-262-56097-6Fayap,1996年。[19]法耶茲UM,Piatetsky-夏皮羅G,P。史密斯和UthurusamyR.,編輯,進(jìn)展知識發(fā)現(xiàn)和數(shù)據(jù)挖掘。
門洛帕克,CA:AAAI/MIT出版社,1996年。[20]喬治R.和R.SRIKANTH,數(shù)據(jù)匯總使用基因算法和模糊邏輯,遺傳算法和軟計算(F.Herrera和JLVerdegay,編),第599-611,海德堡:施普林格出版社,1996年。[21]格斯勒PE,穆爾D.,麥肯齊新澤西州和RyanP...土壤景觀建模和土壤屬性的空間預(yù)測。
在訴訟計算機科學(xué)問題,卷IJCSI國際期刊。8,第3期,1號,2011年5月ISSN(在線):1694-0814地理信息系統(tǒng)的國際雜志,第9卷,421-432頁1995年,。[22]海爾J.和ShenoiS.,在關(guān)系數(shù)據(jù)庫中FD分析推斷,數(shù)據(jù)與知識工程,第一卷。
18,第167-183,1996。[23]胡X.和塞爾康N.,從數(shù)據(jù)庫中挖掘知識規(guī)則:一個粗糙集方法,在12論文集日國際會議在數(shù)據(jù)工程,(華盛頓),第96-105,IEEE計算機社會,1996年2月。[24]耆那教的AK和DubesRC,聚類算法的數(shù)據(jù)。
普倫蒂斯廳,1998年。[25]KacprzykJ.和ZadroznyS.,通過對語言的總結(jié)數(shù)據(jù)挖掘數(shù)據(jù):互動的方式,在飯冢98,(福岡訴訟,日本),頁668-671,1998年10月。[26]KatyalJC,帕羅達(dá)RS,雷迪MN,Aupam瓦瑪和N.Hanumanta饒。
農(nóng)業(yè)科學(xué)家感知對印度農(nóng)業(yè):現(xiàn)場情景和愿景。
國家科學(xué)院農(nóng)業(yè)科學(xué),2000。[27]肯尼迪,J.,埃伯哈特,R.,“粒子群算法”。
訴訟對神經(jīng)網(wǎng)絡(luò)的IEEE國際會議。
IV。
第1942-1948年,1995年。[28]劍H.和福D.,用粗糙的遺傳和Kohonen網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)的概念群的發(fā)現(xiàn)數(shù)據(jù)挖掘,在RSFDGrC'99,(山口,日本),第448-452的法律程序中,1999年11月。[29]帕特里克S.,GelattCD,維奇MP通過優(yōu)化模擬退火??茖W(xué)新系列220(4598):671-680.Doi:10.1126/science.220.4598.671。ISSN00368075.,19
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度互聯(lián)網(wǎng)醫(yī)療平臺合作服務(wù)協(xié)議3篇
- 網(wǎng)上做課程設(shè)計
- 二零二五年度商業(yè)街鋪面租賃合同范本(含裝修支持)3篇
- 二零二五年度國有企業(yè)國有股權(quán)流轉(zhuǎn)監(jiān)管協(xié)議3篇
- 2025年度相機產(chǎn)品定制與銷售合同范本3篇
- 整頓鹽務(wù)市場秩序?qū)嵤┓桨笜颖荆?篇)
- 水泵工安全職責(zé)模版(2篇)
- 2025年配電房管理制度與(2篇)
- 美術(shù)的節(jié)奏課程設(shè)計
- 二零二五年度新能源儲能合同履約保證書3篇
- 2024年廣西廣播電視技術(shù)中心招聘歷年高頻500題難、易錯點模擬試題附帶答案詳解
- 化工企業(yè)安全操作規(guī)程
- 2024年上半年重慶三峽融資擔(dān)保集團(tuán)股份限公司招聘6人易考易錯模擬試題(共200題)試卷后附參考答案
- DB15-T 3644-2024 國有企業(yè)陽光采購規(guī)范
- 2024年秋新教科版八年級上冊物理教學(xué)課件 第2章 運動與能量 3 物體運動的速度
- 工業(yè)機器人仿真軟件:Staubli Robotics Suite:碰撞檢測與避免策略教程
- 幼兒園中大班社會科學(xué)芒種課件
- 《圓的認(rèn)識》(教學(xué)設(shè)計)-2024-2025學(xué)年六年級上冊數(shù)學(xué)人教版
- 電商創(chuàng)業(yè)孵化基地入駐合作協(xié)議2024年
- 托育機構(gòu)年度計劃
-
評論
0/150
提交評論