探討互聯(lián)網(wǎng)+時代下數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析_第1頁
探討互聯(lián)網(wǎng)+時代下數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析_第2頁
探討互聯(lián)網(wǎng)+時代下數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析_第3頁
探討互聯(lián)網(wǎng)+時代下數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析_第4頁
探討互聯(lián)網(wǎng)+時代下數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

探討“互聯(lián)網(wǎng)+”時代下數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析

Summary:“互聯(lián)網(wǎng)+”新概念的出現(xiàn),引起了人們對信息技術(shù)快速發(fā)展的廣泛關(guān)注和討論。目前,隨著我國社會經(jīng)濟的進步,互聯(lián)網(wǎng)包含了越來越完善的內(nèi)容,導(dǎo)致許多新技術(shù)的出現(xiàn)。在現(xiàn)代條件下,傳統(tǒng)的數(shù)據(jù)處理技術(shù)不能實現(xiàn)海量數(shù)據(jù)的存儲和傳輸,不能滿足現(xiàn)代數(shù)據(jù)處理的要求,也不能解決軟件開發(fā)和應(yīng)用過程中的不穩(wěn)定性問題。數(shù)據(jù)提取技術(shù)可以提取、存儲和集成有價值的海量數(shù)據(jù),刪除無效信息,確保數(shù)據(jù)源的安全,方便項目軟件開發(fā)和項目管理。Keys:“互聯(lián)網(wǎng)+”;數(shù)據(jù)挖掘技術(shù);軟件工程前言隨著科學(xué)技術(shù)的進步和互聯(lián)網(wǎng)通信技術(shù)的發(fā)展,海量信息需要建立相應(yīng)的過濾集成軟件。在實踐中,應(yīng)充分利用數(shù)據(jù)采集和存儲技術(shù),過濾數(shù)據(jù)庫中不必要的信息,提高軟件開發(fā)水平。1、數(shù)據(jù)挖掘技術(shù)概述隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)挖掘技術(shù)的重要性日益凸顯。為了將數(shù)據(jù)挖掘技術(shù)應(yīng)用到軟件開發(fā)中,必須明確其特點,為今后的工作打下堅實的基礎(chǔ)。隨著科技的進步,我們已經(jīng)進入了大數(shù)據(jù)時代。在對爆炸性信息進行科學(xué)處理的基礎(chǔ)上,提取出有價值的數(shù)據(jù),以滿足軟件開發(fā)的需要。在實踐中,數(shù)據(jù)挖掘技術(shù)的發(fā)展是以數(shù)據(jù)處理技術(shù)為基礎(chǔ)的。數(shù)據(jù)開發(fā)技術(shù)需要對相關(guān)人員的關(guān)鍵信息進行分類。在實踐中,通過對數(shù)據(jù)的合理劃分,找出規(guī)律,并建立相應(yīng)的跟蹤預(yù)測模型。通過類似的方法,可以發(fā)現(xiàn)各種資料的關(guān)聯(lián),并根據(jù)這些資料,進行有針對性的分析,得到有意義的資料。數(shù)據(jù)挖掘不僅僅是簡單的數(shù)據(jù)分析,更是一個動態(tài)的過程,需要有一個宏觀的角度,這樣才能充分利用數(shù)據(jù)挖掘的本質(zhì),從數(shù)據(jù)的采集與識別,數(shù)據(jù)結(jié)構(gòu)與邏輯的結(jié)合提高數(shù)據(jù)挖掘的應(yīng)用價值。其次,在數(shù)據(jù)挖掘方法的基礎(chǔ)上,首先對數(shù)據(jù)進行預(yù)處理,然后根據(jù)最終的結(jié)果增加數(shù)據(jù)挖掘的價值,如挖掘算法、對象、數(shù)據(jù)分類等,提高挖掘效率。在此基礎(chǔ)上,需要進行深入的分析和評估,以反映最終價值,并為未來的數(shù)據(jù)管理提供必要的支持。合理使用這些技術(shù)不僅可以提高數(shù)據(jù)處理的性能,而且可以充分提高系統(tǒng)的性能,讓用戶有更多的體驗。圖1數(shù)據(jù)挖掘技術(shù)的應(yīng)用流程2、軟件工程中的特殊數(shù)據(jù)提取應(yīng)用2.1數(shù)據(jù)挖掘技術(shù)在開源軟件中的應(yīng)用在介紹這一技術(shù)時,必須考慮到開源的開放程度,從而有效地提高開發(fā)的效率。但是,由于數(shù)據(jù)的不同,會造成管理和安全方面的問題。因此,在實際應(yīng)用中,要解決的問題就是使用數(shù)據(jù)提取技術(shù)來改善軟件的質(zhì)量。該技術(shù)可以實現(xiàn)對大量的數(shù)據(jù)進行處理,實現(xiàn)對大量數(shù)據(jù)的高效利用和整合,以滿足復(fù)雜的軟件特性,實現(xiàn)對用戶的科學(xué)管理。2.2數(shù)據(jù)挖掘技術(shù)在工程軟件中的應(yīng)用利用數(shù)據(jù)挖掘技術(shù)可以確保有用的信息在海量的數(shù)據(jù)中脫穎而出,并針對其進行有效的分析,保證信息得到高效整合。利用數(shù)據(jù)挖掘技術(shù)可以實現(xiàn)對信息的高效處理,通過篩選出軟件庫中的各項信息,并將其轉(zhuǎn)化為有用信息。在工程軟件開發(fā)中,由于含有組織鏈、版本控制等因素,所以必須對其進行有效的管理,以有效地減少資源的浪費。在大規(guī)模的軟件工程中,有可能產(chǎn)生大量的電子文件和電子郵件等信息。如果不進行正確的處理和控制,將會對以后的軟件使用造成很大的影響。因此,應(yīng)用軟件技術(shù)對無用信息進行有效的分離與篩選,以實現(xiàn)有價值的信息整合,以保證后續(xù)的軟件工程的順利進行。2.3代碼數(shù)據(jù)挖掘技術(shù)編碼提取方法主要包括兩大部分:編碼提取和復(fù)制編碼確認。代碼搜索必須以使用者所接受的關(guān)鍵字為主要輸入,然后再輸入對應(yīng)的關(guān)鍵字,再將其傳送至段代碼使用者。在此基礎(chǔ)上,搜索引擎的代碼段可以把注解和代碼看作是文字,并在代碼基礎(chǔ)上按照程序的特征進行搜索,最終以獲得文件的信息為主要目的,對整個工作流程進行優(yōu)化。大部分編程語言都要包含函式與變數(shù),并著重指出標(biāo)簽在易讀性上的重要作用。但需要注意的是,編程不一致在實際應(yīng)用中經(jīng)常發(fā)生,這對返回正確的結(jié)果有一定的影響,因此,在實踐中,我們需要充分利用數(shù)據(jù)挖掘技術(shù)的優(yōu)勢,以便獲得代碼檢索過程的準(zhǔn)確特征,并使后續(xù)用戶更容易使用。此外,我們還需要改進Keys搜索理解應(yīng)用程序,使用Keys準(zhǔn)確表達程序,提高軟件開發(fā)水平。在克隆碼檢測方面,和以前的代碼檢索方法很類似,都是基于代碼本身來描述整個程序的行為,在使用的時候,需要輸入一個已經(jīng)知道的行為代碼,然后復(fù)制代碼檢測就會給出類似于代碼的信息,從而可以對類似的代碼進行描述。利用克隆碼檢測技術(shù),可以使數(shù)據(jù)挖掘技術(shù)的優(yōu)點得到最大限度地優(yōu)化整個開發(fā)流程,從而使軟件的開發(fā)效率和質(zhì)量得到進一步的提升。2.4數(shù)據(jù)挖掘技術(shù)在軟件故障中的應(yīng)用隨著社會信息化程度的不斷加深,數(shù)據(jù)挖掘技術(shù)的應(yīng)用將會更加的廣泛。在實際應(yīng)用中,還應(yīng)對數(shù)據(jù)的執(zhí)行進行描述和記錄,并對其進行識別,以增強后續(xù)工作的針對性。在數(shù)據(jù)挖掘的過程中,要明確挖掘?qū)ο螅@得可追蹤和可理解的信息,從而使問題處理能力得到最大程度的提高。同時,我們也要意識到,很多的挖掘工具都必須在自動化和管理的基礎(chǔ)上,才能更好地運用數(shù)據(jù)挖掘技術(shù),同時也要防止因為種種原因給軟件帶來的影響。在實際應(yīng)用中,對軟件的運行軌跡進行抽象定位,并進行對比驗證,最后確定故障的位置,提高故障診斷的效率和精確度。2.5主要應(yīng)用方法軟件工程數(shù)據(jù)挖掘技術(shù)在應(yīng)用時,雖然已經(jīng)逐漸展開了數(shù)據(jù)框架的構(gòu)建和利用,但是在實踐中還有很多方面的內(nèi)容需要不斷完善和優(yōu)化。因此,必須要加強對軟件開發(fā)和維護方面的合理應(yīng)用,將數(shù)據(jù)挖掘技術(shù)在其中的應(yīng)用價值充分發(fā)揮出來,這樣才能夠推動其長遠穩(wěn)定的發(fā)展。第一,可以通過相關(guān)方法改進數(shù)據(jù)收集模型。該方法可以在日常開發(fā)過程中發(fā)現(xiàn)大量數(shù)據(jù)之間的聯(lián)系,從而為以后的軟件開發(fā)提供重要的基礎(chǔ)。第二,分組法,將目標(biāo)數(shù)據(jù)劃分為不同類別,以實現(xiàn)同一數(shù)據(jù)類別中的可比性。不同類型的目標(biāo)有明顯的差別,并針對實際問題進行分析,以提高數(shù)據(jù)整合的效率。第三,歸類。運算方式主要是用離散的數(shù)值和類別編號。首先要建立相應(yīng)的數(shù)學(xué)模型,并將其歸類為概念,從而實現(xiàn)數(shù)學(xué)建模,提高軟件的開發(fā)速度。從本質(zhì)上講,基因演算法是基于生物的自然選擇與隨機基因的概率來進行日常的運算,是目前數(shù)據(jù)抽取技術(shù)中最常見的一種。結(jié)論綜上所述,將數(shù)據(jù)挖掘技術(shù)引入到軟件開發(fā)中,會使數(shù)據(jù)挖掘更加簡便,從而促進軟件的可持續(xù)發(fā)展。在程序代碼中引入了數(shù)據(jù)挖掘技術(shù),可以有效地提高程序代碼的重現(xiàn)性。該方法能在故障診斷中加入兩種不同的頻率,并能確保故障的正確識別。Reference:[1]鄧朗妮.基于數(shù)據(jù)挖掘技術(shù)的BIM學(xué)術(shù)熱點與學(xué)術(shù)趨勢分析方法研究[A].中國圖學(xué)學(xué)會土木工程圖學(xué)分會.第六屆BIM技術(shù)國際交流會——數(shù)字建造在地產(chǎn)、設(shè)計、施工領(lǐng)域應(yīng)用與發(fā)展論文集[C].中國圖學(xué)學(xué)會土木工程圖學(xué)分會:《土木建筑工程信息技術(shù)》編輯部,2019:10.[2]陳小峰.電力潛在敏感客戶預(yù)測的大數(shù)據(jù)方法應(yīng)用[A].中國電機工程學(xué)會電力信息化專業(yè)委員會.生態(tài)互聯(lián)數(shù)字電力——2019電力行業(yè)信息化年會論文集[C].中國電機工程學(xué)會電力信息化專業(yè)委員會:人民郵電出版社電信科學(xué)編輯部,2019:1.[3]王祥順.數(shù)據(jù)挖掘技術(shù)在軟件工程中的實踐與

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論