


下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、軟件工程中數(shù)據(jù)挖掘技術的應用摘要:近期來,數(shù)據(jù)挖掘技術在軟件項目中產(chǎn)生的作用更不能忽略,筆者關鍵從程序代碼以及結構層面對數(shù)據(jù)挖掘技術的使用做了研討,而且亦對面向程序實施記錄層面的挖掘開展了研究。關鍵詞:軟件項目;數(shù)據(jù)挖掘技術;使用作者概述:鄭健1980-,男,上海市人。碩士研究生畢業(yè)?,F(xiàn)為上海同濟大學電子與信息項目學校項目師。探究方向為計算機技術使用信息技術成為新世紀的明顯特點,很多涵蓋到各行各業(yè),軟件軟件工程亦在持續(xù)版本提高,總量日漸增大,其創(chuàng)新建立亦更復雜。原本存在的直覺型處理模式已經(jīng)漸漸適應不了項目中的進程、活動以及對象等的控制與管理層面的進步要求。這個時候數(shù)據(jù)挖掘技術的產(chǎn)生,給軟件項目
2、帶來了進步的重要機遇。1關于程序代碼及結構層面的挖掘1.1克隆代碼檢測的辦法克隆代碼現(xiàn)實上指以復用如此的意圖為根本原理的情形下開展拷貝、粘貼的代碼段,并且偶爾也是會對局部代碼開展修正,往往情形下,可能會有在軟件軟件工程里面占有代碼的總數(shù)量的百分之七到百分之二十三。其實關于其檢測是旨在避免故障的拷貝傳播如此的不利情形發(fā)生,同時對其檢測還能對軟件開展演化這個進程里起到不錯的保養(yǎng)作用,大致上能說克隆代碼檢測如此的存在已經(jīng)是軟件項目這個大專業(yè)范圍中最先時的數(shù)據(jù)挖掘要求,當前大略能整理出四中比照常用的辦法和路徑,依次為立足于文本比擬、標識符比擬、度量、程序結構的辦法。其第一立足于文本比擬如此的一個辦法和
3、路徑,它關鍵是結合程序代碼中的假設干語句經(jīng)過比擬進而分辨,而其對后期的一個完善,這是運用運用假設干技術或伎倆把字符串的匹配速度和效果給提高上來,示例說能使用Hash函數(shù)如此的一項技術用以提高字符串匹配速度和效果,同時運用與其函數(shù)技術總體應的Duploe如此的伎倆給予輔助。其二那么是根本原理標識符比擬如此的一個辦法和路徑,示例比照通用的一個方法就是在構造分詞建立標識符序列前綴樹實現(xiàn)的情形下在開展比擬,與此類辦法和路徑總體應的有CCFinder或者Dup等等伎倆。第三種以及第四種辦法和路徑依次是立足于度量的辦法與立足于程序結構表示的辦法,這兩種辦法依次對應的伎倆是CLAN與GPLAG、Duplix
4、等等。當然除了這四中比照常用的辦法,還有其它的辦法和路徑,示例頻繁項集或潛在語義索引LSI等等。1.2Aspect挖掘軟件創(chuàng)新建立的關鍵意圖是旨在處理好程序注意點之間關于散列還有其纏結這兩層面產(chǎn)生的問題而提出的新程序創(chuàng)新建立范型。Aspect挖掘與重構是實現(xiàn)遺留軟件工程改導致面向層面軟件而需要要處理好的重要問題。原有的克隆代碼檢測技術因其某個注意點時不時在程序中呈現(xiàn)出相同或者是相近的代碼段而依然作為橫切注意點挖掘的切實處理好渠道。橫切注意點挖掘亦就是常說的Aspect挖掘。結合假設干結合性比照強的假設干辦法,示例立足于度量剖析或者是形式概念剖析等等這類總體而言具有很強結合的方法。使用如此算法而
5、得出的橫切代碼候選集往往情形下都有點大,所以亦能說在候選集輔導下開展面向層面的重構怎么開展是比照難的問題。現(xiàn)實上數(shù)據(jù)挖掘技術還能在很多層面產(chǎn)生不錯的影響。1.3代碼檢索在軟件創(chuàng)新建立辦法律中提倡著復用這個重要的標準,近期來有一個軟件復用這層面專業(yè)范圍里的很重重要的議題,亦就是關于在本地或者是面向WEB這些代碼庫中檢索出合乎目前項目工程的代碼之類的議題,已經(jīng)產(chǎn)生了幾種比照有代代表性的辦法和路徑,示例類別存在和貯存并檢索、立足于輸入-輸出映射的檢索、立足于構件形式化描述、立足于代碼相仿性等等辦法,這些辦法和路徑關鍵會關系到到有關于聚類、類別、語義剖析等等幾種比照關鍵的技術。因為其Web的使用范圍持
6、續(xù)的擴大,亦就不再單單只有文件在其中,還有很多猶如GoogleCod以及Mica等等類型的代碼檢索引擎亦伴著那些Web中的可供參考的代碼而產(chǎn)生。2關于面向程序實施記錄層面的挖掘2.1程序規(guī)約層面的挖掘把程序的實施跟進開展剖析后而知曉程序代碼展現(xiàn)出來的合同亦就是常說的程序規(guī)約挖掘。它現(xiàn)實上亦就是按照實施跟進信息二開展的逆向建模,不但關于程序理解的實行會產(chǎn)生不錯的效果,同時關于其程序檢驗以及程序保養(yǎng)的實行亦有著不錯的效果。此類挖掘的進程往往是先對總需剖析的軟件工程做一個初步的插裝,做了之后還總需把軟件對API亦或是大致模塊的提取和使用以及軟件工程狀態(tài)變量的值作出記錄。其次在對這些記錄下來的信息開展
7、一個必要的過濾以及聚類還有約筒,進而亦就能建立規(guī)約。從其總量的形式層面開展剖析,目前有兩類規(guī)約挖掘的辦法,即立足于自行機的規(guī)約挖掘辦法和立足于標準的規(guī)約挖掘辦法。2.2故障定位在現(xiàn)實測評這類型的活動中往往情形下假設是要確保其測評涵蓋的完全性,都總需使用很多測評用例開展測評,如此一來就很有可能使得能讓程序失效的用例數(shù)量比照可觀,進而假設是總需用時較短的的情形下綜合找到接下來程序診斷進程里的故障亦就顯得很有困難性,單單是調(diào)試人員的人工查看是很難超過要求的,故而,這個時候與數(shù)據(jù)挖掘技術相結合,就能比照容易的適應預期的效果。往往情形下程序面臨的數(shù)次生效狀況亦有可能是同樣一個故障而引出的。故而亦就能非簡
8、潔對其開展聚類,如此一來亦就避免了對各次生效都開展調(diào)試。目前Dickinson與Podgurski已經(jīng)先于其它人提出了關于程序失效這層面能用聚類到達對調(diào)試代價減少的如此具有科學性的思想。而毛澄映那局部人那么采用了相異性度量完善等類型的辦法和路徑讓聚類的精度得以提高。在這之后,還產(chǎn)生了某些探究者運用對函數(shù)提取和使用對等以及返回值與程序失效之間的關聯(lián)信息開展剖析而到達對故障的定位。總體而言比照以往的一個故障定位技術就有程序切片此類技術,只是還有很多的保養(yǎng)人員關于比照大型的復雜軟件工程類型的切片成果開展理解時往往都會比照有難度軟件工程。3結論因為其軟件項目中產(chǎn)生的各種各類困難,數(shù)據(jù)挖掘技術的產(chǎn)生在最大限度上提升了軟件項目中的假設干問題,故而只有持續(xù)加深對數(shù)據(jù)挖掘技術在軟件項目中的使用探究,才有利于更加推動軟件項目的進步與發(fā)展。參考文獻
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年個體住宅建設合同模板
- 2025屆湖南省岳陽市高三下學期質(zhì)量監(jiān)測(二)語文試題及答案
- 2025工程設備采購合同范文
- 協(xié)議離婚可以委托
- 2025年金華從業(yè)資格證貨運模擬考試下載
- 2025年山東貨運從業(yè)資格考試模擬考試題目及答案
- 2025年貨運道路資格證考試模擬考試題
- 農(nóng)產(chǎn)品電子商務銷售合作協(xié)議書
- 通信工程中的信號處理技術試題及答案
- 錫山區(qū)電梯安全管理人員勝任力評估真題卷和答案
- 小學奧數(shù)等差數(shù)列經(jīng)典練習題
- 2024年江蘇省常州市中考一模英語試卷(含答案解析)
- 2024年福建省中考歷史試卷(含標準答案及解析)
- 人教版四年級下冊音樂《唱山歌》教學設計
- 車輛維修免責協(xié)議書范本
- 2024醫(yī)療設備器械試用協(xié)議書
- 甘肅省武威第七中學2023-2024學年八年級下學期期中考試英語試題
- ASME材料-設計許用應力
- 采用SF6N2混合氣體絕緣的GIS母線和GIL應用導則
- MOOC 家具史-南京林業(yè)大學 中國大學慕課答案
- 大學生心理健康知識競賽題庫及答案(174題)
評論
0/150
提交評論