下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、淺析數(shù)據(jù)挖掘技術(shù)在軟件工程中的運(yùn)用0引言隨著我國(guó)信息技術(shù)的進(jìn)步,數(shù)據(jù)挖掘技術(shù)得到廣泛應(yīng)用,在軟件工程中需要對(duì)數(shù)據(jù)信息 進(jìn)行搜集、分類(lèi)與整理,通過(guò)數(shù)據(jù)挖掘技術(shù)的應(yīng)用可以有效提高工作效率,推動(dòng)軟件工程的 有序發(fā)展。我國(guó)對(duì)數(shù)據(jù)挖掘技術(shù)的應(yīng)用與研究雖然處于初級(jí)階段,但通過(guò)不斷的經(jīng)驗(yàn)積累也 能夠發(fā)揮技術(shù)的更多價(jià)值。1數(shù)據(jù)挖掘技術(shù)概述數(shù)據(jù)挖掘技術(shù)指的是在信息技術(shù)發(fā)展背景下,對(duì)信息數(shù)據(jù)展開(kāi)處理的技術(shù)。與過(guò)去的信 息處理技術(shù)相比,數(shù)據(jù)挖掘技術(shù)功能更加強(qiáng)大,可以應(yīng)用在各個(gè)領(lǐng)域,無(wú)論是數(shù)據(jù)處理、數(shù) 據(jù)轉(zhuǎn)換還是數(shù)據(jù)分析.都能夠完成相互之間的聯(lián)系,并對(duì)數(shù)據(jù)進(jìn)行最終評(píng)估。將數(shù)據(jù)挖掘技 術(shù)應(yīng)用在軟件工程中.能夠提高企業(yè)處
2、理信息數(shù)據(jù)的效率,避免操作失誤,保護(hù)企業(yè)數(shù)據(jù)準(zhǔn) 確。2數(shù)據(jù)挖掘技術(shù)在軟件工程中的重要性分析2. 1高效整合多樣化信息數(shù)據(jù)由于數(shù)據(jù)挖掘技術(shù)的功能比較多,其中包含了傳統(tǒng)處理技術(shù)的功能,實(shí)現(xiàn)多樣化信息的 收集與分類(lèi),并將數(shù)據(jù)按照類(lèi)別存儲(chǔ)與整理。數(shù)據(jù)挖掘技術(shù)可以在多樣化數(shù)據(jù)中實(shí)現(xiàn)數(shù)據(jù)的 系統(tǒng)化管理,為人們進(jìn)行數(shù)據(jù)查閱工作帶來(lái)方便。在軟件工程中應(yīng)用該技術(shù),方便信息數(shù)據(jù) 的高效整合,幫助企業(yè)全方位了解信息與數(shù)據(jù)2。2. 2保證信息數(shù)據(jù)的準(zhǔn)確率數(shù)據(jù)挖掘技術(shù)擁有強(qiáng)大數(shù)據(jù)運(yùn)算功能,以往的數(shù)據(jù)信息系統(tǒng)運(yùn)算數(shù)據(jù)時(shí)需要耗費(fèi)大量時(shí) 間與成本。如果信息數(shù)據(jù)體系龐大,系統(tǒng)運(yùn)算時(shí)會(huì)而臨癱瘓問(wèn)題。在軟件工程中,一旦系統(tǒng) 發(fā)生癱
3、瘓,系統(tǒng)將無(wú)法正常使用,數(shù)據(jù)也會(huì)受到破壞。應(yīng)用數(shù)據(jù)挖掘技術(shù)之后可以有效解決 以上問(wèn)題,實(shí)現(xiàn)系統(tǒng)的優(yōu)化,使系統(tǒng)可以在最短時(shí)間內(nèi)處理數(shù)據(jù),防止信息數(shù)據(jù)發(fā)生丟失現(xiàn) 象,提高數(shù)據(jù)處理的時(shí)效性。面對(duì)大量的信息數(shù)據(jù),有的數(shù)據(jù)得不到利用,但長(zhǎng)期處于系統(tǒng) 中會(huì)影響系統(tǒng)運(yùn)行效率,應(yīng)用數(shù)據(jù)挖掘技術(shù)可以將無(wú)價(jià)值的數(shù)據(jù)剔除,留下有用的信息數(shù)據(jù), 保證系統(tǒng)的運(yùn)行效率和數(shù)據(jù)質(zhì)量。2. 3縮短信息數(shù)據(jù)處理時(shí)間在軟件工程中應(yīng)用數(shù)據(jù)挖掘技術(shù)可以分類(lèi)處理雜亂無(wú)章的數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)的轉(zhuǎn)換與調(diào)用。 對(duì)數(shù)據(jù)進(jìn)行深入挖掘處理時(shí)也可以應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行數(shù)據(jù)的分類(lèi),并對(duì)模糊數(shù)據(jù)及時(shí)清 理,提高系統(tǒng)內(nèi)現(xiàn)存數(shù)據(jù)的實(shí)用價(jià)值。人們獲取到的信息數(shù)據(jù)需
4、要進(jìn)行反復(fù)核對(duì),以此保證 數(shù)據(jù)真實(shí)性,通過(guò)數(shù)據(jù)挖掘技術(shù)的應(yīng)用減少時(shí)間浪費(fèi),提高數(shù)據(jù)核對(duì)效率。3數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析3. 1系統(tǒng)結(jié)構(gòu)數(shù)據(jù)挖掘技術(shù)應(yīng)用流程主要分為三個(gè)階段:數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、模式評(píng)估與知識(shí)表 示。在數(shù)據(jù)預(yù)處理階段中,高效得到原始數(shù)據(jù)的根本原因在于確定任務(wù)處理對(duì)象,得到符合 軟件工程需求的數(shù)據(jù)。通過(guò)數(shù)據(jù)清洗彌補(bǔ)原始數(shù)據(jù)存在的缺陷,確保數(shù)據(jù)的完整性。數(shù)據(jù)抽 取需要從數(shù)據(jù)庫(kù)中選擇與軟件工程任務(wù)相符合的信息。數(shù)據(jù)轉(zhuǎn)換需要將數(shù)據(jù)格式加以轉(zhuǎn)化, 實(shí)現(xiàn)數(shù)據(jù)的適用性。在數(shù)據(jù)挖掘中需要制定一定的挖掘任務(wù),通過(guò)對(duì)數(shù)據(jù)的分類(lèi)與評(píng)價(jià)總結(jié), 合理應(yīng)用運(yùn)算方法進(jìn)行數(shù)據(jù)推敲。在模式評(píng)估與知識(shí)表
5、示中,其實(shí)際用途在于挖掘成功的表 達(dá),將興趣度作為衡量標(biāo)準(zhǔn),提高數(shù)據(jù)表達(dá)的識(shí)別能力。針對(duì)軟件工程中數(shù)據(jù)挖掘技術(shù)的優(yōu)化應(yīng)用,可以從系統(tǒng)結(jié)構(gòu)方面入手,具體如下:(1) 檢測(cè)軟件工程中的克隆代碼。以軟件工程為標(biāo)準(zhǔn),將一部分代碼復(fù)制,結(jié)合實(shí)際情況更改一 部分代碼,并對(duì)這些代碼進(jìn)行檢測(cè),代碼檢測(cè)與更改可以同時(shí)進(jìn)行,能有效提高檢測(cè)效率, 實(shí)現(xiàn)系統(tǒng)的維護(hù)工作。當(dāng)前應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行克隆代碼檢測(cè)的方式一共有四種,具體為 比較標(biāo)識(shí)符、對(duì)比文本、檢測(cè)系統(tǒng)程序結(jié)構(gòu)與度量圈。在實(shí)際操作中,要求人們結(jié)合實(shí)際情 況選擇相應(yīng)的克隆代碼檢測(cè)方法。(2)數(shù)據(jù)信息挖掘法。這是以橫切關(guān)注點(diǎn)為主的挖掘方法, 在軟件工程中應(yīng)用該方法
6、可以改造系統(tǒng),對(duì)數(shù)據(jù)信息達(dá)到良好的處理效果3.3. 2軟件管理為了讓數(shù)據(jù)挖掘技術(shù)更好地應(yīng)用在軟件工程中,需要從軟件管理角度入手,采用以下兩 方面舉措。一方面,深入挖掘數(shù)據(jù)的組織關(guān)系,另一方面,挖掘版本控制信息。軟件工程系 統(tǒng)比較繁瑣,挖掘組織關(guān)系時(shí)較為困難,人們需要合理調(diào)配各項(xiàng)信息,以此作為挖掘的依據(jù)。 如果以軟件工程管理流程作為主題,對(duì)電子郵件與共享文件展開(kāi)組織關(guān)系挖掘,可以有效避 免系統(tǒng)流程發(fā)生混亂,保護(hù)軟件管理的秩序。當(dāng)信息數(shù)據(jù)發(fā)生變化時(shí),應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn) 行軟件管理,將版本控制作為重要依據(jù),將數(shù)據(jù)挖掘技術(shù)與版本控制相聯(lián)系,降低系統(tǒng)運(yùn)行 成本,并達(dá)到警示的效果,提高軟件工程的管理水平。
7、3. 3軟件開(kāi)發(fā)在軟件工程初期階段,人們將數(shù)據(jù)挖掘技術(shù)看成數(shù)據(jù)庫(kù),隨著技術(shù)的發(fā)展,軟件工程發(fā) 展到現(xiàn)實(shí)應(yīng)用,系統(tǒng)和現(xiàn)實(shí)共同發(fā)展。軟件工程將各項(xiàng)指標(biāo)與要求緊密結(jié)合,研發(fā)出最新產(chǎn) 品,以往的軟件工程中軟件開(kāi)發(fā)十分困難,而如今應(yīng)用數(shù)據(jù)挖掘技術(shù),可以將其與數(shù)據(jù)庫(kù)相 融合,發(fā)揮數(shù)據(jù)庫(kù)內(nèi)信息的最大價(jià)值,有效推動(dòng)軟件開(kāi)發(fā)的進(jìn)步。不僅如此,軟件工程可以 對(duì)信息進(jìn)行更深層次的挖掘,充分發(fā)揮軟件工程的價(jià)值,利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)數(shù)據(jù)的更新, 保證軟件開(kāi)發(fā)質(zhì)量,優(yōu)化軟件操作流程。在技術(shù)的支持下,人們可以合理劃分軟件內(nèi)部,方 便及時(shí)發(fā)現(xiàn)問(wèn)題,并展開(kāi)積極有效的問(wèn)題處理。利用數(shù)據(jù)挖掘技術(shù)可以進(jìn)行網(wǎng)站設(shè)計(jì),對(duì)網(wǎng) 站內(nèi)容進(jìn)行挖
8、掘,特別是對(duì)文本內(nèi)容的挖掘,隨后整合網(wǎng)站信息,通過(guò)自動(dòng)歸類(lèi)技術(shù)實(shí)現(xiàn)信 息的層次性組織。在軟件或網(wǎng)站管理中,應(yīng)用數(shù)據(jù)挖掘技術(shù)可以根據(jù)用戶對(duì)網(wǎng)站的訪問(wèn)記錄, 進(jìn)行記錄信息挖掘,從中了解用戶對(duì)該網(wǎng)站內(nèi)容的興趣,進(jìn)而對(duì)用戶提供信息推送服務(wù)和定 制服務(wù),以此吸引更多用戶訪問(wèn)該網(wǎng)站。在軟件開(kāi)發(fā)階段,可以使用DataAnalytics輕量級(jí)業(yè)務(wù)數(shù)據(jù)可視化分析平臺(tái),這是數(shù)據(jù)挖掘技術(shù)的一項(xiàng)成果。該平臺(tái)能夠?qū)崿F(xiàn)異構(gòu)數(shù)據(jù)源的高效整合,可以兼容各種數(shù)據(jù)源類(lèi)型, 支持海量數(shù)據(jù)??山尤隕xcel/CSV等數(shù)據(jù)文件、企業(yè)各種業(yè)務(wù)系統(tǒng)、第三方互聯(lián)網(wǎng)數(shù)據(jù)、公 共數(shù)據(jù)服務(wù)平臺(tái)等來(lái)源,輕松整合所有相關(guān)業(yè)務(wù)數(shù)據(jù),幫助企業(yè)消滅數(shù)據(jù)孤島
9、。企業(yè)利用該 平臺(tái)可以完成數(shù)據(jù)的深度交互分析,DataAnalytics基于探索式分析,支持智能推薦圖形與 圖表,二者可以協(xié)同過(guò)濾,幫助用戶快速定位,通過(guò)數(shù)據(jù)挖掘找出問(wèn)題,以拖拽式操作方法 解決問(wèn)題。3. 4聚類(lèi)在數(shù)據(jù)挖掘技術(shù)中聚類(lèi)指的是對(duì)各個(gè)環(huán)節(jié)數(shù)據(jù)加以分析,結(jié)合軟件工程的具體要求實(shí)現(xiàn) 數(shù)據(jù)細(xì)化,以類(lèi)型細(xì)化作為基礎(chǔ),為原始數(shù)據(jù)類(lèi)型做出保障。通過(guò)聚類(lèi)可以讓同種類(lèi)型數(shù)據(jù) 具有相似性特點(diǎn),在存在相似性的同時(shí),也存在一定的差異,突出各自的特點(diǎn)。應(yīng)用數(shù)據(jù)挖 掘技術(shù)實(shí)現(xiàn)聚類(lèi)劃分時(shí),而對(duì)的對(duì)象無(wú)法預(yù)測(cè),與其他算法相比,聚類(lèi)擁有更加廣泛的應(yīng)用 范圍,進(jìn)行數(shù)據(jù)分析時(shí)更加獨(dú)特,挖掘信息數(shù)據(jù)時(shí)可以確保檢測(cè)結(jié)果的有效性與真實(shí)性。4結(jié)論總而言之,隨著信息技術(shù)的深入發(fā)展,人們已經(jīng)步入信息時(shí)代,數(shù)據(jù)挖掘技術(shù)也成為對(duì) 信息數(shù)據(jù)展開(kāi)處理和存儲(chǔ)的有效方式。在軟件工程中應(yīng)用數(shù)據(jù)挖掘技術(shù),有利于提高軟件開(kāi) 發(fā)效率,提升軟件管理質(zhì)量,加強(qiáng)數(shù)據(jù)挖掘力度,使數(shù)據(jù)挖掘技術(shù)發(fā)揮巨大效果,人們可以 應(yīng)用數(shù)據(jù)挖掘技術(shù)完成數(shù)據(jù)的聚類(lèi)和網(wǎng)站設(shè)計(jì),為人們的生活帶來(lái)便利。參考文獻(xiàn):1
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度禮品包裝設(shè)計(jì)創(chuàng)意授權(quán)合同
- 軟件公司裝修監(jiān)理合同要求
- 企業(yè)級(jí)云計(jì)算服務(wù)解決方案設(shè)計(jì)與實(shí)施
- 粉煤灰銷(xiāo)售合同
- 架子工安全施工的協(xié)議書(shū)
- 農(nóng)產(chǎn)品質(zhì)量安全追溯系統(tǒng)建設(shè)與合作協(xié)議
- 農(nóng)業(yè)綜合開(kāi)發(fā)工作指南與規(guī)范
- 化學(xué)品運(yùn)輸合同
- 三農(nóng)村社區(qū)信息化建設(shè)與管理規(guī)范
- 公共衛(wèi)生與防疫服務(wù)作業(yè)指導(dǎo)書(shū)
- GB/T 26189.2-2024工作場(chǎng)所照明第2部分:室外作業(yè)場(chǎng)所的安全保障照明要求
- 2025年中國(guó)水解聚馬來(lái)酸酐市場(chǎng)調(diào)查研究報(bào)告
- 高考百日誓師動(dòng)員大會(huì)
- 2024年北京東城社區(qū)工作者招聘筆試真題
- 2024新人教版初中英語(yǔ)單詞表默寫(xiě)版(七~九年級(jí))
- 七上 U2 過(guò)關(guān)單 (答案版)
- 五年級(jí)上冊(cè)小數(shù)遞等式計(jì)算200道及答案
- 杭州市主城區(qū)聲環(huán)境功能區(qū)劃分圖
- 新概念英語(yǔ)第二冊(cè)1-Lesson29(共127張PPT)課件
- 膨化魚(yú)料生產(chǎn)工藝
- EN1779-歐洲無(wú)損檢測(cè)標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論