數(shù)據(jù)挖掘技術(shù)分析及其應(yīng)用評(píng)價(jià)_第1頁(yè)
數(shù)據(jù)挖掘技術(shù)分析及其應(yīng)用評(píng)價(jià)_第2頁(yè)
數(shù)據(jù)挖掘技術(shù)分析及其應(yīng)用評(píng)價(jià)_第3頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)挖掘技術(shù)分析及其應(yīng)用評(píng)價(jià) 術(shù)多 種進(jìn)行了評(píng)價(jià),并對(duì)研究結(jié)果進(jìn)行了思考。關(guān)鍵詞:數(shù)據(jù)挖掘;技術(shù)分析;應(yīng)用評(píng)價(jià)1 前言 越緊密,從而讓世界經(jīng)濟(jì)、貿(mào)易、政治、教育等多種領(lǐng)域業(yè)務(wù)的發(fā)展都開始受到由先進(jìn)互聯(lián) 這些信息如何獲取、這些數(shù)據(jù)如何挖掘已經(jīng)開始成為當(dāng)代信息收集者所要思考的重要問題。 通過利用數(shù)據(jù)挖掘工具從日?;顒?dòng)、工作、行為當(dāng)中收集信息、匯總信息、整理信息、篩選 信息、分析信息,從而達(dá)到獲取真正有用信息的整個(gè)過程。2 數(shù)據(jù)挖掘技術(shù)分析研究2.1 數(shù)據(jù)挖掘的概念2.2 統(tǒng)計(jì)技術(shù) 模型方式,然后依據(jù)這種假定的分布以及其概率模型進(jìn)行數(shù)據(jù)挖掘。2.3 關(guān)聯(lián)規(guī)則 大魚發(fā)覺問題背后潛在的信息,從而實(shí)現(xiàn)將這

2、種數(shù)據(jù)挖掘技術(shù)切切實(shí)實(shí)的用到實(shí)際當(dāng)中。2.4 基于歷史的分析 所獲得信息的來源再重新整個(gè)對(duì)同一個(gè)問題或者其他領(lǐng)域可以適用的問題進(jìn)行研究。通過這 進(jìn)展。使用這種方法通常尋在著的主要的問題是這些歷史數(shù)據(jù)是否能成為這種問題分析的依 2.5 遺傳算法 制、相互影響、相互變化,并且結(jié)合現(xiàn)有分析方法選擇能夠相互遺傳、相互復(fù)制、影響、變 據(jù)和要素,最終能夠提高整個(gè)樣本的適配比率,讓研究的整個(gè)過程更具有效率。2.6 聚集檢測(cè) 每一個(gè)聚類,數(shù)量一般都是要保持一定比率的,從而保持每個(gè)樣本之間的可比性。最后,通 過比較每一個(gè)聚集之間的數(shù)據(jù)差異就能夠找出最終研究的目標(biāo),從而解決了成本和時(shí)間問題。2.7 連接分析圖論是

3、這種連接分析方法的核心思想,它旨為這種方式找到最為可靠、最為便利的方法, 來 不完美卻能夠?qū)栴}解決的方法。2.8 決策樹分析法 進(jìn)行相乘得到最后的結(jié)果,選擇最大幾率的方法作為這個(gè)問題的能夠最終得到解決的方法。2.9 神經(jīng)網(wǎng)絡(luò)分析法神經(jīng)分析法在其結(jié)構(gòu)上是將一個(gè)神經(jīng)的網(wǎng)絡(luò)組成部分劃分成輸入層和輸出層以及隱含層 一個(gè)隱含層,將其作為一種潛在影響因素,也可以說是誤差變量、影響變量。這個(gè)隱含層的 總層數(shù)以及每層與每層交點(diǎn)之間的個(gè)數(shù)就會(huì)決定整個(gè)神經(jīng)網(wǎng)絡(luò)總體復(fù)雜的程度。2.10 粗糙和模糊集方法這兩種數(shù)據(jù)挖掘的方法都是為了讓數(shù)據(jù)所收集的范圍更加廣泛,通過引入一種模糊性的邊 界,讓整個(gè)數(shù)據(jù)含量更加的充分,

4、從而讓整個(gè)研究過程更加具有科學(xué)性。其具體設(shè)計(jì)的方 進(jìn) 行隨即篩選,為總體目標(biāo)的證明和解釋提供有力的依據(jù)。2.11 回歸分析法 也是在所有領(lǐng)域的實(shí)證研究當(dāng)中都會(huì)用到的,現(xiàn)階段比較規(guī)范性的實(shí)證分析都會(huì)采用線性回 歸和穩(wěn)健性檢驗(yàn)的方式,從而證明數(shù)據(jù)之間的關(guān)系假設(shè)的存在。這種方法易于操作,例如:最簡(jiǎn)單的線性回歸模型就是大眾從小學(xué)學(xué)到的一元一次方程。 2.12 差別分析 數(shù)據(jù),欺詐的數(shù)據(jù)等等這些異常的數(shù)據(jù),通過對(duì)立面問題研究解決正面問題。2.13 概念描述這種方法是一種對(duì)某類對(duì)象的潛在的內(nèi)涵進(jìn)行基本的描述,然后通過概括這類對(duì)象一些明 顯的相關(guān)聯(lián)的特征的方法?,F(xiàn)階段,理論界用到的概念描述可以分為:第一,特征性描述; 在的區(qū)別,從而對(duì)相同類和不同類對(duì)象的整個(gè)對(duì)象集總結(jié)出他們的共性,得到研究結(jié)論。3 數(shù)據(jù)挖掘技術(shù)應(yīng)用評(píng)價(jià) 研究方法當(dāng)中如何選取合適的方法就成為一項(xiàng)技術(shù)是否能發(fā)揮其優(yōu)勢(shì)、一個(gè)問題能否得到有 3.1 數(shù)據(jù)挖掘技術(shù)的應(yīng)用選擇3.2 數(shù)據(jù)挖掘技術(shù)應(yīng)用的思考 種叫做描述型的模式。這些模式又能夠根據(jù)其具有的相關(guān)的功能以及其在實(shí)際運(yùn)用當(dāng)中發(fā)揮 的作用分為以下幾種類別:數(shù)據(jù)分類,數(shù)據(jù)估值,數(shù)據(jù)預(yù)測(cè),變量之間的相關(guān)性分析,變量 式。那么, 正確的方法并不等同于最好的方法,在實(shí)際進(jìn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論