數(shù)據(jù)挖掘方向【開題報告】_第1頁
數(shù)據(jù)挖掘方向【開題報告】_第2頁
數(shù)據(jù)挖掘方向【開題報告】_第3頁
數(shù)據(jù)挖掘方向【開題報告】_第4頁
免費預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

開題報告.研究(設(shè)計)目的意義及國內(nèi)外研究狀況和應(yīng)用前景(附參考文獻(xiàn)):研究(設(shè)計)目的意義隨著我國經(jīng)濟(jì)的快速發(fā)展,各行各業(yè)的信息量正呈現(xiàn)爆發(fā)性增長趨勢,其中極具代表性的是數(shù)據(jù)量以50%以上的年成長量不斷刷新紀(jì)錄。為了應(yīng)對數(shù)據(jù)成長的壓力,人們需要更多的技術(shù)與產(chǎn)品來滿足數(shù)據(jù)成長的需要。而數(shù)據(jù)挖掘技術(shù)恰恰能做到這一點。近年來,隨著計算機(jī)技術(shù)、信息技術(shù)的飛速發(fā)展,生活中涌現(xiàn)眾多的各種形式的數(shù)據(jù),我們采用多種方式整理以及儲存。而數(shù)據(jù)的大量增長采用普通的數(shù)據(jù)統(tǒng)計方式難以滿足大數(shù)據(jù)的收集以及整理需求,數(shù)據(jù)庫能夠?qū)?shù)據(jù)進(jìn)行統(tǒng)計、查詢以及錄入等作用,然而數(shù)據(jù)之間的關(guān)系以及數(shù)據(jù)內(nèi)部存在的規(guī)律,甚至于數(shù)據(jù)未來的發(fā)展趨勢,采用數(shù)據(jù)庫難以進(jìn)行預(yù)測以及提取?,F(xiàn)實生活中爆炸式的大數(shù)據(jù)采用傳統(tǒng)的數(shù)據(jù)統(tǒng)計方式難以達(dá)到預(yù)期目的,因而,人們急需一種新型技術(shù)或者數(shù)據(jù)整理工具,從而協(xié)助人們從大量的數(shù)據(jù)信息當(dāng)中找到自己最感興趣的信息或者總結(jié)出對自己有益的規(guī)律,數(shù)據(jù)挖掘技術(shù)應(yīng)運而生。數(shù)據(jù)挖掘是一門新型的、發(fā)展快而形成成熟的學(xué)科,其又被稱之為數(shù)據(jù)信息當(dāng)中的知識發(fā)現(xiàn),其主要過程是采用某種科學(xué)的方法或知識,在大量的數(shù)據(jù)信息當(dāng)中找出數(shù)據(jù)內(nèi)在的規(guī)律以及聯(lián)系,從而進(jìn)行數(shù)據(jù)分析獲得對人們有益的內(nèi)在信息,按照不同的情形構(gòu)建不同的數(shù)據(jù)挖掘模型,并且獲得所需的知識。同時,挖掘出的這些隱藏的信息作為決策者的決策依據(jù),成為決策者策略的制定的重要依據(jù)。數(shù)據(jù)挖掘為一門綜合性的學(xué)科,其綜合采用數(shù)據(jù)可視化、高性能計算、智能技術(shù)、模式識別技術(shù)、數(shù)據(jù)庫存儲技術(shù)、網(wǎng)絡(luò)技術(shù)等多個領(lǐng)域的知識完善其自身的知識范疇。通過數(shù)據(jù)挖掘形成的信息以及數(shù)據(jù)廣泛應(yīng)用在科學(xué)研究、商務(wù)決策及其電子商務(wù)等各個領(lǐng)域,除此之外計算機(jī)網(wǎng)絡(luò)、銀行業(yè)務(wù)、金融等各個領(lǐng)域得到推廣。數(shù)據(jù)挖掘不同于數(shù)據(jù)庫系統(tǒng)的簡單統(tǒng)計、查詢功能,其通過一定的算法將數(shù)據(jù)當(dāng)中內(nèi)在的規(guī)律或模式找出,將有使用價值的模式當(dāng)作處理實際問題的參考依據(jù)或者決策依據(jù),同時采用現(xiàn)有的信息或知識預(yù)測對象的發(fā)展趨勢。本文以礦井人員為源數(shù)據(jù)。球員數(shù)據(jù)當(dāng)中包含眾多的數(shù)據(jù),通過對該類數(shù)據(jù)進(jìn)行聚類分析。這些數(shù)據(jù)中記錄了幾十次的數(shù)據(jù)調(diào)用,其中考慮了下面不同的因素:姓名、身高、體重、所屬班組、所屬工種、職務(wù)、本人照片、血型等因素,因此可以基本滿足完備性的要求。國內(nèi)外研究狀況數(shù)據(jù)挖掘技術(shù)使得在大量數(shù)據(jù)中找出有價值的內(nèi)在的規(guī)律以及知識成為現(xiàn)實,當(dāng)前國內(nèi)外眾多學(xué)者從事該數(shù)據(jù)挖掘技術(shù)的研究,國外較為成功的有R.Aggrawal所帶領(lǐng)的IBMAlmaden實驗室,加拿大SimonFraster大學(xué)成立的KDD課題研究小組,其研究了多種數(shù)據(jù)挖掘算法,在各個行業(yè)取得了較為成功的應(yīng)用,同時也吸引了眾多的商業(yè)機(jī)構(gòu)以及研究學(xué)者開展數(shù)據(jù)挖掘技術(shù)的研究,同時也涌現(xiàn)出各種類型的數(shù)據(jù)挖掘系統(tǒng),并且成功的在金融、經(jīng)濟(jì)、商業(yè)等行業(yè)取得成功應(yīng)用。近年來,國外數(shù)據(jù)挖掘的研究趨勢主要為數(shù)據(jù)挖掘技術(shù)算法的研究,例如,重點研究了Bayes(貝葉斯)方法和Boosting方法深入研究;數(shù)據(jù)挖掘技術(shù)中融入了傳統(tǒng)的統(tǒng)計學(xué)回歸方法;數(shù)據(jù)庫技術(shù)與數(shù)據(jù)挖掘技術(shù)的緊密融合。數(shù)據(jù)挖掘技術(shù)應(yīng)用方面主要為數(shù)據(jù)挖掘商業(yè)應(yīng)用軟件的逐步完善與提升,重點關(guān)注系統(tǒng)的研究,并非某個點的研究。數(shù)據(jù)挖掘商業(yè)軟件主要應(yīng)用在金融行業(yè)、保險業(yè)務(wù)以及電信業(yè)務(wù)等方面。國外目前著名的計算機(jī)企業(yè)在數(shù)據(jù)挖掘方面投入大量的資源,其中微軟、IBM都成立了該方面的研究中心,并且研制出了類似Platinum、B0以及IBM等數(shù)據(jù)挖掘軟件。通過軟件實現(xiàn)數(shù)據(jù)挖掘是當(dāng)前信息化技術(shù)發(fā)展的結(jié)果,當(dāng)目前為止,數(shù)據(jù)挖掘軟件歷經(jīng)了4個發(fā)展階段。第一個階段的數(shù)據(jù)挖掘程序僅能支持單個或少數(shù)數(shù)據(jù)挖掘算法,其中較為經(jīng)典的數(shù)據(jù)挖掘系統(tǒng)有SalfordSystems研制的CART數(shù)據(jù)挖掘系統(tǒng)。在數(shù)據(jù)信息量巨大,且數(shù)據(jù)變化頻率大的情況下,必須通過運用數(shù)據(jù)倉庫或者數(shù)據(jù)庫系統(tǒng)進(jìn)行統(tǒng)一管理,顯然該階段的數(shù)據(jù)挖掘系統(tǒng)功能不能滿足要求?;诘谝浑A段的數(shù)據(jù)挖掘軟件,通過增添多種挖掘算法,不斷推出了第二階段的數(shù)據(jù)挖掘應(yīng)用程序。該階段的數(shù)據(jù)挖掘軟件集成了數(shù)據(jù)庫管理系統(tǒng),能夠?qū)?shù)據(jù)倉庫以及數(shù)據(jù)庫進(jìn)行支持,可以與其他應(yīng)用軟件進(jìn)行連接,系統(tǒng)擴(kuò)展性較強,其另一個特點為能夠?qū)Υ髷?shù)據(jù)集和復(fù)雜的數(shù)據(jù)集進(jìn)行數(shù)據(jù)挖掘。在此基礎(chǔ)上系統(tǒng)靈活性更強,采用了數(shù)據(jù)挖掘查詢語言以及挖掘模式。其中最為常見的為DBMiner數(shù)據(jù)挖掘系統(tǒng),其能夠采用DMQL數(shù)據(jù)挖掘語言開展數(shù)據(jù)挖掘工作。然而,該階段的數(shù)據(jù)挖掘軟件的缺點在于側(cè)重模型的形成,并且就模型系統(tǒng)的集成形成了第三階段以及第四階段的數(shù)據(jù)挖掘軟件的形成。[1]韓王瑩.基于數(shù)據(jù)挖掘技術(shù)的人力資源信息管理系統(tǒng)設(shè)計[J].電子設(shè)計工程,2015(15):54-56,[2]裴新明.基于數(shù)據(jù)挖掘的人力資源考核系統(tǒng)分析[J],企業(yè)改革與管理,2016(18):57-58.[3]楊帆.基于數(shù)據(jù)挖掘技術(shù)的人力資源信息化管理[J].信息通信,2017(4):152-153.[4]李妹琴.試論人力資源管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用[J].財經(jīng)界:學(xué)術(shù)版,2016(27).[5]徐毅.數(shù)據(jù)挖掘技術(shù)在人力資源管理中的應(yīng)用研究[J].中國市場,2017(32).[6]王琳.基于數(shù)據(jù)挖掘的丫汽車學(xué)院教科研人員管理對策研究[D].大連海事大學(xué),2016.[刀李會欣.數(shù)據(jù)倉庫為中心的人力資源統(tǒng)計信息系統(tǒng)運用探究[J].關(guān)愛明天,2016(5).[8]張金艷.數(shù)據(jù)挖掘在人力資源離職管理中的應(yīng)用——以GST公司為例[D].首都經(jīng)濟(jì)貿(mào)易大學(xué),2016..主要內(nèi)容、研究方法和思路近年來,計算機(jī)網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)庫技術(shù)的不斷發(fā)展,信息數(shù)據(jù)的日益膨脹,在巨大的數(shù)據(jù)信息當(dāng)中找出自身最為關(guān)注的信息已經(jīng)成為當(dāng)前的一個極為重要的研究熱點,在此基礎(chǔ)上數(shù)據(jù)挖掘技術(shù)引起了信息產(chǎn)業(yè)界的極大關(guān)注。聚類分析技術(shù)是一種將數(shù)據(jù)集劃分為多個簇的技術(shù),確保同一個簇中的數(shù)據(jù)特征盡量保持一致,不同簇間的數(shù)據(jù)特征盡量相異的一項技術(shù)。本文分析了數(shù)據(jù)挖掘中的聚類算法類型,闡述了現(xiàn)有聚類算法的性能特點。為驗證改進(jìn)的K-means算法的效果,本文利用JAVA作為開發(fā)語言,以礦井人員統(tǒng)計數(shù)據(jù)為基礎(chǔ),運用基于改進(jìn)的K-means聚類算法,將球員數(shù)據(jù)對象進(jìn)行分類,通過對比分析傳統(tǒng)K-means算法結(jié)果,改進(jìn)后的K-means算法效果更好。前言1數(shù)據(jù)挖掘1.1數(shù)據(jù)挖掘定義L2數(shù)據(jù)挖掘過程2數(shù)據(jù)挖掘中的K-means聚類算法及改進(jìn)K-means算法原理及其聚類過程傳統(tǒng)K-means算法基于平均誤差準(zhǔn)則函數(shù)的k-means算法K-means算法聚類要素及其優(yōu)缺點k-means聚類算法要素分析k-means聚類算法優(yōu)劣勢分析基于初始聚類中心選取的K-means算法改進(jìn)改進(jìn)初始聚類中心的選取基于規(guī)則初始聚類中心的k-means聚類算法對噪聲以及孤立點處理能力的改進(jìn)基于改進(jìn)算法的實驗分析3基于數(shù)據(jù)挖掘技術(shù)的礦井人員管理系統(tǒng)設(shè)計基于改進(jìn)的K-means聚類算法的礦井人員管理系統(tǒng)軟件總體功能結(jié)構(gòu)方案系統(tǒng)軟件實現(xiàn)流程運行界面及結(jié)果分析系統(tǒng)運行情況分析基于改進(jìn)的K-means聚類結(jié)果分析4結(jié)論參考文獻(xiàn)3.總體安排和進(jìn)度(包括階段性工作內(nèi)容及完成日期):2018

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論