




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、開題報(bào)告1.研究(設(shè)計(jì))目的意義及國內(nèi)外研究狀況和應(yīng)用前景(附參考文獻(xiàn)):研究(設(shè)計(jì))目的意義隨著我國經(jīng)濟(jì)的快速發(fā)展,各行各業(yè)的信息量正呈現(xiàn)爆發(fā)性增長趨勢,其中極具代表性的是數(shù)據(jù)量以50%以上的年成長量不斷刷新紀(jì)錄。為了應(yīng)對數(shù)據(jù)成長的壓力,人們需要更多的技術(shù)與產(chǎn)品來滿足數(shù)據(jù)成長的需要。而數(shù)據(jù)挖掘技術(shù)恰恰能做到這一點(diǎn)。近年來,隨著計(jì)算機(jī)技術(shù)、信息技術(shù)的飛速發(fā)展,生活中涌現(xiàn)眾多的各種形式的數(shù)據(jù),我們采用多種方式整理以及儲(chǔ)存。而數(shù)據(jù)的大量增長采用普通的數(shù)據(jù)統(tǒng)計(jì)方式難以滿足大數(shù)據(jù)的收集以及整理需求,數(shù)據(jù)庫能夠?qū)?shù)據(jù)進(jìn)行統(tǒng)計(jì)、查詢以及錄入等作用,然而數(shù)據(jù)之間的關(guān)系以及數(shù)據(jù)內(nèi)部存在的規(guī)律,甚至于數(shù)據(jù)未來的
2、發(fā)展趨勢,采用數(shù)據(jù)庫難以進(jìn)行預(yù)測以及提取?,F(xiàn)實(shí)生活中爆炸式的大數(shù)據(jù)采用傳統(tǒng)的數(shù)據(jù)統(tǒng)計(jì)方式難以達(dá)到預(yù)期目的,因而,人們急需一種新型技術(shù)或者數(shù)據(jù)整理工具,從而協(xié)助人們從大量的數(shù)據(jù)信息當(dāng)中找到自己最感興趣的信息或者總結(jié)出對自己有益的規(guī)律,數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。數(shù)據(jù)挖掘是一門新型的、發(fā)展快而形成成熟的學(xué)科,其又被稱之為數(shù)據(jù)信息當(dāng)中的知識(shí)發(fā)現(xiàn),其主要過程是采用某種科學(xué)的方法或知識(shí),在大量的數(shù)據(jù)信息當(dāng)中找出數(shù)據(jù)內(nèi)在的規(guī)律以及聯(lián)系,從而進(jìn)行數(shù)據(jù)分析獲得對人們有益的內(nèi)在信息,按照不同的情形構(gòu)建不同的數(shù)據(jù)挖掘模型,并且獲得所需的知識(shí)。同時(shí),挖掘出的這些隱藏的信息作為決策者的決策依據(jù),成為決策者策略的制定的重要依
3、據(jù)。數(shù)據(jù)挖掘?yàn)橐婚T綜合性的學(xué)科,其綜合采用數(shù)據(jù)可視化、高性能計(jì)算、智能技術(shù)、模式識(shí)別技術(shù)、數(shù)據(jù)庫存儲(chǔ)技術(shù)、網(wǎng)絡(luò)技術(shù)等多個(gè)領(lǐng)域的知識(shí)完善其自身的知識(shí)范疇。通過數(shù)據(jù)挖掘形成的信息以及數(shù)據(jù)廣泛應(yīng)用在科學(xué)研究、商務(wù)決策及其電子商務(wù)等各個(gè)領(lǐng)域,除此之外計(jì)算機(jī)網(wǎng)絡(luò)、銀行業(yè)務(wù)、金融等各個(gè)領(lǐng)域得到推廣。數(shù)據(jù)挖掘不同于數(shù)據(jù)庫系統(tǒng)的簡單統(tǒng)計(jì)、查詢功能,其通過一定的算法將數(shù)據(jù)當(dāng)中內(nèi)在的規(guī)律或模式找出,將有使用價(jià)值的模式當(dāng)作處理實(shí)際問題的參考依據(jù)或者決策依據(jù),同時(shí)采用現(xiàn)有的信息或知識(shí)預(yù)測對象的發(fā)展趨勢。本文以礦井人員為源數(shù)據(jù)。球員數(shù)據(jù)當(dāng)中包含眾多的數(shù)據(jù),通過對該類數(shù)據(jù)進(jìn)行聚類分析。這些數(shù)據(jù)中記錄了幾十次的數(shù)據(jù)調(diào)用,其
4、中考慮了下面不同的因素:姓名、身高、體重、所屬班組、所屬工種、職務(wù)、本人照片、血型等因素,因此可以基本滿足完備性的要求。國內(nèi)外研究狀況數(shù)據(jù)挖掘技術(shù)使得在大量數(shù)據(jù)中找出有價(jià)值的內(nèi)在的規(guī)律以及知識(shí)成為現(xiàn)實(shí),當(dāng)前國內(nèi)外眾多學(xué)者從事該數(shù)據(jù)挖掘技術(shù)的研究,國外較為成功的有R.Aggrawal所帶領(lǐng)的IBM Almaden實(shí)驗(yàn)室,加拿大SimonFraster大學(xué)成立的KDD課題研究小組,其研究了多種數(shù)據(jù)挖掘算法,在各個(gè)行業(yè)取得了較為成功的應(yīng)用,同時(shí)也吸引了眾多的商業(yè)機(jī)構(gòu)以及研究學(xué)者開展數(shù)據(jù)挖掘技術(shù)的研究,同時(shí)也涌現(xiàn)出各種類型的數(shù)據(jù)挖掘系統(tǒng),并且成功的在金融、經(jīng)濟(jì)、商業(yè)等行業(yè)取得成功應(yīng)用。近年來,國外數(shù)據(jù)
5、挖掘的研究趨勢主要為數(shù)據(jù)挖掘技術(shù)算法的研究,例如,重點(diǎn)研究了Bayes(貝葉斯)方法和Boosting方法深入研究;數(shù)據(jù)挖掘技術(shù)中融入了傳統(tǒng)的統(tǒng)計(jì)學(xué)回歸方法;數(shù)據(jù)庫技術(shù)與數(shù)據(jù)挖掘技術(shù)的緊密融合。數(shù)據(jù)挖掘技術(shù)應(yīng)用方面主要為數(shù)據(jù)挖掘商業(yè)應(yīng)用軟件的逐步完善與提升,重點(diǎn)關(guān)注系統(tǒng)的研究,并非某個(gè)點(diǎn)的研究。數(shù)據(jù)挖掘商業(yè)軟件主要應(yīng)用在金融行業(yè)、保險(xiǎn)業(yè)務(wù)以及電信業(yè)務(wù)等方面。國外目前著名的計(jì)算機(jī)企業(yè)在數(shù)據(jù)挖掘方面投入大量的資源,其中微軟、IBM都成立了該方面的研究中心,并且研制出了類似Platinum、BO以及IBM等數(shù)據(jù)挖掘軟件。通過軟件實(shí)現(xiàn)數(shù)據(jù)挖掘是當(dāng)前信息化技術(shù)發(fā)展的結(jié)果,當(dāng)目前為止,數(shù)據(jù)挖掘軟件歷經(jīng)了4
6、個(gè)發(fā)展階段。第一個(gè)階段的數(shù)據(jù)挖掘程序僅能支持單個(gè)或少數(shù)數(shù)據(jù)挖掘算法,其中較為經(jīng)典的數(shù)據(jù)挖掘系統(tǒng)有Salford Systems研制的CART數(shù)據(jù)挖掘系統(tǒng)。在數(shù)據(jù)信息量巨大,且數(shù)據(jù)變化頻率大的情況下,必須通過運(yùn)用數(shù)據(jù)倉庫或者數(shù)據(jù)庫系統(tǒng)進(jìn)行統(tǒng)一管理,顯然該階段的數(shù)據(jù)挖掘系統(tǒng)功能不能滿足要求?;诘谝浑A段的數(shù)據(jù)挖掘軟件,通過增添多種挖掘算法,不斷推出了第二階段的數(shù)據(jù)挖掘應(yīng)用程序。該階段的數(shù)據(jù)挖掘軟件集成了數(shù)據(jù)庫管理系統(tǒng),能夠?qū)?shù)據(jù)倉庫以及數(shù)據(jù)庫進(jìn)行支持,可以與其他應(yīng)用軟件進(jìn)行連接,系統(tǒng)擴(kuò)展性較強(qiáng),其另一個(gè)特點(diǎn)為能夠?qū)Υ髷?shù)據(jù)集和復(fù)雜的數(shù)據(jù)集進(jìn)行數(shù)據(jù)挖掘。在此基礎(chǔ)上系統(tǒng)靈活性更強(qiáng),采用了數(shù)據(jù)挖掘查詢語言
7、以及挖掘模式。其中最為常見的為DB Miner數(shù)據(jù)挖掘系統(tǒng),其能夠采用DMQL數(shù)據(jù)挖掘語言開展數(shù)據(jù)挖掘工作。然而,該階段的數(shù)據(jù)挖掘軟件的缺點(diǎn)在于側(cè)重模型的形成,并且就模型系統(tǒng)的集成形成了第三階段以及第四階段的數(shù)據(jù)挖掘軟件的形成。1韓王瑩. 基于數(shù)據(jù)挖掘技術(shù)的人力資源信息管理系統(tǒng)設(shè)計(jì)J. 電子設(shè)計(jì)工程, 2015(15):54-56.2裴新明. 基于數(shù)據(jù)挖掘的人力資源考核系統(tǒng)分析J. 企業(yè)改革與管理, 2016(18):57-58.3楊帆. 基于數(shù)據(jù)挖掘技術(shù)的人力資源信息化管理J. 信息通信, 2017(4):152-153.4李妹琴. 試論人力資源管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用J. 財(cái)經(jīng)界:學(xué)術(shù)版,
8、 2016(27).5徐毅. 數(shù)據(jù)挖掘技術(shù)在人力資源管理中的應(yīng)用研究J. 中國市場, 2017(32).6王琳. 基于數(shù)據(jù)挖掘的Y汽車學(xué)院教科研人員管理對策研究D. 大連海事大學(xué), 2016.7李會(huì)欣. 數(shù)據(jù)倉庫為中心的人力資源統(tǒng)計(jì)信息系統(tǒng)運(yùn)用探究J. 關(guān)愛明天, 2016(5).8張金艷. 數(shù)據(jù)挖掘在人力資源離職管理中的應(yīng)用以GST公司為例D. 首都經(jīng)濟(jì)貿(mào)易大學(xué), 2016.2.主要內(nèi)容、研究方法和思路近年來,計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)庫技術(shù)的不斷發(fā)展,信息數(shù)據(jù)的日益膨脹,在巨大的數(shù)據(jù)信息當(dāng)中找出自身最為關(guān)注的信息已經(jīng)成為當(dāng)前的一個(gè)極為重要的研究熱點(diǎn),在此基礎(chǔ)上數(shù)據(jù)挖掘技術(shù)引起了信息產(chǎn)業(yè)界的極大關(guān)
9、注。聚類分析技術(shù)是一種將數(shù)據(jù)集劃分為多個(gè)簇的技術(shù),確保同一個(gè)簇中的數(shù)據(jù)特征盡量保持一致,不同簇間的數(shù)據(jù)特征盡量相異的一項(xiàng)技術(shù)。本文分析了數(shù)據(jù)挖掘中的聚類算法類型,闡述了現(xiàn)有聚類算法的性能特點(diǎn)。為驗(yàn)證改進(jìn)的K-means算法的效果,本文利用JAVA作為開發(fā)語言,以礦井人員統(tǒng)計(jì)數(shù)據(jù)為基礎(chǔ),運(yùn)用基于改進(jìn)的K-means聚類算法,將球員數(shù)據(jù)對象進(jìn)行分類,通過對比分析傳統(tǒng)K-means算法結(jié)果,改進(jìn)后的K-means算法效果更好。前言1數(shù)據(jù)挖掘1.1數(shù)據(jù)挖掘定義1.2數(shù)據(jù)挖掘過程2數(shù)據(jù)挖掘中的K-means聚類算法及改進(jìn)2.1 K-means算法原理及其聚類過程2.1.1傳統(tǒng)K-means算法2.1.2
10、 基于平均誤差準(zhǔn)則函數(shù)的k-means算法2.2 K-means算法聚類要素及其優(yōu)缺點(diǎn)2.2.1 k-means聚類算法要素分析2.2.2 k-means聚類算法優(yōu)劣勢分析2.3 基于初始聚類中心選取的K-means算法改進(jìn)2.3.1 改進(jìn)初始聚類中心的選取2.3.2 基于規(guī)則初始聚類中心的k-means聚類算法2.3.3 對噪聲以及孤立點(diǎn)處理能力的改進(jìn)2.3.4 基于改進(jìn)算法的實(shí)驗(yàn)分析3基于數(shù)據(jù)挖掘技術(shù)的礦井人員管理系統(tǒng)設(shè)計(jì)3.1 基于改進(jìn)的K-means聚類算法的礦井人員管理系統(tǒng)3.1.1軟件總體功能結(jié)構(gòu)方案3.1.2系統(tǒng)軟件實(shí)現(xiàn)流程3.2運(yùn)行界面及結(jié)果分析3.2.1 系統(tǒng)運(yùn)行情況分析3.2.2基于改進(jìn)的K-means聚類結(jié)果分析4結(jié)論參考文獻(xiàn)3.總體安排和進(jìn)度(包括階段性工作內(nèi)容及完成日期):
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年電子蜂鳴器項(xiàng)目投資可行性研究分析報(bào)告
- 丙類項(xiàng)目安全預(yù)評價(jià)報(bào)告
- 資源計(jì)劃系統(tǒng)行業(yè)行業(yè)發(fā)展趨勢及投資戰(zhàn)略研究分析報(bào)告
- 2025年桑樹專用肥行業(yè)深度研究分析報(bào)告
- 2024-2026年中國高鎳三元材料市場競爭格局及投資戰(zhàn)略規(guī)劃報(bào)告
- 花崗石購銷合同范本
- 自動(dòng)給湯機(jī)行業(yè)深度研究報(bào)告
- 2025年砂漿養(yǎng)護(hù)室項(xiàng)目投資可行性研究分析報(bào)告
- 2024年福建省危險(xiǎn)廢物處理行業(yè)市場深度分析及投資策略研究報(bào)告
- 中國鋸切機(jī)床行業(yè)市場全景監(jiān)測及投資前景展望報(bào)告
- 市政工程監(jiān)理規(guī)劃范本(完整版)
- 幼兒園小班語言:《我上幼兒園》 PPT課件
- 高標(biāo)準(zhǔn)農(nóng)田項(xiàng)目規(guī)劃設(shè)計(jì)和評審要點(diǎn)
- 小學(xué)三年級下冊綜合實(shí)踐活動(dòng).水果拼盤-(14張)ppt
- 部編版二年級語文下冊第三單元課文《傳統(tǒng)節(jié)日》PPT課件
- 北京市城市建設(shè)節(jié)約用地標(biāo)準(zhǔn)
- 開學(xué)第一課我們開學(xué)啦主題班會(huì)PPT課件(帶內(nèi)容)
- 電源線檢驗(yàn)報(bào)告RVV
- 體育訓(xùn)練隊(duì)隊(duì)規(guī)
- 八字命理漫畫版
- 電梯工程開工報(bào)告(直梯)(共1頁)
評論
0/150
提交評論