數(shù)據(jù)挖掘技術(shù)深化數(shù)據(jù)采集應(yīng)用系統(tǒng)_第1頁
數(shù)據(jù)挖掘技術(shù)深化數(shù)據(jù)采集應(yīng)用系統(tǒng)_第2頁
數(shù)據(jù)挖掘技術(shù)深化數(shù)據(jù)采集應(yīng)用系統(tǒng)_第3頁
數(shù)據(jù)挖掘技術(shù)深化數(shù)據(jù)采集應(yīng)用系統(tǒng)_第4頁
數(shù)據(jù)挖掘技術(shù)深化數(shù)據(jù)采集應(yīng)用系統(tǒng)_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、摘要大數(shù)據(jù)使現(xiàn)代化信息技術(shù)實(shí)現(xiàn)了高速發(fā)展 , 利用現(xiàn)代化信息 技術(shù)建立狀態(tài)數(shù)據(jù)采集系統(tǒng)進(jìn)行院校評估,是院校管理的發(fā)展方向。 數(shù)據(jù)采集系統(tǒng)不應(yīng)只注重平臺服務(wù)而忽視了功能的挖掘與發(fā)揮。 數(shù)據(jù)挖掘技術(shù)對高職狀態(tài)數(shù)據(jù)采集的應(yīng)用系統(tǒng)建設(shè)方法應(yīng)注重關(guān)聯(lián) 規(guī)則方法和聚類分析方法的構(gòu)建與使用。 關(guān)鍵詞數(shù)據(jù)挖掘技術(shù); 狀態(tài)數(shù)據(jù);數(shù)據(jù)采集;應(yīng)用系統(tǒng)數(shù)據(jù)采集應(yīng)用系統(tǒng)又被稱之為高職院 校人才培養(yǎng)工作狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng), 該數(shù)據(jù)采集應(yīng)用系統(tǒng)在 2008 年得到教育部門批準(zhǔn)并公布實(shí)施, 這使數(shù)據(jù)采集應(yīng)用系統(tǒng)成為高職院 校進(jìn)行方案評估的重要組成部分, 并越來越受到各個高職院校的關(guān)注 與重視。 不過,由于數(shù)據(jù)采集應(yīng)用系統(tǒng)出

2、現(xiàn)的時間較短,各個 高職院校還沒有真正認(rèn)識到數(shù)據(jù)采集應(yīng)用系統(tǒng)的作用, 對數(shù)據(jù)采集應(yīng) 用系統(tǒng)的框架體系與邏輯關(guān)系的理解仍舊需要一段時間, 對應(yīng)用系統(tǒng) 中相關(guān)聯(lián)的數(shù)據(jù)進(jìn)行聚合, 使其成為一種能夠幫助學(xué)院進(jìn)行教學(xué)決策 與管理的價值信息, 更需要探索一種新的數(shù)據(jù)分析方法, 再加上高職 院校只注重系統(tǒng)的服務(wù)評估功能而忽視了其他功能的挖掘與應(yīng)用, 這 就造成許多高職院校只是在填報時才會用到該系統(tǒng), 而在填報過后便 成為了擺設(shè), 這使數(shù)據(jù)采集應(yīng)用系統(tǒng)的作用未得到真正發(fā)揮, 利用率 較低。 為此,針對以上問題,通過數(shù)據(jù)挖掘技術(shù)對高職狀態(tài)數(shù) 據(jù)采集應(yīng)用系統(tǒng)進(jìn)行深化分析。 1 數(shù)據(jù)挖掘技術(shù)大數(shù)據(jù)具有增 長速度快、

3、海量、多樣、真實(shí)、價值密度低五大特點(diǎn),從數(shù)據(jù)本身進(jìn) 行分析,所謂數(shù)據(jù)挖掘技術(shù)便是通過算法搜索, 從海量的大數(shù)據(jù)中對 價值密度低的價值數(shù)據(jù)進(jìn)行挖掘與收集的過程。 數(shù)據(jù)挖掘技術(shù)和計算機(jī)科學(xué)有著緊密的聯(lián)系,通過數(shù)據(jù)的統(tǒng)計、處理、機(jī)器學(xué)習(xí)、 模式識別、情報檢索等諸多手段來達(dá)成價值數(shù)據(jù)挖掘目的。 這 些手段能使企業(yè)決策者根據(jù)價值數(shù)據(jù)來對策略進(jìn)行調(diào)整, 以此降低風(fēng) 險,并做出正確決策。 數(shù)據(jù)挖掘由三個階段構(gòu)成數(shù)據(jù)準(zhǔn)備、數(shù) 據(jù)挖掘、結(jié)果表達(dá)。 2 數(shù)據(jù)挖掘技術(shù)在高職狀態(tài)數(shù)據(jù)采集應(yīng)用 系統(tǒng)中的深化基礎(chǔ)高職狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng)屬于一種數(shù)據(jù)倉庫, 該 系統(tǒng)每進(jìn)行一次數(shù)據(jù)采集便會采集到超過 50 萬條的數(shù)據(jù),通過將

4、狀 態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng)與互聯(lián)網(wǎng)技術(shù)進(jìn)行結(jié)合, 還能使數(shù)據(jù)采集應(yīng)用系 統(tǒng)一次性采集到的數(shù)據(jù)量更多。 以知識管理理論對數(shù)據(jù)進(jìn)行分 析,數(shù)據(jù)自身是不會提供太多價值信息的,因此,需要將這些采集到 的數(shù)據(jù)進(jìn)行轉(zhuǎn)化,使其成為有效信息,并利用科學(xué)的數(shù)據(jù)分析方法, 通過關(guān)聯(lián)、聚類、聚合等方法來對這些海量的數(shù)據(jù)進(jìn)行分析。 現(xiàn) 如今,數(shù)據(jù)分析在各行各業(yè)中發(fā)揮越來越重要的作用, 數(shù)據(jù)挖掘技術(shù) 的相關(guān)理論與方法也使數(shù)據(jù)采集應(yīng)用系統(tǒng)具備極高的應(yīng)用價值與意 義。 可以說,數(shù)據(jù)挖掘技術(shù)作為一種新型信息處理技術(shù),能對 大量數(shù)據(jù)中人們所不知道而又潛在的有用信候進(jìn)行提取, 屬于一種更 深層次化的數(shù)據(jù)分析方式, 其與傳統(tǒng)分析方法的

5、最大不同是傳統(tǒng)分析 方法具備非常明顯的指向性特征, 而其目的是通過結(jié)果來對預(yù)設(shè)命題 的正確性進(jìn)行驗(yàn)證,或是通過對預(yù)設(shè)模型的機(jī)理進(jìn)行量化分析。 而數(shù)據(jù)挖掘技術(shù)則是在沒有任何比較明確的假設(shè)情況下對信息進(jìn)行 挖掘,找出信息的關(guān)聯(lián)性, 并獲得那些難以通過直覺,甚至?xí)`背直 覺的相關(guān)信息,這樣挖掘出的信息極有可能出人意料而又富有價值, 可以說,數(shù)據(jù)挖掘技術(shù)是傳統(tǒng)分析方法不斷變革后的結(jié)晶。 事 實(shí)上,經(jīng)過教育界諸多專家對數(shù)據(jù)采集應(yīng)用系統(tǒng)的不斷完善, 在數(shù)據(jù) 采集應(yīng)用系統(tǒng)頒布應(yīng)用的三年里, 系統(tǒng)結(jié)構(gòu)與信息的采集量都發(fā)生了 極大改變,以版本來說,最初的數(shù)據(jù)采集應(yīng)用系統(tǒng)是 08 版的,之后 經(jīng)過不斷的改進(jìn)已經(jīng)成

6、為現(xiàn)今的 10001版,原有采集字段僅為 594 字 段,現(xiàn)如今已經(jīng)增長到了 750 個字段,采集字段的大幅增加,也使數(shù) 據(jù)采集應(yīng)用系統(tǒng)的信息容量得到了大幅度擴(kuò)充, 其數(shù)據(jù)倉庫特征也越 來越明顯, 尤為重要的是數(shù)據(jù)間的關(guān)聯(lián)度不斷增加, 使其成為數(shù)據(jù)挖 掘技術(shù)的深化基礎(chǔ), 從客觀上來說, 通過數(shù)據(jù)挖掘技術(shù)的應(yīng)用來進(jìn)行 數(shù)據(jù)分析, 能為數(shù)據(jù)采集應(yīng)用系統(tǒng)創(chuàng)造更加有利便捷的條件。 3 數(shù)據(jù)挖掘技術(shù)深化高職狀態(tài)數(shù)據(jù)采集的應(yīng)用系統(tǒng)分析數(shù)據(jù)挖掘技術(shù) 在高職狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng)中的應(yīng)用方法主要有關(guān)聯(lián)、 分類、聚類、 估計、細(xì)分或預(yù)測等, 數(shù)據(jù)挖掘技術(shù)的自身理論與思維方式給數(shù)據(jù)采 集應(yīng)用系統(tǒng)帶來了廣闊的發(fā)展空間

7、。 在這些應(yīng)用方法中,以聚 類分析方法和關(guān)聯(lián)規(guī)則分析方法最為易于理解和實(shí)施, 以下便對這種 主要方法在高職狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng)中的深化應(yīng)用進(jìn)行探討。31 關(guān)聯(lián)規(guī)則分析在關(guān)聯(lián)規(guī)則方法中,數(shù)據(jù)是以孤立、單獨(dú)的形式分 散存在的,這也使單獨(dú)的數(shù)據(jù)不能形成信息,不過將這些單獨(dú)、分散 而又相互關(guān)聯(lián)的信息數(shù)據(jù)收集起來, 則能多角度、 全方位地對某一對 象進(jìn)行高效的價值辨別。 而對于剛開始接觸數(shù)據(jù)采集應(yīng)用系統(tǒng) 的用戶來說, 在數(shù)據(jù)采集應(yīng)用系統(tǒng)使用過程中, 應(yīng)以海量信息數(shù)據(jù)作 為依據(jù)來對高職院校在人才培養(yǎng)過程中的各個方面進(jìn)行判斷與價值辨別,這就造成系統(tǒng)用戶往往感覺無從下手, 只會對各個表格中的數(shù) 據(jù)進(jìn)行割裂而孤

8、立地分析, 更加難以找出數(shù)據(jù)之間的關(guān)聯(lián)性與內(nèi)在規(guī) 律,同樣難以對這些相互關(guān)聯(lián)的數(shù)據(jù)進(jìn)行聚合, 這使高職院校難以將 人才培養(yǎng)工作過程中的關(guān)鍵要素進(jìn)行全面呈現(xiàn), 以此幫助管理人員進(jìn) 行工作決策。 而通過關(guān)聯(lián)規(guī)則挖掘方法的應(yīng)用,則由數(shù)據(jù)采集 應(yīng)用系統(tǒng)提供數(shù)據(jù), 并對人才培養(yǎng)工作的所有關(guān)鍵要素進(jìn)行分析, 通 過挖掘與之相關(guān)的所有數(shù)據(jù), 能更加清晰地呈現(xiàn)數(shù)據(jù)與指標(biāo)間的相關(guān) 關(guān)系及關(guān)聯(lián)規(guī)則。 例如,在對高職院校的兼職教師隊(duì)伍建設(shè)現(xiàn) 狀進(jìn)行分析時, 利用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則分析方法, 能將兼職 教師的人數(shù)和整個高職院校的教師總數(shù)量進(jìn)行對比, 能清楚地知道兼 職教師在整個高職院校的教師隊(duì)伍中占據(jù)的比例,

9、再將兼職教師數(shù)量 和高職院校所設(shè)置的專業(yè)數(shù)量進(jìn)行對比, 還可清楚地知道各個專業(yè)所 安排的平均兼職教師數(shù)量等等。 這些與之對比的數(shù)據(jù)均分散在 整個系統(tǒng)中, 但它們都和兼職教師隊(duì)伍有著很強(qiáng)的內(nèi)在關(guān)聯(lián), 通過對 這些與之關(guān)聯(lián)的數(shù)據(jù)進(jìn)行采集, 能非常直觀地對某個方面的具體工作 情況進(jìn)行真實(shí)反映。 通過將這些數(shù)據(jù)進(jìn)行聚合,還能非常直觀 地反映高職院校對專業(yè)教師隊(duì)伍建設(shè)的重視程度及總體規(guī)則, 并將其 與預(yù)期的高職院校教師隊(duì)伍規(guī)劃進(jìn)行比較, 能清楚地知道當(dāng)前教師隊(duì) 伍建設(shè)能否滿足學(xué)校師資建設(shè)的發(fā)展需要, 具體的實(shí)施情況如何等問 題。32 聚類分析在聚類分析中,對于不同的數(shù)據(jù),通過關(guān)聯(lián)規(guī)則分析,能獲得大量的價

10、值信息。 而對于同一類的數(shù)據(jù),則將 這些數(shù)據(jù)利用聚類分析思路進(jìn)行相應(yīng)整合, 這樣能使信息的呈現(xiàn)更加 豐富,并能對某項(xiàng)工作的進(jìn)程及各個部門間的差異進(jìn)行真實(shí)可靠的反 映。 例如,在對高職院校的師生比情況進(jìn)行分析時,利用聚類 分析將歷年的院校招生情況及教師人數(shù)情況進(jìn)行對比, 能非常直觀地 對院校在歷年中的師生比情況進(jìn)行衡量, 當(dāng)發(fā)現(xiàn)每一年的學(xué)生數(shù)量都 有所增長, 而教師數(shù)量增長不大時, 則可以通過師生比來衡量院校的 教師增長數(shù)量難以滿足學(xué)院的教學(xué)要求,應(yīng)加強(qiáng)師資隊(duì)伍建設(shè)。33 聚合分析對于不同系數(shù)中的同類數(shù)據(jù)來說,可以通過聚合分析的 方法來對系部間的差距進(jìn)行直觀衡量與觀察, 僅僅對同一系部中的數(shù) 據(jù)

11、進(jìn)行分析, 是難以獲得較多有價值信息的, 而通過聚合分析方法將 不同系部中的同類數(shù)據(jù)進(jìn)行聚合, 則能使數(shù)據(jù)信息變得更加豐富, 進(jìn) 而可以非常直觀地了解到不同系部在相同工作之間的差距, 從而使院 校管理人員能根據(jù)這種差距來對工作差距較大的系部進(jìn)行加強(qiáng)。 4結(jié)語綜上所述,數(shù)據(jù)挖掘技術(shù)在高職院校狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng)中 的應(yīng)用案例比比皆是, 這也證明了數(shù)據(jù)挖掘技術(shù)能使院校狀態(tài)數(shù)據(jù)采 集系統(tǒng)的作用得到更進(jìn)一步的發(fā)揮, 使數(shù)據(jù)采集應(yīng)用系統(tǒng)能對各類數(shù) 據(jù)進(jìn)行有效挖掘與轉(zhuǎn)化, 并將其應(yīng)用到高職院校的管理與教學(xué)工作中, 提高了高職院校的管理服務(wù)水平, 為高職院校管理人員提供大量的有 效信息。 可以說,數(shù)據(jù)挖掘技術(shù)在很大程度上促進(jìn)了高職院校 狀態(tài)數(shù)據(jù)采集系統(tǒng)的深化應(yīng)用。 參考文獻(xiàn) 1 張曉蕾基于平臺的 人才培養(yǎng)工作狀態(tài)數(shù)據(jù)采集管理系統(tǒng)的設(shè)計與實(shí)現(xiàn) 成都電子科技 大學(xué)碩士論文 ,20142 蘇世文, 王國慶高職院校人才培養(yǎng)工作狀態(tài)數(shù) 據(jù)采集平臺的柔性模型設(shè)計 江蘇經(jīng)貿(mào)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論