




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上學(xué)生一卡通消費大數(shù)據(jù)貧困生挖掘隨著高等教育規(guī)模的迅速擴大,各個高校的貧困生數(shù)量也在不斷攀升。教育部的一項調(diào)查顯示,目前高校中存在經(jīng)濟困難的學(xué)生占在校學(xué)生的15%-30%1。因此,越來越多的研究關(guān)注如何解決貧困生問題2。有的研究關(guān)注能否為貧困生爭取有益的條件,例如國家層面的助學(xué)貸款;學(xué)校層面的校級獎學(xué)金和提供助學(xué)崗位等3;有的研究則借助信息技術(shù)的手段,建立貧困生信息管理系統(tǒng),實現(xiàn)信息的登記、查詢、計算和分析4。這些研究雖然提高了貧困生管理工作的效率,但如何通過分析這些數(shù)據(jù)得到一些知識或規(guī)律,從而幫助有關(guān)貧困生工作人員完善目前的貧困生資助體系,制定合理科學(xué)的資助政策是一項
2、有重要意義的工作5。在這種驅(qū)動下,現(xiàn)在越來越多的研究把數(shù)據(jù)挖掘方法引入到高校貧困生資格認證分析中。例如,采用改進的K-Means聚類算法對高校學(xué)生的校園卡消費數(shù)據(jù)進行分析,基于聚類結(jié)果計算每個學(xué)生的貧困程度,用來輔助高校資助決策工作6;還有研究采用支持向量機(SupportVectorMachine,SVM)對學(xué)生校園一卡通的消費數(shù)據(jù)進行分析,將學(xué)生按貧困與非貧困分類,在高校資助決策工作中給予一定輔助7。這些方法大多是在一個數(shù)據(jù)集上運用數(shù)據(jù)挖掘算法得出規(guī)則,挖掘的結(jié)果在一定程度上可以為貧困生認定工作提供輔助和決策。但沒有系統(tǒng)的搭建全方位、統(tǒng)一的數(shù)據(jù)主題,以提升數(shù)據(jù)質(zhì)量和共享程度,運算出更精確的
3、結(jié)果進而更好地支持數(shù)據(jù)挖掘和決策。2015年召開的黨的十八屆五中全會明確提出了實施“國家大數(shù)據(jù)戰(zhàn)略”8。在2018年度國家自然科學(xué)基金項目指南9專門開辟教育研究通道研究教育的難題,旨在推動以自然科學(xué)范式和手段,特別是讓傳統(tǒng)教育科學(xué)與信息科學(xué)、神經(jīng)科學(xué)、認知科學(xué)相交叉,研究教育的基本理論和基礎(chǔ)問題,支撐新時代的教育。電子科技大學(xué)大數(shù)據(jù)研究中心-教育大數(shù)據(jù)研究所在貧困生精準(zhǔn)資助、圖書推薦、成績預(yù)測領(lǐng)域做了很多開創(chuàng)前沿性的工作10。文章正是在這種“數(shù)據(jù)驅(qū)動學(xué)校,分析變革教育”的大數(shù)據(jù)時代背景下11,結(jié)合我校正在構(gòu)建的數(shù)據(jù)資產(chǎn)管理平臺,對主題數(shù)據(jù)進行全面梳理,搭建統(tǒng)一的學(xué)生數(shù)據(jù)主題,以提高數(shù)據(jù)分析結(jié)果
4、。具體做法是采集一卡通系統(tǒng)736名學(xué)生近三個月的條就餐數(shù)據(jù)和與學(xué)生主題相關(guān)的其他六大應(yīng)用系統(tǒng)中的信息經(jīng)過清洗并建模。通過對這些數(shù)據(jù)規(guī)?;姆治龊筮\算出結(jié)果以支持貧困生決策。1學(xué)生主題數(shù)據(jù)建模早在2010年我校就引入了數(shù)據(jù)交換平臺和共享庫,在一定程度上解決了業(yè)務(wù)系統(tǒng)之間數(shù)據(jù)互聯(lián)互通問題。但在實際建設(shè)過程中,它只是充當(dāng)了數(shù)據(jù)交換中轉(zhuǎn)站的角色。為了滿足學(xué)校對數(shù)據(jù)挖掘和決策支持需求,需要構(gòu)建校級數(shù)據(jù)倉庫(DataWare原h(huán)ouse)。通過數(shù)據(jù)倉庫的建立,職能部門可對現(xiàn)有系統(tǒng)的數(shù)據(jù)進行有效的清洗和整合并加以重組,進而在此基礎(chǔ)上做應(yīng)用場景的分析。如以學(xué)生主題為例,我們把與學(xué)生主題有關(guān)的業(yè)務(wù)系統(tǒng)接入數(shù)據(jù)中
5、心。如圖1所示,通過數(shù)據(jù)整合及分層設(shè)計構(gòu)建了學(xué)生主題域的數(shù)據(jù)倉庫。其中操作型數(shù)據(jù)存儲層(OperationalDataStore)解決源系統(tǒng)快速接入的問題,避免從源系統(tǒng)做頻繁和重復(fù)數(shù)據(jù)抽取;數(shù)據(jù)倉庫層(EnterpriseDataWarehouse)按照業(yè)務(wù)驅(qū)動,面向主題整合,保留明細和歷史數(shù)據(jù)并且模型相對穩(wěn)定,但是會隨著源系統(tǒng)和數(shù)據(jù)業(yè)務(wù)標(biāo)準(zhǔn)的變化,ETL(ExtractionTransformationLoading)會隨之變化。應(yīng)用數(shù)據(jù)層是面向應(yīng)用的個性化定制。構(gòu)建好了一個主題模型框架后,需要在適當(dāng)?shù)臅r候逐步實現(xiàn)物理化。貧困生挖掘分析的ETL工作流功能結(jié)構(gòu)如圖2所示。圖中選取了與學(xué)生信息相
6、關(guān)的六大核心業(yè)務(wù)系統(tǒng),經(jīng)過ETL處理后以學(xué)號為主關(guān)鍵字把學(xué)生的信息整合成一張表信息。以保證基于學(xué)生的消費數(shù)據(jù)模型進行貧困生挖掘分析的有效性。2學(xué)生消費數(shù)據(jù)建模經(jīng)過學(xué)生主題數(shù)據(jù)倉庫建模后,采集了學(xué)生一張表信息集,我們把涉及到學(xué)生消費數(shù)據(jù)建模所需要的數(shù)據(jù)集輸入大數(shù)據(jù)分析專家軟件Datist,并對敏感信息如身份證號脫敏處理以及對學(xué)生基本信息和就餐交易數(shù)據(jù)進行了從身份證中解析性別和籍貫信息和對交易記錄中的日期進行數(shù)據(jù)預(yù)處理后,再添加就餐飯點信息和就餐星期信息以及設(shè)置條件“設(shè)在飯?zhí)贸燥垺钡玫綄W(xué)生消費數(shù)據(jù)模型如圖3所示。模型分析了長期不在飯?zhí)贸燥垺⒋箢~消費(即單餐消費超30元)和貧困生單月消費總額三種情況
7、。Datist是服務(wù)于大數(shù)據(jù)時代場景式(Context)數(shù)據(jù)整合與融合的功能強大的軟件產(chǎn)品。該軟件根據(jù)用戶場景需求組織數(shù)據(jù)與編制業(yè)務(wù)流程,通過可視化的節(jié)點組合來完成數(shù)據(jù)的獲取、組織、整合、提純及有形化表達。圖3是根據(jù)學(xué)生一卡通消費數(shù)據(jù)設(shè)計的業(yè)務(wù)流程。圖中有輸入節(jié)點即數(shù)據(jù)源:學(xué)生基本信息表和學(xué)生消費交易數(shù)據(jù)表等。輸入節(jié)點后進入數(shù)據(jù)處理階段,通過數(shù)據(jù)處理如匯總節(jié)點、過濾節(jié)點、大額消費數(shù)據(jù)即單餐消費超30元等節(jié)點處理后再經(jīng)過各種輸出節(jié)點輸出結(jié)果。如有貧困學(xué)生單月消費總額、長期不在食堂吃飯等異常結(jié)果信息。部分處理的樣例數(shù)據(jù)如表1所示。3學(xué)生就餐消費信息分析數(shù)據(jù)模型確立后,通過軟件運算,對736名學(xué)生2
8、016年9月9日-12月28日(共111天)的就餐數(shù)據(jù)進行分析,從中獲取到學(xué)生的就餐習(xí)慣信息。4.1學(xué)生消費異常分析以下分析是針對廣州大學(xué)2016年9月-12月其中736名學(xué)生的三個月中就餐數(shù)據(jù)異常情況進行分析,由于數(shù)據(jù)量還沒有足夠大,異常分析結(jié)果可能存在一些偏差。3.1.1連續(xù)7日無就餐消費記錄學(xué)生分析三個月份有連續(xù)7天沒有消費記錄學(xué)生共計435人,由于篇幅有限,無法列出所有學(xué)生詳細信息,表2只列出前20名學(xué)生信息,對于這一部分長期不在食堂吃飯的學(xué)生建議需要關(guān)注。3.1.2大額就餐消費記錄對于單筆消費超過30元的消費記錄可能是校園內(nèi)部其他消費,如超市消費,網(wǎng)費繳費或者醫(yī)院繳費等,這些記錄如果
9、判別為醫(yī)院消費,那將要對這些學(xué)生進行重點關(guān)注。分析的結(jié)果展示3050元之間的占大部分,50100元次之,其他100200元之間的建議需要多關(guān)注。3.1.3消費指數(shù)分析通過對736名學(xué)生2016年9月-12月份,3個月份校園消費記錄條數(shù)據(jù)進行綜合分析,根據(jù)就餐頻次、消費額度、每餐消費額、消費均值等給每名學(xué)生計算消費指數(shù)。消費指數(shù)具有相對意義,值越小消費水平越低。通過消費指數(shù)進行排序可以很快了解到學(xué)生的相關(guān)信息,由于篇幅限制,表3僅展示前10名學(xué)生信息。表中貧困生貧困程度的認定就是根據(jù)消費指數(shù)為依據(jù)的,如可以設(shè)置一個閾值,小于等于該閾值的認定為特別貧困,大于該閾值的認定為一般貧困。4結(jié)論分析的數(shù)據(jù)
10、集只采用了2016年9月-12月份三個月的736名學(xué)生條就餐消費數(shù)據(jù)進行分析,獲得了學(xué)生就餐習(xí)慣及消費指數(shù)。就餐消費數(shù)據(jù)分析可以達到兩項目的,一是對學(xué)生生活現(xiàn)狀進行分析;二是可系統(tǒng)地實現(xiàn)校園大數(shù)據(jù),精準(zhǔn)資助,即是在貧困生中分析發(fā)現(xiàn)“潛藏”的非貧困生;在非貧困生中發(fā)現(xiàn)那些確實很貧窮,但又不愿意說的學(xué)生。從以上分析結(jié)果來看,通過“一卡通”交易數(shù)據(jù)來對貧困生的貧困程度進行排名有比較好的區(qū)分度,可以作為發(fā)放貧困生資助的一個依據(jù)。為了準(zhǔn)確的對學(xué)生進行畫像,下面對今后分析提幾點建議:1.本次大數(shù)據(jù)分析,只是學(xué)校做一個掀起實驗性研究。只用了736多名學(xué)生3個多月的“一卡通”的消費數(shù)據(jù)是遠遠不夠的,未來用全校
11、所有學(xué)生一個學(xué)年的數(shù)據(jù)進行綜合分析,這樣分析出來的結(jié)果更準(zhǔn)確。2.通過獲取全校所有學(xué)生的“一卡通”交易數(shù)據(jù),這樣可以對貧困生和非貧困生的基本情況進行對比分析,可以更好的了解貧困生的生活狀況,也可以發(fā)現(xiàn)未申報貧困生的潛在貧困生的學(xué)生名單。3.通過獲取更詳細的“一卡通”其他交易數(shù)據(jù),比如“一卡通”加款數(shù)據(jù)、“一卡通”消費刷卡終端信息,這樣就可以更好的識別交易類型,剔除那些非就餐交易。后續(xù)的分析可以利用學(xué)生的消費行為進行改進的RFM建模,利用貧困生名單進行機器學(xué)習(xí)分類建模,利用學(xué)生就餐順序進行網(wǎng)絡(luò)關(guān)系建模。4.獲取教務(wù)系統(tǒng)數(shù)據(jù),結(jié)合貧困生的學(xué)習(xí)狀況進行綜合分析,可以用有限的資金盡可能資助貧困而學(xué)習(xí)成績優(yōu)秀的學(xué)生。5.學(xué)生心理行為分析和學(xué)情分析。如獲取學(xué)生政治面貌數(shù)據(jù),比如黨員、預(yù)備黨員、入黨積極分子等信息,可以更好了解貧困生的思想進步情況。6.動態(tài)學(xué)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 智慧環(huán)衛(wèi)信息管理平臺建設(shè)方案
- 基于云計算技術(shù)的智慧環(huán)衛(wèi)解決方案
- 展臺搭建合同范本
- 稅務(wù)系統(tǒng)納稅信用管理政策解讀
- 重型柴油車遠程在線監(jiān)控系統(tǒng)項目 投標(biāo)方案(技術(shù)方案)
- 三農(nóng)村創(chuàng)業(yè)投資手冊
- 企業(yè)供應(yīng)鏈管理的數(shù)字化轉(zhuǎn)型及優(yōu)化策略研究
- 三農(nóng)產(chǎn)品質(zhì)量安全追溯系統(tǒng)建設(shè)手冊
- 新零售技術(shù)應(yīng)用與發(fā)展趨勢分析報告
- 停車場車輛出入智能管理系統(tǒng)
- 公務(wù)員2014年國考《申論》真題卷及答案(副省級)
- 裝飾裝修施工人員安全知識培訓(xùn)考試試卷及答案
- 伸縮臂式22m高空作業(yè)車安全操作規(guī)程
- 嬰幼兒發(fā)展引導(dǎo)員(育嬰員)職業(yè)技能競賽理論考試題庫(含答案)
- 全國國家版圖知識競賽題庫及答案(中小學(xué)組)
- 湖北省武漢市實驗外國語學(xué)校小學(xué)部小學(xué)六年級小升初期末語文試題(含答案)
- 高職生職業(yè)生涯規(guī)劃與就業(yè)指導(dǎo) 課件全套 崔麗娜 第1-8章 揭開生涯規(guī)劃面紗 走進生涯規(guī)劃- 助力職業(yè)發(fā)展 職場適應(yīng)
- 小學(xué)一年級數(shù)學(xué)下冊綜合知識訓(xùn)練100題含答案
- 2024營運純電動汽車換電服務(wù)技術(shù)要求
- 三年級科學(xué)《月相的變化規(guī)律》說課課件
- 橫向課題項目協(xié)議書
評論
0/150
提交評論