![《數(shù)據(jù)挖掘與商務(wù)智能》小組作業(yè)_第1頁](http://file4.renrendoc.com/view/388cec610c8522dde1212f49d54dd1cd/388cec610c8522dde1212f49d54dd1cd1.gif)
![《數(shù)據(jù)挖掘與商務(wù)智能》小組作業(yè)_第2頁](http://file4.renrendoc.com/view/388cec610c8522dde1212f49d54dd1cd/388cec610c8522dde1212f49d54dd1cd2.gif)
![《數(shù)據(jù)挖掘與商務(wù)智能》小組作業(yè)_第3頁](http://file4.renrendoc.com/view/388cec610c8522dde1212f49d54dd1cd/388cec610c8522dde1212f49d54dd1cd3.gif)
![《數(shù)據(jù)挖掘與商務(wù)智能》小組作業(yè)_第4頁](http://file4.renrendoc.com/view/388cec610c8522dde1212f49d54dd1cd/388cec610c8522dde1212f49d54dd1cd4.gif)
![《數(shù)據(jù)挖掘與商務(wù)智能》小組作業(yè)_第5頁](http://file4.renrendoc.com/view/388cec610c8522dde1212f49d54dd1cd/388cec610c8522dde1212f49d54dd1cd5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、專業(yè)班級(jí)2013級(jí)企業(yè)管理HUXANUNIVERSITY數(shù)據(jù)挖掘與商務(wù)智能小組作業(yè)作業(yè)題目一一決策樹算法在人力資源管理中的應(yīng)用研究小組成員涂艷紅沈之夏吳虹橋韓進(jìn)劉澤銀策算在學(xué)院名稱工商管理學(xué)院指導(dǎo)老師楊超副教授提交日期2014年7月40人力資源管理中的應(yīng)用研究1數(shù)據(jù)挖掘技術(shù)在人力資源管理中的應(yīng)用隨著信息技術(shù)的迅速發(fā)展,特別是數(shù)據(jù)庫技術(shù)和計(jì)算機(jī)網(wǎng)絡(luò)的廣泛應(yīng)用,企業(yè)擁有的數(shù)據(jù)量急劇增加。在大量的數(shù)據(jù)與信息中,蘊(yùn)藏著企業(yè)運(yùn)營(yíng)的利弊得失,若能夠?qū)@種海量的數(shù)據(jù)與信息進(jìn)行快速有效地深入分析和處理,就能從中找出規(guī)律和模式,策略制定配置人力資源獲取所需知識(shí),幫助企業(yè)更好地進(jìn)行決策。數(shù)據(jù)挖掘技術(shù)和產(chǎn)品在這種市
2、場(chǎng)需求中逐漸發(fā)展成熟,并使企業(yè)獲得極高的投資回報(bào)。圖1數(shù)據(jù)挖掘在人力資源管理中的應(yīng)用(1)員工招聘員工的招聘是具體人力資源管理的開始。人力資源管理者利用各種方法和手段,如網(wǎng)路招聘、接受推薦、刊登廣告、舉辦人才交流會(huì)、到職業(yè)介紹所登記等從組織內(nèi)部和外部吸引優(yōu)秀人才招聘是企業(yè)獲取人力資本的重要手段,企業(yè)要生存并持續(xù)發(fā)展就必須招聘。因此,招聘的結(jié)果直接關(guān)系到企業(yè)能否保持優(yōu)良的員工素質(zhì)和合理的結(jié)構(gòu),也影響企業(yè)的人員流動(dòng)和人力資源管理的費(fèi)用控制。現(xiàn)實(shí)中往往經(jīng)常存在著這種現(xiàn)象,企業(yè)急需優(yōu)秀員工但招聘者找不到合適的人才,而有能力的求職者又找不到合適的工作。這些問題主要就是因?yàn)槎叩脑S多潛在的聯(lián)系沒有被挖掘出
3、來。比如說,招聘的企業(yè)不了解求職者離職的普遍原因,不了解求職者普遍要求的薪資水平等,這就導(dǎo)致企業(yè)在招聘過程中盲目性。而要解決這類問題,就目前的技術(shù)而言,采用數(shù)據(jù)挖掘技術(shù)是一種方便有效的解決方案。在數(shù)據(jù)挖掘子系統(tǒng)中,數(shù)據(jù)挖掘技術(shù)所要解決的問題之一就是找出求職者身份、特點(diǎn)與離職的各種原因之間的關(guān)系并建立模式,以公司可以通過調(diào)整薪資、福利,甚至更換工作環(huán)境等手段來留住所需的人才,對(duì)新的求職者做出預(yù)測(cè),以幫助人力資源部門招聘人員找到正確的招聘對(duì)象。(2)員工績(jī)效考評(píng)對(duì)在職員工的管理,不能只局限于記錄和管理相關(guān)的數(shù)據(jù),如員工基本信息,員工考核信息等,更重要的是應(yīng)該能整理和分析這些數(shù)據(jù),并提出有價(jià)值的報(bào)告
4、。例如:通過對(duì)員工考評(píng)數(shù)據(jù)的分析,企業(yè)可以了解到目前的整體績(jī)效狀況;通過對(duì)工資結(jié)構(gòu)分布的分析,可以提出成本控制的建議等。所以我們要求人力資源管理系統(tǒng)不但要對(duì)企業(yè)整體的人力資源狀況做出判斷,更重要的是可以向企業(yè)高層提出支持性的建議,引入數(shù)據(jù)挖掘技術(shù),即可達(dá)到該目標(biāo)。在該系統(tǒng)中運(yùn)用數(shù)據(jù)挖掘技術(shù),比如通過對(duì)人才年齡的分析,判斷公司年齡結(jié)構(gòu)是否合理,應(yīng)補(bǔ)充哪一年齡層次的人才等;收集和分析人力資源供給與需求方面的信息,預(yù)測(cè)人力資源供給和需求的發(fā)展趨勢(shì)。這些統(tǒng)計(jì)與分析結(jié)果為人力資源部制訂人力資源招聘、調(diào)配、培訓(xùn)、開發(fā)及發(fā)展計(jì)劃等政策和措施提供準(zhǔn)確、量化的依據(jù)。(3)員工離職在市場(chǎng)化的人才就業(yè)機(jī)制下,人才的
5、流動(dòng)是一種必然現(xiàn)象,而且我國正處于社會(huì)轉(zhuǎn)型期,人才的流動(dòng)更為頻繁。適度的員工流動(dòng)率對(duì)企業(yè)發(fā)展有益,但是員工流動(dòng)過于頻繁,對(duì)于企業(yè)和社會(huì)都具有不利影響。對(duì)于企業(yè)來說,過高的員工流動(dòng)率意味著企業(yè)人才的流失,以及企業(yè)在員工身上所進(jìn)行的人力資源投資的喪失,包括招聘,培訓(xùn)等費(fèi)用的空耗,還面臨著巨大的重置成本。特別是核心員工的離職,往往對(duì)企業(yè)產(chǎn)生非常重要的影響,甚至決定企業(yè)的生存與否。離職員工從不同的方面對(duì)企業(yè)的生產(chǎn)經(jīng)營(yíng)過程產(chǎn)生著各種各樣的影響,特別是現(xiàn)在的人員流動(dòng)經(jīng)常是以團(tuán)隊(duì)方式進(jìn)行的,一個(gè)人的離職可能會(huì)產(chǎn)生連鎖反應(yīng),嚴(yán)重的有可能使企業(yè)陷入癱瘓。企業(yè)應(yīng)充分認(rèn)識(shí)到人才流失對(duì)企業(yè)經(jīng)營(yíng)帶來的巨大風(fēng)險(xiǎn),建立完整
6、的針對(duì)人才流失危機(jī)管理機(jī)制,從而避免優(yōu)秀人才的流失可能給企業(yè)帶來的巨大損失。人力資源管理者通常是通過書面調(diào)查和口頭詢問得到的信息來定性的分析員工離職原因,但是這種分析帶有很大的主觀性。通過數(shù)據(jù)挖掘技術(shù)建立起員工分類模型,發(fā)現(xiàn)離職員工的主要特征,然后利用這個(gè)模型挖掘出在職員工中的潛在的離職者,對(duì)于其中的優(yōu)秀員工,企業(yè)應(yīng)該引起重視,并采取措施留住人才。誠如上文所述,人力資源的管理的目標(biāo)是人員工,他是一個(gè)復(fù)雜的、易變的對(duì)象,傳統(tǒng)的分析方法已經(jīng)不能滿足管理者的需要。數(shù)據(jù)挖掘技術(shù)在近幾年剛剛出現(xiàn),它在挖掘數(shù)據(jù)中隱含的規(guī)律以及解決具體問題方面而言,是其他技術(shù)方法所不能比擬的現(xiàn)已經(jīng)在實(shí)際領(lǐng)域得到廣泛的應(yīng)用,
7、并且產(chǎn)生了良好效果。此外,數(shù)據(jù)挖掘技術(shù)的優(yōu)點(diǎn)是可以集成到具體的人力資源管理系統(tǒng)之中,從而利用已有信息系統(tǒng)存儲(chǔ)的數(shù)據(jù)進(jìn)行挖掘計(jì)算,利用計(jì)算機(jī)應(yīng)用程序,把高深復(fù)雜的統(tǒng)計(jì)技術(shù)、挖掘算法封裝起來,使人們不用掌握這些技術(shù)也能完成同樣的功能,從而更專注于自己所要解決的問題。下面是一些數(shù)據(jù)挖掘技術(shù)在人力資源管理系統(tǒng)中研究和應(yīng)用的實(shí)例。(1)IBM在管理系統(tǒng)解決方案中,數(shù)據(jù)挖掘部件使用的是IntelligentMiner。它提供以下功能:a廣泛的數(shù)據(jù)挖掘技術(shù)和算法集;b.在數(shù)據(jù)規(guī)模和計(jì)算性能方面有非常高的可伸縮性,可在許多IBM和非IBM的平臺(tái)上運(yùn)行;c.具有大量能被用來開發(fā)用戶化數(shù)據(jù)挖掘應(yīng)用程序的編程接口;
8、所有的數(shù)據(jù)挖掘引擎和數(shù)據(jù)操縱函數(shù)能通過共享C+庫被訪問。Inte山gentMiner支持分類、預(yù)測(cè)、關(guān)聯(lián)規(guī)則產(chǎn)生、聚類、順序模式偵測(cè)和時(shí)間序列分析的算法。大多數(shù)算法是由IBM研究所研發(fā)出來的,是IBM專有技術(shù),只存在于IntelligentMiner中。Inte山gentMiner是一個(gè)客戶服務(wù)系統(tǒng),客戶機(jī)用于控制用戶界面和數(shù)據(jù)可視化函數(shù),而數(shù)據(jù)挖掘和數(shù)據(jù)操縱引擎在服務(wù)器上IntelligentMiner支持展開文件并提供對(duì)DB2的直接訪問。IntelligentMiner支持?jǐn)?shù)據(jù)挖掘在人力資源管理系統(tǒng)中的應(yīng)用。(2)EnterpriseMiner是SAS公司推出的數(shù)據(jù)挖掘工具。它支持關(guān)聯(lián)、聚
9、類、決策樹、神經(jīng)元網(wǎng)絡(luò)和經(jīng)典回歸技術(shù),它能運(yùn)行在客戶服務(wù)模式下。其對(duì)數(shù)據(jù)的訪問是通過標(biāo)準(zhǔn)的SAS數(shù)據(jù)程序(SAS/ACCESS模塊)??偟膩碚f,它適用于企業(yè)在數(shù)據(jù)挖掘方面的應(yīng)用和人力資源管理的決策支持應(yīng)用。國內(nèi)目前也有不少的軟件公司開發(fā)出了自己的人力資源管理系統(tǒng)產(chǎn)品,但他們的產(chǎn)品大部分停留在對(duì)員工信息的記錄上,對(duì)數(shù)據(jù)挖掘部分比較弱化。這與我國的數(shù)據(jù)挖掘技術(shù)應(yīng)用水平有一定的關(guān)系。但隨著人力管理管理系統(tǒng)在我國的進(jìn)一步發(fā)展,企業(yè)對(duì)數(shù)據(jù)挖掘部分的要求會(huì)越來越高,因此加強(qiáng)數(shù)據(jù)挖掘技術(shù)在人力資源管理方面的應(yīng)用研究,有利于提高我國企業(yè)對(duì)人力資源管理系統(tǒng)理論的進(jìn)一步認(rèn)識(shí)和促進(jìn)我國企業(yè)人力資源管理系統(tǒng)應(yīng)用水平的
10、提高。2決策樹應(yīng)用2.1基于ID3算法的決策樹應(yīng)用決策樹技術(shù)是用于分類和預(yù)測(cè)的主要技術(shù),決策樹學(xué)習(xí)是以實(shí)例為基礎(chǔ)的歸納學(xué)習(xí)算法。它著眼于從一組無次序、無規(guī)則的事例中推理除決策樹表示形式的分類規(guī)則。它采用自頂向下的遞歸方式,在決策樹的內(nèi)部節(jié)點(diǎn)進(jìn)行屬性值的比較并根據(jù)不同屬性判斷從該節(jié)點(diǎn)向下的分支,然后進(jìn)行剪枝,最后在決策樹的葉節(jié)點(diǎn)得到結(jié)論。所以從根到葉節(jié)點(diǎn)就對(duì)應(yīng)著一條合取規(guī)則,整棵樹就對(duì)應(yīng)著一組析取表達(dá)式規(guī)則?;跊Q策樹的分類有很多實(shí)現(xiàn)算法。ID3是較早提出并普遍使用的決策樹算法。Quinlan提出的著名的ID3學(xué)習(xí)算法是較早的經(jīng)典算法,它通過選擇窗口來形成決策樹,是利用信息論中的互信息尋找訓(xùn)練集
11、具有最大信息量的屬性字段,建立決策樹的一個(gè)節(jié)點(diǎn),再根據(jù)該屬性字段的不同取值建立樹的分支;在每個(gè)分支子集中重復(fù)建立樹的下層節(jié)點(diǎn)和分支過程。2.2決策樹方法在員工離職分析中的應(yīng)用1、員工分類過程中的總體結(jié)構(gòu)利用決策樹對(duì)離職員工資源進(jìn)行分類的目的,是在公司在職員工中挖掘出潛在離職者。然后,就可以有針對(duì)性地對(duì)一些潛在離職的重要員工,采取一些措施進(jìn)行挽留,減少企業(yè)由此帶來的損失,形成一個(gè)穩(wěn)定的員工團(tuán)體。主要的措施分為三類:一、激勵(lì)機(jī)制留人才;二、建立合理的薪酬結(jié)構(gòu);提供有競(jìng)爭(zhēng)力的薪酬水平;三、重視人本管理,給員工的發(fā)展提供機(jī)會(huì)。員工分類過程的總體結(jié)構(gòu)如圖2所示:圖2數(shù)據(jù)挖掘在人力資源管理中的應(yīng)用2、數(shù)據(jù)
12、準(zhǔn)備(1)數(shù)據(jù)選取從數(shù)據(jù)源中得到的歷史數(shù)據(jù)存在著量大、屬性繁多、定義復(fù)雜、不完整的特性,分析人員需要從大量的數(shù)據(jù)中選擇適合分析的數(shù)據(jù)。不同時(shí)間段的員工具有不同的特征,比如,現(xiàn)在員工學(xué)歷普遍比過去十年前的高,因此不能用十年前的相關(guān)數(shù)據(jù)來建立模型,預(yù)測(cè)現(xiàn)在員工相關(guān)情況。系統(tǒng)選取數(shù)據(jù)的過程中,將運(yùn)用SQL查詢語句得到近幾年的數(shù)據(jù)。(2)數(shù)據(jù)清理數(shù)據(jù)清理也可稱為數(shù)據(jù)清洗。數(shù)據(jù)清理是在數(shù)據(jù)中清除錯(cuò)誤和不一致,并解決對(duì)象識(shí)別問題的過程。數(shù)據(jù)清理包括空值處理、噪聲處理及不一致數(shù)據(jù)處理等。數(shù)據(jù)不一致性導(dǎo)致數(shù)據(jù)挖掘結(jié)果的信任度降低。數(shù)據(jù)清理去除噪聲或無關(guān)數(shù)據(jù),并處理數(shù)據(jù)中缺失的數(shù)據(jù)域。(3)數(shù)據(jù)歸納這里采用面向
13、屬性的歸納法進(jìn)行數(shù)據(jù)歸納。面向?qū)傩缘臍w納法就是以數(shù)據(jù)庫中關(guān)系表為基礎(chǔ),查詢收集任務(wù)相關(guān)數(shù)據(jù),形成任務(wù)相關(guān)基礎(chǔ)表;然后在基礎(chǔ)表的基礎(chǔ)上,對(duì)各屬性進(jìn)行分析和泛化,找出與決策規(guī)則有關(guān)聯(lián)的屬性,構(gòu)造出分類樣本模型。此時(shí)的數(shù)據(jù)樣本模型就是一個(gè)有效的、通過壓縮或泛化了的數(shù)據(jù)集合。這樣做的目的是設(shè)法減小數(shù)據(jù)規(guī)模,使之只與屬性值有關(guān)系,而與原始的數(shù)據(jù)量無關(guān),為更有效地產(chǎn)生決策樹提供了極大的方便,公司的員工信息關(guān)系數(shù)據(jù)庫的結(jié)構(gòu)示意圖如圖3所示:圖3員工信息關(guān)系數(shù)據(jù)庫結(jié)構(gòu)示意圖A.在職基本信息:?jiǎn)T工編號(hào)、姓名、性別、所在部門、現(xiàn)任職務(wù)、職稱、婚姻、年齡、政治面貌、入黨時(shí)間、文化程度、身份證號(hào)、入職時(shí)間。B.離職員
14、工基本信息:?jiǎn)T工編號(hào)、姓名、性別、所在部門、職稱、婚姻、年齡、政治面貌、入黨時(shí)間、文化程度、身份證號(hào)、離職時(shí)間。以某公司部分員土信息數(shù)據(jù)為例,通過SQL查詢語句對(duì)員工信息關(guān)系數(shù)據(jù)庫進(jìn)行壓縮、刪除、匯總等操作,得表1所示的相關(guān)基礎(chǔ)數(shù)據(jù)表:表1相關(guān)基礎(chǔ)數(shù)據(jù)表職工編號(hào)姓名職稱性別年齡是否離職00037563方*華低級(jí)女3500038795游*低級(jí)本科4000036125.卅女本科27是00055605低級(jí)本科25是000S2364低級(jí)碩七26是00038962柯沙*島級(jí)女本科職否00036785吳海*男???2否000&4562陳鳳*高級(jí)碩士3右000325I男號(hào)科54是00035624壬東*男26
15、00004618王丹卞申級(jí)女本科35否00039263趙*0級(jí)*察科38否00034521熊*屮級(jí)女碩七3900037659李慘中圾男碩1-5&000S9621中級(jí)男???巧(4)數(shù)據(jù)轉(zhuǎn)換ID3算法不能處理數(shù)值連續(xù)型屬性,必須將其進(jìn)行離散化處理,如屬性年齡。這里采用信息增益法,將連續(xù)型數(shù)據(jù)劃分成兩個(gè)區(qū)間,具體步驟如下:A.對(duì)屬性年齡進(jìn)行排序:(其中重復(fù)的值被合并),因?yàn)樽畲笾挡荒茏鳛榉至腰c(diǎn),所以只有12個(gè)可能的分裂點(diǎn),如表2所示。表2排序后的數(shù)據(jù)表屬性值25262735333940485458所屈是是,足.否否否否是否類B.然后用前述的方法計(jì)算每個(gè)分裂點(diǎn)的信息增益(Gain),選擇Gain值最
16、大的作為分裂點(diǎn),由于給定數(shù)據(jù)的I(A)相同,根據(jù)公式,只需計(jì)算信息嫡(information),選擇嫡值最小即可。根據(jù)公式,計(jì)算得到的信息嫡值表如下表3所示。表3排序后的數(shù)據(jù)表25262735363839485258所屈類是否躺否楚沓否否弄是E(A)0,8420.8880930.9830.9520.M90.180.9560.9400.9180.958空根據(jù)表3中E(A)欄所示結(jié)果顯示,分裂點(diǎn)為25(=25與25)。歸納后數(shù)據(jù)集為表4所示。表4歸納后的數(shù)據(jù)集範(fàn)編號(hào)職稱性別學(xué)歷年齡是否離職00037563方*華低級(jí)女碩士否否00038795低級(jí)男本科否否00036125低級(jí)女本暮否是0003569
17、5低級(jí)杠;是是00032564任級(jí)男碩匕00038962軻沙*鬲級(jí)女本科否否000367S5吳海*高級(jí)男與科否否00004562陳鳳*高級(jí)男碩七是00038251方*男專科否足00035624E東*中級(jí)男碩士否否00004618壬丹*中級(jí)女本科否00039263中級(jí)女本科否否00034521女碩T:杏否00037659李健*中級(jí)男頓士00039621王培*男否是3、決策樹的構(gòu)建由于篇幅所限,只取數(shù)據(jù)集中有代表性的十幾個(gè)數(shù)據(jù)作為模型創(chuàng)建輸入訓(xùn)練集。表5訓(xùn)練樣本編兮瞅稱年齡(1$屮5卜紳皿紳+存.000皿沁如果選取性別作為分類屬性,信息爛為:對(duì)于性別=44男S正例為5,反例為3,則有/?rlog?
18、=-*log-*log=0.956TOC o 1-5 h z#i亠*對(duì)于性別二女S正例為1,反例為6,則有;(176)=-JM丄恤冊(cè)V恤g$二orbits/=b6因此:鞏性別卜廠屯*乜叫二頭6956+?*0.596-0.786j_is1515如果選取學(xué)歷作為分類屬性,信息嫡為:對(duì)于學(xué)歷二“??啤保秊?,反例1,則有(2,1)=一丫西1吸=-*log-*log=0.91?加肚同33對(duì)于學(xué)歷=“本科舄正例為2,反例!,則有f(2,4)=-pbg;=-*log*log=0.9176(/5曰66對(duì)于學(xué)歷=“碩士爲(wèi)正例為乙反例1,則有I(2,4)-Pilog;*=-*log-*log釣=0.917b
19、itshi66因此:E(學(xué)歷卜蘭宀八f兒M5召石q計(jì)山亍閒京仞嚴(yán)門如沁如果選取年齡作為分類屬性,信息爛為:對(duì)于年齡=“=25役正例為5,反例為9,則有TOC o 1-5 h zf(5,9)=_pGg;二一專*lo裁_魯*log?。二(K94QMs因此:*E(年齡)衛(wèi)1(,卜丄*0.000+*0.940=orbitsj.is1515(3)計(jì)算信息增益;G如(司齡)(%暮心)-E(司)=0556-0.851=0.105teG曲(性別)(環(huán)旳,)-E(性別)=0.956-0.786=()JJObitsGo加(學(xué)歷)=/仙宀,罔_)-(學(xué)歷)=0.956-0.917二0Q39MsG為(年齡)二迫品“)
20、-(年齡卜0.956-0.877=0.07%我們可以看出屬性“性別”的信息增益最大,也就是說屬性“性別”提供的信息量最大,對(duì)于分類幫助最大,所以選擇“性別”作為根節(jié)點(diǎn)。(3)建立決策樹的根枝與分枝選擇屬性“性別”作為根節(jié)點(diǎn),并引出二個(gè)分枝,此時(shí),將訓(xùn)練實(shí)例集分為二個(gè)子集,生成包含二個(gè)葉節(jié)點(diǎn)的決策樹,如圖5所示。圖5根結(jié)點(diǎn)分類決策樹F面對(duì)圖5中葉結(jié)點(diǎn)進(jìn)行分類。表6結(jié)點(diǎn)1所包含的數(shù)據(jù)集編號(hào)職稱性抱學(xué)切年齡(2)=-j?/logJ=-*log-*log=l.GOQ&iisi-i44因此:“(學(xué)歷)=%+_珀治廠J二耳肌0+匕1.000皿750阪5Js&如果選取年齡作為分類屬性佶息爛為:對(duì)于年齡=“=
21、25”,正例為4,反例為3,則有Z(4,3)=-flog-*log;/-*lo3p=0.986toi-j了了因此:e(年齡卜心屮J-知30+尸|5耳-).y86=0.S6558計(jì)算信息增益:G血(司齡)=勺居,)-E(司齡)=0.9710.688=0.28鮎諭G伽(學(xué)歷)=/(耳居,,爲(wèi))-F僭歷)二0971-0.750二0.220佩Gain(年鈴)二/&心,心)-E(年齡卜(X971-0.S65二0Ambits選擇“職稱”作為分裂屬性,到這一步還需要繼續(xù)分裂,決策樹的這個(gè)分枝還未生成。F面對(duì)圖5中葉結(jié)點(diǎn)2進(jìn)行分類。表7葉結(jié)點(diǎn)2所包含的數(shù)據(jù)集職稱年齡昱否離職低級(jí)女枚士否是6本私否7高級(jí)女站科否
22、11申級(jí)女本科12門級(jí)女本科沓否13中圾女碩士否否由表4/7知,初始時(shí)刻lE例為1,反例為5所以開始吋的嫡值為:Z(l,6)=-p-logj=-*log-*log=0,589toc-i77如果選取職稱作為分類屬性,信息爛為:對(duì)于職稱二“低級(jí)”,工例為1,反例為1,則有Z(l,l)=-p,.log=-*log?-*log學(xué)=1.000加TOC o 1-5 h zmi22對(duì)于職稱=“中級(jí)”,正例為0,反例為3,則有=logj=-*log=0.000加信M3對(duì)于職稱=“高級(jí)”,正例為0,反例為2,則有/(0,2)=呂log?=-*log字=0.000b於z2因此:E(司齡)二片丿+$2/+_+幾丿/
23、(%,.)=2*1.000二0.2286b宓y=lS7如果選取學(xué)歷作為分類屬性,信息炳為:對(duì)于學(xué)歷=“??啤保秊?,反例為1,則有/(l,0)=-plog?=-i*log-QMObits=i1對(duì)于學(xué)歷=“本科”,正例為1,反例為3,則有/(l,l)=-plog?=-1*log彳一?*log?=0.81Ito/=!44對(duì)于學(xué)歷=“碩士3正例為0,反例為2,則有“0,2)二和磴=2叫遵-0.000to=i2因此:列學(xué)歷)+7:,%)-%=竝血;-1&/如果選取年齡作為分類屬性,信息爛為:對(duì)于年齡=25,正例為1,反例為6,則有Z(1T0)=Ptlog?:=-*log-*log二Q羔恥諭r-i7
24、7因此匸E(年齡)二讓巴=5寺卜屮,.)二上“5的二0.589to/=is4計(jì)算信息增益;G渝(司齡)“(咕忑)一(司i)=0,589-0286=0.3036toGain(學(xué)呵=1(厲角、也j-E(學(xué))-0.589-0,463=0.126hits-G諷年齡)=/匕禺,心)一列年齡)二0589-0.589=(X000宓選擇“職稱”作為分裂的屬性,將結(jié)點(diǎn)2分為三個(gè)子集,屬于不同的類。擴(kuò)展后的決策樹見圖6所示:圖7拓展后的決策樹繼續(xù)對(duì)結(jié)點(diǎn)3、結(jié)點(diǎn)4、結(jié)點(diǎn)5和結(jié)點(diǎn)6應(yīng)用上文的方法進(jìn)行分類,直到得到整棵決策樹,如圖7所示:圖8最終決策樹4、決策樹應(yīng)用結(jié)果分析在分析過程中,利用數(shù)據(jù)庫中相關(guān)的數(shù)據(jù),通過對(duì)員
25、工的職稱、性別、學(xué)歷、年齡等因素的分析,經(jīng)過數(shù)據(jù)選取、數(shù)據(jù)清理、數(shù)據(jù)歸納、數(shù)據(jù)轉(zhuǎn)換等過程,運(yùn)用決策樹中的ID3算法建立員工分類模型,提出分類規(guī)則,發(fā)現(xiàn)離職員工的主要特征。利用該模型對(duì)收集到的現(xiàn)有的在職員工數(shù)據(jù)進(jìn)行分析預(yù)測(cè),挖掘出其中的潛在的離職員工。從決策樹分類的結(jié)果可以看出離職員工的關(guān)鍵屬性信息分別為男性、職稱為低級(jí)、年齡小于25歲、高學(xué)歷。針對(duì)這些離職員工的關(guān)鍵屬性信息,應(yīng)該制定相應(yīng)的人力資源管理措施來挽留他們,使他們能繼續(xù)為公司的發(fā)展作貢獻(xiàn)。第一,男性的離職率要明顯高于女性。從公司的現(xiàn)狀來看,是因?yàn)楣镜钠髽I(yè)文化沒有充分發(fā)揮其作用,男性員工非常的想要公司給他們創(chuàng)造互相交流的機(jī)會(huì)。最好的方
26、法就是舉行各種運(yùn)動(dòng)俱樂部,這樣既可以增加員工之間的交流與溝通,也可以讓員工感受公司的關(guān)懷,從而使其凝聚力得到提高。第二,職稱為低級(jí)的員工易于離職。公司在新員工入職的時(shí)都會(huì)對(duì)其有一個(gè)職稱的評(píng)定,隨著工作的時(shí)間的增加,對(duì)其職稱也會(huì)進(jìn)行調(diào)整。由于公司在職稱調(diào)整的時(shí)候不是很及時(shí),導(dǎo)致低級(jí)職稱的員工對(duì)自己在公司的職稱不滿意。因此,應(yīng)該進(jìn)一步規(guī)范化職稱評(píng)定規(guī)則,及時(shí)、公正的對(duì)員工進(jìn)行職稱評(píng)定,進(jìn)而調(diào)整薪酬,使優(yōu)秀員工的能力和其薪酬相匹配。第三,年輕的員工離職率較高。新員工對(duì)公司的認(rèn)歸屬感來自于剛?cè)肼殨r(shí)的企業(yè)文化培訓(xùn),公司對(duì)新員工的入職培訓(xùn)很多時(shí)候是走形式。今后應(yīng)該加強(qiáng)新員工的入職培訓(xùn),使新員工充分了解公司
27、,增強(qiáng)對(duì)公司的歸屬感。第四,學(xué)歷較高的員工容易離職。公司是一家以銷售為主的IT企業(yè),傳統(tǒng)的思想認(rèn)為在沒有專業(yè)技能的時(shí)候才去作銷售,這樣就使高學(xué)歷的人認(rèn)為作銷售委屈了自己,還有一個(gè)原因是高學(xué)歷的員工認(rèn)為他們沒有得到應(yīng)有的報(bào)酬。針對(duì)這種情況,一方面要利用各種機(jī)會(huì)使高學(xué)歷員工明白他們的知識(shí)一樣的發(fā)揮著很好的作用,另一方面調(diào)整薪酬適當(dāng)?shù)臐M足他們的要求。以上四個(gè)屬性是該公司離職員工的關(guān)鍵屬性,有的離職員工可能具備其中的一、兩個(gè)關(guān)鍵屬性,有的則可能全都具備。因此公司在挽留有離職傾向的員工時(shí)不能只是片面的針對(duì)某一方面,應(yīng)該從公司的整體上考慮如何消除導(dǎo)致員工離職的關(guān)鍵屬性,從而為企業(yè)留住優(yōu)秀的員工。2.3決策
28、樹在人力資源管理中的價(jià)值決策樹為人力資源管理決策者提供了找到關(guān)鍵屬性的算法依據(jù),其價(jià)值在于可以科學(xué)精確地做到對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行評(píng)估,根據(jù)算法規(guī)則對(duì)趨勢(shì)做出預(yù)測(cè)。從數(shù)據(jù)結(jié)構(gòu)上來說,一旦系統(tǒng)得到一條信息完整的數(shù)據(jù)時(shí),這條數(shù)據(jù)便會(huì)根據(jù)系統(tǒng)預(yù)設(shè)的算法被歸類到它應(yīng)屬的類別,這個(gè)類別成為類標(biāo)號(hào)屬性的屬性確定,通過分析由屬性描述的數(shù)據(jù)庫元組來構(gòu)造模型。這些決策樹的算法,或者稱之為規(guī)則用來為以后的數(shù)據(jù)樣本分類,也為數(shù)據(jù)庫的內(nèi)容提供更好的了解。3數(shù)據(jù)挖掘技術(shù)在人力資源中應(yīng)用的展望全球化改變了各個(gè)領(lǐng)域的管理哲學(xué)和管理實(shí)踐,其中人力資源管理首當(dāng)其沖。人力資源管理是現(xiàn)代管理理論的新趨勢(shì),傳統(tǒng)的人力資源管理受到挑戰(zhàn),對(duì)于新
29、時(shí)期人力資源管理發(fā)展趨勢(shì)和特點(diǎn)有以下觀點(diǎn):第一,具有彈性和適應(yīng)性成為生存的基本條件。大多數(shù)公司運(yùn)用參與系統(tǒng)從事雇傭,發(fā)展適合的管理形態(tài),領(lǐng)導(dǎo)風(fēng)格和雇傭態(tài)度;建立功能團(tuán)隊(duì),超越傳統(tǒng)的“任務(wù)強(qiáng)制力”、“目標(biāo)團(tuán)隊(duì)”或“質(zhì)量循環(huán)”,認(rèn)識(shí)到初始階段團(tuán)隊(duì)在公司的位置;運(yùn)用自我評(píng)價(jià),參考優(yōu)秀的企業(yè)管理模式,擴(kuò)大技能,超越狹隘的功能界限,發(fā)展管理能力和技術(shù)。第二,組織的限制變得越來越少,雇傭方式成為公司競(jìng)爭(zhēng)優(yōu)勢(shì)的一個(gè)來源。傳統(tǒng)的人際關(guān)系消失,它使組織成員為一項(xiàng)任務(wù)而結(jié)合起來變的更復(fù)雜;組織的結(jié)構(gòu)變得扁平,中層管理者減少,工作群體和團(tuán)隊(duì)變得越來越重要;高質(zhì)量雇員數(shù)量增加,社會(huì)越來越需要組織的社會(huì)責(zé)任和倫理行為。
30、第三,全球化具有的競(jìng)爭(zhēng)優(yōu)勢(shì)形成知識(shí)。知識(shí)管理者看作一種戰(zhàn)略能力,只要被運(yùn)用于實(shí)踐,鼓勵(lì)發(fā)展、收集知識(shí),使公司設(shè)計(jì)一個(gè)其他競(jìng)爭(zhēng)者無法模仿的操作程序。組織學(xué)習(xí)藍(lán)圖的構(gòu)造在個(gè)人競(jìng)爭(zhēng)中產(chǎn)生力量是人力資源管理的任務(wù),因此組織學(xué)習(xí)可被理解為集體的現(xiàn)象,把個(gè)人學(xué)習(xí)作為基本出發(fā)點(diǎn)。通過收集經(jīng)驗(yàn)和通過實(shí)驗(yàn)方式學(xué)習(xí),產(chǎn)生獨(dú)特競(jìng)爭(zhēng)力,通過增加、聯(lián)合、更新知識(shí)產(chǎn)生新的知識(shí)并運(yùn)用于實(shí)踐,用開放的態(tài)度吸取經(jīng)驗(yàn),抓住面對(duì)失敗和錯(cuò)誤并從中吸取教訓(xùn)的機(jī)會(huì)。第四,人力資源管理集中于激勵(lì),提高積極性和創(chuàng)造性,集中于增加人們的活力,充分發(fā)揮每個(gè)人的才能,從而加強(qiáng)企業(yè)競(jìng)爭(zhēng)力,樹立良好的企業(yè)形象。新時(shí)期人力資源管理發(fā)展趨勢(shì)和特點(diǎn)越來越要求在組織規(guī)模不斷擴(kuò)大的今天,作為管理人員和組織領(lǐng)導(dǎo)者要想做到對(duì)組織進(jìn)行有效的管理和正確的決策就必須借助于數(shù)字化工具的幫助。目前對(duì)于人力資源數(shù)字化的了解及應(yīng)用越來越普及,人們對(duì)于數(shù)字化的人力資源工具能夠更好地幫到?jīng)Q策者做相關(guān)分析和管理都毫無質(zhì)疑。但對(duì)于數(shù)據(jù)挖掘在“人力資源管理”的研究及應(yīng)用卻始終沒有“客戶關(guān)系管理”來得廣泛透徹。但是隨著人們對(duì)人力資源管理的認(rèn)識(shí)不斷加深,對(duì)于人力資源管理能夠帶來不菲價(jià)值的理解不斷提高
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年山東公務(wù)員考試行測(cè)試題
- 2025年太陽能光伏組件安裝服務(wù)合同
- 2025年商業(yè)地產(chǎn)租賃協(xié)議深度剖析
- 2025年醫(yī)院食堂食用油采購協(xié)議
- 2025年紫外光固化油墨項(xiàng)目規(guī)劃申請(qǐng)報(bào)告
- 2025年互聯(lián)網(wǎng)用戶權(quán)益協(xié)議
- 2025年貨運(yùn)司機(jī)勞動(dòng)合同
- 2025年腫瘤類生物制品項(xiàng)目提案報(bào)告模范
- 2025年保障性住房貸款合同
- 2025年標(biāo)準(zhǔn)個(gè)人古董押借款合同樣本
- 輔導(dǎo)員入職培訓(xùn)課件
- 中建雨季專項(xiàng)施工方案
- 《我國個(gè)人所得稅制下稅收征管問題研究》
- 建筑工程三通一平技術(shù)方案
- 綠化養(yǎng)護(hù)工安全培訓(xùn)
- DB21-T 1720-2017海水源熱泵系統(tǒng)工程技術(shù)規(guī)程
- 組長(zhǎng)競(jìng)選課件教學(xué)課件
- 《基于UTAUT2模型的虛擬學(xué)術(shù)社區(qū)用戶持續(xù)使用意愿影響因素研究》
- 2022年公務(wù)員多省聯(lián)考《申論》真題(遼寧A卷)及答案解析
- 2024 ESC慢性冠脈綜合征指南解讀(全)
- 消防設(shè)施操作員(初級(jí))題庫與參考答案
評(píng)論
0/150
提交評(píng)論