AI+HR黑科技秘笈-AI賦能人力資本智能化變革_第1頁
AI+HR黑科技秘笈-AI賦能人力資本智能化變革_第2頁
AI+HR黑科技秘笈-AI賦能人力資本智能化變革_第3頁
AI+HR黑科技秘笈-AI賦能人力資本智能化變革_第4頁
AI+HR黑科技秘笈-AI賦能人力資本智能化變革_第5頁
已閱讀5頁,還剩190頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

AI黑科技揭秘AI+HR創(chuàng)新應(yīng)用頂尖科學(xué)家團(tuán)隊(duì)力作獻(xiàn)給走在數(shù)字化浪潮前沿的HR們,數(shù)字經(jīng)濟(jì)時(shí)代已全面開啟,大數(shù)據(jù)、人工智能、云計(jì)算等新科技推動(dòng)經(jīng)濟(jì)、社會(huì)、企業(yè)發(fā)生翻天覆地的變化,也將賦予人力資本巨大的變革力量。企業(yè)紛紛在尋求智慧變革,人力資源部門是推動(dòng)企業(yè)變革的重要?jiǎng)恿χ?,HR也要時(shí)刻隨著時(shí)代和科技的變化而變化,找到并駕馭合適、高效的智能化工具。在這場(chǎng)浪潮中,思變的企業(yè)和HR們已經(jīng)開始尋求變革新路徑。作為人力資本數(shù)字化平臺(tái)和數(shù)字化人才戰(zhàn)略的先行者,e成科技將始終與您同在,攜手開啟人力資本數(shù)字化新時(shí)代!”本專欄內(nèi)容由HR圖靈學(xué)院出品,HR圖靈學(xué)院是e成科技打造的HR領(lǐng)域第一AI專欄,希望以此為窗口,向HR傳達(dá)專業(yè)的AI知識(shí)與信息,賦予人力資本領(lǐng)域變革力量,以AI為鑰,攜手HR開啟數(shù)字化變革之門!在這里,HR們可以得到前沿技術(shù)思考、行業(yè)技術(shù)干貨、全球AI好物、HR+AI創(chuàng)新應(yīng)用等。02-0910-1702-0910-1718-2318-2324-2924-2930-3637-4230-3637-4243-5143-5152-6061-6852-6061-6869-75第七部分智能職業(yè)發(fā)展規(guī)劃76-8476-8485-9485-94讓AI技術(shù)提升人崗匹配效果,我們做了這些探索解鎖這項(xiàng)AI黑科技,馬上實(shí)現(xiàn)人崗匹配自由AI黑科技:Embedding、知識(shí)圖譜(KG)方法、自然語言處理(NLP)、非線性樹模型、deep模型、BERT、Word2Vec模型等讓AI技術(shù)提升人崗匹配效果,我們做了這些探索本期和大家討論下“人崗匹配排序的探索與實(shí)踐”。從人力資源管理的發(fā)展來看,人崗匹配大致經(jīng)歷了三個(gè)階段,“三歷對(duì)照法”、“冰山挖掘法”、“全人匹配法”,而AI技術(shù)的引用將為企業(yè)迎來第四個(gè)——“數(shù)據(jù)解剖法”。AI技術(shù)實(shí)現(xiàn)人崗匹配,離不開數(shù)據(jù)的處理和模型的選擇與訓(xùn)練,看似高深、復(fù)雜的人崗匹配算創(chuàng)新應(yīng)用?!叭藣徠ヅ洹笔瞧髽I(yè)人力資源管理的核心問題,更是所有HR追求的目標(biāo)。毫不夸張地說,“人崗匹配”是人力資源的起點(diǎn),也是人力資源的核心目標(biāo)之一。本質(zhì)上,企業(yè)和個(gè)人是利益共同體,只有使得組織利益和個(gè)體價(jià)值得才能使人才發(fā)揮最大價(jià)值,同時(shí)激活組織。那么,HR如何做好人崗匹配呢?以前,在千百萬份簡(jiǎn)歷中篩選人才,是HR工作中“解不開的劫”,每天花費(fèi)大量的時(shí)間和精力對(duì)優(yōu)秀簡(jiǎn)歷和職位信息人工做匹配,不僅消耗著HR的積極性,往往結(jié)果也不盡如人意,篩不到合適的人才,難以滿足業(yè)務(wù)部門的需求。現(xiàn)在,數(shù)字經(jīng)濟(jì)時(shí)代的新技術(shù)給HR帶來了更多可能,AI技術(shù)將助力HR實(shí)現(xiàn)智能人崗匹配、大大提升人崗匹配效率與準(zhǔn)確率,將HR從機(jī)械、瑣碎的招聘工作中解放出來。那么,實(shí)現(xiàn)AI人崗匹配背后的依據(jù)和邏輯又是什么呢?e成科技基于前沿的自然語言處理技術(shù)和深度學(xué)習(xí)模型,并結(jié)合大量數(shù)據(jù)和知識(shí)圖譜,通過不斷探索和反復(fù)實(shí)踐,形成一套高效的人崗匹配推薦算法系統(tǒng),下面院長(zhǎng)將詳細(xì)為大家介紹這套系統(tǒng)及其背后的邏輯。根據(jù)發(fā)布職位來推薦簡(jiǎn)歷,該場(chǎng)景中需要優(yōu)化推薦的準(zhǔn)確率、召回率,提升HR更高的工作效率,提升崗位和簡(jiǎn)歷的匹配度來減少招聘人才的成本。在經(jīng)典的機(jī)器學(xué)習(xí)排序模型中通常分為兩種:復(fù)雜的人工特征工程+簡(jiǎn)單的模型,簡(jiǎn)單的人工特征+復(fù)雜的模型。本著該原則我們對(duì)以文本為主的職位和簡(jiǎn)歷對(duì)進(jìn)行了匹配排序?qū)嵺`。特征為王以JD和CV對(duì)為背景,該場(chǎng)景為經(jīng)典的機(jī)器學(xué)習(xí)排序問題,目標(biāo)在于預(yù)測(cè)JD和CV是否匹配,數(shù)據(jù)集的采集則是來自我司產(chǎn)品ATS平臺(tái),HR從系統(tǒng)根據(jù)JD推薦的CV來進(jìn)行選擇,符合要求將要走面試程序的則標(biāo)為1,否則標(biāo)為0。2.1特征介紹常見的JD如下圖1所示,其中包含格式化離散數(shù)據(jù)和整段文本數(shù)據(jù),從整段文本數(shù)據(jù)獲取招聘意圖是提取JD特征的重點(diǎn)難點(diǎn)。為了更好的解決該問題,我們分別引入知識(shí)圖譜(KG)方法和自然語言處理(NLP)方法,其中KG負(fù)責(zé)去充分提取文本中實(shí)體的關(guān)系和聯(lián)系,NLP則更好的獲取JD本文和CV文本相似性信息。因涉及個(gè)人隱私此處不展示CV信息。在以JD和CV對(duì)是否匹配的背景下,我們將特征主要分為以下幾類:JD特征:包含地點(diǎn),學(xué)歷硬性要求和利用知識(shí)圖譜中提取的實(shí)體特征如(職能,公司,技能,專業(yè),行業(yè))等;CV特征:包含性別,年齡,學(xué)歷等基礎(chǔ)信息和從工作經(jīng)歷描述文本中提取的實(shí)體信息,以及文本類特征等。2.2特征處理>在獲取JD和CV的基礎(chǔ)特征之后我們主要將特征主要分為四種類型:ID離散特征:比如UID,職能ID,公司ID,行業(yè)ID,技能ID,專業(yè)ID等。硬性離散類特征:除了性別,年齡,工作地點(diǎn)等基礎(chǔ)類型特征,還包含有知識(shí)圖譜提取的實(shí)體之間的關(guān)系特征比如學(xué)校是否匹配,職能(工作職位對(duì)應(yīng)能力)是否匹配等,此處成為match特征。連續(xù)性特征:除薪資等,還包含有知識(shí)圖譜提取的實(shí)體之間的graphembedding的vector相似性值,此處成為IDsim特征。Emdedding特征:包括了ID離散特征的vector,該vector有知識(shí)圖譜的graphembedding方法產(chǎn)生(如DeepWalk,LINE等)。文本embedding特征,該特征以JD和CV對(duì)的方式輸入DSSM模型產(chǎn)生vector。在此基礎(chǔ)上我們還加入了相應(yīng)統(tǒng)計(jì)特征,統(tǒng)計(jì)特征主要有強(qiáng)特征的共現(xiàn)特征以及強(qiáng)特征之間的能力不同。模型演變?cè)谀P头矫嬷饕梢苑譃閮蓚€(gè)總方向,分別是非線性樹和deep模型的探索,在探索上主要是根據(jù)不同模型的性質(zhì)進(jìn)行特征工程。3.1非線性樹模型>我們主要以gbdt為主的樹模型展開特征工程的探索,gbdt的實(shí)現(xiàn)以xgboost和lgb為主。gbdt模型結(jié)構(gòu)如圖2所示,gbdt為一個(gè)boosting模型,通過疊加多個(gè)弱模型來提升擬合能力,根據(jù)xgboost模型的優(yōu)缺點(diǎn)我們可以充分挖掘可用特征。我們?cè)俅握砩弦还?jié)可用特征,主要有ID類特征(職能、行業(yè)、公司、技能、專業(yè)等基本信息匹配特征(年齡,工作經(jīng)驗(yàn),學(xué)校等)該特征為二分類特征,以JD和CV的ID類特征是否匹配來構(gòu)建二分類特征(如職能是否匹配等稱為match特征將這兩類統(tǒng)稱為硬性離散類特征;JD和CV類的graphembedding產(chǎn)生vector對(duì)計(jì)算余弦值作為連續(xù)特征(稱為IDsim特征),加上文本相似性特征(稱為textsim特征)和薪資組成連續(xù)特征。值得注意的是文本特征主要根據(jù)JD和CV的格式分為title和description兩個(gè)部分來挖掘xgboost處理連續(xù)值的缺點(diǎn)我們將連續(xù)值進(jìn)行分桶,桶數(shù)可由某維特征的分布來確定。將ID類特征也一同加入到樹模型中,這是考慮到組合特征的業(yè)務(wù)意義。分析特征重要性之后,我們根據(jù)特征現(xiàn)象去做統(tǒng)計(jì)特征,比如出現(xiàn)頻率統(tǒng)計(jì),特征共現(xiàn)統(tǒng)計(jì),多維特征多樣性統(tǒng)計(jì)等操作。相對(duì)應(yīng)的title和description文本特征也可通過簡(jiǎn)單的加權(quán)命中率來構(gòu)成特征加入到樹模型中??傊畬?shí)驗(yàn)證明ID類特征,二分類特征,連續(xù)特征離散化,統(tǒng)計(jì)類特征,以及的vector的交叉特征都會(huì)給模型帶來正向收益。embedding產(chǎn)生3.2深度模型的探索>的弊端就是模型的可解釋性變差,根據(jù)結(jié)果反向特征工程變得困難起來。我們?cè)贘D和CV匹配場(chǎng)景下分別使用了DNN,Wide&Deep,DeepFM,等模型嘗試。同時(shí)并借鑒了PNN、DCN、DLRM和DKN網(wǎng)絡(luò)原理正在適配適合現(xiàn)有數(shù)據(jù)類型的模型。本節(jié)主要簡(jiǎn)要介紹DNN和Wide&Deep,DeepFM的使用,再闡述對(duì)現(xiàn)有數(shù)據(jù)的思考。以YouTube的經(jīng)典NN為開端(如圖3,引用自相應(yīng)論文),現(xiàn)有的數(shù)據(jù)下如何去使用DNN達(dá)到收益正是我們所考慮的。在現(xiàn)有的特征中除了上文提到的二分類特征,embedding相似性等特征之外我們包含知識(shí)圖譜抽取的實(shí)體embedding和文本embedding。文本embedding主要有DSSM模型產(chǎn)生,雙塔模型的輸入分別為JD的title、description,CV工作經(jīng)驗(yàn)的title、description,雙塔輸出為JD和CV是否匹配。我們以雙塔的每坐塔的最后輸出vector作為JD和CV的表征。本著論文中提到的原理我們?nèi)コ藰淠P椭蠭D類特征,換成了ID對(duì)應(yīng)的vector,保留原有的二分類和連續(xù)特征,另外在加入了文本embedding特征,最后的結(jié)果不是很樂觀。因此分析原因可能是某些特征缺失ID(比如CV職能等)初始化為0導(dǎo)致,還存在的原因可能是由于IDvector的知識(shí)結(jié)構(gòu)和文本embedding知識(shí)結(jié)構(gòu)不同導(dǎo)致,此處知識(shí)結(jié)構(gòu)可以理解為不同訓(xùn)練任務(wù)下的embedding空間結(jié)構(gòu)。經(jīng)歷了DNN嘗試沒帶來正向收益我們偏向于以線性和深度非線性結(jié)合的Wide&Deep結(jié)構(gòu)(如圖4)進(jìn)行適配,此時(shí)我們考慮到DNN的實(shí)驗(yàn)產(chǎn)生的問題。embedding的結(jié)果,我們采用ID類特征進(jìn)行隨機(jī)初始化的embedding在連接match,IDsim和textsim等特征作為deep的輸入,將match,IDsim,textsim連接作為wide的輸入。以輸入ID類特征,match類特征,IDsim特征,textsim的xgboost模型作為wide&deep的比較模型,實(shí)驗(yàn)證明wide&deep模型略優(yōu)于xgboost模型,但是如果對(duì)此基礎(chǔ)上xgboost做統(tǒng)計(jì)特征則可超過wide&deep模型。以上可得deep模型非線性表征能力還是略微的比xgboost能力強(qiáng)。deepFM模型,deepFM模型結(jié)構(gòu)圖如圖5所示(引用自deepFM相應(yīng)論文),deepFM將wide&deep的wide部分替換成了FM機(jī)制提升了模型對(duì)特征的交叉組合能力。根據(jù)此模型特征我們將UID,圖譜產(chǎn)生的ID類特征等稀疏特征輸入FM部分,match特征、IDsim特征以及textsim特征為dense特征輸入。結(jié)果很是令人歡喜,達(dá)到了以上實(shí)驗(yàn)的最優(yōu)值,可能這就是深度學(xué)習(xí)帶來的魅力吧。在喜悅的同時(shí),我們想現(xiàn)有的ID初始化embedding都能產(chǎn)生如此大的魅力,利用graphembedding豈不更加喜人。在DeepFM模型輸入基礎(chǔ)上我們將ID的graphembedding也加入到模型的densefeature部分,然而實(shí)驗(yàn)證明并沒有想當(dāng)然的好,甚至產(chǎn)生了負(fù)作用。但至少證明了特征交叉能帶來收益,至于graphembedding的加入為啥效果不好卻是值得思考和探索的問題。經(jīng)過上面的探索我們獲取了一些經(jīng)驗(yàn),例如交叉特征有用,用embedding產(chǎn)生的向量?jī)蓛上嗨菩杂?jì)算對(duì)樹模型有用,因此我們本著上面積累的經(jīng)驗(yàn)進(jìn)行了人工構(gòu)建交叉特征作為xgboost模型的輸入。在此基礎(chǔ)上加入統(tǒng)計(jì)特征,這波操作再次給我們帶來了0.5%的收益。最后總結(jié)下模型方面的探索結(jié)果,以上實(shí)驗(yàn)說明我們還沒有充分利用graphembedding和由DSSM產(chǎn)出的文本embedding,也證明了embedding內(nèi)涵的巨大作用,后期我們將加大力度去挖掘該部分的內(nèi)容。03現(xiàn)階段成果和未來展望4.1現(xiàn)階段成果>經(jīng)過上文特征和模型的探索在此我們分方案來展示我們的實(shí)驗(yàn)結(jié)果,分別包含以下方案:方案1:ID類特征+match特征+IDsim特征+textsim特征+gbdt方案2:IDvector特征+match特征+IDsim特征+textvector特征+dnn方案3:ID類特征(隨機(jī)初始化embedding)+match特征+IDsim特征+textsim特征+deepFM方案4:ID類特征+match特征+IDsim特征+IDvectorinner(交叉)特征+textsim特征+統(tǒng)計(jì)特征+gbdt主要以這四種有效的遞進(jìn)關(guān)系來展示,其中多種的組合嘗試就不一一列舉了。效果如表格1中,我們的評(píng)價(jià)指標(biāo)主要為正例的準(zhǔn)確率,召回率,F(xiàn)1值和總的AUC值作為評(píng)價(jià)指標(biāo)。以上結(jié)果都為數(shù)據(jù)清洗特征工程后結(jié)果,本次數(shù)據(jù)量JD和CV對(duì)大致為86萬,其中負(fù)例和正例比大致為7:1,我們將其隨機(jī)分成8:1:1其中8成訓(xùn)練集、1成訓(xùn)練集和1成測(cè)試集。4.2未來展望>據(jù)質(zhì)量和量的保證下我們相信深度學(xué)習(xí)帶來的魅力是巨大的。最近由Facebook出品的DLRM處理異構(gòu)embedding的能力使我們躍躍欲試。另外由微軟出品的DKN網(wǎng)絡(luò)也證明了graphembedding所隱藏的信息量對(duì)推薦效果有很大幫助。文獻(xiàn)5中結(jié)合知識(shí)圖譜在電商環(huán)境下的推薦也使得我們相信充分挖掘embedding信息可以帶來不錯(cuò)的收益。作為以技術(shù)為驅(qū)動(dòng)的企業(yè),e成科技在AI技術(shù)的基礎(chǔ)上,創(chuàng)新性地提出基于人才畫像和崗位畫像的匹配,為人崗匹配帶來革命性變革。e成科技作為HR+AI賽道的領(lǐng)跑者,一直專注于AI技術(shù)在人力資本領(lǐng)域創(chuàng)新應(yīng)用,開創(chuàng)性地將AI技術(shù)與人力資本場(chǎng)景深度結(jié)合。基于6年的AI能力和行業(yè)經(jīng)驗(yàn)積累,e成科技打造了AI開放平臺(tái),將AI能力和產(chǎn)品整合至AI開放平臺(tái),并通過開放平臺(tái)將AI能力開放給所有企業(yè)和友商。e成科技AI開放平臺(tái)是HR賽道首個(gè)企業(yè)自主研發(fā)的聚焦人力資本場(chǎng)景的一站式AI能力服務(wù)平臺(tái),覆蓋簡(jiǎn)歷解析、人崗匹配、HR機(jī)器人等諸多場(chǎng)景,通過OpenAPI及需求定制等形式,面向所有自研系統(tǒng)大型企業(yè)、垂直招聘平臺(tái)、傳統(tǒng)HR行業(yè)廠商等企業(yè)用戶提供智能化服務(wù)。未來,我們將一直保持高效的創(chuàng)新與研發(fā)能力,將前沿的AI技術(shù)深度融合至人力資本場(chǎng)景,為所有企業(yè)賦能。文獻(xiàn)引用:[1]ChenT,GuestrinC.XGBoost:AScalableTreeBoostingSystem[J].2016.[2]CovingtonP,AdamsJ,SarginE,etal.DeepNeuralNetworksforYouTubeRecommendations[C].-conferenceonrecommendersystems,2016:191-198.[3]ChengH,KocL,HarmsenJ,etal.Wide&DeepLearningforRecommenderSystems[C].conferenceonrecommendersystems,2016:7-10.[4]GuoH,TangR,YeY,etal.DeepFM:AFactorization-MachinebasedNeuralNetworkforCTRPre-diction[J].arXiv:InformationRetrieval,2017.[5]WangJ,HuangP,ZhaoH,etal.Billion-scaleCommodityEmbeddingforE-commerceRecommen-dationinAlibaba[C].knowledgediscoveryanddatamining,2018:839-848.作者:e成科技人崗匹配團(tuán)隊(duì)汪序明(掃描二維碼查看文章)一切皆可Embedding一切皆可Embedding解鎖這項(xiàng)AI黑科技,馬上實(shí)現(xiàn)人崗匹配自由人崗匹配,是企業(yè)人力資源管理的核心之一,更是HR招聘工作的精髓。傳統(tǒng)工作方式下,簡(jiǎn)歷搜索和人崗匹配往往消耗HR大量時(shí)間和精力,結(jié)果卻往往不精準(zhǔn),隨著人工智能和NLP技術(shù)的發(fā)展,一些招聘網(wǎng)站紛紛推出自動(dòng)化推薦功能,但卻同質(zhì)化嚴(yán)重,準(zhǔn)確率不高?,F(xiàn)在“graphembedding”在人力資本領(lǐng)域落地且取得不俗效果,助力人崗匹配更加高效,這樣的AI技術(shù),作為HR的你值得擁有!在NLP(自然語言處理)中,自然語言無法直接應(yīng)用到數(shù)學(xué)模型的建立中,需要將其映射到歐式空間。Embedding就是解決如何將自然語言表示為向量的,Google推出了Word2Vec模型,可以將語義相近的詞映射到向量空間中相近的位置,之后Google又提出了BERT,BERT可以析等多個(gè)語言任務(wù)的表現(xiàn)。同時(shí),Embedding也可以作為深度學(xué)習(xí)模型的隱藏層,可以極大提高模型的表現(xiàn)。自從word2vec橫空出世,似乎各行各業(yè)的一切東西都在被Embedding,Embedding在數(shù)學(xué)上表示一個(gè)映射F:X->Y,也就是一個(gè)函數(shù),其中該函數(shù)是一一對(duì)應(yīng)的而且保持空間同構(gòu)性(即在X空間是近鄰的,則被映射到Y(jié)空間也是近鄰的)。Embedding技術(shù)被應(yīng)用在了多種業(yè)務(wù)場(chǎng)1)在Airbnb中實(shí)現(xiàn)實(shí)時(shí)個(gè)性化搜索,利用用戶近幾周或者近幾個(gè)月點(diǎn)擊過的房源行為數(shù)據(jù)實(shí)時(shí)對(duì)用戶的搜索目標(biāo)房源進(jìn)行相似度比較和排序,這樣既極大的提高了效率而且也保證的搜索房源的準(zhǔn)確性提高了用戶體驗(yàn)。2)在電子商務(wù)領(lǐng)域,根據(jù)用戶的瀏覽和購買行為數(shù)據(jù),通過深度學(xué)習(xí)模型可以將用戶和物品同時(shí)嵌入(embedding)到相同的低維空間,然后利用Embedding計(jì)算用戶和物品之間的相似度(匹配度)直接給用戶推薦感興趣的物品。在人力資本領(lǐng)域,求職者、公司、職位、專業(yè)、技能等不同的實(shí)體間存在著多種類型的關(guān)系,構(gòu)成了一個(gè)知識(shí)圖譜(KnowledgeGraph)。這里,我們主要關(guān)注的是GraphEmbedding(其實(shí)也可以稱為NetworkEmbedding)。我們利用GraphEmbedding技術(shù),把這些實(shí)體嵌入到低維的向量空間,可以直接比較他們的相似性,并能大大的提高簡(jiǎn)歷和崗位的匹配效果。對(duì)于具有較多類型節(jié)點(diǎn)且各類型節(jié)點(diǎn)的數(shù)量巨大來說這是比較好的嘗試,而且取得了一些效果。生成GraphEmbedding常用方法及其原理由于graphembedding的廣泛應(yīng)用,同時(shí)衍生出了很多計(jì)算embedding的方法,下面我們介紹幾種商業(yè)上比較常用的幾種方法:1)DeepWalkDeepWalk[3]是KDD2014的一篇文章,我們常用的word2vec是根據(jù)詞的共現(xiàn)關(guān)系利用skipgram和COBW將詞映射到低維向量。DeepWalk算法思路其實(shí)是利用了word2vec生成embedding的一種方法skipgram,對(duì)于已經(jīng)建立的Graph來說每個(gè)節(jié)點(diǎn)可以是不同的實(shí)體且實(shí)體時(shí)間可以有不同的關(guān)系,從圖上的一個(gè)節(jié)點(diǎn)開始隨機(jī)游走(randomwalk如果節(jié)點(diǎn)之間有weight可以根據(jù)weight的不同進(jìn)行walk來生成類似文本的序列數(shù)據(jù),實(shí)體id作為一個(gè)個(gè)詞使用skipgram訓(xùn)練得到詞向量。算法的大體思路就是:根據(jù)圖中節(jié)點(diǎn)隨機(jī)游走->生成一定長(zhǎng)度的序列->利用skip-gram進(jìn)行訓(xùn)練。2)LINELINE(Large-scaleInformationNetworkEmbedding)是2015年文章[4]中微軟亞洲研究院提出來的一種算法,LINE定義了兩種度量節(jié)點(diǎn)相似度的方法:一階相似度(First-orderproximity)和二階相似度(Second-orderproximity)。一階相似度節(jié)點(diǎn)之間無連接,則一階相似度為0;對(duì)每個(gè)無向邊,定義頂點(diǎn)和的聯(lián)合概率分布為:是頂點(diǎn)的低維向量表示,我們的目的就是使得經(jīng)驗(yàn)分布和概率分布盡可能的接近,于是我們定義以下一階相似度的目標(biāo)函數(shù):其中為兩種分布之間的距離,為空間上的一個(gè)分布,=是它的經(jīng)驗(yàn)分布,其中W為兩點(diǎn)間邊權(quán)重總和。我們選擇KL散度來計(jì)算(2)式子。分布q,比較兩個(gè)概率分布的相似性:將,帶入KL散度的公式我們得到︰KL散度的計(jì)算公式其實(shí)是熵計(jì)算公式的簡(jiǎn)單變形,在原有概率分布分布q,比較兩個(gè)概率分布的相似性:將,帶入KL散度的公式我們得到︰其中C為一個(gè)常數(shù),需要注意的是,一階相似度僅適用于無向圖,而不適用于有向圖。二階相似度越高則它們的相似性就越高。二階相似性假定與其他頂點(diǎn)共享鄰居頂點(diǎn)的兩個(gè)點(diǎn)彼此相似(無向有向均可),一個(gè)向量和分別表示頂點(diǎn)本身和其他頂點(diǎn)的特定“上下文”,意為二階相似。對(duì)于每個(gè)有向邊,我們首先定義由頂點(diǎn)生成“上下文”的概率:式子(5)是一個(gè)條件分布,對(duì)于頂點(diǎn),我們的目的就是要擬合與其經(jīng)驗(yàn)分布。為邊的權(quán)重,為相鄰邊的權(quán)重的和,因此最小化以下目標(biāo)函數(shù):d(,)上文已經(jīng)說明,來表示頂點(diǎn)的度數(shù)。這里我們令利用KL散度同一階相似性的推導(dǎo)類似我們可以得到二階相似性的計(jì)算公式(去掉常數(shù)項(xiàng))為:3)Node2vecNode2vec[5]3)Node2vecNode2vec[5]算法是在DeepWalk基礎(chǔ)上進(jìn)行了改進(jìn),主要的創(chuàng)新點(diǎn)在于改進(jìn)了隨機(jī)游走的策略,DeepWalk中根據(jù)邊的權(quán)重進(jìn)行隨機(jī)游走,而Node2vec加了一個(gè)權(quán)重調(diào)整參數(shù),同時(shí)考慮到局部和宏觀的信息,并且具有很高的適應(yīng)性。除了以上提到的常用的生成embedding方法,學(xué)術(shù)界和工業(yè)界還提出了很多方法,像SDNE[6]、Struc2vec、Starspace[7](Facebook用的技術(shù))、EGES(阿里巴巴推薦使用的技術(shù)之一)GraphEmbedding為人崗匹配帶來新突破在人力資本行業(yè)最主要的兩大核心要素就是簡(jiǎn)歷CV和工作崗位JD,如何讓CV和JD匹配是人力資本行業(yè)一直非常重視的問題也是一個(gè)難題。我們?cè)谌肆Y本行業(yè)領(lǐng)域?qū)mbedding的嘗試和應(yīng)用,并且取得了一定的效果。有效的graph1)原始文本處理想要有效的進(jìn)行人崗匹配(即CV和JD的合理匹配),需要綜合考慮包括職能、行業(yè)、技能、專業(yè)等維度在內(nèi)的多維度匹配。首先應(yīng)該提取CV、JD中的文本特征,可以利用深度學(xué)習(xí)模型提取出CV、JD的文本特征,我們這里稱為實(shí)體。抽取出實(shí)體之后,我們就可以進(jìn)行CV和JD的匹配,對(duì)于自由文本來說除了CV和JD的實(shí)體完全匹配上,可以算他們的相似度,詞的語義相似度無法完全的詮釋。舉個(gè)例子:CV的特征:技能實(shí)體(JAVA),職能實(shí)體(JAVA開發(fā)工程師)、專業(yè)實(shí)體(計(jì)算機(jī))JD的特征:技能實(shí)體(Spring),職能實(shí)體(JAVA后端開發(fā))、專業(yè)實(shí)體(信息技術(shù))從詞的表面是無法區(qū)分他們的相似度的。下面就用到了embedding,embedding可以將這些實(shí)體嵌入到同一低維的向量空間,在空間中實(shí)體之間的距離可以通過數(shù)學(xué)公式計(jì)算從而表示他們的相似性。2)生成實(shí)體embedding第一步:數(shù)據(jù)的生成,我們首先利用CV、JD中不同實(shí)體的共現(xiàn),以及不同工作經(jīng)歷之間的跳轉(zhuǎn)來抽取簡(jiǎn)歷中的實(shí)體跳轉(zhuǎn),這些不同的實(shí)體之間可以構(gòu)成network如圖1所示。不同的實(shí)體就是不同的節(jié)點(diǎn),實(shí)線就是節(jié)點(diǎn)之間的邊也可以稱為關(guān)系。圖1第二步:使用Deepwalk、LINE生成embedding。對(duì)于Deepwalk可以直接根據(jù)network生成不同的文本序列,利用skip-gram進(jìn)行模型的訓(xùn)練。而對(duì)于LINE可以直接利用不同實(shí)體的共現(xiàn)次數(shù)作為模型的輸入。第三步:優(yōu)化訓(xùn)練數(shù)據(jù)。我們發(fā)現(xiàn)不同的實(shí)體出現(xiàn)次數(shù)的量級(jí)是不同的,比如專業(yè)在JD中就很少出現(xiàn),這樣就導(dǎo)致了數(shù)據(jù)的不平衡。我們解決的方式是,統(tǒng)計(jì)了不同實(shí)體之間的t?df、npmi(NormalPointwiseMutualInformation)作為實(shí)體之間的權(quán)重,即表示了不同實(shí)體之間關(guān)系的強(qiáng)弱程度,之后再進(jìn)行模型的訓(xùn)練。第四步:以上都是利用無監(jiān)督的方式去訓(xùn)練embedding,由于e成科技有自己獨(dú)立的人力資源ATS系統(tǒng),包含了用戶大量的真實(shí)行為數(shù)據(jù)。把其中匹配上的CV、JD作為正例,未匹配上的作為負(fù)例,構(gòu)造出有監(jiān)督的訓(xùn)練數(shù)據(jù)。將JD作為query,CV作為title,利用DSSM模型(如圖2)進(jìn)行有監(jiān)督的模型訓(xùn)練。需要注意的是這里的embedding層并不是隨機(jī)初始化的,而是利用第三步已經(jīng)訓(xùn)練過的embedding作為預(yù)訓(xùn)練的權(quán)重。這樣有監(jiān)督訓(xùn)練的目的就是利用真實(shí)的行為數(shù)據(jù)更新embedding層的數(shù)據(jù),使得每個(gè)實(shí)體的embedding更能好的表達(dá)在招聘這個(gè)業(yè)務(wù)場(chǎng)景中的語義。圖1我們使用內(nèi)部標(biāo)注的評(píng)估數(shù)據(jù)對(duì)不同模型進(jìn)行了評(píng)估,比較結(jié)果如下:以下是fasttext和graphembedding模型輸出的top相關(guān)公司實(shí)體的一些例子。可以看到FastText單單只從字面意思進(jìn)行了相似度匹配;而graphembedding模型輸出結(jié)果能夠更好地包含了具有相似業(yè)務(wù)、相似規(guī)模的公司,具有更好的語義相關(guān)性。以下是fasttext和graphembedding模型輸出的top相關(guān)公司實(shí)體的一些例子??梢钥吹紽astText單單只從字面意思進(jìn)行了相似度匹配;而graphembedding模型輸出結(jié)果能夠更好地包含了具有相似業(yè)務(wù)、相似規(guī)模的公司,具有更好的語義相關(guān)性。0404HR+AI領(lǐng)跑者,助力每一個(gè)HR實(shí)現(xiàn)AI賦能本文主要闡述了Embedding的原理以及一些應(yīng)用,具體的闡述了Graphmbedding在人力資本領(lǐng)域的落地應(yīng)用。Embedding既可以作為計(jì)算各個(gè)實(shí)體的工具也可以作為深度學(xué)習(xí)中的embedding嵌入層增加模型的準(zhǔn)確性。不夸張的說一切可以embedding,而且embedding在很多領(lǐng)域都取得了不俗的成就,尤其是NLP領(lǐng)域。e成科技作為HR+AI賽道的領(lǐng)跑者,一直專注于人力資本領(lǐng)域的AI創(chuàng)新升級(jí),開創(chuàng)性地將AI技術(shù)與人才戰(zhàn)略升級(jí)場(chǎng)景深度結(jié)合,我們已經(jīng)將embedding技術(shù)應(yīng)用到人崗匹配、面試Bot等多實(shí)際場(chǎng)景,接下來我們將繼續(xù)優(yōu)化embedding,助力AI技術(shù)在人力資源領(lǐng)域的更多應(yīng)用。同時(shí),基于積累多年的AI能力和行業(yè)經(jīng)驗(yàn),e成科技重磅打造了AI開放平臺(tái),并將AI能力開放給所有企業(yè)和友商。e成科技AI開放平臺(tái)是HR賽道首個(gè)企業(yè)自主研發(fā)的聚焦人力資本場(chǎng)景的一站式AI能力服務(wù)平臺(tái),覆蓋簡(jiǎn)歷解析、人崗匹配、HR機(jī)器人等諸多場(chǎng)景,通過OpenAPI及需求定制等形式,面向所有自研系統(tǒng)大型企業(yè)、垂直招聘平臺(tái)、傳統(tǒng)HR行業(yè)廠商等企業(yè)用戶提供智能化服務(wù)。參考文獻(xiàn):[1]Banana,神奇的Embedding,/p/53058456[2]Ethan,Embedding的理解,/p/46016518[3]PerozziB,Al-RfouR,SkienaS.DeepWalk:OnlineLearningofSocialRepresentations[J].arXivpre-printarXiv:1403.6652,2014.[4]TangJ,QuM,WangM,etal.Line:Large-scaleinformationnetworkembedding[C]//Proceedingsofthe24thinternationalconferenceonworldwideweb.InternationalWorldWideWebConferencesSteer-ingCommittee,2015:1067-1077.[5]GroverA,LeskovecJ.node2vec:Scalablefeaturelearningfornetworks[C]//Proceedingsofthe22ndACMSIGKDDinternationalconferenceonKnowledgediscoveryanddatamining.ACM,2016:855-864.[6]WangD,CuiP,ZhuW,etal.StructuralDeepNetworkEmbedding[C].knowledgediscoveryanddatamining,2016:1225-1234.[7]Wu,L.,Fisch,A.,Chopra,S.,Adams,K.,Bordes,A.,&Weston,J.(2017).StarSpace:EmbedAllTheThings!arXivpreprintarXiv:1709.03856作者:e成科技知識(shí)圖譜團(tuán)隊(duì)白永斌(掃描二維碼查看文章)人才畫像畫得好,數(shù)字化HR有妙招AI黑科技:BertELMo(EmbeddingfromLanguageModels)模型Embeddingattention人才畫像畫得好,數(shù)字化HR有妙招俗話說“人才畫像畫得好,HR招聘快不少”。人才畫像是現(xiàn)在企業(yè)人才招聘和人才管理的核心,并應(yīng)用在人崗匹配、薪酬預(yù)測(cè)、人才盤點(diǎn)等諸多場(chǎng)景。數(shù)字化時(shí)代,畫像成為人才招聘和人才管理的入口,通過上百個(gè)維度進(jìn)行提煉、總結(jié)進(jìn)行人才全方位刻畫。但如何刻畫畫像,畫像準(zhǔn)不準(zhǔn),還得這背后默默運(yùn)行的AI算法和知識(shí)圖譜說了算。(persona)的概念最早由交互設(shè)計(jì)之父AlanCooper提出:“Personasareaconcreterepresentationoftargetusers.”是指真實(shí)用戶的虛擬代表,是建立在一系列屬性數(shù)據(jù)之上的目標(biāo)用戶模型。如今,為了提高客戶體驗(yàn)和運(yùn)營(yíng)效率,畫像早已被應(yīng)用在各行各業(yè)。金融企業(yè)是最早開始使用用戶畫像的行業(yè),在人力資本領(lǐng)域,人才/崗位畫像的應(yīng)用大大提升了HR的工作效率和質(zhì)量,是人力資本數(shù)字化的重要入口和核心要素。所謂人才/崗位畫像,即是基于企業(yè)招聘的顯性的職位描述和隱形的內(nèi)在潛質(zhì)共同組成的用戶畫像(以下簡(jiǎn)稱“畫像”)。△一張畫像,沒有讀不懂的人才構(gòu)建畫像的核心工作,主要是利用存儲(chǔ)在服務(wù)器上的海量日志和數(shù)據(jù)庫里的大量數(shù)據(jù)進(jìn)行分析和挖掘,給用戶貼“標(biāo)簽”,而“標(biāo)簽”是能表示用戶某一維度特征的標(biāo)識(shí)。字段進(jìn)行數(shù)值化處理。其中結(jié)構(gòu)化數(shù)據(jù)比較容易進(jìn)行數(shù)值編碼(例如:性別/年齡/工作年限等而非結(jié)構(gòu)化數(shù)據(jù)(例如工作經(jīng)歷/職能/技能等)多數(shù)為文本類型處理難度較高。對(duì)于非結(jié)構(gòu)化數(shù)據(jù),生成具備語義含義的Embedding是業(yè)界較為廣泛使用的方案。職能/技能可以統(tǒng)稱為用戶的知識(shí)體系,即使每一個(gè)職能/技能生成了具備語義含義的Embedding,如何通過聚合生成用戶整個(gè)知識(shí)體系的數(shù)值表達(dá)并盡可能保留文本自身的信息,依舊是亟待解決的問題。據(jù)(例如文本類型)包含了更全面和深度的用戶潛在信息,目前通過詞向量加權(quán)平均依舊是主流使用的處理方法。此類方法存在一些缺陷:1.生成的Embedding完全基于語義表達(dá),缺失了其內(nèi)在業(yè)務(wù)含義;2.直接加權(quán)平均的方法,容易掩蓋掉重要的信息,且權(quán)重不好定義?;诖?,我們針對(duì)人力資本場(chǎng)景,借鑒Bert的思想提出了一個(gè)新方法,能夠更好地用數(shù)學(xué)的方法對(duì)人才/崗位畫像進(jìn)行表示。為了讓AI+數(shù)據(jù)驅(qū)動(dòng)的數(shù)字化招聘更為精準(zhǔn)智能,我們以e成科技獨(dú)有的HR行業(yè)職能/技能知識(shí)圖譜作為先驗(yàn)的業(yè)務(wù)知識(shí),并基于海量簡(jiǎn)歷和崗位描述數(shù)據(jù)(千萬級(jí)借鑒Bert的模型架構(gòu),專門對(duì)畫像中的知識(shí)體系相關(guān)字段(職能/技能)進(jìn)行了深度優(yōu)化。該方法提供的知識(shí)表征,首先包含了技能/職能的內(nèi)在關(guān)系,其次通過attention的方式聚合能保證重要業(yè)務(wù)信息的不丟失。經(jīng)過優(yōu)化的人才/崗位畫像,在數(shù)字化招聘、人崗匹配、人才盤點(diǎn)、薪酬預(yù)測(cè)等多個(gè)下游業(yè)務(wù)場(chǎng)景中均取得顯著的優(yōu)化提升。部分場(chǎng)景舉例人才選拔:通過人才畫像分析,使人才供給與業(yè)務(wù)發(fā)展速度高度匹配,優(yōu)化人才隊(duì)伍配置效率,降低人才流失率;人才任用:通過崗位畫像和人才畫像的分析與匹配度分析,實(shí)現(xiàn)人才和崗位最優(yōu)配置,使優(yōu)秀人才能充分發(fā)揮能力與主觀能動(dòng)性,提高人力資本效率;薪酬預(yù)測(cè):根據(jù)人才畫像和崗位畫像,結(jié)合行業(yè)崗位知識(shí),分析人才/候選人技能及發(fā)展水平,預(yù)測(cè)候選人及企業(yè)未來薪酬水平;接下來,院長(zhǎng)就將為大家介紹e成科技在有關(guān)領(lǐng)域的最新方案以及應(yīng)用成果。ELMoVSELMoVSWord2Vec,更優(yōu)的特征提取器Word2Vec是近幾年非常流行的WordEembedding提取模型。模型通過預(yù)先構(gòu)建的詞表將輸入語句中某單詞前、后所有詞語編碼為多個(gè)one-hot向量傳入模型,隨后通過一個(gè)共享的參數(shù)矩陣將這些向量映射到隱藏層,最后使用softmax將隱藏層的輸出轉(zhuǎn)化為詞表中每個(gè)單詞的概率作為輸出,其中概率最高的單詞即為最終預(yù)測(cè)結(jié)果。經(jīng)過充分訓(xùn)練后,詞表中每個(gè)單詞的語義信息已經(jīng)充分“嵌入”了用于映射輸入層和隱藏層的參數(shù)矩陣中。使用時(shí)只需用單詞的one-hot向量和參數(shù)矩陣相乘就可以得到對(duì)應(yīng)的WordEmbedding。這樣的網(wǎng)絡(luò)結(jié)構(gòu)為Word2Vec帶來了一個(gè)嚴(yán)重的問題,它無法為語言中常見的多義詞提取Embedding。由于同一個(gè)單詞在參數(shù)矩陣中只占據(jù)一個(gè)向量,網(wǎng)絡(luò)只能將多義詞的不同語義信息全部編碼到相同的向量中,反而降低了這些詞向量的表達(dá)能力。此外,Word2Vec只采用了一個(gè)線性隱藏層,特征提取能力較弱,對(duì)Embedding的表現(xiàn)也有很大的影響。ELMo(EmbeddingfromLanguageModels)模型使用與Word2Vec截然不同的方式提取Embedding,并采用更優(yōu)的特征提取器,很好地解決了多義詞問題,同時(shí)增強(qiáng)了詞向量的表達(dá)能力。模型使用兩層雙向LSTM(LongShortTermMemory)單元作為模型中間層,其中正向LSTM順序接受輸入語句中給定單詞的上文,逆向LSTM倒序接受語句中給定單詞的下文。訓(xùn)練完成后將輸入層Embedding和兩層LSTM產(chǎn)生的Embedding加權(quán)結(jié)合后作為句中每個(gè)單詞的Embedding使用。與Word2Vec查表式獲取靜態(tài)的Embedding不同,ELMo可以根據(jù)上下文信息動(dòng)態(tài)調(diào)整詞語的Embedding。多層LSTM特征提取器可以從文本中分別提取句法、語義等不同層次的信息,大大提升了詞語特征的豐富程度。Attention機(jī)制是近幾年提出的新型特征提取器,在NLP領(lǐng)域的表現(xiàn)效果遠(yuǎn)超以往使用的卷積Self-Attention單元構(gòu)成的大型網(wǎng)絡(luò)和巧妙設(shè)計(jì)的無監(jiān)督訓(xùn)練方式使模型可以利用豐富的自由文本進(jìn)行訓(xùn)練,從中提取多層次的語言特征。0303e成科技的應(yīng)用:知識(shí)表征模型我們的知識(shí)表征模型(以下簡(jiǎn)稱“模型”)同樣使用了多層Self-Attention單元作為基本的特征提取器,嘗試從e成科技豐富的數(shù)據(jù)中挖掘出可描述職能和技能各自特征及其相關(guān)關(guān)系的Embedding。為了訓(xùn)練這樣的模型,我們借鑒并調(diào)整了Bert的設(shè)計(jì)思路,建立一套符合我們?cè)V求的模型結(jié)構(gòu)。模型將e成科技知識(shí)圖譜中職能和技能的實(shí)體名稱作為Embedding提取粒度,端到端地進(jìn)行損失。模型訓(xùn)練時(shí),我們使用職能、技能前后拼接的數(shù)據(jù)結(jié)構(gòu),其中來自相同CV數(shù)據(jù)的職能、技能作1。為了防止模型僅抽取職能對(duì)技能的依賴關(guān)系,我們?cè)趯⒙毮芎图寄苷{(diào)換順序后的數(shù)據(jù)加入樣本中同時(shí)訓(xùn)練,以提取雙向的依賴關(guān)系。經(jīng)過充分訓(xùn)練后,模型可以提供多樣化的使用方式。模型最后一層輸出和輸入序列等長(zhǎng)的Embedding序列,其中第一個(gè)Embedding包含整條數(shù)據(jù)的特征,之后每個(gè)Embedding與輸入序列的詞語一一對(duì)應(yīng),分別是每個(gè)詞語的動(dòng)態(tài)特征。將序列頭Embedding接入下游任務(wù)網(wǎng)絡(luò)中可以對(duì)模型進(jìn)行?ne-tune,可進(jìn)一步用于不同的細(xì)分領(lǐng)域任務(wù)。同時(shí),其余Embedding也可以直接作為詞語特征使用??紤]到模型結(jié)構(gòu)復(fù)雜,運(yùn)算時(shí)間較長(zhǎng),針對(duì)某些性能要求較高的業(yè)務(wù)場(chǎng)景,可以將模型輸入層對(duì)應(yīng)的Embedding作為靜態(tài)詞向量使用,通過查表方式大大簡(jiǎn)化運(yùn)算流程。我們使用內(nèi)部標(biāo)注的薪酬預(yù)測(cè)、人崗匹配數(shù)據(jù)對(duì)不同模型進(jìn)行了評(píng)估,結(jié)果如下:薪酬預(yù)測(cè)任務(wù)中,每個(gè)模型需要提取候選人的技能Embedding作為下游任務(wù)的參數(shù),輔助判斷候選人的薪酬水平。實(shí)驗(yàn)中模型之間互不影響,且使用相同的下游薪酬預(yù)測(cè)模型。結(jié)果中可以看到,我們的知識(shí)技能表達(dá)模型對(duì)下游任務(wù)各項(xiàng)指標(biāo)均有5%左右的提升。而人崗匹配任務(wù)中,我們將崗位和候選人各自技能Embedding之和作為它們的特征向量,通過特征向量相似度判斷候選人和崗位是否匹配。評(píng)估結(jié)果顯示,我們的模型表現(xiàn)非常出眾,提升效果明顯。分未正確還原的情況??梢钥吹郊词惯€原失敗,模型也能夠預(yù)測(cè)到行業(yè)內(nèi)與正確結(jié)果相似的答案。數(shù)字化時(shí)代,HR作為推動(dòng)企業(yè)數(shù)字化升級(jí)的核心力量之一,通過數(shù)字化工具助力人才管理和人才引進(jìn)數(shù)字化,已經(jīng)成為必然趨勢(shì)。e成科技創(chuàng)新研發(fā)的畫像+Bot兩大引擎,助力人才知己、企業(yè)知人、社會(huì)知命。利用大數(shù)據(jù)和人工智能技術(shù)構(gòu)建的畫像,將對(duì)人才的素質(zhì)、性格、職業(yè)動(dòng)力都進(jìn)行全方位描述,幫助人才認(rèn)識(shí)自己,進(jìn)行自我反思,同時(shí)幫助企業(yè)和HR更全面、更立體、更準(zhǔn)確識(shí)別候選人,實(shí)現(xiàn)選、融、育、激各個(gè)環(huán)節(jié)高效的人才管理。作為HR+AI賽道的領(lǐng)跑者,e成科技從創(chuàng)立伊始就將AI基因根植于業(yè)務(wù),并開創(chuàng)性地將AI技術(shù)與人才戰(zhàn)略升級(jí)場(chǎng)景深度結(jié)合。同時(shí),基于積累多年的AI能力和HR行業(yè)經(jīng)驗(yàn),e成科技重磅打造了AI開放平臺(tái),通過OpenAPI及需求定制等形式將AI能力開放給所有企業(yè)和友商。e成科技AI開放平臺(tái)是HR賽道首個(gè)企業(yè)自主研發(fā)的聚焦人力資本場(chǎng)景的一站式AI能力服務(wù)平臺(tái),覆蓋簡(jiǎn)歷解析、人崗匹配、HR機(jī)器人等諸多場(chǎng)景,這些HR+AI的創(chuàng)新應(yīng)用和智能產(chǎn)品背后,都是e成科技領(lǐng)先的AI能力和默默潛心研發(fā)的科學(xué)家及算法工程師們作為支撐。未來,e成科技將持續(xù)打造更多創(chuàng)新智能產(chǎn)品,全面加速人力資本數(shù)字化升級(jí)!作者:e成科技AI算法團(tuán)隊(duì)陳嘉欽(掃描二維碼查看文章)場(chǎng)景:音視頻面試內(nèi)容:AI面試官來襲,HR你準(zhǔn)備好了嗎?AI黑科技:機(jī)器學(xué)習(xí)、語音識(shí)別、面部識(shí)別、排名算法、計(jì)算機(jī)視覺技術(shù)、語義理解能力、跨媒體協(xié)同推理技術(shù)AI面試官來襲,HR你準(zhǔn)備好了嗎?這回院長(zhǎng)為大家?guī)硪粋€(gè)神秘炸彈:獵豹(Leopard)項(xiàng)目!聽起來是不是很炫酷?你一定想不到,這個(gè)獵豹(Leopard)項(xiàng)目是做什么的吧?沒錯(cuò)!就是眾多候選人“聞風(fēng)喪膽”的AI面試!這是e成科技AI算法團(tuán)隊(duì)研究的新成果,之所以起這個(gè)名字是希望我們的AI面試像草原上狩獵的獵豹一樣敏捷高效!下面就隨院長(zhǎng)一起看看“這只獵豹”背后的黑科技吧!說到AI面試,相信很多參加過校招的候選人都不陌生,被HireVue支配的恐懼還歷歷在目,不少小伙伴面完忍不住把一首“涼涼”送給自己……對(duì)于很多企業(yè)和HR來說,AI面試更是應(yīng)用廣泛。招聘是企業(yè)和HR亙古不變的主題,尤其是眾多大廠每年要面臨千百萬量級(jí)的候選人,面對(duì)如此龐大的應(yīng)聘者數(shù)量,AI技術(shù)無疑是簡(jiǎn)化招聘的利器。AI的力量。過去幾年,使用AI視頻面試的公司從14%上升至60%,聯(lián)合利華、歐萊雅、可口可達(dá)能、高盛、瑞士銀行、摩根大通等全球600多家企業(yè)陸續(xù)開始使用AI面試的形式進(jìn)行首輪面試。在提供AI面試的企業(yè)中,以視頻面試公司HireVue開發(fā)的服務(wù)最為著名。在一個(gè)典型的AI視回答情況,結(jié)合面試者聲音及面部表情的信息,判斷其能否通過這一場(chǎng)面試?!鲌D片來自HireVue官網(wǎng)之所以越來越接受的企業(yè)愿意類似的AI面試,院長(zhǎng)覺得有如下幾個(gè)原因:1.相比于傳統(tǒng)的人工面試,基于音視頻的AI面試可以在前期大大減少HR的工作量,降低企業(yè)2.在簡(jiǎn)歷篩選和初面階段,由于不同面試官的專業(yè)水平和個(gè)人喜好不同,會(huì)使得面試存在著很大的偶然性。而基于AI的音視頻面試的面試評(píng)價(jià)標(biāo)準(zhǔn)相對(duì)統(tǒng)一,對(duì)每個(gè)面試者也更加公平;3.基于音視頻的AI面試除了能夠?qū)γ嬖囌叩幕卮疬M(jìn)行分析外,還可以對(duì)面試者的表情及回答內(nèi)容給出實(shí)時(shí)的分析與反饋,既能提升面試者體驗(yàn),也有助于提升公司的品牌形象。不過,要做到體驗(yàn)級(jí)的音視頻面試能力,對(duì)于產(chǎn)品和技術(shù)的要求都是非常高的。不同的行業(yè)與招聘場(chǎng)景,對(duì)于音視頻面試的要求都是不同的,想要產(chǎn)品既契合場(chǎng)景且體驗(yàn)出色,少不了大量高大上的AI面試背后的黑科技。0202黑科技揭秘:AI面試為何那么神2004年HireVue成立之初,只是為了記錄面試者視頻數(shù)據(jù),供HR參考。10年后,HireVue融入了AI技術(shù),重新定義了“面試”。這些AI技術(shù)是基于機(jī)器學(xué)習(xí)的復(fù)雜算法,并結(jié)合語音識(shí)別以及面部識(shí)別,協(xié)同排名算法,通過15000+個(gè)不同的維度(包括肢體語言、語音模式、眼神活動(dòng)、做題速度、聲音大小等)來對(duì)候選者進(jìn)行評(píng)分?!鰽I面試可以通過15000+個(gè)不同維度對(duì)候選者評(píng)分,圖片來自BusinessInsider之前有同學(xué)跟院長(zhǎng)說,現(xiàn)在我們的語音識(shí)別和人臉識(shí)別技術(shù)都已經(jīng)非常成熟,做基于AI的音視頻頻面試只是把這些能力進(jìn)行一下組合,難度并不大。這種說法確實(shí)有一些道理,AI面試產(chǎn)品的出現(xiàn)確實(shí)是得益于近年來人工智能飛速的發(fā)展,特別是深度學(xué)習(xí)在計(jì)算機(jī)視覺和語音識(shí)別等領(lǐng)域的廣泛應(yīng)用。但是,面試場(chǎng)景又對(duì)AI能力有很多特殊的要求,需要有針對(duì)性做大量工作,下面院長(zhǎng)結(jié)合e成科技在這方面的研究成果和創(chuàng)新研發(fā)進(jìn)行介紹:語義理解能力要對(duì)求職者的能力有好的判斷,面試官必須對(duì)求職者所說的內(nèi)容做到充分的理解,AI面試官也不例外。除了夠理解面試者的意圖,并且判斷面試者的通用表達(dá)能力、語言邏輯性的通用語義理解外,AI面試官還需要具備更加專業(yè)的知識(shí)。借助于六年來積累的大量人力資源行業(yè)專家知識(shí)及知識(shí)圖譜,e成科技開發(fā)的AI面試產(chǎn)品不但可以基于不同崗位的需求進(jìn)行技能追問和熟練度判斷,并且研發(fā)行業(yè)內(nèi)首個(gè)BEI機(jī)器人,通過分析候選人提供的故事來判斷其在不同崗位要求素質(zhì)項(xiàng)上的評(píng)分。對(duì)話能力為了保證求職者擁有更好的面試體驗(yàn),AI面試官也得像普通面試官一樣跟候選人流暢地對(duì)話,這除了依賴前面所說的語義理解能力外,也需要強(qiáng)大的對(duì)話能力作為支持。e成科技近年來開發(fā)多款HR場(chǎng)景聊天機(jī)器人,并沉淀出統(tǒng)一對(duì)話框架Snowball。基于該對(duì)話框架,AI面試機(jī)器人可以進(jìn)行統(tǒng)一的意圖識(shí)別和對(duì)話策略管理,并同時(shí)支持知識(shí)庫問答和閑聊(Chitchat),帶給候選人更好的面試體驗(yàn)。語音與視覺能力進(jìn)行音視頻面試非常核心的工作是對(duì)語音和視頻內(nèi)容的理解。其中語音識(shí)別是整個(gè)AI面試對(duì)候識(shí)別外,e成科技的科學(xué)家和算法工程師們還在探索基于一些基礎(chǔ)的語音信息對(duì)面試者的面試狀態(tài)(比如,面試者是否緊張)、基礎(chǔ)表達(dá)能力和普通話能力進(jìn)行分析。與狀態(tài),對(duì)于一些頂替、偷看資料等面試作假的情況,可以利用人臉識(shí)別和動(dòng)作場(chǎng)景識(shí)別的計(jì)算機(jī)視覺算法進(jìn)行識(shí)別。更進(jìn)一步地,與HireVue等AI面試產(chǎn)品類似,e成科技也在開發(fā)利用計(jì)算機(jī)視覺技術(shù)對(duì)面試者進(jìn)行更細(xì)致的分析,比如借助微表情和情緒識(shí)別技術(shù)判斷面試者在回答問題過程中的心理狀態(tài),甚至捕捉到一些候選人可信度不夠高的回答??缑襟w有了音視頻的處理能力,AI面試官可以從視覺、語音、語義等不同維度獲取候選人的信息,雖然每個(gè)維度都能夠獲取大量候選人信息,但要真正想把AI面試做好,必須對(duì)這些不同維度的信息進(jìn)行統(tǒng)一分析。舉個(gè)例子,當(dāng)候選人在提到某個(gè)關(guān)鍵概念時(shí),說話的語氣和眼神可能會(huì)有一的參考和幫助。想要實(shí)現(xiàn)這樣的功能,除了各個(gè)本身的內(nèi)容理解外,還需要引入“跨媒體協(xié)同推理”技術(shù)。這一技術(shù)是新一代人工智能的重要組成部分,通過視聽感知、機(jī)器學(xué)習(xí)和語言計(jì)算等理論和方法,構(gòu)建出實(shí)體世界的統(tǒng)一語義表達(dá),從而跨媒體的分析和推理。e成科技在自己的音視頻面試產(chǎn)品斷的準(zhǔn)確性。0202黑科技揭秘:AI面試為何那么神AI技術(shù)似乎具有與生俱來的爭(zhēng)議性。雖然基于音視頻的AI面試已經(jīng)在很多場(chǎng)合得到廣泛應(yīng)用,但是也有不少人對(duì)其產(chǎn)生質(zhì)疑。一方面,到底AI面試官的信效度如何,能否達(dá)到專業(yè)面試官的水平?院長(zhǎng)覺得機(jī)器和人類各有優(yōu)劣,機(jī)器并不是要替代人類,而是要輔助人類,和人類更好地合作。在具體形式上,AI面試官和專業(yè)面試官可以有很多協(xié)同方式,比如由AI面試官進(jìn)行候選人的初篩,并且給后續(xù)專業(yè)面試官提供面試評(píng)價(jià)與建議。也有人會(huì)覺得AI面試可能產(chǎn)生一些倫理問題,如是否會(huì)產(chǎn)生一些對(duì)相貌和言語的歧視?其實(shí)這好這些問題,讓自己成為AI時(shí)代的受益者。簡(jiǎn)而言之,AI面試的初衷是幫助優(yōu)秀的候選人脫穎而出,從而讓招聘者重點(diǎn)關(guān)注優(yōu)秀候選人;同時(shí),可以大大幫助HR節(jié)省時(shí)間,把更多精力放在關(guān)注人才質(zhì)量、選拔多樣性上。人工智能是應(yīng)對(duì)這些挑戰(zhàn)的最佳方式。而從創(chuàng)立之初就將AI基因深植于業(yè)務(wù)的e成科技,一直在潛心研發(fā)和積累,致力于將AI技術(shù)深度應(yīng)用于人力資本全場(chǎng)景中,推動(dòng)人力資本智能變革。憑借自身在AI能力和行業(yè)經(jīng)驗(yàn)的獨(dú)特優(yōu)勢(shì),以及來自全球頂尖跨媒體技術(shù)實(shí)驗(yàn)室的AI核心團(tuán)隊(duì),擁有頂尖的跨媒體AI技術(shù),結(jié)合多年積累的知識(shí)圖譜與對(duì)話技術(shù),e成科技推出的AI面試機(jī)器人更是如虎添翼?!鱡成科技AI開放平臺(tái)四大算法中臺(tái)目前,e成的音視頻面試技術(shù)已經(jīng)在一線員工自動(dòng)化招聘和候選人Bot等場(chǎng)景中落地,為大量的用戶賦能,助力企業(yè)降本增效。未來,隨著科技飛速發(fā)展,AI技術(shù)正在根據(jù)大數(shù)據(jù)和深度學(xué)習(xí)不斷優(yōu)化和升級(jí),AI在行業(yè)的應(yīng)用也會(huì)越來越廣泛和深入,我們也必須擁抱變化,適應(yīng)人機(jī)交互新模式,通過駕馭智能工具,實(shí)現(xiàn)數(shù)字化升級(jí)。e成科技愿意借助于自身在AI開放平臺(tái)、技術(shù)、產(chǎn)品、行業(yè)經(jīng)驗(yàn)等優(yōu)勢(shì),助您實(shí)現(xiàn)人力資本數(shù)字化新升級(jí)!作者:e成科技AI算法團(tuán)隊(duì)劉洋(掃描二維碼查看文章)真技術(shù)還是偽AI,HR如何選擇合適的智能工具?HR圖靈學(xué)院|一文讀懂RPA、AI與HR的關(guān)系A(chǔ)I黑科技:語音識(shí)別(ASR)、自然語言理解(NLU)、對(duì)話管理(DM)、文本生成(NLG)、語音合成(TTS)、文本檢索、情感分析、光學(xué)文字識(shí)別(OCR)……一文讀懂RPA、AI與HR的關(guān)系近兩年,科技行業(yè)熱詞里突然多了一個(gè)簡(jiǎn)寫—RPA,有人把RPA當(dāng)作解放勞動(dòng)力的救星,認(rèn)為任何大規(guī)模、重復(fù)性工作都能用RPA機(jī)器人代替,大大節(jié)省了人力、時(shí)間和金錢。比如在人力資本領(lǐng)域,研究表明,HR們大約93%時(shí)間花費(fèi)在重復(fù)性工作上,但65%的工作流程其實(shí)可以實(shí)現(xiàn)自動(dòng)化,RPA可以將HR從大量、繁瑣、重復(fù)的任務(wù)中解放出來,如簡(jiǎn)歷篩選、面試邀約、員工入職、員工數(shù)據(jù)管理、考勤管理、離職管理……從而將時(shí)間和資源聚焦在更高價(jià)值和戰(zhàn)略性任務(wù)上。Gartner研究表明,到2022年底85%的大型和超大型組織將部署某種形式的RPA。一時(shí)間,RPA風(fēng)頭無兩,被認(rèn)為未來市場(chǎng)前景廣闊,引得各路投資人爭(zhēng)先恐后。但也存在不同聲音,有人說RPA是開數(shù)字化歷史的倒車,認(rèn)為RPA只不過是在重復(fù)執(zhí)行腳本,不過是不斷執(zhí)行命令的“手腳”,AI才是發(fā)布命令的“大腦”。面對(duì)眾說紛紜、信息紛繁,我們似乎只能管中窺豹難得全貌,那么到底該如何看待RPA?RPA和AI有哪些聯(lián)系?RPA和HR又有哪些關(guān)系呢?本期,院長(zhǎng)就聊一聊關(guān)于RPA你想知道的那些事兒。(掃描二維碼查看文章)真技術(shù)還是偽AI,HR如何選擇合適的智能工具?2019年,RPA突然火了,成為新興風(fēng)口、資本的寵兒,甚至有些媒體宣稱人力資源部門一定要部署RPA,但這種火熱到底是資本炒作,還是RPA真的有用,相信很多人都心存疑惑……01RPA能滿足HR需求嗎RPA(RoboticProcessAutomation是指用軟件流程自動(dòng)化方式實(shí)現(xiàn)在各個(gè)行業(yè)中本來是人工操作計(jì)算機(jī)完成的業(yè)務(wù)。事實(shí)上,第一期院長(zhǎng)和大家探討了RPA與AI的關(guān)系,傳統(tǒng)RPA并沒有用到特別前沿的人工智能技術(shù),RPA也并不等同于人工智能。但隨著近些年來,軟件流程自動(dòng)化技術(shù)與AI這兩個(gè)互補(bǔ)概念結(jié)合在一起,RPA很多環(huán)節(jié)上用到了越來越多的人工智能技術(shù),使得工具更加智慧,也提升了效率減少了人工,于是RPA在金融、財(cái)務(wù)和工業(yè)自動(dòng)化等領(lǐng)域應(yīng)用越來越廣泛。對(duì)于企業(yè)人力資源部門來講,HR每天都需面對(duì)大量事務(wù)性工作,這些事務(wù)性工作大都可以通過自動(dòng)化的方式由機(jī)器人來替代。而借助語音識(shí)別、OCR等AI能力,也的確能夠進(jìn)一步提升RPA的靈活性與智能性,替代人工將繁瑣的業(yè)務(wù)操作流程自動(dòng)化,解放HR們的雙手,提升HR的工作效率??梢?,RPA的真正價(jià)值在于,其可以將HR從以往大量、繁瑣、重復(fù)的事務(wù)性工作(如篩選簡(jiǎn)歷、入離職辦理、社保、福利、開具證明等)中解放出來,將時(shí)間和資源集中在高價(jià)值的、戰(zhàn)略性任務(wù)上(比如支持組織轉(zhuǎn)型、引入職業(yè)發(fā)展規(guī)劃、尋找最新培訓(xùn)材料、理解業(yè)務(wù)特點(diǎn)和實(shí)操場(chǎng)景、為企業(yè)戰(zhàn)略提供決策依據(jù)等),提高人資效率。但RPA真的能滿足HR的所有工作需求嗎?院長(zhǎng)曾經(jīng)和一些在互聯(lián)網(wǎng)公司的HR小伙伴們探討這個(gè)問題,他們紛紛表示人資軟件操作并非他們工作的主要內(nèi)容,單純的軟件流程自動(dòng)化對(duì)他們幫助非常有限。首先,我們知道不同于金融、財(cái)務(wù)等工作,HR每天更多時(shí)間花在了與候選人、員工的面試與溝通上。這些溝通需要HR與員工協(xié)同進(jìn)行,時(shí)間與方式都非常靈活,很難通過傳統(tǒng)軟件進(jìn)行自動(dòng)化。其次,優(yōu)秀的HR進(jìn)行的溝通應(yīng)該是有溫度的,這樣的溫度很難在軟件自動(dòng)化中體現(xiàn)和傳遞出來。最后,很多重要的決策也需要基于溝通的結(jié)果,結(jié)合大量的專業(yè)知識(shí)來進(jìn)行,這也并非簡(jiǎn)單RPA可以實(shí)現(xiàn)的??梢姡词褂辛薃I的助力,RPA也不能完全滿足HR需求,還需要有更強(qiáng)大的工具來幫助HR提升相關(guān)的工作效率。0202實(shí)現(xiàn)人與人更好地連接:畫像+Bot事實(shí)上,人力資源部門不缺自動(dòng)化技術(shù)及系統(tǒng)。市場(chǎng)上種類繁多的自動(dòng)化工具和系統(tǒng),都能或多或少解決HR們的一部分需求,通過自動(dòng)化大大降低HR處理事務(wù)性工作的時(shí)間和精力。但HR需要的僅僅是一個(gè)代替自己雙手的自動(dòng)化工具嗎?一個(gè)RPA機(jī)器人就夠了嗎?工作已經(jīng)不能滿足企業(yè)發(fā)展的需求,如何充分利用人與技術(shù)的合作,全面提升組織與人才管理、員工體驗(yàn)和組織數(shù)字化升級(jí)變革成為重中之重。相比于RPA,我們相信智能對(duì)話機(jī)器人(ChatBot)更能實(shí)現(xiàn)人與人之間更好地相互連接,更適合幫助HR完成日?,嵥榈臏贤üぷ?,提升HR的工作效率與員工體驗(yàn)。這里的機(jī)器人既可以是基于文字交互的聊天機(jī)器人,也可以是基于電話線路的外呼機(jī)器人。HR只需要簡(jiǎn)單配置,就可以將這些機(jī)器人應(yīng)用在各種場(chǎng)景中,比如與候選人進(jìn)行面試邀約,進(jìn)行電話面試并7*24小時(shí)回答候選人各種問題,還可以和在職員工進(jìn)行實(shí)時(shí)交流,了解他們對(duì)于自己和公司的各種想法。當(dāng)畫像與Bot結(jié)合在一起時(shí),還會(huì)發(fā)生更加奇妙的化學(xué)反應(yīng)。如果把畫像比作大腦,Bot就相Bot也具備了更強(qiáng)的專業(yè)性和個(gè)性化能力,更能像一個(gè)專業(yè)HR一樣與候選人或者員工進(jìn)行交流。首先,“畫像+Bot”與“RPA+AI”本身的動(dòng)機(jī)是類似的,都是致力于通過自動(dòng)化、數(shù)字化、智能化提升HR工作效率,降低人資部門的流程負(fù)擔(dān);其次,僅僅靠RPA實(shí)現(xiàn)流程自動(dòng)化提升HR工作效率是遠(yuǎn)遠(yuǎn)不夠的,注重體驗(yàn)性和智能性的對(duì)話機(jī)器人對(duì)HR的效率提升更為關(guān)鍵;最后,AI這個(gè)概念過于龐大,對(duì)人力資源領(lǐng)域而言,畫像是AI最為重要的體現(xiàn),大量智能化工作都需要圍繞著畫像進(jìn)行體現(xiàn);所以,相比于RPA+AI,畫像+Bot的提法更貼近人力資源的實(shí)際場(chǎng)景需求,也更有利于真正將HR從事務(wù)性工作中解放出來,給候選人及員工更好的體驗(yàn)。羅馬不是一天建成的,構(gòu)建好Bot與畫像能力也一樣,一方面需要長(zhǎng)期的數(shù)據(jù)與技術(shù)積累,另一方面也需要有大量的實(shí)際業(yè)務(wù)經(jīng)驗(yàn)。反觀行業(yè)內(nèi)一些公司,在RPA與AI的熱潮下,短時(shí)間內(nèi)搖身一變就成了一家RPA+AI的公司,這其中究竟有多少AI能力,而這些AI能力有真正能對(duì)業(yè)務(wù)產(chǎn)生多大幫助,恐怕要打上一個(gè)大大的問號(hào)。能做出HR真正滿意的產(chǎn)品,靠的不是蹭熱點(diǎn),而是對(duì)業(yè)務(wù)的深入理解和對(duì)技術(shù)的不斷追求。RPA能滿足HR需求嗎e成科技從成立伊始就秉持“科技助力人才升級(jí)”的公司使命,并以“畫像”和“Bot”作為兩大核心驅(qū)動(dòng)力。經(jīng)過多年的技術(shù)積累,e成科技在智能對(duì)話機(jī)器人領(lǐng)域沉淀出自主研發(fā)的Snowball對(duì)話框架,具備意圖識(shí)別、槽位提取、實(shí)體識(shí)別、對(duì)話管理、問答對(duì)話、閑聊對(duì)話等諸多對(duì)話能力。尤其針對(duì)人力資源領(lǐng)域特點(diǎn),Snowball有針對(duì)性的搜集語料進(jìn)行模型訓(xùn)練,并且增加了許多定制化功能以保證對(duì)話系統(tǒng)的專業(yè)性及良好體驗(yàn)。而在用戶畫像方面,基于多年的豐富行業(yè)經(jīng)驗(yàn),e成科技形成了包含百萬級(jí)實(shí)體和千萬級(jí)關(guān)系的知識(shí)圖譜作為畫像的知識(shí)儲(chǔ)備,同時(shí)加入專業(yè)咨詢團(tuán)隊(duì)的理論編寫大量專家規(guī)則,并結(jié)合業(yè)界前沿的機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)模型,構(gòu)建了覆蓋廣、精度高的用戶畫像體系,帶動(dòng)相關(guān)業(yè)務(wù)的發(fā)展?;谝陨蠈?duì)話與畫像能力,e成科技研發(fā)了大量覆蓋人力資本全場(chǎng)景的智能應(yīng)用,將AI技術(shù)與HR場(chǎng)景深度融合,更加貼合數(shù)字化時(shí)代下HR的業(yè)務(wù)需求。部分應(yīng)用小e外呼:基于人工智能意圖識(shí)別及對(duì)話管理,利用電話外呼技術(shù)實(shí)現(xiàn)的高潛候選人自動(dòng)意向溝通最佳解決方案,突破性提高人才復(fù)用率;員工機(jī)器人:將e成科技多年積累的HR領(lǐng)域業(yè)務(wù)知識(shí)與智能對(duì)話機(jī)器人結(jié)合,減少HR重復(fù)工作,提升員工工作體驗(yàn);面試機(jī)器人:基于崗位畫像和專家知識(shí)對(duì)候選人進(jìn)行智能化面試,通過刻畫人才畫像幫助HR全面了解候選人;HR機(jī)器人:通過Bot構(gòu)建交互信息的采集和分析系統(tǒng),打造面向HR、員工、候選人的全場(chǎng)景高效對(duì)話體驗(yàn);人崗匹配:基于人才及崗位畫像,結(jié)合專家知識(shí)與前沿深度學(xué)習(xí)模型個(gè)性化推薦人才,提升HR工作效率;△從Bot集群到超級(jí)Bot,科技助力人才升級(jí)HR行業(yè)首個(gè)AI開放平臺(tái),賦能行業(yè)變革部AI技術(shù),于是一時(shí)間市場(chǎng)上涌現(xiàn)眾多“HR+AI”、“RPA+AI”的人力資本產(chǎn)品或服務(wù),可謂亂花漸欲迷人眼。但通用AI技術(shù)往往與業(yè)務(wù)場(chǎng)景有著巨大的鴻溝,AI技術(shù)與垂直行業(yè)的融合,絕非一朝一夕之事。誠然,目前的“AI熱”或者“RPA熱”反映了市場(chǎng)的焦慮和人力資本領(lǐng)域數(shù)字化轉(zhuǎn)型的迫切需求,AI”的道路上越走越遠(yuǎn)。AI技術(shù)成功應(yīng)用到人力資本場(chǎng)景,是不斷試錯(cuò),不斷創(chuàng)新和優(yōu)化的過程,需要長(zhǎng)時(shí)間的研發(fā)和打磨。作為HR+AI賽道領(lǐng)跑者,e成科技的AI能力從創(chuàng)立起就深植于基因,并伴隨著人力資本業(yè)務(wù)發(fā)展不斷學(xué)習(xí)和進(jìn)化,融合了深厚的HR行業(yè)經(jīng)驗(yàn)積累、頂尖專家團(tuán)隊(duì)提供專業(yè)知識(shí),突破技術(shù)邊界,才在HRSaaS領(lǐng)域形成獨(dú)一無二的“護(hù)城河”。e成科技AI核心優(yōu)勢(shì)AI技術(shù)優(yōu)勢(shì):6年的AI能力積累,掌握深度學(xué)習(xí)、數(shù)據(jù)挖掘與分析、自然語言處理、知識(shí)圖譜、智能推薦、人才素質(zhì)模型、情感分析、實(shí)體識(shí)別等核心AI技術(shù),引領(lǐng)AI技術(shù)與人力資本場(chǎng)景深度融合;頂尖團(tuán)隊(duì)優(yōu)勢(shì):3位頂尖AI科學(xué)家,超過50人的來自BAT等互聯(lián)網(wǎng)巨頭的優(yōu)秀算法團(tuán)隊(duì),超過30人的來自全球知名咨詢企業(yè)的HRTech行業(yè)咨詢團(tuán)隊(duì)陣容;行業(yè)知識(shí)優(yōu)勢(shì):超大規(guī)模全行業(yè)人力資源知識(shí)圖譜,歷時(shí)6年,10,000+家企業(yè)使用驗(yàn)證,成功構(gòu)建50,000,000+實(shí)體關(guān)系;AI行業(yè)認(rèn)可:HR賽道唯一入選上海人工智能發(fā)展聯(lián)盟(SAIA)和中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)的會(huì)員單位,多次斬獲人工智能技術(shù)應(yīng)用十強(qiáng)、AI商業(yè)落地百強(qiáng)等諸多榮譽(yù);基于以上優(yōu)勢(shì)和能力,經(jīng)過多年積累和孵化,e成科技打造了HR賽道首個(gè)AI開放平臺(tái),并將多年AI能力積累開放給所有HR友商,助力實(shí)現(xiàn)人力資本智能化升級(jí)與變革。e成科技AI開放平臺(tái)是HR賽道首個(gè)企業(yè)自主研發(fā)的聚焦人力資本場(chǎng)景的一站式AI能力服務(wù)平臺(tái),覆蓋簡(jiǎn)歷解析、人崗匹配、HR機(jī)器人等諸多場(chǎng)景,通過OpenAPI及需求定制等形式,面向所有自研系統(tǒng)大型企業(yè)、垂直招聘平臺(tái)、傳統(tǒng)HR行業(yè)廠商等企業(yè)用戶提供智能化服務(wù)。e成科技AI開放平臺(tái)提供的服務(wù)主要集中在這三種形式:標(biāo)準(zhǔn)化AI能力:將NLP、NLU等前沿的AI技術(shù)全面應(yīng)用于HR各類核心業(yè)務(wù)場(chǎng)景,為用戶直接輸出單個(gè)或多個(gè)AI技術(shù)能力,如簡(jiǎn)歷解析、職位解析、人崗匹配等;組件化AI產(chǎn)品:基于業(yè)務(wù)深度理解,實(shí)現(xiàn)AI產(chǎn)品組件化、平臺(tái)化,用戶通過標(biāo)準(zhǔn)API接入,實(shí)現(xiàn)快速調(diào)用AI產(chǎn)品,無需企業(yè)再次開發(fā);個(gè)性化場(chǎng)景解決方案:根據(jù)用戶的個(gè)性化場(chǎng)景需求提供定制化的AI能力和服務(wù),打造企業(yè)專屬目前,e成科技AI開放平臺(tái)已助力多家企業(yè)合作伙伴智能應(yīng)用落地,賦能行業(yè)智能化變革。后續(xù),我們將為大家分享一些精彩案例,盤點(diǎn)下AI賦能企業(yè)變革的那些事兒。院長(zhǎng)結(jié)語:數(shù)字化時(shí)代,企業(yè)紛紛在尋求智慧變革,人力資源部門是推動(dòng)企業(yè)變革的重要?jiǎng)恿χ唬琀R也要時(shí)刻隨著時(shí)代和科技的變化而變化,找到并駕馭合適、高效的智能化工具,將助力人力資源工作者和企業(yè)領(lǐng)先同行,實(shí)現(xiàn)數(shù)字化升級(jí)彎道超車。為客戶服務(wù)的道路上沒有終點(diǎn),為了實(shí)現(xiàn)這一目標(biāo),未來,e成科技將持續(xù)努力把技術(shù)能力與人力資本業(yè)務(wù)更好地結(jié)合,推出更多滿足HR場(chǎng)景需求的智能化產(chǎn)品與服務(wù),與合作伙伴們一起攜手開啟人力資本數(shù)字化新時(shí)代!作者:e成科技AI算法團(tuán)隊(duì)劉洋(掃描二維碼查看文章)場(chǎng)景:智能聊天機(jī)器人內(nèi)容:請(qǐng)回答B(yǎng)ERT:HR聊天機(jī)器人強(qiáng)大聊天技能背后的秘密AI黑科技:BERT(BidirectionalEncoderRepresentationsfromTransformers)BERT-base\BERT_wwm\ernie模型自然語言處理(NLP)請(qǐng)回答B(yǎng)ERT:HR聊天機(jī)器人強(qiáng)大聊天技能背后的秘密聊天機(jī)器人等智能應(yīng)用的出現(xiàn),無疑在人力資本領(lǐng)域掀起了一場(chǎng)聲勢(shì)浩大的革命,它的即時(shí)性、全天候、智能化回應(yīng),不僅提升了候選人/員工的體驗(yàn),也大大地提升了HR效率,降低企業(yè)成本。不難想象,未來這些智能化應(yīng)用將會(huì)給我們帶來更多驚喜。在這里,院長(zhǎng)不禁要問,你知道這么好用的聊天機(jī)器人背后,是什么AI技術(shù)在支撐嗎?很多人都說當(dāng)然是NLP,沒錯(cuò),但NLP背后呢?還有一個(gè)利器就是:BERT!2018年底到2019年,NLP領(lǐng)域從學(xué)術(shù)界到工業(yè)界最火熱最強(qiáng)大的模型是什么?那就是BERT!BERT已然成為NLP技術(shù)歷史上最重大轉(zhuǎn)折點(diǎn)之一,是NLP技術(shù)向加速產(chǎn)業(yè)落地邁進(jìn)的一大步。e成科技作為HR+AI賽道領(lǐng)跑者,從BERT一經(jīng)發(fā)布就敏銳察覺到了機(jī)遇,積極布局相關(guān)研究,不斷跟進(jìn)最近進(jìn)展、探索相關(guān)應(yīng)用,取得不錯(cuò)的積累和成果。在這篇文章里,院長(zhǎng)將簡(jiǎn)單向大家闡述BERT的相關(guān)背景、原理、升級(jí),以及e成科技在人力資本領(lǐng)域的一些應(yīng)用、探索和思考。01背景:什么是BERTBERT(BidirectionalEncoderRepresentationsfromTransformers),是google于2018年底提出的一個(gè)預(yù)訓(xùn)練語言模型,它通過無監(jiān)督的方法對(duì)大規(guī)模的自然語言的語料進(jìn)行學(xué)習(xí),從中提取出人類語言的內(nèi)在基本規(guī)律,輔助后續(xù)的自然語言理解的相關(guān)任務(wù)。例如,對(duì)于一段文本:e成科技是HR+AI賽道的領(lǐng)跑者,在NLP領(lǐng)域有很多的技術(shù)積累。用通俗的語言理解,BERT在學(xué)習(xí)的是以下兩方面的能力:1.當(dāng)輸入了“e成科技是一家HR+AI___的領(lǐng)跑者”的時(shí)候,模型要學(xué)習(xí)到填而不是其他的任何的無關(guān)詞。2.當(dāng)輸入了“e成科技是HR+AI賽道的領(lǐng)跑者”的時(shí)候,模型要學(xué)習(xí)到“在NLP領(lǐng)域有很多的技術(shù)積累”是最佳的下一句,而不是其他的任何句子。以上兩方面的能力,可以理解為是人類語言的基本規(guī)律,那么當(dāng)模型學(xué)習(xí)到這種規(guī)律之后,有BERT的強(qiáng)大能力以BERT模型為基礎(chǔ),通過?netune的方式,可以在BERT已經(jīng)習(xí)得的語言知識(shí)的基礎(chǔ)上,1.理解更深入。由于已經(jīng)在大量的自然語言中習(xí)得了基本的語言規(guī)律,當(dāng)模型面臨一個(gè)新的自然語言任務(wù)的時(shí)候,模型可以利用的知識(shí)就包含了已經(jīng)習(xí)得的海量語言規(guī)律+新任務(wù)里的知識(shí),使得模型能夠更加深入新任務(wù)所表達(dá)的規(guī)律。2.更少的樣本依賴。在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論