AI+HR黑科技秘笈-AI賦能人力資本智能化變革

上傳人：策*** IP屬地：山西上傳時間：2023-12-11 格式：DOCX 頁數(shù)：195 大小：10.98MB 積分：19.9 舉報 版權(quán)申訴

已閱讀5頁，還剩190頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

AI黑科技揭秘AI+HR創(chuàng)新應(yīng)用頂尖科學(xué)家團(tuán)隊(duì)力作獻(xiàn)給走在數(shù)字化浪潮前沿的HR們，數(shù)字經(jīng)濟(jì)時代已全面開啟，大數(shù)據(jù)、人工智能、云計算等新科技推動經(jīng)濟(jì)、社會、企業(yè)發(fā)生翻天覆地的變化，也將賦予人力資本巨大的變革力量。企業(yè)紛紛在尋求智慧變革，人力資源部門是推動企業(yè)變革的重要動力之一，HR也要時刻隨著時代和科技的變化而變化，找到并駕馭合適、高效的智能化工具。在這場浪潮中，思變的企業(yè)和HR們已經(jīng)開始尋求變革新路徑。作為人力資本數(shù)字化平臺和數(shù)字化人才戰(zhàn)略的先行者，e成科技將始終與您同在，攜手開啟人力資本數(shù)字化新時代！”本專欄內(nèi)容由HR圖靈學(xué)院出品，HR圖靈學(xué)院是e成科技打造的HR領(lǐng)域第一AI專欄，希望以此為窗口，向HR傳達(dá)專業(yè)的AI知識與信息，賦予人力資本領(lǐng)域變革力量，以AI為鑰，攜手HR開啟數(shù)字化變革之門！在這里，HR們可以得到前沿技術(shù)思考、行業(yè)技術(shù)干貨、全球AI好物、HR+AI創(chuàng)新應(yīng)用等。02-0910-1702-0910-1718-2318-2324-2924-2930-3637-4230-3637-4243-5143-5152-6061-6852-6061-6869-75第七部分智能職業(yè)發(fā)展規(guī)劃76-8476-8485-9485-94讓AI技術(shù)提升人崗匹配效果，我們做了這些探索解鎖這項(xiàng)AI黑科技，馬上實(shí)現(xiàn)人崗匹配自由AI黑科技：Embedding、知識圖譜（KG）方法、自然語言處理（NLP）、非線性樹模型、deep模型、BERT、Word2Vec模型等讓AI技術(shù)提升人崗匹配效果，我們做了這些探索本期和大家討論下“人崗匹配排序的探索與實(shí)踐”。從人力資源管理的發(fā)展來看，人崗匹配大致經(jīng)歷了三個階段，“三歷對照法”、“冰山挖掘法”、“全人匹配法”，而AI技術(shù)的引用將為企業(yè)迎來第四個——“數(shù)據(jù)解剖法”。AI技術(shù)實(shí)現(xiàn)人崗匹配，離不開數(shù)據(jù)的處理和模型的選擇與訓(xùn)練，看似高深、復(fù)雜的人崗匹配算創(chuàng)新應(yīng)用?！叭藣徠ヅ洹笔瞧髽I(yè)人力資源管理的核心問題，更是所有HR追求的目標(biāo)。毫不夸張地說，“人崗匹配”是人力資源的起點(diǎn)，也是人力資源的核心目標(biāo)之一。本質(zhì)上，企業(yè)和個人是利益共同體，只有使得組織利益和個體價值得才能使人才發(fā)揮最大價值，同時激活組織。那么，HR如何做好人崗匹配呢？以前，在千百萬份簡歷中篩選人才，是HR工作中“解不開的劫”，每天花費(fèi)大量的時間和精力對優(yōu)秀簡歷和職位信息人工做匹配，不僅消耗著HR的積極性，往往結(jié)果也不盡如人意，篩不到合適的人才，難以滿足業(yè)務(wù)部門的需求。現(xiàn)在，數(shù)字經(jīng)濟(jì)時代的新技術(shù)給HR帶來了更多可能，AI技術(shù)將助力HR實(shí)現(xiàn)智能人崗匹配、大大提升人崗匹配效率與準(zhǔn)確率，將HR從機(jī)械、瑣碎的招聘工作中解放出來。那么，實(shí)現(xiàn)AI人崗匹配背后的依據(jù)和邏輯又是什么呢？e成科技基于前沿的自然語言處理技術(shù)和深度學(xué)習(xí)模型，并結(jié)合大量數(shù)據(jù)和知識圖譜，通過不斷探索和反復(fù)實(shí)踐，形成一套高效的人崗匹配推薦算法系統(tǒng)，下面院長將詳細(xì)為大家介紹這套系統(tǒng)及其背后的邏輯。根據(jù)發(fā)布職位來推薦簡歷，該場景中需要優(yōu)化推薦的準(zhǔn)確率、召回率，提升HR更高的工作效率，提升崗位和簡歷的匹配度來減少招聘人才的成本。在經(jīng)典的機(jī)器學(xué)習(xí)排序模型中通常分為兩種：復(fù)雜的人工特征工程+簡單的模型，簡單的人工特征+復(fù)雜的模型。本著該原則我們對以文本為主的職位和簡歷對進(jìn)行了匹配排序?qū)嵺`。特征為王以JD和CV對為背景，該場景為經(jīng)典的機(jī)器學(xué)習(xí)排序問題，目標(biāo)在于預(yù)測JD和CV是否匹配，數(shù)據(jù)集的采集則是來自我司產(chǎn)品ATS平臺，HR從系統(tǒng)根據(jù)JD推薦的CV來進(jìn)行選擇，符合要求將要走面試程序的則標(biāo)為1，否則標(biāo)為0。2.1特征介紹常見的JD如下圖1所示，其中包含格式化離散數(shù)據(jù)和整段文本數(shù)據(jù)，從整段文本數(shù)據(jù)獲取招聘意圖是提取JD特征的重點(diǎn)難點(diǎn)。為了更好的解決該問題，我們分別引入知識圖譜（KG）方法和自然語言處理（NLP）方法，其中KG負(fù)責(zé)去充分提取文本中實(shí)體的關(guān)系和聯(lián)系，NLP則更好的獲取JD本文和CV文本相似性信息。因涉及個人隱私此處不展示CV信息。在以JD和CV對是否匹配的背景下，我們將特征主要分為以下幾類：JD特征：包含地點(diǎn)，學(xué)歷硬性要求和利用知識圖譜中提取的實(shí)體特征如（職能，公司，技能，專業(yè)，行業(yè)）等；CV特征：包含性別，年齡，學(xué)歷等基礎(chǔ)信息和從工作經(jīng)歷描述文本中提取的實(shí)體信息，以及文本類特征等。2.2特征處理>在獲取JD和CV的基礎(chǔ)特征之后我們主要將特征主要分為四種類型：ID離散特征：比如UID，職能ID，公司ID，行業(yè)ID，技能ID，專業(yè)ID等。硬性離散類特征：除了性別，年齡，工作地點(diǎn)等基礎(chǔ)類型特征，還包含有知識圖譜提取的實(shí)體之間的關(guān)系特征比如學(xué)校是否匹配，職能（工作職位對應(yīng)能力）是否匹配等，此處成為match特征。連續(xù)性特征：除薪資等，還包含有知識圖譜提取的實(shí)體之間的graphembedding的vector相似性值，此處成為IDsim特征。Emdedding特征：包括了ID離散特征的vector，該vector有知識圖譜的graphembedding方法產(chǎn)生（如DeepWalk，LINE等）。文本embedding特征，該特征以JD和CV對的方式輸入DSSM模型產(chǎn)生vector。在此基礎(chǔ)上我們還加入了相應(yīng)統(tǒng)計特征，統(tǒng)計特征主要有強(qiáng)特征的共現(xiàn)特征以及強(qiáng)特征之間的能力不同。模型演變在模型方面主要可以分為兩個總方向，分別是非線性樹和deep模型的探索，在探索上主要是根據(jù)不同模型的性質(zhì)進(jìn)行特征工程。3.1非線性樹模型>我們主要以gbdt為主的樹模型展開特征工程的探索，gbdt的實(shí)現(xiàn)以xgboost和lgb為主。gbdt模型結(jié)構(gòu)如圖2所示，gbdt為一個boosting模型，通過疊加多個弱模型來提升擬合能力，根據(jù)xgboost模型的優(yōu)缺點(diǎn)我們可以充分挖掘可用特征。我們再次整理上一節(jié)可用特征，主要有ID類特征（職能、行業(yè)、公司、技能、專業(yè)等基本信息匹配特征（年齡，工作經(jīng)驗(yàn)，學(xué)校等）該特征為二分類特征，以JD和CV的ID類特征是否匹配來構(gòu)建二分類特征（如職能是否匹配等稱為match特征將這兩類統(tǒng)稱為硬性離散類特征；JD和CV類的graphembedding產(chǎn)生vector對計算余弦值作為連續(xù)特征（稱為IDsim特征），加上文本相似性特征（稱為textsim特征）和薪資組成連續(xù)特征。值得注意的是文本特征主要根據(jù)JD和CV的格式分為title和description兩個部分來挖掘xgboost處理連續(xù)值的缺點(diǎn)我們將連續(xù)值進(jìn)行分桶，桶數(shù)可由某維特征的分布來確定。將ID類特征也一同加入到樹模型中，這是考慮到組合特征的業(yè)務(wù)意義。分析特征重要性之后，我們根據(jù)特征現(xiàn)象去做統(tǒng)計特征，比如出現(xiàn)頻率統(tǒng)計，特征共現(xiàn)統(tǒng)計，多維特征多樣性統(tǒng)計等操作。相對應(yīng)的title和description文本特征也可通過簡單的加權(quán)命中率來構(gòu)成特征加入到樹模型中?？傊畬?shí)驗(yàn)證明ID類特征，二分類特征，連續(xù)特征離散化，統(tǒng)計類特征，以及的vector的交叉特征都會給模型帶來正向收益。embedding產(chǎn)生3.2深度模型的探索>的弊端就是模型的可解釋性變差，根據(jù)結(jié)果反向特征工程變得困難起來。我們在JD和CV匹配場景下分別使用了DNN，Wide&Deep，DeepFM，等模型嘗試。同時并借鑒了PNN、DCN、DLRM和DKN網(wǎng)絡(luò)原理正在適配適合現(xiàn)有數(shù)據(jù)類型的模型。本節(jié)主要簡要介紹DNN和Wide&Deep，DeepFM的使用，再闡述對現(xiàn)有數(shù)據(jù)的思考。以YouTube的經(jīng)典NN為開端（如圖3，引用自相應(yīng)論文），現(xiàn)有的數(shù)據(jù)下如何去使用DNN達(dá)到收益正是我們所考慮的。在現(xiàn)有的特征中除了上文提到的二分類特征，embedding相似性等特征之外我們包含知識圖譜抽取的實(shí)體embedding和文本embedding。文本embedding主要有DSSM模型產(chǎn)生，雙塔模型的輸入分別為JD的title、description，CV工作經(jīng)驗(yàn)的title、description，雙塔輸出為JD和CV是否匹配。我們以雙塔的每坐塔的最后輸出vector作為JD和CV的表征。本著論文中提到的原理我們?nèi)コ藰淠Ｐ椭蠭D類特征，換成了ID對應(yīng)的vector，保留原有的二分類和連續(xù)特征，另外在加入了文本embedding特征，最后的結(jié)果不是很樂觀。因此分析原因可能是某些特征缺失ID（比如CV職能等）初始化為0導(dǎo)致，還存在的原因可能是由于IDvector的知識結(jié)構(gòu)和文本embedding知識結(jié)構(gòu)不同導(dǎo)致，此處知識結(jié)構(gòu)可以理解為不同訓(xùn)練任務(wù)下的embedding空間結(jié)構(gòu)。經(jīng)歷了DNN嘗試沒帶來正向收益我們偏向于以線性和深度非線性結(jié)合的Wide&Deep結(jié)構(gòu)（如圖4）進(jìn)行適配，此時我們考慮到DNN的實(shí)驗(yàn)產(chǎn)生的問題。embedding的結(jié)果，我們采用ID類特征進(jìn)行隨機(jī)初始化的embedding在連接match，IDsim和textsim等特征作為deep的輸入，將match，IDsim，textsim連接作為wide的輸入。以輸入ID類特征，match類特征，IDsim特征，textsim的xgboost模型作為wide&deep的比較模型，實(shí)驗(yàn)證明wide&deep模型略優(yōu)于xgboost模型，但是如果對此基礎(chǔ)上xgboost做統(tǒng)計特征則可超過wide&deep模型。以上可得deep模型非線性表征能力還是略微的比xgboost能力強(qiáng)。deepFM模型，deepFM模型結(jié)構(gòu)圖如圖5所示（引用自deepFM相應(yīng)論文）,deepFM將wide&deep的wide部分替換成了FM機(jī)制提升了模型對特征的交叉組合能力。根據(jù)此模型特征我們將UID，圖譜產(chǎn)生的ID類特征等稀疏特征輸入FM部分，match特征、IDsim特征以及textsim特征為dense特征輸入。結(jié)果很是令人歡喜，達(dá)到了以上實(shí)驗(yàn)的最優(yōu)值，可能這就是深度學(xué)習(xí)帶來的魅力吧。在喜悅的同時，我們想現(xiàn)有的ID初始化embedding都能產(chǎn)生如此大的魅力，利用graphembedding豈不更加喜人。在DeepFM模型輸入基礎(chǔ)上我們將ID的graphembedding也加入到模型的densefeature部分，然而實(shí)驗(yàn)證明并沒有想當(dāng)然的好,甚至產(chǎn)生了負(fù)作用。但至少證明了特征交叉能帶來收益，至于graphembedding的加入為啥效果不好卻是值得思考和探索的問題。經(jīng)過上面的探索我們獲取了一些經(jīng)驗(yàn)，例如交叉特征有用，用embedding產(chǎn)生的向量兩兩相似性計算對樹模型有用，因此我們本著上面積累的經(jīng)驗(yàn)進(jìn)行了人工構(gòu)建交叉特征作為xgboost模型的輸入。在此基礎(chǔ)上加入統(tǒng)計特征，這波操作再次給我們帶來了0.5%的收益。最后總結(jié)下模型方面的探索結(jié)果，以上實(shí)驗(yàn)說明我們還沒有充分利用graphembedding和由DSSM產(chǎn)出的文本embedding，也證明了embedding內(nèi)涵的巨大作用，后期我們將加大力度去挖掘該部分的內(nèi)容。03現(xiàn)階段成果和未來展望4.1現(xiàn)階段成果>經(jīng)過上文特征和模型的探索在此我們分方案來展示我們的實(shí)驗(yàn)結(jié)果，分別包含以下方案：方案1：ID類特征+match特征+IDsim特征+textsim特征+gbdt方案2：IDvector特征+match特征+IDsim特征+textvector特征+dnn方案3：ID類特征（隨機(jī)初始化embedding）+match特征+IDsim特征+textsim特征+deepFM方案4：ID類特征+match特征+IDsim特征+IDvectorinner（交叉）特征+textsim特征+統(tǒng)計特征+gbdt主要以這四種有效的遞進(jìn)關(guān)系來展示，其中多種的組合嘗試就不一一列舉了。效果如表格1中，我們的評價指標(biāo)主要為正例的準(zhǔn)確率，召回率，F(xiàn)1值和總的AUC值作為評價指標(biāo)。以上結(jié)果都為數(shù)據(jù)清洗特征工程后結(jié)果，本次數(shù)據(jù)量JD和CV對大致為86萬，其中負(fù)例和正例比大致為7:1，我們將其隨機(jī)分成8:1:1其中8成訓(xùn)練集、1成訓(xùn)練集和1成測試集。4.2未來展望>據(jù)質(zhì)量和量的保證下我們相信深度學(xué)習(xí)帶來的魅力是巨大的。最近由Facebook出品的DLRM處理異構(gòu)embedding的能力使我們躍躍欲試。另外由微軟出品的DKN網(wǎng)絡(luò)也證明了graphembedding所隱藏的信息量對推薦效果有很大幫助。文獻(xiàn)5中結(jié)合知識圖譜在電商環(huán)境下的推薦也使得我們相信充分挖掘embedding信息可以帶來不錯的收益。作為以技術(shù)為驅(qū)動的企業(yè)，e成科技在AI技術(shù)的基礎(chǔ)上，創(chuàng)新性地提出基于人才畫像和崗位畫像的匹配，為人崗匹配帶來革命性變革。e成科技作為HR+AI賽道的領(lǐng)跑者，一直專注于AI技術(shù)在人力資本領(lǐng)域創(chuàng)新應(yīng)用，開創(chuàng)性地將AI技術(shù)與人力資本場景深度結(jié)合?；?年的AI能力和行業(yè)經(jīng)驗(yàn)積累，e成科技打造了AI開放平臺，將AI能力和產(chǎn)品整合至AI開放平臺，并通過開放平臺將AI能力開放給所有企業(yè)和友商。e成科技AI開放平臺是HR賽道首個企業(yè)自主研發(fā)的聚焦人力資本場景的一站式AI能力服務(wù)平臺，覆蓋簡歷解析、人崗匹配、HR機(jī)器人等諸多場景，通過OpenAPI及需求定制等形式，面向所有自研系統(tǒng)大型企業(yè)、垂直招聘平臺、傳統(tǒng)HR行業(yè)廠商等企業(yè)用戶提供智能化服務(wù)。未來，我們將一直保持高效的創(chuàng)新與研發(fā)能力，將前沿的AI技術(shù)深度融合至人力資本場景，為所有企業(yè)賦能。文獻(xiàn)引用：[1]ChenT,GuestrinC.XGBoost:AScalableTreeBoostingSystem[J].2016.[2]CovingtonP,AdamsJ,SarginE,etal.DeepNeuralNetworksforYouTubeRecommendations[C].-conferenceonrecommendersystems,2016:191-198.[3]ChengH,KocL,HarmsenJ,etal.Wide&DeepLearningforRecommenderSystems[C].conferenceonrecommendersystems,2016:7-10.[4]GuoH,TangR,YeY,etal.DeepFM:AFactorization-MachinebasedNeuralNetworkforCTRPre-diction[J].arXiv:InformationRetrieval,2017.[5]WangJ,HuangP,ZhaoH,etal.Billion-scaleCommodityEmbeddingforE-commerceRecommen-dationinAlibaba[C].knowledgediscoveryanddatamining,2018:839-848.作者：e成科技人崗匹配團(tuán)隊(duì)汪序明（掃描二維碼查看文章）一切皆可Embedding一切皆可Embedding解鎖這項(xiàng)AI黑科技，馬上實(shí)現(xiàn)人崗匹配自由人崗匹配，是企業(yè)人力資源管理的核心之一，更是HR招聘工作的精髓。傳統(tǒng)工作方式下，簡歷搜索和人崗匹配往往消耗HR大量時間和精力，結(jié)果卻往往不精準(zhǔn)，隨著人工智能和NLP技術(shù)的發(fā)展，一些招聘網(wǎng)站紛紛推出自動化推薦功能，但卻同質(zhì)化嚴(yán)重，準(zhǔn)確率不高?，F(xiàn)在“graphembedding”在人力資本領(lǐng)域落地且取得不俗效果，助力人崗匹配更加高效，這樣的AI技術(shù)，作為HR的你值得擁有！在NLP（自然語言處理）中,自然語言無法直接應(yīng)用到數(shù)學(xué)模型的建立中，需要將其映射到歐式空間。Embedding就是解決如何將自然語言表示為向量的，Google推出了Word2Vec模型，可以將語義相近的詞映射到向量空間中相近的位置，之后Google又提出了BERT，BERT可以析等多個語言任務(wù)的表現(xiàn)。同時，Embedding也可以作為深度學(xué)習(xí)模型的隱藏層，可以極大提高模型的表現(xiàn)。自從word2vec橫空出世，似乎各行各業(yè)的一切東西都在被Embedding，Embedding在數(shù)學(xué)上表示一個映射F:X->Y，也就是一個函數(shù)，其中該函數(shù)是一一對應(yīng)的而且保持空間同構(gòu)性(即在X空間是近鄰的，則被映射到Y(jié)空間也是近鄰的)。Embedding技術(shù)被應(yīng)用在了多種業(yè)務(wù)場1)在Airbnb中實(shí)現(xiàn)實(shí)時個性化搜索，利用用戶近幾周或者近幾個月點(diǎn)擊過的房源行為數(shù)據(jù)實(shí)時對用戶的搜索目標(biāo)房源進(jìn)行相似度比較和排序，這樣既極大的提高了效率而且也保證的搜索房源的準(zhǔn)確性提高了用戶體驗(yàn)。2)在電子商務(wù)領(lǐng)域，根據(jù)用戶的瀏覽和購買行為數(shù)據(jù)，通過深度學(xué)習(xí)模型可以將用戶和物品同時嵌入(embedding)到相同的低維空間，然后利用Embedding計算用戶和物品之間的相似度（匹配度）直接給用戶推薦感興趣的物品。在人力資本領(lǐng)域，求職者、公司、職位、專業(yè)、技能等不同的實(shí)體間存在著多種類型的關(guān)系，構(gòu)成了一個知識圖譜（KnowledgeGraph）。這里，我們主要關(guān)注的是GraphEmbedding(其實(shí)也可以稱為NetworkEmbedding)。我們利用GraphEmbedding技術(shù)，把這些實(shí)體嵌入到低維的向量空間，可以直接比較他們的相似性，并能大大的提高簡歷和崗位的匹配效果。對于具有較多類型節(jié)點(diǎn)且各類型節(jié)點(diǎn)的數(shù)量巨大來說這是比較好的嘗試，而且取得了一些效果。生成GraphEmbedding常用方法及其原理由于graphembedding的廣泛應(yīng)用，同時衍生出了很多計算embedding的方法，下面我們介紹幾種商業(yè)上比較常用的幾種方法：1)DeepWalkDeepWalk[3]是KDD2014的一篇文章，我們常用的word2vec是根據(jù)詞的共現(xiàn)關(guān)系利用skipgram和COBW將詞映射到低維向量。DeepWalk算法思路其實(shí)是利用了word2vec生成embedding的一種方法skipgram，對于已經(jīng)建立的Graph來說每個節(jié)點(diǎn)可以是不同的實(shí)體且實(shí)體時間可以有不同的關(guān)系，從圖上的一個節(jié)點(diǎn)開始隨機(jī)游走（randomwalk如果節(jié)點(diǎn)之間有weight可以根據(jù)weight的不同進(jìn)行walk來生成類似文本的序列數(shù)據(jù)，實(shí)體id作為一個個詞使用skipgram訓(xùn)練得到詞向量。算法的大體思路就是：根據(jù)圖中節(jié)點(diǎn)隨機(jī)游走->生成一定長度的序列->利用skip-gram進(jìn)行訓(xùn)練。2)LINELINE（Large-scaleInformationNetworkEmbedding）是2015年文章[4]中微軟亞洲研究院提出來的一種算法，LINE定義了兩種度量節(jié)點(diǎn)相似度的方法:一階相似度(First-orderproximity)和二階相似度(Second-orderproximity)。一階相似度節(jié)點(diǎn)之間無連接，則一階相似度為0；對每個無向邊，定義頂點(diǎn)和的聯(lián)合概率分布為：是頂點(diǎn)的低維向量表示,我們的目的就是使得經(jīng)驗(yàn)分布和概率分布盡可能的接近，于是我們定義以下一階相似度的目標(biāo)函數(shù)：其中為兩種分布之間的距離，為空間上的一個分布,=是它的經(jīng)驗(yàn)分布,其中W為兩點(diǎn)間邊權(quán)重總和。我們選擇KL散度來計算（2）式子。分布q，比較兩個概率分布的相似性：將，帶入KL散度的公式我們得到︰KL散度的計算公式其實(shí)是熵計算公式的簡單變形,在原有概率分布分布q，比較兩個概率分布的相似性：將，帶入KL散度的公式我們得到︰其中C為一個常數(shù)，需要注意的是，一階相似度僅適用于無向圖,而不適用于有向圖。二階相似度越高則它們的相似性就越高。二階相似性假定與其他頂點(diǎn)共享鄰居頂點(diǎn)的兩個點(diǎn)彼此相似(無向有向均可)，一個向量和分別表示頂點(diǎn)本身和其他頂點(diǎn)的特定“上下文”，意為二階相似。對于每個有向邊，我們首先定義由頂點(diǎn)生成“上下文”的概率：式子(5)是一個條件分布，對于頂點(diǎn)，我們的目的就是要擬合與其經(jīng)驗(yàn)分布。為邊的權(quán)重，為相鄰邊的權(quán)重的和，因此最小化以下目標(biāo)函數(shù)：d(,)上文已經(jīng)說明，來表示頂點(diǎn)的度數(shù)。這里我們令利用KL散度同一階相似性的推導(dǎo)類似我們可以得到二階相似性的計算公式（去掉常數(shù)項(xiàng)）為：3)Node2vecNode2vec[5]3)Node2vecNode2vec[5]算法是在DeepWalk基礎(chǔ)上進(jìn)行了改進(jìn)，主要的創(chuàng)新點(diǎn)在于改進(jìn)了隨機(jī)游走的策略，DeepWalk中根據(jù)邊的權(quán)重進(jìn)行隨機(jī)游走，而Node2vec加了一個權(quán)重調(diào)整參數(shù)，同時考慮到局部和宏觀的信息，并且具有很高的適應(yīng)性。除了以上提到的常用的生成embedding方法，學(xué)術(shù)界和工業(yè)界還提出了很多方法，像SDNE[6]、Struc2vec、Starspace[7]（Facebook用的技術(shù)）、EGES（阿里巴巴推薦使用的技術(shù)之一）GraphEmbedding為人崗匹配帶來新突破在人力資本行業(yè)最主要的兩大核心要素就是簡歷CV和工作崗位JD，如何讓CV和JD匹配是人力資本行業(yè)一直非常重視的問題也是一個難題。我們在人力資本行業(yè)領(lǐng)域?qū)mbedding的嘗試和應(yīng)用，并且取得了一定的效果。有效的graph1）原始文本處理想要有效的進(jìn)行人崗匹配（即CV和JD的合理匹配），需要綜合考慮包括職能、行業(yè)、技能、專業(yè)等維度在內(nèi)的多維度匹配。首先應(yīng)該提取CV、JD中的文本特征，可以利用深度學(xué)習(xí)模型提取出CV、JD的文本特征，我們這里稱為實(shí)體。抽取出實(shí)體之后，我們就可以進(jìn)行CV和JD的匹配，對于自由文本來說除了CV和JD的實(shí)體完全匹配上，可以算他們的相似度，詞的語義相似度無法完全的詮釋。舉個例子：CV的特征：技能實(shí)體（JAVA），職能實(shí)體（JAVA開發(fā)工程師）、專業(yè)實(shí)體（計算機(jī)）JD的特征：技能實(shí)體（Spring），職能實(shí)體（JAVA后端開發(fā)）、專業(yè)實(shí)體（信息技術(shù)）從詞的表面是無法區(qū)分他們的相似度的。下面就用到了embedding，embedding可以將這些實(shí)體嵌入到同一低維的向量空間，在空間中實(shí)體之間的距離可以通過數(shù)學(xué)公式計算從而表示他們的相似性。2）生成實(shí)體embedding第一步：數(shù)據(jù)的生成，我們首先利用CV、JD中不同實(shí)體的共現(xiàn)，以及不同工作經(jīng)歷之間的跳轉(zhuǎn)來抽取簡歷中的實(shí)體跳轉(zhuǎn)，這些不同的實(shí)體之間可以構(gòu)成network如圖1所示。不同的實(shí)體就是不同的節(jié)點(diǎn)，實(shí)線就是節(jié)點(diǎn)之間的邊也可以稱為關(guān)系。圖1第二步：使用Deepwalk、LINE生成embedding。對于Deepwalk可以直接根據(jù)network生成不同的文本序列，利用skip-gram進(jìn)行模型的訓(xùn)練。而對于LINE可以直接利用不同實(shí)體的共現(xiàn)次數(shù)作為模型的輸入。第三步：優(yōu)化訓(xùn)練數(shù)據(jù)。我們發(fā)現(xiàn)不同的實(shí)體出現(xiàn)次數(shù)的量級是不同的，比如專業(yè)在JD中就很少出現(xiàn)，這樣就導(dǎo)致了數(shù)據(jù)的不平衡。我們解決的方式是，統(tǒng)計了不同實(shí)體之間的t?df、npmi（NormalPointwiseMutualInformation）作為實(shí)體之間的權(quán)重，即表示了不同實(shí)體之間關(guān)系的強(qiáng)弱程度，之后再進(jìn)行模型的訓(xùn)練。第四步：以上都是利用無監(jiān)督的方式去訓(xùn)練embedding，由于e成科技有自己獨(dú)立的人力資源ATS系統(tǒng)，包含了用戶大量的真實(shí)行為數(shù)據(jù)。把其中匹配上的CV、JD作為正例，未匹配上的作為負(fù)例，構(gòu)造出有監(jiān)督的訓(xùn)練數(shù)據(jù)。將JD作為query，CV作為title，利用DSSM模型(如圖2)進(jìn)行有監(jiān)督的模型訓(xùn)練。需要注意的是這里的embedding層并不是隨機(jī)初始化的，而是利用第三步已經(jīng)訓(xùn)練過的embedding作為預(yù)訓(xùn)練的權(quán)重。這樣有監(jiān)督訓(xùn)練的目的就是利用真實(shí)的行為數(shù)據(jù)更新embedding層的數(shù)據(jù)，使得每個實(shí)體的embedding更能好的表達(dá)在招聘這個業(yè)務(wù)場景中的語義。圖1我們使用內(nèi)部標(biāo)注的評估數(shù)據(jù)對不同模型進(jìn)行了評估，比較結(jié)果如下:以下是fasttext和graphembedding模型輸出的top相關(guān)公司實(shí)體的一些例子?？梢钥吹紽astText單單只從字面意思進(jìn)行了相似度匹配；而graphembedding模型輸出結(jié)果能夠更好地包含了具有相似業(yè)務(wù)、相似規(guī)模的公司，具有更好的語義相關(guān)性。以下是fasttext和graphembedding模型輸出的top相關(guān)公司實(shí)體的一些例子。可以看到FastText單單只從字面意思進(jìn)行了相似度匹配；而graphembedding模型輸出結(jié)果能夠更好地包含了具有相似業(yè)務(wù)、相似規(guī)模的公司，具有更好的語義相關(guān)性。0404HR+AI領(lǐng)跑者，助力每一個HR實(shí)現(xiàn)AI賦能本文主要闡述了Embedding的原理以及一些應(yīng)用，具體的闡述了Graphmbedding在人力資本領(lǐng)域的落地應(yīng)用。Embedding既可以作為計算各個實(shí)體的工具也可以作為深度學(xué)習(xí)中的embedding嵌入層增加模型的準(zhǔn)確性。不夸張的說一切可以embedding，而且embedding在很多領(lǐng)域都取得了不俗的成就，尤其是NLP領(lǐng)域。e成科技作為HR+AI賽道的領(lǐng)跑者，一直專注于人力資本領(lǐng)域的AI創(chuàng)新升級，開創(chuàng)性地將AI技術(shù)與人才戰(zhàn)略升級場景深度結(jié)合,我們已經(jīng)將embedding技術(shù)應(yīng)用到人崗匹配、面試Bot等多實(shí)際場景，接下來我們將繼續(xù)優(yōu)化embedding，助力AI技術(shù)在人力資源領(lǐng)域的更多應(yīng)用。同時，基于積累多年的AI能力和行業(yè)經(jīng)驗(yàn)，e成科技重磅打造了AI開放平臺，并將AI能力開放給所有企業(yè)和友商。e成科技AI開放平臺是HR賽道首個企業(yè)自主研發(fā)的聚焦人力資本場景的一站式AI能力服務(wù)平臺，覆蓋簡歷解析、人崗匹配、HR機(jī)器人等諸多場景，通過OpenAPI及需求定制等形式，面向所有自研系統(tǒng)大型企業(yè)、垂直招聘平臺、傳統(tǒng)HR行業(yè)廠商等企業(yè)用戶提供智能化服務(wù)。參考文獻(xiàn)：[1]Banana，神奇的Embedding,/p/53058456[2]Ethan，Embedding的理解，/p/46016518[3]PerozziB,Al-RfouR,SkienaS.DeepWalk:OnlineLearningofSocialRepresentations[J].arXivpre-printarXiv:1403.6652,2014.[4]TangJ,QuM,WangM,etal.Line:Large-scaleinformationnetworkembedding[C]//Proceedingsofthe24thinternationalconferenceonworldwideweb.InternationalWorldWideWebConferencesSteer-ingCommittee,2015:1067-1077.[5]GroverA,LeskovecJ.node2vec:Scalablefeaturelearningfornetworks[C]//Proceedingsofthe22ndACMSIGKDDinternationalconferenceonKnowledgediscoveryanddatamining.ACM,2016:855-864.[6]WangD,CuiP,ZhuW,etal.StructuralDeepNetworkEmbedding[C].knowledgediscoveryanddatamining,2016:1225-1234.[7]Wu,L.,Fisch,A.,Chopra,S.,Adams,K.,Bordes,A.,&Weston,J.(2017).StarSpace:EmbedAllTheThings!arXivpreprintarXiv:1709.03856作者：e成科技知識圖譜團(tuán)隊(duì)白永斌（掃描二維碼查看文章）人才畫像畫得好，數(shù)字化HR有妙招AI黑科技：BertELMo(EmbeddingfromLanguageModels)模型Embeddingattention人才畫像畫得好，數(shù)字化HR有妙招俗話說“人才畫像畫得好，HR招聘快不少”。人才畫像是現(xiàn)在企業(yè)人才招聘和人才管理的核心，并應(yīng)用在人崗匹配、薪酬預(yù)測、人才盤點(diǎn)等諸多場景。數(shù)字化時代，畫像成為人才招聘和人才管理的入口，通過上百個維度進(jìn)行提煉、總結(jié)進(jìn)行人才全方位刻畫。但如何刻畫畫像，畫像準(zhǔn)不準(zhǔn)，還得這背后默默運(yùn)行的AI算法和知識圖譜說了算。（persona）的概念最早由交互設(shè)計之父AlanCooper提出:“Personasareaconcreterepresentationoftargetusers.”是指真實(shí)用戶的虛擬代表，是建立在一系列屬性數(shù)據(jù)之上的目標(biāo)用戶模型。如今，為了提高客戶體驗(yàn)和運(yùn)營效率，畫像早已被應(yīng)用在各行各業(yè)。金融企業(yè)是最早開始使用用戶畫像的行業(yè)，在人力資本領(lǐng)域，人才/崗位畫像的應(yīng)用大大提升了HR的工作效率和質(zhì)量，是人力資本數(shù)字化的重要入口和核心要素。所謂人才/崗位畫像，即是基于企業(yè)招聘的顯性的職位描述和隱形的內(nèi)在潛質(zhì)共同組成的用戶畫像（以下簡稱“畫像”）?！饕粡埉嬒?，沒有讀不懂的人才構(gòu)建畫像的核心工作，主要是利用存儲在服務(wù)器上的海量日志和數(shù)據(jù)庫里的大量數(shù)據(jù)進(jìn)行分析和挖掘，給用戶貼“標(biāo)簽”，而“標(biāo)簽”是能表示用戶某一維度特征的標(biāo)識。字段進(jìn)行數(shù)值化處理。其中結(jié)構(gòu)化數(shù)據(jù)比較容易進(jìn)行數(shù)值編碼（例如：性別/年齡/工作年限等而非結(jié)構(gòu)化數(shù)據(jù)（例如工作經(jīng)歷/職能/技能等）多數(shù)為文本類型處理難度較高。對于非結(jié)構(gòu)化數(shù)據(jù)，生成具備語義含義的Embedding是業(yè)界較為廣泛使用的方案。職能/技能可以統(tǒng)稱為用戶的知識體系，即使每一個職能/技能生成了具備語義含義的Embedding，如何通過聚合生成用戶整個知識體系的數(shù)值表達(dá)并盡可能保留文本自身的信息，依舊是亟待解決的問題。據(jù)（例如文本類型）包含了更全面和深度的用戶潛在信息，目前通過詞向量加權(quán)平均依舊是主流使用的處理方法。此類方法存在一些缺陷：1.生成的Embedding完全基于語義表達(dá)，缺失了其內(nèi)在業(yè)務(wù)含義；2.直接加權(quán)平均的方法，容易掩蓋掉重要的信息，且權(quán)重不好定義?；诖?，我們針對人力資本場景，借鑒Bert的思想提出了一個新方法，能夠更好地用數(shù)學(xué)的方法對人才/崗位畫像進(jìn)行表示。為了讓AI+數(shù)據(jù)驅(qū)動的數(shù)字化招聘更為精準(zhǔn)智能，我們以e成科技獨(dú)有的HR行業(yè)職能/技能知識圖譜作為先驗(yàn)的業(yè)務(wù)知識，并基于海量簡歷和崗位描述數(shù)據(jù)（千萬級借鑒Bert的模型架構(gòu)，專門對畫像中的知識體系相關(guān)字段（職能/技能）進(jìn)行了深度優(yōu)化。該方法提供的知識表征，首先包含了技能/職能的內(nèi)在關(guān)系，其次通過attention的方式聚合能保證重要業(yè)務(wù)信息的不丟失。經(jīng)過優(yōu)化的人才/崗位畫像，在數(shù)字化招聘、人崗匹配、人才盤點(diǎn)、薪酬預(yù)測等多個下游業(yè)務(wù)場景中均取得顯著的優(yōu)化提升。部分場景舉例人才選拔：通過人才畫像分析，使人才供給與業(yè)務(wù)發(fā)展速度高度匹配，優(yōu)化人才隊(duì)伍配置效率，降低人才流失率；人才任用：通過崗位畫像和人才畫像的分析與匹配度分析，實(shí)現(xiàn)人才和崗位最優(yōu)配置，使優(yōu)秀人才能充分發(fā)揮能力與主觀能動性，提高人力資本效率；薪酬預(yù)測：根據(jù)人才畫像和崗位畫像，結(jié)合行業(yè)崗位知識，分析人才/候選人技能及發(fā)展水平，預(yù)測候選人及企業(yè)未來薪酬水平；接下來，院長就將為大家介紹e成科技在有關(guān)領(lǐng)域的最新方案以及應(yīng)用成果。ELMoVSELMoVSWord2Vec，更優(yōu)的特征提取器Word2Vec是近幾年非常流行的WordEembedding提取模型。模型通過預(yù)先構(gòu)建的詞表將輸入語句中某單詞前、后所有詞語編碼為多個one-hot向量傳入模型，隨后通過一個共享的參數(shù)矩陣將這些向量映射到隱藏層，最后使用softmax將隱藏層的輸出轉(zhuǎn)化為詞表中每個單詞的概率作為輸出，其中概率最高的單詞即為最終預(yù)測結(jié)果。經(jīng)過充分訓(xùn)練后，詞表中每個單詞的語義信息已經(jīng)充分“嵌入”了用于映射輸入層和隱藏層的參數(shù)矩陣中。使用時只需用單詞的one-hot向量和參數(shù)矩陣相乘就可以得到對應(yīng)的WordEmbedding。這樣的網(wǎng)絡(luò)結(jié)構(gòu)為Word2Vec帶來了一個嚴(yán)重的問題，它無法為語言中常見的多義詞提取Embedding。由于同一個單詞在參數(shù)矩陣中只占據(jù)一個向量，網(wǎng)絡(luò)只能將多義詞的不同語義信息全部編碼到相同的向量中，反而降低了這些詞向量的表達(dá)能力。此外，Word2Vec只采用了一個線性隱藏層，特征提取能力較弱，對Embedding的表現(xiàn)也有很大的影響。ELMo(EmbeddingfromLanguageModels)模型使用與Word2Vec截然不同的方式提取Embedding，并采用更優(yōu)的特征提取器，很好地解決了多義詞問題，同時增強(qiáng)了詞向量的表達(dá)能力。模型使用兩層雙向LSTM(LongShortTermMemory)單元作為模型中間層，其中正向LSTM順序接受輸入語句中給定單詞的上文，逆向LSTM倒序接受語句中給定單詞的下文。訓(xùn)練完成后將輸入層Embedding和兩層LSTM產(chǎn)生的Embedding加權(quán)結(jié)合后作為句中每個單詞的Embedding使用。與Word2Vec查表式獲取靜態(tài)的Embedding不同，ELMo可以根據(jù)上下文信息動態(tài)調(diào)整詞語的Embedding。多層LSTM特征提取器可以從文本中分別提取句法、語義等不同層次的信息，大大提升了詞語特征的豐富程度。Attention機(jī)制是近幾年提出的新型特征提取器，在NLP領(lǐng)域的表現(xiàn)效果遠(yuǎn)超以往使用的卷積Self-Attention單元構(gòu)成的大型網(wǎng)絡(luò)和巧妙設(shè)計的無監(jiān)督訓(xùn)練方式使模型可以利用豐富的自由文本進(jìn)行訓(xùn)練，從中提取多層次的語言特征。0303e成科技的應(yīng)用：知識表征模型我們的知識表征模型（以下簡稱“模型”）同樣使用了多層Self-Attention單元作為基本的特征提取器，嘗試從e成科技豐富的數(shù)據(jù)中挖掘出可描述職能和技能各自特征及其相關(guān)關(guān)系的Embedding。為了訓(xùn)練這樣的模型，我們借鑒并調(diào)整了Bert的設(shè)計思路，建立一套符合我們訴求的模型結(jié)構(gòu)。模型將e成科技知識圖譜中職能和技能的實(shí)體名稱作為Embedding提取粒度，端到端地進(jìn)行損失。模型訓(xùn)練時，我們使用職能、技能前后拼接的數(shù)據(jù)結(jié)構(gòu)，其中來自相同CV數(shù)據(jù)的職能、技能作1。為了防止模型僅抽取職能對技能的依賴關(guān)系，我們在將職能和技能調(diào)換順序后的數(shù)據(jù)加入樣本中同時訓(xùn)練，以提取雙向的依賴關(guān)系。經(jīng)過充分訓(xùn)練后，模型可以提供多樣化的使用方式。模型最后一層輸出和輸入序列等長的Embedding序列，其中第一個Embedding包含整條數(shù)據(jù)的特征，之后每個Embedding與輸入序列的詞語一一對應(yīng)，分別是每個詞語的動態(tài)特征。將序列頭Embedding接入下游任務(wù)網(wǎng)絡(luò)中可以對模型進(jìn)行?ne-tune，可進(jìn)一步用于不同的細(xì)分領(lǐng)域任務(wù)。同時，其余Embedding也可以直接作為詞語特征使用?？紤]到模型結(jié)構(gòu)復(fù)雜，運(yùn)算時間較長，針對某些性能要求較高的業(yè)務(wù)場景，可以將模型輸入層對應(yīng)的Embedding作為靜態(tài)詞向量使用，通過查表方式大大簡化運(yùn)算流程。我們使用內(nèi)部標(biāo)注的薪酬預(yù)測、人崗匹配數(shù)據(jù)對不同模型進(jìn)行了評估，結(jié)果如下：薪酬預(yù)測任務(wù)中，每個模型需要提取候選人的技能Embedding作為下游任務(wù)的參數(shù)，輔助判斷候選人的薪酬水平。實(shí)驗(yàn)中模型之間互不影響，且使用相同的下游薪酬預(yù)測模型。結(jié)果中可以看到，我們的知識技能表達(dá)模型對下游任務(wù)各項(xiàng)指標(biāo)均有5%左右的提升。而人崗匹配任務(wù)中，我們將崗位和候選人各自技能Embedding之和作為它們的特征向量，通過特征向量相似度判斷候選人和崗位是否匹配。評估結(jié)果顯示，我們的模型表現(xiàn)非常出眾，提升效果明顯。分未正確還原的情況?？梢钥吹郊词惯€原失敗，模型也能夠預(yù)測到行業(yè)內(nèi)與正確結(jié)果相似的答案。數(shù)字化時代，HR作為推動企業(yè)數(shù)字化升級的核心力量之一，通過數(shù)字化工具助力人才管理和人才引進(jìn)數(shù)字化，已經(jīng)成為必然趨勢。e成科技創(chuàng)新研發(fā)的畫像+Bot兩大引擎，助力人才知己、企業(yè)知人、社會知命。利用大數(shù)據(jù)和人工智能技術(shù)構(gòu)建的畫像，將對人才的素質(zhì)、性格、職業(yè)動力都進(jìn)行全方位描述，幫助人才認(rèn)識自己，進(jìn)行自我反思，同時幫助企業(yè)和HR更全面、更立體、更準(zhǔn)確識別候選人，實(shí)現(xiàn)選、融、育、激各個環(huán)節(jié)高效的人才管理。作為HR+AI賽道的領(lǐng)跑者，e成科技從創(chuàng)立伊始就將AI基因根植于業(yè)務(wù)，并開創(chuàng)性地將AI技術(shù)與人才戰(zhàn)略升級場景深度結(jié)合。同時，基于積累多年的AI能力和HR行業(yè)經(jīng)驗(yàn)，e成科技重磅打造了AI開放平臺，通過OpenAPI及需求定制等形式將AI能力開放給所有企業(yè)和友商。e成科技AI開放平臺是HR賽道首個企業(yè)自主研發(fā)的聚焦人力資本場景的一站式AI能力服務(wù)平臺，覆蓋簡歷解析、人崗匹配、HR機(jī)器人等諸多場景，這些HR+AI的創(chuàng)新應(yīng)用和智能產(chǎn)品背后，都是e成科技領(lǐng)先的AI能力和默默潛心研發(fā)的科學(xué)家及算法工程師們作為支撐。未來，e成科技將持續(xù)打造更多創(chuàng)新智能產(chǎn)品，全面加速人力資本數(shù)字化升級！作者：e成科技AI算法團(tuán)隊(duì)陳嘉欽（掃描二維碼查看文章）場景：音視頻面試內(nèi)容：AI面試官來襲，HR你準(zhǔn)備好了嗎？AI黑科技：機(jī)器學(xué)習(xí)、語音識別、面部識別、排名算法、計算機(jī)視覺技術(shù)、語義理解能力、跨媒體協(xié)同推理技術(shù)AI面試官來襲，HR你準(zhǔn)備好了嗎？這回院長為大家?guī)硪粋€神秘炸彈：獵豹（Leopard）項(xiàng)目！聽起來是不是很炫酷？你一定想不到，這個獵豹（Leopard）項(xiàng)目是做什么的吧？沒錯！就是眾多候選人“聞風(fēng)喪膽”的AI面試！這是e成科技AI算法團(tuán)隊(duì)研究的新成果，之所以起這個名字是希望我們的AI面試像草原上狩獵的獵豹一樣敏捷高效！下面就隨院長一起看看“這只獵豹”背后的黑科技吧！說到AI面試，相信很多參加過校招的候選人都不陌生，被HireVue支配的恐懼還歷歷在目，不少小伙伴面完忍不住把一首“涼涼”送給自己……對于很多企業(yè)和HR來說，AI面試更是應(yīng)用廣泛。招聘是企業(yè)和HR亙古不變的主題，尤其是眾多大廠每年要面臨千百萬量級的候選人，面對如此龐大的應(yīng)聘者數(shù)量，AI技術(shù)無疑是簡化招聘的利器。AI的力量。過去幾年，使用AI視頻面試的公司從14%上升至60%，聯(lián)合利華、歐萊雅、可口可達(dá)能、高盛、瑞士銀行、摩根大通等全球600多家企業(yè)陸續(xù)開始使用AI面試的形式進(jìn)行首輪面試。在提供AI面試的企業(yè)中，以視頻面試公司HireVue開發(fā)的服務(wù)最為著名。在一個典型的AI視回答情況，結(jié)合面試者聲音及面部表情的信息，判斷其能否通過這一場面試?！鲌D片來自HireVue官網(wǎng)之所以越來越接受的企業(yè)愿意類似的AI面試，院長覺得有如下幾個原因：1.相比于傳統(tǒng)的人工面試，基于音視頻的AI面試可以在前期大大減少HR的工作量，降低企業(yè)2.在簡歷篩選和初面階段，由于不同面試官的專業(yè)水平和個人喜好不同，會使得面試存在著很大的偶然性。而基于AI的音視頻面試的面試評價標(biāo)準(zhǔn)相對統(tǒng)一，對每個面試者也更加公平；3.基于音視頻的AI面試除了能夠?qū)γ嬖囌叩幕卮疬M(jìn)行分析外，還可以對面試者的表情及回答內(nèi)容給出實(shí)時的分析與反饋，既能提升面試者體驗(yàn)，也有助于提升公司的品牌形象。不過，要做到體驗(yàn)級的音視頻面試能力，對于產(chǎn)品和技術(shù)的要求都是非常高的。不同的行業(yè)與招聘場景，對于音視頻面試的要求都是不同的，想要產(chǎn)品既契合場景且體驗(yàn)出色，少不了大量高大上的AI面試背后的黑科技。0202黑科技揭秘：AI面試為何那么神2004年HireVue成立之初，只是為了記錄面試者視頻數(shù)據(jù)，供HR參考。10年后，HireVue融入了AI技術(shù)，重新定義了“面試”。這些AI技術(shù)是基于機(jī)器學(xué)習(xí)的復(fù)雜算法，并結(jié)合語音識別以及面部識別，協(xié)同排名算法，通過15000+個不同的維度（包括肢體語言、語音模式、眼神活動、做題速度、聲音大小等）來對候選者進(jìn)行評分?！鰽I面試可以通過15000+個不同維度對候選者評分,圖片來自BusinessInsider之前有同學(xué)跟院長說，現(xiàn)在我們的語音識別和人臉識別技術(shù)都已經(jīng)非常成熟，做基于AI的音視頻頻面試只是把這些能力進(jìn)行一下組合，難度并不大。這種說法確實(shí)有一些道理，AI面試產(chǎn)品的出現(xiàn)確實(shí)是得益于近年來人工智能飛速的發(fā)展，特別是深度學(xué)習(xí)在計算機(jī)視覺和語音識別等領(lǐng)域的廣泛應(yīng)用。但是，面試場景又對AI能力有很多特殊的要求，需要有針對性做大量工作，下面院長結(jié)合e成科技在這方面的研究成果和創(chuàng)新研發(fā)進(jìn)行介紹：語義理解能力要對求職者的能力有好的判斷，面試官必須對求職者所說的內(nèi)容做到充分的理解，AI面試官也不例外。除了夠理解面試者的意圖，并且判斷面試者的通用表達(dá)能力、語言邏輯性的通用語義理解外，AI面試官還需要具備更加專業(yè)的知識。借助于六年來積累的大量人力資源行業(yè)專家知識及知識圖譜，e成科技開發(fā)的AI面試產(chǎn)品不但可以基于不同崗位的需求進(jìn)行技能追問和熟練度判斷，并且研發(fā)行業(yè)內(nèi)首個BEI機(jī)器人，通過分析候選人提供的故事來判斷其在不同崗位要求素質(zhì)項(xiàng)上的評分。對話能力為了保證求職者擁有更好的面試體驗(yàn)，AI面試官也得像普通面試官一樣跟候選人流暢地對話，這除了依賴前面所說的語義理解能力外，也需要強(qiáng)大的對話能力作為支持。e成科技近年來開發(fā)多款HR場景聊天機(jī)器人，并沉淀出統(tǒng)一對話框架Snowball?；谠搶υ捒蚣埽珹I面試機(jī)器人可以進(jìn)行統(tǒng)一的意圖識別和對話策略管理，并同時支持知識庫問答和閑聊（Chitchat），帶給候選人更好的面試體驗(yàn)。語音與視覺能力進(jìn)行音視頻面試非常核心的工作是對語音和視頻內(nèi)容的理解。其中語音識別是整個AI面試對候識別外，e成科技的科學(xué)家和算法工程師們還在探索基于一些基礎(chǔ)的語音信息對面試者的面試狀態(tài)（比如，面試者是否緊張）、基礎(chǔ)表達(dá)能力和普通話能力進(jìn)行分析。與狀態(tài)，對于一些頂替、偷看資料等面試作假的情況，可以利用人臉識別和動作場景識別的計算機(jī)視覺算法進(jìn)行識別。更進(jìn)一步地，與HireVue等AI面試產(chǎn)品類似，e成科技也在開發(fā)利用計算機(jī)視覺技術(shù)對面試者進(jìn)行更細(xì)致的分析，比如借助微表情和情緒識別技術(shù)判斷面試者在回答問題過程中的心理狀態(tài)，甚至捕捉到一些候選人可信度不夠高的回答。跨媒體有了音視頻的處理能力，AI面試官可以從視覺、語音、語義等不同維度獲取候選人的信息，雖然每個維度都能夠獲取大量候選人信息，但要真正想把AI面試做好，必須對這些不同維度的信息進(jìn)行統(tǒng)一分析。舉個例子，當(dāng)候選人在提到某個關(guān)鍵概念時，說話的語氣和眼神可能會有一的參考和幫助。想要實(shí)現(xiàn)這樣的功能，除了各個本身的內(nèi)容理解外，還需要引入“跨媒體協(xié)同推理”技術(shù)。這一技術(shù)是新一代人工智能的重要組成部分，通過視聽感知、機(jī)器學(xué)習(xí)和語言計算等理論和方法，構(gòu)建出實(shí)體世界的統(tǒng)一語義表達(dá)，從而跨媒體的分析和推理。e成科技在自己的音視頻面試產(chǎn)品斷的準(zhǔn)確性。0202黑科技揭秘：AI面試為何那么神AI技術(shù)似乎具有與生俱來的爭議性。雖然基于音視頻的AI面試已經(jīng)在很多場合得到廣泛應(yīng)用，但是也有不少人對其產(chǎn)生質(zhì)疑。一方面，到底AI面試官的信效度如何，能否達(dá)到專業(yè)面試官的水平？院長覺得機(jī)器和人類各有優(yōu)劣，機(jī)器并不是要替代人類，而是要輔助人類，和人類更好地合作。在具體形式上，AI面試官和專業(yè)面試官可以有很多協(xié)同方式，比如由AI面試官進(jìn)行候選人的初篩，并且給后續(xù)專業(yè)面試官提供面試評價與建議。也有人會覺得AI面試可能產(chǎn)生一些倫理問題，如是否會產(chǎn)生一些對相貌和言語的歧視？其實(shí)這好這些問題，讓自己成為AI時代的受益者。簡而言之，AI面試的初衷是幫助優(yōu)秀的候選人脫穎而出，從而讓招聘者重點(diǎn)關(guān)注優(yōu)秀候選人；同時，可以大大幫助HR節(jié)省時間，把更多精力放在關(guān)注人才質(zhì)量、選拔多樣性上。人工智能是應(yīng)對這些挑戰(zhàn)的最佳方式。而從創(chuàng)立之初就將AI基因深植于業(yè)務(wù)的e成科技，一直在潛心研發(fā)和積累，致力于將AI技術(shù)深度應(yīng)用于人力資本全場景中，推動人力資本智能變革。憑借自身在AI能力和行業(yè)經(jīng)驗(yàn)的獨(dú)特優(yōu)勢，以及來自全球頂尖跨媒體技術(shù)實(shí)驗(yàn)室的AI核心團(tuán)隊(duì)，擁有頂尖的跨媒體AI技術(shù)，結(jié)合多年積累的知識圖譜與對話技術(shù)，e成科技推出的AI面試機(jī)器人更是如虎添翼。△e成科技AI開放平臺四大算法中臺目前，e成的音視頻面試技術(shù)已經(jīng)在一線員工自動化招聘和候選人Bot等場景中落地，為大量的用戶賦能，助力企業(yè)降本增效。未來，隨著科技飛速發(fā)展，AI技術(shù)正在根據(jù)大數(shù)據(jù)和深度學(xué)習(xí)不斷優(yōu)化和升級，AI在行業(yè)的應(yīng)用也會越來越廣泛和深入，我們也必須擁抱變化，適應(yīng)人機(jī)交互新模式，通過駕馭智能工具，實(shí)現(xiàn)數(shù)字化升級。e成科技愿意借助于自身在AI開放平臺、技術(shù)、產(chǎn)品、行業(yè)經(jīng)驗(yàn)等優(yōu)勢，助您實(shí)現(xiàn)人力資本數(shù)字化新升級！作者：e成科技AI算法團(tuán)隊(duì)劉洋（掃描二維碼查看文章）真技術(shù)還是偽AI，HR如何選擇合適的智能工具？HR圖靈學(xué)院|一文讀懂RPA、AI與HR的關(guān)系A(chǔ)I黑科技：語音識別(ASR)、自然語言理解(NLU)、對話管理（DM）、文本生成（NLG）、語音合成（TTS）、文本檢索、情感分析、光學(xué)文字識別（OCR）……一文讀懂RPA、AI與HR的關(guān)系近兩年，科技行業(yè)熱詞里突然多了一個簡寫—RPA，有人把RPA當(dāng)作解放勞動力的救星，認(rèn)為任何大規(guī)模、重復(fù)性工作都能用RPA機(jī)器人代替，大大節(jié)省了人力、時間和金錢。比如在人力資本領(lǐng)域，研究表明，HR們大約93％時間花費(fèi)在重復(fù)性工作上，但65％的工作流程其實(shí)可以實(shí)現(xiàn)自動化，RPA可以將HR從大量、繁瑣、重復(fù)的任務(wù)中解放出來，如簡歷篩選、面試邀約、員工入職、員工數(shù)據(jù)管理、考勤管理、離職管理……從而將時間和資源聚焦在更高價值和戰(zhàn)略性任務(wù)上。Gartner研究表明，到2022年底85％的大型和超大型組織將部署某種形式的RPA。一時間，RPA風(fēng)頭無兩，被認(rèn)為未來市場前景廣闊，引得各路投資人爭先恐后。但也存在不同聲音，有人說RPA是開數(shù)字化歷史的倒車，認(rèn)為RPA只不過是在重復(fù)執(zhí)行腳本，不過是不斷執(zhí)行命令的“手腳”，AI才是發(fā)布命令的“大腦”。面對眾說紛紜、信息紛繁，我們似乎只能管中窺豹難得全貌，那么到底該如何看待RPA？RPA和AI有哪些聯(lián)系？RPA和HR又有哪些關(guān)系呢？本期，院長就聊一聊關(guān)于RPA你想知道的那些事兒。（掃描二維碼查看文章）真技術(shù)還是偽AI，HR如何選擇合適的智能工具？2019年，RPA突然火了，成為新興風(fēng)口、資本的寵兒，甚至有些媒體宣稱人力資源部門一定要部署RPA，但這種火熱到底是資本炒作，還是RPA真的有用，相信很多人都心存疑惑……01RPA能滿足HR需求嗎RPA(RoboticProcessAutomation是指用軟件流程自動化方式實(shí)現(xiàn)在各個行業(yè)中本來是人工操作計算機(jī)完成的業(yè)務(wù)。事實(shí)上，第一期院長和大家探討了RPA與AI的關(guān)系，傳統(tǒng)RPA并沒有用到特別前沿的人工智能技術(shù)，RPA也并不等同于人工智能。但隨著近些年來，軟件流程自動化技術(shù)與AI這兩個互補(bǔ)概念結(jié)合在一起，RPA很多環(huán)節(jié)上用到了越來越多的人工智能技術(shù)，使得工具更加智慧，也提升了效率減少了人工，于是RPA在金融、財務(wù)和工業(yè)自動化等領(lǐng)域應(yīng)用越來越廣泛。對于企業(yè)人力資源部門來講，HR每天都需面對大量事務(wù)性工作，這些事務(wù)性工作大都可以通過自動化的方式由機(jī)器人來替代。而借助語音識別、OCR等AI能力，也的確能夠進(jìn)一步提升RPA的靈活性與智能性，替代人工將繁瑣的業(yè)務(wù)操作流程自動化，解放HR們的雙手，提升HR的工作效率。可見，RPA的真正價值在于，其可以將HR從以往大量、繁瑣、重復(fù)的事務(wù)性工作（如篩選簡歷、入離職辦理、社保、福利、開具證明等）中解放出來，將時間和資源集中在高價值的、戰(zhàn)略性任務(wù)上（比如支持組織轉(zhuǎn)型、引入職業(yè)發(fā)展規(guī)劃、尋找最新培訓(xùn)材料、理解業(yè)務(wù)特點(diǎn)和實(shí)操場景、為企業(yè)戰(zhàn)略提供決策依據(jù)等），提高人資效率。但RPA真的能滿足HR的所有工作需求嗎？院長曾經(jīng)和一些在互聯(lián)網(wǎng)公司的HR小伙伴們探討這個問題，他們紛紛表示人資軟件操作并非他們工作的主要內(nèi)容，單純的軟件流程自動化對他們幫助非常有限。首先，我們知道不同于金融、財務(wù)等工作，HR每天更多時間花在了與候選人、員工的面試與溝通上。這些溝通需要HR與員工協(xié)同進(jìn)行，時間與方式都非常靈活，很難通過傳統(tǒng)軟件進(jìn)行自動化。其次，優(yōu)秀的HR進(jìn)行的溝通應(yīng)該是有溫度的，這樣的溫度很難在軟件自動化中體現(xiàn)和傳遞出來。最后，很多重要的決策也需要基于溝通的結(jié)果，結(jié)合大量的專業(yè)知識來進(jìn)行，這也并非簡單RPA可以實(shí)現(xiàn)的?？梢姡词褂辛薃I的助力，RPA也不能完全滿足HR需求，還需要有更強(qiáng)大的工具來幫助HR提升相關(guān)的工作效率。0202實(shí)現(xiàn)人與人更好地連接：畫像+Bot事實(shí)上，人力資源部門不缺自動化技術(shù)及系統(tǒng)。市場上種類繁多的自動化工具和系統(tǒng)，都能或多或少解決HR們的一部分需求，通過自動化大大降低HR處理事務(wù)性工作的時間和精力。但HR需要的僅僅是一個代替自己雙手的自動化工具嗎？一個RPA機(jī)器人就夠了嗎？工作已經(jīng)不能滿足企業(yè)發(fā)展的需求，如何充分利用人與技術(shù)的合作，全面提升組織與人才管理、員工體驗(yàn)和組織數(shù)字化升級變革成為重中之重。相比于RPA，我們相信智能對話機(jī)器人（ChatBot）更能實(shí)現(xiàn)人與人之間更好地相互連接，更適合幫助HR完成日?，嵥榈臏贤üぷ鳎嵘鼿R的工作效率與員工體驗(yàn)。這里的機(jī)器人既可以是基于文字交互的聊天機(jī)器人，也可以是基于電話線路的外呼機(jī)器人。HR只需要簡單配置，就可以將這些機(jī)器人應(yīng)用在各種場景中，比如與候選人進(jìn)行面試邀約，進(jìn)行電話面試并7*24小時回答候選人各種問題，還可以和在職員工進(jìn)行實(shí)時交流，了解他們對于自己和公司的各種想法。當(dāng)畫像與Bot結(jié)合在一起時，還會發(fā)生更加奇妙的化學(xué)反應(yīng)。如果把畫像比作大腦，Bot就相Bot也具備了更強(qiáng)的專業(yè)性和個性化能力，更能像一個專業(yè)HR一樣與候選人或者員工進(jìn)行交流。首先，“畫像+Bot”與“RPA+AI”本身的動機(jī)是類似的，都是致力于通過自動化、數(shù)字化、智能化提升HR工作效率，降低人資部門的流程負(fù)擔(dān)；其次，僅僅靠RPA實(shí)現(xiàn)流程自動化提升HR工作效率是遠(yuǎn)遠(yuǎn)不夠的，注重體驗(yàn)性和智能性的對話機(jī)器人對HR的效率提升更為關(guān)鍵；最后，AI這個概念過于龐大，對人力資源領(lǐng)域而言，畫像是AI最為重要的體現(xiàn)，大量智能化工作都需要圍繞著畫像進(jìn)行體現(xiàn)；所以，相比于RPA+AI，畫像+Bot的提法更貼近人力資源的實(shí)際場景需求，也更有利于真正將HR從事務(wù)性工作中解放出來，給候選人及員工更好的體驗(yàn)。羅馬不是一天建成的，構(gòu)建好Bot與畫像能力也一樣，一方面需要長期的數(shù)據(jù)與技術(shù)積累，另一方面也需要有大量的實(shí)際業(yè)務(wù)經(jīng)驗(yàn)。反觀行業(yè)內(nèi)一些公司，在RPA與AI的熱潮下，短時間內(nèi)搖身一變就成了一家RPA+AI的公司，這其中究竟有多少AI能力，而這些AI能力有真正能對業(yè)務(wù)產(chǎn)生多大幫助，恐怕要打上一個大大的問號。能做出HR真正滿意的產(chǎn)品，靠的不是蹭熱點(diǎn)，而是對業(yè)務(wù)的深入理解和對技術(shù)的不斷追求。RPA能滿足HR需求嗎e成科技從成立伊始就秉持“科技助力人才升級”的公司使命，并以“畫像”和“Bot”作為兩大核心驅(qū)動力。經(jīng)過多年的技術(shù)積累，e成科技在智能對話機(jī)器人領(lǐng)域沉淀出自主研發(fā)的Snowball對話框架，具備意圖識別、槽位提取、實(shí)體識別、對話管理、問答對話、閑聊對話等諸多對話能力。尤其針對人力資源領(lǐng)域特點(diǎn)，Snowball有針對性的搜集語料進(jìn)行模型訓(xùn)練，并且增加了許多定制化功能以保證對話系統(tǒng)的專業(yè)性及良好體驗(yàn)。而在用戶畫像方面，基于多年的豐富行業(yè)經(jīng)驗(yàn)，e成科技形成了包含百萬級實(shí)體和千萬級關(guān)系的知識圖譜作為畫像的知識儲備，同時加入專業(yè)咨詢團(tuán)隊(duì)的理論編寫大量專家規(guī)則，并結(jié)合業(yè)界前沿的機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)模型，構(gòu)建了覆蓋廣、精度高的用戶畫像體系，帶動相關(guān)業(yè)務(wù)的發(fā)展?；谝陨蠈υ捙c畫像能力，e成科技研發(fā)了大量覆蓋人力資本全場景的智能應(yīng)用，將AI技術(shù)與HR場景深度融合，更加貼合數(shù)字化時代下HR的業(yè)務(wù)需求。部分應(yīng)用小e外呼：基于人工智能意圖識別及對話管理，利用電話外呼技術(shù)實(shí)現(xiàn)的高潛候選人自動意向溝通最佳解決方案，突破性提高人才復(fù)用率；員工機(jī)器人：將e成科技多年積累的HR領(lǐng)域業(yè)務(wù)知識與智能對話機(jī)器人結(jié)合，減少HR重復(fù)工作，提升員工工作體驗(yàn)；面試機(jī)器人：基于崗位畫像和專家知識對候選人進(jìn)行智能化面試，通過刻畫人才畫像幫助HR全面了解候選人；HR機(jī)器人：通過Bot構(gòu)建交互信息的采集和分析系統(tǒng)，打造面向HR、員工、候選人的全場景高效對話體驗(yàn)；人崗匹配：基于人才及崗位畫像，結(jié)合專家知識與前沿深度學(xué)習(xí)模型個性化推薦人才，提升HR工作效率；△從Bot集群到超級Bot，科技助力人才升級HR行業(yè)首個AI開放平臺，賦能行業(yè)變革部AI技術(shù)，于是一時間市場上涌現(xiàn)眾多“HR+AI”、“RPA+AI”的人力資本產(chǎn)品或服務(wù)，可謂亂花漸欲迷人眼。但通用AI技術(shù)往往與業(yè)務(wù)場景有著巨大的鴻溝，AI技術(shù)與垂直行業(yè)的融合，絕非一朝一夕之事。誠然，目前的“AI熱”或者“RPA熱”反映了市場的焦慮和人力資本領(lǐng)域數(shù)字化轉(zhuǎn)型的迫切需求，AI”的道路上越走越遠(yuǎn)。AI技術(shù)成功應(yīng)用到人力資本場景，是不斷試錯，不斷創(chuàng)新和優(yōu)化的過程，需要長時間的研發(fā)和打磨。作為HR+AI賽道領(lǐng)跑者，e成科技的AI能力從創(chuàng)立起就深植于基因，并伴隨著人力資本業(yè)務(wù)發(fā)展不斷學(xué)習(xí)和進(jìn)化，融合了深厚的HR行業(yè)經(jīng)驗(yàn)積累、頂尖專家團(tuán)隊(duì)提供專業(yè)知識，突破技術(shù)邊界，才在HRSaaS領(lǐng)域形成獨(dú)一無二的“護(hù)城河”。e成科技AI核心優(yōu)勢AI技術(shù)優(yōu)勢：6年的AI能力積累，掌握深度學(xué)習(xí)、數(shù)據(jù)挖掘與分析、自然語言處理、知識圖譜、智能推薦、人才素質(zhì)模型、情感分析、實(shí)體識別等核心AI技術(shù)，引領(lǐng)AI技術(shù)與人力資本場景深度融合；頂尖團(tuán)隊(duì)優(yōu)勢：3位頂尖AI科學(xué)家，超過50人的來自BAT等互聯(lián)網(wǎng)巨頭的優(yōu)秀算法團(tuán)隊(duì)，超過30人的來自全球知名咨詢企業(yè)的HRTech行業(yè)咨詢團(tuán)隊(duì)陣容；行業(yè)知識優(yōu)勢：超大規(guī)模全行業(yè)人力資源知識圖譜，歷時6年，10,000+家企業(yè)使用驗(yàn)證，成功構(gòu)建50,000,000+實(shí)體關(guān)系；AI行業(yè)認(rèn)可：HR賽道唯一入選上海人工智能發(fā)展聯(lián)盟（SAIA）和中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟（AIIA）的會員單位，多次斬獲人工智能技術(shù)應(yīng)用十強(qiáng)、AI商業(yè)落地百強(qiáng)等諸多榮譽(yù)；基于以上優(yōu)勢和能力，經(jīng)過多年積累和孵化，e成科技打造了HR賽道首個AI開放平臺，并將多年AI能力積累開放給所有HR友商，助力實(shí)現(xiàn)人力資本智能化升級與變革。e成科技AI開放平臺是HR賽道首個企業(yè)自主研發(fā)的聚焦人力資本場景的一站式AI能力服務(wù)平臺，覆蓋簡歷解析、人崗匹配、HR機(jī)器人等諸多場景，通過OpenAPI及需求定制等形式，面向所有自研系統(tǒng)大型企業(yè)、垂直招聘平臺、傳統(tǒng)HR行業(yè)廠商等企業(yè)用戶提供智能化服務(wù)。e成科技AI開放平臺提供的服務(wù)主要集中在這三種形式：標(biāo)準(zhǔn)化AI能力：將NLP、NLU等前沿的AI技術(shù)全面應(yīng)用于HR各類核心業(yè)務(wù)場景，為用戶直接輸出單個或多個AI技術(shù)能力，如簡歷解析、職位解析、人崗匹配等；組件化AI產(chǎn)品：基于業(yè)務(wù)深度理解，實(shí)現(xiàn)AI產(chǎn)品組件化、平臺化，用戶通過標(biāo)準(zhǔn)API接入，實(shí)現(xiàn)快速調(diào)用AI產(chǎn)品，無需企業(yè)再次開發(fā)；個性化場景解決方案：根據(jù)用戶的個性化場景需求提供定制化的AI能力和服務(wù)，打造企業(yè)專屬目前，e成科技AI開放平臺已助力多家企業(yè)合作伙伴智能應(yīng)用落地，賦能行業(yè)智能化變革。后續(xù)，我們將為大家分享一些精彩案例，盤點(diǎn)下AI賦能企業(yè)變革的那些事兒。院長結(jié)語：數(shù)字化時代，企業(yè)紛紛在尋求智慧變革，人力資源部門是推動企業(yè)變革的重要動力之一，HR也要時刻隨著時代和科技的變化而變化，找到并駕馭合適、高效的智能化工具，將助力人力資源工作者和企業(yè)領(lǐng)先同行，實(shí)現(xiàn)數(shù)字化升級彎道超車。為客戶服務(wù)的道路上沒有終點(diǎn)，為了實(shí)現(xiàn)這一目標(biāo)，未來，e成科技將持續(xù)努力把技術(shù)能力與人力資本業(yè)務(wù)更好地結(jié)合，推出更多滿足HR場景需求的智能化產(chǎn)品與服務(wù)，與合作伙伴們一起攜手開啟人力資本數(shù)字化新時代！作者：e成科技AI算法團(tuán)隊(duì)劉洋（掃描二維碼查看文章）場景：智能聊天機(jī)器人內(nèi)容：請回答B(yǎng)ERT：HR聊天機(jī)器人強(qiáng)大聊天技能背后的秘密AI黑科技：BERT(BidirectionalEncoderRepresentationsfromTransformers)BERT-base\BERT_wwm\ernie模型自然語言處理（NLP）請回答B(yǎng)ERT：HR聊天機(jī)器人強(qiáng)大聊天技能背后的秘密聊天機(jī)器人等智能應(yīng)用的出現(xiàn)，無疑在人力資本領(lǐng)域掀起了一場聲勢浩大的革命，它的即時性、全天候、智能化回應(yīng)，不僅提升了候選人/員工的體驗(yàn)，也大大地提升了HR效率，降低企業(yè)成本。不難想象，未來這些智能化應(yīng)用將會給我們帶來更多驚喜。在這里，院長不禁要問，你知道這么好用的聊天機(jī)器人背后，是什么AI技術(shù)在支撐嗎？很多人都說當(dāng)然是NLP，沒錯，但NLP背后呢？還有一個利器就是：BERT！2018年底到2019年，NLP領(lǐng)域從學(xué)術(shù)界到工業(yè)界最火熱最強(qiáng)大的模型是什么？那就是BERT！BERT已然成為NLP技術(shù)歷史上最重大轉(zhuǎn)折點(diǎn)之一，是NLP技術(shù)向加速產(chǎn)業(yè)落地邁進(jìn)的一大步。e成科技作為HR+AI賽道領(lǐng)跑者，從BERT一經(jīng)發(fā)布就敏銳察覺到了機(jī)遇，積極布局相關(guān)研究，不斷跟進(jìn)最近進(jìn)展、探索相關(guān)應(yīng)用，取得不錯的積累和成果。在這篇文章里，院長將簡單向大家闡述BERT的相關(guān)背景、原理、升級，以及e成科技在人力資本領(lǐng)域的一些應(yīng)用、探索和思考。01背景：什么是BERTBERT(BidirectionalEncoderRepresentationsfromTransformers)，是google于2018年底提出的一個預(yù)訓(xùn)練語言模型，它通過無監(jiān)督的方法對大規(guī)模的自然語言的語料進(jìn)行學(xué)習(xí)，從中提取出人類語言的內(nèi)在基本規(guī)律，輔助后續(xù)的自然語言理解的相關(guān)任務(wù)。例如，對于一段文本：e成科技是HR+AI賽道的領(lǐng)跑者，在NLP領(lǐng)域有很多的技術(shù)積累。用通俗的語言理解，BERT在學(xué)習(xí)的是以下兩方面的能力：1.當(dāng)輸入了“e成科技是一家HR+AI___的領(lǐng)跑者”的時候，模型要學(xué)習(xí)到填而不是其他的任何的無關(guān)詞。2.當(dāng)輸入了“e成科技是HR+AI賽道的領(lǐng)跑者”的時候，模型要學(xué)習(xí)到“在NLP領(lǐng)域有很多的技術(shù)積累”是最佳的下一句，而不是其他的任何句子。以上兩方面的能力，可以理解為是人類語言的基本規(guī)律，那么當(dāng)模型學(xué)習(xí)到這種規(guī)律之后，有BERT的強(qiáng)大能力以BERT模型為基礎(chǔ)，通過?netune的方式，可以在BERT已經(jīng)習(xí)得的語言知識的基礎(chǔ)上，1.理解更深入。由于已經(jīng)在大量的自然語言中習(xí)得了基本的語言規(guī)律，當(dāng)模型面臨一個新的自然語言任務(wù)的時候，模型可以利用的知識就包含了已經(jīng)習(xí)得的海量語言規(guī)律+新任務(wù)里的知識，使得模型能夠更加深入新任務(wù)所表達(dá)的規(guī)律。2.更少的樣本依賴。在

人人文庫> 全部分類> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

AI+HR黑科技秘笈-AI賦能人力資本智能化變革

文檔簡介

溫馨提示

最新文檔

評論

AI+HR黑科技秘笈-AI賦能人力資本智能化變革

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔