智能客服方案及技術(shù)架構(gòu)_第1頁
智能客服方案及技術(shù)架構(gòu)_第2頁
智能客服方案及技術(shù)架構(gòu)_第3頁
智能客服方案及技術(shù)架構(gòu)_第4頁
智能客服方案及技術(shù)架構(gòu)_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

智能客服

——聊天機(jī)器人

智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第1頁。問題解決型實現(xiàn)技術(shù)解決方案架構(gòu)及開發(fā)流程小Y(智能機(jī)器人)智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第2頁。問題解決型機(jī)器人智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第3頁。問題解決型機(jī)器人,存在的目的是為了幫用戶解決具體問題,例如:售前咨詢、售后報修、訂機(jī)票、酒店、餐廳座位等等需要提供給用戶自己都不知道的信息--知識庫1.理解用戶問題,知道用戶在問什么2.將用戶的問題轉(zhuǎn)化為對知識庫的查詢智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第4頁。問題理解查詢知識庫構(gòu)建知識庫查詢多輪對話的上下文管理提問:今天北京多少度?。炕卮穑?5度提問:有霧霾嗎?(北京有霧霾嗎?)回答:空氣質(zhì)量優(yōu)。提問:那上海呢?(上海有霧霾嗎?)回答:空氣質(zhì)量也是優(yōu)。結(jié)合上下文智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第5頁。聊天機(jī)器人解決方案智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第6頁。自然語言處理、文本挖掘、知識圖譜智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第7頁。知識庫中存儲的是一對對的“問題-答案”對(QAPair)。這些Pair可以是人工構(gòu)建的,源于客戶系統(tǒng)或者舊有知識庫的,也可以是從互聯(lián)網(wǎng)上爬取下來的。當(dāng)用戶輸入問題后,將其和知識庫現(xiàn)有的標(biāo)準(zhǔn)問題進(jìn)行一一比對,尋找與用戶問題最相近的標(biāo)準(zhǔn)問題,然后將該問題組對的答案返回給用戶。用戶問題->標(biāo)準(zhǔn)問題->答案解決方案一智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第8頁。用戶問題->標(biāo)準(zhǔn)問題的匹配方法可以是關(guān)鍵詞匹配(包括正則表達(dá)式匹配);也可以是先將用戶問題和標(biāo)準(zhǔn)問題都轉(zhuǎn)化為向量,再計算兩者之間的距離(余弦距離、歐氏距離、交叉熵、Jaccard距離等),找到距離最近且距離值低于預(yù)設(shè)閾值的那個標(biāo)準(zhǔn)問題,作為查找結(jié)果。但關(guān)鍵字匹配覆蓋面太小。距離計算的話,在實踐中比對出來的最近距離的兩句話,可能在語義上毫無關(guān)聯(lián),甚至滿擰(比如一個比另一個多了一個否定詞)“關(guān)鍵詞”智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第9頁。解決方案二知識庫中存儲的不是問題-答案對,而僅存儲答案(文檔)。當(dāng)接收到用戶問題后,直接拿問題去和知識庫中的一篇篇文檔比對,找到在內(nèi)容上關(guān)聯(lián)最緊密的那篇,作為答案返回給用戶。用戶問題->答案智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第10頁。解決方案三從用戶的問題當(dāng)中識別出用戶的意圖,并抽取這個意圖針對的實體。相應(yīng)的,知識庫內(nèi)存儲的知識,除了包含知識內(nèi)容本身之外,還應(yīng)該在結(jié)構(gòu)上能夠表示知識之間的關(guān)聯(lián)關(guān)系。在提取了意圖和實體后,構(gòu)造出對知識庫的查詢(Query),實施查詢,得出結(jié)果后生成回答,回復(fù)給用戶。用戶問題->語義理解->知識庫查詢->查詢結(jié)果生成答案智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第11頁。聊天機(jī)器人實現(xiàn)技術(shù)智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第12頁。語義理解NLU意圖識別實體抽取用來識別用戶所提問題的意圖,也就是用戶希望做一件什么事用于提取用戶對話中所提供的和意圖相關(guān)的參數(shù)(實體),例如時間、地點等智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第13頁。Case1:有粉色的手機(jī)殼嗎?——意圖:商品推薦;實體:商品類型-手機(jī),商品顏色-粉色。Case2:00183號商品快遞到伊犁郵費多少?——意圖:查詢郵費;實體:目的地-伊犁,商品Id-00183。Case3:02465號商品有保修嗎?——意圖:保修查詢;實體:商品Id-02465。舉個例子,小明是一家小淘寶店主,他要為自己的淘寶店開發(fā)一款客服機(jī)器人,主要回答和商品屬性(品牌、價格、郵費、售后等)相關(guān)的問題。Case2’:00183號商品快遞到伊犁郵費多少?——意圖:商品查詢;實體:目的地-伊犁,商品Id-00183,商品屬性-郵費。Case3’:02465號商品有保修嗎?——意圖:商品查詢;實體:商品Id-02465,商品屬性-保修。具體怎么定義,要與知識庫的結(jié)構(gòu)及中間控件(語義理解+對話管理)結(jié)合起來決定,怎么簡單怎么來智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第14頁。意圖識別-分類模型分類模型和seq2seq判別模型的訓(xùn)練都屬于有監(jiān)督學(xué)習(xí),因此,所有的訓(xùn)練數(shù)據(jù)都是標(biāo)注數(shù)據(jù)。因此,在進(jìn)入訓(xùn)練階段前必須要經(jīng)過一個步驟:人工標(biāo)注。如果大家真的在工作中應(yīng)用機(jī)器學(xué)習(xí),標(biāo)注就是無法逾越的臟活累活。實體抽取-Seq2Seq判別模型智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第15頁。人工標(biāo)記語料(Utterance)意圖(Intent)[00183]{商品Id}號商品快遞到[伊犁]{目的地}[郵費]{商品屬性}多少?商品查詢[02465]{商品Id}號商品有[保修]{商品屬性}嗎?商品查詢訂[一張]{數(shù)量}[2018.12.1]號{時間}[北京]{出發(fā)地}到[南京]{目的地}的機(jī)票訂機(jī)票智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第16頁。知識庫、知識查詢和結(jié)果返回知識庫用于存儲知識,本身可以是各種形式:數(shù)據(jù)庫,API,或者文本文件等。用戶的問題經(jīng)過語義理解,被提取成了意圖和若干實體。知識庫類型構(gòu)造查詢回答生成關(guān)系型數(shù)據(jù)庫根據(jù)意圖和實體,確定tabmeName,where條件,和目標(biāo)column等要素,構(gòu)建SQLQuery將SQLQuery的結(jié)果填注到答案模板中,生成回答問題的自然語言API根據(jù)意圖和實體,確定要調(diào)用的API類型和參數(shù),構(gòu)造HttpRequest將API返回的結(jié)果填注到答案模板中,生成回答問題的自然語言文本文件(json/xml等)根據(jù)意圖和實體,確定對應(yīng)的文件路徑和對其中存儲數(shù)據(jù)結(jié)構(gòu)的查詢將獲取的內(nèi)容填注到模板中,生成回答問題的自然語言智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第17頁。例如,我們選擇MySQL作為小明的淘寶店小助手的知識庫。則商品相關(guān)數(shù)據(jù)都存儲在table中。知識庫里有一個Table,名字叫product_query,其中每一個row對應(yīng)一種產(chǎn)品,每個column對應(yīng)一個屬性。Case2’:00183號商品快遞到伊犁郵費多少?——意圖:商品查詢;實體:目的地-伊犁,商品Id-00183,商品屬性-郵費。Case3’:02465號商品有保修嗎?——意圖:商品查詢;實體:商品Id-02465,商品屬性-保修。table_name:product_querycolumn: 目的地->destination 商品Id->product_id 郵費->postage 保修->guaranteeCase2’:SELECTpostageFROMproduct_queryWHEREproduct_id='00183'ANDdestination='伊犁'Case3’:SELECTguaranteeFROMproduct_queryWHEREproduct_id='02465'Query在MySQL中運行的結(jié)果(比如是26元),被放到一個預(yù)置的針對商品查詢的答案模板里,生成答案。預(yù)置模板:${商品Id}號商品的${商品屬性}是${Query_Result}。生成答案:00183號商品的郵費是26元。智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第18頁。上下文管理例如:在商品查詢的目標(biāo)屬性為郵費時,目的地缺失,這時候就需要主動要求用戶輸入對應(yīng)的值。思路:1.在配置意圖和實體模板時,需設(shè)置[郵費]相依賴的實體(商品ID、目的地)2.創(chuàng)建意圖表,實體表,建立意圖表與實體表間的關(guān)系,實體與實體間的關(guān)系3.識別出意圖后,提取實體,如果發(fā)現(xiàn)缺失,則一個接一個提示用戶輸入對應(yīng)的指(配置回答模板)機(jī)器人反問每次用戶新輸入的信息都要先進(jìn)行語言理解,再結(jié)合目前已經(jīng)存儲的上下文信息,或更新Context,或讀取之前的Context作為補(bǔ)充信息??梢詫⒁鈭D,和幾種實體類型對應(yīng)的實體值存儲在Context中。當(dāng)新的用戶語句輸入后,若能從中提取出新的意圖或?qū)嶓w值,則用新值更新Context,否則,讀入現(xiàn)有的對應(yīng)實體值,作為本次語言理解的補(bǔ)充。智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第19頁。架構(gòu)及開發(fā)流程智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第20頁。問答咨詢......知識主力銷售引導(dǎo)業(yè)務(wù)辦理Web微信APP聊天工具......應(yīng)用場景接入渠道中控調(diào)度策略第三方系統(tǒng)行業(yè)知識互聯(lián)網(wǎng)數(shù)據(jù)用戶畫像搜索引擎(語義檢索/文檔檢索...)靜態(tài)知識FAQFAQ管理動態(tài)知識KGKG構(gòu)建管理意圖訓(xùn)練實體抽取流程設(shè)計高頻問題突增問題滿意度NLP知識包智能知識庫會話管理數(shù)據(jù)監(jiān)控客服大腦產(chǎn)品架構(gòu)智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第21頁。用戶問題AIML格式常見問題模板匹配構(gòu)建查詢意圖識別實體抽取語義理解查詢知識庫填注模板答案處理關(guān)鍵詞提取自然語言處理ES文檔查詢構(gòu)造Jena查詢構(gòu)建知識圖譜智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第22頁。語料獲取網(wǎng)絡(luò)爬取開源語料庫用戶日志語料人工編寫語料預(yù)處理人工標(biāo)記模板配置業(yè)務(wù)咨詢閱讀用戶日志模型訓(xùn)練分詞Word2Vec卷積神經(jīng)網(wǎng)絡(luò)Keras文本分類命名實體識別詞性標(biāo)注TensorFlow語義理解NLU保存模型智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第23頁。知識圖譜KnowledgeGraph本體構(gòu)建網(wǎng)絡(luò)爬取客戶文檔本體庫實體詞典語義解析本體查詢查詢陳述構(gòu)造查詢語句執(zhí)行查詢語句謂語消歧陳述本體庫命名實體識別歧義陳述構(gòu)建依存句法分析實體消歧陳述語義圖構(gòu)建語義圖陳述構(gòu)建謂語消歧陳述智能客服方案及技術(shù)架構(gòu)全文共27頁,當(dāng)前為第24頁。語義理解(意圖識別、實體抽取):Python+TensorFlow+RNN等知識圖譜:Java+NLP知識庫存儲:數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論