qcon2018小機(jī)器人誕生之路_第1頁(yè)
qcon2018小機(jī)器人誕生之路_第2頁(yè)
qcon2018小機(jī)器人誕生之路_第3頁(yè)
qcon2018小機(jī)器人誕生之路_第4頁(yè)
qcon2018小機(jī)器人誕生之路_第5頁(yè)
已閱讀5頁(yè),還剩67頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

小Q 近期主要關(guān)注人工智能 教育等創(chuàng)新產(chǎn)品的研發(fā)小Q小Q

小Q小Q 聊12聊12

小Q33 器QQ空間 器峰值每日聊天2000w次,用戶130w(業(yè)界領(lǐng)先單用戶會(huì)話輪次達(dá)到15AI模型,算法實(shí)踐結(jié)果做到70%開(kāi) 閉?量數(shù) 檢索式

深度學(xué)習(xí)

多樣化數(shù)據(jù) 生成式

RankingQuery理解(TF、Ranking分詞&

searchdsearchd

基于Sphinx技術(shù)特色——獨(dú)家配方Rank數(shù)據(jù)數(shù)據(jù)baseline A1:休息下A2:你還 A3:R率F-R率F---------POS-IDF A1:休息下A2:你還 啊A3:下次叫我一起,球場(chǎng)

Word2vecRF-深度學(xué)習(xí)引入深度學(xué)習(xí)CNN模型,基于TGU訓(xùn)練\評(píng)測(cè)\部署,Q數(shù)據(jù)做了拼接共用一個(gè)卷積池化的參數(shù),然后求余弦相似度。ApplyingDeepLearningtoAnswerSelection:AStudyandAnOpen深度學(xué) 我們引 改進(jìn)模型對(duì)原有 N模型對(duì)比優(yōu)化LearningtoRankShortTextPairswithConvolutionalDeepNeuralNR率F-R率F-技術(shù)特色——獨(dú)家配方Rank

Pair

12POS-技術(shù)特色——獨(dú)家配方Rank綜合詞共現(xiàn)/IDF詞向量 N取得比baseline在F值上約70%的提升RF-----N詞共現(xiàn)+idf-基于UGC中文和Emoji表情label利于深度學(xué)習(xí)LSTM目前6分類(lèi)的成功率大于80結(jié)合寵物的情感分 也開(kāi)始顯現(xiàn)(KFC&寵物321 器321

小Q小Q

整合人工智能基礎(chǔ)能力 生態(tài)系統(tǒng)合作伙伴。——騰訊2017年Q2財(cái)+44整合騰訊內(nèi)多項(xiàng)AI上下文管 會(huì)話管

流 流

AILabsAILabsQQ QQ

流式上任 支任 支

我要 稻

意圖識(shí)別實(shí)體抽 實(shí)體消 領(lǐng)域預(yù)分 相似度排領(lǐng)域指令粗 指令擴(kuò) 句子相似 槽位填提高響應(yīng)速率策略:fastText在top3的領(lǐng)域上選中目標(biāo)準(zhǔn)確率達(dá)到97.6%Fasttext1fastText原理

物聯(lián)控制音 故 通 算 電 提 笑 天 百科通用控由于停用詞影響正確率(你、我、他等),這里設(shè)置停用詞去掉后剩余詞多于由于停用詞影響正確率(你、我、他等),這里設(shè)置停用詞去掉后剩余詞多于個(gè)(謂賓短語(yǔ)),停用詞。否則保留停用詞。2t的實(shí)體(歌曲、歌手等)給予較低權(quán)重。主流語(yǔ)義相似度算法:CNN,wmd 心如刀看深南大道

看深南大道堵 (無(wú)實(shí)體基于29個(gè)句子/詞性特征,實(shí)體消歧采用GBDT+Boosting95%,提高容錯(cuò)能力策略:QueryCorrection(QC)321 器321

小Q小Q的團(tuán)隊(duì)缺乏硬 ,硬件如何選型,硬件研發(fā)如何開(kāi)展 硬件項(xiàng)目周期長(zhǎng),如何做到快速驗(yàn)證,快速試錯(cuò),快速

頭效果 花

失 按鍵通信題

過(guò) 電磁干

1、總耗時(shí)達(dá)4.423、每個(gè)流程都在不同的部門(mén),有些功能還是剛走 4、TTS耗時(shí)過(guò)長(zhǎng),需要15、靜音檢測(cè)每次都要消耗 耗時(shí)過(guò)長(zhǎng),接近2秒 2、優(yōu)化各個(gè)步驟耗時(shí),比如音樂(lè)從800ms優(yōu)化到3

靜音檢

目標(biāo)是秒開(kāi),追趕AmazonEcho的應(yīng)答速度。

音樂(lè)意 稻音樂(lè)意 稻我要 稻

語(yǔ)音識(shí) 語(yǔ)義分

3、TTS不用等待音樂(lè)查詢結(jié)果,節(jié)省約 生成 流

響應(yīng)速度優(yōu)化——TTS傳統(tǒng)TTS生成音頻文件,返回地址客戶

痛點(diǎn):耗時(shí)?。ㄔ诎倏祁?lèi)長(zhǎng)內(nèi)容上非常明顯1、 生成完整音頻文件時(shí)2、客戶端拿到音頻地址后時(shí)間到可 的時(shí)響應(yīng)速度優(yōu)化——TTS根據(jù)文本實(shí)時(shí)生成語(yǔ)音包數(shù)據(jù),借助TCP ,OPUS將語(yǔ)音包編碼后,有序送往客戶,OPUS可將語(yǔ)音包從2880b減至300b

數(shù)據(jù) 數(shù)據(jù)

OPUSPCM1、流式TTS 時(shí)間不依賴于文本的長(zhǎng)度,在長(zhǎng)文本和短文本上時(shí)間無(wú)差2、客戶端無(wú)需 , 會(huì)以PUSH的形式有序傳遞給客戶測(cè)試數(shù)據(jù)來(lái)源測(cè)試數(shù)據(jù)來(lái)源 PC調(diào)試工具連接前端IC,dump工作時(shí)各寄存器的設(shè)置,確認(rèn)IC發(fā)現(xiàn)問(wèn)題:codec模塊AEC沒(méi)有打開(kāi)前端adc、codec抓取原始音頻pcmmicAEC針對(duì)前端信號(hào)幅度被截的問(wèn)題,調(diào)整了codec調(diào)整mic輸入的放大增益參數(shù)以及調(diào)整C信號(hào)的放大增益參數(shù),確保信號(hào)幅度的完整性。測(cè)試的成功率在安靜環(huán)境測(cè)試,由原來(lái)的%提升到82%比還有明顯差距。專(zhuān)業(yè)音 測(cè)試,驗(yàn)證Mic頻響和結(jié)構(gòu)密封性AudioAudioUSBUSBdriver中多核多線程并 USBUSBUSB修改USB驅(qū)動(dòng)bug,推動(dòng)解決了MTK底層USBDriver的bug你好小 明天天氣 ,9月份第一版數(shù)據(jù)為誤喚醒為10小時(shí)8次,喚醒率為60%; ,在用戶群體差異化情況下,不同習(xí)慣容易造成身語(yǔ)音內(nèi)容丟失,進(jìn)而語(yǔ)義分 確,導(dǎo)致內(nèi)容異常。9月份第一版語(yǔ)義的成功率為間斷說(shuō) 會(huì)話開(kāi) 數(shù)據(jù)傳

明天天氣怎么 天氣|明

天氣怎么 天氣|今會(huì)話開(kāi)

明天天氣怎么 天氣|明喚 [ State

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論