訊飛語音聯(lián)合實驗室簡介_第1頁
訊飛語音聯(lián)合實驗室簡介_第2頁
訊飛語音聯(lián)合實驗室簡介_第3頁
訊飛語音聯(lián)合實驗室簡介_第4頁
訊飛語音聯(lián)合實驗室簡介_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、語音及語言信息處理國家工程實驗室科大訊飛語音聯(lián)合實驗室概況語音及語言信息處理國家工程實驗室二一三年五月八日個人介紹薛少飛 2006年考入中國科學技術(shù)大學,2010年獲“電子信息工程”專業(yè)學士學位,保送研究生。目前為“信號與信息處理”專業(yè)在讀博士,研究方向為語音識別。我們是國家工程實驗室語音評測研究室語音識別研究室語音合成研究室提綱研究方向與成果前景與風采展示工作與生活研究方向與成果研究方向一、語音合成二、語音識別三、說話人識別四、語種識別 五、語音評測語音合成綜述基本概念從文字到語音的轉(zhuǎn)換(Text to Speech)應用領(lǐng)域廣泛電話查詢文檔閱讀語音播報研究內(nèi)容語音合成核心技術(shù)基于HMM的單

2、元挑選拼接合成基于HMM的參數(shù)語音合成個性化與表現(xiàn)力個性化語音合成TTS ConversionVoice Conversion高表現(xiàn)力語音合成歌唱合成多風格語音合成研究內(nèi)容部分開創(chuàng)性研究成果首次使用RBM進行聲學建?;贛GE的語音合成技術(shù)基于HMM的單元挑選合成方法融合發(fā)音器官參數(shù)的語音合成技術(shù)基于主觀評價的合成語音檢錯近期成果與獲獎2012年國際英文語音合成大賽再次榮獲第一名評測時間:20062012評測對象:英文語音合成技術(shù)評測單位:“Blizzard Challenge”國際英文語音合成大賽 參賽單位:IBM、微軟、MIT、CMU、英國愛丁堡大學、日本ATR等Blizzard Chal

3、lenge 測試結(jié)果(自然度指標)迄今唯一自然度大于4分的參測系統(tǒng)自然語音本項目單位參測系統(tǒng)編號匿名MOS20062012年Blizzard Challenge大賽七連冠合成語音樣例(2013年)近期成果與獲獎研究成果獲2010年度 IEEE信號處理學會最佳青年作者論文獎(IEEE Signal Processing Society Young Author Best Paper Award) 近期成果與演示:大語料庫拼接合成技術(shù)2009年中文合成系統(tǒng)英文合成系統(tǒng)年份1995年1998年1999年2001年2003年自然度3.03.03.53.84.3STOPSTOP近期成果與演示:可訓練參數(shù)

4、語音合成可訓練參數(shù)語音合成基于HMM對語音進行建模,并通過訓練得到合成所需的參數(shù)預測模型基本不需要人工干預的情況下自動、快速地進行系統(tǒng)構(gòu)建合成語音具有很高的自然度音質(zhì)相比拼接合成尚有一定差距中文合成系統(tǒng)英文合成系統(tǒng)STOP廣東話四川話13各種方言合成系統(tǒng):近期成果與演示:方言和少數(shù)民族語音合成技術(shù)藏語合成系統(tǒng):文本:分詞:發(fā)音文本:科大訊飛是中國最大的智能語音技術(shù)提供商,在語音合成、語音識別等多項技術(shù)上處于國際領(lǐng)先水平IFLYTEK is the largest provider of speech and language technology in China, holding the w

5、orldwide leading technologies in speech synthesis, speech recognition, etc.私達會社中國 大音聲合成技術(shù)、音聲合成、音聲認識 技術(shù)上國際的水準 , . 歐洲語種 意大利語 德語 法語近期成果與演示:多語種語音合成近期成果與演示:表現(xiàn)力與個性化語音合成系統(tǒng)的話者轉(zhuǎn)換利用少量目標發(fā)音人數(shù)據(jù)構(gòu)建合成系統(tǒng)源合成系統(tǒng)(1000句)目標合成系統(tǒng)(1000句)話者轉(zhuǎn)換系統(tǒng)(5句)對特定發(fā)音人的模仿STOP具有情感的語音合成歌唱合成近期成果與演示:表現(xiàn)力與個性化語音識別綜述基本概念讓機器聽出人說的話語應用領(lǐng)域人工智能個人助理工業(yè)控制研究

6、內(nèi)容語音識別核心技術(shù)基于深層神經(jīng)網(wǎng)絡(luò)的語言模型大數(shù)據(jù)下語音識別技術(shù)技術(shù)分支資源受限的語音識別噪音魯棒性語音識別與前段增強基于語音屬性的識別研究多語種語音識別語音識別演示:訊飛語點2012年3月22日,以“語音點亮生活”為主題的科大訊飛新一代“語音云”發(fā)布暨語音開發(fā)者大會在北京國家會議中心隆重舉行Free download: MSP(訊飛語音平臺)前景與風采展示國際交流與英國愛丁堡大學、名古屋工業(yè)大學、日本東京大學等開展合作微軟研究院(美國&亞洲),佐治亞理工學院李錦輝教授,約克大學江輝教授定期到訪,共同培養(yǎng)博士生,新加坡Institute for m Research工作前景StatisticalModelingBasicsforInformationProcessing信息處理統(tǒng)計建模基礎(chǔ)上課時間為7月1日至8月9日之間江輝YorkUniversity語音及語言信息處理國家工程實驗室投入使用杰出人才劉慶峰1990年考入中國科學技術(shù)大學,1998年獲“通信與電子系統(tǒng)”專業(yè)碩士學位,2003年7月獲“信號與信息處理”專業(yè)博士學位。中國科學技術(shù)大學兼職教授、博士生導師,中華全國青年聯(lián)合會委員、中國科協(xié)七屆委員和十屆、十一屆全國人大代表。1999年創(chuàng)辦安徽科大訊飛信息科技股份有限公司,并擔任總裁至今。杰出人才凌震華中國科學技術(shù)大學信號與信息處理專業(yè)博士,現(xiàn)任中國

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論