版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
語音識別技術(shù)的發(fā)展與未來語音識別技術(shù)的發(fā)展與未來語音識別技術(shù)的發(fā)展與未來xxx公司語音識別技術(shù)的發(fā)展與未來文件編號:文件日期:修訂次數(shù):第1.0次更改批準審核制定方案設(shè)計,管理制度語音識別技術(shù)的發(fā)展與未來與機器進行語音交流,讓它聽明白你在說什么。語音識別技術(shù)將人類這一曾經(jīng)的夢想變成了現(xiàn)實。語音識別就好比“機器的聽覺系統(tǒng)”,該技術(shù)讓機器通過識別和理解,把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令。在1952年的貝爾研究所,Davis等人研制了世界上第一個能識別10個英文數(shù)字發(fā)音的實驗系統(tǒng)。1960年英國的Denes等人研制了第一個計算機語音識別系統(tǒng)。大規(guī)模的語音識別研究始于上世紀70年代以后,并在小詞匯量、孤立詞的識別方面取得了實質(zhì)性的進展。上世紀80年代以后,語音識別研究的重點逐漸轉(zhuǎn)向大詞匯量、非特定人連續(xù)語音識別。同時,語音識別在研究思路上也發(fā)生了重大變化,由傳統(tǒng)的基于標準模板匹配的技術(shù)思路開始轉(zhuǎn)向基于統(tǒng)計模型的技術(shù)思路。此外,業(yè)內(nèi)有專家再次提出了將神經(jīng)網(wǎng)絡(luò)技術(shù)引入語音識別問題的技術(shù)思路。上世紀90年代以后,在語音識別的系統(tǒng)框架方面并沒有什么重大突破。但是,在語音識別技術(shù)的應(yīng)用及產(chǎn)品化方面出現(xiàn)了很大的進展。比如,DARPA是在上世界70年代由美國國防部遠景研究計劃局資助的一項計劃,旨在支持語言理解系統(tǒng)的研究開發(fā)工作。進入上世紀90年代,DARPA計劃仍在持續(xù)進行中,其研究重點已轉(zhuǎn)向識別裝置中的自然語言處理部分,識別任務(wù)設(shè)定為“航空旅行信息檢索”。我國的語音識別研究起始于1958年,由中國科學(xué)院聲學(xué)所利用電子管電路識別10個元音。由于當(dāng)時條件的限制,中國的語音識別研究工作一直處于緩慢發(fā)展的階段。直至1973年,中國科學(xué)院聲學(xué)所開始了計算機語音識別。進入上世紀80年代以來,隨著計算機應(yīng)用技術(shù)在我國逐漸普及和應(yīng)用以及數(shù)字信號技術(shù)的進一步發(fā)展,國內(nèi)許多單位具備了研究語音技術(shù)的基本條件。與此同時,國際上語音識別技術(shù)在經(jīng)過了多年的沉寂之后重又成為研究的熱點。在這種形式下,國內(nèi)許多單位紛紛投入到這項研究工作中去。1986年,語音識別作為智能計算機系統(tǒng)研究的一個重要組成部分而被專門列為研究課題。在“863”計劃的支持下,中國開始組織語音識別技術(shù)的研究,并決定了每隔兩年召開一次語音識別的專題會議。自此,我國語音識別技術(shù)進入了一個新的發(fā)展階段。自2009年以來,借助機器學(xué)習(xí)領(lǐng)域深度學(xué)習(xí)研究的發(fā)展以及大數(shù)據(jù)語料的積累,語音識別技術(shù)得到突飛猛進的發(fā)展。將機器學(xué)習(xí)領(lǐng)域深度學(xué)習(xí)研究引入到語音識別聲學(xué)模型訓(xùn)練,使用帶RBM預(yù)訓(xùn)練的多層神經(jīng)網(wǎng)絡(luò),提高了聲學(xué)模型的準確率。在此方面,微軟公司的研究人員率先取得了突破性進展,他們使用深層神經(jīng)網(wǎng)絡(luò)模型(DNN)后,語音識別錯誤率降低了30%,是近20年來語音識別技術(shù)方面最快的進步。2009年前后,大多主流的語音識別解碼器已經(jīng)采用基于有限狀態(tài)機(WFST)的解碼網(wǎng)絡(luò),該解碼網(wǎng)絡(luò)可以把語言模型、詞典和聲學(xué)共享音字集統(tǒng)一集成為一個大的解碼網(wǎng)絡(luò),提高了解碼的速度,為語音識別的實時應(yīng)用提供了基礎(chǔ)。隨著互聯(lián)網(wǎng)的快速發(fā)展,以及手機等移動終端的普及應(yīng)用,可以從多個渠道獲取大量文本或語音方面的語料,這為語音識別中的語言模型和聲學(xué)模型的訓(xùn)練提供了豐富的資源,使得構(gòu)建通用大規(guī)模語言模型和聲學(xué)模型成為可能。在語音識別中,訓(xùn)練數(shù)據(jù)的匹配和豐富性是推動系統(tǒng)性能提升的最重要因素之一,但是語料的標注和分析需要長期的積累和沉淀,隨著大數(shù)據(jù)時代的來臨,大規(guī)模語料資源的積累將提到戰(zhàn)略高度?,F(xiàn)如今,語音識別在移動終端上的應(yīng)用最為火熱,語音對話機器人、語音助手、互動工具等層出不窮,許多互聯(lián)網(wǎng)公司紛紛投入人力、物力和財力展開此方面的研究和應(yīng)用,目的是通過語音交互的新穎和便利模式迅速占領(lǐng)客戶群。(雨田整理)相關(guān)產(chǎn)品siriSiri技術(shù)來源于美國國防部高級研究規(guī)劃局所公布的CALO計劃:一個讓軍方簡化處理一些繁復(fù)庶務(wù),并具學(xué)習(xí)、組織以及認知能力的數(shù)字助理,其所衍生出來的民用版軟件Siri虛擬個人助理。Siri成立于2007年,最初是以文字聊天服務(wù)為主,隨后通過與語音識別廠商Nuance合作,Siri實現(xiàn)了語音識別功能。2010年,Siri被蘋果以2億美金收購。Siri成為蘋果公司在其產(chǎn)品iPhone和iPadAir上應(yīng)用的一項語音控制功能。Siri可以令iPhone和iPadAir變身為一臺智能化機器人。Siri支持自然語言輸入,并且可以調(diào)用系統(tǒng)自帶的天氣預(yù)報、日程安排、搜索資料等應(yīng)用,還能夠不斷學(xué)習(xí)新的聲音和語調(diào),提供對話式的應(yīng)答。GoogleNowGoogleNow是谷歌隨安卓系統(tǒng)同時推出的一款應(yīng)用,它可以了解用戶的各種習(xí)慣和正在進行的動作,并利用所了解的資料來為用戶提供相關(guān)信息。今年3月24日,谷歌宣布GoogleNow語音服務(wù)正式登陸Windows和Mac桌面版Chrome瀏覽器。GoogleNow的應(yīng)用會更加方便用戶收取電子郵件,當(dāng)你接收到新郵件時,它就會自動彈出以便你查看。GoogleNow還推出了步行和行車里程記錄功能,這個計步器功能可通過Android設(shè)備的傳感器來統(tǒng)計用戶每月行駛的里程,包括步行和騎自行車的路程。此外,GoogleNow增加了一些旅游和娛樂特色功能,包括:汽車租賃、演唱會門票和通勤共享方面的卡片;公共交通和電視節(jié)目的卡片進行改善,這些卡片現(xiàn)在可以聽音識別音樂和節(jié)目信息;用戶可以為新媒體節(jié)目的開播設(shè)定搜索提醒,同時還可以接收實時NCAA(美國大學(xué)體育協(xié)會)橄欖球比分。百度語音百度語音一般指百度語音搜索,是百度公司為廣大互聯(lián)網(wǎng)用戶提供的一種基于語音的搜索服務(wù),用戶可以使用多種客戶端發(fā)起語音搜索,服務(wù)器端根據(jù)用戶的發(fā)出的語音請求,進行語音識別然后將檢索結(jié)果反饋給用戶。百度語音搜索不僅提供一般的通用語音搜索服務(wù),還有針對地圖用戶制定的特色搜索服務(wù),后續(xù)還會有更多的個性化搜索和識別服務(wù)出現(xiàn)。目前百度語音搜索以移動客戶端為主要平臺,內(nèi)嵌于百度的其他產(chǎn)品中,比如掌上百度,百度手機地圖等,用戶可以在使用這些客戶端產(chǎn)品的同時體驗語音搜索,支持全部主流的手機操作系統(tǒng)。微軟CortanaCortana是WindowsPhone平臺下的虛擬語音助手,由游戲《光暈》中Cortana的聲優(yōu)JenTaylor配音,Cortana中文版又名“微軟小娜”。微軟對Cortana的描述為“你手機上的私人助手,為你提供設(shè)置日歷項、建議、進程等更多幫助”,它能夠和你之間進行交互,并且盡可能的模擬
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度碎石場環(huán)保設(shè)備購置合同2篇
- 2024年中國球磨機配件市場調(diào)查研究報告
- 2025年度展臺搭建與展覽策劃一體化服務(wù)合同3篇
- 公益崗位用工協(xié)議(2025年度)執(zhí)行責(zé)任書3篇
- 二零二五年度農(nóng)副產(chǎn)品品牌推廣與廣告投放合同3篇
- 2024年沁陽市人民醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 2025年度消防控制系統(tǒng)設(shè)計與安裝合同2篇
- 2024年噴涂塑鋼鋼襯項目可行性研究報告
- 《基于單目視覺移動機器人的避障研究》
- 2024年單相感應(yīng)馬達項目可行性研究報告
- AI在藥物研發(fā)中的應(yīng)用
- 建立信息共享和預(yù)警機制
- 美容外外科管理制度
- 苯-甲苯分離精餾塔化工原理課程設(shè)計
- 國企人力資源崗位筆試題目多篇
- 病毒 課件 初中生物人教版八年級上冊(2023~2024學(xué)年)
- JGT129-2017 建筑門窗五金件 滑輪
- 三年級科學(xué)上冊水和空氣復(fù)習(xí)課教案
- 全國普通高校本科專業(yè)目錄(2023版)
- 助產(chǎn)學(xué)導(dǎo)論學(xué)習(xí)通章節(jié)答案期末考試題庫2023年
- 寧波大學(xué)“一頁開卷”考試專用紙
評論
0/150
提交評論