語(yǔ)音識(shí)別技術(shù)文獻(xiàn)綜述_第1頁(yè)
語(yǔ)音識(shí)別技術(shù)文獻(xiàn)綜述_第2頁(yè)
語(yǔ)音識(shí)別技術(shù)文獻(xiàn)綜述_第3頁(yè)
語(yǔ)音識(shí)別技術(shù)文獻(xiàn)綜述_第4頁(yè)
語(yǔ)音識(shí)別技術(shù)文獻(xiàn)綜述_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、語(yǔ)音識(shí)別技術(shù)綜述語(yǔ)音識(shí)別技術(shù)綜述The summarization of speech recognition張永雙蘇州大學(xué)蘇州江蘇摘要本文回顧 了語(yǔ)音 識(shí)別技 術(shù)的發(fā) 展歷史 ,綜述 了語(yǔ)音 識(shí)別系 統(tǒng)的結(jié) 構(gòu)、分類及基本方法,分析了語(yǔ)音識(shí)別技術(shù)面臨的問(wèn)題及發(fā)展方向。關(guān)鍵詞:語(yǔ)音識(shí)別;特征;匹配AbstactThisarticlereviewthecoursesofspeechrecognitiontechnologyprogress,summarizethe structure,classificationsand basicmethods ofspeechrecognitionsyste

2、mandanalyzethedirectionandtheissueswhich speech recognition technology development may confront with.Key words:speech recognition;character;matching引言語(yǔ)音識(shí)別 技術(shù)就 是讓機(jī) 器通過(guò) 識(shí)別和 理解過(guò) 程把語(yǔ) 音信號(hào) 轉(zhuǎn)變?yōu)?相應(yīng)的文本或 命令的 高技術(shù) 。語(yǔ)音識(shí) 別是一 門(mén)交叉 學(xué)科, 所涉及 的領(lǐng)域 有信號(hào)處理、模式識(shí)別、概率論和 信息論、發(fā)聲機(jī)理和聽(tīng)覺(jué)機(jī)理、人工智能等等,甚至還涉 及到人 的體態(tài) 語(yǔ)言(如 人民在 說(shuō)話時(shí) 的表情 手勢(shì)等 行為

3、動(dòng) 作可幫助對(duì)方理 解)。 其應(yīng)用 領(lǐng)域也非 常廣, 例如相 對(duì)于鍵 盤(pán)輸入 方法的 語(yǔ)音輸入系統(tǒng)、可 用于工業(yè)控制的語(yǔ)音控制系統(tǒng)及 服務(wù)領(lǐng)域的智能對(duì)話查詢系統(tǒng) ,在信息高 度化的 今天, 語(yǔ)音識(shí)別 技術(shù)及 其應(yīng)用 已成為 信息社 會(huì)不可 或缺的重要組成部分 。1.語(yǔ)音識(shí)別技術(shù)的發(fā)展歷史語(yǔ)音識(shí)別技術(shù)的研究開(kāi)始二十世紀(jì)50 年代。 1952 年, AT&Tbell實(shí)驗(yàn)室的Davis等人成功研制出了世界上第一個(gè)能識(shí)別十個(gè)英文數(shù)字發(fā)音的實(shí)驗(yàn)系統(tǒng): Audry 系統(tǒng)。第1頁(yè)共7頁(yè)語(yǔ)音識(shí)別技術(shù)綜述60 年代計(jì)算機(jī)的應(yīng)用推動(dòng)了語(yǔ)音識(shí)別技術(shù)的發(fā)展,提出兩大重要研究成果:動(dòng)態(tài)規(guī)劃(Dynamic Planni

4、ng, DP) 和線性預(yù)測(cè)分析(Linear Predict,LP) ,其中后者較好的解決了語(yǔ)音信號(hào)產(chǎn)生模型的問(wèn)題,對(duì)語(yǔ)音識(shí)別技術(shù)的發(fā)展產(chǎn)生了深遠(yuǎn)影響。70 年代, 語(yǔ)音識(shí) 別領(lǐng) 域取 得突 破性 進(jìn)展 。 線性 預(yù)測(cè) 編碼 技術(shù) (LinearPredict Coding , LPC) 被 Itakura 成功應(yīng)用于 語(yǔ)音識(shí)別; Sakoe 和 Chiba 將動(dòng)態(tài)規(guī) 劃的思 想應(yīng)用 到語(yǔ)音識(shí) 別并提 出動(dòng)態(tài) 時(shí)間規(guī) 整算法 ,有效 的解決了語(yǔ)音信號(hào)的 特征提取和不等長(zhǎng)語(yǔ)音匹配問(wèn)題 ;同時(shí)提出了矢量量化 ( VQ )和隱馬 爾可夫模型( HMM )理 論。在同一時(shí)期 ,統(tǒng)計(jì)方法開(kāi)始 被用來(lái)解決

5、語(yǔ)音識(shí)別 的關(guān)鍵 問(wèn)題, 這為接下 來(lái)的非 特定人 大詞匯 量連續(xù) 語(yǔ)音識(shí) 別技術(shù)走向成熟奠定 了重要的基礎(chǔ)。80 年代,連續(xù)語(yǔ)音識(shí)別 成為語(yǔ)音識(shí)別 的 研究重點(diǎn) 之一 。 Meyers 和Rabiner 研究出多級(jí) 動(dòng)態(tài)規(guī)劃語(yǔ)音識(shí)別算法 (Level Building,LB) 這一連續(xù)語(yǔ)音識(shí)別算法。 80 年代另一 個(gè)重要的發(fā)展是概率統(tǒng)計(jì)方法成為語(yǔ)音識(shí)別研究方法的主流,其顯著特征是HMM 模型 在語(yǔ)音識(shí)別中的成功應(yīng)用。1988 年,美國(guó)卡內(nèi)基 梅隆大學(xué) (CMU) 用 VQ/HMM 方法實(shí)現(xiàn)了 997詞的非特定人連續(xù)語(yǔ)音識(shí)別系 統(tǒng) SPHINX 。在這一時(shí)期, 人工神經(jīng)網(wǎng)絡(luò)在語(yǔ)音識(shí)別中也得到

6、成功應(yīng)用。進(jìn)入 90 年代后,隨著多媒體時(shí)代的來(lái)臨,迫切要求語(yǔ)音識(shí)別系統(tǒng)從實(shí)驗(yàn)走向?qū)嵱茫S多發(fā)達(dá)國(guó)家如美國(guó)、日本、韓國(guó)以及IBM 、 Apple 、 AT&T 、NTT 等著 名公司都為語(yǔ)音識(shí)別系統(tǒng)實(shí)用化的開(kāi)發(fā)研究投以巨資。最具代表性的是 IBM 的 ViaVoice 和 Dragon公司的 DragonDectate 系統(tǒng)。這些系統(tǒng)具有說(shuō) 話人自 適應(yīng)能 力,新用 戶不需 要對(duì)全 部詞匯 進(jìn)行訓(xùn) 練便可 在使用中不斷提高識(shí) 別率。當(dāng)前,美 國(guó)在非 特定人 大詞匯 表連續(xù) 語(yǔ)音隱 馬爾可 夫模型 識(shí)別方 面起主導(dǎo)作用 ,而日 本則在 大詞匯表 連續(xù)語(yǔ) 音神經(jīng) 網(wǎng)絡(luò)識(shí) 別、模 擬人工 智能進(jìn)行語(yǔ)

7、音后處理 方面處于主導(dǎo)地位。國(guó)在七十 年代末 就開(kāi)始 了語(yǔ)音 技術(shù)的 研究, 但在很 長(zhǎng)一段 時(shí)間內(nèi) ,都處于緩慢 發(fā)展的 階段。 直到八十 年代后 期,國(guó) 內(nèi)許多 單位紛 紛投入 到這項(xiàng)研究工作 中去, 其中有 中科院聲 學(xué)所, 自動(dòng)化 所,清 華大學(xué) ,四川 大學(xué)和西北工業(yè) 大學(xué)等 科研機(jī) 構(gòu)和高等 院校, 大多數(shù) 研究者 致力于 語(yǔ)音識(shí) 別的基礎(chǔ)理論研 究工作 、模型 及算法的 研究和 改進(jìn)。 但由于 起步晚 、基礎(chǔ) 薄弱,計(jì)算機(jī)水 平不發(fā) 達(dá),導(dǎo) 致在整個(gè) 八十年 代,我 國(guó)在語(yǔ) 音識(shí)別 研究方 面并沒(méi)有形成自 己的特 色,更 沒(méi)有取得 顯著的 成果和 開(kāi)發(fā)出 大型性 能優(yōu)良 的實(shí)驗(yàn)系

8、統(tǒng)。但 進(jìn)入九 十年代 后,我國(guó) 語(yǔ)音識(shí) 別研究 的步伐 就逐漸 緊追國(guó) 際先進(jìn)水平了, 在“八 五”、 “九五” 國(guó)家科 技攻關(guān) 計(jì)劃、 國(guó)家自 然科學(xué) 基金、國(guó)家 863 計(jì)劃的支持下, 我國(guó)在中文語(yǔ)音技術(shù)的基礎(chǔ)研究 方面也取得了一系列成果 。在語(yǔ) 音合成 技術(shù)方面 ,中國(guó) 科大訊 飛公司 已具有 國(guó)際上 最領(lǐng)先的核心技 術(shù);中 科院聲 學(xué)所也在 長(zhǎng)期積 累的基 礎(chǔ)上, 研究開(kāi) 發(fā)出頗 具特色的產(chǎn)品: 在語(yǔ)音 識(shí)別技 術(shù)方面, 中科院 自動(dòng)化 所具有 相當(dāng)?shù)?技術(shù)優(yōu) 勢(shì):社科院語(yǔ)言 所在漢 語(yǔ)言學(xué) 及實(shí)驗(yàn)語(yǔ) 言科學(xué) 方面同 樣具有 深厚的 積累。 但是,這些成果 并沒(méi)有 得到很 好的應(yīng)用

9、,沒(méi)有 轉(zhuǎn)化成 產(chǎn)業(yè); 相反, 中文語(yǔ) 音技術(shù)在技術(shù)、 人才、 市場(chǎng)等 方面正面 臨著來(lái) 自國(guó)際 競(jìng)爭(zhēng)環(huán) 境中越 來(lái)越嚴(yán) 峻的挑戰(zhàn)和壓力。第2頁(yè)共7頁(yè)語(yǔ)音識(shí)別技術(shù)綜述2.語(yǔ)音識(shí)別系統(tǒng)的結(jié)構(gòu)主要包括 語(yǔ)音信 號(hào)的采 樣和預(yù) 處理部 分、特 征參數(shù) 提取部 分、語(yǔ) 音識(shí)別核心部分以 及語(yǔ)音識(shí)別后處理部分,圖 2-1 給出了語(yǔ)音 識(shí)別系統(tǒng)的基本結(jié)構(gòu)。語(yǔ)音信號(hào)輸入語(yǔ)音識(shí)別基本識(shí)別結(jié)果預(yù)處理特征提取模式匹配訓(xùn)練參考模式庫(kù)圖 2-1 語(yǔ) 音識(shí)別系統(tǒng)的基本結(jié)構(gòu)圖語(yǔ) 音識(shí)別 的過(guò)程 是一個(gè) 模式識(shí) 別匹配 的過(guò)程 。在這 個(gè)過(guò)程 中,首 先要根 據(jù)人的 語(yǔ)音特 點(diǎn)建立 語(yǔ)音模型 ,對(duì)輸 入的語(yǔ) 音信號(hào) 進(jìn)行分

10、 析,并 抽取所需的特征 ,在此 基礎(chǔ)上 建立語(yǔ)音 識(shí)別所 需的模 式。而 在識(shí)別 過(guò)程中 要根據(jù)語(yǔ)音識(shí)別 的整體 模型, 將輸入的 語(yǔ)音信 號(hào)的特 征與已 經(jīng)存在 的語(yǔ)音 模式進(jìn)行比較, 根據(jù)一 定的搜 索和匹配 策略, 找出一 系列最 優(yōu)的與 輸入的 語(yǔ)音相匹配的模 式。然 后,根 據(jù)此模式 號(hào)的定 義,通 過(guò)查表 就可以 給出計(jì) 算機(jī)的識(shí)別結(jié)果。3.語(yǔ)音識(shí)別系統(tǒng)的分類根據(jù)識(shí)別的對(duì)象不同,語(yǔ)音識(shí)別任務(wù)大體可分為 3 類,即孤立詞識(shí)別( isolated wordrecognition) ,關(guān)鍵詞識(shí)別(或稱關(guān)鍵詞檢出, keywordspotting) 和連續(xù)語(yǔ) 音識(shí)別。其中,孤立詞識(shí)別的任

11、務(wù)是識(shí)別事先已知的孤立的詞,如 “開(kāi)機(jī) ”、 “關(guān)機(jī) ”等;連 續(xù)語(yǔ)音識(shí)別的任務(wù)則是識(shí)別任意的連續(xù)語(yǔ)音,如一個(gè)句子或一段話;連續(xù)語(yǔ)音流中的關(guān)鍵詞檢測(cè)針對(duì)的是連續(xù)語(yǔ)音,但它并不識(shí)別 全部文字,而只是檢測(cè)已知的若干關(guān)鍵詞在何處出現(xiàn),如在一段話中檢測(cè) “計(jì)算 機(jī) ”、 “世界 ”這 兩個(gè)詞。根據(jù)針對(duì)的發(fā) 音人,可以把語(yǔ)音識(shí)別技術(shù)分為特定人語(yǔ)音識(shí)別和非特定人語(yǔ)音識(shí)別 ,前者只能識(shí)別一個(gè)或幾個(gè)人的語(yǔ)音,而后者則可以被任何人使用。顯然 ,非特定人語(yǔ)音識(shí)別系統(tǒng)更符合實(shí)際需要,但它要比針對(duì)特定人的識(shí)別困 難得多。另外,根據(jù)語(yǔ) 音設(shè)備和通道,可以分為桌面(PC )語(yǔ)音識(shí)別、電話語(yǔ)音識(shí)別和嵌入 式設(shè)備(手機(jī)、 P

12、DA 等)語(yǔ)音識(shí)別。不同的采集通道會(huì)使人的發(fā)音的聲學(xué) 特性發(fā)生變形,因此需要構(gòu)造各自的識(shí)別系統(tǒng)。第3頁(yè)共7頁(yè)語(yǔ)音識(shí)別技術(shù)綜述4.語(yǔ)音識(shí)別系統(tǒng)的基本識(shí)別方法一般來(lái)說(shuō),語(yǔ)音識(shí)別的方法有三種:基于聲道模型和語(yǔ)音知識(shí)的方法、模式匹配的方法以及利用人工神經(jīng)網(wǎng)絡(luò)的方法。4.1 基于 語(yǔ)音學(xué)和聲學(xué)的方法該方法起步較早,在語(yǔ)音識(shí)別技術(shù)提出的開(kāi)始,就有了這方面的研究,但由于其模型及語(yǔ)音知識(shí)過(guò)于復(fù)雜,現(xiàn)階段還沒(méi)有達(dá)到實(shí)用的階段。4.2 模式 匹配的方法模式匹配方法 的發(fā)展比較成熟,目前已達(dá)到實(shí)用階段。在模式匹配方法中,需經(jīng)過(guò) 四個(gè)步驟:特征提取、模式訓(xùn)練、模式識(shí)別和判決。4.2.1 特征提取特征提取方法 主要采用

13、以下三種:基于 LPC 的倒譜參數(shù) (LPCC) 分析法,基于 Mel 系數(shù)的 Mel 頻標(biāo)倒譜系數(shù)(MPCC) 分析法, 基 于現(xiàn)代處理技術(shù)的小波變換系 數(shù)分析法。在這些方法中,MFCC 方法比 LPCC 方法的識(shí)別效果稍好一些 ,而且 MFCC 符合人們的聽(tīng)覺(jué)特性,在有信道噪聲和頻譜失真的情況下具 有較好的穩(wěn)健性, 其不足之處是MFCC 方法中多次用 到 FFT ,故算法的復(fù)雜 程度遠(yuǎn)大于 LPCC 方法。因 此,在安靜的環(huán)境下,目前比較成熟和最常用 的語(yǔ)音特征提取方法還 是 LPCC 方法。在條件不好的環(huán)境下,則宜選 用 MFCC 方法。 而小波變換法則是一種新興的理論工具,要獲得較高的

14、識(shí)別率還 有許多問(wèn)題有待研究,但與經(jīng)典的方法相比,小波變換法有著計(jì)算量小、 復(fù)雜程度低、識(shí)別效果好等許多優(yōu)點(diǎn),研究前景十分樂(lè)觀,是研究發(fā)展的 一個(gè)方向。4.2.2 模式識(shí)別模式識(shí)別常用 技術(shù)有三種:動(dòng)態(tài)時(shí)間規(guī)整(DTW )、隱馬爾可夫模型( HMM )、矢量量化( VQ )。(1) 動(dòng)態(tài)時(shí)間 規(guī)整( DTW )語(yǔ)音信號(hào)的端 點(diǎn)檢測(cè)是進(jìn)行語(yǔ)音識(shí)別中的一個(gè)基本步驟,它是特征訓(xùn)練和識(shí)別的基 礎(chǔ)。所謂端點(diǎn)檢測(cè)就是在語(yǔ)音信號(hào)中的各種段落(如音素、音節(jié)、詞素 ) 的始點(diǎn)和終點(diǎn)的位置,從語(yǔ)音信號(hào)中排除無(wú)聲段。在早期,進(jìn)行端點(diǎn)檢測(cè)的主 要依據(jù)是能量、振幅和過(guò)零率。但效果往往不明顯。上世紀(jì) 60 年代日本學(xué)者

15、Itakura 提出了動(dòng)態(tài)時(shí)間 規(guī)整算法。算法的思想就是把未知量均勻地伸 長(zhǎng)或縮短,直到與參考模式的長(zhǎng)度一致。在這一過(guò)程中,未知單詞的時(shí)間 軸要不均勻地扭曲或彎折,以使其特征與模型特征對(duì)正。在連續(xù)語(yǔ)音識(shí)別 中仍然是主流方法。同時(shí),在小詞匯量、孤立字(詞 ) 識(shí)別系統(tǒng)中,也已有 許多改進(jìn)的 DTW 算法提 出。第4頁(yè)共7頁(yè)語(yǔ)音識(shí)別技術(shù)綜述(2) 隱馬爾可 夫模型(HMM )隱馬爾可夫模 型是 20世紀(jì) 70年代引入語(yǔ)音識(shí)別理論的,它的出現(xiàn)使得自然語(yǔ)音識(shí) 別系統(tǒng)取得了實(shí)質(zhì)性的突破。目前大多數(shù)大詞匯量、連續(xù)語(yǔ)音的非特定人 語(yǔ)音識(shí)別系統(tǒng)都是基于HMM模型的。 HMM 是對(duì)語(yǔ)音信號(hào)的時(shí)間序列結(jié)構(gòu) 建立統(tǒng)

16、計(jì)模型,將之看作一個(gè)數(shù)學(xué)上的雙重隨機(jī)過(guò)程 :一個(gè)是用具有有限狀 態(tài)數(shù)的 Markov 鏈來(lái)模擬語(yǔ)音信號(hào)統(tǒng)計(jì)特性變化的隱含的隨機(jī)過(guò)程,另一 個(gè)是與 Markov 鏈的每一個(gè)狀態(tài)相關(guān)聯(lián)的觀測(cè)序列的隨機(jī)過(guò)程。前者通過(guò) 后者表現(xiàn)出來(lái),但前者的具體參數(shù)是不可測(cè)的。人的言語(yǔ)過(guò)程實(shí)際上就是 一個(gè)雙重隨機(jī)過(guò)程,語(yǔ)音信號(hào)本身是一個(gè)可觀測(cè)的時(shí)變序列,是由大腦根據(jù) 語(yǔ)法知識(shí)和言語(yǔ)需要(不可觀測(cè)的狀 態(tài) ) 發(fā)出的音素的參數(shù)流??梢?jiàn) HMM 合理地模仿了這一過(guò)程, 很好地描述了語(yǔ)音 信號(hào)的整體非平穩(wěn)性和局部平 穩(wěn)性,是較為理想的一種語(yǔ)音模型。(3) 矢量量化 ( VQ )矢量量化是一 種重要的信號(hào)壓縮方法。與 HMM

17、 相比,矢量量化主要適用于小詞匯 量、孤立詞的語(yǔ)音識(shí)別中。其過(guò)程是:將語(yǔ)音信號(hào)波形的 k個(gè)樣點(diǎn)的每一幀 ,或有 k 個(gè)參數(shù)的每一參數(shù)幀,構(gòu)成 k 維空間中的一個(gè)矢量,然后對(duì)矢量進(jìn) 行量化。量化時(shí),將k 維無(wú)限空間 劃分為 M 個(gè)區(qū)域邊界,然后將輸入矢量 與這些邊界進(jìn)行比較,并被量化為“距離”最小的區(qū)域邊界的中心矢量值 。矢量量化器的設(shè)計(jì)就是從大量信號(hào)樣本中訓(xùn)練出好的碼書(shū),從實(shí)際效果出 發(fā)尋找到好的失真測(cè)度定義公式,設(shè)計(jì)出最佳的矢量量化系統(tǒng),用最少的 搜索和計(jì)算失真的運(yùn)算量,實(shí)現(xiàn)最大可能的平均信噪比。4.3 人工 神經(jīng)網(wǎng)絡(luò)的方法利用人工神經(jīng)網(wǎng)絡(luò)的方法是80 年代末期提出的一種新的語(yǔ)音識(shí)別方法。人

18、工神經(jīng)網(wǎng)絡(luò) (ANN) 本質(zhì)上是一個(gè)自適應(yīng)非線性動(dòng)力學(xué)系統(tǒng),模擬了人類神經(jīng)活動(dòng)的原理,具有自適應(yīng)性、并行性、魯棒性、容錯(cuò)性和學(xué)習(xí)特性,其強(qiáng)的 分類能力和輸入- 輸出映射能力在語(yǔ)音識(shí)別中都很有吸引力。但由于存在訓(xùn)練、識(shí)別時(shí)間太長(zhǎng)的缺點(diǎn),目前仍處于實(shí)驗(yàn)探索階段。由于ANN 不能很好的描述語(yǔ)音信號(hào)的時(shí) 間動(dòng)態(tài)特性, 所以常 把 ANN 與傳統(tǒng)識(shí)別方法結(jié)合 , 分別利用各自優(yōu)點(diǎn)來(lái)進(jìn)行語(yǔ) 音識(shí)別。5.語(yǔ)音識(shí)別所面臨的問(wèn)題(1) 就算法 模型方面而言, 需要有 進(jìn)一步的突破。 目前使用 的語(yǔ)言模型只是一種概率 模型,還沒(méi)有用到以語(yǔ)言學(xué)為基礎(chǔ)的文法模型,而要使計(jì)算機(jī)確實(shí)理解人 類的語(yǔ)言,就必須在這一點(diǎn)上取得

19、進(jìn)展。(2) 就自適 應(yīng)方面而言, 語(yǔ)音識(shí)別 技術(shù)也有待進(jìn)一步改進(jìn),做到不受特定人、口音或者方言的影響,這實(shí)際上也意味著對(duì)語(yǔ)言模型的進(jìn)一步改進(jìn)。第5頁(yè)共7頁(yè)語(yǔ)音識(shí)別技術(shù)綜述(3) 就強(qiáng)健 性方面而言,語(yǔ)音識(shí)別技術(shù)需要能排除各種環(huán)境因素的影響。目前,對(duì) 語(yǔ)音識(shí)別效果影響最大的就是環(huán)境雜音或嗓音,個(gè)人能有意識(shí)地摒棄環(huán)境 嗓音并從中獲取自己所需要的特 定聲音,如何讓語(yǔ)音識(shí)別技術(shù)也能達(dá)成這 一點(diǎn)是一個(gè)艱巨的任務(wù)。(4) 多語(yǔ)言 混合識(shí)別以及無(wú)限詞匯識(shí)別方面 :將來(lái)的語(yǔ)音和聲學(xué)模型可能會(huì)做到將多 種語(yǔ)言混合納入,用戶因此就可以不必在語(yǔ)種之間來(lái)回切換。此外,對(duì)于聲 學(xué)模型的進(jìn)一步改進(jìn),以及以語(yǔ)義學(xué)為基礎(chǔ)的語(yǔ)言模型的改進(jìn),也能幫助用戶盡可能少或不受詞匯的影響,從而可實(shí)行無(wú)限詞匯識(shí)別。(5) 多語(yǔ)種 交流系統(tǒng)的應(yīng)用 :是將語(yǔ)音識(shí)別技 術(shù)、機(jī)器翻譯技術(shù)以及語(yǔ)音合成技術(shù)的 完美結(jié)合,全世界說(shuō)不同語(yǔ)言 的人都可以實(shí)時(shí)地自由地交流,不存在語(yǔ)言障 礙??梢韵胍?jiàn),多語(yǔ)種自由交流 系統(tǒng)將帶給我們?nèi)碌纳羁臻g。(6) 語(yǔ)音情 感識(shí)別 :近年來(lái)隨著人工智能的發(fā) 展,情感智能跟計(jì)算機(jī)技術(shù)結(jié)合產(chǎn)生了 情感計(jì)算這一研究課題,這將 大大的促進(jìn)計(jì)算機(jī)技術(shù)的發(fā)展 。情感自動(dòng)識(shí)別 是通向情感計(jì)算的第一步。語(yǔ) 音作為人類最重要的交流媒介 ,攜帶著豐富的 情感信息。如何從語(yǔ)音中自動(dòng)識(shí) 別說(shuō)話者的情感狀態(tài)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論