下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第7章語音識別:讓機器言聽計從課后習(xí)題答案一、考考你 1.語音識別技術(shù)主要包括語音信號處理、C、聲學(xué)模型、語言模型和解碼搜索五個關(guān)鍵要素。A.采用頻率 B.分頻技術(shù)C.特征提取 D.模型訓(xùn)練2.深度神經(jīng)網(wǎng)絡(luò)與基本神經(jīng)網(wǎng)絡(luò)的區(qū)別是C。A.輸入層節(jié)點數(shù)不同 B.輸出層節(jié)點數(shù)不同C.隱含層個數(shù)不同 D.激活函數(shù)不同3.卷積神經(jīng)網(wǎng)絡(luò)的主要特點是具有C。A.池化層 B.全連接層C.卷積操作 D.多層隱含層4.卷積神經(jīng)網(wǎng)絡(luò)的池化層的本質(zhì)是D。A.提取特征數(shù)據(jù) B.提高模型泛化能力C.過濾到不必要數(shù)據(jù) D.對數(shù)據(jù)進(jìn)行一個縮小5.關(guān)于EasyDL錯誤的說法是C。A.可定制高精度AI模型 B.自定制模型可迭代訓(xùn)練C.只用于語音識別模型的定制 D.幾乎零基礎(chǔ)就可以上手使用 二、亮一亮 1.請簡述語音識別的過程。語音識別過程的步驟如下。(1)把一段語音進(jìn)行采集轉(zhuǎn)換成數(shù)字信號,然后進(jìn)行預(yù)加重、分幀和濾波處理,分成若干小段;(2)按FBank特征或MFCC特征進(jìn)行特征提取工作,為聲學(xué)模型提供合適的特征向量;(3)利用聲學(xué)模型計算每一個特征向量在聲學(xué)特征上的得分;(4)利用語言模型計算該聲音對應(yīng)的可能詞組序列的概率;(5)根據(jù)已有的詞典,對詞組序列進(jìn)行解碼,得到最有可能的文本表示。 2.什么是深度神經(jīng)網(wǎng)絡(luò)?什么是卷積神經(jīng)網(wǎng)絡(luò)?兩種有何異同?深度神經(jīng)網(wǎng)絡(luò):神經(jīng)網(wǎng)絡(luò)模型包括多個神經(jīng)網(wǎng)絡(luò)層,如卷積層、全連接層、LSTM(longshorttermmemory)等,每一層又包括很多神經(jīng)元,通常超過三層的非線性神經(jīng)網(wǎng)絡(luò)都可以被稱為深度神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò):深度神經(jīng)網(wǎng)絡(luò)中,如果輸入層向量有n個,假設(shè)隱藏層數(shù)目與輸入層一樣,那么輸入層到隱藏層的權(quán)重參數(shù)有n*n個,還不考慮后面其它隱藏層的參數(shù),這樣參數(shù)就太多了,模型根本無法訓(xùn)練,因此就需要減少參數(shù)以加快訓(xùn)練速度,在20世紀(jì)60年代,Hubel和Wiesel在研究大腦皮層中用于局部敏感和方向選擇的神經(jīng)元是發(fā)現(xiàn)其獨特的網(wǎng)絡(luò)結(jié)構(gòu)可以有效地降低反饋神經(jīng)網(wǎng)絡(luò)的復(fù)雜性,繼而提出了卷積神經(jīng)(ConvolutionalNeuralNetwork,CNN),其結(jié)構(gòu)如下所示,即通過卷積層的卷積操作大大減少輸入層原始數(shù)據(jù)的計算量,這就是卷積神經(jīng)網(wǎng)絡(luò)的由來。 三、幫幫我 1.利用百度智能云創(chuàng)建一個語音識別應(yīng)用,來識別本地的一個短語音文件。 提示:1)使用命令pip3installbaidu-aip安裝AipSpeech模塊。2)創(chuàng)建一個AipSpeech的客戶端對象client。3)調(diào)用client的自動語音識別方法asr將本地語音文件發(fā)送到服務(wù)器,并對返回的數(shù)據(jù)進(jìn)行解析從而得到語音識別結(jié)果。請訪問相關(guān)技術(shù)指南頁面/doc/SPEECH/s/Bk4o0bmt3了解詳情,參考代碼如下:fromaipimportAipSpeech#定義常量,你在百度智能云上申請的應(yīng)用獲取appKey和appSecretAPP_ID='你的AppID'API_KEY='你的APIKey'SECRET_KEY='你的SecretKey'#初始化AipSpeech對象aipSpeech=AipSpeech(APP_ID,API_KEY,SECRET_KEY)#讀取文件defget_file_content(filePath):withopen(filePath,'rb')asfp:returnfp.read()#識別本地文件#請求說明:
#1.原始語音的錄音格式目前只支持評測8k/16k采樣率16bit位深的單聲道語音
#2.壓縮格式支持:pcm(不壓縮)、wav、amr
#3.系統(tǒng)支持語言種類:中文(zh)、粵語(ct)、英文(en)。result=aipSpeech.asr(get_file_content('audio.pcm'),'pcm',16000,{'lan':'zh',})#打印識別結(jié)果print(result)2.針對
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 七年級現(xiàn)代文語文閱讀訓(xùn)練集
- 高考語文文言文閱讀分類訓(xùn)練:歷史事件類
- 2025年人造板類家具項目合作計劃書
- 2024年重樓種苗采購與銷售專項協(xié)議版B版
- KTV裝飾裝修音響系統(tǒng)設(shè)備合同
- 家居建材市場寬帶施工合作協(xié)議
- 養(yǎng)殖場品牌運營合同范本
- 環(huán)衛(wèi)車輛運輸安全管理辦法
- 2024年高科技合同范例3篇
- 招投標(biāo)代理公司供應(yīng)商評估準(zhǔn)則
- 礦井軌道質(zhì)量標(biāo)準(zhǔn)及架線維護規(guī)程
- 打字測試評分標(biāo)準(zhǔn)
- VBOXTools軟件操作手冊
- 外研版(三年級起點)五年級上冊重點知識點復(fù)習(xí)
- 2023-2024學(xué)年四川省涼山州小學(xué)數(shù)學(xué)六年級上冊期末自測試卷
- 2023年報告文學(xué)研究(自考)(重點)題庫(帶答案)
- GB/T 18691.5-2021農(nóng)業(yè)灌溉設(shè)備灌溉閥第5部分:控制閥
- 安全帶管理登記臺帳
- 第26課《詩詞五首-漁家傲》課件【教材精講精研】部編版語文八年級上冊
- 湖南省高等教育自學(xué)考試 畢業(yè)生登記表
- 湖北省武漢市江漢區(qū)2021-2022七年級初一上學(xué)期期末數(shù)學(xué)試卷+答案
評論
0/150
提交評論