


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第7章語音識別:讓機(jī)器言聽計從課后習(xí)題答案一、考考你 1.語音識別技術(shù)主要包括語音信號處理、C、聲學(xué)模型、語言模型和解碼搜索五個關(guān)鍵要素。A.采用頻率 B.分頻技術(shù)C.特征提取 D.模型訓(xùn)練2.深度神經(jīng)網(wǎng)絡(luò)與基本神經(jīng)網(wǎng)絡(luò)的區(qū)別是C。A.輸入層節(jié)點(diǎn)數(shù)不同 B.輸出層節(jié)點(diǎn)數(shù)不同C.隱含層個數(shù)不同 D.激活函數(shù)不同3.卷積神經(jīng)網(wǎng)絡(luò)的主要特點(diǎn)是具有C。A.池化層 B.全連接層C.卷積操作 D.多層隱含層4.卷積神經(jīng)網(wǎng)絡(luò)的池化層的本質(zhì)是D。A.提取特征數(shù)據(jù) B.提高模型泛化能力C.過濾到不必要數(shù)據(jù) D.對數(shù)據(jù)進(jìn)行一個縮小5.關(guān)于EasyDL錯誤的說法是C。A.可定制高精度AI模型 B.自定制模型可迭代訓(xùn)練C.只用于語音識別模型的定制 D.幾乎零基礎(chǔ)就可以上手使用 二、亮一亮 1.請簡述語音識別的過程。語音識別過程的步驟如下。(1)把一段語音進(jìn)行采集轉(zhuǎn)換成數(shù)字信號,然后進(jìn)行預(yù)加重、分幀和濾波處理,分成若干小段;(2)按FBank特征或MFCC特征進(jìn)行特征提取工作,為聲學(xué)模型提供合適的特征向量;(3)利用聲學(xué)模型計算每一個特征向量在聲學(xué)特征上的得分;(4)利用語言模型計算該聲音對應(yīng)的可能詞組序列的概率;(5)根據(jù)已有的詞典,對詞組序列進(jìn)行解碼,得到最有可能的文本表示。 2.什么是深度神經(jīng)網(wǎng)絡(luò)?什么是卷積神經(jīng)網(wǎng)絡(luò)?兩種有何異同?深度神經(jīng)網(wǎng)絡(luò):神經(jīng)網(wǎng)絡(luò)模型包括多個神經(jīng)網(wǎng)絡(luò)層,如卷積層、全連接層、LSTM(longshorttermmemory)等,每一層又包括很多神經(jīng)元,通常超過三層的非線性神經(jīng)網(wǎng)絡(luò)都可以被稱為深度神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò):深度神經(jīng)網(wǎng)絡(luò)中,如果輸入層向量有n個,假設(shè)隱藏層數(shù)目與輸入層一樣,那么輸入層到隱藏層的權(quán)重參數(shù)有n*n個,還不考慮后面其它隱藏層的參數(shù),這樣參數(shù)就太多了,模型根本無法訓(xùn)練,因此就需要減少參數(shù)以加快訓(xùn)練速度,在20世紀(jì)60年代,Hubel和Wiesel在研究大腦皮層中用于局部敏感和方向選擇的神經(jīng)元是發(fā)現(xiàn)其獨(dú)特的網(wǎng)絡(luò)結(jié)構(gòu)可以有效地降低反饋神經(jīng)網(wǎng)絡(luò)的復(fù)雜性,繼而提出了卷積神經(jīng)(ConvolutionalNeuralNetwork,CNN),其結(jié)構(gòu)如下所示,即通過卷積層的卷積操作大大減少輸入層原始數(shù)據(jù)的計算量,這就是卷積神經(jīng)網(wǎng)絡(luò)的由來。 三、幫幫我 1.利用百度智能云創(chuàng)建一個語音識別應(yīng)用,來識別本地的一個短語音文件。 提示:1)使用命令pip3installbaidu-aip安裝AipSpeech模塊。2)創(chuàng)建一個AipSpeech的客戶端對象client。3)調(diào)用client的自動語音識別方法asr將本地語音文件發(fā)送到服務(wù)器,并對返回的數(shù)據(jù)進(jìn)行解析從而得到語音識別結(jié)果。請訪問相關(guān)技術(shù)指南頁面/doc/SPEECH/s/Bk4o0bmt3了解詳情,參考代碼如下:fromaipimportAipSpeech#定義常量,你在百度智能云上申請的應(yīng)用獲取appKey和appSecretAPP_ID='你的AppID'API_KEY='你的APIKey'SECRET_KEY='你的SecretKey'#初始化AipSpeech對象aipSpeech=AipSpeech(APP_ID,API_KEY,SECRET_KEY)#讀取文件defget_file_content(filePath):withopen(filePath,'rb')asfp:returnfp.read()#識別本地文件#請求說明:
#1.原始語音的錄音格式目前只支持評測8k/16k采樣率16bit位深的單聲道語音
#2.壓縮格式支持:pcm(不壓縮)、wav、amr
#3.系統(tǒng)支持語言種類:中文(zh)、粵語(ct)、英文(en)。result=aipSpeech.asr(get_file_content('audio.pcm'),'pcm',16000,{'lan':'zh',})#打印識別結(jié)果print(result)2.針對
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國鐵氧體軟磁市場競爭狀況分析及投資戰(zhàn)略研究報告
- 2025-2030年中國重晶石市場運(yùn)行狀況及前景趨勢分析報告
- 2025-2030年中國連接器制造市場發(fā)展趨勢與十三五規(guī)劃研究報告
- 2025-2030年中國超級活性炭行業(yè)市場運(yùn)行動態(tài)及前景規(guī)模分析報告
- 2025-2030年中國臍橙行業(yè)運(yùn)行狀況及發(fā)展趨勢預(yù)測報告
- 2025-2030年中國羊藿苷提取物行業(yè)發(fā)展?fàn)顩r規(guī)劃研究報告
- 2025上海市建筑安全員《A證》考試題庫及答案
- 2025-2030年中國電網(wǎng)企業(yè)信息化市場運(yùn)營現(xiàn)狀及發(fā)展規(guī)劃分析報告
- 恩施職業(yè)技術(shù)學(xué)院《行政案例研習(xí)》2023-2024學(xué)年第二學(xué)期期末試卷
- 長沙文創(chuàng)藝術(shù)職業(yè)學(xué)院《地球物理學(xué)導(dǎo)論》2023-2024學(xué)年第二學(xué)期期末試卷
- 干部選拔任用程序
- 部編人教版五年級下冊道德與法治簡答題歸納總結(jié)
- 保障性住房資格申請表
- 2023高二開學(xué)第一課《蛻變》-主題班會
- 口服降糖藥物分類詳解課件
- 二級生物安全實(shí)驗室設(shè)計建造與運(yùn)行管理指南
- 圍手術(shù)期疼痛護(hù)理課件
- 外國新聞傳播史-張昆課件
- 圓圈正義:作為自由前提的信念
- 一次性纖維環(huán)縫合器
- 中華民族的形成與發(fā)展
評論
0/150
提交評論