智能語音技術(shù)及應(yīng)用開發(fā) 課件 單元一任務(wù)2:了解數(shù)字語音_第1頁
智能語音技術(shù)及應(yīng)用開發(fā) 課件 單元一任務(wù)2:了解數(shù)字語音_第2頁
智能語音技術(shù)及應(yīng)用開發(fā) 課件 單元一任務(wù)2:了解數(shù)字語音_第3頁
智能語音技術(shù)及應(yīng)用開發(fā) 課件 單元一任務(wù)2:了解數(shù)字語音_第4頁
智能語音技術(shù)及應(yīng)用開發(fā) 課件 單元一任務(wù)2:了解數(shù)字語音_第5頁
已閱讀5頁,還剩19頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

初步了解語音2023年2月單元一了解數(shù)字語音單元一:任務(wù)2語音是一種非常有用的信息載體,人們一直在尋找可靠的記錄處理語音信號的方法。音樂盒是通過上發(fā)條的滾輪上不同位置的突起來帶動簧片發(fā)出事先設(shè)計(jì)好的樂音,這是通過機(jī)械的方法實(shí)現(xiàn)了語音信號的

記錄(有計(jì)劃地在滾輪上設(shè)置突起)、回放(簧片發(fā)出樂音)。留聲機(jī)、磁帶等是靠磁頭處的電位變化記錄或回放語音信號的。而隨著計(jì)算機(jī)技術(shù)的發(fā)展與普及,利用計(jì)算機(jī)處理語音信號已經(jīng)被廣泛應(yīng)用。項(xiàng)目導(dǎo)入目錄CONTENTS1什么是數(shù)字聲音2語音信號數(shù)字化3數(shù)字化語音存儲與回放系統(tǒng)知識目標(biāo)理解什么是數(shù)字語音理解數(shù)字語音的采集、轉(zhuǎn)換、存儲和表達(dá)過程理解數(shù)字語音的專業(yè)術(shù)語能力目標(biāo)能夠描述每個步驟的功能能夠描述每個步驟的具體目標(biāo)能夠理解流程中涉及到的專業(yè)術(shù)語思政目標(biāo)感悟腳踏實(shí)地、勤懇敬業(yè)、精益求精的大國工匠精神學(xué)習(xí)愛崗敬業(yè)的社會主義核心價值觀PART01什么是數(shù)字聲音什么是數(shù)字聲音什么是數(shù)字聲音?什么是數(shù)字聲音數(shù)字聲音——將表示聲音強(qiáng)弱的模擬電壓,用數(shù)字表示。如電壓1V用數(shù)字40表示,2V用80表示。通常,模擬聲音的幅度被放大器限制在一定幅度內(nèi)。而在此幅度內(nèi),放大器輸出可以為無窮多個值,如1.2V,1.21V,1.213V等等。而當(dāng)數(shù)字表示聲音幅度時,把無窮多個電壓值用有限個數(shù)字來表示。即把某一范圍內(nèi)的電壓僅用一個數(shù)字表示,這稱之為量化。例如把1.2V到1.4V內(nèi)的電壓表示成數(shù)字8。計(jì)算機(jī)內(nèi)的基本數(shù)制是二進(jìn)制,我們也要把語音數(shù)據(jù)寫成計(jì)算機(jī)的數(shù)據(jù)格式,這稱之為編碼。什么是數(shù)字聲音數(shù)字語音是以二進(jìn)制編碼表示、存在計(jì)算機(jī)存儲器內(nèi)的數(shù)據(jù)。模擬數(shù)字轉(zhuǎn)換器可以把模擬聲音轉(zhuǎn)換成數(shù)字聲音。數(shù)字模擬轉(zhuǎn)換器可以恢復(fù)出模擬聲音。什么是數(shù)字聲音數(shù)字聲音是如何實(shí)現(xiàn)的?數(shù)字聲音是由CA(ComputerAudition)算法系統(tǒng)轉(zhuǎn)化出來的,一個完整的CA算法系統(tǒng)應(yīng)該包括的幾個步驟:(1)采集聲音數(shù)據(jù)(2)預(yù)處理:轉(zhuǎn)換成單聲道、重采樣、解壓縮(3)音頻分割:事件端點(diǎn)檢測(4)聲源分離:消除噪聲、信號增強(qiáng)(5)提取音頻特征:特征選擇、抽取,表征學(xué)習(xí)(6)機(jī)器學(xué)習(xí)/深度學(xué)習(xí)模型:分類或預(yù)測什么是數(shù)字聲音數(shù)字聲音有哪些應(yīng)用場景?什么是數(shù)字聲音數(shù)字聲音有哪些應(yīng)用場景?(1)醫(yī)療衛(wèi)生(2)安全保護(hù)(3)交通運(yùn)輸、倉儲(4)制造業(yè)PART02語音信號數(shù)字化語音信號數(shù)字化信息從物理特征上分為:模擬信號和數(shù)字信號模擬信號數(shù)字信號語音信號數(shù)字化語音信號數(shù)字化語音信號數(shù)字化經(jīng)過編碼的信號就是PCM信號。PCM信號是計(jì)算機(jī)語言的數(shù)字信號,可以進(jìn)行數(shù)字化傳輸和應(yīng)用,但是轉(zhuǎn)換為初始的模擬信號,還需要進(jìn)行解碼。解碼是用特定的方法將數(shù)字語音信號還原成它所代表的原始模擬語音信號(信息、數(shù)據(jù)等)的過程。解碼是編碼的反變換,在接收端將收到的PCM碼組還原為PAM信號,這個過程又稱數(shù)模變換(D/A變換)。語音信號數(shù)字化PART03數(shù)字化語音存儲與回放系統(tǒng)數(shù)字化語音存儲與回放系統(tǒng)數(shù)字化語音存儲與回放系統(tǒng),是在語音信號處理技術(shù)的快速發(fā)展基礎(chǔ)上,利用數(shù)字語音電路來實(shí)現(xiàn)語音信號的數(shù)據(jù)存儲、還原等任務(wù)。數(shù)字化語音存儲與回放系統(tǒng)的基本原理就是對語音的錄音與放音的數(shù)字化控制,為了增加語音的存儲量,采用非失真壓縮算法對語音信號進(jìn)行壓縮,壓縮以后再進(jìn)行存儲處理,當(dāng)進(jìn)行播放的時候在進(jìn)行解壓處理,同時還可以利用數(shù)字濾波來抑制雜音和干擾,以保證語音播放的質(zhì)量。數(shù)字化語音存儲與回放系統(tǒng)數(shù)字化語音存儲與回放系統(tǒng)的主要思想是將模擬語音信號通過模數(shù)轉(zhuǎn)換器A/D轉(zhuǎn)換成數(shù)字信號,再通過

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論