版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第5節(jié)體驗語音合成
與人臉識別技術(shù)2.使用訊飛留音生成個人聲庫學(xué)習(xí)任務(wù)1.掌握語音合成技術(shù)和人臉識別技術(shù)的原理3.使用百度人工智能服務(wù)平臺進(jìn)行人臉識別分析新課導(dǎo)入上節(jié)課我們了解了各種類型的人工智能技術(shù),我想考考同學(xué)們,讓人工智能實現(xiàn)“看懂”和“聽懂”的分別是什么技術(shù)?這兩種技術(shù)分別有什么應(yīng)用?一、體驗并探究語音合成技術(shù)1.體驗文本轉(zhuǎn)換為語音的技術(shù)訊飛有聲粘貼文本當(dāng)前主播正在播放的文本播放功能一、體驗并探究語音合成技術(shù)1.體驗文本轉(zhuǎn)換為語音的技術(shù)(1)更換主播后,聲音播放的具體內(nèi)容是否發(fā)生了變化?(2)更換主播操作究竟改變了什么?(3)從文字的錄入到語音播出,你認(rèn)為經(jīng)歷了哪些過程?一、體驗并探究語音合成技術(shù)2.了解語音合成技術(shù)的主要過程將文字信息轉(zhuǎn)換為流利的可聽懂的口語輸出技術(shù),稱為語音合成。這是一項綜合技術(shù),不僅需要計算機(jī)理解信息含義,保證信息正常輸出,還需要利用聲學(xué)相關(guān)知識,使內(nèi)容可以轉(zhuǎn)換成恰當(dāng)?shù)穆晫W(xué)模型進(jìn)行語音輸出。一、體驗并探究語音合成技術(shù)2.了解語音合成技術(shù)的主要過程(1)理解文本信息的含義在語言學(xué)家和計算機(jī)科學(xué)家的共同努力下,將文本中的語法規(guī)則轉(zhuǎn)化成相應(yīng)的程序輸入計算機(jī)中,系統(tǒng)根據(jù)相應(yīng)算法,為文本進(jìn)行斷句,準(zhǔn)確獲取文本需要表達(dá)的內(nèi)容,這是文本分析的過程。一、體驗并探究語音合成技術(shù)2.了解語音合成技術(shù)的主要過程(2)韻律處理在理解文本的內(nèi)容后,通常需要考慮在讀取這段文本時使用的節(jié)奏、時長、頻率等,從而使計算機(jī)的發(fā)音更接近于人類說話的聲音。一、體驗并探究語音合成技術(shù)2.了解語音合成技術(shù)的主要過程(3)創(chuàng)建聲學(xué)模型模擬發(fā)音這個過程類似我們模仿他人聲音,需要考慮語種、音色、響度、音調(diào)等。計算機(jī)模擬的方法是在原始的語音庫中提取相關(guān)的聲音信息,采用單元合成與拼接技術(shù)將信息進(jìn)行拼接,從而達(dá)到模擬發(fā)聲的效果。一、體驗并探究語音合成技術(shù)3.模擬自己的聲音(1)明確任務(wù)了解了語音合成技術(shù)的原理,同學(xué)們想不想讓程序模擬你自己的聲音呢?接下來我們利用“訊飛留聲”程序復(fù)刻自己的聲音,然后讓機(jī)器模仿自己的聲音,進(jìn)行一段雙語朗誦。一、體驗并探究語音合成技術(shù)3.模擬自己的聲音(2)解決問題要點分析計算機(jī)完成對人類聲音的模仿,有以下兩個關(guān)鍵內(nèi)容:第一,形成個人的聲音庫,為計算機(jī)提供聲學(xué)模型。通過形成個人的音庫,將具有個人特色的聲學(xué)信息(音色、音調(diào)、響度等)存儲在其中,使計算機(jī)能夠提取出相關(guān)數(shù)據(jù)。第二,通過和個人音庫匹配,完成合成。通過語音合成技術(shù),在識別文本內(nèi)容的前提下,通過與個人音庫中的信息自匹配,從而使計算機(jī)可以模仿我們的聲音進(jìn)行輸出。一、體驗并探究語音合成技術(shù)3.模擬自己的聲音一、體驗并探究語音合成技術(shù)3.模擬自己的聲音第一步,關(guān)注微信公眾號“訊飛留聲”,選擇“復(fù)刻聲音”,進(jìn)入程序。單擊“去復(fù)刻我的聲音”按鈕,開始進(jìn)入工作狀態(tài)。一、體驗并探究語音合成技術(shù)3.模擬自己的聲音錄制停止第二步,根據(jù)要求,朗讀10段文字,按“話筒鍵”開始,“停止鍵”結(jié)束。注意錄制時聲音要清晰,內(nèi)容要準(zhǔn)確。在朗讀文字過程中,采用的是語音識別技術(shù),對我們讀取的語音進(jìn)行識別,并和提供的文字進(jìn)行對比。錄制聲音完成后,系統(tǒng)會自動制作并生成個人音庫。一、體驗并探究語音合成技術(shù)3.模擬自己的聲音第三步,在“訊飛留聲”的“聲音應(yīng)用一玩轉(zhuǎn)好聲音”應(yīng)用中,選擇“我是歪果仁”選項卡,選定任意一條文本,選擇個人音庫進(jìn)行雙語朗誦,聽取合成聲音,也可以將聲音分享到微信群中。一、體驗并探究語音合成技術(shù)3.模擬自己的聲音(4)效果評價將生成的聲音分享到微信群,同學(xué)們互相傾聽、評價,填寫下表。聲音是否流程聲音是否清晰發(fā)音是否自然和個人發(fā)音是否相似二、體驗并探究人臉識別技術(shù)1.體驗身邊的人臉識別技術(shù)(1)體驗人臉識別①神奇的美顏拍攝功能很多人在拍照時喜歡使用美顏功能,有同學(xué)懂美顏功能嗎?你能給大家介紹一款帶有這類功能的智能相機(jī)應(yīng)用嗎?請你當(dāng)小老師指導(dǎo)大家一起體驗,并思考應(yīng)用程序是如何將相關(guān)裝飾和特效放到人臉各個部位的。二、體驗并探究人臉識別技術(shù)1.體驗身邊的人臉識別技術(shù)(1)體驗人臉識別②會分類的智能程序帶有分類功能的智能手機(jī)等設(shè)備,能自動識別照片中的面孔,根據(jù)不同的人像進(jìn)行分類,使每個人都能得到一個單獨(dú)的人物相冊;如果是合影,還能自動生成“合影”標(biāo)簽。分類功能是人臉識別的基礎(chǔ),我們熟悉的人臉識別、人臉解鎖相關(guān)功能都是在此基礎(chǔ)之上的應(yīng)用。二、體驗并探究人臉識別技術(shù)2.了解常用的人臉識別技術(shù)(1)人臉檢測檢測出圖像的人臉?biāo)谖恢?。計算機(jī)通過對圖像的完整掃描,最終標(biāo)記出人臉的相關(guān)信息。二、體驗并探究人臉識別技術(shù)2.了解常用的人臉識別技術(shù)(2)人臉配準(zhǔn)人臉配準(zhǔn)是指在人像中準(zhǔn)確定位五官的技術(shù)。通過人臉配準(zhǔn),計算機(jī)可以清晰地識別人臉圖像五官的位置。在計算機(jī)中,是通過標(biāo)記一些固定的關(guān)鍵點來描繪人物的眼鼻口耳。二、體驗并探究人臉識別技術(shù)2.了解常用的人臉識別技術(shù)(3)人臉特征提取人臉特征提取是指將一張人臉圖像轉(zhuǎn)化為一串固定長度的數(shù)值的過程。這些數(shù)值用來表示人臉的特征,這些特征包含大量的人臉信息。信息包含人臉的固有屬性和動態(tài)屬性,固有屬性包括眼睛的大小、嘴巴的形狀、鼻梁的狀態(tài)、臉上是否有痣;動態(tài)屬性包括“是否在微笑、歪頭”等信息。這些數(shù)據(jù)是計算機(jī)人臉識別工作的基礎(chǔ),也是應(yīng)用的基本保障。二、體驗并探究人臉識別技術(shù)2.了解常用的人臉識別技術(shù)(4)人臉對比人臉對比是指在特征提取的基礎(chǔ)上,對比兩張圖片特征值的相似程度。通過相似程度,可以判定兩張圖片中是否包含了同一個人。這種技術(shù)在人臉解鎖、人臉簽到中被頻繁使用,二、體驗并探究人臉識別技術(shù)3.利用人工智能服務(wù)平臺體驗人臉識別技術(shù)(1)體驗百度人工智能服務(wù)平臺的人臉識別功能首先,注冊百度平臺的賬號,然后登錄該平臺,通過網(wǎng)絡(luò)版百度人工智能開放平臺網(wǎng)址或者移動終端微信小程序“百度AI體驗中心”兩種途徑來體驗人工智能服務(wù)。任選一個平臺,選取一張人像圖片上傳,可得到相應(yīng)的分析結(jié)果。二、體驗并探究人臉識別技術(shù)3.利用人工智能服務(wù)平臺體驗人臉識別技術(shù)(2)人臉識別執(zhí)行過程分析平臺是如何從圖像檢測人臉,并完成最終判定的呢?整個過程包括以下步驟:第一步,人臉檢測與定位。通過人臉檢測技術(shù)識別圖像的人臉區(qū)域,并對人的五官進(jìn)行準(zhǔn)確定位。第二步,特征提取。通過特征提取技術(shù),對圖像信息進(jìn)行數(shù)字化,并用復(fù)雜的數(shù)據(jù)代碼對圖像進(jìn)行描述。第三步,屬性分類。在得到人臉客觀數(shù)據(jù)的基礎(chǔ)上,通過“分類器”(可以將分類器理解成一個標(biāo)準(zhǔn)庫)中提供的大量模型對人的屬性做出判斷,如人物的年齡、表情、情緒等。二、體驗并探究人臉識別技術(shù)3.利用人工智能服務(wù)平臺體驗人臉識別技術(shù)第四步,結(jié)果輸出。將判斷的答案進(jìn)行公布。人工智能平臺對人臉的識別過程和人類對人臉的識別存在相似之處,同時也存在很大不同。具體差別如圖所示。練習(xí)與思考(1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 個人買賣合同范本
- 互助服務(wù)領(lǐng)域推廣合作合同
- 全新餐飲場地租賃合同
- 個人購銷合同模板-食品行業(yè)專用
- 產(chǎn)品分銷合同書新協(xié)定
- 個人借款還款合同模板標(biāo)準(zhǔn)范本大全
- 兩人合資合同:正式合同文件
- 臨時勞動合同范本
- 樂隊合作演出合同范本
- 廢舊保溫棉處置合同范例
- 2024年數(shù)據(jù)編織價值評估指南白皮書-Aloudata
- 托育園老師培訓(xùn)
- 人教版八年級英語上冊Unit1-10完形填空閱讀理解專項訓(xùn)練
- 脊柱外科護(hù)理進(jìn)修心得
- 4.1中國特色社會主義進(jìn)入新時代+課件-2024-2025學(xué)年高中政治統(tǒng)編版必修一中國特色社會主義
- 護(hù)理工作中的人文關(guān)懷
- 完整液壓系統(tǒng)課件
- 班級建設(shè)方案中等職業(yè)學(xué)校班主任能力大賽
- T-TJSG 001-2024 天津市社會組織社會工作專業(yè)人員薪酬指導(dǎo)方案
- 芯片設(shè)計基礎(chǔ)知識題庫100道及答案(完整版)
評論
0/150
提交評論