大學(xué)非英語專業(yè)音素教改與自動語音識別技術(shù)融合應(yīng)用可行性_第1頁
大學(xué)非英語專業(yè)音素教改與自動語音識別技術(shù)融合應(yīng)用可行性_第2頁
大學(xué)非英語專業(yè)音素教改與自動語音識別技術(shù)融合應(yīng)用可行性_第3頁
大學(xué)非英語專業(yè)音素教改與自動語音識別技術(shù)融合應(yīng)用可行性_第4頁
大學(xué)非英語專業(yè)音素教改與自動語音識別技術(shù)融合應(yīng)用可行性_第5頁
免費預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、    大學(xué)非英語專業(yè)音素教改與自動語音識別技術(shù)融合應(yīng)用可行性    【摘要】文中以近些年自動語音識別技術(shù)在大學(xué)非英語專業(yè)音素教改中的融入為研究基礎(chǔ),通過分析目前大學(xué)非英語專業(yè)因素教改中存在的問題,探討大學(xué)非英語專業(yè)因素教改中自動語音識別技術(shù)的應(yīng)用優(yōu)勢并引入案例嘗試分析如何提升自動語音識別技術(shù)在大學(xué)非英語專業(yè)音素教改中應(yīng)用的有效性等。【關(guān)鍵詞】大學(xué)非英語專業(yè) 音素教改 自動語音識別技術(shù) 融合g64 a 2095-3089(2018)08-0094-02一、大學(xué)非英語專業(yè)因素教改中存在的問題目前,絕大多數(shù)高校在非英語專業(yè)英語教學(xué)的過程中,并沒有關(guān)于朗讀質(zhì)量

2、的及時有效反饋源,如此也導(dǎo)致學(xué)習(xí)者發(fā)音中的錯誤無法被及時糾正。大學(xué)非英語專業(yè)音素教改的傳統(tǒng)應(yīng)用手段基本可將文字與語音融合為一體,從語音習(xí)得入手,糾正學(xué)習(xí)者錯誤發(fā)音,規(guī)范學(xué)習(xí)者音素應(yīng)用方式等。此種教學(xué)方式的確卓有成效,但是按照新時期大學(xué)非英語專業(yè)音素教改的要求,顯然是不夠的。語音作為語言習(xí)得的重要物質(zhì)基礎(chǔ),利于學(xué)習(xí)者更為便捷的捕捉語言信息并掌握語言技巧?;谡Z言教學(xué)中語音教學(xué)的重要性作用,在大學(xué)非英語專業(yè)的音素教改中,就需要將其視為獨立的部分進行針對性的分析,繼而結(jié)合大學(xué)非英語專業(yè)語言習(xí)得要求、標(biāo)準等,著手相關(guān)方案或者措施的設(shè)計。在此過程中,為提升大學(xué)非英語專業(yè)學(xué)生語言習(xí)得的主動性和積極性,建議

3、嘗試在大學(xué)非英語專業(yè)音素教改中融合自動語音識別技術(shù),以此來提升語音教改向每個學(xué)習(xí)者提供及時反饋需求及個體練習(xí)等的服務(wù)性。二、大學(xué)非英語專業(yè)因素教改中自動語音識別技術(shù)的應(yīng)用優(yōu)勢盡管計算機輔助語言學(xué)習(xí)技術(shù)可幫助增加大學(xué)非英語專業(yè)音素教改的成效,但是如果計算機輔助語言學(xué)習(xí)技術(shù)選擇及應(yīng)用不當(dāng),或者忽視學(xué)生實際學(xué)情,依然無法保障大學(xué)非英語專業(yè)音素教改成效。但是自動語音識別技術(shù)(asr)可以讓計算機通過“聽”不同人連續(xù)的和階段性的說出的語音,在電腦中“寫”出所說內(nèi)容的方式,與人工判斷比較,自動語音識別技術(shù)不僅能完成聲音向文字的轉(zhuǎn)換,按照使用需求,自動語音識別技術(shù)可依照系統(tǒng)用戶情況分為特定和特定人的識別系統(tǒng)

4、,按照系統(tǒng)詞匯量可分為大詞、中詞、小詞的匯量系統(tǒng),按照輸入語音發(fā)音方式可分為自然發(fā)音的口語式和朗讀式兩種,按照輸入語音方言背景可分為方言語音、方言背景普通話、普通話三類識別系統(tǒng),按照輸入語音情感狀態(tài)可分為情感語音識別系統(tǒng)及中性系統(tǒng),借助以上功能優(yōu)勢,自動語音識別技術(shù)一方面可清晰的辨識出不同方言影響下非英語專業(yè)習(xí)得者發(fā)音的不夠標(biāo)準化所引發(fā)的問題,幫助語言習(xí)得者和教師及時糾正及檢測語言習(xí)得給定的音素發(fā)音錯誤。另一方面,自動語音識別技術(shù)能便捷使用,具有強大數(shù)據(jù)分析能力及計算能力,能對學(xué)習(xí)者一對一自主分析性功能,在語音識別技術(shù)輔助下可實時檢測學(xué)習(xí)者發(fā)音錯誤并提供糾正意見,能輔助學(xué)生及教師獲得反映發(fā)音質(zhì)

5、量的指標(biāo),不依賴固定或者特定地點和時間的跨平臺自動語音識別技術(shù),因此,作為計算機輔助語言學(xué)習(xí)技術(shù)中的佼佼者,則以其可及時、實時總結(jié)學(xué)生弱點,推薦針對性強化訓(xùn)練方案等優(yōu)勢勝出。三、大學(xué)非英語專業(yè)音素教改中自動語音識別技術(shù)的應(yīng)用思路鑒于國人在英語朗讀和發(fā)音時容易出現(xiàn)的不標(biāo)準、不規(guī)范錯誤,在大學(xué)非英語專業(yè)音素教改中引入自動語音識別技術(shù)時,建議按照大學(xué)非英語專業(yè)音素教改要求以及音素應(yīng)用規(guī)則,有選擇的使用自動語音識別技術(shù)及載體,進行實驗數(shù)據(jù)錄制和分析,系統(tǒng)衡量指標(biāo)并建設(shè)基本音素檢錯系統(tǒng)等。具體設(shè)計及應(yīng)用的思路如下:第一步,實驗數(shù)據(jù)的錄制及分析。考慮到大學(xué)非英語專業(yè)音素教改中自動語音識別技術(shù)的應(yīng)用方式多樣

6、,自動語音識別技術(shù)所依賴的載體也多種多樣,因此,以下以嵌入式設(shè)備如智能手機作為自動語音識別技術(shù)應(yīng)用的載體,實驗語音數(shù)據(jù)錄入使用自帶麥克風(fēng)的pda。朗讀文本選擇英語900句作為語料,錄制每人20句,實驗人隨機抽選大學(xué)非英語專業(yè)學(xué)生45人。年齡集中在20-25歲之間。在明確錄制要求和對象之后,按照英語專家所設(shè)定的朗讀數(shù)據(jù)語素正確發(fā)音標(biāo)準及標(biāo)注,定義音素發(fā)音情況為三類,如漏讀、錯讀、正確。在系統(tǒng)衡量指標(biāo)并建設(shè)基本音素檢錯系統(tǒng)之前,以簡化模型為目標(biāo),增讀暫時忽視,標(biāo)注統(tǒng)計結(jié)果如下:專家1音素發(fā)音標(biāo)注結(jié)果中正確17468、錯讀519、漏讀402;專家2音素發(fā)音標(biāo)注結(jié)果中正確17202、錯讀713、漏讀4

7、74。第二步,確定系統(tǒng)衡量指標(biāo)。按照衡量系統(tǒng)總體性能進行兩大重要指標(biāo)的界定,即準確率和召回率,以專家1標(biāo)注結(jié)果為標(biāo)準,計算準確率和召回率分別為59%和69%。公式為:召回率=系統(tǒng)檢測出的錯誤數(shù)量/測試集中的音素數(shù)量?鄢100%針對計算結(jié)果進行分析可得,正確發(fā)音在所選語料中占大多數(shù),兩位專家標(biāo)注的結(jié)果類似,漏讀和錯讀的比率類似,這意味著大學(xué)非英語專業(yè)學(xué)生英語發(fā)音時容易漏讀音素而不是音素發(fā)音錯誤。第三步,建立基本音素檢錯系統(tǒng)。大學(xué)非英語專業(yè)音素教改中自動語音識別技術(shù)的應(yīng)用到此階段,需要使用音素發(fā)音自動檢錯技術(shù)來輔助大學(xué)非英語專業(yè)音素教改的實踐應(yīng)用。判斷工作流程為,按照音素序列自動切分朗讀句子,所切

8、分的為每個音素對應(yīng)的語音小片段,之后進行小片段發(fā)音質(zhì)量的判斷,此處可引入音素發(fā)音質(zhì)量cop輔助構(gòu)建系統(tǒng)。在實踐應(yīng)用中,音素切分網(wǎng)絡(luò)可直接使用朗讀文本對應(yīng)的音素序列作為切分網(wǎng)絡(luò),在聲學(xué)模型選擇方面,建議使用目前自動語音識別中慣常使用的hmm模型,發(fā)音數(shù)據(jù)則選擇標(biāo)準英文發(fā)音數(shù)據(jù),升學(xué)特征參數(shù)選擇mel頻率倒數(shù)系數(shù)mfcc,音素識別列表方面按照常見的競爭子集。按照以上的操作方式,在部分音素競爭子集的選擇階段,需要依照語音學(xué)和聲學(xué)經(jīng)驗,客觀規(guī)律中每個音素模型間的相似度和距離,統(tǒng)計人工標(biāo)注中容易混淆的音素對。部分音素競爭子集可對應(yīng)如下:(1)aa,對應(yīng)ae、ax、eh;(2)ao,對應(yīng)ax、er、eh;

9、(3)aw,對應(yīng)ao、oo、uw;(4)ch,對應(yīng)sh、t;(5)eh,對應(yīng)ih、ax、el、ey;(6)s,對應(yīng)z。第四步,使用獨立閾值提升錯讀檢測性能。按照上述三個步驟進行基本英文發(fā)音檢錯系統(tǒng)的描述,之后結(jié)果顯示所有音素的判斷閾值均一致。但是在研究結(jié)果中也充分體現(xiàn)出不同音素錯讀和正確讀出的cop分布情況大相徑庭。以“ey”和“ax”為例,兩者錯讀和正確讀出的區(qū)分相差度甚至二倍出現(xiàn)。基于此,進行獨立閾值的優(yōu)化時,可將所有訓(xùn)練數(shù)據(jù)里的cop值以音素為歸類和升序排序依據(jù),歸類所得形成n個棧vi,用vij代表音素i的第i個樣本是否為錯誤發(fā)音,可取值0或者1,之后將最佳獨立閾值訓(xùn)練過程抽象成數(shù)學(xué)問題

10、,即從頂部開始,每個棧全出個ai數(shù)據(jù)繼而求出最優(yōu)化ai構(gòu)成的b維向量。按照以上思路進行計算時,可在初始化階段將樣本個數(shù)設(shè)置為0,得到的最多錯誤樣本個數(shù)設(shè)定為em,那么可得最佳ain=0。在逐步進行向量計算后,最終得到第i個棧中的第ain個樣本對應(yīng)cop值為最終訓(xùn)練所得到與因素對應(yīng)的檢錯門限。第五步,檢測改進因素對齊網(wǎng)絡(luò)實現(xiàn)漏讀。上文分析可得大學(xué)非英語專業(yè)學(xué)生在朗讀英語時會出現(xiàn)漏讀一個或者多個因素,建議假定發(fā)音人按照句子里的因素排列順序能完整朗讀整個例句,在因素切分之前可檢測出發(fā)音人漏讀音素,放棄音素邊界的劃分,并以此作為提升系統(tǒng)應(yīng)用性能的切入點。在檢測后可限定因素對齊網(wǎng)絡(luò),比如搭建起識別網(wǎng)絡(luò),網(wǎng)絡(luò)主路徑可依照單詞中每個因素的排列順序來依次連接,每個因素均可跳過去,如此一旦出現(xiàn)某個因素漏讀,此識別網(wǎng)絡(luò)就可自動識別漏讀,并得強制劃分出可匹配漏讀情況的小段語音數(shù)據(jù)。在識別器及自動識別技術(shù)應(yīng)用靈敏度較高的情況下此種設(shè)計才能確保有效。但是識別網(wǎng)絡(luò)需要被限制,不能所有音素都能輕易被跳過。否則就會失去檢驗和應(yīng)用的初衷。參考文獻:1劉

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論