版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、 淺談掌上氣象客戶端智能語音播報系統(tǒng)技術(shù) 周丹摘 要:掌上氣象客戶端智能語音播報系統(tǒng)依托tts技術(shù),在手機上實現(xiàn)語音播報天氣信息的功能。tts技術(shù),又稱文語轉(zhuǎn)換技術(shù),它將計算機、手機自己產(chǎn)生的、或外部輸入的文字信息轉(zhuǎn)變?yōu)榭梢月牭枚?、流利的漢語口語輸出的技術(shù)。關(guān)鍵詞:tts 語音合成 智能播報:tn912.3:a:1003-9082(2020)06-000-01引言tts技術(shù)關(guān)鍵的就是韻律控制、符號數(shù)字、多音字、構(gòu)詞方面有較多的問題,需要不斷研究,使得語音合成的自然化程度提高。掌上氣象客戶端智能語音播報系統(tǒng)使用語音合成技術(shù)(tts),來進行天
2、氣情況的智能播報。一、tts技術(shù)簡介tts是語音合成應用的一種,使計算機、手機等設(shè)備,具有類似于人一樣的說話能力,是當今時代信息產(chǎn)業(yè)的重要競爭技術(shù)。tts是text to speech的縮寫,即“從文本到語音” 1。語音合成,又稱文語轉(zhuǎn)換,目的是讓設(shè)備說話。文語轉(zhuǎn)換過程是先將文字序列轉(zhuǎn)換成音韻序列,再由系統(tǒng)根據(jù)音韻序列生成語音波形。如:將文本文件內(nèi)容等文字信息按語音處理規(guī)則轉(zhuǎn)換成語音信號輸出, 使設(shè)備流利地讀出文字信息, 使人們通過“聽”就可以知曉信息的內(nèi)容。tts技術(shù)對文本文件進行實時轉(zhuǎn)換,轉(zhuǎn)換時間之短可以秒計算。在其特有智能語音控制器作用下,文本輸出的語音音律流暢,使得聽者在聽取信息時感覺
3、自然,毫無機器語音輸出的冷漠與生澀感。二、掌上氣象客戶端文語轉(zhuǎn)換系統(tǒng)文本分析、韻律控制和語音合成這三個模塊是文語轉(zhuǎn)換系統(tǒng)的三個核心部分2。其結(jié)構(gòu)如下圖所示(如:圖示1)(圖示1)1.文本及文本分析語音播放的文本由掌上氣象客戶端對所接收到的天氣信源,進行拼接處理后生成。對輸入文本進行語言學分析,逐句進行詞匯的、語法的和語義的分析,以確定句子的低層結(jié)構(gòu)和每個字的音素的組成。2.韻律控制合成音質(zhì)(qualityof synthetic speech)是指語音合成系統(tǒng)所輸出的語音的質(zhì)量,一般從清晰度(或可懂度)、自然度和連貫性等方面進行主觀評價。掌上氣象客戶端依據(jù)普通人說話的韻律特征,并對語音播報效果
4、進行反復調(diào)試,從而制定了一套韻律控制機制,用于控制語音的停頓以及聲調(diào)大小等。3.語音數(shù)據(jù)庫掌上氣象客戶端智能語音系統(tǒng)采取自行錄制語音文件的方式,通過將天氣、地名、日期、風向、風力、關(guān)鍵詞等詞句片段錄制成語音文件,并依據(jù)詞句信息進行編號入庫,生成掌上氣象客戶端專有的語音數(shù)據(jù)庫。4.語音合成模塊語音合成模塊最主要功能實現(xiàn)文本拆分、語音合成兩個模塊。文本拆分使用遍歷方式,將輸入語音文本分割成語音片段;語音合成采用語音二進制流,將分割完畢的語音片段進行合并。/以下代碼為文本切割偽代碼片段textarray removeallobjects;nsstring *textcopy = text;nsstr
5、ing *key = nil;nsinteger length = text length;int i = 0;while (i < length)/遍歷所有文本textcopy = text substringfromindex:i;for (int j=0; jkey = textlib allkeys objectatindex:j;if (textcopy hasprefix:key)/匹配某個語音片段textarray addobject:key;/ 保存語音片段i = i + key length - 1;/ 遍歷下一條語音片段break;i+;/如果沒有匹配,跳過這個單詞/
6、以下代碼為語音合成偽代碼片段stream *outstream;for (nsinteger i=0; ioutstream += 語音片段數(shù)組(i).tostream();return outstream;5.輸出語音目前主流手機終端ios/android/wp7/symbian,將語音二進制流放到播放緩沖中,即可實現(xiàn)語音播放。/以下為偽代碼/申請播放器內(nèi)存mediaplay *play = new mediaplay();/將二進制流放入播放緩存play.playaudio(outstream);/play.pause();暫停播放三、總結(jié)tts即語音合成技術(shù)(text to speech)在掌上氣象客戶端平臺上的應用,涉及到聲學、語言學、數(shù)學信號處理技術(shù)、多媒體技術(shù)等多個學科技術(shù)領(lǐng)域,是中文信息處理領(lǐng)域的一項前沿技術(shù),實現(xiàn)了把手機中讀取的文字信源轉(zhuǎn)換成自然流暢的語音輸出?;趖ts技術(shù)的掌上氣象客戶端智能語音系統(tǒng),實現(xiàn)“以人為本”的人性化氣象服務,圖文聲并茂,打造出最具權(quán)威和科技含量的手機氣象客戶端服務系統(tǒng)。參考文獻1顧海峰.基于中文tts技術(shù)研究j.電腦知識與技術(shù):學術(shù)交流,2007,(5).2馬強.嵌入tts技術(shù)開發(fā)語音合成軟件j.電腦開發(fā)與應用,2004,(4).中文信息2020年6期中文信息的其它文章高職院校畢業(yè)生擇業(yè)取向研究核心素養(yǎng)引導
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年鳳凰輪項目可行性研究報告
- 電工技術(shù)課程設(shè)計創(chuàng)意
- 中國配電變壓器行業(yè)發(fā)展趨勢與應用前景預測研究報告(2024-2030版)
- 2024年中國木紋電磁爐市場調(diào)查研究報告
- 2024年中國振動盤底盤市場調(diào)查研究報告
- 中國等壓灌裝機行業(yè)發(fā)展狀況及應用前景預測研究報告(2024-2030版)
- 中國社品行業(yè)市場運營模式及未來發(fā)展動向預測研究報告(2024-2030版)
- 路由模擬課程設(shè)計
- 中國液壓卡盤行業(yè)發(fā)展動態(tài)及投資效益預測研究報告(2024-2030版)
- 中國浮油撈除機行業(yè)市場現(xiàn)狀分析及競爭格局與投資發(fā)展研究報告(2024-2030版)
- 期中模擬檢測(試題) 2024-2025學年四年級上冊數(shù)學北師大版
- 乙醇鈉團體標準
- 2023年國家公務員錄用考試《行測》副省級卷-解析
- 2024人教新版七年級上冊英語單詞英譯漢默寫表
- 教育機構(gòu)線上教育平臺建設(shè)方案
- 五年級語文上冊第四單元綜合素質(zhì)達標作業(yè)
- 第02講:內(nèi)容概括(講解)-2024年中考語文記敘文閱讀講與練(全國)原卷版
- 2024年高考政治考試題海南卷及參考答案
- 危險貨物道路運輸車輛動態(tài)監(jiān)控考核試卷
- 2024年電工作業(yè)高壓電工操作證考試模擬試題庫及答案(共180題)
- 英語冠詞講解
評論
0/150
提交評論