Apriori算法在語(yǔ)音合成應(yīng)用中的一種改進(jìn)_第1頁(yè)
Apriori算法在語(yǔ)音合成應(yīng)用中的一種改進(jìn)_第2頁(yè)
Apriori算法在語(yǔ)音合成應(yīng)用中的一種改進(jìn)_第3頁(yè)
Apriori算法在語(yǔ)音合成應(yīng)用中的一種改進(jìn)_第4頁(yè)
Apriori算法在語(yǔ)音合成應(yīng)用中的一種改進(jìn)_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第3l卷第5期 2004年l 0月湖南大學(xué)學(xué)報(bào)(自然科學(xué)版Jourml of Hunan Unive商ty(Natural Sciences文章編號(hào):10002472(200405一009405Apriori算法在語(yǔ)音合成應(yīng)用中的一種改進(jìn)。趙歡1,譚華2(1.湖南大學(xué)計(jì)算機(jī)與通信學(xué)院,湖南長(zhǎng)沙410082;2.湖南大學(xué)軟件學(xué)院,湖南長(zhǎng)沙410082摘要:針對(duì)目前語(yǔ)音合成技術(shù)中提高語(yǔ)音合成自然度這一難點(diǎn),研究了數(shù)據(jù)挖掘在語(yǔ)音合成中的應(yīng)用.首先通過(guò)選取基頻曲線中的最高音基頻值(N1和最低音基頻值(N2優(yōu)化韻律參數(shù),然后將其運(yùn)用到關(guān)聯(lián)規(guī)則對(duì)韻律參數(shù)進(jìn)行規(guī)則提取的方法中,提出了優(yōu)化韻律參數(shù)后的規(guī)則提取

2、過(guò)程,并對(duì)原有的Aprio“算法進(jìn)行改進(jìn)而獲得更適合語(yǔ)音合成的HLApriori算法,通過(guò)該算法可以將原有Apriori算法得到的規(guī)則進(jìn)一步細(xì)分,從而得到更多研究者感興趣的規(guī)則.關(guān)鍵詞:語(yǔ)音合成;數(shù)據(jù)挖掘;Apriori算法;HLAprio“算法中圖分類號(hào):TP301.6文獻(xiàn)標(biāo)識(shí)碼:AAn I mprovement to Apriori Algorithmin the Application of Speech SynphesisZHAo Huanl。TAN Hu一(1.college of(確puter and(抽1nnunication,Hunan Univ,ChaIlgsha 41008

3、2,Chian;2.瞄llege of SOftware,Hunan Univ。Changsha 410082,ChinaAbstract:This paper studied the application of data mining technology in speech synphesis in order to over come the current technical difficulty in improVing the spontane。usness of speech synphesis. Firstly, we opti mized the prosodic para

4、meter by choosing the highest pitch values(N1and the lowest pitch values(N2.!;ec ondly,we applied this optimized pp。sodic parameter to the rules concerned to pick out the rules for the prosodic parameter.We put forward the process of distilling rules after the optimized prosodic par枷eter.We propOsed

5、 a new algorithm,HLAprio“algorithm,to better fit the speech synphesis,and obtain more interesting rules for in vest譫atorS.Key words:speech synphesis;data mining;Apriori algorithm;HLApriori algo“thmO引 言近代語(yǔ)音合成技術(shù)是隨著計(jì)算機(jī)技術(shù)和數(shù)字信 號(hào)處理技術(shù)的發(fā)展而發(fā)展起來(lái)的,主要是讓計(jì)算機(jī) 能夠產(chǎn)生高清晰度、高自然度的連續(xù)語(yǔ)音.近幾十年基金項(xiàng)目:湖南省自然科學(xué)基金資助項(xiàng)目(033JJY3097作者簡(jiǎn)

6、介:趙歡(1967一,女,湖南長(zhǎng)沙人,湖南大學(xué)副教授 E.mail:hzh 來(lái)國(guó)際和國(guó)內(nèi)的研究主要集中在按規(guī)則文語(yǔ)轉(zhuǎn)換方 法¨。3J,在語(yǔ)音合成技術(shù)的研究中,基音同步疊加 (PsoLA方法H。5的提出大大提高了合成語(yǔ)音的音 色和自然度.20世紀(jì)90年代初,基于PSOLA技術(shù) 的法語(yǔ)、德語(yǔ)、英語(yǔ)、日語(yǔ)等語(yǔ)種的文語(yǔ)轉(zhuǎn)換系統(tǒng)都 已經(jīng)相繼研制成功,近年來(lái)一種新的基于數(shù)據(jù)挖掘 的語(yǔ)音合成方法正引起人們的注意,在這種方法中第5期 趙歡等:Apriori算法在語(yǔ)音合成應(yīng)用中的一種改進(jìn) 95合成語(yǔ)句的語(yǔ)音單元是從一個(gè)預(yù)先錄下的龐大的語(yǔ)音數(shù)據(jù)庫(kù)中挑選出來(lái)的,只要語(yǔ)音數(shù)據(jù)庫(kù)足夠大,包 括了各種可能語(yǔ)境下

7、的語(yǔ)音單元,理論上講就有可 能拼接出任何語(yǔ)句.由于合成的語(yǔ)音基元都是來(lái)自 自然的原始發(fā)音,合成語(yǔ)句的清晰度和自然度都將 會(huì)非常高.本文將數(shù)據(jù)挖掘技術(shù)應(yīng)用到語(yǔ)音合成中, 在Apriori算法基礎(chǔ)上提出了HLAprio“算法,通過(guò) 生成更多有用規(guī)則及更好的搜索語(yǔ)音單元,以求獲 得更好的語(yǔ)音合成自然度.1語(yǔ)音合成中的存在問(wèn)題語(yǔ)音合成系統(tǒng)的主要功能是將計(jì)算機(jī)中任意出 現(xiàn)的文字轉(zhuǎn)換成自然流暢的語(yǔ)音輸出.一般認(rèn)為語(yǔ) 音合成系統(tǒng)包括3個(gè)主要的組成部分:文本分析模 塊、韻律生成模塊和聲學(xué)模塊,其主要結(jié)構(gòu)如圖1所示.圖l語(yǔ)音合成系統(tǒng)組成結(jié)構(gòu)Fig.1The c(nstitution of speech anal

8、ysis syst咖 語(yǔ)音合成技術(shù)從規(guī)則合成技術(shù)發(fā)展到基于大語(yǔ) 料和數(shù)據(jù)驅(qū)動(dòng)的技術(shù),系統(tǒng)也從單一語(yǔ)種發(fā)展到多 語(yǔ)種,而且越來(lái)越靈活,目前基于大語(yǔ)料庫(kù)和數(shù)據(jù)驅(qū) 動(dòng)的技術(shù)依然是語(yǔ)音合成的主流技術(shù).在此技術(shù)背 景下要提高合成語(yǔ)音的自然度就要求增大語(yǔ)料庫(kù)的 規(guī)模,由此產(chǎn)生了一系列新的需要研究的問(wèn)題,其中 包括:1如何確定語(yǔ)音合成基元,根據(jù)準(zhǔn)則去挑選合 適的基元;2韻律參數(shù)定量化問(wèn)題,對(duì)數(shù)據(jù)庫(kù)進(jìn)行定標(biāo) 問(wèn)題.由于語(yǔ)音合成技術(shù)越來(lái)越依賴大型語(yǔ)料庫(kù),要 提高語(yǔ)音合成的自然度,數(shù)據(jù)挖掘成為語(yǔ)音合成技 術(shù)首選方法. 2韻律參數(shù)選取任何人說(shuō)話都有韻律特征,特別在漢語(yǔ)中,音節(jié) 有不同的聲調(diào)、語(yǔ)氣和停頓方式,發(fā)音長(zhǎng)短

9、也各不相 同.韻律特征主要是指音節(jié)的時(shí)長(zhǎng)、基頻的包絡(luò)變 化、能量的變化及適當(dāng)?shù)耐nD等眾多參數(shù)屬性,在這 些屬性中,對(duì)合成系統(tǒng)的自然度影響最顯著的是音 節(jié)的基頻變化和音長(zhǎng)的變化.圖2基頻調(diào)型曲線Fig.2Modulating pitch curve其中橫坐標(biāo)以表示音節(jié)中以時(shí)序?yàn)榛A(chǔ)的不 同位置的基頻取值;縱坐標(biāo).,表示音節(jié)中不同的參 數(shù):H為基頻曲線的最大值,L為基頻曲線的最小 值,S為基頻曲線的起始值,E為基頻曲線的終止 值,Nl為最大值位置,N2為最小值位置,N1,N,為 最大值還是最小值視具體基頻曲線升降而定. 有研究者將基頻中值作為處理對(duì)象7|,并能得 到一定滿意度的合成效果,如果語(yǔ)音合

10、成不需要精 細(xì)的韻律系統(tǒng),那么中值的好處就是方便.語(yǔ)音合成 要向前推進(jìn),就要考慮到中值是對(duì)高音特征點(diǎn)和低 音特征點(diǎn)各自作用的模糊表現(xiàn)形式.當(dāng)兩個(gè)不同的 音節(jié)基頻中值相同時(shí),可能高音部分和低音部分是 不同的,這樣就不能更好的細(xì)分,在規(guī)則提取時(shí)就不 能將有用規(guī)則完全提取.根據(jù)以上分析,本文選擇基湖南大學(xué)學(xué)報(bào)(自然科學(xué)版 2004年頻曲線中的最高音基頻值(N。和最低音基頻值 (N2,以期達(dá)到更佳效果的合成度.3數(shù)據(jù)挖掘模型選取數(shù)據(jù)挖掘(data mining是從大量的數(shù)據(jù)中得到 嶄新的模式、結(jié)論和假設(shè)的方法舊J.影響數(shù)據(jù)挖掘 結(jié)果質(zhì)量好壞的因素有兩個(gè)舊j:一是所采用的數(shù)據(jù) 挖掘技術(shù)的有效性,二是用于

11、挖掘的數(shù)據(jù)的質(zhì)量和 數(shù)據(jù)量.如果選擇了錯(cuò)誤的數(shù)據(jù)或不適當(dāng)?shù)膶傩?或 對(duì)數(shù)據(jù)進(jìn)行了不適當(dāng)?shù)霓D(zhuǎn)換,則挖掘結(jié)果不會(huì)好.數(shù) 據(jù)挖掘技術(shù)中的主要模型有舊J:關(guān)聯(lián)規(guī)則模型、分 類和預(yù)測(cè)模型、聚類分析模型、孤立點(diǎn)分析模型及粗 糙集模型等.目前,合成系統(tǒng)中的基頻變化規(guī)律大多是根據(jù) 語(yǔ)言學(xué)的研究得出的一些定性的描述,這些定性規(guī) 則能夠?yàn)楹铣蛇^(guò)程提供一些參考,但是無(wú)法在合成文本信息韻律基頻最值設(shè)置域值求規(guī)則擴(kuò)展規(guī)則確定候選音節(jié)選取后一音節(jié)(多對(duì)多最終選定規(guī)則 過(guò)程中直接使用這些規(guī)則,而且這些規(guī)則也很難覆 蓋所有的基頻變化現(xiàn)象,同時(shí)對(duì)這些規(guī)則的維護(hù)和 完善也很困難,在具體應(yīng)用中仍存在較大的不足.由 于韻律規(guī)則在語(yǔ)音

12、合成中發(fā)揮著重要作用,迫切需 要采用新的處理方法加以解決.由前文所選的韻律參數(shù)來(lái)看,每個(gè)音節(jié)選取其 中的最值、并且是對(duì)兩個(gè)最值進(jìn)行研究,設(shè)選取的韻 律參數(shù)表示為P=(S,N】,N2,E,其中N】,N2分 別表示音節(jié)基頻之中兩個(gè)最值點(diǎn).通過(guò)此表達(dá)式可 知每個(gè)音節(jié)的始終位置及最值情況,對(duì)某一音節(jié)的 下音節(jié)進(jìn)行選取時(shí)選取出的規(guī)則基本形式為A B,其中A,.B分別表示兩前后相鄰的音節(jié).它們之 間存在一定的先后順序及規(guī)律,鑒于此選用關(guān)聯(lián)規(guī) 則模型對(duì)韻律規(guī)則進(jìn)行提取,然后根據(jù)具體最值情 況進(jìn)行進(jìn)一步的規(guī)律選取.圖3為本文提出的選取 韻律參數(shù)后規(guī)則提取的基本過(guò)程.弓.-I置。圖3規(guī)則提取過(guò)程Fig.3The process of distilling I.ules圖3為提取規(guī)則的過(guò)程,根據(jù)前面所選取的韻律 參數(shù)為每個(gè)文本信息單元選取韻律特征最優(yōu)基頻最 值,通過(guò)設(shè)置一定大小的域值得到初始規(guī)則N M.由于對(duì)每個(gè)音節(jié)選取的韻律參數(shù)為兩個(gè)最

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論