版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、目錄一、問題重述2二、問題提出2三、問題分析2四、模型假設(shè)2五、主要符號(hào)說明3六、模型建立與求解36.1探究影響流行音樂風(fēng)格分類的主要因素36.1.1旋律對(duì)音樂風(fēng)格的影響36.1.2音高對(duì)音樂風(fēng)格的影響66.1.3和聲對(duì)音樂風(fēng)格的影響76.1.4音色對(duì)音樂風(fēng)格的影響76.1.5復(fù)調(diào)對(duì)音樂風(fēng)格的影響76.1.6節(jié)拍對(duì)音樂風(fēng)格的影響76.2對(duì)各影響因素進(jìn)行主成分分析86.2.1模型的建立86.2.2模型的求解106.3用matlab進(jìn)行音樂特征提取116.3.1利用FFT進(jìn)行頻譜分析116.3.2特征提取分析126.3.3特征提取結(jié)果126.4基于BP神經(jīng)網(wǎng)絡(luò)的分類算法136.4.1 BP神經(jīng)網(wǎng)絡(luò)
2、介紹136.4.2 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練步驟146.4.3 BP神經(jīng)網(wǎng)絡(luò)語音特征信號(hào)分類156.4.4 歸一化處理166.4.5 結(jié)果分析16七、模型的優(yōu)缺點(diǎn)187.1層次分析法的優(yōu)缺點(diǎn)187.2主成分分析法的優(yōu)缺點(diǎn)187.3 BP神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點(diǎn)18八、參考文獻(xiàn)19一、問題重述隨著互聯(lián)網(wǎng)的發(fā)展,流行音樂的主要傳播媒介從傳統(tǒng)的電臺(tái)和唱片逐漸過渡到網(wǎng)絡(luò)下載和網(wǎng)絡(luò)電臺(tái)等。網(wǎng)絡(luò)電臺(tái)需要根據(jù)收聽者的已知喜好,自動(dòng)推薦并播放其它音樂。由于每個(gè)人喜好的音樂可能橫跨若干種風(fēng)格,區(qū)別甚大,需要分別對(duì)待。這就需要探討如何區(qū)分音樂風(fēng)格的問題。在流行音樂中,傳統(tǒng)的風(fēng)格概念包括Pop(流行)、Country(鄉(xiāng)村)、Ja
3、zz(爵士)、Rock(搖滾)、R&B(節(jié)奏布魯斯)、New Age(新世紀(jì))等若干大類,它們分別可以細(xì)分成許多小類,有些小類甚至可以做更進(jìn)一步的細(xì)分。而每首歌曲只能靠人工賦予風(fēng)格標(biāo)簽。這樣的做法有許多不足:有的類別之間關(guān)系不清楚,造成混亂;有的類別過度粗略或精細(xì);有的類別標(biāo)簽沒有得到公認(rèn);有的音樂歸屬則存在爭議或者難以劃歸。二、問題提出建立合理的數(shù)學(xué)模型,對(duì)流行音樂的風(fēng)格給出一個(gè)自然、合理的分類方法,以便給網(wǎng)絡(luò)電臺(tái)的推薦功能和其它可能的用途提供支持。三、問題分析對(duì)于流行音樂風(fēng)格的分類,要從以下三個(gè)方面進(jìn)行考慮:(1)探究影響流行音樂風(fēng)格分類的主要因素。目前,旋律、音高、和聲、音色、復(fù)
4、調(diào)和節(jié)拍等都是體現(xiàn)音樂風(fēng)格的因素。通過建立遞階層次結(jié)構(gòu),構(gòu)造判斷矩陣并賦值、層次單排序(計(jì)算權(quán)向量)與檢驗(yàn)、主成分分析的數(shù)學(xué)模型等方法,確定影響流行音樂風(fēng)格的主要因素;(2)音樂特征提取。通過FFT進(jìn)行頻譜分析,利用不同類別音樂的統(tǒng)計(jì)規(guī)律提取特征向量;(3)進(jìn)行歸一化處理;(4)利用BP神經(jīng)網(wǎng)絡(luò)分類算法進(jìn)行分類。四、模型假設(shè)4.1忽略主觀因素對(duì)流行音樂風(fēng)格分類的影響4.2假設(shè)每個(gè)音樂分類是明確的4.3假設(shè)流行音樂市場處于穩(wěn)定狀態(tài)4.4其他所發(fā)生的偶然因素對(duì)模型無影響五、主要符號(hào)說明神經(jīng)網(wǎng)絡(luò)的輸入值神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)值、神經(jīng)網(wǎng)絡(luò)權(quán)值a隱含層閾值b輸出層閾值數(shù)據(jù)序列最小數(shù)數(shù)據(jù)序列均值學(xué)習(xí)速率六、模型建
5、立與求解6.1探究影響流行音樂風(fēng)格分類的主要因素6.1.1旋律對(duì)音樂風(fēng)格的影響6.1.1.1分析旋律亦稱曲調(diào),是經(jīng)過藝術(shù)構(gòu)思而形成的若干樂音的有組織、有節(jié)奏的和諧運(yùn)動(dòng)。它建立在一定的調(diào)式和節(jié)拍的基礎(chǔ)上,按一定的音高、時(shí)值和音量構(gòu)成的、具有邏輯因素的單聲部進(jìn)行的。在音樂作品中,旋律是表情達(dá)意的主要手段,也是一種反映人們內(nèi)心感受的藝術(shù)語言。對(duì)于流行音樂風(fēng)格分類來說,每個(gè)風(fēng)格各異,歌曲旋律也不盡相同。如rap舞曲它以人聲的吟唱加上鼓的清晰濃郁節(jié)奏,歌詞通俗,朗朗上口;鄉(xiāng)村音樂在唱法上多用民間本嗓演唱,形式多為獨(dú)唱或小合唱,用吉他、班卓琴、口琴、小提琴伴奏。6.1.1.2模型的建立因?yàn)橛绊懶傻囊蛩赜?/p>
6、很多,我們采用層次分析法來解決這一問題。所謂層次分析法,是指將一個(gè)復(fù)雜的多目標(biāo)決策問題作為一個(gè)系統(tǒng),將目標(biāo)分解為多個(gè)目標(biāo)或準(zhǔn)則,進(jìn)而分解為多指標(biāo)(或準(zhǔn)則、約束)的若干層次,通過定性指標(biāo)模糊量化方法算出層次單排序(權(quán)數(shù))和總排序,以作為目標(biāo)(多指標(biāo))、多方案優(yōu)化決策的系統(tǒng)方法。6.1.1.2.1建立遞階層次結(jié)構(gòu) AHP遞階層次結(jié)構(gòu)三個(gè)層次組成:目標(biāo)層、準(zhǔn)則層、指標(biāo)層,如圖所示:6.1.1.2.2構(gòu)造判斷矩陣并賦值構(gòu)造判斷矩陣時(shí)用到1-9標(biāo)度,對(duì)重要性程度按1-9賦值(重要性標(biāo)度值見下表)重要性標(biāo)度含 義1表示兩個(gè)元素相比,具有同等重要性3表示兩個(gè)元素相比,前者比后者稍重要5表示兩個(gè)元素相比,前者
7、比后者明顯重要7表示兩個(gè)元素相比,前者比后者強(qiáng)烈重要9表示兩個(gè)元素相比,前者比后者極端重要2,4,6,8表示上述判斷的中間值倒數(shù)若元素I與元素j的重要性之比為aij, 則元素j與元素I的重要性之比為aji=1/aij6.1.1.2.3 層次單排序(計(jì)算權(quán)向量)與檢驗(yàn)層次單排序是指每一個(gè)判斷矩陣各因素針對(duì)其準(zhǔn)則的相對(duì)權(quán)重,所以本質(zhì)上是計(jì)算權(quán)向量。計(jì)算權(quán)向量有特征根法、和法、根法、冪法等,這里簡要介紹和法。和法的原理是,對(duì)于一致性判斷矩陣,每一列歸一化后就是相應(yīng)的權(quán)重。對(duì)于非一致性判斷矩陣,每一列歸一化后近似其相應(yīng)的權(quán)重,在對(duì)這n個(gè)列向量求取算術(shù)平均值作為最后的權(quán)重。具體的公式是:需要注意的是,在
8、層層排序中,要對(duì)判斷矩陣進(jìn)行一致性檢驗(yàn)。在特殊情況下,判斷矩陣可以具有傳遞性和一致性。一般情況下,并不要求判斷矩陣嚴(yán)格滿足這一性質(zhì)。但從人類認(rèn)識(shí)規(guī)律看,一個(gè)正確的判斷矩陣重要性排序是有一定邏輯規(guī)律的,例如若A比B重要,B又比C重要,則從邏輯上講,A應(yīng)該比C明顯重要,若兩兩比較時(shí)出現(xiàn)A比C重要的結(jié)果,則該判斷矩陣違反了一致性準(zhǔn)則,在邏輯上是不合理的。因此在實(shí)際中要求判斷矩陣滿足大體上的一致性,需進(jìn)行一致性檢驗(yàn)。只有通過檢驗(yàn),才能說明判斷矩陣在邏輯上是合理的,才能繼續(xù)對(duì)結(jié)果進(jìn)行分析。一致性檢驗(yàn)的步驟如下:第一步,計(jì)算一致性指標(biāo)C.I.(consistency index)第二步,查表確定相應(yīng)的平均
9、隨機(jī)一致性指標(biāo)R.I.(random index)據(jù)判斷矩陣不同階數(shù)查下表,得到平均隨機(jī)一致性指標(biāo)R.I.。平均隨機(jī)一致性指標(biāo)R.I.表(1000次正互反矩陣計(jì)算結(jié)果)矩陣階數(shù)12345678R.I.000.520.891.121.261.361.41矩陣階數(shù)9101112131415R.I.1.461.491.521.541.561.581.59第三步,計(jì)算一致性比例C.R.(consistency ratio)并進(jìn)行判斷當(dāng)C.R.<0.1時(shí),認(rèn)為判斷矩陣的一致性是可以接受的,C.R.>0.1時(shí),認(rèn)為判斷矩陣不符合一致性要求,需要對(duì)該判斷矩陣進(jìn)行重新修正。6.1.1.2.4.層次
10、總排序與檢驗(yàn)總排序是指每一個(gè)判斷矩陣各因素針對(duì)目標(biāo)層(最上層)的相對(duì)權(quán)重。這一權(quán)重的計(jì)算采用從上而下的方法,逐層合成。很明顯,第二層的單排序結(jié)果就是總排序結(jié)果。假定已經(jīng)算出第k-1層m個(gè)元素相對(duì)于總目標(biāo)的權(quán)重w(k-1)=(w1(k-1),w2(k-1),wm(k-1)T,第k層n個(gè)元素對(duì)于上一層(第k層)第j個(gè)元素的單排序權(quán)重是pj(k)=(p1j(k),p2j(k),pnj(k)T,其中不受j支配的元素的權(quán)重為零。令P(k)=(p1(k),p2(k),pn(k),表示第k層元素對(duì)第k-1層個(gè)元素的排序,則第k層元素對(duì)于總目標(biāo)的總排序?yàn)椋簑(k)=(w1(k),w2(k),wn(k)T= p
11、(k) w(k-1) 或 I=1,2,n同樣,也需要對(duì)總排序結(jié)果進(jìn)行一致性檢驗(yàn)。假定已經(jīng)算出針對(duì)第k-1層第j個(gè)元素為準(zhǔn)則的C.I.j(k)、R.I.j(k)和C.R.j(k), j=1,2,m,則第k層的綜合檢驗(yàn)指標(biāo)C.I.j(k)=(C.I.1(k) ,C.I.2(k) , C.I.m(k))w(k-1)R.I.j(k)=(R.I.1(k) ,R.I.2(k) , R.I.m(k))w(k-1)當(dāng)C.R.(k)<0.1時(shí),認(rèn)為判斷矩陣的整體一致性是可以接受的。6.1.1.2.5 結(jié)果分析通過對(duì)排序結(jié)果的分析,得出最后的決策方案。6.1.1.3模型的求解通過使用AHP軟件,我們得到了以
12、下數(shù)據(jù):旋律曲調(diào)主題節(jié)奏曲調(diào)11/21/3主題211/2節(jié)奏321單層權(quán)重0.16340.29700.5396注:lmax=3.0092; CI=0.0046; RI=0.58; CR=0.0079曲調(diào)因素聲音腔調(diào)聲音高低語勢(shì)輕重緩急聲音腔調(diào)132聲音高低1/311/2語勢(shì)輕重緩急1/221單層權(quán)重0.53960.16340.2970注:lmax=3.0092; CI=0.0046; RI=0.58; CR=0.0079主題因素歌詞作者情感背景音歌詞11/21/3作者情感211/2背景音321單層權(quán)重0.16340.29700.5396注:lmax=3.0092; CI=0.0046; RI=
13、0.58; CR=0.0079節(jié)奏因素樂器特點(diǎn)節(jié)拍快慢樂器特點(diǎn)12節(jié)拍快慢1/21單層權(quán)重0.66670.3333注:lmax=2; CI=0; RI=1E-6; CR=0通過上述分析,我們可以得到節(jié)奏在旋律因素中起到主要的影響,其次是主題因素和曲調(diào)因素。在曲調(diào)因素中,聲音腔調(diào)對(duì)其影響很大;在主題因素中,背景音到很大的影響;在節(jié)奏因素中,樂器特點(diǎn)對(duì)其影響占有很大的比例。綜上所述,旋律因素對(duì)音樂風(fēng)格分類有很大的影響。6.1.2音高對(duì)音樂風(fēng)格的影響音高即音的高低。音樂如語言,孤立的音是構(gòu)不成樂句的,有了樂句才能構(gòu)成樂段,從而表達(dá)完整的樂思。由一組高低不同的音按照一定的調(diào)式關(guān)系和節(jié)奏關(guān)系組織起來,并
14、體現(xiàn)著相對(duì)穩(wěn)定的樂思,便形成了旋律。由于音高之間的次第變化,使旋律進(jìn)行形成上行、下行、平行、波浪等多種進(jìn)行方向。6.1.3和聲對(duì)音樂風(fēng)格的影響兩個(gè)以上不同的音按一定的法則同時(shí)發(fā)聲而構(gòu)成的音響組合稱為和聲。和聲有明顯的濃,淡,厚,薄的色彩作用;還有構(gòu)成分句,分樂段和終止樂曲的作用。在調(diào)性音樂中,和聲同時(shí)具有功能性與色彩性的意義。和聲的功能,是指各和弦在調(diào)性內(nèi)所具有的穩(wěn)定或不穩(wěn)定的作用、它們的運(yùn)動(dòng)與傾向特性、彼此之間的邏輯聯(lián)系等。和聲的功能與調(diào)性密切相關(guān),離開了調(diào)性或取消了調(diào)性,和聲也就失去了它的功能意義。和聲的色彩,是指各種和弦結(jié)構(gòu)、和聲位置、織體寫法與和聲進(jìn)行等所具有的音響效果。和聲的色彩是和
15、聲表現(xiàn)作用的主要因素,無論在調(diào)性音樂或非調(diào)性音樂中,它都具有重要意義。6.1.4音色對(duì)音樂風(fēng)格的影響音色是指聲音的感覺特性。我們可以通過音色的不同去分辨不同的發(fā)聲體。音色是聲音的特色,根據(jù)不同的音色,即使在同一音高和同一聲音強(qiáng)度的情況下,也能區(qū)分出是不同樂器或人發(fā)出的。音色的不同取決于不同的泛音,每一種樂器、不同的人以及所有能發(fā)聲的物體發(fā)出的聲音,除了一個(gè)基音外,還有許多不同頻率的泛音伴隨。正是這些泛音決定了其不同的音色,使人能辨別出是不同的樂器甚至不同的人發(fā)出的聲音。6.1.5復(fù)調(diào)對(duì)音樂風(fēng)格的影響復(fù)調(diào)是若干旋律的同時(shí)結(jié)合。音樂從聲部的組合方式上分為單音音樂,主調(diào)音樂,復(fù)調(diào)音樂三類。復(fù)調(diào)是音樂
16、的重要手段之一。它通過旋律與旋律的結(jié)合,既能現(xiàn)時(shí)刻劃兩個(gè)或幾個(gè)具有鮮明性格的音樂形象和表達(dá)一個(gè)音樂形象的不同側(cè)面。又能促進(jìn)樂思形成連續(xù)不斷的發(fā)展,還能夠加強(qiáng)樂曲結(jié)構(gòu)上的統(tǒng)一性。6.1.6節(jié)拍對(duì)音樂風(fēng)格的影響當(dāng)音樂的節(jié)奏按照某種時(shí)值長度和輕重關(guān)系進(jìn)行有序的組織時(shí),就形成了節(jié)拍。所以,節(jié)拍即數(shù)列對(duì)音樂時(shí)值、節(jié)奏的邏輯組織?,F(xiàn)代音樂中的各種變節(jié)拍,也常反映為另外一些數(shù)列控制。如斯特拉文斯基的春之祭中就有等差數(shù)列節(jié)拍等,被西方視為現(xiàn)代手法。特定的節(jié)奏、節(jié)拍可能具備特定的體裁特征,如圓舞曲、馬祖卡、波羅奈茲都是三拍子,但圓舞曲的強(qiáng)拍在小節(jié)第一拍,馬祖卡的節(jié)拍重音在第二拍,而波羅奈茲的特定節(jié)奏更給人一些進(jìn)
17、行曲似的感受。從而也使三種舞曲獲得了完全不同的風(fēng)格特點(diǎn)和氣質(zhì)。6.2對(duì)各影響因素進(jìn)行主成分分析6.2.1模型的建立6.2.1.1主成分分析基本思想 主成分分析是數(shù)學(xué)上對(duì)數(shù)據(jù)降維的一種方法。其基本思想是設(shè)法將原來眾多的具有一定相關(guān)性的指標(biāo)(比如p個(gè)指標(biāo)),重新組合成一組新的互不相關(guān)的綜合指標(biāo)來代替原來指標(biāo)。通常數(shù)學(xué)上的處理就是將原來p個(gè)指標(biāo)作線性組合,作為新的綜合指標(biāo)。但是這種線性組合,如果不加限制,則可以有很多,應(yīng)該如何去選取呢?在所有的線性組合中所選取的F1應(yīng)該是方差最大的,故稱F1為第一主成分。如果第一主成分不足以代表原來p個(gè)指標(biāo)的信息,再考慮選取F2即選第二個(gè)線性組合。為了有效地反映原有
18、信息,F(xiàn)1已有的信息就不需要再出現(xiàn)在F2中,用數(shù)學(xué)語言表達(dá)就是要求Cov(F1,F(xiàn)2)0。稱F2為第二主成分,依此類推可以構(gòu)造出第三、第四、第p個(gè)主成分。6.2.1.2 主成分分析的數(shù)學(xué)模型 設(shè)有n個(gè)樣品(多元觀測(cè)值),每個(gè)樣品觀測(cè)p項(xiàng)指標(biāo)(變量):X1,X2,Xp,得到原始數(shù)據(jù)資料陣:其中Xi = (x1i,x2i,xni)',i = 1,2,p。用數(shù)據(jù)矩陣X的p個(gè)列向量(即p個(gè)指標(biāo)向量)X1,X2,Xp作線性組合,得綜合指標(biāo)向量:簡寫成:Fi = a1iX1 + a2iX2 +apiXp i = 1,2,p為了加以限制,對(duì)組合系數(shù)ai' = (a1i,a2i,api)作如下
19、要求:即:ai為單位向量:ai'ai = 1,且由下列原則決定: 1) Fi與Fj(ij, i, j = 1, , p)互不相關(guān),即Cov(Fi,F(xiàn)j) = 0,并有Var(Fi)=ai'ai,其中為X的協(xié)方差陣2) F1是X1,X2,Xp的一切線性組合(系數(shù)滿足上述要求)中方差最大的,即,其中c = (c1,c2,cp)' F2是與F1不相關(guān)的X1,X2,Xp一切線性組合中方差最大的,F(xiàn)p是與F1,F(xiàn)2,F(xiàn)p-1都不相關(guān)的X1,X2,Xp的一切線性組合中方差最大的。滿足上述要求的綜合指標(biāo)向量F1,F(xiàn)2,F(xiàn)p就是主成分,這p個(gè)主成分從原始指標(biāo)所提供的信息總量中所提取的信
20、息量依次遞減,每一個(gè)主成分所提取的信息量用方差來度量,主成分方差的貢獻(xiàn)就等于原指標(biāo)相關(guān)系數(shù)矩陣相應(yīng)的特征值li,每一個(gè)主成分的組合系數(shù)ai' = (a1i,a2i,api)就是相應(yīng)特征值li所對(duì)應(yīng)的單位特征向量ti。方差的貢獻(xiàn)率為,ai越大,說明相應(yīng)的主成分反映綜合信息的能力越強(qiáng)。6.2.1.3主成分分析的步驟(1) 計(jì)算協(xié)方差矩陣計(jì)算樣品數(shù)據(jù)的協(xié)方差矩陣: = (sij)p´p,其中 i,j = 1,2,p(2) 求出的特征值及相應(yīng)的特征向量 求出協(xié)方差矩陣的特征值l1³l2³lp>0及相應(yīng)的正交化單位特征向量:則X的第i個(gè)主成分為Fi = ai&
21、#39;X i = 1,2,p。(3) 選擇主成分 在已確定的全部p個(gè)主成分中合理選擇m個(gè)來實(shí)現(xiàn)最終的評(píng)價(jià)分析。一般用方差貢獻(xiàn)率解釋主成分Fi所反映的信息量的大小,m的確定以累計(jì)貢獻(xiàn)率達(dá)到足夠大(一般在85%以上)為原則。(4) 計(jì)算主成分得分計(jì)算n個(gè)樣品在m個(gè)主成分上的得分:, i = 1,2,m(5) 標(biāo)準(zhǔn)化實(shí)際應(yīng)用時(shí),指標(biāo)的量綱往往不同,所以在主成分計(jì)算之前應(yīng)先消除量綱的影響。消除數(shù)據(jù)的量綱有很多方法,常用方法是將原始數(shù)據(jù)標(biāo)準(zhǔn)化,即做如下數(shù)據(jù)變換:其中,j = 1,2,p。標(biāo)準(zhǔn)化后的數(shù)據(jù)陣記為X*,其中每個(gè)列向量(標(biāo)準(zhǔn)化變量)的均值為0,標(biāo)準(zhǔn)差為1,數(shù)據(jù)無量綱。標(biāo)準(zhǔn)化后變量的協(xié)方差矩陣(
22、Covariance Matrix) = (sij)p´p,即原變量的相關(guān)系數(shù)矩陣(Correlation Matrix)R= (rij)p´p:i,j = 1,2,p此時(shí)n個(gè)樣品在m個(gè)主成分上的得分應(yīng)為:Fj = a1jX1* + a2jX2* +.+ apjXp* j = 1,2,m6.2.2模型的求解利用spss軟件,我們進(jìn)行分析:從碎石圖可以看出,與特定樂曲聯(lián)系最為密切的是旋律和音高。當(dāng)旋律和音高確定了,無論演奏的音色如何,速度快慢,音量大小,聽者都能辨認(rèn)出樂曲,所以旋律和音高是比較適當(dāng)?shù)囊魳诽卣?。需要注意的是,絕對(duì)的音高不能作為音樂特征,因?yàn)橥粯非强梢砸普{(diào)演奏
23、的;同樣地,節(jié)奏速度的改變也不能作為音樂特征,因?yàn)橥瑯拥臉非葑嗟乃俣纫矔?huì)有變化。6.3用matlab進(jìn)行音樂特征提取6.3.1利用FFT進(jìn)行頻譜分析若信號(hào)本身是有限長的序列,計(jì)算序列的頻譜就是直接對(duì)序列進(jìn)行FFT運(yùn)算求得,就代表了序列在之間的頻譜值。幅度譜 相位譜 若信號(hào)是模擬信號(hào),用FFT進(jìn)行譜分析時(shí),首先必須對(duì)信號(hào)進(jìn)行采樣,使之變成離散信號(hào),然后就可按照前面的方法用FFT來對(duì)連續(xù)信號(hào)進(jìn)行譜分析。按采樣定理,采樣頻率應(yīng)大于2倍信號(hào)的最高頻率,為了滿足采樣定理,一般在采樣之前要設(shè)置一個(gè)抗混疊低通濾波器。用FFT對(duì)模擬信號(hào)進(jìn)行譜分析的方框圖如下所示??够殳B低通濾波器采樣T=1/fsN點(diǎn)FFT截
24、取20秒時(shí)長的鄉(xiāng)村音樂,得到波形和頻譜圖如下:6.3.2特征提取分析上文中我們知道了與特定樂曲聯(lián)系最為密切的是旋律和音高。根據(jù)旋律的不同,可將音樂分為平緩部分、高潮等部分,決定音樂風(fēng)格的基本是高潮部分,如高潮出現(xiàn)的時(shí)間、次數(shù),以及強(qiáng)度等。特征的提取的工作就實(shí)際上就可以是一個(gè)分類的過程:將每一個(gè)幀分類,將高潮部分和相對(duì)激烈的幀提取出來作為特征向量。首先,將音樂劃分為一系列的幀,對(duì)每一個(gè)幀用下式計(jì)算FE:根據(jù),計(jì)算得到靜音閾值,并依次閾值對(duì)FE進(jìn)行過濾,剩下的片段認(rèn)為是非背景聲。6.3.3特征提取結(jié)果我們選取了15個(gè)音樂片段進(jìn)行實(shí)驗(yàn),每段音樂截取20秒時(shí)長進(jìn)行分析,依據(jù)以上算法得到的結(jié)果畫出分布圖
25、如下:圖中,紅色圓點(diǎn)表示Piano樣本;綠色方塊表示Rock樣本;藍(lán)色星號(hào)表示Pop樣本??梢钥吹?,由于Piano風(fēng)格的音樂相對(duì)比較舒緩,“高潮”部分就比較稀疏,而且距離的方差較大;而與其風(fēng)格截然不同的Rock風(fēng)格的音樂節(jié)奏比較緊快,“高潮”迭起,表現(xiàn)為高潮段落之間相隔較短,距離方差也相對(duì)較小。上圖的結(jié)果正好符合這樣的分析。 從圖中還可以看到,各種不同風(fēng)格類型的音樂其特征向量雖然差別較大,但有明顯的聚簇。從而證明了這樣提取出來的特征向量是有效的。6.4基于BP神經(jīng)網(wǎng)絡(luò)的分類算法6.4.1 BP神經(jīng)網(wǎng)絡(luò)介紹BP神經(jīng)網(wǎng)絡(luò)是一種多層前饋神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)的主要特點(diǎn)是信號(hào)前向傳遞,誤差反向傳播。在前向傳
26、遞中,輸入信號(hào)從輸入層經(jīng)隱含層逐層處理,直至輸出層。每一層的神經(jīng)元狀態(tài)只影響下一層神經(jīng)元狀態(tài)。如果輸出層得不到期望輸出,則轉(zhuǎn)入反向傳播,根據(jù)預(yù)測(cè)誤差調(diào)整網(wǎng)絡(luò)權(quán)值和閾值,從而使BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)輸出不斷逼近期望輸出。BP神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)如圖所示。,是BP神經(jīng)網(wǎng)絡(luò)的輸入值,是BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)值,和為BP神經(jīng)網(wǎng)絡(luò)權(quán)值。從圖可以看出,BP神經(jīng)網(wǎng)絡(luò)可以看成一個(gè)非線性函數(shù),網(wǎng)絡(luò)輸入值和預(yù)測(cè)值分別為該函數(shù)的自變量和因變量。當(dāng)輸入節(jié)點(diǎn)數(shù)為n,輸出節(jié)點(diǎn)數(shù)為m時(shí),BP神經(jīng)網(wǎng)絡(luò)就表達(dá)了從n個(gè)自變量到m個(gè)因變量的函數(shù)映射關(guān)系。6.4.2 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練步驟BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)前首先要訓(xùn)練網(wǎng)絡(luò),通過訓(xùn)練使網(wǎng)絡(luò)具有聯(lián)想記
27、憶和預(yù)測(cè)能力。BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程包括以下幾個(gè)步驟。步驟1:網(wǎng)絡(luò)初始化。根據(jù)系統(tǒng)輸入輸出序列(X,Y)確定網(wǎng)絡(luò)輸入層節(jié)點(diǎn)數(shù)n、隱含層節(jié)點(diǎn)數(shù)l,輸出層節(jié)點(diǎn)數(shù)m,初始化輸入層、隱含層和輸出層神經(jīng)元之間的連接權(quán)值,初始化隱含層閾值a,輸出層閾值b,給定學(xué)習(xí)速率和神經(jīng)元激勵(lì)函數(shù)。步驟2:隱含層輸出計(jì)算。根據(jù)輸入向量X,輸入層和隱含層間連接權(quán)值以及隱含層閾值a,計(jì)算隱含層輸出H。 式中,l為隱含層節(jié)點(diǎn)數(shù);f為隱含層激勵(lì)函數(shù),該函數(shù)有多種表達(dá)形式,本文所選函數(shù)為:步驟3:輸出層輸出計(jì)算。根據(jù)隱含層輸出H,連接權(quán)值和閾值b,計(jì)算BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)輸出O。 步驟4:誤差計(jì)算。根據(jù)網(wǎng)絡(luò)預(yù)測(cè)輸出O和期望輸出Y,計(jì)
28、算網(wǎng)絡(luò)預(yù)測(cè)誤差e。 步驟5:權(quán)值更新。根據(jù)網(wǎng)絡(luò)預(yù)測(cè)誤差e更新網(wǎng)絡(luò)連接權(quán)值和。 式中,為學(xué)習(xí)速率。步驟6:閾值更新。根據(jù)網(wǎng)絡(luò)預(yù)測(cè)誤差e更新網(wǎng)絡(luò)節(jié)點(diǎn)閾值a,b。 步驟7:判斷算法迭代是否結(jié)束,若沒有結(jié)束,返回步驟2。6.4.3 BP神經(jīng)網(wǎng)絡(luò)語音特征信號(hào)分類下面我們選取了民歌、古箏、搖滾和流行四類,用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行分類。基于BP神經(jīng)網(wǎng)絡(luò)的語音特征信號(hào)分類算法建模包括BP神經(jīng)網(wǎng)絡(luò)構(gòu)建、BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練和BP神經(jīng)網(wǎng)絡(luò)分類三步,算法流程如圖所示。BP神經(jīng)網(wǎng)絡(luò)構(gòu)建根據(jù)系統(tǒng)輸入輸出數(shù)據(jù)特點(diǎn)確定BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),由于語音特征輸入信號(hào)有24維,待分類的語音信號(hào)共有4類,所以BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)24-25 4,即
29、輸入層有24個(gè)節(jié)點(diǎn),隱含層有25個(gè)節(jié)點(diǎn),輸出層有4個(gè)節(jié)點(diǎn)。BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練用訓(xùn)練數(shù)據(jù)訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)。共有2000組語音特征信號(hào),從中隨機(jī)選擇1500組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò),500組數(shù)據(jù)作為測(cè)試數(shù)據(jù)測(cè)試網(wǎng)絡(luò)分類能力。BP神經(jīng)網(wǎng)絡(luò)分類用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)對(duì)測(cè)試數(shù)據(jù)所屬語音類別進(jìn)行分類。6.4.4 歸一化處理數(shù)據(jù)歸一化方法是神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)前對(duì)數(shù)據(jù)常做的一種處理方法。數(shù)據(jù)歸一化處理把所有數(shù)據(jù)都轉(zhuǎn)化為0,1之間的數(shù),其目的是取消各維數(shù)數(shù)據(jù)間數(shù)量級(jí)差別,避免因?yàn)檩斎胼敵鰯?shù)據(jù)數(shù)量級(jí)差別較大而造成網(wǎng)絡(luò)預(yù)測(cè)誤差較大。數(shù)據(jù)歸一化的方法主要有以下兩種。(1)最大最小法。函數(shù)形式如下:式中,為數(shù)據(jù)序列中的最小數(shù);為
30、序列中的最大數(shù)。(2)平均數(shù)方差法。函數(shù)形式如下:式中,為數(shù)據(jù)序列的均值;為數(shù)據(jù)的方差。本文采用第一種數(shù)據(jù)歸一化方法。 6.4.5 結(jié)果分析用訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)分類語音特征信號(hào)測(cè)試數(shù)據(jù),BP神經(jīng)網(wǎng)絡(luò)分類誤差和神經(jīng)網(wǎng)絡(luò)分類正確率如圖所示??梢钥闯觯珺P神經(jīng)網(wǎng)絡(luò)的語音信號(hào)分類算法具有較高的準(zhǔn)確性,能夠準(zhǔn)確識(shí)別出語音信號(hào)所屬的類別,說明了BP神經(jīng)網(wǎng)絡(luò)在音樂分類上的有效性。七、模型的優(yōu)缺點(diǎn)7.1層次分析法的優(yōu)缺點(diǎn)優(yōu)點(diǎn):1.系統(tǒng)性的分析方法;2.簡潔實(shí)用的決策方法;3.所需定量數(shù)據(jù)信息較少。缺點(diǎn):1.不能為決策提供新方案;2.定量數(shù)據(jù)較少,定性成分多,不易令人信服;3.指標(biāo)過多時(shí)數(shù)據(jù)統(tǒng)計(jì)量大,且權(quán)重難以確定。7.2主成分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 食品承包分銷合同范例
- 高企服務(wù)合同范例
- 出口委托加工合同范例
- 樓盤推銷合同范例
- 青海師范大學(xué)《工程數(shù)學(xué)A》2023-2024學(xué)年第一學(xué)期期末試卷
- 青海農(nóng)牧科技職業(yè)學(xué)院《證券投資技術(shù)分析》2023-2024學(xué)年第一學(xué)期期末試卷
- 購買技術(shù)定金合同范例
- 商業(yè)規(guī)劃合同范例
- 多媒體合同范例
- 事業(yè)單位資產(chǎn)處置合同范例
- 國際商務(wù)談判 袁其剛課件 第四章-國際商務(wù)談判的結(jié)構(gòu)和過程
- 國際商法教案(20092新版)
- 江蘇開放大學(xué)漢語作為第二語言教學(xué)概論期末復(fù)習(xí)題
- 貨物質(zhì)量保證措施
- 工作簡化方法改善與流程分析課件
- 國家開放大學(xué)《管理學(xué)基礎(chǔ)》形考任務(wù)1-4參考答案
- 道德與法治《健康看電視》優(yōu)秀課件
- 急性胰腺炎完整版課件
- 雙絞線鏈路測(cè)試報(bào)告
- 《建筑工程類別劃分標(biāo)準(zhǔn)》-全
- 工藝變更通知單
評(píng)論
0/150
提交評(píng)論