智能音箱聲場自適應(yīng)定位系統(tǒng)設(shè)計與實(shí)現(xiàn)_第1頁
智能音箱聲場自適應(yīng)定位系統(tǒng)設(shè)計與實(shí)現(xiàn)_第2頁
智能音箱聲場自適應(yīng)定位系統(tǒng)設(shè)計與實(shí)現(xiàn)_第3頁
智能音箱聲場自適應(yīng)定位系統(tǒng)設(shè)計與實(shí)現(xiàn)_第4頁
智能音箱聲場自適應(yīng)定位系統(tǒng)設(shè)計與實(shí)現(xiàn)_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

智能音箱聲場自適應(yīng)定位系統(tǒng)設(shè)計與實(shí)現(xiàn)【摘要】隨著信息技術(shù)的快速發(fā)展,人們對于音視頻環(huán)境也有了更高的要求,伴隨著互聯(lián)網(wǎng)技術(shù)的崛起,超高清視頻空前發(fā)展,而市場急需與之匹配的能夠?qū)崿F(xiàn)根據(jù)聽音環(huán)境而自動匹配的智能音箱系統(tǒng)。開發(fā)一種能自動識別聲場環(huán)境,調(diào)整音箱聲道音量、聲道平衡及聲場定位,精準(zhǔn)設(shè)置視覺與聽覺同步,讓聽音者所在位置自適應(yīng)調(diào)整為俗稱“皇帝位”的最佳效果位置,實(shí)現(xiàn)聲場精準(zhǔn)定位的智能音頻產(chǎn)品。結(jié)合互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、AI人工智能技術(shù),產(chǎn)業(yè)發(fā)展,開發(fā)出國內(nèi)先進(jìn)智能音頻系列產(chǎn)品,提升產(chǎn)品品質(zhì)與檔次。實(shí)現(xiàn)智能音頻產(chǎn)品市場占有率提升,以點(diǎn)帶面,帶動智能音頻產(chǎn)業(yè)快速發(fā)展,增強(qiáng)國際競爭能力,帶動產(chǎn)業(yè)經(jīng)濟(jì)發(fā)展?!娟P(guān)鍵詞】物聯(lián)網(wǎng);超高清視頻;智能音箱;智能音頻產(chǎn)品;聲場定位;聲像定位;數(shù)字娛樂。當(dāng)今萬物互聯(lián)的信息時代,智能手機(jī)、互網(wǎng)絡(luò)、物聯(lián)網(wǎng)等萬物互聯(lián)的載體已經(jīng)滲入到我們生活的方方面面,無處不在,遠(yuǎn)程辦公、AI虛擬現(xiàn)實(shí)、數(shù)字娛樂等新興產(chǎn)業(yè)更是如雨后春筍般蓬勃發(fā)展。而這些在越來越逼真的超高清視頻顯示,在用戶體驗高逼真視覺享受的同時,對聲像同步的聽覺享受追求更加強(qiáng)烈。然而,我國的音頻產(chǎn)業(yè)發(fā)展比快速發(fā)展的超高清視頻技術(shù)發(fā)展相對滯后,為了享受高逼真視覺與聽覺聲像同步體驗,必須購買昂貴的專業(yè)音響,并且人工調(diào)試音箱擺放位置、聽音者位置才能真正享受聲像同步的震撼效果。相應(yīng)的調(diào)試需要專業(yè)人員才能完成,消費(fèi)者無法做到,制約了高保真高端音箱的普及。隨著人工智能、人臉識別技術(shù)的發(fā)展,使自適應(yīng)調(diào)整聲像最佳效果位置得以實(shí)現(xiàn),利用人臉識別技術(shù),能夠確定人的位置,通過音箱系統(tǒng)麥克風(fēng)單元收集聽音環(huán)境聲波反射數(shù)據(jù)、DSP處理器,調(diào)整聲道平衡、數(shù)字濾波、調(diào)整混響效果、確定聲場相位、精準(zhǔn)自適應(yīng)定位,隨時都能享受聲像同步逼真的數(shù)字娛樂帶來的高品質(zhì)享受。、智能音箱聲場自適應(yīng)定位系統(tǒng)的設(shè)計原理為讓本自適應(yīng)定位系統(tǒng)能精準(zhǔn)判斷所在聽音環(huán)境聲波放射狀況,先短按音箱系統(tǒng)的功能按鍵,播放音箱系統(tǒng)預(yù)先錄制一段掃頻信號,有麥克風(fēng)采集直達(dá)聲與方式聲,并將這些信息輸入系統(tǒng)Soc處理器,經(jīng)過計算確定最佳聽音條件,調(diào)整音箱左右聲道平衡度、音箱大小,使聽音者達(dá)到聲像最佳效果位置,以便滿足聽音者所需的“皇帝位”,達(dá)到聲像精準(zhǔn)定位效果。本文中Soc處理器控制系統(tǒng)的設(shè)計原理是在Android或其他操作系統(tǒng)的軟件環(huán)境下進(jìn)行軟件編寫。二、智能音箱聲場自適應(yīng)定位系統(tǒng)的硬件設(shè)計硬件系統(tǒng)框圖如圖1所示。圖1系統(tǒng)硬件設(shè)計圖1智能音箱聲場自適應(yīng)定位系統(tǒng)的硬件是由主機(jī)與音箱系統(tǒng)組成,其中主機(jī)主要由Soc處理器、電源、攝像頭、WiFi/BT、模數(shù)轉(zhuǎn)換器、DDR/eMMC、功能按鍵、功率放大器等組成,音箱系統(tǒng)為無源音箱組成。其中輸入電源經(jīng)降壓后一路經(jīng)開關(guān)后供功率放大器供電,另一路經(jīng)過DC/DCbuck降壓為5V,再經(jīng)低壓電壓Buck調(diào)整為Soc處理器需要的各種電壓,最終形成穩(wěn)定的電壓供Soc處理器及周邊電路模塊使用。攝像頭采集各種信息后輸入給Soc處理器分析處理并經(jīng)過預(yù)先編程的特定算法分析處理,再調(diào)整內(nèi)置DSP的功率放大器音效參數(shù),實(shí)現(xiàn)聲音精準(zhǔn)定位,精準(zhǔn)自適應(yīng)定位,聲像同步逼真的數(shù)字娛樂享受。(一) 電源電路設(shè)計在設(shè)計電源電路時可以根據(jù)Soc處理器及周邊電路所需求的電壓值,設(shè)計不同的Buck調(diào)壓器輸出不同的電壓提供系統(tǒng)所需電源。(二) 自適應(yīng)環(huán)境調(diào)整音效設(shè)計通過圖1所示按鍵或麥克風(fēng)輸入語音指令,播放預(yù)先存儲與Soc存儲器的一段20Hz至20KHz掃頻信號,經(jīng)揚(yáng)聲器發(fā)出聲音、經(jīng)過環(huán)境發(fā)射回來的聲波后,再有麥克風(fēng)錄音,錄制到Soc處理器經(jīng)模數(shù)轉(zhuǎn)換成數(shù)字信號進(jìn)行分析比對直接錄音與經(jīng)反射后的聲音,建立所在的聽音環(huán)境模型,以此為依據(jù),調(diào)整功放音效達(dá)到與環(huán)境最佳匹配效果。實(shí)現(xiàn)自動自適應(yīng)調(diào)整功放音效達(dá)到與環(huán)境最佳匹配效果,達(dá)到自適應(yīng)聲場定位。三、智能音箱聲場自適應(yīng)定位系統(tǒng)的軟件設(shè)計聲場定位關(guān)鍵的因素是聽音環(huán)境的直達(dá)聲,直達(dá)聲越多定位越清晰,但是,要達(dá)到好的聽音體驗,需要合適的混響效果,就必須平衡反射聲與直達(dá)聲的比例。Soc處理器改進(jìn)了信號處理能力。將降噪消回音麥克風(fēng)陣列算法、環(huán)繞聲立體聲音效算法、聲場定位算法等存儲于Flash內(nèi),Soc處理器對采集的外部信息計算分析,以此為依據(jù)進(jìn)行精準(zhǔn)控制功率放大器內(nèi)置DSP音量、聲道平衡度、混響效果、環(huán)繞效果等,達(dá)到聲場精準(zhǔn)定位的目的。(一)語音降噪及環(huán)境聲波反射參數(shù)采集處理要想通過軟件實(shí)現(xiàn)對音箱功放參數(shù)調(diào)整,首先要對音箱所處聽音環(huán)境聲波反射參數(shù)、環(huán)境混響效果進(jìn)行信號采集建模,以便進(jìn)一步優(yōu)化處理。如圖2所示,通過對喇叭輸出實(shí)時信號回踩,經(jīng)模數(shù)轉(zhuǎn)換成數(shù)字信號,輸入Soc處理器,再根據(jù)輸入與輸出的變量函數(shù)由預(yù)先編程的語音降噪算法,降噪、消回音,以便麥克風(fēng)能有效識別輸入的語音指令,執(zhí)行所需要的功能指令,同時麥克風(fēng)接收喇叭發(fā)出的播放的20Hz-20KHz掃頻信號,以及經(jīng)環(huán)境放射后回傳的信號,比對建模,以此為依據(jù),調(diào)整Soc與DSP數(shù)字功放音效參數(shù),最終實(shí)現(xiàn)聲場的精準(zhǔn)定位。(二) 人臉識別算法設(shè)計通過上述方法建立聽音環(huán)境模型及聲場環(huán)境參數(shù)后,要想聽音者獲得最佳的聽音效果,必須知道聽音者所處環(huán)境先對位置,以便進(jìn)一步細(xì)調(diào)音效參數(shù)。圖2所示,攝像頭捕捉到聽音者信息后,送Soc處理器分析處理,通過人臉識別技術(shù)可以很快定位聽音者與各音箱相對位置,為上述調(diào)整音效參數(shù)提供了依據(jù)。(三) 聲場定位處理流程為了理解聲場定位原理,首先需要了解影響聲場定位的主要因素:1人可以通過雙耳效應(yīng)定位,利用雙耳接收到的聲音到達(dá)左右耳朵時間差別,再通過腦神經(jīng)系統(tǒng)構(gòu)建的3D虛擬空間定位聲音所處空間位置。2人腦可以通過聲強(qiáng)效應(yīng)來判斷聲源位置,如果一人的左右耳中心為中軸線,左右耳收到的聲音強(qiáng)度一樣大,人腦可以判斷聲源在正前方,如果右耳聲音強(qiáng)度比左耳大,人腦能感知聲音在右側(cè),同理也可以感知聲音左側(cè)的場景。3相位差也是影響聲場定位的重要因素。人耳對于800Hz到10KHz頻率方位感比較敏感,而低于700Hz頻率聲波方位感不敏感。4人耳的“耳郭效應(yīng)”對聲場定位也起到了關(guān)鍵作用,這種影響通常在4KHz以上頻率比較明顯。5人耳對聲場定位,通常1.4KHz以上對聲音強(qiáng)度影響比較大,對于1.4KHz以下,時間差對判斷聲場定位影響比較大。根據(jù)上述影響聲場定位的主要因素,軟件處理流程如下:如圖2所示,音頻信號經(jīng)EqualizerEQ調(diào)整,音量調(diào)整,經(jīng)多段DRC自動增益控制減少失真處理,經(jīng)AGL自動增益限制,經(jīng)THD&MakeupGain失真度與增益精細(xì)調(diào)整,根據(jù)聲場定位算法處理,輸出信號給Amp功率放大器,最后經(jīng)喇叭實(shí)現(xiàn)電能與聲能轉(zhuǎn)換。要實(shí)現(xiàn)環(huán)境自適應(yīng)定位功能,首先可以通過語音或功能按鍵方式,讓系統(tǒng)預(yù)播放一段預(yù)測在內(nèi)存的20Hz—20KHz掃頻信號,通過麥克風(fēng)采樣喇叭信號,經(jīng)數(shù)模轉(zhuǎn)換后送Soc處理器,Soc處理器軟件虛擬的計量器,可以測試反射聲與直達(dá)聲的時間差,通過Cameras模塊人臉識別,確定人處于系統(tǒng)先對位置,最后由Soc小系統(tǒng)ControlSignal控制信號控制系統(tǒng)各電路模塊參數(shù),使聲音定位準(zhǔn)確,輸出高品質(zhì)音質(zhì)效果。1.智能音箱聲場自適應(yīng)定位系統(tǒng)設(shè)計的實(shí)現(xiàn)為了實(shí)現(xiàn)音箱聲場自適應(yīng)定位,本系統(tǒng)通過聲場定位算法技術(shù),實(shí)現(xiàn)自適應(yīng)精準(zhǔn)定位。在高清視頻的數(shù)字娛樂環(huán)境下,人們對音質(zhì)的要求越來越高,必須滿足聲音定位準(zhǔn)確、聲像同步,而傳統(tǒng)音箱技術(shù)需要專業(yè)人員經(jīng)過繁瑣的調(diào)試,無法滿足市場需求。使音箱成為實(shí)現(xiàn)高品質(zhì)的萬物互聯(lián)新時代的聲音為入口,解決傳統(tǒng)音箱系統(tǒng)聲音受環(huán)境影響而導(dǎo)致聲場定位不準(zhǔn)的問題,使音頻發(fā)展得到質(zhì)的飛躍。結(jié)語:在當(dāng)今萬物互聯(lián)的信息環(huán)境下,智能音箱快速發(fā)展,使傳統(tǒng)的音箱技術(shù)得到了革命性的突破。通過對聽音環(huán)境的反射情況進(jìn)行建模,精細(xì)化處理音效,彌補(bǔ)了超高清視頻等虛擬現(xiàn)實(shí)對高品質(zhì)聲像定位的不足。從而滿足人們對高逼真音視頻的需求,適應(yīng)數(shù)字娛樂高速發(fā)展的需求,拓展該領(lǐng)域產(chǎn)品海外市場,創(chuàng)造高額經(jīng)濟(jì)利益。通過該項技術(shù)的智能音箱產(chǎn)品的推廣與普及,使以聲音為入口的萬物互聯(lián)的數(shù)字娛樂向高品質(zhì)的超高清視頻看齊,從而推動數(shù)字娛樂產(chǎn)業(yè)快速發(fā)展,促進(jìn)我國經(jīng)濟(jì)發(fā)展。參考文獻(xiàn)肖景和,趙健,高保真音響電路與家庭影院迎新系統(tǒng).人民郵電出版社2000,I

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論