互聯(lián)網實時語音通信技術的研究_第1頁
互聯(lián)網實時語音通信技術的研究_第2頁
互聯(lián)網實時語音通信技術的研究_第3頁
互聯(lián)網實時語音通信技術的研究_第4頁
互聯(lián)網實時語音通信技術的研究_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、互聯(lián)網實時語音通信技術的研究互聯(lián)網實時語音通信技術的研究1引言Internet在全世界范圍內的快速開展和語音信號處理技術的進步,促進了vP(IP網絡下的語音技術)業(yè)務的興起。由于VIP務以傳統(tǒng)的Iternet為根本平臺,具有不可比較的價格優(yōu)勢,因此開展前景非常廣闊。我門通過設計的兩臺計算機間的語音通信軟件,實現(xiàn)了全雙上語音通信信。P-P的語音傳輸,需要麥克風、音響。聲卡本文由論文聯(lián)盟.LL.搜集整理等設備就可以通過IP網實現(xiàn)這種應用。這種VIP方案的顯著優(yōu)點就是可以支持多媒體通信,主要適用于計算機用戶。其原理是利用 軟件把送入話筒的聲音進展編碼壓縮、分組,變成IP數據報,經Inteet網絡傳送

2、;接收端利用軟件進展解碼,復原成原來的信號后送到揚聲器中。由于軟件所需要的設備較為簡單,尤其是隨著計算機的日益普及、各種硬件設備不斷開展;局域網不斷增加;通信信道容量不斷增加;計算機PU處理才能不斷增強;具有人工智能的可即插即用軟件代碼技術的出現(xiàn)等等,這些郡為VIP的開展提供了強有力的技術支持。在以上處理過程中,要用到一系列的網絡接口以及緩沖區(qū)來處理數據,但是當前還沒有一種固定的和通用的策略可以完全解決VlP應用中的QS問題。本文就存在的問題進展了分析,并給出了一組解決問題的策略。2問題的提出(1)時延、抖動和丟包三者之間的關系從網絡的角度來看,時廷、抖動和丟包三省同時制約于網絡的運行狀況,當

3、網絡的效勞質量下降時,三者均迅速惡化,從終端處理的角度來看,時延。抖動和丟包三者之間又互相影響,比方:在終端處理中,為減小抖動帶來的影響,就要采用抗抖動緩沖區(qū),這就引入了額外的時延;為了減小遲到的語音包數量,可以延遲語音的回放,但也會引入額外的時延;為了采用丟包恢復技術,往往需要利用后續(xù)幀信息,這樣也就引入了一定的時延;假如抖動效應加強,勢必會引起遲到的語音包數量增多。為理解決好話音質量出問題,就必須在這三者當中效蝦權衡。(2)緩沖區(qū)機制對語音實時傳輸性能的影響緩沖區(qū)機制對語音實時傳輸性能的影響也就是對語音從采樣到回放這一時間延遲的影響,特別是當為了滿足內存分配的需求而挪動全局內存塊和拋棄可拋

4、棄的內存塊時,消耗的系統(tǒng)時間將對一些實時性操作產生嚴重影響,在語音實時通信中,用擴大內存的有效的頁面技術和磁盤交換技術將不再適用,因為這些語音數據塊不能放在真正的主存中以滿足實時性要求,需要通過設計數據構造和信息列表實現(xiàn)優(yōu)化的緩沖機制。同時緩沖機制對語音的連續(xù)性也有很大影響,假如定制的錄音緩沖區(qū)過小,就會使錄制的語音幀過小,從而使語音蠻得不連接。對內存資源的過度占用將導致系統(tǒng)資源的缺乏。因此需要一種既高效利用內存,又盡量減少語音傳輸時延的緩沖區(qū)管理機制。(3)網絡分組信息的喪失分組喪失對語音質量有非常大的不良影響。當語音經過個使用分組喪失作為手段來管理數據網絡阻塞的略由器的,這是很費事的。對于

5、TP的數據,端站簡單地重新發(fā)送喪失的數據并降低它們的通信速率,緩解阻塞,保證數據正確性,而對于UDP協(xié)議的語音,沒有時間進展重新發(fā)送,所以VlP系統(tǒng)只能適應這種喪失。除了由于中間網絡部件引起的分組喪失外,語音網絡中由于超出抖動緩沖區(qū)的可忍受的到達延時也引起分組喪失。在分組被喪失的情況下,假如語音分組喪失是隨機的、不相關的,當前的語音編碼器的聲碼器在分組喪失率小于10的情況下,簡單的方法是在喪失包的間隔處插入最后接收到的包,仍能恢復出質量可承受的語音信號。當然,也可以設計出優(yōu)化的緩沖區(qū),從而前向糾錯以減少對語音質量的影響。3網絡協(xié)議的選擇策略實時語音的特點:實時性要求高,且允許語音數據在一定的范

6、圍內出錯;IP語音的特點:由于IPV4不可以提供效勞質量保證,所以丟包率和抖動是不可預知的,并且把它們帶到了上層協(xié)議IPUDP中。TP的特點:能提供面向連接的流傳輸,可靠性很高,但是會占用網絡較多的資源;UDP的特點:能提供無連接的數據包傳輸,不可靠,對網絡的資源占用較少。由于TP在傳輸數據前建立的是虛鏈路,它不能保證各個語音包在相等的時間內到達,即無法防止話音抖動現(xiàn)象。而且當網絡狀況不佳時,也無法防止喪失語音包,即使重傳也有可能無法滿足語音的實坷性。更有甚者,它的窗口技術也會造成較大的附加抖動。至于UDP,那么有可能出現(xiàn)語音包的喪失、重復和失序(好在語音通信允許出錯),話音抖動現(xiàn)象也無法避(

7、比TP好),效率較TP要高。但需要在應用層增添排序、抗抖、抗重復和抗丟包等功能。所以,對于網絡時延較大的場合,一般選用UDP來傳輸語音包;而在網絡負載較小的場合,TP更為方便。如圖分別為TPAJDP編程時序圖。隨著IPv6的成熟應用,不僅用于解決In-ternet網絡地址的危機,而且在解決Internet網絡性能方面也有很大的打破;在4ESV中提供了對QS的支持,在IPv6中定義了兩個參數;業(yè)務類別域和數據流標志位。業(yè)務類別域將IP包的優(yōu)先級分為16級,優(yōu)先級分為兩類:0-7用于在網絡發(fā)生擁塞時通過減少數據包的發(fā)送速度來實現(xiàn)擁塞控制的業(yè)務;8-15用于一些實時性很強的業(yè)務,它在網絡擁塞時不作任

8、何減少流量的控制。對于那些需要特殊QS的業(yè)務,可在IP數據包中設置相應的優(yōu)先級,路由器根據IP包的優(yōu)先級來處理數據。因此,vIP將得到更好的應用。4緩沖區(qū)的設計謀略(1)發(fā)送端緩沖區(qū)的設計在語音發(fā)送端,語音采集時必需要申請緩沖區(qū),而且這種緩沖區(qū)既用作語音信號的輸入,又用作語音幀的輸出。假如采用單一緩沖區(qū)機制,將有可能出現(xiàn)數據覆蓋問題。數據發(fā)送操作中也存在此問題,實際應用必須通過實驗確定緩沖區(qū)的數目,既保證語音數據庫不喪失,又不會多用內存。決定發(fā)送緩沖區(qū)的數目的因素有兩個,一個是編碼緩沖區(qū)的數目;另一個是一個數據分組的發(fā)送的最長時間與一個數據分組的最短打包時間的比值,由于實際應用中,實時語音的傳

9、送一般采用非連接的網絡傳輸協(xié)議,所以發(fā)送緩沖區(qū)的數目可以小于或者等于編碼緩沖區(qū)的數目。決定編碼緩沖區(qū)的數目的因素有兩個,一個是錄音緩沖區(qū)的數據目;另一個是一個數據分組的最長打包時間與一個數據分組的最短編碼時間的比值,假如這個比值小于1,那么對編碼緩沖區(qū)的數目沒有特殊要求,假如大于1,那么要求有盡可能大的編碼緩沖區(qū)數目,但一般不要超過錄音緩沖區(qū)的數目,這是由語音數據的實時性和連續(xù)性所決定的。(2)接收端緩沖區(qū)數目在語音接收端必須有一組接收緩沖區(qū),理由有三:IP網絡阻塞狀況不穩(wěn)定,數據到達有時非常集中,而接收數據又會花費一定的時間,太少的緩沖區(qū)會造成數據的喪失;由于IP網絡只提供一種盡力型效勞,不

10、可防止地造成分組喪失和亂序,假如不加以處理,必然會影響實時語音的效果。而處理這些情況都需要存儲空間,表現(xiàn)為一定數目的緩沖區(qū);必須對接收到的數據進展后續(xù)的處理,而這些處理要產生一定的時延,假如只有一個接收緩沖區(qū),有可能接收到的數據來不及得到處理就被覆蓋了。另外,與語音發(fā)送方相對應,在語音接收方需要解碼緩沖區(qū)和回放緩沖區(qū)。由于網絡延遲抖動的存在和語音應用天然的等時性要求,必須對語音回放設定一個回放延遲,即按照一定的時間間隔回放語音幀,這就需要有一定數目的緩沖區(qū)來存放等待回放的語音鄭(3)緩沖區(qū)的大小錄音時,緩沖區(qū)大小的選擇也是一個關鍵性的問題。因為假如緩沖區(qū)過小,生成的語音幀也就會過小,語音的連續(xù)

11、性遭到破壞,同時數據分組的有效數據率也會過小,相對增加了網絡負擔。假如緩沖區(qū)過大,會在語音錄制時和其它處理時造成比較大的處理時延,還有可能造成發(fā)送的數據分組過大而導致某協(xié)議層的數據分割與合并,形成很大的傳輸時延。所以錄音緩沖區(qū)要選擇適宜的大小,必須在語音的連續(xù)性和時延之間進展平衡。編碼緩沖區(qū)的大小取決于錄音緩沖區(qū)的大小和所采用的編碼算法。實際應用中有可能采用不同的編碼算法,以適應多變的網絡傳輸狀況。緩沖區(qū)的大小要采用所需的最大值。計算方法如下:針對一個語音包,包長度RTP頭+UDP頭+IP頭+Etheet頭+有效載荷。其中RTP頭96bit(12byte);UDP頭=64bit(8byte);

12、IP頭=160bit(20byte);Ethernet頭=208bit(26byte)。所以,包長度(96+64+160+208)十有效載荷528bit+有效載荷。有效載荷打包周期(秒)x每秒的比特數帶寬包長度x每秒包數(528打包周期)+每秒比特數因此,要根據不同的語音編解碼技術,設計不同的緩沖區(qū):G711,每秒比特數是64kG729,每秒比特數是8kG723,兩種,一種是53k,另一種是63kG711,20s打包,帶寬為(52820+64)kbitsG711,30s打包,帶寬為(52830+64)kbitsG729,20s打包,帶寬為(52820+8)kbitsG723,53k,30s打包,帶寬為(52830+53)kbits(4)緩沖區(qū)的申請和釋放語音通信中對數據塊的使用是一次性的。在各個語音數據模塊中,一個數據塊只會在某個操作中作短暫緩存,處理之后,該數據塊對操作不再有任何意義。我們根據實時語音數據的需要,充分利用內存硬件

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論