無(wú)線(xiàn)傳感器海量數(shù)據(jù)處理_第1頁(yè)
無(wú)線(xiàn)傳感器海量數(shù)據(jù)處理_第2頁(yè)
無(wú)線(xiàn)傳感器海量數(shù)據(jù)處理_第3頁(yè)
無(wú)線(xiàn)傳感器海量數(shù)據(jù)處理_第4頁(yè)
無(wú)線(xiàn)傳感器海量數(shù)據(jù)處理_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第 卷 第 期 中國(guó)圖象圖形學(xué)報(bào) Vol. ,No. 200 年 月 Journal of Image and Graphics .,200WSN海量數(shù)據(jù)處理讀書(shū)報(bào)告楊立摘 要:目前對(duì)無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中的海量數(shù)據(jù)處理的研究大致分為基于海量數(shù)據(jù)的研究、基于數(shù)據(jù)處理的研究以及最終的分類(lèi)識(shí)別。在數(shù)據(jù)處理層面,人們主要的研究方向是對(duì)數(shù)據(jù)的特征提取與選擇,數(shù)據(jù)的融合技術(shù)。最終的分類(lèi)識(shí)別著重關(guān)注對(duì)特征進(jìn)行分類(lèi)識(shí)別或?qū)μ卣鬟M(jìn)行組合建模后分類(lèi)識(shí)別以達(dá)到最終的判定。而在對(duì)無(wú)線(xiàn)傳感器網(wǎng)絡(luò)所產(chǎn)生的海量數(shù)據(jù)的研究中,人們主要對(duì)數(shù)據(jù)流與海量數(shù)據(jù)的存儲(chǔ)做了深入細(xì)致的研究。本文通過(guò)對(duì)近年來(lái)WSN數(shù)據(jù)處理相關(guān)文獻(xiàn)的研讀對(duì)其海量

2、數(shù)據(jù)處理的整個(gè)過(guò)程進(jìn)行了一個(gè)系統(tǒng)的概述。關(guān)鍵詞 :特征提取與選擇 數(shù)據(jù)融合 WSN 流數(shù)據(jù) 模式識(shí)別0 引 言傳感器網(wǎng)絡(luò)中不論是傳感器的數(shù)量還是類(lèi)型都是多種多樣的,它包括目標(biāo)的探測(cè)、數(shù)據(jù)關(guān)聯(lián)、跟蹤識(shí)別、情況評(píng)估與預(yù)測(cè)幾個(gè)層面。目前對(duì)無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中的海量數(shù)據(jù)處理的研究大致分為基于海量數(shù)據(jù)的研究、基于數(shù)據(jù)處理的研究以及最終的分類(lèi)識(shí)別。在數(shù)據(jù)處理層面,人們主要的研究方向是對(duì)數(shù)據(jù)的特征提取與選擇,數(shù)據(jù)的融合技術(shù)。最終的分類(lèi)識(shí)別著重關(guān)注對(duì)特征進(jìn)行分類(lèi)識(shí)別或?qū)μ卣鬟M(jìn)行組合建模后分類(lèi)識(shí)別以達(dá)到最終的判定。而在對(duì)無(wú)線(xiàn)傳感器網(wǎng)絡(luò)所產(chǎn)生的海量數(shù)據(jù)的研究中,人們主要對(duì)數(shù)據(jù)流與海量數(shù)據(jù)的存儲(chǔ)做了深入細(xì)致的研究。1

3、數(shù)據(jù)處理在數(shù)據(jù)處理層面上主要分為兩部分,首先是對(duì)數(shù)據(jù)進(jìn)行特征的提取與選擇。這里的特征是對(duì)于不同信號(hào)來(lái)說(shuō)的。在無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中,其各類(lèi)傳感器所產(chǎn)生的信號(hào)類(lèi)型也是多種多樣的。因此對(duì)不同類(lèi)型的信號(hào)分別進(jìn)行特征的提取與選擇就顯得尤為重要了。其分析了各種特征的有效性并選出最有代表性的特征。這些特征有效地降低了特征空間的維度。其次是對(duì)數(shù)據(jù)的融合,無(wú)線(xiàn)傳感器網(wǎng)絡(luò)信息采集的過(guò)程中,會(huì)產(chǎn)生大量的冗余信息。為了使大量的通信帶寬和寶貴的能量資源得以節(jié)省,數(shù)據(jù)融合技術(shù)就顯得尤為重要了。1.1 特征的提取與選擇特征的提取與選擇直接面向目標(biāo)信號(hào)本身,是信息感知的第一步也是至關(guān)重要的一部。特征選擇的適當(dāng)與否直接影響到整個(gè)信

4、息處理系統(tǒng)的設(shè)計(jì)復(fù)雜度,并決定了系統(tǒng)的準(zhǔn)確性。1.1.1特征提取特征提取,即在原始特征中挑出一些有代表性分類(lèi)性能最好的特征。特征提取的方法有很多,總結(jié)起來(lái)可以歸為四大類(lèi) :基于基本統(tǒng)計(jì)方法的特征提取,基于模型的特征提取,基于變換的特征提取基于分形、維數(shù)的特征提取。通過(guò)這些特征提取后的特征矢量能夠達(dá)到較好的分類(lèi)效果。文獻(xiàn)1中介紹了一種基于小波包分析的拉索損傷聲發(fā)射信號(hào)特征提取方法,采用ANSYSKSDYNA模擬得到拉索損傷聲發(fā)射信號(hào)的仿真信號(hào),從小波包分解層次、特征頻帶數(shù)量的選擇及特征參數(shù)的噪聲魯棒性三個(gè)方面開(kāi)展了討論分析。小波包能量譜的特征參數(shù)具有較強(qiáng)的損傷類(lèi)型敏感性及噪聲魯棒性,當(dāng)選取合適的

5、小波包分解層次時(shí),可以在強(qiáng)噪聲影響下實(shí)現(xiàn)對(duì)拉索不同損傷類(lèi)型的判別。對(duì)于非平穩(wěn)性、非線(xiàn)性過(guò)程的信號(hào)處理,文獻(xiàn)2中提出一種基于經(jīng)驗(yàn)?zāi)B(tài)分解的目標(biāo)特征提取與選擇方法,可以自適應(yīng)地將信號(hào)的局部特征逐級(jí)分解出來(lái)。將本征模態(tài)函數(shù)IMF分量及其瞬時(shí)頻率作為特征,并選擇其判別熵作為特征向量的可分性度量。與小波變換相比IMF不需要預(yù)先設(shè)定基函數(shù),可根據(jù)信號(hào)自身的特征進(jìn)行分解,具有自適應(yīng)性,所得的本征模態(tài)分量突出了數(shù)據(jù)的局部特征,非常適用于非平穩(wěn)性G非線(xiàn)性過(guò)程的信號(hào)處理中。文獻(xiàn)3中提出了使用功率譜二次處理對(duì)地震信號(hào)進(jìn)行特征提取的方法。將經(jīng)典的語(yǔ)音特征處理算法根據(jù)地震信號(hào)的特點(diǎn)進(jìn)行有針對(duì)性的改進(jìn),通過(guò)對(duì)信號(hào)的功率譜

6、進(jìn)行二次處理, 實(shí)現(xiàn)了對(duì)信號(hào)功率譜及頻率的同時(shí)檢測(cè)。文獻(xiàn)4提出了利用最大熵ARBurg功率譜估計(jì)法對(duì)進(jìn)入無(wú)線(xiàn)傳感器網(wǎng)絡(luò)區(qū)域中的車(chē)輛信號(hào)進(jìn)行譜特征提取,具有很強(qiáng)的可操操作性、可重復(fù)性和參考性。文獻(xiàn)5 針對(duì)探地雷達(dá)的回波信號(hào)具有非平穩(wěn)特征 為實(shí)現(xiàn)非平穩(wěn)信號(hào)的檢測(cè)和分類(lèi)采用了二進(jìn)小波變換主分量分析與Fisher 線(xiàn)性判別分析和前饋多層感知器分類(lèi)器分別對(duì)探地雷達(dá)回波信號(hào)進(jìn)行小波分解去相關(guān)與特征選擇和分類(lèi),其克服了基于Fourier 變換的分析方法對(duì)非平穩(wěn)信號(hào)進(jìn)行特征提取時(shí)會(huì)平滑了非平穩(wěn)信號(hào)的局部特征從而導(dǎo)致其分類(lèi)效果不佳的缺點(diǎn),取得了一定的效果。文獻(xiàn)6在研究地面目標(biāo)聲震信號(hào)識(shí)別過(guò)程中提出基于局域判別(

7、Local Discriminant Bases,LDB)算法的特征提取方法。并且,針對(duì)現(xiàn)有的基于時(shí)頻能量圖的可分性測(cè)度的缺點(diǎn),提出新的基于概率密度估計(jì)的相對(duì)微分熵的可分性測(cè)度在一定程度上提高了目標(biāo)的正確識(shí)別率,降低了特征維數(shù)。文獻(xiàn)7在研究應(yīng)用最優(yōu)小波包變換的特征提取方法的過(guò)程中提出了應(yīng)用三種可分性準(zhǔn)則,即距離準(zhǔn)則,散度準(zhǔn)則和熵準(zhǔn)則選擇最優(yōu)基。三種可分性準(zhǔn)則比較而言,距離準(zhǔn)則簡(jiǎn)單直觀(guān),散度準(zhǔn)則更適用于正態(tài)分布模式,當(dāng)模式類(lèi)別具有同樣的均值時(shí)可使用熵準(zhǔn)則,并且使用這些準(zhǔn)則只需根據(jù)訓(xùn)練樣本集計(jì)算模式的兩個(gè)重要統(tǒng)計(jì)量,即均值和方差.但為獲得較穩(wěn)定的特征,需較大的訓(xùn)練樣本集。1.1.2特征選擇特征選擇

8、就是通過(guò)消除冗余、不相關(guān)及被噪聲污染的特征,從而達(dá)到降低特征空間維數(shù)的目的。它實(shí)際上就是從一個(gè)原始的特征集合中選取一個(gè)特征子集的過(guò)程。有時(shí)是采用某種變換技術(shù),得出數(shù)目比原來(lái)少的綜合性特征用于分類(lèi),這稱(chēng)為特征維數(shù)壓縮。特征選擇的過(guò)程如圖1所示,首先從原始特征集合中選出一個(gè)特征子集,然后通過(guò)評(píng)價(jià)函數(shù)對(duì)其進(jìn)行評(píng)價(jià),若滿(mǎn)足特征子集停止迭代的要求即停止,否則產(chǎn)生新的特征子集繼續(xù)迭代。特征的選擇主要分為兩個(gè)方面,一是特征選擇的標(biāo)準(zhǔn),二是特征子集的選擇算法。發(fā)圖1 特征選擇的過(guò)程特征選擇標(biāo)準(zhǔn)的作用實(shí)際上是對(duì)特征子向量好壞做一個(gè)界定??煞譃闉V波器型(Filter)、封裝型(Wrapper)、和混合型(Hybr

9、id)。濾波器型一般用特征子集的內(nèi)在特性來(lái)評(píng)估特征的好壞,如距離測(cè)度、相關(guān)性測(cè)度及一致性測(cè)度等。封裝型實(shí)質(zhì)上是一個(gè)分類(lèi)器,封裝器用選取的特征子集對(duì)樣本集進(jìn)行分類(lèi),分類(lèi)的精度作為衡量特征子集好壞的標(biāo)準(zhǔn)。而混合型算法則是濾波器型和封裝型的疊加。按照搜索方式的不同,特征選擇算法可分為完全搜索、序列搜索以及隨機(jī)搜索三類(lèi)?;谕耆阉鞯奶卣鬟x擇算法能保證找到最有的特征子集,但其計(jì)算十分復(fù)雜,很少應(yīng)用于實(shí)際工程中?;谛蛄兴阉鞯奶卣鬟x擇算法擁有最小的計(jì)算復(fù)雜度,對(duì)于搜索空間中只有單一極值的最優(yōu)問(wèn)題效果理想,而對(duì)多極值問(wèn)題容易陷入局部最優(yōu)點(diǎn)。隨機(jī)搜索的復(fù)雜度介于前兩者之間,且隨機(jī)搜索有助于擺脫局部最優(yōu)點(diǎn),目

10、前應(yīng)用最廣泛。1.2 數(shù)據(jù)融合技術(shù)由于大多數(shù)無(wú)線(xiàn)傳感器網(wǎng)絡(luò)應(yīng)用都是由大量傳感器節(jié)點(diǎn)構(gòu)成的,共同完成信息收集、目標(biāo)監(jiān)視和感知環(huán)境的任務(wù)。因此,在信息采集的過(guò)程中,采用各個(gè)節(jié)點(diǎn)單獨(dú)傳輸數(shù)據(jù)到匯聚節(jié)點(diǎn)的方法顯然是不合適的。因?yàn)榫W(wǎng)絡(luò)存在大量冗余信息,這樣會(huì)浪費(fèi)大量的通信帶寬和寶貴的能量資源。此外,還會(huì)降低信息的收集效率,影響信息采集的及時(shí)性。 為避免上述問(wèn)題,人們采用了一種稱(chēng)為數(shù)據(jù)融合(或稱(chēng)為數(shù)據(jù)匯聚)的技術(shù)。所謂數(shù)據(jù)融合是指將多份數(shù)據(jù)或信息進(jìn)行處理,組合出更高效、更符合用戶(hù)需求的數(shù)據(jù)的過(guò)程。在大多數(shù)無(wú)線(xiàn)傳感器網(wǎng)絡(luò)應(yīng)用當(dāng)中,許多時(shí)候只關(guān)心監(jiān)測(cè)結(jié)果,并不需要收到大量原始數(shù)據(jù),數(shù)據(jù)融合是處理該類(lèi)問(wèn)題的有效

11、手段。數(shù)據(jù)融合技術(shù)涉及到檢測(cè)技術(shù)、模式識(shí)別、決策論、不確定性理論、估計(jì)理論、最優(yōu)化理論等眾多學(xué)科領(lǐng)域。1.2.1 WSNs數(shù)據(jù)融合結(jié)構(gòu)目前對(duì)于無(wú)線(xiàn)傳感器網(wǎng)絡(luò)信息融合結(jié)構(gòu)的分類(lèi)還沒(méi)有一個(gè)明確的標(biāo)準(zhǔn)。文獻(xiàn)8中給出了一個(gè)基于信息表征層次的劃分,將其分為數(shù)據(jù)級(jí)融合、特征級(jí)融合、以及決策級(jí)融合。數(shù)據(jù)級(jí)融合,就是直接到采集的原始數(shù)據(jù)層上進(jìn)行融合。如圖2,這種融合的主要優(yōu)點(diǎn)是原始信息豐富。但其所要處理的傳感器數(shù)據(jù)量巨大,處理代價(jià)高。數(shù)據(jù)級(jí)融合的主要方法有:HIS變換、PCA變換、小波變換等。特征級(jí)融合屬于中間層次,它首先對(duì)來(lái)自傳感器的原始信息進(jìn)行特征提取,然后對(duì)特征信息進(jìn)行綜合分析和處理。如圖3所示,其實(shí)現(xiàn)

12、了可觀(guān)的信息壓縮,有利于實(shí)時(shí)處理,能最大限度地給出決策分析所需要的特征信息。目前大多數(shù)C3I系統(tǒng)的數(shù)據(jù)融合研究都是在該層次上展開(kāi)的。特征級(jí)融合的方法有:DempsterSharer推理法(DS方法)、表決法、神經(jīng)網(wǎng)絡(luò)法等。決策級(jí)融合是一種高層次的融合,其結(jié)果可為指揮控制與決策提供依據(jù)。如圖4所示,決策級(jí)融合是三級(jí)融合的最終結(jié)果,是直針對(duì)具體決策目標(biāo)的融合結(jié)果直接影響決策水平。目前,決策級(jí)數(shù)據(jù)融合方法主要有:貝葉斯估計(jì)法、專(zhuān)家系統(tǒng)、神經(jīng)網(wǎng)絡(luò)法、模糊集理論、可靠性理論以及邏輯模板法等。圖2 數(shù)據(jù)級(jí)融合圖3 特征級(jí)融合圖4 決策級(jí)融合文獻(xiàn)7中將數(shù)據(jù)融合層次結(jié)構(gòu)分為網(wǎng)絡(luò)層的數(shù)據(jù)融合、應(yīng)用層的數(shù)據(jù)融合、

13、獨(dú)立的數(shù)據(jù)融合層。其中網(wǎng)絡(luò)層的數(shù)據(jù)融合,WSN網(wǎng)絡(luò)層的數(shù)據(jù)融合主要采用以數(shù)據(jù)為中心的路由協(xié)議。優(yōu)點(diǎn)是:數(shù)據(jù)融合在路由過(guò)程中實(shí)現(xiàn),可以有效減少傳輸能耗和時(shí)延;問(wèn)題是:跨協(xié)議層理解應(yīng)用層數(shù)據(jù)的語(yǔ)義,會(huì)增大網(wǎng)絡(luò)層的數(shù)據(jù)融合計(jì)算量。應(yīng)用層的數(shù)據(jù)融合,基于查詢(xún)模式的數(shù)據(jù)融合算法是應(yīng)用層數(shù)據(jù)融合的研究方向,其算法思想是將WSN看作是一個(gè)分布式的數(shù)據(jù)庫(kù),采用分布式數(shù)據(jù)庫(kù)技術(shù)來(lái)收集數(shù)據(jù),應(yīng)用層接口與SQL相似。獨(dú)立的數(shù)據(jù)融合層,對(duì)多個(gè)數(shù)據(jù)包進(jìn)行合并,減少數(shù)據(jù)封裝頭部開(kāi)銷(xiāo)和MAC層的數(shù)據(jù)發(fā)送沖突來(lái)節(jié)省能耗。獨(dú)立的數(shù)據(jù)融合不能最大化網(wǎng)絡(luò)的生存時(shí)間,只是利用了數(shù)據(jù)融合減小MAC層的擁塞沖突。因此,獨(dú)立的數(shù)據(jù)融合技術(shù)

14、應(yīng)用還不是很廣泛。1.2.2數(shù)據(jù)融合方法分類(lèi)及研究現(xiàn)狀根據(jù)不同的融合規(guī)則,可分為不同的類(lèi)型,例如有損融合、無(wú)損融合、依賴(lài)于應(yīng)用的數(shù)據(jù)融合、獨(dú)立于應(yīng)用的數(shù)據(jù)融合、基于分布式數(shù)據(jù)庫(kù)的數(shù)據(jù)融合3、基于中心的數(shù)據(jù)融合等。下面從如何有效降低數(shù)據(jù)傳輸量和能量方面對(duì)WSN中現(xiàn)有的數(shù)據(jù)融合方法進(jìn)行分類(lèi),介紹其研究進(jìn)展情況。(1)、基于生成樹(shù)的數(shù)據(jù)融合在WSN中,匯聚節(jié)點(diǎn)在收集數(shù)據(jù)時(shí),是通過(guò)反向組播樹(shù)的形式從分散的傳感器節(jié)點(diǎn)逐步將監(jiān)測(cè)數(shù)據(jù)匯集起來(lái)的。從而達(dá)到減少網(wǎng)絡(luò)擁塞,降低能耗,減輕監(jiān)測(cè)延時(shí),增加數(shù)據(jù)包傳送速率的目的?,F(xiàn)有的基于生成樹(shù)的數(shù)據(jù)融合算法采用的主要是近源匯集(center at nearest so

15、urce,CNS)、最短路徑樹(shù)(shortestpaths tree,SPT)、貪婪增量樹(shù)(greedy incremental tree,GIT),以及對(duì)它們進(jìn)行的改進(jìn)算法。基于生成樹(shù)的數(shù)據(jù)融合方法雖然能夠?qū)崿F(xiàn)對(duì)傳輸?shù)臄?shù)據(jù)進(jìn)行融合的功能,但是有些問(wèn)題仍需關(guān)注。首先是生成樹(shù)的構(gòu)建和融合時(shí)機(jī)的確定問(wèn)Steiner樹(shù)比較適合事件驅(qū)動(dòng)的應(yīng)用。另外,基于WSN的特點(diǎn),有效的數(shù)據(jù)融合生成樹(shù)的構(gòu)造算法應(yīng)該具有時(shí)間復(fù)雜度低以及分布式的特點(diǎn)。其次,應(yīng)該考慮數(shù)據(jù)融合生成樹(shù)的維護(hù)問(wèn)題。當(dāng)節(jié)點(diǎn)失效時(shí),需要對(duì)生成樹(shù)進(jìn)行維護(hù)。生成樹(shù)的維護(hù)可采用周期性更新和事件觸發(fā)兩種方式。其實(shí),這個(gè)問(wèn)題就是如何平衡網(wǎng)絡(luò)能量消耗。而且,

16、維護(hù)這些數(shù)據(jù)融合結(jié)構(gòu)的能耗開(kāi)銷(xiāo)應(yīng)盡可能小。(2)、基于時(shí)空相關(guān)性的WSN數(shù)據(jù)融合 在WSN中,同一地點(diǎn)布置了許多傳感器,這些傳感器之間的相對(duì)距離較近,其觀(guān)察值在時(shí)間和空間上存在相關(guān)性,導(dǎo)致數(shù)據(jù)冗余現(xiàn)象。因此,如何消除多傳感器間的時(shí)空相關(guān)性。以降低網(wǎng)絡(luò)傳輸數(shù)據(jù)及節(jié)省網(wǎng)絡(luò)能量和開(kāi)銷(xiāo),值得研究。時(shí)間和空間上的這種相關(guān)性也是設(shè)計(jì)數(shù)據(jù)融合方法的主要依據(jù)。目前現(xiàn)有的文獻(xiàn)對(duì)時(shí)空相關(guān)性的WSN數(shù)據(jù)融合的研究大致分為兩類(lèi),一種是時(shí)間或空間融合模型,另一種是時(shí)間和空間相結(jié)合的融合模型。典型的時(shí)間融合模型是TiNA(temporal coherency-aware in-network aggregation)7,

17、它利用傳感器節(jié)點(diǎn)采集數(shù)據(jù)的時(shí)間一致性進(jìn)行網(wǎng)內(nèi)融合。其基本思想是,只有當(dāng)前采集的數(shù)據(jù)與上一次采集的數(shù)據(jù)的差值大于某個(gè)用戶(hù)指定的容忍限度時(shí),節(jié)點(diǎn)才進(jìn)行數(shù)據(jù)發(fā)送。這種方法對(duì)于監(jiān)測(cè)數(shù)據(jù)波動(dòng)較小的應(yīng)用十分有效,能夠顯著地減少網(wǎng)絡(luò)中的數(shù)據(jù)傳輸量。然而,當(dāng)監(jiān)測(cè)數(shù)據(jù)波動(dòng)較大時(shí),TiNA的作用就不是非常明顯了;而且TiNA對(duì)于節(jié)點(diǎn)存儲(chǔ)空間的要求比較高,尤其當(dāng)網(wǎng)絡(luò)規(guī)模較大時(shí),轉(zhuǎn)發(fā)節(jié)點(diǎn)需要保存大量的額外信息??臻g融合模型8應(yīng)用于WSN事件監(jiān)測(cè)。該模型完全用節(jié)點(diǎn)間距離遠(yuǎn)近來(lái)衡量節(jié)點(diǎn)觀(guān)測(cè)值間的相關(guān)程度,而實(shí)際上離事件源距離相同的節(jié)點(diǎn)的觀(guān)測(cè)值間的相關(guān)性更高。時(shí)空融合模型是消除時(shí)空相關(guān)性的數(shù)據(jù)融合研究的發(fā)展趨勢(shì),此類(lèi)模型主

18、要是對(duì)時(shí)間融合和空間融合進(jìn)行組合排序,融合性能不但取決于進(jìn)行時(shí)間與空間融合的先后次序,而且還與具體采用何種融合方法有關(guān),這些都需要做進(jìn)一步的定量分析。目前的研究主要有D-S證據(jù)理論進(jìn)行空間融合,沒(méi)有達(dá)到很好的節(jié)能與減少時(shí)延的效果,從而限制了其廣泛應(yīng)用。(3)、基于路由的WSN數(shù)據(jù)融合基于路由的WSN數(shù)據(jù)融合有兩個(gè)主要的目的,即尋找最佳路徑和對(duì)數(shù)據(jù)進(jìn)行融合、傳輸。目前WSN的主要路由協(xié)議有四種:數(shù)據(jù)為中心的路由協(xié)議、基于集群(Clustering)結(jié)構(gòu)的路由協(xié)議、基于地理信息(Geographic)的路由協(xié)議和基于服務(wù)質(zhì)量(QoS,Quality of Service)的路由協(xié)議。路由驅(qū)動(dòng)型數(shù)據(jù)

19、融合算法主要基于兩類(lèi)路由協(xié)議:以數(shù)據(jù)為中心的定向擴(kuò)散路由協(xié)議和關(guān)于集群結(jié)構(gòu)的分層聚簇路由協(xié)議。A、定向擴(kuò)散路由型數(shù)據(jù)融合定向擴(kuò)散協(xié)議(directed diffusion,DD)是一個(gè)以數(shù)據(jù)為中心的路由和融合協(xié)議,為WSN提供有效的能量通信。在定向擴(kuò)散協(xié)議中,數(shù)據(jù)融合包括路徑建立階段的興趣(interest)融合和數(shù)據(jù)傳輸階段的數(shù)據(jù)融合。然而,畢竟DD主要解決的是WSN中的路由問(wèn)題,其中涉及的數(shù)據(jù)融合技術(shù)相對(duì)較為簡(jiǎn)單。同時(shí),DD中的數(shù)據(jù)融合是基于其提出的屬性值對(duì)而設(shè)計(jì)的,與具體應(yīng)用關(guān)系非常緊密,是以數(shù)據(jù)為中心的一種數(shù)據(jù)融合技術(shù)。另外,在DD中,數(shù)據(jù)傳輸路由的確定還取決于節(jié)點(diǎn)到sink的時(shí)延,時(shí)

20、延小的路徑將被確定為數(shù)據(jù)傳輸路由。但這種方法并不利于鄰近節(jié)點(diǎn)的數(shù)據(jù)融合,因此可采用改進(jìn)的GIT算法。B、分層聚簇路由型數(shù)據(jù)融合低能耗自適應(yīng)聚類(lèi)分層(low-energy adaptive clustering hierarchy,LEACH)12協(xié)議是典型的WSN路由協(xié)議,通過(guò)定期選舉一些簇頭節(jié)點(diǎn),形成基于層次結(jié)構(gòu)的路由機(jī)制。該路由協(xié)議可以支持簇頭節(jié)點(diǎn)中的數(shù)據(jù)融合,能夠體現(xiàn)出盡早進(jìn)行數(shù)據(jù)融合的原則和優(yōu)勢(shì)。不過(guò),LEACH僅強(qiáng)調(diào)了數(shù)據(jù)融合的重要性,并未給出具體的融合方法。而且,僅僅在簇頭實(shí)施數(shù)據(jù)融合,簇內(nèi)節(jié)點(diǎn)直接將原始數(shù)據(jù)送到簇頭的策略也沒(méi)有充分利用相鄰節(jié)點(diǎn)間的數(shù)據(jù)相關(guān)性來(lái)減少簇內(nèi)節(jié)點(diǎn)傳輸?shù)哪芎?/p>

21、。因此在文獻(xiàn)無(wú)線(xiàn)傳感器網(wǎng)絡(luò)數(shù)據(jù)傳輸及融合技術(shù)14中,將其與PEGASIS算法分類(lèi)為集中式數(shù)據(jù)融合的算法。并介紹了分布式數(shù)據(jù)融合算法,將一個(gè)規(guī)則傳感器網(wǎng)絡(luò)拓?fù)鋱D等效于一幅圖像,獲得一種將小波變換應(yīng)用到無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中的分布式數(shù)據(jù)融合技術(shù)。總的來(lái)說(shuō),路由驅(qū)動(dòng)型數(shù)據(jù)融合算法與具體路由的建立關(guān)系密切,還涉及到融合節(jié)點(diǎn)的選擇、融合時(shí)機(jī)的選擇及如何進(jìn)行數(shù)據(jù)融合處理等問(wèn)題。在路由驅(qū)動(dòng)型數(shù)據(jù)融合算法中仍然有很多關(guān)鍵問(wèn)題未解決,如融合增益與能量和通信服務(wù)質(zhì)量的平衡、支持拓?fù)漕l繁改變的數(shù)據(jù)融合算法、安全數(shù)據(jù)融合等同題。(4)基于時(shí)域預(yù)測(cè)的WSN數(shù)據(jù)融合基于時(shí)域預(yù)測(cè)的WSN數(shù)據(jù)融合是利用節(jié)點(diǎn)采集數(shù)據(jù)在時(shí)間上有固定的

22、采樣周期的特點(diǎn),對(duì)已經(jīng)采集的數(shù)據(jù)在時(shí)間上排序并分析數(shù)據(jù)幅值變化情況,建立能夠反映數(shù)據(jù)在時(shí)間上動(dòng)態(tài)變化的數(shù)學(xué)模型,預(yù)測(cè)將來(lái)的數(shù)據(jù)值。當(dāng)實(shí)際采集的數(shù)據(jù)值與預(yù)測(cè)值之差超過(guò)給定的閾值時(shí),對(duì)新采集的數(shù)據(jù)進(jìn)行無(wú)線(xiàn)傳輸。通過(guò)預(yù)測(cè),減少不必要的數(shù)據(jù)傳輸,從而降低網(wǎng)絡(luò)能耗,延長(zhǎng)網(wǎng)絡(luò)的生命周期?;跁r(shí)域預(yù)測(cè)的數(shù)據(jù)融合算法與TiNA有相似之處。二者都屬于時(shí)域數(shù)據(jù)融合。它們的主要區(qū)別在于TiNA是一種被動(dòng)的數(shù)據(jù)融合算法,節(jié)點(diǎn)比較的是當(dāng)前采樣數(shù)據(jù)與前一個(gè)周期的采樣數(shù)據(jù)。而基于時(shí)域預(yù)測(cè)的數(shù)據(jù)融合算法是根據(jù)歷史數(shù)據(jù)進(jìn)行數(shù)據(jù)的預(yù)測(cè),若預(yù)測(cè)數(shù)據(jù)與當(dāng)前采集數(shù)據(jù)之差小于閾值,則不發(fā)送當(dāng)前數(shù)據(jù)。服務(wù)器使用其預(yù)測(cè)數(shù)據(jù)從而達(dá)到減少通信量

23、的目的?,F(xiàn)有文獻(xiàn)采用的預(yù)測(cè)融合方法主要包括:自回歸(AR)模型、移動(dòng)平均(MA)模型以及自回歸移動(dòng)平均(ARMA)模型等。文獻(xiàn)無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中基于預(yù)測(cè)的時(shí)域數(shù)據(jù)融合技術(shù)13中介紹了對(duì)自回歸預(yù)測(cè)算法、移動(dòng)平均預(yù)測(cè)算法、以及指數(shù)平滑預(yù)測(cè)算法進(jìn)行了以溫度為測(cè)量數(shù)據(jù)進(jìn)行仿真得出一階自回歸預(yù)測(cè)算法與其它預(yù)測(cè)算法相比。具有更好的適用性,當(dāng)誤差閑值為O.05-0.50時(shí),預(yù)測(cè)成功率為21-83;當(dāng)誤差閾值為O.05時(shí)節(jié)能收益達(dá)到68。(5)、基于數(shù)據(jù)包合并的數(shù)據(jù)融合數(shù)據(jù)包合并是WSN中一種有效的數(shù)據(jù)融合算法。數(shù)據(jù)包合并的主要思想是當(dāng)某個(gè)節(jié)點(diǎn)收到多個(gè)子節(jié)點(diǎn)發(fā)來(lái)的數(shù)據(jù)包時(shí),將它們合并成一個(gè)大的數(shù)據(jù)包,然后將合并

24、后的數(shù)據(jù)包發(fā)送到父節(jié)點(diǎn)。在WSN中,數(shù)據(jù)字段相對(duì)較短,而控制字段相對(duì)較長(zhǎng)。數(shù)據(jù)包合并能夠有效地降低包頭的開(kāi)銷(xiāo)。典型的數(shù)據(jù)包合并算法包括數(shù)據(jù)漏斗(data funneling)以及AIDA(application-independent data aggregation)15等。數(shù)據(jù)漏斗實(shí)質(zhì)上是一種基于簇的數(shù)據(jù)融合,簇頭節(jié)點(diǎn)負(fù)責(zé)合并簇內(nèi)節(jié)點(diǎn)的數(shù)據(jù)包。然而,數(shù)據(jù)漏斗要求節(jié)點(diǎn)具有自身的位置信息,并且有可能產(chǎn)生漏斗效應(yīng)(funnelingeffect)。AIDA是一種與應(yīng)用無(wú)關(guān)的數(shù)據(jù)融合算法,實(shí)質(zhì)上是在MAC層與網(wǎng)絡(luò)層之間加入了一個(gè)數(shù)據(jù)融合層進(jìn)行數(shù)。據(jù)包合并的操作。通過(guò)數(shù)據(jù)包合并,AIDA能夠有效地減

25、少網(wǎng)絡(luò)中的數(shù)據(jù)傳輸量,降低無(wú)線(xiàn)信道中發(fā)生沖突的可能性。然而,AIDA與應(yīng)用相互獨(dú)立,無(wú)法利用高層次的語(yǔ)義信息對(duì)數(shù)據(jù)作進(jìn)一步的壓縮,因此其融合度相對(duì)比較低。綜上數(shù)據(jù)融合技術(shù)是為適應(yīng)WSN以數(shù)據(jù)為中心的應(yīng)用而產(chǎn)生的,主要關(guān)注如何對(duì)采集到的或接收到的其它傳感器節(jié)點(diǎn)發(fā)送的多個(gè)數(shù)據(jù)進(jìn)行融合理,消除冗余信息,然后再傳輸處理后續(xù)數(shù)據(jù),其重點(diǎn)在于減少需要傳輸?shù)臄?shù)據(jù)。關(guān)于數(shù)據(jù)融合的研究雖然已經(jīng)取得了很大進(jìn)展,但是研究工作尚處于起步階段,大量問(wèn)題還沒(méi)有涉及到。因此,對(duì)于WSN數(shù)據(jù)融合算法的設(shè)計(jì)與分析既具有很高的研究?jī)r(jià)值和創(chuàng)新性,又存在一定的挑戰(zhàn)性。2 分類(lèi)識(shí)別在無(wú)線(xiàn)傳感器網(wǎng)絡(luò)模式識(shí)別與分類(lèi)中,分類(lèi)器的作用是對(duì)特征

26、向量驚醒某種變換和映射,將特征向量從特征空間映射到目標(biāo)類(lèi)別空間,從而得到識(shí)別結(jié)果,其實(shí)質(zhì)是分類(lèi)器對(duì)特征空間進(jìn)行適當(dāng)?shù)膭澐?,從而形成決策區(qū)域。基本做法是在樣本訓(xùn)練集基礎(chǔ)上確定某個(gè)判決規(guī)則,使按這種判決規(guī)則對(duì)被識(shí)別對(duì)象進(jìn)行分類(lèi)所造成的錯(cuò)誤識(shí)別率最小或引起的損失最小。橋梁結(jié)構(gòu)是陸地交通運(yùn)輸網(wǎng)絡(luò)中的關(guān)鍵部位,為確保橋梁結(jié)構(gòu)在整個(gè)服役期間的安全性和服務(wù)功能,對(duì)重要橋梁結(jié)構(gòu)實(shí)施健康監(jiān)測(cè)和安全性評(píng)估是十分必要的。作為健康監(jiān)測(cè)和安全性評(píng)估系統(tǒng)的核心技術(shù)的橋梁結(jié)構(gòu)損傷識(shí)別更是成為國(guó)際上研究的熱點(diǎn)本章就基于無(wú)線(xiàn)傳感器網(wǎng)絡(luò)的橋梁結(jié)構(gòu)損傷識(shí)別進(jìn)行一個(gè)總結(jié),對(duì)近年來(lái)基于振動(dòng)分析和結(jié)構(gòu)動(dòng)力學(xué)參數(shù)的結(jié)構(gòu)損傷識(shí)別理論進(jìn)行了比

27、較系統(tǒng)地總結(jié)和評(píng)述。近年來(lái)基于振動(dòng)測(cè)試的橋梁結(jié)構(gòu)損傷識(shí)別的研 究主要可分為三個(gè)方面,(1)基于模型修正理論的損傷識(shí)別,(2)結(jié)構(gòu)損傷指數(shù)法,(3)人工神經(jīng)網(wǎng)絡(luò)法。2.1基于模型修正理論的損傷識(shí)別基于模型修正理論的結(jié)構(gòu)損傷識(shí)別的方法就是利用試驗(yàn)?zāi)B(tài)分析結(jié)果修改理論有限元模型的剛度矩陣、質(zhì)量矩陣等模型參數(shù),在保證模態(tài)參數(shù)自身精度的前提下,使修正后有限元模型的振動(dòng)參數(shù)與試驗(yàn)值相同。集中經(jīng)典的方法有:矩陣優(yōu)化修正方法,矩陣優(yōu)化修正法試圖通過(guò)尋求某種優(yōu)化目標(biāo)并滿(mǎn)足一定約束條件的矩陣或矩陣參數(shù)修正來(lái)修正模型。子矩陣修正法,子矩陣修正法對(duì)待修正的子矩陣或單元定義修正系數(shù),通過(guò)對(duì)子矩陣修正系數(shù)的調(diào)整來(lái)修改結(jié)構(gòu)

28、剛度矩陣。以及敏感性分析法和特征結(jié)構(gòu)分配法。文獻(xiàn)16 基于靜載試驗(yàn)進(jìn)行橋梁結(jié)構(gòu)損傷識(shí)別,以橋梁結(jié)構(gòu)有限元為工具,把當(dāng)前結(jié)構(gòu)模型中各單元的等效面積、慣性矩以及板殼單元的厚度作為識(shí)別參數(shù)p,建立識(shí)別參數(shù)對(duì)于各種量測(cè)的靈敏度矩陣 Sp。通過(guò)優(yōu)化方法不斷調(diào)整當(dāng)前計(jì)算模型的參數(shù),使結(jié)構(gòu)響應(yīng)與相應(yīng)的試驗(yàn)值最大程度地吻合,從而得到結(jié)構(gòu)參數(shù)變化的信息。并通過(guò)換桿的形式模擬結(jié)構(gòu)局部構(gòu)件的退化,得到不錯(cuò)的效果。2.2基于損傷指數(shù)的損傷識(shí)別損傷指數(shù)法是利用結(jié)構(gòu)振動(dòng)測(cè)試直接得到的振動(dòng)響應(yīng)的時(shí)程(位移、速度、加速度時(shí)程)或經(jīng)過(guò)變換分析得到的結(jié)構(gòu)的動(dòng)力學(xué)參數(shù)作為損傷指示信息來(lái)識(shí)別結(jié)構(gòu)損傷位置和程度?;痉椒ㄓ校豪媚B(tài)參

29、數(shù)(頻率、振型)的損傷識(shí)別,主要通過(guò)對(duì)兩個(gè)不同階頻率變化比或結(jié)構(gòu)損傷前后振型來(lái)實(shí)現(xiàn)損傷定位。利用振動(dòng)響應(yīng)時(shí)程或其變換,其中包括基于波形的識(shí)別指標(biāo)、用小波分析技術(shù)處理振動(dòng)響應(yīng)信號(hào)的損傷識(shí)別方法以及利用結(jié)構(gòu)振動(dòng)響應(yīng)的時(shí)域變換方法等。文獻(xiàn)17小波變換在橋梁結(jié)構(gòu)損傷識(shí)別中的應(yīng)用,通過(guò)小波變換極大值點(diǎn)同信號(hào)突變點(diǎn)及其李氏指數(shù)之間的關(guān)系,采用小波變換極大值在多尺度上的變化規(guī)律來(lái)表征信號(hào)突變點(diǎn)的性質(zhì),從而確定信號(hào)有無(wú)奇異點(diǎn)并確定其位置,進(jìn)而對(duì)橋梁進(jìn)行損傷識(shí)別。并進(jìn)行單裂縫懸臂梁的靜力試驗(yàn),達(dá)到精確定位裂縫位置的目的。2.3基于人工神經(jīng)網(wǎng)絡(luò)的損傷識(shí)別人工神經(jīng)網(wǎng)絡(luò)法神經(jīng)網(wǎng)絡(luò)損傷識(shí)別法實(shí)際上就是用一些已知損傷的響

30、應(yīng)或理論上構(gòu)建的樣本集來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò),使網(wǎng)絡(luò)達(dá)到一種相對(duì)平衡的狀態(tài),利用網(wǎng)絡(luò)訓(xùn)練后的映射關(guān)系和網(wǎng)絡(luò)的泛化能力,根據(jù)輸入的結(jié)構(gòu)實(shí)測(cè)響應(yīng),得到損傷的位置及損傷程度。目前采用的網(wǎng)絡(luò)主要是BP網(wǎng)絡(luò)、徑向基函數(shù)(RBF)網(wǎng)絡(luò)和hopfield網(wǎng)絡(luò)。對(duì)于神經(jīng)網(wǎng)絡(luò)方法,除神經(jīng)網(wǎng)絡(luò)的構(gòu)建外,最關(guān)鍵的就是損傷識(shí)別指標(biāo)的選取,一般的都取振型和頻率的組合或在二者的基礎(chǔ)上加工出新的更能反映損傷前后變化特征。文獻(xiàn)17基于CS和神經(jīng)網(wǎng)絡(luò)的傳感器網(wǎng)絡(luò)模式識(shí)別研究將壓縮感知技術(shù)與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合應(yīng)用于傳感器網(wǎng)絡(luò),對(duì)傳感器網(wǎng)絡(luò)中傳輸?shù)臄?shù)據(jù)進(jìn)行壓縮,降低傳輸數(shù)據(jù)量,然后在接收端重構(gòu)數(shù)據(jù),將該數(shù)據(jù)樣本作為BP網(wǎng)絡(luò)的輸入進(jìn)行識(shí)別。

31、提高網(wǎng)絡(luò)數(shù)據(jù)存儲(chǔ)能力和帶寬利用率。文獻(xiàn)16基于RBF神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)的橋梁結(jié)構(gòu)損傷識(shí)別方法研究,從徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、網(wǎng)絡(luò)設(shè)計(jì)和網(wǎng)絡(luò)訓(xùn)練算法等方面論述了神經(jīng)網(wǎng)絡(luò)理論。并以一座裝配式預(yù)應(yīng)力鋼筋混凝土系桿拱橋?yàn)楣こ虒?shí)例,通過(guò)改變構(gòu)件的彈性模量降低單元?jiǎng)偠葋?lái)模擬結(jié)構(gòu)損傷程度,并以任意三組向量對(duì)網(wǎng)絡(luò)進(jìn)行測(cè)試,說(shuō)明了基于頻率參數(shù)和RBF網(wǎng)絡(luò)方法的結(jié)構(gòu)損傷識(shí)別的可行性和準(zhǔn)確性。3 流數(shù)據(jù)及海量數(shù)據(jù)存儲(chǔ)對(duì)于科學(xué)發(fā)展的今天,人們得到的信息量是成倍的增長(zhǎng),數(shù)據(jù)的來(lái)源也是越來(lái)越多樣化,因此需要處理那些龐大的數(shù)據(jù)集,這些數(shù)據(jù)都是以很快的速度無(wú)限不停的產(chǎn)生,并且是隨著時(shí)間的變化而變化,這就是一種新式數(shù)型流數(shù)

32、據(jù)。流數(shù)據(jù)的特點(diǎn)是數(shù)據(jù)持續(xù)到達(dá),且速度快、規(guī)模大。其研究核心是設(shè)計(jì)高效的單遍數(shù)據(jù)集掃描算法,在一個(gè)遠(yuǎn)小于數(shù)據(jù)規(guī)模的內(nèi)存空間里不斷更新一個(gè)代表數(shù)據(jù)集的結(jié)構(gòu)概要數(shù)據(jù)結(jié)構(gòu),使得在任何時(shí)候都能夠根據(jù)這個(gè)結(jié)構(gòu)迅速獲得查詢(xún)結(jié)果。在無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中,系統(tǒng)有成千上萬(wàn)個(gè)傳感器在同時(shí)工作,每個(gè)傳感器每秒鐘獲取一個(gè)測(cè)量值,每個(gè)傳感器就會(huì)產(chǎn)生一個(gè)隨時(shí)更新變化的時(shí)間序列數(shù)據(jù)流,整個(gè)系統(tǒng)形成一個(gè)多數(shù)據(jù)流并行的數(shù)據(jù)環(huán)境。因此,對(duì)數(shù)據(jù)流的分析與信息存儲(chǔ)在無(wú)線(xiàn)傳感器網(wǎng)絡(luò)的研究中起著至關(guān)重要的作用。3.1 數(shù)據(jù)流挖掘的基本技術(shù)目前大部分?jǐn)?shù)據(jù)流流挖掘方法都基共同的基本技術(shù),如概要數(shù)據(jù)結(jié)構(gòu)、抽樣、滑動(dòng)窗口、衰減函數(shù)、傾斜時(shí)間構(gòu)架等。

33、(1) 概要數(shù)據(jù)結(jié)構(gòu)。是通過(guò)應(yīng)用概要技術(shù),生成的比當(dāng)前數(shù)據(jù)流小得多的數(shù)據(jù)結(jié)構(gòu),它是當(dāng)前數(shù)據(jù)流的概要描述。新的流數(shù)據(jù)處理技術(shù)并不保存整個(gè)數(shù)據(jù)集,僅維護(hù)一個(gè)遠(yuǎn)小于其規(guī)模的概要數(shù)據(jù)結(jié)構(gòu)18,從而能夠常駐內(nèi)存。對(duì)于不同數(shù)據(jù)流算法,其概要數(shù)據(jù)結(jié)構(gòu)相差很大。目前已經(jīng)提出了多種概要技術(shù)包括有:頻率矩、直方圖和小波分析等等。(2) 抽樣。通過(guò)一定的概率來(lái)決定一個(gè)數(shù)據(jù)元素是否被處理。這樣可以避免處理整個(gè)數(shù)據(jù)流。但在數(shù)據(jù)流模型中,抽樣技術(shù)的問(wèn)題是不可能預(yù)先知道流的長(zhǎng)度。一種方法19采用水庫(kù)抽樣技術(shù)較好的解決這個(gè)問(wèn)題;在抽樣技術(shù)中另一問(wèn)題是數(shù)據(jù)流其流動(dòng)率是不是穩(wěn)定的。故對(duì)那些需要監(jiān)測(cè)不規(guī)則且浮動(dòng)上下的流數(shù)據(jù)是個(gè)較好

34、的選擇。(3) 滑動(dòng)窗口?;瑒?dòng)窗口模型基于這樣一個(gè)事實(shí):“用戶(hù)對(duì)于最近的數(shù)據(jù)更感興趣”。從而使人們只對(duì)少量的近期數(shù)據(jù)做細(xì)節(jié)分析,而對(duì)大量的歷史數(shù)據(jù),只給出一個(gè)概要結(jié)構(gòu)20。而達(dá)到只需存儲(chǔ)小的數(shù)據(jù)窗口,減少對(duì)內(nèi)存的需求?;瑒?dòng)窗口一個(gè)缺陷是要求用戶(hù)預(yù)先指定窗口的尺寸,有些應(yīng)用中,不太可能知道窗口的大小。(4) 衰減函數(shù)。也是一種強(qiáng)調(diào)近期數(shù)據(jù)的重要性、消減歷史數(shù)據(jù)對(duì)計(jì)算結(jié)果影響的方法,主要利用衰減函數(shù)和衰減因子,數(shù)據(jù)元素在參與計(jì)算前,先經(jīng)過(guò)衰減函數(shù)的作用22。從而使每個(gè)數(shù)據(jù)元素隨著時(shí)間的推移逐漸減少對(duì)最終結(jié)果的影響。常用的衰減函數(shù)形式是Cao 等人提出的Den-Stream算法25采用的衰減函數(shù)形式

35、: f (t) = 2-lt,l <0。3.2數(shù)據(jù)流管理系統(tǒng)傳感器網(wǎng)絡(luò)本質(zhì)上是一個(gè)以數(shù)據(jù)為中心的網(wǎng)絡(luò),它處理的數(shù)據(jù)為傳感器采集的連續(xù)不斷的數(shù)據(jù)流。因此,現(xiàn)有的數(shù)據(jù)管理技術(shù)把無(wú)線(xiàn)傳感器網(wǎng)絡(luò)看作為來(lái)自物理世界的連續(xù)數(shù)據(jù)流組成的分布式數(shù)據(jù)庫(kù)。3.2.1 感器網(wǎng)絡(luò)數(shù)據(jù)庫(kù)系統(tǒng)體系結(jié)構(gòu)典型的傳感器網(wǎng)絡(luò)的系統(tǒng)結(jié)構(gòu)包括資源受限的傳感器節(jié)點(diǎn)群組成的多跳自組織網(wǎng)絡(luò)、資源豐富的Sink節(jié)點(diǎn)、互聯(lián)網(wǎng)和用戶(hù)界面等24。映射到傳感器網(wǎng)絡(luò)的分布式數(shù)據(jù)庫(kù)系統(tǒng)也采用兩層體系結(jié)構(gòu),如圖1所示,它是由運(yùn)行在傳感器節(jié)點(diǎn)上本地?cái)?shù)據(jù)庫(kù)和運(yùn)行在sink節(jié)點(diǎn)上與局部數(shù)據(jù)庫(kù)進(jìn)行交互的分布式數(shù)據(jù)庫(kù)管理層組成。位于Sink節(jié)點(diǎn)上的分布式數(shù)據(jù)

36、管理層通常亦稱(chēng)為代理數(shù)據(jù)庫(kù),它包括兩個(gè)關(guān)鍵組件:一個(gè)為數(shù)據(jù)緩存(cache),用于保存低層節(jié)點(diǎn)監(jiān)測(cè)到的數(shù)據(jù)匯總及從傳感器節(jié)點(diǎn)查詢(xún)得到的結(jié)果;另一個(gè)為查詢(xún)處理引擎,決定如何處理查詢(xún)。圖5 無(wú)線(xiàn)傳感器網(wǎng)絡(luò)數(shù)據(jù)庫(kù)系統(tǒng)體系結(jié)構(gòu)3.2.2 傳感器節(jié)點(diǎn)的數(shù)據(jù)存儲(chǔ)與索引技術(shù)出于抗震性、節(jié)點(diǎn)大小以及能量消耗等方面考慮,硬盤(pán)不適用于作為傳感器節(jié)點(diǎn)的永久性存儲(chǔ)器,flash是目前的最佳選擇。傳感器節(jié)點(diǎn)的數(shù)據(jù)存儲(chǔ)與索引技術(shù)要考慮flash特性、節(jié)點(diǎn)的能量消耗等因素。根據(jù)WSN的數(shù)據(jù)流以及flash存儲(chǔ)器的特征,目前傳感器節(jié)點(diǎn)上的數(shù)據(jù)存儲(chǔ)方式主要有兩種方式:一種為不帶索引基于日志結(jié)構(gòu)的文件存儲(chǔ)方式,另一種為基于索引結(jié)

37、構(gòu)的存儲(chǔ)方式。文獻(xiàn)29是針對(duì)傳感器節(jié)點(diǎn)設(shè)計(jì)的基于flash存儲(chǔ)器的日志結(jié)構(gòu)文件系統(tǒng)(Efficient Log Structured Flash File systern,ELF)。ELF考慮到傳感器節(jié)點(diǎn)的資源限制,僅為系統(tǒng)的通用任務(wù)提供了一些基本的文件管理操作,如open,create,modify,append,read,seek,delete,rename,truncation等。與傳統(tǒng)的基于flash的文件系統(tǒng)的不同之處主要在于對(duì)文件的寫(xiě)操作(包括append和modify)。對(duì)于append操作,ELF并不為每個(gè)append操作創(chuàng)建一個(gè)日志數(shù)據(jù)項(xiàng),而是對(duì)每個(gè)文件,利用一個(gè)寫(xiě)緩沖區(qū)緩存

38、追加到同一頁(yè)的13志項(xiàng),當(dāng)緩沖區(qū)滿(mǎn)時(shí)再寫(xiě)入到flash頁(yè)上。這樣可以減少對(duì)flash寫(xiě)的次數(shù),以延長(zhǎng)flash的使用壽命和降低能量消耗。Mierohash32提出一種基于hash索引結(jié)構(gòu)的數(shù)據(jù)存儲(chǔ)方式。它把flash的數(shù)據(jù)存儲(chǔ)區(qū)組織成堆(heap),監(jiān)測(cè)數(shù)據(jù)按時(shí)間順序以循環(huán)數(shù)組方式存儲(chǔ)在flash的數(shù)據(jù)存儲(chǔ)區(qū)上,這種方式直接解決了刪除、寫(xiě)以及磨損平衡問(wèn)題。Microhash在把監(jiān)測(cè)數(shù)據(jù)存儲(chǔ)到flash時(shí),同時(shí)建立索引。索引采用兩層索引結(jié)構(gòu),即index層和directory層。Index的每個(gè)索引記錄格式為idx,offset,其中idx為數(shù)據(jù)存儲(chǔ)的flash頁(yè)的地址,offset為存儲(chǔ)在該頁(yè)

39、相對(duì)起始地址的偏移值。directory的每個(gè)記錄項(xiàng)包括index層的某個(gè)flash頁(yè)的地址以及索引數(shù)據(jù)項(xiàng)值的上、下界。值得進(jìn)一步研究的是,在傳感器節(jié)點(diǎn)數(shù)據(jù)庫(kù)構(gòu)建和維護(hù)索引時(shí),必須考慮能量消耗問(wèn)題。建立索引可以提高訪(fǎng)問(wèn)數(shù)據(jù)的速度,減少讀取flash頁(yè)的次數(shù)。但建立和維護(hù)索引除了增加額外的存儲(chǔ)空間外,其讀寫(xiě)也需要消耗能量,尤其是對(duì)索引的寫(xiě)操作。這些能量消耗要在查詢(xún)處理中得到補(bǔ)償,索引才有意義。因此,使用索引結(jié)構(gòu)只有在數(shù)據(jù)訪(fǎng)問(wèn)操作非常頻繁時(shí)才有效,否則通過(guò)順序掃描來(lái)執(zhí)行查詢(xún)更節(jié)約能量。3.2.3 以數(shù)據(jù)為中心的存儲(chǔ)與分布式索引技術(shù)在WSN中,傳感器監(jiān)測(cè)數(shù)據(jù)可以存儲(chǔ)在本地節(jié)點(diǎn),也可以根據(jù)數(shù)據(jù)的屬性通

40、過(guò)某種映射技術(shù)存儲(chǔ)到網(wǎng)絡(luò)中的一些指定節(jié)點(diǎn)上,即以數(shù)據(jù)為中心的存儲(chǔ)技術(shù)。以數(shù)據(jù)為中心的存儲(chǔ)技術(shù)根據(jù)數(shù)據(jù)的屬性把相關(guān)聯(lián)的數(shù)據(jù)存儲(chǔ)到指定的節(jié)點(diǎn),可通過(guò)數(shù)據(jù)融合技術(shù)對(duì)數(shù)據(jù)進(jìn)行處理,避免把大量的測(cè)量數(shù)據(jù)傳輸?shù)骄W(wǎng)外,以達(dá)到降低數(shù)據(jù)傳輸能耗的目的。在數(shù)據(jù)查詢(xún)中,為了能快速地定位到數(shù)據(jù)的存儲(chǔ)節(jié)點(diǎn),避免在全網(wǎng)泛洪廣播查詢(xún)請(qǐng)求,需要對(duì)網(wǎng)絡(luò)中的數(shù)據(jù)建立分布式索引技術(shù)。如GHT技術(shù)可以直接根據(jù)數(shù)據(jù)的屬性,利用Hash函數(shù),定位到數(shù)據(jù)的存儲(chǔ)節(jié)點(diǎn)。文獻(xiàn)34提出了一種分布式索引方法(Distributed Indexfor Features in Sensor Networks,DIFS),該方法綜合了GHT技術(shù)和空間分解

41、技術(shù),利用GHT技術(shù)實(shí)現(xiàn)了以數(shù)據(jù)為中心的存儲(chǔ),利用空間分解技術(shù)實(shí)現(xiàn)對(duì)分布式數(shù)據(jù)的索引。區(qū)別于文獻(xiàn)19所采用的空間分解技術(shù),其構(gòu)造的層次結(jié)構(gòu)的每個(gè)非根節(jié)點(diǎn)具有多個(gè)父節(jié)點(diǎn),以解決能量消耗和通信瓶頸問(wèn)題。每個(gè)節(jié)點(diǎn)都存儲(chǔ)特定地理范圍內(nèi)和特定監(jiān)測(cè)數(shù)據(jù)值范圍內(nèi)的數(shù)據(jù)。上層節(jié)點(diǎn)存儲(chǔ)的數(shù)據(jù)覆蓋的地理范圍大,但覆蓋的監(jiān)測(cè)數(shù)據(jù)值的范圍小。相反,下層節(jié)點(diǎn)的數(shù)據(jù)覆蓋的地理范圍小,但數(shù)據(jù)值的范圍大。在查詢(xún)數(shù)據(jù)時(shí),首先選擇最高父節(jié)點(diǎn)的集合,這些節(jié)點(diǎn)覆蓋所有查詢(xún)要求的數(shù)據(jù)名的范圍。然后根據(jù)查詢(xún)要求的空間范圍逐層進(jìn)行遍歷,最后得到查詢(xún)結(jié)果。DIFS適用于指定空間范圍以及指定數(shù)據(jù)值范圍的單屬性的查詢(xún)要求。3.2.4 數(shù)據(jù)模式現(xiàn)

42、有的WSN數(shù)據(jù)庫(kù)系統(tǒng)對(duì)傳感器監(jiān)測(cè)的數(shù)據(jù)流建模大多為對(duì)傳統(tǒng)的數(shù)據(jù)模式進(jìn)行擴(kuò)展,主要有基于工作流模式、基于關(guān)系模式、基于對(duì)象模式。針對(duì)WSN的一些特殊應(yīng)用,也可以建立特殊的數(shù)據(jù)模式。Aurora系統(tǒng)是一種面向時(shí)間工作流模式建模的系統(tǒng),其查詢(xún)建立在Aurora查詢(xún)代數(shù)基礎(chǔ)上,包括3個(gè)與順序無(wú)關(guān)的操作(Filter,Map和Union)和4個(gè)對(duì)順序敏感的操作(BSort,Aggregate,Join和Resample)。TinyDB24采用基于關(guān)系的數(shù)據(jù)模式,并對(duì)傳統(tǒng)的關(guān)系模式進(jìn)行了擴(kuò)展。它把傳感器節(jié)點(diǎn)的測(cè)量數(shù)據(jù)定義為一個(gè)單一的、無(wú)限長(zhǎng)的、有兩類(lèi)屬性的虛擬關(guān)系表:一類(lèi)用來(lái)定義測(cè)量數(shù)據(jù),如節(jié)點(diǎn)標(biāo)識(shí)符、測(cè)

43、量時(shí)間、測(cè)量數(shù)據(jù)類(lèi)型、單位等;另一類(lèi)用來(lái)描述測(cè)量數(shù)據(jù)本身,如溫度、位置等。COUGAR是一個(gè)基于抽象數(shù)據(jù)類(lèi)型(Abstract Data Type)的數(shù)據(jù)流系統(tǒng),它采用兩種模式對(duì)數(shù)據(jù)進(jìn)行建模:用對(duì)象關(guān)系模式來(lái)組織建模存儲(chǔ)數(shù)據(jù);引入一種時(shí)間序列模式建模組織傳感器監(jiān)測(cè)數(shù)據(jù),并定義了相應(yīng)的關(guān)系代數(shù)操作、時(shí)間序列操作以及關(guān)系及時(shí)間序列之間的操作。3.2.5 數(shù)據(jù)查詢(xún)處理與優(yōu)化WSN的數(shù)據(jù)查詢(xún)應(yīng)用可以分為兩大類(lèi):查詢(xún)動(dòng)態(tài)數(shù)據(jù)和查詢(xún)歷史數(shù)據(jù)。在查詢(xún)動(dòng)態(tài)數(shù)據(jù)中,數(shù)據(jù)在傳感器監(jiān)測(cè)到的一個(gè)小的時(shí)間窗內(nèi)有效,例如事件檢測(cè)查詢(xún)或一些特定查詢(xún)(當(dāng)前的溫度是多少?)。而查詢(xún)歷史數(shù)據(jù)是指對(duì)檢測(cè)到的歷史數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,用

44、于發(fā)現(xiàn)事件特殊模式,分析數(shù)據(jù)走趨,形成特定事件的理想模型等。對(duì)這一類(lèi)應(yīng)用來(lái)說(shuō),每一個(gè)數(shù)據(jù)都是重要的,不能被拋棄。WSN數(shù)據(jù)庫(kù)系統(tǒng)可理解為一個(gè)兩層結(jié)構(gòu)的分布式數(shù)據(jù)庫(kù)系統(tǒng):運(yùn)行在Sink節(jié)點(diǎn)上的代理數(shù)據(jù)庫(kù)服務(wù)器和運(yùn)行在傳感器節(jié)點(diǎn)上的局部數(shù)據(jù)庫(kù)。數(shù)據(jù)查詢(xún)的處理過(guò)程一般為:首先用戶(hù)使用命令式查詢(xún)接口把查詢(xún)請(qǐng)求發(fā)送到網(wǎng)絡(luò),通過(guò)路由技術(shù)傳送到運(yùn)行在Sink節(jié)點(diǎn)的代理服務(wù)器。其次,代理服務(wù)器根據(jù)接收到的用戶(hù)請(qǐng)求生成相應(yīng)查詢(xún)計(jì)劃。然后,代理服務(wù)器把查詢(xún)計(jì)劃通過(guò)路由技術(shù)發(fā)送到相應(yīng)的傳感器節(jié)點(diǎn)。節(jié)點(diǎn)接收到查詢(xún)后,執(zhí)行查詢(xún),并把結(jié)果傳送到代理服務(wù)器。最后,代理服務(wù)器對(duì)節(jié)點(diǎn)返回的結(jié)果進(jìn)行處理,并把最終結(jié)果返回給相應(yīng)的

45、用戶(hù)。WSN中的查詢(xún)優(yōu)化策略大致可分為運(yùn)行在sink節(jié)點(diǎn)上的多查詢(xún)優(yōu)化策略和運(yùn)行在網(wǎng)內(nèi)節(jié)點(diǎn)上的單查詢(xún)優(yōu)化策略。這兩種技術(shù)結(jié)合起來(lái)構(gòu)造WSN的查詢(xún)優(yōu)化系統(tǒng)。優(yōu)化的目標(biāo)要在保證網(wǎng)絡(luò)服務(wù)質(zhì)量的前提下,盡可能降低能量消耗,以延長(zhǎng)網(wǎng)絡(luò)的壽命。查詢(xún)優(yōu)化問(wèn)題是傳感器網(wǎng)絡(luò)領(lǐng)域的研究難題之一。它必須設(shè)計(jì)一些高效的分布式處理和數(shù)據(jù)重用技術(shù),既要降低全網(wǎng)絡(luò)的能量消耗,又要避免少量節(jié)點(diǎn)因負(fù)擔(dān)過(guò)重,能量消耗過(guò)快而失效,從而影響到整個(gè)網(wǎng)絡(luò)的使用壽命。無(wú)線(xiàn)傳感器網(wǎng)絡(luò)是一個(gè)以數(shù)據(jù)為中心的網(wǎng)絡(luò),它管理的傳感器監(jiān)測(cè)數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)庫(kù)中的數(shù)據(jù)有很大的差別,再加上傳感器節(jié)點(diǎn)自身的特性,給數(shù)據(jù)管理技術(shù)帶來(lái)了巨大的挑戰(zhàn)與機(jī)遇。目前,在WS

46、N的數(shù)據(jù)管理技術(shù)方面已經(jīng)取得了一些研究成果,但離實(shí)際應(yīng)用還很遠(yuǎn),仍具有很大的研究空間。本章主要從數(shù)據(jù)庫(kù)的體系結(jié)構(gòu)、數(shù)據(jù)在傳感器節(jié)點(diǎn)上的存儲(chǔ)與索引技術(shù)、以數(shù)據(jù)為中心的存儲(chǔ)與分布式索引技術(shù)、數(shù)據(jù)模式、數(shù)據(jù)查詢(xún)與優(yōu)化等方面介紹了無(wú)線(xiàn)傳感器網(wǎng)絡(luò)數(shù)據(jù)管理技術(shù)的研究進(jìn)展。結(jié)束語(yǔ)無(wú)線(xiàn)傳感器網(wǎng)絡(luò)本就是一個(gè)以數(shù)據(jù)為中心的網(wǎng)絡(luò)。與我們以前所用到的關(guān)系型數(shù)據(jù)庫(kù)存儲(chǔ)的數(shù)據(jù)不同,它所產(chǎn)生的數(shù)據(jù)是以數(shù)據(jù)流的形式所呈現(xiàn)出來(lái)的。這就意味著我們對(duì)無(wú)線(xiàn)傳感器網(wǎng)絡(luò)所產(chǎn)生的海量數(shù)據(jù)的處理過(guò)程也是一個(gè)系統(tǒng)的工程。它包括了特征的選擇與提?。ㄒ匀コ哂?,降噪以及降低特征空間維度為目的)、數(shù)據(jù)傳輸過(guò)程中的融合(所要考慮最重要的問(wèn)題是能耗的問(wèn)

47、題,所以很多數(shù)據(jù)融合的算法也是基于降低數(shù)據(jù)傳輸量與能耗來(lái)考慮的)、模式的分類(lèi)識(shí)別(在本文中主要以對(duì)大型橋梁的損傷作為識(shí)別的對(duì)象)、以及無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中海量數(shù)據(jù)的存儲(chǔ)與查詢(xún)(數(shù)據(jù)管理技術(shù)將物理世界WSN的連續(xù)數(shù)據(jù)流看作是一個(gè)分布式數(shù)據(jù)庫(kù)。)的問(wèn)題。本文所做的主要工作就是對(duì)WSN數(shù)據(jù)處理的整個(gè)過(guò)程進(jìn)行了一個(gè)系統(tǒng)的概述,這是一個(gè)從采集到傳輸再到識(shí)別存儲(chǔ)的一個(gè)過(guò)程。當(dāng)然,整個(gè)過(guò)程是一個(gè)大的系統(tǒng)。它內(nèi)容非常的多,以至于每一塊的內(nèi)容單獨(dú)拿出來(lái)都是一個(gè)獨(dú)立的研究方向。所以本文肯定會(huì)有許多沒(méi)有涉及到的地方,我將會(huì)在未來(lái)的學(xué)習(xí)中進(jìn)一步去探索。參考文獻(xiàn)(References)1、 鄧揚(yáng),丁幼亮,李?lèi)?ài)群 基于小波包分析的拉索損傷聲發(fā)射信號(hào)特征提取J振動(dòng)與沖擊,2010,(29)62、 張小薊,張歆,孫進(jìn)才 基于經(jīng)驗(yàn)?zāi)B(tài)分解的目標(biāo)特征提取與選擇J. 西北工業(yè)大學(xué)學(xué)報(bào), 2006,(24)43、 祁浩 王福豹 鄧宏 基于無(wú)線(xiàn)傳感器網(wǎng)絡(luò)的地震信號(hào)特征提取方法研究

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論