國家自然科學基金面上青年基金項目進展報告_第1頁
國家自然科學基金面上青年基金項目進展報告_第2頁
國家自然科學基金面上青年基金項目進展報告_第3頁
國家自然科學基金面上青年基金項目進展報告_第4頁
國家自然科學基金面上青年基金項目進展報告_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

國家自然科學基金面上青年基金項目進展報告項目的主要任務(wù)1.免疫計算的分層計算與負載平衡基于正常模型,人工免疫系統(tǒng)的3層是指固有免疫計算層、適應性免疫計算層和并行免疫計算層。對一種基于文件的人工免疫系統(tǒng)建立正常模型,用其正常組件文件的時空屬性唯一確定該人工免疫系統(tǒng)的正常狀態(tài)。正常模型為人工免疫系統(tǒng)的可信建模奠定基礎(chǔ),可提高人工免疫系統(tǒng)的性能。人工免疫系統(tǒng)的正常模型圖1

基于文件人工免疫系統(tǒng)的正常模型文件的空間屬性是其絕對路徑名,文件的時間屬性是其最后修改時間。人工免疫系統(tǒng)的3層結(jié)構(gòu)(圖2)在圖2中,第1層是固有免疫計算層,用來檢測所有的自體和異體,并識別所有已知的異體;第2層是適應性免疫計算層,用BP網(wǎng)絡(luò)、RBF網(wǎng)絡(luò)等神經(jīng)網(wǎng)絡(luò)對未知的異體進行識別、學習和記憶,然后消除所有被人工免疫系統(tǒng)看作威脅的異體;第3層是并行免疫計算層,這一層為人工免疫系統(tǒng)提供了改善效率的輔助工具,是受自然免疫系統(tǒng)中用作生物基礎(chǔ)組織的并行免疫細胞和分子啟發(fā)而來的。

自體數(shù)據(jù)庫設(shè)計為正常模型的數(shù)據(jù)集,該自體數(shù)據(jù)庫用來在人工免疫系統(tǒng)中100%檢測自體和異體。所有已知異體的特征存儲在異體數(shù)據(jù)庫中,該異體數(shù)據(jù)庫用來識別所有已知的異體和大多數(shù)未知的異體。對于未知的異體,用神經(jīng)網(wǎng)絡(luò)學習它們。與該未知異體最相似的已知異體將用作學習的樣本,以選擇該未知異體的最佳類似物。人工免疫系統(tǒng)中所有受損的文件在被識別為異體并要被刪除時,將記錄在臨時數(shù)據(jù)庫中。通過該臨時數(shù)據(jù)庫和所述自體數(shù)據(jù)庫,受損的人工免疫系統(tǒng)能最大可能地自動被修復。

并行免疫計算層的節(jié)點是計算機主機,其中表示節(jié)點的總數(shù),并行節(jié)點為人工免疫系統(tǒng)提供了高性能的計算基礎(chǔ)組織。有關(guān)人工免疫系統(tǒng)正常模型的定理定理1

文件的時空屬性二元組唯一確定了該文件的狀態(tài)

。定理2

人工免疫系統(tǒng)

中所有文件都處于正常狀態(tài)時,其各個文件的時空屬性二元組

唯一確定了該系統(tǒng)的正常狀態(tài)

。定理3

基于人工免疫系統(tǒng)的正常模型,對其自體的檢測率從理論上可以達到100%,對其異體的檢測率從理論上也可以達到100%。定理4基于人工免疫系統(tǒng)的正常模型和神經(jīng)網(wǎng)絡(luò),同等誤差條件下對異體的識別率將比不采用正常模型更高。人工免疫系統(tǒng)的并行免疫計算層為固有免疫計算層和適應性免疫計算層提供高性能的計算基礎(chǔ)組織,解決有限計算和負載平衡的問題。一臺主機的計算能力和資源總是有限的,高負荷的計算是不可靠的、易摧毀的并且高風險的。當移動機器人等系統(tǒng)的免疫信息處理量超過單個處理器的負載能力時,便調(diào)用并行免疫計算層,并行免疫計算層還能用來實現(xiàn)數(shù)據(jù)的多備份和系統(tǒng)恢復。對于移動機器人等系統(tǒng)的每個功能模塊,其相應的免疫子系統(tǒng)監(jiān)視和保護這個模塊,來維護每個功能模塊的局部免疫和移動機器人的整體免疫。免疫計算模塊建立在移動機器人等系統(tǒng)的功能模塊上,成為一系列相對獨立的免疫計算體。移動機器人的并行免疫計算(圖3)并行免疫計算的復雜度定理定理5

假設(shè)并行計算機有d個主機節(jié)點,且每個節(jié)點有2個處理器,那么,并行計算機解決導航問題的時間復雜度與單機解決此問題的時間復雜度之間的關(guān)系如下:

。定理6

假設(shè)并行計算機有d個主機節(jié)點,且每個節(jié)點有2個處理器,那么,并行計算機解決抗病毒問題的時間復雜度與單機解決此問題的時間復雜度之間的關(guān)系如下:。定理7

假設(shè)移動機器人的軟件系統(tǒng)由n個文件和m個文件夾組成,異體數(shù)據(jù)庫nonselfdb中共有K個已知異體,發(fā)生故障的機器人軟件系統(tǒng)中有k1個異體文件,其中k3個異體文件是該系統(tǒng)中正常文件的異常狀態(tài)。假設(shè)并行計算機有d個主機節(jié)點,且每個節(jié)點有2個處理器,那么,并行計算機解決抗病毒問題的時間復雜度與單機解決此問題的時間復雜度之間的關(guān)系如下:。2.免疫計算的算法設(shè)計基于正常模型和3層免疫計算模型,人工免疫系統(tǒng)的算法設(shè)計包括人工免疫系統(tǒng)的正常模型構(gòu)建算法設(shè)計、基于正常模型的自體/異體檢測算法設(shè)計、基于異體數(shù)據(jù)庫的異體識別算法設(shè)計、基于BP神經(jīng)網(wǎng)絡(luò)的未知異體識別算法設(shè)計、基于臨時數(shù)據(jù)庫的異體消除算法設(shè)計、基于正常模型的系統(tǒng)恢復算法設(shè)計和基于Java多線程技術(shù)的并行免疫計算算法設(shè)計。2.1人工免疫系統(tǒng)的正常模型構(gòu)建算法第1步對系統(tǒng)進行備份,提供該備份系統(tǒng)的根目錄路徑;第2步讀取系統(tǒng)的根目錄,從其根目錄中查找文件;第3步如果當前目錄中至少存在一個未讀取的文件或子文件夾,那么依次讀取當前選定文件或子文件夾的絕對路徑名和最后修改時間,否則進入第9步;第4步建立到自體數(shù)據(jù)庫的JDBC連接,對自體數(shù)據(jù)庫進行初始化;第5步將該文件或子文件夾的絕對路徑名和最后修改時間添加到該自體數(shù)據(jù)庫中;第6步關(guān)閉自體數(shù)據(jù)庫的當前數(shù)據(jù)庫連接;第7步如果剛處理的是子文件夾,那么遞歸構(gòu)建該文件夾所對應子系統(tǒng)的正常模型;第8步重復第3步;第9步如果已處理的文件有個,且已處理的文件夾有個,就結(jié)束算法。圖4用自體數(shù)據(jù)庫selfdb存儲的正常模型數(shù)據(jù)2.2

基于正常模型的自體/異體檢測算法第1步讀取系統(tǒng)的根目錄,從其根目錄中查找文件;第2步如果在當前目錄中至少存在一個未讀取的文件或文件夾,那么依次讀取當前選定文件或文件夾的絕對路徑名和最后修改時間,否則進入第9步;第3步建立到自體數(shù)據(jù)庫的JDBC連接;第4步用該文件或文件夾的絕對路徑名和最后修改時間查詢自體數(shù)據(jù)庫;第5步如果存在相匹配的記錄,那么該文件或文件夾標識為自體,否則標識為異體,并把其中的異體文件交由異體識別算法進行識別;第6步關(guān)閉自體數(shù)據(jù)庫的當前數(shù)據(jù)庫連接;第7步如果剛檢測的是子文件夾,那么遞歸檢測該文件夾所對應子系統(tǒng)中的各個文件;第8步重復第2步;第9步如果已處理的文件有個,且已處理的文件夾有個,就結(jié)束算法。圖5正常網(wǎng)頁系統(tǒng)的自體檢測2.3基于異體數(shù)據(jù)庫的異體識別算法第1步依次選定被檢測的異體文件,讀取其文件擴展名;第2步建立到異體數(shù)據(jù)庫的JDBC連接;第3步用該文件的擴展名查詢異體數(shù)據(jù)庫;第4步如果在異體數(shù)據(jù)庫中不存在與該異體文件的擴展名相匹配的記錄,那么該異體文件是未知的異體,需要用未知異體識別算法對它識別,否則從異體數(shù)據(jù)庫中讀取與之匹配的記錄,包括特征串、文件復制行為、對注冊表的行為和對郵件的調(diào)用等字段數(shù)據(jù);第5步關(guān)閉異體數(shù)據(jù)庫的當前數(shù)據(jù)庫連接;第6步讀取該文件的數(shù)據(jù),尋找與異體數(shù)據(jù)庫中記錄相匹配的特征串、文件復制行為、對注冊表的行為和對郵件的調(diào)用等信息,如果找到一致的特征匹配,那么該異體文件被識別為已知異體,在異體數(shù)據(jù)庫中已有其記錄,否則需要用未知異體識別算法對它識別;第7步關(guān)閉文件讀取器,結(jié)束算法。圖6已知異體識別算法的測試結(jié)果2.4基于BP神經(jīng)網(wǎng)絡(luò)的未知異體識別算法第1步,依次選定已知異體識別算法所不能識別的未知異體文件,讀取其第個特征;第2步建立到異體數(shù)據(jù)庫的JDBC連接;第3步查詢異體數(shù)據(jù)庫中所有已知異體的第個特征,計算查到的特征與未知異體的特征之間的相似度,選擇其中最大的相似度及其對應的特征編碼;第4步根據(jù)最大相似度及其對應的特征編碼,計算未知異體的第個特征所對應的不確定編碼;第5步關(guān)閉異體數(shù)據(jù)庫的當前數(shù)據(jù)庫連接,結(jié)束算法。圖7BP神經(jīng)網(wǎng)絡(luò)的訓練結(jié)果圖8BP神經(jīng)網(wǎng)絡(luò)對未知異體的識別結(jié)果2.5基于臨時數(shù)據(jù)庫的異體消除算法第1步如果存在未消除的異體文件,就依次讀取選定異體文件或文件夾的絕對路徑名,否則進入第8步;第2步如果該異體是文件,就建立到自體數(shù)據(jù)庫的JDBC連接,否則進入第7步;第3步用該異體文件的絕對路徑名查詢該自體數(shù)據(jù)庫;第4步如果找到與之匹配的記錄,就推斷該異體文件是原來的正常文件受異體感染而產(chǎn)生的,然后根據(jù)其絕對路徑名、系統(tǒng)的根目錄路徑和其備份系統(tǒng)的根目錄路徑生成該異體文件的備份文件路徑,并將該異體文件的絕對路徑名和備份文件路徑存入臨時數(shù)據(jù)庫usefulfile中;第5步如果該異體文件處于打開狀態(tài),就關(guān)閉該異體文件,然后刪除該異體文件;第6步關(guān)閉自體數(shù)據(jù)庫的當前數(shù)據(jù)庫連接;第7步如果該異體是子文件夾,并且該子文件夾非空,那么遞歸消除該文件夾中的異體文件;否則刪除該異體文件夾;第8步重復第1步;第9步如果已處理的異體有個,并且臨時數(shù)據(jù)庫usefulfile中有個記錄,就結(jié)束算法。圖9異體消除算法的測試結(jié)果圖10在臨時數(shù)據(jù)庫中添加了受異體感染的正常文件信息2.6基于正常模型的系統(tǒng)恢復算法第1步建立到自體數(shù)據(jù)庫的JDBC連接,并查詢該自體數(shù)據(jù)庫;第2步如果在自體數(shù)據(jù)庫中存在未讀取的記錄,依次讀取當前選定記錄的空間屬性,否則進入第5步;第3步如果該空間屬性所對應的文件不存在,就計算該文件的備份文件路徑,并用其備份文件恢復;第4步重復第2步;第5步關(guān)閉到自體數(shù)據(jù)庫的JDBC連接,并建立到臨時數(shù)據(jù)庫的JDBC連接;第6步如果在臨時數(shù)據(jù)庫中存在記錄,依次讀取當前選定的記錄,否則進入第9步;第7步根據(jù)該記錄的絕對路徑名和備份文件路徑,將相應的備份文件拷貝到該絕對路徑名所指定的位置;第8步重復第6步;第9步關(guān)閉臨時數(shù)據(jù)庫的當前數(shù)據(jù)庫連接,結(jié)束算法。圖11系統(tǒng)恢復算法的測試結(jié)果3.免疫計算的測不準特征在自然免疫系統(tǒng)中,抗體、免疫細胞和抗原都是納米量度的微觀世界事物,現(xiàn)有的生物醫(yī)學設(shè)備無法準確測量抗體識別未知異體的位置和時間,這和量子物理的盧森堡測不準原理類似,表現(xiàn)為微觀世界的測不準特征。這種生物醫(yī)學領(lǐng)域的測不準特征也影響到了人工免疫系統(tǒng)領(lǐng)域,因為人工免疫系統(tǒng)是根據(jù)生物醫(yī)學的免疫學說靈感啟發(fā)而設(shè)計的。在基于正常模型的人工免疫系統(tǒng)中,對未知異體的特征識別不可能是完全準確的,測量誤差和未知異體的復雜性是直接原因。因此,對未知異體的識別屬于非精確推理,這里采用相似度推理,尋找和未知異體最相似的已知異體。這種推理建立在概率和可信度的基礎(chǔ)上。所述未知異體的特征提取是和對已知異體的識別同步進行的,在讀取并通過異體數(shù)據(jù)庫匹配待識別異體的特征時,計算該異體的特征信息與異體數(shù)據(jù)庫中最相似的已知異體特征之間的相似度。該相似度是一種概率值,用來表示對待識別異體計算特征值的可信度。例如,蠕蟲病毒特征字符串的相似度是指在異體數(shù)據(jù)庫中和該特征串最相似的特征串與該特征串匹配的長度,除以最相似特征串的長度的比率,待識別蠕蟲病毒的特征字符串為“happybirthday”,在異體數(shù)據(jù)庫中和該特征串最相似的是已知蠕蟲病毒“歡樂時光”病毒的特征串“happytime”,這兩個特征串匹配的長度為6,歡樂時光”病毒的特征串長度為10,這樣其相似度為。因此,相似度必定為大于或等于0、小于或等于1的小數(shù),是一種概率,表示未知異體特征提取的不確定性。未知異體的特征編碼就是由在異體數(shù)據(jù)庫中與之最相似的特征所對應的編碼值和這兩個特征之間的相似度決定的。4.分布式人工免疫系統(tǒng)的魯棒性分析自然免疫系統(tǒng)是天然的并行、分布式生物信息處理系統(tǒng),人工免疫系統(tǒng)也具有分布式信息處理的特征。因此,根據(jù)已提出的多真體魯棒性歸約模型,可以用分布式系統(tǒng)的魯棒性分析方法分析人工免疫系統(tǒng)的魯棒性。問題歸約法是一種把問題由繁化簡、由多元轉(zhuǎn)化為一元的有效分析方法,用問題歸約法分析人工免疫系統(tǒng)的魯棒性,就能建立人工免疫系統(tǒng)的魯棒性歸約模型,并分析實際人工免疫系統(tǒng)的魯棒相關(guān)性。4.1人工免疫系統(tǒng)的分布式結(jié)構(gòu)人工免疫系統(tǒng)主要包括幾個相對獨立的計算模塊:正常模型生成模塊、自體/異體檢測模塊、已知異體識別模塊、未知異體學習模塊、異體消除模塊和系統(tǒng)修復模塊。在理想情況下各個計算模塊完全獨立,該人工免疫系統(tǒng)是一種對等型的分布式

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論