基于FPGA的三模冗余容錯(cuò)技術(shù)的研究_第1頁(yè)
基于FPGA的三模冗余容錯(cuò)技術(shù)的研究_第2頁(yè)
基于FPGA的三模冗余容錯(cuò)技術(shù)的研究_第3頁(yè)
基于FPGA的三模冗余容錯(cuò)技術(shù)的研究_第4頁(yè)
基于FPGA的三模冗余容錯(cuò)技術(shù)的研究_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于FPGA的三模冗余容錯(cuò)技術(shù)的研究摘要:基于SRAM的FPGA對(duì)于空間粒子輻射非常敏感,很容易產(chǎn)生軟故障,所以對(duì)基于FPGA的電子系統(tǒng)采取容錯(cuò)措施以防止此類故障的出現(xiàn)非常重要。通過(guò)對(duì)敏感電路使用三模冗余(TMR)方法并利用FPGA的動(dòng)態(tài)可重構(gòu)特性,可以有效的增強(qiáng)FPGA的抗單粒子性能,解決FPGA對(duì)因空間粒子輻射而形成的軟故障。1引言隨著現(xiàn)場(chǎng)可編程門(mén)陣列(FieldProgrammableGateArray,F(xiàn)PGA)技術(shù)的不斷發(fā)展,F(xiàn)PGA以其研發(fā)周期短、研發(fā)成本低等優(yōu)勢(shì),極大地提高了電子系統(tǒng)設(shè)計(jì)的靈活性和通用性,被廣泛地應(yīng)用在航天、通信、醫(yī)療、工控等各個(gè)領(lǐng)域?;赟RAM的現(xiàn)場(chǎng)可編程門(mén)陣列(FieldProgrammableGateArray,F(xiàn)PGA)對(duì)于帶電粒子的輻射特別敏感,尤其是近年來(lái)高密度集成芯片的出現(xiàn),電路容量增大、操作電壓降低使得它們?cè)谳椛洵h(huán)境下的可靠性降低。其中軟故障是主要的故障,它是由粒子和PN結(jié)相互作用引起的一種暫態(tài)故障,軟故障對(duì)在基于SRAM的FPGA上實(shí)現(xiàn)的電路具有特別嚴(yán)重的影響。三模冗余(TripleModularRedundancy,TMR)技術(shù)是一個(gè)被廣泛使用的針對(duì)FPGA上單粒子翻轉(zhuǎn)(Single-EventUpset,SEU)的容錯(cuò)技術(shù),可以大幅度提高FPGA在SEU影響下的可靠性。但是由于要實(shí)現(xiàn)額外的模塊與布線,它對(duì)硬件資源以及功耗消耗較大,而且工作速度也受到影響,這都限制了傳統(tǒng)TMR的使用。隨著電子技術(shù)特別是部分可重構(gòu)技術(shù)的發(fā)展,出現(xiàn)了多種改進(jìn)的TMR技術(shù),它們都有針對(duì)性地解決了傳統(tǒng)TMR方法所存在的問(wèn)題,使得TMR技術(shù)得到發(fā)展。2常規(guī)TMR方法及存在的問(wèn)題三重冗余技術(shù)的原理可以簡(jiǎn)單的理解為將同一個(gè)電路進(jìn)行三次復(fù)制,然后對(duì)這三個(gè)電路的輸出進(jìn)行“多數(shù)投票”仲裁,將其中至少有兩個(gè)相同的輸出結(jié)果作為最終的輸出。TMR是緩減SEU非常有效的技術(shù),但當(dāng)單粒子的能量足以引起三個(gè)單元中的兩個(gè)同時(shí)發(fā)生SEU時(shí),這種簡(jiǎn)單的TMR技術(shù)就會(huì)失效,但是這種情況發(fā)生的概率很低。所以TMR是現(xiàn)在比較有效且被大量使用的一種容錯(cuò)方法,被廣泛用于防止由輻射引起的SEU對(duì)系統(tǒng)的影響。傳統(tǒng)TMR方法可以有效提高設(shè)計(jì)的可靠性,但是它也存在很多不足之處:

1)它不能對(duì)出錯(cuò)的單元進(jìn)行修復(fù)。當(dāng)三個(gè)單元中的一個(gè)單元出錯(cuò)后,它只是將錯(cuò)誤通過(guò)多數(shù)表

決器屏蔽,但是錯(cuò)誤單元模塊仍然存在。而且一般的TMR也不能對(duì)錯(cuò)誤進(jìn)行檢測(cè)和定位,以便系統(tǒng)進(jìn)行修復(fù)。如果出現(xiàn)的錯(cuò)誤得不到及時(shí)修復(fù),那么當(dāng)再次出現(xiàn)錯(cuò)誤時(shí)TMR將失效。2)普通TMR資源開(kāi)銷(xiāo)大,資源利用率低。普通TMR是對(duì)整個(gè)設(shè)計(jì)或者較大的模塊進(jìn)行三模冗余,粒度比較大,它的資源開(kāi)銷(xiāo)相比原始電路增大300%。對(duì)整個(gè)電路或者模塊實(shí)現(xiàn)TMR,會(huì)造成資源浪費(fèi)。3)由于電路的倍增使得功耗增大,而且由于表決器的存在以及其他一些額外的布線使得速度降低。4)表決器本身也可能出錯(cuò),而一般的TMR的表決器沒(méi)有自檢錯(cuò)能力,也不具備抗輻射能力。5)當(dāng)采用三模冗余的電路驅(qū)動(dòng)沒(méi)有采用冗余電路時(shí),需要一個(gè)表決器將三個(gè)信號(hào)合為一個(gè)信號(hào)。當(dāng)沒(méi)有采用冗余的電路驅(qū)動(dòng)采用三模冗余電路時(shí)需要通過(guò)額外的布線將一路信號(hào)擴(kuò)展成為三路信號(hào)。因?yàn)檫壿嬰娐泛筒季€資源都對(duì)SEU敏感,所以這樣的結(jié)果會(huì)降低系統(tǒng)可靠性。3改進(jìn)的TMR方法1)動(dòng)態(tài)可重構(gòu)技術(shù)

由于TMR本身不具備錯(cuò)誤模塊修復(fù)能力,若僅一個(gè)模塊出現(xiàn)錯(cuò)誤時(shí),系統(tǒng)功能不受影響,但如果在另一個(gè)模塊出現(xiàn)錯(cuò)誤前不能對(duì)已出現(xiàn)的錯(cuò)誤模塊進(jìn)行修復(fù),那么冗余方法會(huì)失效。所以當(dāng)出現(xiàn)一個(gè)錯(cuò)誤的時(shí)候,必須及時(shí)地對(duì)出錯(cuò)的模塊進(jìn)行修復(fù)。利用FPGA局部動(dòng)態(tài)可重構(gòu)技術(shù)可以及時(shí)的對(duì)出錯(cuò)模塊進(jìn)行修復(fù)。動(dòng)態(tài)可重構(gòu)技術(shù)就是對(duì)基于SRAM編程技術(shù)FPGA的全部或部分邏輯資源實(shí)現(xiàn)在系統(tǒng)運(yùn)行時(shí)的動(dòng)態(tài)功能變換。系統(tǒng)重構(gòu)可分為靜態(tài)系統(tǒng)重構(gòu)和動(dòng)態(tài)系統(tǒng)重構(gòu)。前者指目標(biāo)系統(tǒng)的邏輯功能靜態(tài)重載,即FPGA芯片功能在外部邏輯的控制下,通過(guò)存儲(chǔ)于存儲(chǔ)器中不同的目標(biāo)系統(tǒng)數(shù)據(jù)的重新下載,實(shí)現(xiàn)芯片邏輯功能的改變。對(duì)一個(gè)常規(guī)SRAM編程的FPGA,只能用于實(shí)現(xiàn)靜態(tài)系統(tǒng)重構(gòu)。后者是指對(duì)于時(shí)序變化

的數(shù)字邏輯系統(tǒng),其時(shí)序邏輯的發(fā)生不是通過(guò)調(diào)用芯片內(nèi)不同區(qū)域、不同邏輯資源來(lái)組合而成,而是通過(guò)對(duì)具有專門(mén)緩存邏輯資源的FPGA,進(jìn)行局部和全局芯片邏輯的動(dòng)態(tài)重構(gòu)(或稱修改)而快速實(shí)現(xiàn)。動(dòng)態(tài)可重構(gòu)FPGA內(nèi)部邏輯塊和內(nèi)連線的改變,可以通過(guò)讀取不同的SRAMbit數(shù)據(jù)來(lái)直接實(shí)現(xiàn)這樣的邏輯重建,時(shí)間往往在納秒量級(jí),有助于實(shí)現(xiàn)FPGA系統(tǒng)邏輯功能的動(dòng)態(tài)重構(gòu)。由于對(duì)于空間電子系統(tǒng)來(lái)說(shuō)影響最嚴(yán)重的是SEU等軟故障,而軟故障可以通過(guò)重構(gòu)來(lái)解決,所以周期性地對(duì)配置存儲(chǔ)器進(jìn)行刷新可以實(shí)現(xiàn)對(duì)這類錯(cuò)誤的修復(fù)。TMR電路可以設(shè)計(jì)出具有檢錯(cuò)和定位功能的表決器,當(dāng)某個(gè)模塊出錯(cuò)時(shí),表決器的信號(hào)直接觸發(fā)重構(gòu)功能,動(dòng)態(tài)地只對(duì)出錯(cuò)部分的電路進(jìn)行重構(gòu)。這樣可以解決定時(shí)刷新時(shí)產(chǎn)生的時(shí)間和功耗問(wèn)題,并為防止錯(cuò)誤積累提供了解決途徑。為了防止表決器出錯(cuò),表決器可以采用對(duì)輻射不敏感的器件來(lái)實(shí)現(xiàn)而替代基于SRAM的材料,這樣提高了表決器的穩(wěn)健性。改進(jìn)的表決器不再使用多數(shù)表決器對(duì)三個(gè)冗余模塊的輸出進(jìn)行表決,而是將三個(gè)冗余模塊相應(yīng)的輸出通過(guò)三態(tài)緩沖器和少數(shù)表決器后分別由FPGA的三個(gè)輸出管腳輸出,最后在印刷電路板(PCB)上“線或”為一個(gè)信號(hào)。少數(shù)表決器電路負(fù)責(zé)判斷本冗余模塊的信號(hào)是否是少數(shù)值,如果是少數(shù)值,則相對(duì)應(yīng)的緩沖器輸出高阻,如果不是,則使相應(yīng)的信號(hào)正常輸出。Readback是在動(dòng)態(tài)可重構(gòu)的基礎(chǔ)上發(fā)展起來(lái)的,它是指將配置數(shù)據(jù)回讀與最初的配置數(shù)據(jù)進(jìn)行比較,發(fā)現(xiàn)錯(cuò)誤后進(jìn)行重構(gòu),另外還可以采用糾錯(cuò)碼來(lái)保護(hù)配置數(shù)據(jù)。每一個(gè)配置幀的數(shù)據(jù)被12位的see-dec漢明碼保護(hù),而且FPGA中每個(gè)基本單元的識(shí)別碼都不一樣,通過(guò)ICAP(InternalConfigurationAccessPort)回讀配置文件后,糾錯(cuò)碼可以給出錯(cuò)位的位置。動(dòng)態(tài)可重構(gòu)技術(shù)可以在不中斷電路工作的情況下修復(fù)SEU在LUT、布線矩陣和CLB中造成的功能錯(cuò)誤,有效的增強(qiáng)FPGA電路的抗單粒子能力。2)局部敏感電路TMR技術(shù)

隨著部分動(dòng)態(tài)重構(gòu)技術(shù)的出現(xiàn),可以使用局部敏感電路TMR方法。以較小的粒度為步長(zhǎng),采用合理的布局布線實(shí)現(xiàn)TMR以達(dá)到要求的資源開(kāi)銷(xiāo)并得到最大的可靠性。由于資源有限,因此在無(wú)法實(shí)現(xiàn)全局TMR的情況下,對(duì)局部敏感電路進(jìn)行TMR是一個(gè)較好的選擇,可以在使用較少資源的情況下提高系統(tǒng)的可靠性。由于不是對(duì)所有的模塊都采用冗余措施,所以在實(shí)現(xiàn)的時(shí)候必須著重于對(duì)那些可以相對(duì)更高地提高系統(tǒng)可靠性的模塊應(yīng)用TMR技術(shù)。此時(shí)表決器的數(shù)量和位置也是一個(gè)需要考慮的問(wèn)題。由于采用三模冗余的模塊前后需要額外的布線,而邏輯電路和布線資源都對(duì)SEU敏感,所以這樣的結(jié)果會(huì)降低系統(tǒng)可靠性。為了選擇需要進(jìn)行三模冗余的模塊并進(jìn)行合理的布局布線,將系統(tǒng)出現(xiàn)的錯(cuò)誤分為持續(xù)性錯(cuò)誤和非持續(xù)性錯(cuò)誤。持續(xù)性錯(cuò)誤是指由SEU產(chǎn)生的改變了電路內(nèi)部狀態(tài)的錯(cuò)誤;非持續(xù)性錯(cuò)誤是指可以通過(guò)FPGA重構(gòu)而消除的錯(cuò)誤,而持續(xù)性錯(cuò)誤在重構(gòu)后依然存在。結(jié)合以上的分析,實(shí)施部分TMR的優(yōu)先級(jí)別如下:

第一級(jí)是會(huì)產(chǎn)生持續(xù)性錯(cuò)誤的部分。

第二級(jí)是會(huì)導(dǎo)致能產(chǎn)生連續(xù)性錯(cuò)誤電路部分出錯(cuò)的電路,以降低TMR和非TMR之間的轉(zhuǎn)換為準(zhǔn)則。

第三級(jí)是會(huì)產(chǎn)生持續(xù)性錯(cuò)誤電路的前向部分,同樣以降低TMR和非TMR之間的轉(zhuǎn)換為準(zhǔn)則。

第四級(jí)是與會(huì)產(chǎn)生持續(xù)性錯(cuò)誤電路部分獨(dú)立的部分??梢酝ㄟ^(guò)靜態(tài)分析來(lái)對(duì)電路進(jìn)行劃分。這里存在的問(wèn)題是在標(biāo)準(zhǔn)的全局TMR中,所有的輸入、輸出以及時(shí)鐘都進(jìn)行了三模冗余,而使用部分TMR時(shí),對(duì)I/O以及時(shí)鐘的冗余有可能不能被實(shí)現(xiàn)。和沒(méi)有采用TMR的邏輯電路一樣,沒(méi)有進(jìn)行TMR的時(shí)鐘和I/O同樣可以產(chǎn)生不能被檢測(cè)的錯(cuò)誤。由實(shí)驗(yàn)結(jié)果來(lái)看,由于此方法主要著重于能產(chǎn)生持續(xù)性錯(cuò)誤的電路部分,所以當(dāng)所使用的冗余資源增多時(shí),持續(xù)性錯(cuò)誤出現(xiàn)的幾率很快降低,最終幾乎全部被克服掉。所以采用部分TMR可以在資源和可靠性間達(dá)到平衡,在最小限度影響可靠性的條件下,最大限度地提高資源利用率。4結(jié)束語(yǔ)隨著FPGA突飛猛進(jìn)的發(fā)展,芯片的集成度越來(lái)越高,其工作電壓不斷降低,導(dǎo)致

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論