《嵌入式系統(tǒng)原理與技術(shù)》課件第5章-研究生-節(jié)能_第1頁
《嵌入式系統(tǒng)原理與技術(shù)》課件第5章-研究生-節(jié)能_第2頁
《嵌入式系統(tǒng)原理與技術(shù)》課件第5章-研究生-節(jié)能_第3頁
《嵌入式系統(tǒng)原理與技術(shù)》課件第5章-研究生-節(jié)能_第4頁
《嵌入式系統(tǒng)原理與技術(shù)》課件第5章-研究生-節(jié)能_第5頁
已閱讀5頁,還剩104頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、介紹-節(jié)能需求嵌入式設(shè)備多為電池供電如一個(gè)無線傳感網(wǎng)(WSN)的節(jié)點(diǎn)可能由電池供電工作若干年嵌入式手持設(shè)備向移動(dòng)多媒體終端發(fā)展多媒體功能對電池的消耗巨大合理利用電池的容量,延長電池的使用時(shí)間已經(jīng)是制約嵌入式設(shè)備發(fā)展的一個(gè)重要問題高性能計(jì)算領(lǐng)域的高能耗密度有迫切的節(jié)能需求1介紹-節(jié)能的方法改進(jìn)芯片制造工藝設(shè)計(jì)芯片節(jié)能體系結(jié)構(gòu)在硬件支持下的軟件節(jié)能為系統(tǒng)提供合適的資源讓多余的資源休眠不同的節(jié)能技術(shù)應(yīng)用于計(jì)算機(jī)系統(tǒng)的各個(gè)方面現(xiàn)階段的研究工作各自關(guān)注不同的節(jié)能領(lǐng)域軟硬件,OS和編譯器協(xié)同2介紹-節(jié)能技術(shù)分布于系統(tǒng)各處34Outline硬件節(jié)能基礎(chǔ)功耗定義硬件低功耗設(shè)計(jì)基礎(chǔ)體系結(jié)構(gòu)低功耗設(shè)計(jì)業(yè)界動(dòng)態(tài)、發(fā)

2、展趨勢和國際標(biāo)準(zhǔn)軟件節(jié)能研究系統(tǒng)軟件層應(yīng)用軟件層軟件節(jié)能技術(shù)應(yīng)用實(shí)例嵌入式設(shè)備電信設(shè)備5硬件節(jié)能基礎(chǔ)功耗定義硬件低功耗設(shè)計(jì)基礎(chǔ)業(yè)界動(dòng)態(tài)發(fā)展趨勢國際組織功效的重要性現(xiàn)在便攜式手持設(shè)備的功能變得越來越強(qiáng)大,功能越來越豐富。 便攜式手持設(shè)備對電池的需求呈上升趨勢。而嵌入式系統(tǒng)都是通過電池供電。合理利用電池的容量,延長電池的使用時(shí)間已經(jīng)是制約嵌入式設(shè)備發(fā)展的一個(gè)重要問題。 6能耗定義power、energy 定義power的意思就是功率;而energy的意思是能量,就是J。EnergyPowerT(時(shí)間)。CMOS電路的功耗Pwhole_system=Pstatic+PdynamicPstatic也被

3、稱為leakage power7能耗定義動(dòng)態(tài)功耗的產(chǎn)生動(dòng)態(tài)能耗主要是由于系統(tǒng)的某個(gè)加法器或者寄存器的輸入發(fā)生變化而產(chǎn)生。這主要是由電容的狀態(tài)發(fā)生變化和短路電流造成的(switched capacitance and short-circuit current.)。其中switched capacitance是動(dòng)態(tài)能耗的主要來源,他的產(chǎn)生主要是因?yàn)殡娙莸某浞烹?。short-circuit current是動(dòng)態(tài)能耗的第二部分,他約占能耗的10到15 8能耗定義動(dòng)態(tài)功耗計(jì)算PdynamicacV2fC表示電路負(fù)載(電容)大小,V表示供電電壓,f為工作頻率 幾種降低CMOS電路功耗的手段降低C降低V選

4、擇能滿足所需性能的最低時(shí)鐘頻率,然后,在時(shí)鐘頻率和各種系統(tǒng)不見要求的限制范圍內(nèi),設(shè)定盡量低的電源電壓。降低f選擇能滿足所需性能的最低時(shí)鐘頻率9能耗定義靜態(tài)功耗計(jì)算靜態(tài)功耗又稱為idle power或者leakageCMOS工藝晶體管的靜態(tài)功耗已微不足道。但是為了獲得高速度和高集成度特性,芯片的工藝尺寸就要成幾何級(jí)數(shù)減小,這樣會(huì)使芯片的靜態(tài)(漏)功耗有所增加。例如,采用0.13mm工藝時(shí),芯片的靜態(tài)功耗大約占總功率的1520。當(dāng)工藝技術(shù)提高到100nm以下時(shí),靜態(tài)功耗將成指數(shù)倍數(shù)增加,并將成為處理器芯片功耗的主要部分 10能耗定義靜態(tài)功耗計(jì)算PleakageVIleakageV為供電電壓, Il

5、eakage為漏電流降低靜態(tài)功耗的手段(工藝手段)降低功耗電壓減小芯片面積降低芯片表面溫度 降低閾值電壓11硬件低功耗設(shè)計(jì)基礎(chǔ)Reduce Sizing通過減少晶體管的寬度來降低動(dòng)態(tài)功耗但是在減少晶體管寬度的同時(shí),增加了晶體管的延時(shí)所以,使用這種技術(shù)的前提是必須根據(jù)電路對延時(shí)的要求,即電路中兩個(gè)晶體管的距離,然后在這個(gè)要求下,盡量的降低能耗。12硬件低功耗設(shè)計(jì)基礎(chǔ)晶體管重組晶體管的排列方式影響芯片的能耗Transistor reordering技術(shù)主要是通過對晶體管進(jìn)行重排,減少晶體管的沖放電活動(dòng),達(dá)到節(jié)能的目的。13一條設(shè)計(jì)原則盡量將沖放電活動(dòng)頻繁的晶體管放在電路的出口處防止因?yàn)橐粋€(gè)晶體管的

6、沖放電活動(dòng)引起大量的其他晶體管沖放電活動(dòng)的多米諾骨牌效應(yīng)的產(chǎn)生。硬件低功耗設(shè)計(jì)基礎(chǔ)Half Frequency and Half Swing Clocks 原來寄存器的更新是在時(shí)鐘的上升延進(jìn)行的,每個(gè)時(shí)鐘只能更新一次數(shù)據(jù)現(xiàn)在就是讓他在時(shí)鐘下降延的時(shí)候也更新寄存器的值這樣就可以降低系統(tǒng)的時(shí)鐘。同時(shí)他還可以帶來降低驅(qū)動(dòng)電壓的好處。 14硬件低功耗設(shè)計(jì)基礎(chǔ)邏輯門重構(gòu)15舉例:假設(shè)現(xiàn)在又4個(gè)輸入?yún)?shù)A、B、C、D,要計(jì)算A AND B AND C AND那么就有下面兩個(gè)基本的電路。假設(shè)四個(gè)參數(shù)為真的概率都為0.5,那么我們就可以計(jì)算3個(gè)與門輸出從0到1的變化概率。我們可以發(fā)現(xiàn)兩種不同排列方式下,門的變

7、化概率是不一樣的,這就帶來了不同的能耗,所以在設(shè)計(jì)的時(shí)候得考慮門的排列方式。硬件低功耗設(shè)計(jì)基礎(chǔ)Technology Mapping 由于門之間存在大量不同排列,以及不同的延時(shí),一般情況下必須得使用工具才能實(shí)現(xiàn)門的低功耗排列。Technology Mapping 是在各種約束(比如:面積、延時(shí)、功耗等)下對門進(jìn)行排列的工具。對門的排列是一個(gè)NP-hard Directed Acyclic Graph (DAG)問題Technology Mapping解決上面NP問題的方法是將DAG劃分為一組樹,然后使用standard tree-covering算法來獲得最優(yōu)化的結(jié)果16硬件低功耗設(shè)計(jì)基礎(chǔ)Low

8、 Power Flip-Flops Flip-Flops是小型存儲(chǔ)器(比如寄存器)的基本元件。一種典型的master slave flip-flop包括兩部分,一個(gè)是master鎖,一個(gè)是slave鎖。當(dāng)時(shí)鐘為高的時(shí)候,master鎖開啟并輸入數(shù)據(jù),同時(shí)把數(shù)據(jù)輸出給slave鎖,而此時(shí)slave鎖關(guān)閉。當(dāng)時(shí)鐘為低的時(shí)候,master關(guān)閉并保存數(shù)據(jù),而此時(shí)slave鎖開啟并輸入數(shù)據(jù),同時(shí)把數(shù)據(jù)輸出。Flip-Flops的能量主要消耗在:時(shí)鐘信號(hào)的變化內(nèi)部數(shù)據(jù)的轉(zhuǎn)換輸出數(shù)據(jù)的變化低功耗Flip-Flops 設(shè)計(jì)self-gating flip-flop當(dāng)輸入數(shù)據(jù)和當(dāng)前存儲(chǔ)的數(shù)據(jù)相等時(shí),將時(shí)鐘信號(hào)屏

9、蔽,不產(chǎn)生觸發(fā)conditional dischargeflip-flops通過排除一些無必要的預(yù)充電和放電來節(jié)省能量dual edge triggered FLIP-FLOP在時(shí)鐘上下延都可進(jìn)行工作的方法,降低時(shí)鐘的頻率17硬件低功耗設(shè)計(jì)基礎(chǔ)低功耗控制邏輯設(shè)計(jì)處理器的控制邏輯可以使用有限狀態(tài)機(jī)表示低功耗控制邏輯設(shè)計(jì)方法通過對有限狀態(tài)機(jī)的狀態(tài)進(jìn)行編碼,降低處理器在各個(gè)狀態(tài)之間的轉(zhuǎn)換頻率將有限狀態(tài)機(jī)按功能分解為各個(gè)子系統(tǒng),每次只打開那些當(dāng)前操作需要部分的控制邏輯18硬件低功耗設(shè)計(jì)基礎(chǔ)Delay-Based Dynamic-Supply Voltage Adjustment 通用處理器現(xiàn)在都可以運(yùn)

10、行在不同的幾個(gè)頻率下面。處理器通過查看一個(gè)叫做lookup table的表為現(xiàn)在所用的處理器頻率選擇一個(gè)相應(yīng)的電壓 這個(gè)表一般是通過使用worst-case的方式提前決定的。但是這種方式不一定反映真實(shí)的運(yùn)行情況。 Arm公司開發(fā)了一種叫做Razor pipeline的技術(shù)來取代這種lookup table的技術(shù)。這種方法通過芯片的延時(shí)長度來決定使用哪種處理器電壓。 處理器的電壓被降低后,處理器的速度也會(huì)被降低,如果當(dāng)時(shí)的處理器頻率太高,則會(huì)產(chǎn)生time error。由于time error一些指令結(jié)果會(huì)產(chǎn)生錯(cuò)誤,或者結(jié)果不一致的情況。Razor pipeline通過監(jiān)視這種錯(cuò)誤的產(chǎn)生數(shù)量,當(dāng)這

11、種錯(cuò)誤的數(shù)量超過一定的值后,Razor pipeline就會(huì)要求調(diào)高處理器的內(nèi)核電壓值,如果產(chǎn)生的值小于某個(gè)值的時(shí)候就可以降低處理器的內(nèi)核電壓,更大的降低系統(tǒng)的能耗。19硬件低功耗設(shè)計(jì)基礎(chǔ)總線倒置技術(shù)每一次在總線上傳輸數(shù)據(jù)的時(shí)候,多少根線的電平要進(jìn)行狀態(tài)轉(zhuǎn)換必須得由本次要傳輸?shù)臄?shù)據(jù)和上次傳輸?shù)臄?shù)據(jù)決定。當(dāng)兩個(gè)數(shù)據(jù)之間的差距大于一般的數(shù)據(jù)線的數(shù)量時(shí),那么就有很多根線要進(jìn)行電平的轉(zhuǎn)換。為了防止這種事情的發(fā)生就產(chǎn)生了一種技術(shù)叫做bus-inversion (總線倒置)bus-inversion:通過使用一種智能化的總線編碼技術(shù)減少總線上的開關(guān)次數(shù)For example, 如果當(dāng)前要傳輸?shù)臄?shù)據(jù)為 11

12、0 而上次剛傳輸?shù)臄?shù)據(jù)為 000, 那總線就傳輸 110 的倒置001過去,這樣就減少了電平的轉(zhuǎn)換次數(shù)。由于這種技術(shù)需要其他芯片,所以一般情況下時(shí)用在外部總線上的,而內(nèi)部總線一般不用。這種技術(shù)在研究者之間也造成了相應(yīng)的爭議,這種方法簡單的將總線能耗歸結(jié)到總線上傳輸?shù)淖址?。20硬件低功耗設(shè)計(jì)基礎(chǔ)總線干擾消除技術(shù)隨著芯片的小型化,還有一種crosstalk的問題產(chǎn)生,他也同樣消耗了很多能量。所謂CrossTalk就是干擾,有可能某根線由于旁邊線上的高頻而產(chǎn)生高頻,改變了線上原有的信號(hào)。這種現(xiàn)象可以造成總線的延時(shí)和信任度的降低,同時(shí)造成系統(tǒng)能耗的增加。一種消除CrossTalk的技術(shù)是在相鄰總線

13、間插入絕緣層。還有一種不使用絕緣層的方法就是self-shielding codes。這種技術(shù)先把要傳輸?shù)臄?shù)據(jù)進(jìn)行編碼,然后在傳輸。21硬件低功耗設(shè)計(jì)基礎(chǔ)Low Swing Buses Low Swing Buses技術(shù)就是在較低電平上傳輸同樣的信息。通常情況下,邏輯0是用5V電壓表示的,而邏輯1是用5V電壓表示,而在Low Swing Buses技術(shù)中,邏輯10分別可以用更低的電壓來表示,比如用300mv300mv表示。22硬件低功耗設(shè)計(jì)基礎(chǔ)總線分割技術(shù) 傳統(tǒng)的共享數(shù)據(jù)總線的體系結(jié)構(gòu),在每次總線訪問的時(shí)候都會(huì)有充電和放電的工作。而Segmentation技術(shù)是把傳統(tǒng)的總線分成多個(gè)不同的seg

14、ment,然后通過一種link把他們鏈接起來,同時(shí)這個(gè)link控制著相鄰兩個(gè)segment之間的交通。Links的主要目的就是將不同的通訊活動(dòng)獨(dú)立起來,這樣就可以保證其他的segment在低電平下工作。理想狀態(tài)下,要盡量將活動(dòng)頻繁的通訊工作放在同一個(gè)segment或者相鄰的區(qū)域內(nèi)這樣就能防止過多的啟動(dòng)不同的segment。 23硬件低功耗設(shè)計(jì)基礎(chǔ)adiabatic circuits還有一種方式叫做adiabatic circuits,他通過減少整體的電容量來節(jié)能。這種芯片通過重用已經(jīng)存在的電荷來減少新電荷的產(chǎn)生。24小結(jié)芯片節(jié)能優(yōu)點(diǎn)從底層解決問題對系統(tǒng)造成的影響小節(jié)能技術(shù)的應(yīng)用代價(jià)小缺點(diǎn)缺少對

15、系統(tǒng)的整體把握無法處理宏觀的問題25低功耗體系結(jié)構(gòu)設(shè)計(jì)拆分存儲(chǔ)器在memory access中降低能耗的最好方法就是只打開需要訪問的那部分memory?,F(xiàn)在采用的就是將memory拆分成小的、而且獨(dú)立的單元。根據(jù)單元大小的不同可以拆分成不同的粒度。每個(gè)不同的單元具有自己的控制信號(hào)目前大部分的嵌入式處理器具有該功能,能把cache部分激活26低功耗體系結(jié)構(gòu)設(shè)計(jì)插入特殊cacheFilter cache新插入的cache位于processor和原來第一層cache之間。這個(gè)cache比第一層cache要小很多,他將消耗更少的能量。但是他又必須足夠大到存儲(chǔ)一個(gè)應(yīng)用程序的工作集,這樣就能過濾掉許多的m

16、emory reference。只有當(dāng)數(shù)據(jù)在這個(gè)cache中沒有找到,才會(huì)去下面的cache中找,這樣就會(huì)有一個(gè)懲罰就是要更多的memory reference。這就是所謂的Filter cache的基本原則 。27低功耗體系結(jié)構(gòu)設(shè)計(jì)trace cacheTrace cache通過保存程序運(yùn)行時(shí)指令順序,而不是編譯后程序的指令順序。如果一組指令序列已經(jīng)在Trace cache中,那么就可以直接從trace cache中得到,而不用再次訪問指令寄存器。trace cache的整體結(jié)構(gòu) :28低功耗體系結(jié)構(gòu)設(shè)計(jì)trace cachetrace cache 工作舉例29低功耗體系結(jié)構(gòu)設(shè)計(jì)Adapti

17、ve Caches Cache可以根據(jù)一個(gè)程序的運(yùn)行狀況,動(dòng)態(tài)的選擇active幾個(gè)cache存儲(chǔ)的單元(可以是lines,可以是blocks,也可以是sets)。Deep-Submicron Instruction (DRI) cache就是一個(gè)例子。這種cache可以允許根據(jù)每個(gè)sets的電壓值,來active需要的cache元素 30硬件低功耗設(shè)計(jì)基礎(chǔ)自適應(yīng)的指令發(fā)射隊(duì)列 將一個(gè)指令隊(duì)列分為多個(gè)部分,每部分都可以被單獨(dú)active。每一個(gè)部分都有一個(gè)wakeup的邏輯電路,決定什么時(shí)候指令可以被執(zhí)行,然后將指令讀出送到流水線中。任何時(shí)候只有那個(gè)包含當(dāng)前指令的partition才被acti

18、ve。很多啟發(fā)性算法也被開發(fā)出來管理這個(gè)隊(duì)列。有些算法需要評估IPC(Instructions per clock cycle)。算法周期性的測量IPC的值,如果當(dāng)前時(shí)間間隔的IPC小于上個(gè)周期的IPC,啟發(fā)算法加大instruction queue的容量,增大處理器的output。相應(yīng)的就減少instruction queue的容量。 31小結(jié)芯片體系結(jié)構(gòu)節(jié)能優(yōu)點(diǎn)從架構(gòu)上解決問題節(jié)能技術(shù)效果好代價(jià)小缺點(diǎn)主要針對存儲(chǔ)器會(huì)影響原架構(gòu)32軟件、硬件節(jié)能業(yè)界動(dòng)態(tài)33降低CPU功耗DVS/DVFSDVS技術(shù)主要解決了一個(gè)頻率與內(nèi)核電壓同步調(diào)整的協(xié)同和模塊化問題。使用這個(gè)技術(shù)的前提是,處理器的負(fù)載一直在

19、變,當(dāng)處理器的利用率比較低的時(shí)候可以通過DVS技術(shù)slow down處理器,但是不能因此而影響性能。P=VDD2fCLKCEFFDVS技術(shù)的使用,關(guān)鍵是對系統(tǒng)未來負(fù)載的預(yù)測。注意:DVS技術(shù)降低的是動(dòng)態(tài)能耗!DVS調(diào)度的原則提供合適而不是過多的計(jì)算能力DVS由處理器提供調(diào)頻能力,其他工作由OS等軟件完成Month dd, yyyy34降低CPU功耗GALSGlobally Asynchronous, Locally Synchronous (GALS)是一種整體異步、個(gè)體同步的芯片。他將自己劃分成不同的域,每個(gè)域都有自己的一個(gè)時(shí)鐘。在一個(gè)domain里面是同步的,而在domains之間是異步的

20、。這樣有幾個(gè)好處:第一、由于時(shí)鐘信號(hào)只在小范圍內(nèi)傳播,所以不會(huì)由于時(shí)鐘傳播路徑太長而造成歪斜;第二、內(nèi)部時(shí)鐘的改變對外部的domain幾乎沒有影響。在普通的處理器中,如果改變時(shí)鐘頻率將會(huì)影響到所有接受這個(gè)時(shí)鐘的部件,造成整體性能的降低。在這種GALS的芯片中,可以降低某個(gè)模塊的頻率而不影響其他模塊的工作。35降低CPU功耗Intel EISTIntel的EIST全稱為Enhanced Intel SpeedStep TechnologyEIST能夠根據(jù)不同的系統(tǒng)工作量自動(dòng)調(diào)節(jié)處理器的電壓和頻率,以減少功耗和發(fā)熱量對操作系統(tǒng)提供軟件接口Intel PM處理器提供6個(gè)可運(yùn)行的處理器和頻率組(Px)

21、,以及C1、C2、C3(ACPI定義)狀態(tài)Month dd, yyyy366個(gè)狀態(tài)37S0 正常,80WS1 POS(Power on Suspend),CPU停止工作S2 CPU關(guān)閉S3 STR(Suspend to RAM)除了內(nèi)存外的部件都停止工作,功耗不超過10WS4 STD(Suspend to Disk),內(nèi)存信息寫入硬盤,所有部件停止工作S5 關(guān)閉降低CPU功耗AMD PowerNow! 和Cool n Quiet ,AMD臺(tái)式機(jī)CPU的節(jié)能技術(shù)名為CoolnQuiet,這是AMD第一種用于臺(tái)式機(jī)處理器的節(jié)能技術(shù)當(dāng)處理器的任務(wù)不是很重時(shí),廠商采取的方法是根據(jù)CPU任務(wù)量的多少調(diào)用

22、和關(guān)閉一些晶體管,可大幅減輕散熱系統(tǒng)的壓力,所以又被形象地稱為“涼又靜”。 Month dd, yyyy38降低CPU功耗ARM IEMIntelligent Energy Management Software (IEM)由ARM開發(fā),用來根據(jù)處理器的workload調(diào)整系統(tǒng)的處理器頻率IEM(Intelligent Energy Management)通過三個(gè)層次的算法來決定處理器的頻率和電壓。最底層是一個(gè)baseline的啟發(fā)算法,他根據(jù)以前的workload,來判斷將來的workload,然后調(diào)整系統(tǒng)的處理器狀態(tài)。最上層是一個(gè)適合多媒體應(yīng)用和交互的,主要是用來決定一個(gè)程序跑多快,就不會(huì)

23、影響程序給用戶的performance。在這兩層中間是一個(gè)通訊層,主要是提供應(yīng)用程序和自己的workload requirement 直接通訊用的。三層預(yù)測的結(jié)果通過每層的一個(gè)信心指數(shù)進(jìn)行加權(quán)合并。 39降低CPU功耗NI AVSPowerwise Adaptive Voltage Scaling(AVS)由國家半導(dǎo)體開發(fā),AVS根據(jù)處理器的溫度和各種環(huán)境的變化,調(diào)整處理器內(nèi)核電壓和頻率AVS的主要目的就是為確定的處理器頻率選擇一個(gè)最小的處理器內(nèi)核電壓。一般情況下他們通過一個(gè)在worstcase情況下面測試出來的表,來決定特定處理器頻率下面的電壓,這個(gè)往往不是最優(yōu)的而AVS技術(shù)采用了一個(gè)反饋機(jī)

24、制。他通過觀察處理器的的溫度以及周邊環(huán)境的變化來決定,對處理器的電壓進(jìn)行微調(diào)。 40降低LCD功耗Display Power Saving Technology (DPST)能夠通過管理圖像的亮度和對比度并動(dòng)態(tài)降低背光亮度來達(dá)到降低顯示屏能耗的目的分析顯示的數(shù)據(jù)- 調(diào)整圖片的亮度- 調(diào)整背光- 獲得新的圖片PRC Tracing Technology降低LCD功耗Dynamic Display Power Optimization (D2PO) 英特爾與東芝松下顯示技術(shù)公司合作開發(fā)的一種新概念液晶屏省電技術(shù)。該技術(shù)可以將靜態(tài)模式下液晶屏的能耗降低25%,節(jié)能效果極其顯著。通過一顆顯示分析芯片來

25、確定用戶當(dāng)前顯示的是靜態(tài)內(nèi)容還是動(dòng)態(tài)內(nèi)容,如果是靜態(tài)顯示,那么屏幕的刷新率會(huì)從標(biāo)準(zhǔn)的60Hz降低到30Hz的隔行刷新Month dd, yyyyPRC Tracing Technology42降低LCD功耗Display Refresh Rate Switching只能在progressive-scan mode下工作根據(jù)負(fù)載和策略動(dòng)態(tài)調(diào)整Refresh Rate PRC Tracing Technology小結(jié)節(jié)能硬件解決方案方面主要關(guān)注了CPU與外設(shè)一般自動(dòng)完成提供API接口商業(yè)系統(tǒng)介紹The Pentium 4 Processor. The Pentium M Processor The

26、 intel Core DuoThe Intel PXA27x Processors. The Transmeta Crusoe Processor IBM Dynamic Power Management Powerwise and Intelligent Energy Management 電池新技術(shù)45The Pentium 4 Processor處理器的發(fā)熱量限制了主頻的不斷提高溫度測試機(jī)制在處理器中為了降低處理器的發(fā)熱量,處在一個(gè)安全的范圍之內(nèi)溫度超范,通過約束處理器的頻率來降低系統(tǒng)的溫度處于處理器最熱處的溫度傳感器處理器的溫度進(jìn)入一個(gè)危險(xiǎn)的區(qū)域向處理器發(fā)送一條叫做STOPCLOCK

27、的請求降低處理器的功率P4的問題在一定程度上反映了高性能計(jì)算遇到的能耗問題向上層提供了接口,為編譯器,OS的低功耗工作提供一定的接口。 Pentium4處理還提供一種根據(jù)ACPI標(biāo)準(zhǔn)確定的低功耗工作狀態(tài),可以通過軟件來控制。處理器提供了一種特殊的寄存器,可以通過軟件來修改處理器的頻率。還提供SeedStep技術(shù),提供兩種處理器頻率和電壓 46The Pentium M ProcessorPentium M處理器的出發(fā)點(diǎn)是一種performance和能耗的平衡。為了節(jié)省能耗,他采用了三種策略,分別為:減少執(zhí)行的指令數(shù)或者微指令數(shù)的;減少電路的轉(zhuǎn)換次數(shù);減少每一個(gè)晶體管的能量消耗。Pentium

28、M處理器采用了多種技術(shù)來減少電路的轉(zhuǎn)換次數(shù):使用硬件單元來預(yù)測閑置單元;通過抑止總線時(shí)鐘,使得只有需要數(shù)據(jù)傳輸?shù)膯卧猘ctive;還有一種叫做Execution Stack的技術(shù),將實(shí)現(xiàn)同樣功能的部件放到同一個(gè)區(qū)域,這樣處理器就可以根據(jù)實(shí)現(xiàn)的功能,有選擇active某部分需要的區(qū)域。為了減少靜態(tài)能耗,處理器在cache中采用了一種low leakage的晶體管。同時(shí)他還支持6中不同的處理器頻率(SpeedStep 技術(shù)) 47節(jié)能體系-Intel Core Duo節(jié)能設(shè)計(jì)介紹Intel Core Duo雙核芯片CMP(CMP,Chip Multi-Processor)2個(gè)Pentium M核共

29、享L2 cache節(jié)能技術(shù)enhanced sleep states controlDynamic Intel Smart cache sizing48節(jié)能體系-Intel Core Duo節(jié)能設(shè)計(jì)介紹(續(xù))每個(gè)核具有單獨(dú)的C-state控制機(jī)制OS單獨(dú)設(shè)置它們的休眠狀態(tài)每個(gè)核可以各自進(jìn)入不同的C-state共享資源保持活躍狀態(tài)如L2 cache在兩個(gè)核都休眠的時(shí)候,仍然可以整體能耗協(xié)同器件保證了兩個(gè)核以及共享資源之間的協(xié)調(diào)工作對于OS來說,就像管理著兩個(gè)處理器Core Duo根據(jù)兩個(gè)core的狀態(tài)作出的反應(yīng)對OS是透明的Core Due整體的C-state協(xié)同器件檢測到兩個(gè)核都處于比C1深的

30、休眠狀態(tài)后,處理器進(jìn)入C2狀態(tài)其他狀態(tài)類似,降低整體功耗協(xié)同部件同時(shí)偵聽中斷,回到合適的狀態(tài)Core Due處于C3或C4flush L1 cacheL1 cache不工作,可以節(jié)能大多數(shù)情況下L1包含在L2中,恢復(fù)L1的代價(jià)不大49節(jié)能體系-Intel Core Duo節(jié)能設(shè)計(jì)介紹(續(xù))L2 cache動(dòng)態(tài)關(guān)閉在C4狀態(tài),動(dòng)態(tài)關(guān)閉L2 cache,節(jié)省L2的能耗出發(fā)點(diǎn):L2 cache較大太過頻繁的flush同樣會(huì)導(dǎo)致能耗帶來延時(shí)實(shí)踐表明,和比較大規(guī)模的程序不一樣的是,一些中斷處理程序或者具有類似性質(zhì)的程序,L2 cache的存在與否對程序性能的影響不大(此類程序同樣導(dǎo)致L2 cache m

31、iss)L2 cache收縮:部分flush L2 cache當(dāng)最后一個(gè)核進(jìn)入C4狀態(tài)后,L2 cache開始收縮除非有中斷發(fā)生,或有一個(gè)核回到C0狀態(tài)注意,從休眠狀態(tài)回到活動(dòng)狀態(tài)C0,此時(shí)L2 cache的大小只是保持不變,而不是復(fù)原,直到L2 cache 擴(kuò)展的開始flush的操作由最后一個(gè)進(jìn)入C4狀態(tài)的核完成為保持一定的速度,每次flush部分L2 cache(1/8到1/2)flush整個(gè)L2 cache后,可以讓cache也處于休眠狀態(tài),即Deeper C4狀態(tài)L2 cache的擴(kuò)展的條件:處理器的工作頻率超過了設(shè)定的最大值(計(jì)算需求大增)處理器處于C0的實(shí)間超過了預(yù)設(shè)值50節(jié)能體系

32、-Intel Core Duo節(jié)能設(shè)計(jì)介紹(續(xù))Cache是處理器節(jié)能的重要一部分特別是當(dāng)Cache容量擴(kuò)大以后對SOC節(jié)能更多外設(shè),內(nèi)存進(jìn)入到處理器,Cache節(jié)能也是節(jié)能的一個(gè)重要部分可以看到很多與本例Core Duo中使用同一種思路的技術(shù)51The Intel PXA27x Processors這個(gè)處理器采用了memory boundness作為決定處理器電源模式的標(biāo)準(zhǔn)。他通過一個(gè)Idle profile來監(jiān)視系統(tǒng)中所有的idle進(jìn)程通過一個(gè)performance profile來監(jiān)視處理器中的performance monitorcounter 獲得系統(tǒng)的運(yùn)行信息,比如TLB或者Cac

33、he Miss等信息。然后根據(jù)這些信息來決定怎么調(diào)整處理器的頻率和電壓。 52The Transmeta Crusoe ProcessorTransmetas Crusoe processor功耗之所以低不僅由于他采用了全程的長期管理策略,重要的是他將很多的復(fù)雜指令的執(zhí)行從硬件轉(zhuǎn)移到了軟件。他主要采用了一種叫做Code morphing engine的技術(shù)他是一個(gè)軟件層主要用來編譯和解釋X86的指令,將他們轉(zhuǎn)換成為本地的VLIW指令,并將產(chǎn)生的代碼存儲(chǔ)在一個(gè)叫做Transaction cache里面。這一層同時(shí)監(jiān)視軟件運(yùn)行的hotspot,并對指令進(jìn)行重編譯。將指令用軟件來執(zhí)行,降低了處理器的

34、復(fù)雜度,減少了功耗。同時(shí)他使用一個(gè)longrun的策略來根據(jù)處理器的利用情況調(diào)整系統(tǒng)的狀態(tài)。 53小結(jié)商用處理器節(jié)能目前的口號(hào)千萬億次計(jì)算到毫瓦級(jí)實(shí)際情況嵌入式處理器一般功耗小于5毫瓦(最高為XScale 1.2G)威盛1瓦處理器54電池新技術(shù)解決能源問題的關(guān)鍵還是在電池技術(shù)的革新Fuel Cells MEMS Systems 55Fuel Cells 燃料電池有三個(gè)好處,一個(gè)就是他的原料很多,二就是他的再次充足很快,三就是他的再次補(bǔ)充次數(shù)不限,燃料電池還有幾個(gè)不足:一、容易發(fā)熱;二、組成容器的材料太貴;三、不安全,容易起火。燃料電池的真正商業(yè)應(yīng)用還得需要5到10年的時(shí)間。56MEMS Sys

35、temsMicroelectrical and Mechanical Systems (MEMS) 他是一種將機(jī)械能轉(zhuǎn)換為電能的微型發(fā)電機(jī)。MIT and the Georgia Institute of Technology的學(xué)者開發(fā)了一種基本的MEMS系統(tǒng)。他們開發(fā)出了一種只有幾毫米的氣輪機(jī),通過氣輪機(jī)發(fā)電??梢詫⑦@種氣輪機(jī)集成到硬盤等功耗大的設(shè)備上。 這種氣輪機(jī)的問題在于排放的廢氣溫度太高。57小結(jié)2008年的IDF上,有近十家燃料電池廠家參展日本已有商用大規(guī)模產(chǎn)業(yè)化指日可待58標(biāo)準(zhǔn)APM傳統(tǒng)的APM(Advanced Power Management)是一種基于bios的電源管理標(biāo)準(zhǔn),

36、目前的最新版本是1.2它提供了CPU和設(shè)備電源管理的功能由于這種電源管理方式主要是由bios實(shí)現(xiàn),所以有些缺陷,比如對bios的過度依賴,新老bios之間的不兼容性,以及無法判斷電源管理命令是由用戶發(fā)起的還是由bios發(fā)起的,對某些新硬件如USB和1394的不支持性, 它目前仍然使用在許多基于Linux的便攜設(shè)備中,但在基于微軟操作系統(tǒng)的筆記本電腦和手持設(shè)備中已經(jīng)被逐步淘汰。 59標(biāo)準(zhǔn)ACPI為了彌補(bǔ)APM的缺陷,新的電源管理ACPI應(yīng)運(yùn)而生,這就是ACPI(Advanced Configuration and Power Interface)它主要是將電源管理的主要執(zhí)行者由bios轉(zhuǎn)換成為操

37、作系統(tǒng),這樣可以提供更大的靈活性以及可擴(kuò)展性, 它是英特爾、東芝和其他一些公司支持的現(xiàn)行標(biāo)準(zhǔn)。在PC、筆記本電腦、服務(wù)器、甚至刀片式通信設(shè)備等商業(yè)硬件中,類似ACPI的系統(tǒng)是人們的首選,但它強(qiáng)烈依賴于流行的x86/IA-32 BIOS 架構(gòu)。 一般節(jié)能系統(tǒng)結(jié)構(gòu)的應(yīng)用都是軟硬件之間協(xié)同工作C0為活動(dòng)狀態(tài),C1到C3/C4/DC4為不同程度的休眠狀態(tài)OS周期性的監(jiān)視系統(tǒng)負(fù)荷,根據(jù)當(dāng)前情況設(shè)置處理器狀態(tài)隨著處理器休眠狀態(tài)的加深,更多的部件被停止供電,更加節(jié)省能耗,同時(shí)恢復(fù)到活動(dòng)狀態(tài)費(fèi)時(shí)越多通過break,讓處理器再次恢復(fù)到活動(dòng)狀態(tài)60ACPIAdvanced Configuration and Po

38、wer Interface高級(jí)配置與電源接口英特爾、微軟和東芝共同開發(fā)的一種電源管理標(biāo)準(zhǔn)功能1、使外設(shè)在指定時(shí)間開關(guān)2、指定計(jì)算機(jī)在低電壓的情況下進(jìn)入低功耗狀態(tài),以保證重要的應(yīng)用程序運(yùn)行3、OS可在應(yīng)用程序?qū)r(shí)間要求不高的情況下降低時(shí)鐘頻率4、OS可根據(jù)外設(shè)和主板的具體需求為它分配能源5、在無人使用計(jì)算機(jī)時(shí)進(jìn)入休眠狀態(tài),但保證一些通信設(shè)備打開6、即插即用設(shè)備在插入時(shí)能夠由ACPI來控制61AVS技術(shù)SoC 設(shè)計(jì)中降低功耗的電壓調(diào)節(jié)技術(shù)有兩種方式一種是開環(huán)電壓調(diào)節(jié)(動(dòng)態(tài))就是DVS另一種則是閉環(huán)(自適應(yīng))電壓控制方法自適應(yīng)電壓調(diào)節(jié)閉環(huán)方式可進(jìn)一步減小功耗Adaptive Voltage Scal

39、ing 通過反饋機(jī)制將電源電壓調(diào)整到給定工作負(fù)載(處理量)所需的最小值。需要將部分電源管理電路置入主處理器62小結(jié)ACPI是應(yīng)用最為廣泛的接口DVS也是一個(gè)重要接口63系統(tǒng)軟件層操作系統(tǒng)編譯器多層協(xié)調(diào)的節(jié)能技術(shù)64軟件節(jié)能研究應(yīng)用軟件層應(yīng)用軟件優(yōu)化多層協(xié)調(diào)的節(jié)能技術(shù)DVS技術(shù)簡介Dynamic Voltage Scaling動(dòng)態(tài)調(diào)頻/調(diào)壓的技術(shù)在一定范圍內(nèi),處理器的頻率和電壓是成正比的,所以也有DFS或者DFVS的說法1998年被提出在此觀點(diǎn)提出后,具有DVS功能的處理器開始制造前提假設(shè)處理器的負(fù)載一直在變當(dāng)處理器的利用率比較低的時(shí)候可以通過DVS技術(shù)slow down處理器,但是不能因此而影

40、響性能目前研究多應(yīng)用于周期性任務(wù)(易于預(yù)測) DVS技術(shù)主要解決了一個(gè)頻率與內(nèi)核電壓同步調(diào)整的協(xié)同和模塊化問題。使用這個(gè)技術(shù)的前提是,處理器的負(fù)載一直在變,當(dāng)處理器的利用率比較低的時(shí)候可以通過DVS技術(shù)slow down處理器,但是不能因此而影響性能。65DVS技術(shù)-PXA255支持的頻率66DVS技術(shù)中的系統(tǒng)負(fù)載預(yù)測預(yù)測前的兩個(gè)問題首先得知道在任何時(shí)刻現(xiàn)在跑的是哪個(gè)任務(wù)?這個(gè)任務(wù)需要的工作量?問題復(fù)雜化任務(wù)可以在任何時(shí)候被搶占不能準(zhǔn)確的實(shí)時(shí)預(yù)測系統(tǒng)的未來情況這就是著名的停機(jī)問題。learning lag 技術(shù)采樣獲得task的信息通過這些信息來預(yù)測task的未來運(yùn)行時(shí)間compiler的靜態(tài)

41、分析預(yù)測技術(shù)靜態(tài)分析工具來進(jìn)行預(yù)測系統(tǒng)的執(zhí)行時(shí)間問題程序的運(yùn)行狀態(tài)多變,不能因此來表明后面程序的執(zhí)行時(shí)間和前面存在必要的聯(lián)系現(xiàn)在還沒有一個(gè)很好的解決方法67DVS小結(jié)目前主要的接口后續(xù)的操作系統(tǒng)節(jié)能調(diào)度、節(jié)能編譯器幾乎都是在此基礎(chǔ)上進(jìn)行的68操作系統(tǒng)Interval-Based Approaches Interval-Based Approaches技術(shù)在某個(gè)時(shí)間段或者某幾個(gè)時(shí)間段內(nèi)對處理器的忙碌程度進(jìn)行采樣對系統(tǒng)下面幾個(gè)時(shí)間段內(nèi)有可能的情況作一個(gè)評估根據(jù)這個(gè)評估結(jié)果對處理器的頻率進(jìn)行調(diào)整根據(jù)對未來處理器利用率的評估算法不同,進(jìn)行了進(jìn)一步的劃分69操作系統(tǒng)Interval-Based Appr

42、oaches PAST。通過周期性的測試處理器閑置的時(shí)間長度,如果他idle的時(shí)間比某個(gè)定義的極值還要長的話,那就slow down處理器,如果他忙的時(shí)間比某個(gè)定義的極值還要大的話,那就加快處理器的頻率。這個(gè)算法主要是在評估最近幾個(gè)interval的基礎(chǔ)上作出決定的,所以有錯(cuò)誤的傾向而且如果每個(gè)interval都進(jìn)行一次評估和調(diào)頻的話,那么就容易產(chǎn)生抖動(dòng)。Aged Average 算法。通過對前面所有的時(shí)間段內(nèi)處理器的利用率進(jìn)行加權(quán)的方法,對未來系統(tǒng)的處理器利用率進(jìn)行評估。這個(gè)算法比PAST算法更加節(jié)能,主要是他考慮到了所有的過去信息。但是這種算法主要的基礎(chǔ)是workload都是規(guī)則的當(dāng)wor

43、kload不規(guī)則的情況下,通過過去的信息預(yù)測未來的信息是十分困難的。70操作系統(tǒng)Inter-task Approaches Inter task Approaches技術(shù)對不同的task定義一個(gè)不同的處理器頻率要求某個(gè)程序在整個(gè)過程中都是使用同一個(gè)頻率采用硬件事件作為某個(gè)任務(wù)制定頻率的標(biāo)準(zhǔn)缺點(diǎn):workload只有等到任務(wù)完成后才能確定這個(gè)算法對程序一無所知71操作系統(tǒng)Intra-task Approaches技術(shù) 在一個(gè)task內(nèi)部調(diào)節(jié)系統(tǒng)處理器的頻率和電壓run-time voltage hopping算法把task化分成固定長度的時(shí)間段為每個(gè)時(shí)間段確定了一個(gè)最低運(yùn)行頻率,這個(gè)最低運(yùn)行頻率

44、主要由任務(wù)的最長完成時(shí)間減去在這個(gè)時(shí)間段之前已經(jīng)逝去的時(shí)間確定的問題怎么來確定這個(gè)時(shí)間段怎么把程序劃分為固定長度的時(shí)間段Stochastic & PACE算法 在某個(gè)task每次運(yùn)行時(shí)都為他選擇一個(gè)適當(dāng)?shù)念l率選擇根據(jù):以前這個(gè)task運(yùn)行時(shí)測到的workload的概率分布這兩個(gè)算法的主要區(qū)別在于他們的代價(jià)函數(shù)Stochastic DVS認(rèn)為能耗和供電電壓的平方成正比PACE認(rèn)為能耗是和處理器頻率的平方成正比program checkpointing 算法在程序中插入checkpoint,并表明一個(gè)時(shí)間約束然后profile the program offline得到每兩個(gè)checkpoint之

45、間的平均運(yùn)行時(shí)間利用時(shí)間約束和這個(gè)預(yù)測值就可以利用DVS調(diào)整處理器的頻率72操作系統(tǒng)Memory Wall當(dāng)一個(gè)程序因?yàn)閮?nèi)存訪問占據(jù)了很大的時(shí)間(這個(gè)稱為MEMORY WALL)時(shí),可以在內(nèi)存訪問的時(shí)候通過降低處理器的速度節(jié)省大量的能量,而且對系統(tǒng)的性能并不會(huì)造成很大的影響。 73操作系統(tǒng)Memory Wall假設(shè)這個(gè)處理器有3個(gè)任務(wù),然后當(dāng)task1執(zhí)行完畢后要將數(shù)據(jù)保存,會(huì)有一個(gè)memory access的過程。任務(wù)2不依賴與這個(gè)task1的結(jié)果,所以可以馬上執(zhí)行。而task3卻要用到這個(gè)結(jié)果,只能等到memory load之后才能運(yùn)行,所以他只能等。前a圖說明了在全速情況下,當(dāng)memor

46、y access的時(shí)候,task2全速運(yùn)行很快就完成,而task3必須得等到memory access完成才能工作。所以在task2完成到memory access完成,處理器一直在全速運(yùn)行,不過都是在空轉(zhuǎn),所以很浪費(fèi)能量。前b圖就在這個(gè)時(shí)候使用DVS技術(shù)使task2運(yùn)行在低頻率下面,這樣就不會(huì)存在空轉(zhuǎn)的時(shí)間,而且低頻率比高頻率更加節(jié)省能量。74小結(jié)節(jié)能調(diào)度評估任務(wù),以節(jié)能為目標(biāo)進(jìn)行調(diào)度策略設(shè)計(jì)內(nèi)存是瓶頸75操作系統(tǒng)資源休眠本問題的提出主要基于兩點(diǎn):一就是系統(tǒng)硬件資源在進(jìn)行狀態(tài)轉(zhuǎn)換的時(shí)候是要消耗一定量的能量的二就是資源在idle狀態(tài)下還是需要消耗能量的。當(dāng)某個(gè)component處于idle的時(shí)

47、候,Resource Hibernation將會(huì)將這個(gè)設(shè)備關(guān)閉。針對不同的設(shè)備很多啟發(fā)式控制算法已經(jīng)被設(shè)計(jì)和開發(fā)出來。 76磁盤大部分能量的丟失來源于磁盤在活動(dòng)和idle狀態(tài)下磁盤盤片的旋轉(zhuǎn)OS對磁盤的節(jié)能方法在磁盤處于inactive的狀態(tài)下一段時(shí)間后,暫停磁盤的旋轉(zhuǎn)在下一次訪問的時(shí)候再啟動(dòng)什么時(shí)候spin down?哪個(gè)idle disk?考慮性能和能耗的tradeoff77操作系統(tǒng)資源休眠操作系統(tǒng)資源休眠磁盤Predictive Dynamic Threshold Adjustment 技術(shù)已經(jīng)在操作系統(tǒng)層面被采用在運(yùn)行時(shí)動(dòng)態(tài)調(diào)整disk閑置的極值當(dāng)disk剛剛spin down就被sp

48、in up起來,那么就增加這個(gè)極值否則就減少這個(gè)值預(yù)測利用硬件前面的利用信息來預(yù)測未來的信息這種技術(shù)在處理不規(guī)則吞吐量的時(shí)候,是不可行的!請求隊(duì)列排序技術(shù)采用將請求集中起來一次處理的方法,來對disk進(jìn)行控制推遲非急迫的disk請求將請求合并預(yù)取數(shù)據(jù)78操作系統(tǒng)資源休眠磁盤Dynamic RPM control(DRPM)技術(shù)沒有徹底的關(guān)閉磁盤,根據(jù)工作量降低磁盤的轉(zhuǎn)速,消除了從低功耗狀態(tài)轉(zhuǎn)換到work狀態(tài)的overhead 建立一個(gè)磁盤模型,將磁盤劃分為不同的RPM(轉(zhuǎn)速)級(jí)別啟發(fā)式的算法,包括一個(gè)disk和磁盤控制器的協(xié)同工作,控制器根據(jù)需求調(diào)整RPM級(jí)別定期檢查任務(wù)隊(duì)列任務(wù)數(shù)目高,級(jí)別加

49、1系統(tǒng)的反應(yīng)時(shí)間高,將磁盤調(diào)整到full power狀態(tài)系統(tǒng)的反應(yīng)時(shí)間慢,增加磁盤請求隊(duì)列的極值79磁盤加速與節(jié)能硬盤上加2G flash加速Flash快擦寫存儲(chǔ)器不需要存儲(chǔ)電容器集成度更高制造成本低于DRAM特點(diǎn)使用方便與SRAM類似,讀寫的靈活性和較快的訪問速度與ROM類似,在斷電后可不丟失信息適用于寬范圍溫度、濕度條件,而且由于沒有運(yùn)動(dòng)部件,存取時(shí)很安靜。電力需求低快擦寫存儲(chǔ)器技術(shù)發(fā)展迅速節(jié)能的存儲(chǔ)層次80操作系統(tǒng)資源休眠網(wǎng)卡在資源關(guān)閉方面,唯一的挑戰(zhàn)就是無線網(wǎng)卡關(guān)閉無線網(wǎng)卡,會(huì)導(dǎo)致通訊的中斷無線網(wǎng)卡方面的工作必須包括協(xié)議棧Threshold-based算法 利用時(shí)鐘來進(jìn)行監(jiān)視devic

50、e的idle time如果一個(gè)準(zhǔn)備傳輸數(shù)據(jù)的設(shè)備,長時(shí)間處于idle,而且超過了某個(gè)時(shí)間,那么就把它轉(zhuǎn)入listening或者sleep模式為確定這個(gè)等待的時(shí)間長度,使用adaptive threshold算法當(dāng)算法發(fā)現(xiàn)通訊活動(dòng),那么她就減少可接受的冬眠時(shí)間相反,當(dāng)算法發(fā)現(xiàn)idle事件的時(shí)候,可以增加這個(gè)時(shí)間值compiler-based hibernation 通過complier使用一個(gè)未來程序行為的模型,迅速關(guān)閉網(wǎng)卡mobile device的虛擬內(nèi)存放在遠(yuǎn)方的服務(wù)器上發(fā)生一個(gè)page fault之后,就可以喚醒無線網(wǎng)卡,到遠(yuǎn)方服務(wù)器上把那個(gè)page取到本地81操作系統(tǒng)Display很耗

51、電歐盟規(guī)定,計(jì)算機(jī)在睡眠和關(guān)閉狀況下的能耗須低于10瓦和3瓦我國僅有10.5美國規(guī)定,顯示器在睡眠和關(guān)閉狀態(tài)下的能耗須低于4瓦和2瓦我國僅有19一般情況下,當(dāng)很長時(shí)間沒有反應(yīng)的時(shí)候,顯示器就會(huì)自動(dòng)降低亮度。但這種方式往往和用戶的想法是不一致的 Face-off 技術(shù)實(shí)驗(yàn)性的人臉識(shí)別系統(tǒng),使用在IBM的T21上面的周期性的觀察監(jiān)視器采集的遠(yuǎn)景數(shù)據(jù)分析采集到的人臉數(shù)據(jù)通過ACPI來控制display比原來的啟發(fā)式算法節(jié)省更多的能量,不足:是重復(fù)的采用人臉識(shí)別技術(shù) Zoned backlighting技術(shù) 構(gòu)造了一種未來的顯示系統(tǒng)根據(jù)用戶的使用模式和電池的情況,通過軟件來可選擇的調(diào)整顯示器不同區(qū)域的

52、亮度根源用戶只對整個(gè)屏幕的部分有興趣,而不是全部一種想法就是前臺(tái)的程序比較亮,而后臺(tái)就比較暗還有一種想法就是當(dāng)電池容量下降的時(shí)候,整個(gè)屏幕都變暗82小結(jié)操作系統(tǒng)的節(jié)能外設(shè)管理83編譯器節(jié)能優(yōu)化技術(shù),靜態(tài)節(jié)能編譯技術(shù)以功耗為主要衡量手段,對代碼進(jìn)行優(yōu)化。循環(huán)展開軟件流水軟件并行化內(nèi)存存儲(chǔ)訪問優(yōu)化兩條技術(shù)路線提高性能類似傳統(tǒng)的編譯優(yōu)化利用擴(kuò)展指令宏融合插入節(jié)能指令節(jié)能算法84編譯器節(jié)能優(yōu)化技術(shù)靜態(tài)編譯和DVS 技術(shù)的結(jié)合85TbothTcpuTCPU memTbothTcpuTmemTmemTCPU mem編譯器節(jié)能優(yōu)化技術(shù)靜態(tài)編譯和DVS 技術(shù)的結(jié)合86CPU memCPU memTbothTc

53、puTTnewTbothnewTcpunew編譯器節(jié)能優(yōu)化技術(shù)靜態(tài)DVS節(jié)能編譯框架可以了解到代碼段的詳細(xì)狀況;節(jié)能編譯框架通過劃分合適的代碼段進(jìn)行DVS:循環(huán),函數(shù)調(diào)用;數(shù)學(xué)建模:,T = Tcpu + Tmem + TbothTnew() = * Tcpu + max(Tboth + Tmem, *Tboth) (Tnew() T)/T , 能夠預(yù)測詳細(xì)的能耗。 87DVS靜態(tài)節(jié)能優(yōu)點(diǎn)代碼生成階段策略豐富缺點(diǎn)compiler的視線只是局限在program內(nèi)部compiler不知道程序到底怎么運(yùn)行的為了獲得程序的運(yùn)行數(shù)據(jù),compiler只能通過模擬的手段獲得的信息是不足的,不夠真實(shí)編譯器在

54、優(yōu)化的時(shí)候,認(rèn)為程序是在沒有被打攪的情況下運(yùn)行的,認(rèn)為他的運(yùn)行空間是純潔的88編譯器節(jié)能優(yōu)化技術(shù)動(dòng)態(tài)編譯為了解決前面提出的問題,提供一種基于反饋的編譯優(yōu)化方法一個(gè)程序被編譯之后,在執(zhí)行的過程中,還是被監(jiān)視著。通過采集程序的運(yùn)行信息反饋給編譯器,編譯器按照得到的信息再次編譯程序,然后程序繼續(xù)運(yùn)行,同時(shí)再次反饋信息給編譯器,然后繼續(xù)上面的過程。 關(guān)于動(dòng)態(tài)編譯最早的理論研究是由Unnikrishnan et al. 2002.做的。他通過儀器測出不同的電量需求和條件下面程序的臨界區(qū),通過預(yù)先編譯的方法,準(zhǔn)備各種情況下的方案。他通過一個(gè)叫做Dyninst的工具來完成的,這個(gè)工具可以在程序運(yùn)行過程中,對

55、程序的運(yùn)行段進(jìn)行patch,修改他的程序的狀態(tài)。 89編譯器節(jié)能優(yōu)化技術(shù)動(dòng)態(tài)節(jié)能編譯框架引入運(yùn)行中的實(shí)際參數(shù)使用更多參數(shù)建立數(shù)學(xué)模型優(yōu)化9091編譯器節(jié)能優(yōu)化技術(shù)遠(yuǎn)程編譯和遠(yuǎn)程執(zhí)行技術(shù)現(xiàn)在有個(gè)很新的研究領(lǐng)域就是程序同時(shí)在mobile device和有強(qiáng)勁計(jì)算能力的server上面編譯和執(zhí)行。這方面現(xiàn)在最主要的研究問題就是一個(gè)程序哪一部分可以在server上面編譯和運(yùn)行。還有就是在多個(gè)服務(wù)器和多個(gè)handholds上面,程序怎么轉(zhuǎn)移,以及程序的忍耐度等問題都是要考慮的問題。 92The Proxy Virtual Machine 采用了一種復(fù)雜的結(jié)構(gòu),包括一個(gè)server、一個(gè)proxy、一個(gè)m

56、obile client。這個(gè)proxy的主要包括一個(gè)編譯器和一個(gè)字節(jié)碼轉(zhuǎn)換器。他和客戶端之間采用高帶寬低延時(shí)的安全通道通訊。當(dāng)mobile device有請求傳出,proxy轉(zhuǎn)發(fā)這個(gè)請求,然后接受請求發(fā)回的代碼,將其編譯,并轉(zhuǎn)換成當(dāng)?shù)卮a,并按能耗的關(guān)系將部分本地代碼發(fā)給mobile device執(zhí)行,部分代碼在proxy上執(zhí)行,然后將結(jié)果返回給mobie device。 編譯器節(jié)能優(yōu)化技術(shù)The Proxy Virtual Machine技術(shù)93編譯器節(jié)能優(yōu)化技術(shù)The Proxy Virtual Machine技術(shù)小結(jié)節(jié)能編譯靜態(tài)編譯,生成帶節(jié)能的代碼動(dòng)態(tài)編譯,運(yùn)行態(tài)重新調(diào)優(yōu)遠(yuǎn)程編譯,后

57、端計(jì)算94應(yīng)用軟件節(jié)能由程序員手工完成低功耗的程序借助硬件提供的節(jié)能方法定制節(jié)能的通信協(xié)議多媒體和網(wǎng)絡(luò)應(yīng)用中的節(jié)能95應(yīng)用層節(jié)能技術(shù)Odyssey 系統(tǒng)Odyssey 是一個(gè)通過犧牲可信度來節(jié)能的系統(tǒng)。他是一個(gè)處理多媒體和網(wǎng)絡(luò)應(yīng)用的操作系統(tǒng)和運(yùn)行環(huán)境。他監(jiān)視整個(gè)系統(tǒng)每個(gè)程序的資源利用率,在某個(gè)程序的資源可利用數(shù)低于他申請的資源數(shù)時(shí),發(fā)出警告。然后程序降低服務(wù)質(zhì)量,直到資源的數(shù)量足夠的多。Odyssey只支持四個(gè)應(yīng)用程序。video player, speech recognizer, map viewer, and Web browser. 他們所要的資源是網(wǎng)絡(luò)帶寬。 96應(yīng)用層節(jié)能技術(shù) EC

58、OSystem系統(tǒng)ECOSystem 把能耗當(dāng)成系統(tǒng)中每個(gè)資源的一種關(guān)聯(lián)用品。當(dāng)某個(gè)資源上面由夠多能量的時(shí)候,可以讓他盡量的操作。這個(gè)模型將每個(gè)資源都定義一個(gè)價(jià)格,然后操作系統(tǒng)根據(jù)現(xiàn)在電池的容量情況,分發(fā)固定一個(gè)的值給每個(gè)應(yīng)用程序每個(gè)應(yīng)用程序要使用某個(gè)資源的時(shí)候,就必須得付相應(yīng)的價(jià)值。只有當(dāng)應(yīng)用程序能夠付出足夠的價(jià)格時(shí)才能使用這個(gè)資源。97應(yīng)用層節(jié)能技術(shù) Application Hints Application Hints 提供了一種新的體系結(jié)構(gòu),主要包括兩層的API調(diào)用。一層是允許Application和OS進(jìn)行通訊,還有一層是允許OS和底層硬件進(jìn)行通訊。上層的API允許應(yīng)用程序給下層OS提供一些暗示,比如:啟動(dòng)時(shí)間、deadline、以及預(yù)期執(zhí)行時(shí)間等。根據(jù)這些信息,操作系統(tǒng)就會(huì)對應(yīng)用程序的未來行為有一個(gè)很好的了解,因而可以更好的提供DVS決策。98多層協(xié)調(diào)的節(jié)能技術(shù)ForgeForge 就是一個(gè)針對網(wǎng)絡(luò)多媒體應(yīng)用的基層電源管理框架。Forge設(shè)定了一種目標(biāo)平臺(tái),這種平臺(tái)向服務(wù)器發(fā)出多媒體請求,這些請求被一個(gè)代理過濾,然后代理根據(jù)目標(biāo)手持設(shè)備的能量等情況,提供不同的層次Q

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論