手機(jī)主流處理器CPU參數(shù)及性能的總論(暨高通,聯(lián)發(fā)科,ARM_第1頁(yè)
手機(jī)主流處理器CPU參數(shù)及性能的總論(暨高通,聯(lián)發(fā)科,ARM_第2頁(yè)
手機(jī)主流處理器CPU參數(shù)及性能的總論(暨高通,聯(lián)發(fā)科,ARM_第3頁(yè)
手機(jī)主流處理器CPU參數(shù)及性能的總論(暨高通,聯(lián)發(fā)科,ARM_第4頁(yè)
手機(jī)主流處理器CPU參數(shù)及性能的總論(暨高通,聯(lián)發(fā)科,ARM_第5頁(yè)
已閱讀5頁(yè),還剩66頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、從2007年iPhone發(fā)布開始,手機(jī)開始邁入真正的智能時(shí)代。處理器從最早的ARM11 400MHz一路飆升;2008年我們擁有了ARM11 533MHz;2009年進(jìn)化到Cortex A8 400MHz;2010年則瞬間提升至Cortex A8 1GHz;2011年,雙核Cortex A9 1.2GHz開始普及;2012年,四核Cortex A9 1.4GHz出現(xiàn).智能手機(jī)處理器的運(yùn)輸能力幾乎以每年2.5倍的速度在提升。如果以平臺(tái)的壽命來看,ARM9平臺(tái)大約擁有5年的壽命,ARM 11為4年,在這之后,Cortex A8在主流市場(chǎng)堅(jiān)持了一年半,而單核Cortex A9被直接跳過,雙核Cort

2、ex A9一年、四核Cortex A9也是一年。為何市場(chǎng)會(huì)出現(xiàn)如此強(qiáng)大的推動(dòng)力,讓企業(yè)可以集中全行業(yè)的技術(shù)和利潤(rùn),去瘋狂推動(dòng)一臺(tái)小小的手機(jī)瘋狂升級(jí)?最主要的原因是因?yàn)槭謾C(jī)本身的定位發(fā)生了變化,過去大家需要用PC實(shí)現(xiàn)的應(yīng)用和功能,如今都開始往手機(jī)上轉(zhuǎn)移,這是推動(dòng)手機(jī)硬件爆炸發(fā)展的原動(dòng)力。這樣的需求轉(zhuǎn)變給手機(jī)帶來了無窮無盡的性能需求,也催生了手機(jī)的大屏化我們需要呈現(xiàn)越來越多的信息,手機(jī)的屏幕自然就要同步增大。第一輪洗牌的贏家是蘋果(必須承認(rèn)的是,即便沒有蘋果,這個(gè)時(shí)代依然會(huì)到來,因?yàn)橛布阅艿奶嵘强陀^存在且不會(huì)停止的)。然而,硬件規(guī)格大幅提升之后,伴隨而來的是同樣大幅增加的功耗和發(fā)熱。瘋狂的硬件

3、軍備競(jìng)賽催生出了智能手機(jī)的黃金時(shí)代,也給整個(gè)行業(yè)埋下了定時(shí)炸彈,一場(chǎng)危機(jī)近在眼前?!鞍惭b飛機(jī)發(fā)動(dòng)機(jī)的自行車”如果我們給奇瑞QQ轎車安裝1000馬力的發(fā)動(dòng)機(jī),可以獲得與超級(jí)跑車相近的性能嗎?答案是否定的,因?yàn)槠嫒餛Q的車體根本無法承受這樣的動(dòng)力輸出。同樣的道理,我們把英特爾酷睿i7處理器裝在手機(jī)上也沒有意義,因?yàn)槭謾C(jī)根本無力承擔(dān)它的功耗。在這個(gè)層面上,我們是理性的,廠家也是理性的,至少在相當(dāng)長(zhǎng)一段時(shí)間內(nèi)是這樣。然而,這部分理性如今卻在逐漸消失。一個(gè)被業(yè)內(nèi)視為默認(rèn)規(guī)則,而聽起來又異常奇怪的現(xiàn)象是:2012年之后的旗艦智能手機(jī),沒有幾臺(tái)能讓CPU做到長(zhǎng)時(shí)間滿負(fù)荷工作不降頻。廠商不斷地往手機(jī)里塞入更快

4、、更強(qiáng)大的硬件,與此同時(shí),卻不得不限制它們的工作頻率與工作時(shí)間。你看到的產(chǎn)品手冊(cè)上赫然寫著“四核1.7GHz”,但實(shí)際使用中你永遠(yuǎn)無法得到這樣的性能。這方面的例子比比皆是,從Nexus 4冷柜跑分暴漲30%,到K3V2的GPU頻率縮水6成,大多數(shù)旗艦手機(jī)都無法發(fā)揮出它應(yīng)有的性能。來自Anandtech的著名測(cè)試:把Nexus 4扔進(jìn)冰箱,結(jié)果跑分提升了20%以上!根據(jù)第三方測(cè)試,目前的旗艦手機(jī)能以最高頻率工作的時(shí)間少則數(shù)十秒,多的也只有幾分鐘,之后便不得不降低頻率以緩解發(fā)熱。消費(fèi)者聽著“性能提升xx%”的宣傳,花費(fèi)高額費(fèi)用抱著“四核1.7GHz”的手機(jī)回家,卻只能享受30秒的快樂,這難道不是一

5、種諷刺?往一臺(tái)手機(jī)里安裝根本無法全速運(yùn)行的“強(qiáng)大”處理器,與開頭提到的往奇瑞QQ上安裝1000馬力的發(fā)動(dòng)機(jī)有什么區(qū)別呢?下面的表格是一個(gè)實(shí)例:LG為Optimus G Pro配備了強(qiáng)大的驍龍600處理器,但持續(xù)高負(fù)載工作3分鐘后,實(shí)際性能卻不如搭載了上一代APQ8064芯片的SONY Xperia Z。配置更高的新產(chǎn)品,在實(shí)際使用中卻輸?shù)袅恕靶詢r(jià)比”,我們得到了配置,卻沒有得到性能。你也許會(huì)說,反正價(jià)格沒有更貴,能不能全速?zèng)]啥損失,但這樣的觀點(diǎn)也是錯(cuò)誤的。記?。耗阌肋h(yuǎn)是在為手機(jī)的標(biāo)稱性能埋單,而不是為實(shí)際性能埋單。八核手機(jī)即使只能發(fā)揮出四核手機(jī)的性能,它的價(jià)格也是“八核”級(jí)別的。硬件上所有的成

6、本最終都會(huì)以各種形式轉(zhuǎn)嫁在消費(fèi)者身上。問題是:我們?yōu)槭裁匆獮榘l(fā)揮不出來的性能埋單呢?這樣的趨勢(shì)在2013年乃至更遠(yuǎn)的未來并沒有緩解的跡象。作為消費(fèi)者,我們必須要明確自己的立場(chǎng):這種趨勢(shì)是錯(cuò)誤的,我們有必要制止它進(jìn)一步惡化!否則我們所付出的金錢將只能換來幾個(gè)紙面上的數(shù)字,而“安裝飛機(jī)發(fā)動(dòng)機(jī)的自行車”遲早有一天要到來。然而,指出錯(cuò)誤很簡(jiǎn)單,糾正錯(cuò)誤卻很困難。如果無法得到一個(gè)對(duì)于正確的評(píng)價(jià)標(biāo)準(zhǔn),那么對(duì)于未來的分析也就沒有意義,這就啟發(fā)我們?nèi)ふ乙恍┎粫?huì)被技術(shù)所改變的東西,作為衡量正確與錯(cuò)誤的標(biāo)準(zhǔn)。接下來,我們將提出一個(gè)相對(duì)客觀的評(píng)價(jià)標(biāo)準(zhǔn),并以之為準(zhǔn)繩,對(duì)2013-2014年市面上主流的手機(jī)處理器進(jìn)行

7、逐個(gè)分析。“不可逾越之墻”什么是技術(shù)所無法改變的事物?對(duì)于智能手機(jī)而言,一是客觀存在的物理定律,二是人的生理需求。因?yàn)楸疚牡闹黝}是處理器,因此我們把目光集中在處理器系統(tǒng)上。可以確定的是,只要技術(shù)還沒有進(jìn)步到手機(jī)可靠意念操作,那么人體對(duì)設(shè)備溫度的可以接受上限就是確定的;而只要手機(jī)還符合物理定律,在一定溫度下它所能散發(fā)的熱量也是固定的(不考慮主動(dòng)散熱,例如內(nèi)置風(fēng)扇),這就勾勒出了一條“生死線”在舒適的前提下,一個(gè)確定尺寸的手機(jī),所采用的硬件功耗,或者說處理器系統(tǒng)的功耗是有極限的,只要超越這條線,就必須要降低工作頻率,否則將會(huì)無法阻止溫度的上升,性能自然也就無從談起。因此我們認(rèn)為,“手機(jī)的極限功耗不

8、應(yīng)該超過其最大可散熱功耗”可以作為衡量產(chǎn)品的準(zhǔn)繩。長(zhǎng)久以來,業(yè)界都習(xí)慣于用配置和價(jià)格的關(guān)系作為評(píng)價(jià)標(biāo)準(zhǔn),但是如果聯(lián)系到配置與性能脫節(jié)的現(xiàn)實(shí),這個(gè)標(biāo)準(zhǔn)已經(jīng)瀕臨失效,因此我們需要提出一個(gè)新的評(píng)判標(biāo)準(zhǔn),不妨姑且將其稱為“體效值”。何謂體效值?我們將體效值定義為設(shè)備體積與能耗系數(shù)的乘積,它代表了一臺(tái)手機(jī)所可以連續(xù)提供的極限性能。將這個(gè)參數(shù)與理論最大性能聯(lián)合評(píng)價(jià),能得出以下的結(jié)論:如果系統(tǒng)的體效值小于最大性能,那么這套系統(tǒng)就必然是錯(cuò)誤的,因?yàn)榇嬖谥速M(fèi)。但是如果體效值大于最大性能,那么這套系統(tǒng)有可能陷入“性能不夠用”的疑問。最佳情況是體效值和最大性能相同,這意味著這套系統(tǒng)所蘊(yùn)含的性能可以全部發(fā)揮,做到了

9、設(shè)計(jì)可以得到的極限。你可以把“體效值”簡(jiǎn)單理解為“每瓦特性能”。手機(jī)絕對(duì)性能的測(cè)量相對(duì)簡(jiǎn)單,因此體效值中最關(guān)鍵的部分是“體”,即手機(jī)體積所能容納的最大功率。這方面目前沒有明確的行業(yè)標(biāo)準(zhǔn),因此我們需要做一些假設(shè)。首先,我們假設(shè)在現(xiàn)在以及將來的一段時(shí)間內(nèi),手機(jī)將主要依靠外殼進(jìn)行被動(dòng)散熱,不會(huì)像電腦一樣引入風(fēng)扇等主動(dòng)散熱手段。其次,我們將人體感溫度舒適上限設(shè)為40度,而耐受極限設(shè)為50度。最后,我們將手機(jī)工作時(shí)環(huán)境溫度設(shè)為25度,并且假定沒有氣流存在。無外界對(duì)流時(shí),手機(jī)的熱量散發(fā)主要依靠空氣的自然對(duì)流與本身的輻射。假定手機(jī)的溫度為介于舒適上限與耐受極限之間的45度,那么與環(huán)境溫度的差值即為20度。相

10、對(duì)于手機(jī)這個(gè)體積的設(shè)備而言,四個(gè)邊側(cè)面的散熱貢獻(xiàn)可以忽略不計(jì),主要的散熱面為前后兩個(gè)面。計(jì)算時(shí)假定手機(jī)為垂直放置。下面計(jì)算開始,首先計(jì)算對(duì)流散熱量,我們選擇iPhone 5作為標(biāo)準(zhǔn)對(duì)象。iPhone 5的尺寸為123.858.67.6毫米,因此正面的面積為0.0073平方米。垂直放置的情況下,iPhone 5一個(gè)正面的傳熱系數(shù)為4.65W/(m2),也就是說這樣一個(gè)表面可以靠對(duì)流散發(fā)的熱量是0.68W,由于有兩個(gè)表面,因此靠機(jī)身自然對(duì)流可以散發(fā)的熱量為1.36W??紤]到還有側(cè)邊的存在,我們可以認(rèn)為這個(gè)功率是1.5W。接下來計(jì)算輻射熱量。由于iPhone 5的材質(zhì)是鋁合金和玻璃,氧化鋁合金的輻射

11、率大約在0.3左右,而玻璃的輻射率大約是0.85,因此整體輻射率取0.6,那么在外殼溫度整體為45度的時(shí)候,靠輻射可以散發(fā)的熱量經(jīng)過計(jì)算大約是1.16W。也就是說,一臺(tái)通體45度,垂直置于靜態(tài)25度的環(huán)境中的iPhone 5,可以散發(fā)的熱量極限是2.66W。實(shí)際環(huán)境中,考慮到用戶體驗(yàn),手機(jī)不會(huì)也不可能做到整機(jī)均勻發(fā)熱,這無疑會(huì)降低手機(jī)的散熱能力,但由于人體與手機(jī)的接觸也可以帶走一定的熱量,因此兩者互有增減,相信整體的散熱功率不會(huì)與計(jì)算數(shù)值差距過大。因此,大約2.66W就是iPhone 5所能承受的最大整機(jī)功率(這里直接使用了整機(jī)功率,這是因?yàn)槟壳半娮赢a(chǎn)品除了天線部分以外,消耗的電能絕大部分都轉(zhuǎn)

12、化成了熱量,耗電量和發(fā)發(fā)熱量基本相等)。再來看看Galaxy S4。由于計(jì)算的方式是相同的,因此過程就不給出了,唯一的不同是,作為塑料外殼的Galaxy S4,在熱輻射效率上要遠(yuǎn)高于鋁合金的iPhone 5,具體來說在0.9左右(看來塑料機(jī)還是有一些好處的)。結(jié)果直接給出,Galaxy S4在同等條件下的散熱量為4.15W。Galaxy S4旗艦安卓手機(jī)的代表,因此更大尺寸的機(jī)器我們就不計(jì)算了。結(jié)果顯而易見,對(duì)于iPhone 5這種尺寸的手機(jī)而言,系統(tǒng)的極限功率是2.66W,而Galaxy S4尺寸的產(chǎn)品則為4.15W。體積處于兩者之間的產(chǎn)品,散熱能力則介于它們之間。至此,體效積中的體就已經(jīng)有

13、了結(jié)論。因?yàn)檫@個(gè)參數(shù)是不會(huì)因?yàn)榧夹g(shù)提升而改變的,所以它可以作為我們判定未來新技術(shù)與新可能的良好標(biāo)準(zhǔn)。也就是說,對(duì)于一臺(tái)5寸手機(jī)而言,我們可以得到的最大性能就是4.15W每瓦特性能,不論這臺(tái)手機(jī)的理論性能有多么強(qiáng)大。換句話說,只要一臺(tái)5寸手機(jī)的整機(jī)最大功耗超過了4.15W,那么我們就一定可以判定:它的性能無法發(fā)揮。進(jìn)一步的,對(duì)于一臺(tái)手機(jī)而言,屏幕所占據(jù)的功耗大約從4寸的1.2W到5寸的1.8W不等,因此我們可以得出,極限散熱功耗中,留給CPU、GPU、內(nèi)存等計(jì)算系統(tǒng)的功耗上限,對(duì)于iPhone 5尺寸的手機(jī)而言是1.5W左右,對(duì)于Galaxy S4尺寸的手機(jī)而言是2.5W左右。需要說明的是,在計(jì)

14、算散熱量時(shí),我們所關(guān)注的對(duì)象是手機(jī)外表面,至于內(nèi)部是如何傳熱的,對(duì)結(jié)果不會(huì)有影響。可能你會(huì)存在疑問,某手機(jī)內(nèi)含熱管,某手機(jī)擁有石墨散熱膜,散熱要好得多這是錯(cuò)誤的,輔助散熱措施只是增加了手機(jī)內(nèi)部的熱傳導(dǎo)效率,最終效果是提高手機(jī)整體的溫度均勻性,而我們?cè)谟?jì)算的時(shí)候已經(jīng)假定了這個(gè)數(shù)值是100%,也就是內(nèi)部熱傳遞設(shè)計(jì)為完美狀態(tài)的極限結(jié)果。至此,我們可以對(duì)智能手機(jī)“核戰(zhàn)爭(zhēng)”帶來的問題給出一個(gè)精確的描述:由于近年來手機(jī)配置的瘋狂提升,導(dǎo)致手機(jī)的最大性能已經(jīng)超越了體效值。這個(gè)前提下,任何理論性能的提升都是紙面的,功耗已經(jīng)成為了一堵不可逾越的墻。在可以預(yù)見的未來,如果我們希望繼續(xù)提升手機(jī)的性能,那就只能在能耗

15、系數(shù)上下功夫。帶著這個(gè)結(jié)論,讓我們來重新審視一番市面上的主流手機(jī)處理器。產(chǎn)品審查:高通驍龍800首先我們來看一看高通。之所以首先觀察高通,是因?yàn)橄鄬?duì)而言高通的產(chǎn)品是變化幅度最小的,因此我們可以借用的歷史數(shù)據(jù)就最多。在四核處理器上成文時(shí),高通的最新產(chǎn)品是S4 Pro APQ8064。而在我們撰寫本文時(shí),高通重新命名了它的產(chǎn)品線,S4 Pro有了繼任者驍龍600。這是一顆和APQ8064區(qū)別很小的芯片,最大的提升在于內(nèi)存從雙通道LPDDR2 533變成了雙通道LPDDR3 1066,因此我們不打算深究這顆芯片。高通的重頭戲,以及下半年乃至明年的主打,將是驍龍800。它擁有改進(jìn)后的Krait 400

16、核心,主要改動(dòng)是調(diào)整了內(nèi)部緩存架構(gòu),降低異步設(shè)計(jì)帶來的影響。同時(shí),驍龍800引入了HPM工藝,主頻達(dá)到了2.3GHz,成為手機(jī)SoC中的一個(gè)超過2GHz大關(guān)的產(chǎn)品。除此之外,驍龍800還集成了新的Adreno 330 GPU,性能與規(guī)模再次翻倍。文件壓縮速度,驍龍600的Krait 300內(nèi)核同頻性能甚至不如Cortex A7相信看過之前的文章后,現(xiàn)在的你已經(jīng)不會(huì)被上面充滿誘惑力的宣傳所擊倒。是的,我們?cè)俅沃貜?fù)一遍:絕對(duì)性能的提升沒有意義,決定用戶體驗(yàn)的是體效值,或者說每瓦特性能。那么驍龍800的每瓦特性能有沒有提升呢?首先我們來看一看CPU部分。由于緩存的增強(qiáng),Krait 400核心的執(zhí)行效

17、率必然會(huì)得到一定的提升,但是Krait核心從本質(zhì)上來說依然是一個(gè)“增肥”版的Cortex A9,它所面對(duì)的最大問題其實(shí)是由于指令隊(duì)列的不足,導(dǎo)致架構(gòu)的IPC受限。Krait的后端就像是規(guī)模巨大的工廠,而經(jīng)過持續(xù)的升級(jí),Krait的前端已經(jīng)從小港口變成了大型碼頭但是連接它們的依然只是一條省道。這樣的架構(gòu)也許可以在理論測(cè)試中獲得極高的成績(jī),但是在實(shí)際變幻莫測(cè)的應(yīng)用代碼面前,往往無法發(fā)揮應(yīng)有的效率,根據(jù)某些第三方測(cè)試,在諸如視頻解碼、文件壓縮與解壓縮等應(yīng)用中,Krait 300核心的同頻性能有時(shí)會(huì)不如Cortex A9甚至A7。這雖然不足以定性的給這個(gè)架構(gòu)下結(jié)論,至少也可以說明一部分的問題。因此,綜

18、合來看,Krait系列核心的能耗,恐怕是比較悲觀的,即APQ8064的執(zhí)行效率并不如Cortex A9,Krait 400核心雖然經(jīng)過了兩次升級(jí),但是考慮到Krait 300的實(shí)際表現(xiàn),我們認(rèn)為其執(zhí)行效率至多只能達(dá)到略高于A9的水平。也就是說,Krait 400架構(gòu)效率上并沒有大幅超越Cortex A9。那么產(chǎn)品效率呢?在這之前筆者需要稍微岔開一些話題。不知道你是否發(fā)現(xiàn),我們?cè)趯?duì)比效率的時(shí)候往往都會(huì)和Cortex A9相比,準(zhǔn)確來說是和SAMSUNG Exynos 4412相比。為何要用它作為基準(zhǔn)?這并不是因?yàn)槠幕蚴菍?duì)于三星有著額外的好感,原因很簡(jiǎn)單,那就是根據(jù)之前我們對(duì)手機(jī)極限功耗的定義,

19、在那樣的功耗限制之下,Exynos 4412是體效值與絕對(duì)性能之間最接近的產(chǎn)品:Exynos 4412的核心,工作在1.4GHz時(shí)單顆功耗約為440mW,1.6GHz約為600mW,總功耗即為1.8W與2.4W。因此Exynos 4412是一個(gè)極好的標(biāo)準(zhǔn)如果有產(chǎn)品的效率比4412高,它就可以發(fā)揮出比4412更加優(yōu)越的實(shí)際性能,否則就只能在降頻中工作。在驍龍800以外的產(chǎn)品中,高通采用的是28LP SiON/Poly工藝,這會(huì)導(dǎo)致漏電增加,繼而降低能耗比。在上篇中我們引用外媒Anandtech的結(jié)論,得知28LP工藝的驍龍APQ8064,運(yùn)行在1.5GHz的頻率下,單個(gè)核心的功耗大約是700mW

20、。而到了驍龍800,高通終于引入了先進(jìn)的HKMG技術(shù),將工藝更換為了28HPM。那么,這個(gè)工藝是否能提升驍龍800的能耗比?根據(jù)TSMC對(duì)于28HPM的工藝描述,我們認(rèn)為這個(gè)答案同樣也許是比較悲觀的,因?yàn)?8HPM本質(zhì)上是用來提升性能的工藝,它的主要目的是讓驍龍800得以運(yùn)行在使用28LP的驍龍600所無法達(dá)到的高頻下,但是處理器本身的漏電并不會(huì)因此而減小。臺(tái)積電四種28納米工藝的區(qū)別我們粗略估計(jì),運(yùn)行在2.3GHz下的Krait 400核心,即便只考慮頻率的提升,單個(gè)核心滿載的功率也將超過1W,四核心的總功耗則會(huì)遠(yuǎn)超2.5W的散熱功耗上限。至于能耗比,在低頻段,驍龍800的能耗比也許可以略超

21、龍600,但是總體來說我們并不認(rèn)為驍龍800在CPU部分的能耗比會(huì)大幅領(lǐng)先于Cortex A9,也就是說驍龍800的體效值將明顯小于極限性能。按照我們之前的分析,驍龍800在手機(jī)上的長(zhǎng)期性能表現(xiàn)就將不會(huì)比Cortex A9提升太多(短期性能表現(xiàn),例如基準(zhǔn)測(cè)試,會(huì)因?yàn)樵O(shè)備的熱容以及溫度滯后效應(yīng)而大幅提升,但是只要工作足夠長(zhǎng)不超過三分鐘的時(shí)間后,性能將會(huì)降低到Cortex A9水平)。使用工具監(jiān)控驍龍APQ8064的CPU頻率變化,運(yùn)行2分鐘以后,CPU頻率降低到了1GHz以下那么GPU部分呢?這方面的問題可能會(huì)比CPU更加嚴(yán)重。高通Adreno 300系列GPU的超低能耗比已經(jīng)是眾人皆知的問題,

22、其嚴(yán)重程度遠(yuǎn)超CPU。由于GPU相對(duì)于CPU而言是低頻大規(guī)模電路,因此它對(duì)于漏電的敏感程度要遠(yuǎn)高于CPU,對(duì)于頻率的敏感程度則不如CPU。驍龍800所集成的Adreno 330相對(duì)于Adreno 320而言規(guī)模提升了一倍,因此功耗的提升幅度自然也不會(huì)小到哪里去,我們假定Adreno 330可以借助HPM工藝,完全避免功耗的提升,它的能耗比能有多高?使用工具監(jiān)控驍龍600的CPU頻率變化,Krait 300核心根本無法維持全速工作對(duì)于這個(gè)問題,我們可以通過一個(gè)粗略的測(cè)試來判斷。Galaxy S4和配備了驍龍600的手機(jī),在3Dmark中的得分基本是相同的,但是根據(jù)耗電量得出的整機(jī)功耗估值方面,G

23、alaxy S4所具備的SGX544MP3 GPU的功耗幾乎只有Adreno320的15%甚至更低,換句話說就是SGX544MP3的能耗比幾乎是Adreno330的7倍實(shí)際上,根據(jù)粗略測(cè)試的結(jié)果,Adren 320的功耗已經(jīng)達(dá)到了大約6W,不論這個(gè)數(shù)字是否精確,Adren 320早已遠(yuǎn)遠(yuǎn)超過了2.5W,甚至4.15W的散熱功耗極限。性能翻倍dreno 330即使維持功耗不變,也將和CPU一樣,在實(shí)際工作中也將永遠(yuǎn)不可能發(fā)揮出其最大性能,它的體效值同樣遠(yuǎn)遠(yuǎn)小于理論最大性能。最終,我們對(duì)于驍龍800的預(yù)期表現(xiàn)是比較悲觀的。我們認(rèn)為,在CPU部分,配備驍龍800的產(chǎn)品,并不能讓用戶得到遠(yuǎn)超四核心Co

24、rtex A9如宣傳、測(cè)試以及參數(shù)上那樣的實(shí)際體驗(yàn),而GPU方面則更會(huì)遠(yuǎn)遠(yuǎn)不如SGX544MP3,不論理論測(cè)試有多么強(qiáng)大。驍龍800并沒能有效提升能耗比,因此裝有驍龍800的產(chǎn)品,其體效值將遠(yuǎn)遠(yuǎn)小于宣傳的性能,作為結(jié)果,消費(fèi)者購(gòu)買的大部分參數(shù)和數(shù)字,將會(huì)永遠(yuǎn)停留在紙面上當(dāng)然,還有基準(zhǔn)測(cè)試軟件里。產(chǎn)品審查:Tegra 4與Tegra 4i雖然都屬于Tegra 4家族,但是實(shí)際上Tegra 4和Tegra 4i的核心并不相同:前者基于Cortex A15,而后者基于改進(jìn)版Cortex A9。對(duì)于后者我們不會(huì)多加論述,我們將主要關(guān)注前者。如同Tegra3,Tegra 4也引入了nVIDIA自行設(shè)計(jì)的

25、vSMP 4+1技術(shù)。因此對(duì)于Tegra 4的效率分析,將會(huì)分為兩個(gè)部分:4核部分與附加單核部分。首先是4核部分。Tegra 4的所有核心都是典型的Cortex A15架構(gòu),工藝使用了TSMC 28HPL,因此對(duì)于這一部分的分析我們可以找到一個(gè)極好的參照物,那就是Nexus 10所配備的Exynos 5250。后者是一枚雙核Cortex A15、32nm HKMG LP工藝、工作頻率1.7GHz的SoC。根據(jù)已有的測(cè)試結(jié)果,Exynos 5250的CPU功耗為4W,也就是說單核功耗為2W。這項(xiàng)對(duì)于Exynos 4412的440/600mW而言是一個(gè)相當(dāng)大的數(shù)值,這也意味著Cortex A15的

26、性能必須要四倍于Cortex A9,才可以維持效率的一致。NV做到了嗎?很明顯,也很遺憾,沒有。Cortex A15的性能提升幅度遠(yuǎn)遠(yuǎn)沒有功耗提升幅度大,兩者之間的差距導(dǎo)致了Cortex A15的每瓦特性能相對(duì)于Cortex A9來說有著至少一半的下降。那么回頭來看看Tegra 4。由于核心是相同的,我們只需要對(duì)比工藝。TSMC 28HPL相對(duì)于三星32nm HKMG LP,究竟有沒有性能和漏電方面的提升我們很難判斷,但是大體上兩者屬于同一時(shí)代的同一水準(zhǔn)工藝,相信差距并不會(huì)過大,我們假設(shè)臺(tái)積電的28LP工藝總體能耗比三星降低30%這已經(jīng)幾乎是同一代工藝可以存在的最大差距這也遠(yuǎn)不足以抵消Cort

27、ex A15和Cortex A9近乎200%的差距,更何況Tegra 4的主頻高達(dá)1.9GHz,這進(jìn)一步降低了它的功耗可以低于2W/核心的可能性。這也就意味著,即便只有一顆核心工作,Tegra 4的功耗就已經(jīng)逼近了4寸手機(jī)的散熱功耗極限,而四核同時(shí)工作,如果不加限制,CPU部分的總功耗必將輕松突破8W。Tegra 4功耗有多大NV很清楚,所以給自家的Shield游戲機(jī)裝上了風(fēng)扇!既然能耗比如此之低,那么技術(shù)有何改變、理論性能有何提升、在哪里提升就完全沒有意義了。在手機(jī)上,Tegra 4的四枚Cortex A15所能發(fā)揮出的長(zhǎng)期性能,除了極少數(shù)情況下,可以幾乎肯定的說,將遠(yuǎn)不如一個(gè)設(shè)計(jì)優(yōu)秀的四核

28、Cortex A9處理器。那么輔助的拌核部分呢?NV沒有公布拌核的細(xì)節(jié)資料,我們假設(shè)它工作在1GHz,由于HPL工藝帶來的低漏電,預(yù)計(jì)可以讓這枚核心的功耗降低到0.6W左右,大約等同于一顆1.6GHz的Cortex A9。在這個(gè)工作條件下,Cortex A15的能耗比和Cortex A9比較接近,因此它們具備了接近的體效值。但是此時(shí)的Tegra 4,絕對(duì)性能只有四核Cortex A9的四分之一,體效值遠(yuǎn)遠(yuǎn)高于絕對(duì)性能,這也就意味著此時(shí)的Tegra 4會(huì)因?yàn)檫^慢而無法滿足用戶需求。綜上所述,Tegra 4不論在哪個(gè)模式下,所能提供的最大性能都難以超越四核心Cortex A9處理器,把這樣一顆處理

29、器做進(jìn)手機(jī)唯一的意義也許只有一個(gè)想方設(shè)法讓手機(jī)堅(jiān)持滿載運(yùn)行三分鐘,跑出一個(gè)驚世駭俗的基準(zhǔn)測(cè)試分?jǐn)?shù),給手機(jī)發(fā)燒友作茶余飯后跑分攀比的資本,就好比購(gòu)買超級(jí)跑車上下班,除了炫耀以外沒有任何意義。至于Tegra 4的GPU部分,由于目前資料較少,所以無法給出分析對(duì)比。當(dāng)然我們也需要明白,Tegra 4的悲劇并不全是由于Tegra 4本身或是nVIDIA的技術(shù)實(shí)力導(dǎo)致的,究其根本,元兇還是Cortex A15核心過低的能耗比。這也決定了不僅是nVIDIA,其他任何試圖在產(chǎn)品中引入標(biāo)準(zhǔn)Cortex A15架構(gòu)的廠家,例如未來的華為海思K3V3,最終都將難逃“性能超不過A9”的魔咒。對(duì)于手機(jī)等便攜式設(shè)備而言

30、,Cortex A15毫無疑問是一個(gè)失敗的設(shè)計(jì),也無怪乎高通和蘋果在幾年前就決定放棄這個(gè)架構(gòu),自行以Cortex A9為基礎(chǔ)發(fā)展自己的強(qiáng)化核心。這也從另一個(gè)方面看出,至少在目前可以看到的ARM產(chǎn)品中,Cortex A9依然是可以提供最強(qiáng)實(shí)際性能的產(chǎn)品,即便它已經(jīng)問世超過了2年。最后提一下Tegra 4i。相信NVIDIA規(guī)劃這樣一個(gè)產(chǎn)品,也是因?yàn)镹V實(shí)際上非常明白Cortex A15是一顆怎樣的核心。因此,我們甚至可以理解為,Tegra 4i才是針對(duì)手機(jī)市場(chǎng)所推出的高性能產(chǎn)品。改進(jìn)的Cortex A9 r3p1核心可以帶來最多15%的同功耗性能提升,也就是更高的體效值與實(shí)際性能。但是Tegra

31、 4i卻如同驍龍800一般選擇了HPM工藝,并且因?yàn)樾枰苫鶐Ф鵁o法在2013年上市,這對(duì)于Tegra 4i和NVIDIA而言無疑是徹頭徹尾的悲劇,尤其是如今Cortex A12箭在弦上的情況下。如果說Cortex A15可以看作ARM在被成功沖昏了頭腦之后的大躍進(jìn),那么后者就可以看作是ARM在大躍進(jìn)失敗后的反省之作,肩負(fù)了Cortex A9正統(tǒng)繼任者的使命。對(duì)于它,我們?cè)诤竺嬗枰杂懻摚@里暫不多言。產(chǎn)品審查:三星Exynos 5 Octa最后來談一談技術(shù)最為復(fù)雜,同時(shí)爭(zhēng)議也最大的三星Exynos 5 Octa(Exynos 5410)。這個(gè)芯片最大的特色就是整合了ARM的big.LITTL

32、E技術(shù),內(nèi)部集成了8個(gè)核心四個(gè)Cortex A15為一組,四個(gè)Cortex A7為一組,從而成為了手機(jī)上第一枚超越四核的片上系統(tǒng)。也許你會(huì)提出質(zhì)疑,NV的Tegra 3和Tegra 4實(shí)際上也擁有5個(gè)核心,為什么它不能算作是五核SoC呢?原因很簡(jiǎn)單,因?yàn)門egra多出來的那一枚核心其實(shí)設(shè)計(jì)上是作為四個(gè)主核心其中之一的映射,在實(shí)際工作中系統(tǒng)是識(shí)別不出這一顆核心的。但Exynos 5 Octa不同,它的八顆核心在某些情況下是可以同時(shí)運(yùn)行的,因此可以稱之為八核SoC,雖然實(shí)際情況下這樣的工作模式不一定會(huì)被用上,關(guān)于這點(diǎn),即Exynos 5 Octa是否是偽八核,同樣也是圍繞這顆芯片的眾多爭(zhēng)議中最大的

33、一個(gè),對(duì)此后面我們會(huì)詳細(xì)討論。除了big.LITTLE以外,Exynos 5 Octa本質(zhì)上是一顆非常典型的處理器,它擁有標(biāo)準(zhǔn)的Cortex A15核心、標(biāo)準(zhǔn)的ARM系統(tǒng)IP,支持的規(guī)格與系統(tǒng)配置也一如三星以往的風(fēng)格,頂級(jí)而不頂尖。LPDDR3 1600的內(nèi)存支持與12.8GB/s的理論帶寬在手機(jī)SoC中實(shí)為翹楚,而PowerVR SGX544MP3運(yùn)行在533MHz的高頻下,假如不考慮信息尚不明確的Tegra 4,性能也足以進(jìn)入ARM世界的前三:僅次于iPad4的SGX554MP4和驍龍800的Adreno 330。工藝方面,三星使用了自家最新的28nm HKMG LP,根據(jù)三星的宣傳資料,

34、相對(duì)于32nm HKMG,28nm HKMG主要的提升在于集成度,也就是單位面積下可以實(shí)現(xiàn)更多的晶體管,提升幅度大約在35%左右。至于漏電等工藝性能,我們有理由認(rèn)為不會(huì)和32nm HKMG,也就是上一代的Exynos 4412所采用的工藝有太大的差別,具體原因在上篇中我們也多有提及。三星32nm HKMG實(shí)際上是一個(gè)性能相當(dāng)強(qiáng)悍的工藝,Exynos 5 Octa的基礎(chǔ)至少也是有所保障的。不過,如同之前說過的,Cortex A15本身不是一個(gè)利于手機(jī)使用的架構(gòu),只要把它做進(jìn)手機(jī),都要面對(duì)功耗難題,三星也不能例外。Exynos 5 Octa的最高頻率目前并沒有明確的說法,也許會(huì)在1.7到1.9GH

35、z之間,但我們知道的是,在Galaxy S4上,Exynos 5 Octa的最高頻率只開放到了1.6GHz。1.6GHz的標(biāo)準(zhǔn)Cortex A15核心滿載功耗不會(huì)低于1.8W,三星即使經(jīng)過大量?jī)?yōu)化,Exynos 5410四顆A15核心的總功率也依然要在6W以上,這大大超越了2.5W乃至4.15W的散熱極限。實(shí)際情況可以作為這個(gè)推斷的最佳例證:Galaxy S4的CPU滿載工作的時(shí)間只能達(dá)到區(qū)區(qū)10秒,之后就不得不因?yàn)楹诵臏囟韧黄?0度而被迫關(guān)閉Cortex A15核心。Exynos 5 Octa是一個(gè)明顯的市場(chǎng)導(dǎo)向產(chǎn)品,三星在設(shè)計(jì)它的時(shí)候,考慮優(yōu)先點(diǎn)是市場(chǎng)對(duì)于參數(shù)的需求,而完全不顧這樣規(guī)模的硬

36、件是否可以安全的工作。當(dāng)然,作為應(yīng)對(duì),ARM提出了big.LITTLE,三星也將其引進(jìn)到產(chǎn)品中,但是這樣的行為并不能本質(zhì)上改變這個(gè)設(shè)計(jì)的失敗之處。有人也許會(huì)說,這不是很好嗎,何來失???那就讓我們繼續(xù)研究下去?,F(xiàn)在讓我們來打個(gè)賭:如果你是Galaxy S4八核版的用戶,你絕對(duì)會(huì)有這樣的體會(huì):Exynos 5410處理器主頻在實(shí)際運(yùn)行中非常不穩(wěn)定,低于標(biāo)稱的1.6GHz是常態(tài)。在Exynos 5410中,Cortex A15四核的最低工作頻率是1.2GHz,而Cortex A7四核的最高工作頻率也是1.2GHz。問題是,這兩者的同頻性能并不一樣,導(dǎo)致以頻率為控制參數(shù)的算法比較難寫。于是三星在系統(tǒng)中

37、將Cortex A7的有效頻率顯示為實(shí)際頻率的一半,并以此作為控制參數(shù),就實(shí)現(xiàn)了較為線性的頻率性能曲線。運(yùn)行5秒鐘以后,獵戶座5處理器的A15核心即開始降頻也就是說,只要你看到Exynos 5 Octa的工作頻率是1.2GHz以上,就意味著現(xiàn)在是Cortex A15在工作,而600MHz則意味著Cortex A15已經(jīng)關(guān)閉,系統(tǒng)已經(jīng)切換到1.2GHz的Cortex A7。由于頻率調(diào)節(jié)十分頻繁,所以這給我們計(jì)算Exynos 5 Octa的效率帶來了一定的困難,不過我們依然可以從實(shí)際工作的情況下對(duì)于極限性能給出近似的計(jì)算。Exynos 5410 CPU + GPU同時(shí)滿載的情況,注意下方的頻率曲線

38、enet的測(cè)試結(jié)果顯示,在滿負(fù)荷工作的時(shí)候,Exynos 5410的工作模式大約如下:Cortex A15于1.6GHz工作6秒左右,于1.2或1.4GHz工作4秒左右,然后切換到1.2GHz的Cortex A7工作10秒左右,并且在這樣的序列下循環(huán)。由于頻率調(diào)節(jié)的目標(biāo)是功耗以及溫度,因此我們可以近似認(rèn)為在這樣的工作序列下,處理器系統(tǒng)的平均功耗大約是2.5W左右。如果將Cortex A15的性能歸一化為同頻Cortex A9的1.5倍,Cortex A7為0.7倍,因此我們可以得到在這20秒內(nèi),Exynos 5 Octa所輸出的總性能相當(dāng)于四核Cortex A9運(yùn)行在1.53GHz時(shí)的性能。也

39、就是說,Exynos 5 Octa所能提供的持續(xù)性能,甚至還不如Exynos 4412,因?yàn)楹笳咴?.5W的功耗限制下可以運(yùn)行在1.6GHz。當(dāng)然,這個(gè)結(jié)論有些粗略,我們只驗(yàn)證了基準(zhǔn)測(cè)試時(shí)獵戶座5處理器的CPU頻率變化,實(shí)際應(yīng)用中可能有所不同,但有一點(diǎn)可以確定,那就是Exynos 5410在手機(jī)上可以發(fā)揮的性能遠(yuǎn)遠(yuǎn)低于硬件設(shè)計(jì)的極限性能。Cortex A7與Cortex A15聯(lián)合的效率,大約和Cortex A9不相上下,這也就意味著配備了Exynos 5 Octa的設(shè)備,其體效值并不會(huì)比Exynos 4412高。然而,這并非Exynos 5 Octa的最佳工作模式。ARM big.LITTL

40、E技術(shù)其實(shí)包含有三種工作模式:整體遷移、非對(duì)稱多核心與異構(gòu)多核心。整體遷移模式指Cortex A15或Cortex A7輪流工作,兩者無法同時(shí)激活,具體開啟的核心數(shù)字根據(jù)系統(tǒng)負(fù)載決定。非對(duì)稱多核心則是將Cortex A15四核簇和Cortex A7四核簇看作兩組非對(duì)稱多核心簇,依靠外部總線工作在異步模式下,從而啟動(dòng)所有的八個(gè)核心。而第三種是最誘人的,也就是將每一個(gè)A15與A7組合成為一個(gè)“處理器對(duì)”,將其看作一個(gè)單獨(dú)的處理器,系統(tǒng)根據(jù)需求開啟若干個(gè)“處理器對(duì)”,而每一對(duì)處理器究竟使用Cortex A15還是Cortex A7,完全根據(jù)該核心的負(fù)載決定。從理論上來說,Exynos 5 Octa支

41、持全部的三個(gè)模式,但是三星目前在系統(tǒng)中卻只支持了第一種模式,產(chǎn)品中的工作模式也只有整體遷移。這導(dǎo)致一些人認(rèn)為三星這顆CPU的技術(shù)開發(fā)尚未完成,是“半成品”,因此并沒有實(shí)現(xiàn)最佳的工作效果。甚至有一些分析表示,這是源于Exynos 5 Octa的硬件設(shè)計(jì)缺陷導(dǎo)致的,需要在未來的產(chǎn)品中才能修復(fù)。對(duì)此,我們認(rèn)為這樣的說法既是對(duì)的,也是錯(cuò)的。為什么這樣說?前提是,單純的降低功耗并沒有意義,只有提升體效值才可以獲得更強(qiáng)的性能。對(duì)于Exynos 5 Octa而言,其他的兩種工作模式似乎可以降低功耗,但可以提升每瓦特性能嗎?這是一個(gè)未知數(shù),而且是一個(gè)相當(dāng)不容樂觀的未知數(shù),原因之一就在于Exynos 5 Oct

42、a的兩組處理器,二級(jí)緩存的大小不同。根據(jù)架構(gòu)圖,Exynos 5 Octa的Cortex A15部分,二級(jí)緩存為2MB,而Cortex A7部分只有512KB。如果是Cortex A9時(shí)代,這并不是問題,因?yàn)樗械亩?jí)緩存都是靠總線實(shí)現(xiàn)的訪問。但是在Cortex A15和A7時(shí)代,ARM為了提升緩存效能,將L2 Cache整合進(jìn)了多核心控制器SCU中,它的壞處就在這里:一旦系統(tǒng)內(nèi)同時(shí)存在著激活的Cortex A7和Cortex A15,那么由于二級(jí)緩存的大小不同,兩組核心之間的聯(lián)合工作將會(huì)變得非常麻煩。二級(jí)緩存是內(nèi)存的映射,所以所有核心所訪問的二級(jí)緩存的數(shù)據(jù)必須完全相同。Cortex A15和

43、Cortex A7各自擁有自己獨(dú)占的二級(jí)緩存,當(dāng)兩者協(xié)同工作時(shí),緩存是無法共享的,維護(hù)兩組L2之間的數(shù)據(jù)一致性會(huì)變成一件非常重要同時(shí)也非常影響性能的事情。高通的異步架構(gòu)之所以有性能損失,一致性開銷就是其中很重要的因素之一。在Exynos 5 Octa中,兩組A15和A7核心的二級(jí)緩存大小不同,這就意味著即便是在最好的情況下,也會(huì)導(dǎo)致Cortex A15處理器簇的有效L2從2MB縮減到512KB,這對(duì)性能的影響極為巨大。所以,三星選擇了只實(shí)現(xiàn)第一種工作模式。在這個(gè)模式下,緩存一致性無需維持,只需要在切換時(shí)通過內(nèi)存將緩存數(shù)據(jù)復(fù)制即可(A7到A15可以視作部分填充,而A15到A7可以丟棄超出512K

44、B的部分),甚至可以更簡(jiǎn)單的直接丟棄L2數(shù)據(jù),令其重新填充。因?yàn)橄鄬?duì)于聯(lián)合工作所需要的一致性維護(hù)需求(其頻繁程度與緩存命中率相關(guān),可能只比處理器時(shí)鐘頻率低23個(gè)量級(jí))而言,由于動(dòng)態(tài)頻率控制導(dǎo)致的核心切換要少的多,至多只有每秒百次的水平,因此這樣的損失是最少的,換句話說,另外兩種big.little模式雖然看起來更美好,但實(shí)際上反而會(huì)導(dǎo)致系統(tǒng)效率的降低,從而進(jìn)一步降低搭載Exynos 5 Octa設(shè)備的體效值,使其變得比Cortex A9更慢。從這個(gè)意義上說,如果你需要一顆手機(jī)處理器,至少在CPU部分,Exynos 5 Octa實(shí)際上相對(duì)于Exynos 4412而言是倒退的。這無疑是對(duì)于畸形市場(chǎng)

45、需求的最佳打臉:超高的規(guī)格,強(qiáng)大的指標(biāo),性能卻在偷偷的后退,不知道這到底迎合了誰(shuí)的需求。當(dāng)然,Exynos 5 Octa也不全都是壞處。由于LPDDR3的引入,翻倍的內(nèi)存帶寬可以極大提升系統(tǒng)在日常使用中的感受,因此總體而言Exynos 5 Octa的體驗(yàn)不會(huì)有之前評(píng)價(jià)的那么悲觀,只是會(huì)距離你所認(rèn)為的強(qiáng)大相去甚遠(yuǎn)罷了。至于另一個(gè)好處則來源于PowerVR SGX544MP3這枚GPU。就如同PC一樣,手機(jī)對(duì)于GPU的需求也慢慢超過了CPU。不客氣的說,現(xiàn)在的日常需求,一枚四核心Cortex A7就可以滿足了,但是游戲所需要的性能卻是永無止境的。在Exynos 4210“獵戶座”剛剛發(fā)布的時(shí)候,M

46、ali400MP4幾乎可以滿足所有游戲,這枚GPU不僅速度飛快,而且極為省電,能耗比相當(dāng)高。但是隨著手機(jī)游戲的進(jìn)步,在Exynos 4412上這枚GPU已經(jīng)顯出了疲態(tài)。三星在Exynos 5 Octa上作出更換GPU的決定非常及時(shí)。Exynos 5 Octa的3D性能達(dá)到了目前手機(jī)處理器的頂級(jí)水平,在日常使用中你有很多機(jī)會(huì)可以體驗(yàn)到它帶來的提升。根據(jù)粗略測(cè)試,搭載Exynos 5 Octa的Galaxy S4在運(yùn)行3Dmark的時(shí)候,整機(jī)功耗不會(huì)超過2.5W,這也就意味著這枚GPU的滿載功耗將不會(huì)超過1.5W。這無疑是一個(gè)非常振奮人心的數(shù)據(jù),這意味著PowerVR SGX544MP3在維持了M

47、ali 400MP4能耗比的基礎(chǔ)上(嚴(yán)格來說仍然有一定的下滑,但是遠(yuǎn)遠(yuǎn)高于繼任者M(jìn)ali T604)將其的最大性能擴(kuò)展了幾乎四倍,這樣的提升才是符合用戶需求的提升。對(duì)于這樣的進(jìn)步,我們需要高舉雙手給予掌聲。新一代處理器性能對(duì)比分析雖然說我們之前通篇都在論述的觀點(diǎn)是目前旗艦手機(jī)平臺(tái)的性能受限于功耗,無法在日常使用中體現(xiàn),但是不得不承認(rèn)基準(zhǔn)測(cè)試也是部分用戶日常使用的功能之一,而且這些芯片“不管實(shí)際情況,就跑分到底誰(shuí)最快”也是很多人很有興趣的問題之一。當(dāng)然,相對(duì)于前幾年的產(chǎn)品而言,現(xiàn)在的平臺(tái)下跑分的意義不論如何都在變得越來越小,因此我們不會(huì)再像上篇一樣做連篇累牘的深入分析。取而代之的,我們只會(huì)從幾個(gè)

48、理論測(cè)試軟件的成績(jī)里大概的看一下它們之間的勝負(fù)關(guān)系與潛力。由于新一代手機(jī)處理器的降頻問題十分嚴(yán)重,因此我們不能簡(jiǎn)單的去比較頻率與分?jǐn)?shù),因?yàn)闊o法確定在實(shí)際測(cè)試中它們運(yùn)行在什么頻率下。這個(gè)問題對(duì)于驍龍800而言相對(duì)小一些,因?yàn)镵rait 400核心的實(shí)際功耗并沒有超越設(shè)備散熱極限太遠(yuǎn),因此我們有理由認(rèn)為在諸如Antutu跑分這類間歇性滿載,且滿載時(shí)間不超過一分鐘的測(cè)試程序中,驍龍800是可以運(yùn)行在全負(fù)荷的2.3GHz的(除非廠商設(shè)定的溫度控制閾值極為激進(jìn),)。Exynos 5 Octa的情況在之前已經(jīng)有所說明,但是由于Antutu的滿載壓力并沒有系統(tǒng)穩(wěn)定性測(cè)試軟件那么高,因此我們假設(shè)Octa在跑A

49、ntutu時(shí)的頻率分布為1.6GHz、1.4GHz Cortex A15和1.2GHz Cortex A7各占1/3時(shí)間。這樣根據(jù)DMIPS的數(shù)據(jù)折算,整體性能相當(dāng)于1.19GHz的Cortex A15??紤]到Cortex A7在整數(shù)部份的同頻性能與Cortex A15的差距并沒有DMIPS所顯示的大,但是浮點(diǎn)性能方面的差距非常明顯,因此在整數(shù)部分,等效頻率將會(huì)接近1.5GHz,而浮點(diǎn)部分則維持1.19GHz。至于Tegra 4,對(duì)于一般手機(jī)而言它幾乎不可能跑到1.9GHz的滿載頻率,但是我們找到了nVIDIA Shield的測(cè)試結(jié)果。由于Shield擁有足夠的空間安裝散熱片,因此可以避免頻率

50、的下降,因此在測(cè)試全程中,頻率應(yīng)當(dāng)都可以維持在1.9GHz。下面就讓我們來看看結(jié)果。只采集CPU的整數(shù)和浮點(diǎn)部分。結(jié)果一如我們的預(yù)料。如果不降頻,那么Cortex A15的絕對(duì)性能將是最為強(qiáng)大的,即便驍龍800擁有高達(dá)2.3GHz的主頻,它也不是全速運(yùn)行的Tegra 4的對(duì)手。同時(shí),和Cortex A9的代表Exynos 4412比較的話,我們發(fā)現(xiàn)驍龍800的整數(shù)性能領(lǐng)先幅度并沒有頻率所表現(xiàn)的那么大,而Exynos 5 Octa由于過高的功耗,也沒有表現(xiàn)出應(yīng)有的性能。下面我們計(jì)算一下每MHz下各個(gè)平臺(tái)的對(duì)應(yīng)性能:這個(gè)結(jié)果就比較有意思了??梢钥吹剑琓egra 4在整數(shù)和浮點(diǎn)性能方面,單位功率的性

51、能都沒有超過Cortex A9,甚至整數(shù)方面的能耗比下降了一半。而Exynos 5 Octa在整數(shù)方面相對(duì)于Tegra 4的效率進(jìn)步,更多的歸功于能耗比更高的Cortex A7內(nèi)核,畢竟不論是A7、A9還是A15,整數(shù)運(yùn)算單元都是兩個(gè),理論上同頻整數(shù)吞吐量沒有區(qū)別,但是依然沒能對(duì)Cortex A9實(shí)現(xiàn)實(shí)質(zhì)性的提升。而驍龍800延續(xù)了之前產(chǎn)品在整數(shù)性能方面能耗比不如Cortex A9的傳統(tǒng)。因此,結(jié)論就十分清晰了:在限制運(yùn)行在相同功耗的前提下,以對(duì)日常使用影響最大的整數(shù)性能而言,不論是驍龍800還是Exynos 5 Octa,都無法表現(xiàn)得比Cortex A9更好。當(dāng)然這是理論測(cè)試,實(shí)際運(yùn)行App

52、時(shí),由于處理器內(nèi)部亂序執(zhí)行和分支預(yù)測(cè)等方面的增強(qiáng),幾大主流新產(chǎn)品的表現(xiàn)會(huì)還是比上一代Exynos 4412強(qiáng)大一些,但是我們要重復(fù)之前說過的話:你不可能得到像測(cè)試分?jǐn)?shù)那樣巨大的體驗(yàn)提升,尤其是考慮到Tegra 4的跑分成績(jī)已經(jīng)高達(dá)40000分,驍龍800的跑分成績(jī)超過了33000分,Exynos 5 Octa雖然不及以上兩者但也接近29000分,而Exynos 4412只有區(qū)區(qū)16500分??傮w來說,雖然有著諸如GPU性能的良性提升與內(nèi)存性能的良性提升,但是星星點(diǎn)點(diǎn)的美好并不能掩蓋新一代處理器所面臨的整體的問題。在我們已經(jīng)分析過的三個(gè)產(chǎn)品中,實(shí)際上沒有一個(gè)實(shí)現(xiàn)了效率的明顯進(jìn)步。這意味著雖然它們

53、每一個(gè)都宣稱自己比前一代提速xx%,但是實(shí)際使用中由于體效值的原地踏步,我們實(shí)際上無法感受到所宣稱的速度。這樣的情況維持一兩代還可以勉強(qiáng)接受,但是如果一直持續(xù)下去,相信消費(fèi)者終究會(huì)疲勞,就像現(xiàn)如今陷入困境的PC市場(chǎng)一樣,最終不再有人愿意為新產(chǎn)品買單,而這顯然是手機(jī)廠家所不愿意看到的。從核心上尋找提高能耗比的方式,以ARM的技術(shù)實(shí)力似乎已經(jīng)走到了盡頭。那還有什么辦法可以推進(jìn)效率的進(jìn)步呢?答案也許只有工藝了。關(guān)鍵之中的關(guān)鍵:半導(dǎo)體工藝通過改進(jìn)處理器微架構(gòu)來獲得性能提升是最體面的方法,也是最難的方法。從40年前的英特爾4004,再到今天的酷睿i7,IPS(每周期指令吞吐量)也就是從1提升到2再提升到

54、3的進(jìn)步。再往上,就撞到了難以逾越的功耗之墻。如何打破這堵高高的墻壁?答案只有一個(gè):更好的工藝。對(duì)于ARM而言尤其如此。5年前的ARM11處理器還在使用老掉牙的130nm普通CMOS工藝。而最近一到兩年,由于無法從核心上榨取更多的油水,業(yè)界開始用越來越新的工藝制作最先進(jìn)的ARM處理器,從45nm到32nm甚至現(xiàn)在的28nm,ARM處理器在工藝上的進(jìn)步速度要遠(yuǎn)超同期PC處理器。正是這些新工藝,支撐著ARM處理器在近幾年內(nèi)以每年200%的速度在提升。但是提到工藝,我們就不得不再一次提到一個(gè)詞:極限。沒錯(cuò),通過超量應(yīng)用工藝,我們獲得了超量的性能提升,但是工藝的儲(chǔ)備并不是無窮無盡的,現(xiàn)在的我們已經(jīng)走在

55、了工藝的極限上。如果是傳統(tǒng)的工程極限,隨著新技術(shù)和新方法的發(fā)明,最終都可以實(shí)現(xiàn)突破,但是工藝面臨的這道極限的背后是物理定律。在28nm以后,晶體管實(shí)在是太小了,小到我們必須重新梳理物理定律,才能準(zhǔn)確掌握它的物理性質(zhì)。隨著半導(dǎo)體工藝線寬邁入20nm以下,集成電路中的某些結(jié)構(gòu)已經(jīng)開始邁入介觀和微觀之間的灰色地帶。對(duì)于微觀世界,也就是量子世界,人們目前所掌握的物理學(xué),并不能給出太多具備足夠工程價(jià)值的答案。也許你很難想象,現(xiàn)代為處理器所使用的晶體管,其柵極漏電的很大一部分原因已經(jīng)是量子隧穿效應(yīng)。這是因?yàn)閷?duì)于一個(gè)線寬只有30nm的晶體管而言,它的柵極絕緣材料的厚度只有不到2nm,也就是說,只有不到10層

56、原子的厚度。而工藝最先進(jìn)的英特爾,其量產(chǎn)晶體管的柵極絕緣層厚度已經(jīng)不到1nm,只有5層原子的厚度。在這樣的規(guī)模下,宏觀的物理定律已經(jīng)有相當(dāng)程度的失效,這個(gè)規(guī)模的晶體管會(huì)做出什么行為?更多的只能靠猜測(cè),靠無數(shù)次的實(shí)驗(yàn)。當(dāng)經(jīng)典物理定律失效,人們需要在盲目的實(shí)驗(yàn)中找到解決方案時(shí),進(jìn)步的速度就變得不再可以預(yù)測(cè)。2013年已經(jīng)是28nm的時(shí)代,按照預(yù)測(cè),2014年業(yè)界就將往20nm邁進(jìn)。但是這一步能順利走出去么?相信沒人對(duì)此能有足夠的信心。作為世界上最大的代工廠,臺(tái)積電TSMC的工藝路線對(duì)于業(yè)界的影響力是最為巨大的,早在2009年,TSMC就已經(jīng)宣布將要量產(chǎn)28nm邏輯電路工藝,但是實(shí)際情況是直到201

57、1年底,TSMC都沒能拿出哪怕只用于性能測(cè)試的樣品芯片,而最終的量產(chǎn)一直到2012年6月才在跌跌撞撞中開始,前后延期達(dá)三年。那么,面對(duì)TSMC“2013年底量產(chǎn)20nm”的豪言壯語(yǔ),你又能相信多少呢?TSMC的下一代20納米工藝還面臨一個(gè)問題性能提升將非常有限。從官方演示文檔中我們可以看到,TSMC的20nm規(guī)劃中,針對(duì)移動(dòng)設(shè)備的工藝也就是LP、HPL和HPM被整合成了一種,名為20SoC。它的性能,以TSMC官方的預(yù)計(jì),僅能實(shí)現(xiàn)漏電比28HPM降低20%、性能比28HPM提升15%的水平。希望各位注意,對(duì)比的對(duì)象是28HPM,而28HPM的漏電水平與28LP是接近的,也就是說從28nm到20

58、nm,TSMC只實(shí)現(xiàn)了20%的漏電降低。這是官方最樂觀的預(yù)計(jì),而實(shí)際情況可能要比這個(gè)悲觀的多,一如TSMC對(duì)于28nm量產(chǎn)時(shí)間的預(yù)計(jì)一樣。那么我們就可以得到一個(gè)自然而然的預(yù)計(jì):20nm時(shí)代,我們除了更高的集成度,什么都得不到。這就意味著,以20nm工藝制造的芯片,固然可以通過規(guī)模的擴(kuò)大而獲得更大的理論性能,卻幾乎無法從工藝的進(jìn)步得到單位功耗效率的提升。在目前手機(jī)處理器絕對(duì)性能已經(jīng)超過體效值的大前提下,這樣的結(jié)論幾乎就已經(jīng)宣布了,未來的產(chǎn)品不會(huì)為我們帶來更快的實(shí)際性能。那么更先進(jìn)的工藝呢?例如16nm?根據(jù)目前的規(guī)劃,TSMC將在16nm引入近年來半導(dǎo)體工藝中繼HKMG后最大也可能是最后的進(jìn)步,

59、也就是3D晶體管,又叫finfet。這個(gè)技術(shù)可以為單個(gè)晶體管帶來40%的性能提升,同時(shí)降低30%的功耗,目前已由英特爾量產(chǎn),而整個(gè)業(yè)界只有英特爾實(shí)現(xiàn)了量產(chǎn),由此可見其技術(shù)難度水平。我們沒有理由認(rèn)為,TSMC對(duì)于finfet的引入會(huì)一帆風(fēng)順,外加16nm對(duì)于EUV的需求以及EUV產(chǎn)業(yè)目前的狀況,至少在筆者看來,TSMC可以在2015年量產(chǎn)16nm finfet的概率幾乎為0。至于GlobalFoundries或者三星,前者目前剛剛實(shí)現(xiàn)28nm的量產(chǎn),雖然幻燈片已經(jīng)寫到了10nm,但是我們不應(yīng)對(duì)其抱有太大的信心,而三星的產(chǎn)能過小,即便有良好的工藝,也無法支撐業(yè)界的需求,因此不需要投以太大的注意力。

60、這就意味著,2014年和2015年對(duì)于ARM而言會(huì)非常艱難。因?yàn)橄冗M(jìn)工藝在這兩年將出現(xiàn)空窗期,而沒有先進(jìn)工藝的支持,ARM系產(chǎn)品的性能進(jìn)步就只能停留在紙面。當(dāng)然,也有一種選擇,那就是提前在20nm上就像英特爾所做的那樣引入finfet,但這會(huì)給本來就已充滿變數(shù)的20nm工藝增添新的難度,最極端情況下也許會(huì)導(dǎo)致2014年的徹底空白。因此我們似乎必須接受2014到2015年的空窗期。那么,更先進(jìn),比16nm還先進(jìn)的工藝呢?業(yè)界普遍認(rèn)為,由于物理規(guī)律限制,目前常規(guī)晶體管的極限將在2nm左右到來,在這個(gè)規(guī)模下,基于宏觀原理工作的硅基半導(dǎo)體晶體管將徹底無法運(yùn)行。而考慮到工程實(shí)際情況,也許在10nm時(shí)就已

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論