手機(jī)主流處理器CPU參數(shù)及性能的總論(暨高通,聯(lián)發(fā)科,ARM

上傳人：知*** IP屬地：江西上傳時(shí)間：2022-07-30 格式：DOCX 頁(yè)數(shù)：71 大?。?.37MB 積分：16 舉報(bào) 版權(quán)申訴

手機(jī)主流處理器CPU參數(shù)及性能的總論(暨高通,聯(lián)發(fā)科,ARM_第2頁(yè)

手機(jī)主流處理器CPU參數(shù)及性能的總論(暨高通,聯(lián)發(fā)科,ARM_第3頁(yè)

手機(jī)主流處理器CPU參數(shù)及性能的總論(暨高通,聯(lián)發(fā)科,ARM_第4頁(yè)

手機(jī)主流處理器CPU參數(shù)及性能的總論(暨高通,聯(lián)發(fā)科,ARM_第5頁(yè)

已閱讀5頁(yè)，還剩66頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、從2007年iPhone發(fā)布開始，手機(jī)開始邁入真正的智能時(shí)代。處理器從最早的ARM11 400MHz一路飆升；2008年我們擁有了ARM11 533MHz；2009年進(jìn)化到Cortex A8 400MHz；2010年則瞬間提升至Cortex A8 1GHz；2011年，雙核Cortex A9 1.2GHz開始普及；2012年，四核Cortex A9 1.4GHz出現(xiàn).智能手機(jī)處理器的運(yùn)輸能力幾乎以每年2.5倍的速度在提升。如果以平臺(tái)的壽命來看，ARM9平臺(tái)大約擁有5年的壽命，ARM 11為4年，在這之后，Cortex A8在主流市場(chǎng)堅(jiān)持了一年半，而單核Cortex A9被直接跳過，雙核Cort

2、ex A9一年、四核Cortex A9也是一年。為何市場(chǎng)會(huì)出現(xiàn)如此強(qiáng)大的推動(dòng)力，讓企業(yè)可以集中全行業(yè)的技術(shù)和利潤(rùn)，去瘋狂推動(dòng)一臺(tái)小小的手機(jī)瘋狂升級(jí)？最主要的原因是因?yàn)槭謾C(jī)本身的定位發(fā)生了變化，過去大家需要用PC實(shí)現(xiàn)的應(yīng)用和功能，如今都開始往手機(jī)上轉(zhuǎn)移，這是推動(dòng)手機(jī)硬件爆炸發(fā)展的原動(dòng)力。這樣的需求轉(zhuǎn)變給手機(jī)帶來了無窮無盡的性能需求，也催生了手機(jī)的大屏化我們需要呈現(xiàn)越來越多的信息，手機(jī)的屏幕自然就要同步增大。第一輪洗牌的贏家是蘋果（必須承認(rèn)的是，即便沒有蘋果，這個(gè)時(shí)代依然會(huì)到來，因?yàn)橛布阅艿奶嵘强陀^存在且不會(huì)停止的）。然而，硬件規(guī)格大幅提升之后，伴隨而來的是同樣大幅增加的功耗和發(fā)熱。瘋狂的硬件

3、軍備競(jìng)賽催生出了智能手機(jī)的黃金時(shí)代，也給整個(gè)行業(yè)埋下了定時(shí)炸彈，一場(chǎng)危機(jī)近在眼前?！鞍惭b飛機(jī)發(fā)動(dòng)機(jī)的自行車”如果我們給奇瑞QQ轎車安裝1000馬力的發(fā)動(dòng)機(jī)，可以獲得與超級(jí)跑車相近的性能嗎？答案是否定的，因?yàn)槠嫒餛Q的車體根本無法承受這樣的動(dòng)力輸出。同樣的道理，我們把英特爾酷睿i7處理器裝在手機(jī)上也沒有意義，因?yàn)槭謾C(jī)根本無力承擔(dān)它的功耗。在這個(gè)層面上，我們是理性的，廠家也是理性的，至少在相當(dāng)長(zhǎng)一段時(shí)間內(nèi)是這樣。然而，這部分理性如今卻在逐漸消失。一個(gè)被業(yè)內(nèi)視為默認(rèn)規(guī)則，而聽起來又異常奇怪的現(xiàn)象是：2012年之后的旗艦智能手機(jī)，沒有幾臺(tái)能讓CPU做到長(zhǎng)時(shí)間滿負(fù)荷工作不降頻。廠商不斷地往手機(jī)里塞入更快

4、、更強(qiáng)大的硬件，與此同時(shí)，卻不得不限制它們的工作頻率與工作時(shí)間。你看到的產(chǎn)品手冊(cè)上赫然寫著“四核1.7GHz”，但實(shí)際使用中你永遠(yuǎn)無法得到這樣的性能。這方面的例子比比皆是，從Nexus 4冷柜跑分暴漲30%，到K3V2的GPU頻率縮水6成，大多數(shù)旗艦手機(jī)都無法發(fā)揮出它應(yīng)有的性能。來自Anandtech的著名測(cè)試：把Nexus 4扔進(jìn)冰箱，結(jié)果跑分提升了20%以上！根據(jù)第三方測(cè)試，目前的旗艦手機(jī)能以最高頻率工作的時(shí)間少則數(shù)十秒，多的也只有幾分鐘，之后便不得不降低頻率以緩解發(fā)熱。消費(fèi)者聽著“性能提升xx%”的宣傳，花費(fèi)高額費(fèi)用抱著“四核1.7GHz”的手機(jī)回家，卻只能享受30秒的快樂，這難道不是一

5、種諷刺？往一臺(tái)手機(jī)里安裝根本無法全速運(yùn)行的“強(qiáng)大”處理器，與開頭提到的往奇瑞QQ上安裝1000馬力的發(fā)動(dòng)機(jī)有什么區(qū)別呢？下面的表格是一個(gè)實(shí)例：LG為Optimus G Pro配備了強(qiáng)大的驍龍600處理器，但持續(xù)高負(fù)載工作3分鐘后，實(shí)際性能卻不如搭載了上一代APQ8064芯片的SONY Xperia Z。配置更高的新產(chǎn)品，在實(shí)際使用中卻輸?shù)袅恕靶詢r(jià)比”，我們得到了配置，卻沒有得到性能。你也許會(huì)說，反正價(jià)格沒有更貴，能不能全速?zèng)]啥損失，但這樣的觀點(diǎn)也是錯(cuò)誤的。記?。耗阌肋h(yuǎn)是在為手機(jī)的標(biāo)稱性能埋單，而不是為實(shí)際性能埋單。八核手機(jī)即使只能發(fā)揮出四核手機(jī)的性能，它的價(jià)格也是“八核”級(jí)別的。硬件上所有的成

6、本最終都會(huì)以各種形式轉(zhuǎn)嫁在消費(fèi)者身上。問題是：我們?yōu)槭裁匆獮榘l(fā)揮不出來的性能埋單呢？這樣的趨勢(shì)在2013年乃至更遠(yuǎn)的未來并沒有緩解的跡象。作為消費(fèi)者，我們必須要明確自己的立場(chǎng)：這種趨勢(shì)是錯(cuò)誤的，我們有必要制止它進(jìn)一步惡化！否則我們所付出的金錢將只能換來幾個(gè)紙面上的數(shù)字，而“安裝飛機(jī)發(fā)動(dòng)機(jī)的自行車”遲早有一天要到來。然而，指出錯(cuò)誤很簡(jiǎn)單，糾正錯(cuò)誤卻很困難。如果無法得到一個(gè)對(duì)于正確的評(píng)價(jià)標(biāo)準(zhǔn)，那么對(duì)于未來的分析也就沒有意義，這就啟發(fā)我們?nèi)ふ乙恍┎粫?huì)被技術(shù)所改變的東西，作為衡量正確與錯(cuò)誤的標(biāo)準(zhǔn)。接下來，我們將提出一個(gè)相對(duì)客觀的評(píng)價(jià)標(biāo)準(zhǔn)，并以之為準(zhǔn)繩，對(duì)2013-2014年市面上主流的手機(jī)處理器進(jìn)行

7、逐個(gè)分析。“不可逾越之墻”什么是技術(shù)所無法改變的事物？對(duì)于智能手機(jī)而言，一是客觀存在的物理定律，二是人的生理需求。因?yàn)楸疚牡闹黝}是處理器，因此我們把目光集中在處理器系統(tǒng)上。可以確定的是，只要技術(shù)還沒有進(jìn)步到手機(jī)可靠意念操作，那么人體對(duì)設(shè)備溫度的可以接受上限就是確定的；而只要手機(jī)還符合物理定律，在一定溫度下它所能散發(fā)的熱量也是固定的（不考慮主動(dòng)散熱，例如內(nèi)置風(fēng)扇），這就勾勒出了一條“生死線”在舒適的前提下，一個(gè)確定尺寸的手機(jī)，所采用的硬件功耗，或者說處理器系統(tǒng)的功耗是有極限的，只要超越這條線，就必須要降低工作頻率，否則將會(huì)無法阻止溫度的上升，性能自然也就無從談起。因此我們認(rèn)為，“手機(jī)的極限功耗不

8、應(yīng)該超過其最大可散熱功耗”可以作為衡量產(chǎn)品的準(zhǔn)繩。長(zhǎng)久以來，業(yè)界都習(xí)慣于用配置和價(jià)格的關(guān)系作為評(píng)價(jià)標(biāo)準(zhǔn)，但是如果聯(lián)系到配置與性能脫節(jié)的現(xiàn)實(shí)，這個(gè)標(biāo)準(zhǔn)已經(jīng)瀕臨失效，因此我們需要提出一個(gè)新的評(píng)判標(biāo)準(zhǔn)，不妨姑且將其稱為“體效值”。何謂體效值？我們將體效值定義為設(shè)備體積與能耗系數(shù)的乘積，它代表了一臺(tái)手機(jī)所可以連續(xù)提供的極限性能。將這個(gè)參數(shù)與理論最大性能聯(lián)合評(píng)價(jià)，能得出以下的結(jié)論：如果系統(tǒng)的體效值小于最大性能，那么這套系統(tǒng)就必然是錯(cuò)誤的，因?yàn)榇嬖谥速M(fèi)。但是如果體效值大于最大性能，那么這套系統(tǒng)有可能陷入“性能不夠用”的疑問。最佳情況是體效值和最大性能相同，這意味著這套系統(tǒng)所蘊(yùn)含的性能可以全部發(fā)揮，做到了

9、設(shè)計(jì)可以得到的極限。你可以把“體效值”簡(jiǎn)單理解為“每瓦特性能”。手機(jī)絕對(duì)性能的測(cè)量相對(duì)簡(jiǎn)單，因此體效值中最關(guān)鍵的部分是“體”，即手機(jī)體積所能容納的最大功率。這方面目前沒有明確的行業(yè)標(biāo)準(zhǔn)，因此我們需要做一些假設(shè)。首先，我們假設(shè)在現(xiàn)在以及將來的一段時(shí)間內(nèi)，手機(jī)將主要依靠外殼進(jìn)行被動(dòng)散熱，不會(huì)像電腦一樣引入風(fēng)扇等主動(dòng)散熱手段。其次，我們將人體感溫度舒適上限設(shè)為40度，而耐受極限設(shè)為50度。最后，我們將手機(jī)工作時(shí)環(huán)境溫度設(shè)為25度，并且假定沒有氣流存在。無外界對(duì)流時(shí)，手機(jī)的熱量散發(fā)主要依靠空氣的自然對(duì)流與本身的輻射。假定手機(jī)的溫度為介于舒適上限與耐受極限之間的45度，那么與環(huán)境溫度的差值即為20度。相

10、對(duì)于手機(jī)這個(gè)體積的設(shè)備而言，四個(gè)邊側(cè)面的散熱貢獻(xiàn)可以忽略不計(jì)，主要的散熱面為前后兩個(gè)面。計(jì)算時(shí)假定手機(jī)為垂直放置。下面計(jì)算開始，首先計(jì)算對(duì)流散熱量，我們選擇iPhone 5作為標(biāo)準(zhǔn)對(duì)象。iPhone 5的尺寸為123.858.67.6毫米，因此正面的面積為0.0073平方米。垂直放置的情況下，iPhone 5一個(gè)正面的傳熱系數(shù)為4.65W/(m2)，也就是說這樣一個(gè)表面可以靠對(duì)流散發(fā)的熱量是0.68W，由于有兩個(gè)表面，因此靠機(jī)身自然對(duì)流可以散發(fā)的熱量為1.36W?？紤]到還有側(cè)邊的存在，我們可以認(rèn)為這個(gè)功率是1.5W。接下來計(jì)算輻射熱量。由于iPhone 5的材質(zhì)是鋁合金和玻璃，氧化鋁合金的輻射

11、率大約在0.3左右，而玻璃的輻射率大約是0.85，因此整體輻射率取0.6，那么在外殼溫度整體為45度的時(shí)候，靠輻射可以散發(fā)的熱量經(jīng)過計(jì)算大約是1.16W。也就是說，一臺(tái)通體45度，垂直置于靜態(tài)25度的環(huán)境中的iPhone 5，可以散發(fā)的熱量極限是2.66W。實(shí)際環(huán)境中，考慮到用戶體驗(yàn)，手機(jī)不會(huì)也不可能做到整機(jī)均勻發(fā)熱，這無疑會(huì)降低手機(jī)的散熱能力，但由于人體與手機(jī)的接觸也可以帶走一定的熱量，因此兩者互有增減，相信整體的散熱功率不會(huì)與計(jì)算數(shù)值差距過大。因此，大約2.66W就是iPhone 5所能承受的最大整機(jī)功率（這里直接使用了整機(jī)功率，這是因?yàn)槟壳半娮赢a(chǎn)品除了天線部分以外，消耗的電能絕大部分都轉(zhuǎn)

12、化成了熱量，耗電量和發(fā)發(fā)熱量基本相等）。再來看看Galaxy S4。由于計(jì)算的方式是相同的，因此過程就不給出了，唯一的不同是，作為塑料外殼的Galaxy S4，在熱輻射效率上要遠(yuǎn)高于鋁合金的iPhone 5，具體來說在0.9左右（看來塑料機(jī)還是有一些好處的）。結(jié)果直接給出，Galaxy S4在同等條件下的散熱量為4.15W。Galaxy S4旗艦安卓手機(jī)的代表，因此更大尺寸的機(jī)器我們就不計(jì)算了。結(jié)果顯而易見，對(duì)于iPhone 5這種尺寸的手機(jī)而言，系統(tǒng)的極限功率是2.66W，而Galaxy S4尺寸的產(chǎn)品則為4.15W。體積處于兩者之間的產(chǎn)品，散熱能力則介于它們之間。至此，體效積中的體就已經(jīng)有

13、了結(jié)論。因?yàn)檫@個(gè)參數(shù)是不會(huì)因?yàn)榧夹g(shù)提升而改變的，所以它可以作為我們判定未來新技術(shù)與新可能的良好標(biāo)準(zhǔn)。也就是說，對(duì)于一臺(tái)5寸手機(jī)而言，我們可以得到的最大性能就是4.15W每瓦特性能，不論這臺(tái)手機(jī)的理論性能有多么強(qiáng)大。換句話說，只要一臺(tái)5寸手機(jī)的整機(jī)最大功耗超過了4.15W，那么我們就一定可以判定：它的性能無法發(fā)揮。進(jìn)一步的，對(duì)于一臺(tái)手機(jī)而言，屏幕所占據(jù)的功耗大約從4寸的1.2W到5寸的1.8W不等，因此我們可以得出，極限散熱功耗中，留給CPU、GPU、內(nèi)存等計(jì)算系統(tǒng)的功耗上限，對(duì)于iPhone 5尺寸的手機(jī)而言是1.5W左右，對(duì)于Galaxy S4尺寸的手機(jī)而言是2.5W左右。需要說明的是，在計(jì)

14、算散熱量時(shí)，我們所關(guān)注的對(duì)象是手機(jī)外表面，至于內(nèi)部是如何傳熱的，對(duì)結(jié)果不會(huì)有影響。可能你會(huì)存在疑問，某手機(jī)內(nèi)含熱管，某手機(jī)擁有石墨散熱膜，散熱要好得多這是錯(cuò)誤的，輔助散熱措施只是增加了手機(jī)內(nèi)部的熱傳導(dǎo)效率，最終效果是提高手機(jī)整體的溫度均勻性，而我們?cè)谟?jì)算的時(shí)候已經(jīng)假定了這個(gè)數(shù)值是100%，也就是內(nèi)部熱傳遞設(shè)計(jì)為完美狀態(tài)的極限結(jié)果。至此，我們可以對(duì)智能手機(jī)“核戰(zhàn)爭(zhēng)”帶來的問題給出一個(gè)精確的描述：由于近年來手機(jī)配置的瘋狂提升，導(dǎo)致手機(jī)的最大性能已經(jīng)超越了體效值。這個(gè)前提下，任何理論性能的提升都是紙面的，功耗已經(jīng)成為了一堵不可逾越的墻。在可以預(yù)見的未來，如果我們希望繼續(xù)提升手機(jī)的性能，那就只能在能耗

15、系數(shù)上下功夫。帶著這個(gè)結(jié)論，讓我們來重新審視一番市面上的主流手機(jī)處理器。產(chǎn)品審查：高通驍龍800首先我們來看一看高通。之所以首先觀察高通，是因?yàn)橄鄬?duì)而言高通的產(chǎn)品是變化幅度最小的，因此我們可以借用的歷史數(shù)據(jù)就最多。在四核處理器上成文時(shí)，高通的最新產(chǎn)品是S4 Pro APQ8064。而在我們撰寫本文時(shí)，高通重新命名了它的產(chǎn)品線，S4 Pro有了繼任者驍龍600。這是一顆和APQ8064區(qū)別很小的芯片，最大的提升在于內(nèi)存從雙通道LPDDR2 533變成了雙通道LPDDR3 1066，因此我們不打算深究這顆芯片。高通的重頭戲，以及下半年乃至明年的主打，將是驍龍800。它擁有改進(jìn)后的Krait 400

16、核心，主要改動(dòng)是調(diào)整了內(nèi)部緩存架構(gòu)，降低異步設(shè)計(jì)帶來的影響。同時(shí)，驍龍800引入了HPM工藝，主頻達(dá)到了2.3GHz，成為手機(jī)SoC中的一個(gè)超過2GHz大關(guān)的產(chǎn)品。除此之外，驍龍800還集成了新的Adreno 330 GPU，性能與規(guī)模再次翻倍。文件壓縮速度，驍龍600的Krait 300內(nèi)核同頻性能甚至不如Cortex A7相信看過之前的文章后，現(xiàn)在的你已經(jīng)不會(huì)被上面充滿誘惑力的宣傳所擊倒。是的，我們?cè)俅沃貜?fù)一遍：絕對(duì)性能的提升沒有意義，決定用戶體驗(yàn)的是體效值，或者說每瓦特性能。那么驍龍800的每瓦特性能有沒有提升呢？首先我們來看一看CPU部分。由于緩存的增強(qiáng)，Krait 400核心的執(zhí)行效

17、率必然會(huì)得到一定的提升，但是Krait核心從本質(zhì)上來說依然是一個(gè)“增肥”版的Cortex A9，它所面對(duì)的最大問題其實(shí)是由于指令隊(duì)列的不足，導(dǎo)致架構(gòu)的IPC受限。Krait的后端就像是規(guī)模巨大的工廠，而經(jīng)過持續(xù)的升級(jí)，Krait的前端已經(jīng)從小港口變成了大型碼頭但是連接它們的依然只是一條省道。這樣的架構(gòu)也許可以在理論測(cè)試中獲得極高的成績(jī)，但是在實(shí)際變幻莫測(cè)的應(yīng)用代碼面前，往往無法發(fā)揮應(yīng)有的效率，根據(jù)某些第三方測(cè)試，在諸如視頻解碼、文件壓縮與解壓縮等應(yīng)用中，Krait 300核心的同頻性能有時(shí)會(huì)不如Cortex A9甚至A7。這雖然不足以定性的給這個(gè)架構(gòu)下結(jié)論，至少也可以說明一部分的問題。因此，綜

18、合來看，Krait系列核心的能耗，恐怕是比較悲觀的，即APQ8064的執(zhí)行效率并不如Cortex A9，Krait 400核心雖然經(jīng)過了兩次升級(jí)，但是考慮到Krait 300的實(shí)際表現(xiàn)，我們認(rèn)為其執(zhí)行效率至多只能達(dá)到略高于A9的水平。也就是說，Krait 400架構(gòu)效率上并沒有大幅超越Cortex A9。那么產(chǎn)品效率呢？在這之前筆者需要稍微岔開一些話題。不知道你是否發(fā)現(xiàn)，我們?cè)趯?duì)比效率的時(shí)候往往都會(huì)和Cortex A9相比，準(zhǔn)確來說是和SAMSUNG Exynos 4412相比。為何要用它作為基準(zhǔn)？這并不是因?yàn)槠幕蚴菍?duì)于三星有著額外的好感，原因很簡(jiǎn)單，那就是根據(jù)之前我們對(duì)手機(jī)極限功耗的定義，

19、在那樣的功耗限制之下，Exynos 4412是體效值與絕對(duì)性能之間最接近的產(chǎn)品：Exynos 4412的核心，工作在1.4GHz時(shí)單顆功耗約為440mW，1.6GHz約為600mW，總功耗即為1.8W與2.4W。因此Exynos 4412是一個(gè)極好的標(biāo)準(zhǔn)如果有產(chǎn)品的效率比4412高，它就可以發(fā)揮出比4412更加優(yōu)越的實(shí)際性能，否則就只能在降頻中工作。在驍龍800以外的產(chǎn)品中，高通采用的是28LP SiON/Poly工藝，這會(huì)導(dǎo)致漏電增加，繼而降低能耗比。在上篇中我們引用外媒Anandtech的結(jié)論，得知28LP工藝的驍龍APQ8064，運(yùn)行在1.5GHz的頻率下，單個(gè)核心的功耗大約是700mW

20、。而到了驍龍800，高通終于引入了先進(jìn)的HKMG技術(shù)，將工藝更換為了28HPM。那么，這個(gè)工藝是否能提升驍龍800的能耗比？根據(jù)TSMC對(duì)于28HPM的工藝描述，我們認(rèn)為這個(gè)答案同樣也許是比較悲觀的，因?yàn)?8HPM本質(zhì)上是用來提升性能的工藝，它的主要目的是讓驍龍800得以運(yùn)行在使用28LP的驍龍600所無法達(dá)到的高頻下，但是處理器本身的漏電并不會(huì)因此而減小。臺(tái)積電四種28納米工藝的區(qū)別我們粗略估計(jì)，運(yùn)行在2.3GHz下的Krait 400核心，即便只考慮頻率的提升，單個(gè)核心滿載的功率也將超過1W，四核心的總功耗則會(huì)遠(yuǎn)超2.5W的散熱功耗上限。至于能耗比，在低頻段，驍龍800的能耗比也許可以略超

21、龍600，但是總體來說我們并不認(rèn)為驍龍800在CPU部分的能耗比會(huì)大幅領(lǐng)先于Cortex A9，也就是說驍龍800的體效值將明顯小于極限性能。按照我們之前的分析，驍龍800在手機(jī)上的長(zhǎng)期性能表現(xiàn)就將不會(huì)比Cortex A9提升太多（短期性能表現(xiàn)，例如基準(zhǔn)測(cè)試，會(huì)因?yàn)樵O(shè)備的熱容以及溫度滯后效應(yīng)而大幅提升，但是只要工作足夠長(zhǎng)不超過三分鐘的時(shí)間后，性能將會(huì)降低到Cortex A9水平）。使用工具監(jiān)控驍龍APQ8064的CPU頻率變化，運(yùn)行2分鐘以后，CPU頻率降低到了1GHz以下那么GPU部分呢？這方面的問題可能會(huì)比CPU更加嚴(yán)重。高通Adreno 300系列GPU的超低能耗比已經(jīng)是眾人皆知的問題，

22、其嚴(yán)重程度遠(yuǎn)超CPU。由于GPU相對(duì)于CPU而言是低頻大規(guī)模電路，因此它對(duì)于漏電的敏感程度要遠(yuǎn)高于CPU，對(duì)于頻率的敏感程度則不如CPU。驍龍800所集成的Adreno 330相對(duì)于Adreno 320而言規(guī)模提升了一倍，因此功耗的提升幅度自然也不會(huì)小到哪里去，我們假定Adreno 330可以借助HPM工藝，完全避免功耗的提升，它的能耗比能有多高？使用工具監(jiān)控驍龍600的CPU頻率變化，Krait 300核心根本無法維持全速工作對(duì)于這個(gè)問題，我們可以通過一個(gè)粗略的測(cè)試來判斷。Galaxy S4和配備了驍龍600的手機(jī)，在3Dmark中的得分基本是相同的，但是根據(jù)耗電量得出的整機(jī)功耗估值方面，G

23、alaxy S4所具備的SGX544MP3 GPU的功耗幾乎只有Adreno320的15%甚至更低，換句話說就是SGX544MP3的能耗比幾乎是Adreno330的7倍實(shí)際上，根據(jù)粗略測(cè)試的結(jié)果，Adren 320的功耗已經(jīng)達(dá)到了大約6W，不論這個(gè)數(shù)字是否精確，Adren 320早已遠(yuǎn)遠(yuǎn)超過了2.5W，甚至4.15W的散熱功耗極限。性能翻倍dreno 330即使維持功耗不變，也將和CPU一樣，在實(shí)際工作中也將永遠(yuǎn)不可能發(fā)揮出其最大性能，它的體效值同樣遠(yuǎn)遠(yuǎn)小于理論最大性能。最終，我們對(duì)于驍龍800的預(yù)期表現(xiàn)是比較悲觀的。我們認(rèn)為，在CPU部分，配備驍龍800的產(chǎn)品，并不能讓用戶得到遠(yuǎn)超四核心Co

24、rtex A9如宣傳、測(cè)試以及參數(shù)上那樣的實(shí)際體驗(yàn)，而GPU方面則更會(huì)遠(yuǎn)遠(yuǎn)不如SGX544MP3，不論理論測(cè)試有多么強(qiáng)大。驍龍800并沒能有效提升能耗比，因此裝有驍龍800的產(chǎn)品，其體效值將遠(yuǎn)遠(yuǎn)小于宣傳的性能，作為結(jié)果，消費(fèi)者購(gòu)買的大部分參數(shù)和數(shù)字，將會(huì)永遠(yuǎn)停留在紙面上當(dāng)然，還有基準(zhǔn)測(cè)試軟件里。產(chǎn)品審查：Tegra 4與Tegra 4i雖然都屬于Tegra 4家族，但是實(shí)際上Tegra 4和Tegra 4i的核心并不相同：前者基于Cortex A15，而后者基于改進(jìn)版Cortex A9。對(duì)于后者我們不會(huì)多加論述，我們將主要關(guān)注前者。如同Tegra3，Tegra 4也引入了nVIDIA自行設(shè)計(jì)的

25、vSMP 4+1技術(shù)。因此對(duì)于Tegra 4的效率分析，將會(huì)分為兩個(gè)部分：4核部分與附加單核部分。首先是4核部分。Tegra 4的所有核心都是典型的Cortex A15架構(gòu)，工藝使用了TSMC 28HPL，因此對(duì)于這一部分的分析我們可以找到一個(gè)極好的參照物，那就是Nexus 10所配備的Exynos 5250。后者是一枚雙核Cortex A15、32nm HKMG LP工藝、工作頻率1.7GHz的SoC。根據(jù)已有的測(cè)試結(jié)果，Exynos 5250的CPU功耗為4W，也就是說單核功耗為2W。這項(xiàng)對(duì)于Exynos 4412的440/600mW而言是一個(gè)相當(dāng)大的數(shù)值，這也意味著Cortex A15的

26、性能必須要四倍于Cortex A9，才可以維持效率的一致。NV做到了嗎？很明顯，也很遺憾，沒有。Cortex A15的性能提升幅度遠(yuǎn)遠(yuǎn)沒有功耗提升幅度大，兩者之間的差距導(dǎo)致了Cortex A15的每瓦特性能相對(duì)于Cortex A9來說有著至少一半的下降。那么回頭來看看Tegra 4。由于核心是相同的，我們只需要對(duì)比工藝。TSMC 28HPL相對(duì)于三星32nm HKMG LP，究竟有沒有性能和漏電方面的提升我們很難判斷，但是大體上兩者屬于同一時(shí)代的同一水準(zhǔn)工藝，相信差距并不會(huì)過大，我們假設(shè)臺(tái)積電的28LP工藝總體能耗比三星降低30%這已經(jīng)幾乎是同一代工藝可以存在的最大差距這也遠(yuǎn)不足以抵消Cort

27、ex A15和Cortex A9近乎200%的差距，更何況Tegra 4的主頻高達(dá)1.9GHz，這進(jìn)一步降低了它的功耗可以低于2W/核心的可能性。這也就意味著，即便只有一顆核心工作，Tegra 4的功耗就已經(jīng)逼近了4寸手機(jī)的散熱功耗極限，而四核同時(shí)工作，如果不加限制，CPU部分的總功耗必將輕松突破8W。Tegra 4功耗有多大NV很清楚，所以給自家的Shield游戲機(jī)裝上了風(fēng)扇！既然能耗比如此之低，那么技術(shù)有何改變、理論性能有何提升、在哪里提升就完全沒有意義了。在手機(jī)上，Tegra 4的四枚Cortex A15所能發(fā)揮出的長(zhǎng)期性能，除了極少數(shù)情況下，可以幾乎肯定的說，將遠(yuǎn)不如一個(gè)設(shè)計(jì)優(yōu)秀的四核

28、Cortex A9處理器。那么輔助的拌核部分呢？NV沒有公布拌核的細(xì)節(jié)資料，我們假設(shè)它工作在1GHz，由于HPL工藝帶來的低漏電，預(yù)計(jì)可以讓這枚核心的功耗降低到0.6W左右，大約等同于一顆1.6GHz的Cortex A9。在這個(gè)工作條件下，Cortex A15的能耗比和Cortex A9比較接近，因此它們具備了接近的體效值。但是此時(shí)的Tegra 4，絕對(duì)性能只有四核Cortex A9的四分之一，體效值遠(yuǎn)遠(yuǎn)高于絕對(duì)性能，這也就意味著此時(shí)的Tegra 4會(huì)因?yàn)檫^慢而無法滿足用戶需求。綜上所述，Tegra 4不論在哪個(gè)模式下，所能提供的最大性能都難以超越四核心Cortex A9處理器，把這樣一顆處理

29、器做進(jìn)手機(jī)唯一的意義也許只有一個(gè)想方設(shè)法讓手機(jī)堅(jiān)持滿載運(yùn)行三分鐘，跑出一個(gè)驚世駭俗的基準(zhǔn)測(cè)試分?jǐn)?shù)，給手機(jī)發(fā)燒友作茶余飯后跑分攀比的資本，就好比購(gòu)買超級(jí)跑車上下班，除了炫耀以外沒有任何意義。至于Tegra 4的GPU部分，由于目前資料較少，所以無法給出分析對(duì)比。當(dāng)然我們也需要明白，Tegra 4的悲劇并不全是由于Tegra 4本身或是nVIDIA的技術(shù)實(shí)力導(dǎo)致的，究其根本，元兇還是Cortex A15核心過低的能耗比。這也決定了不僅是nVIDIA，其他任何試圖在產(chǎn)品中引入標(biāo)準(zhǔn)Cortex A15架構(gòu)的廠家，例如未來的華為海思K3V3，最終都將難逃“性能超不過A9”的魔咒。對(duì)于手機(jī)等便攜式設(shè)備而言

30、，Cortex A15毫無疑問是一個(gè)失敗的設(shè)計(jì)，也無怪乎高通和蘋果在幾年前就決定放棄這個(gè)架構(gòu)，自行以Cortex A9為基礎(chǔ)發(fā)展自己的強(qiáng)化核心。這也從另一個(gè)方面看出，至少在目前可以看到的ARM產(chǎn)品中，Cortex A9依然是可以提供最強(qiáng)實(shí)際性能的產(chǎn)品，即便它已經(jīng)問世超過了2年。最后提一下Tegra 4i。相信NVIDIA規(guī)劃這樣一個(gè)產(chǎn)品，也是因?yàn)镹V實(shí)際上非常明白Cortex A15是一顆怎樣的核心。因此，我們甚至可以理解為，Tegra 4i才是針對(duì)手機(jī)市場(chǎng)所推出的高性能產(chǎn)品。改進(jìn)的Cortex A9 r3p1核心可以帶來最多15%的同功耗性能提升，也就是更高的體效值與實(shí)際性能。但是Tegra

31、 4i卻如同驍龍800一般選擇了HPM工藝，并且因?yàn)樾枰苫鶐Ф鵁o法在2013年上市，這對(duì)于Tegra 4i和NVIDIA而言無疑是徹頭徹尾的悲劇，尤其是如今Cortex A12箭在弦上的情況下。如果說Cortex A15可以看作ARM在被成功沖昏了頭腦之后的大躍進(jìn)，那么后者就可以看作是ARM在大躍進(jìn)失敗后的反省之作，肩負(fù)了Cortex A9正統(tǒng)繼任者的使命。對(duì)于它，我們?cè)诤竺嬗枰杂懻摚@里暫不多言。產(chǎn)品審查：三星Exynos 5 Octa最后來談一談技術(shù)最為復(fù)雜，同時(shí)爭(zhēng)議也最大的三星Exynos 5 Octa（Exynos 5410）。這個(gè)芯片最大的特色就是整合了ARM的big.LITTL

32、E技術(shù)，內(nèi)部集成了8個(gè)核心四個(gè)Cortex A15為一組，四個(gè)Cortex A7為一組，從而成為了手機(jī)上第一枚超越四核的片上系統(tǒng)。也許你會(huì)提出質(zhì)疑，NV的Tegra 3和Tegra 4實(shí)際上也擁有5個(gè)核心，為什么它不能算作是五核SoC呢？原因很簡(jiǎn)單，因?yàn)門egra多出來的那一枚核心其實(shí)設(shè)計(jì)上是作為四個(gè)主核心其中之一的映射，在實(shí)際工作中系統(tǒng)是識(shí)別不出這一顆核心的。但Exynos 5 Octa不同，它的八顆核心在某些情況下是可以同時(shí)運(yùn)行的，因此可以稱之為八核SoC，雖然實(shí)際情況下這樣的工作模式不一定會(huì)被用上，關(guān)于這點(diǎn)，即Exynos 5 Octa是否是偽八核，同樣也是圍繞這顆芯片的眾多爭(zhēng)議中最大的

33、一個(gè)，對(duì)此后面我們會(huì)詳細(xì)討論。除了big.LITTLE以外，Exynos 5 Octa本質(zhì)上是一顆非常典型的處理器，它擁有標(biāo)準(zhǔn)的Cortex A15核心、標(biāo)準(zhǔn)的ARM系統(tǒng)IP，支持的規(guī)格與系統(tǒng)配置也一如三星以往的風(fēng)格，頂級(jí)而不頂尖。LPDDR3 1600的內(nèi)存支持與12.8GB/s的理論帶寬在手機(jī)SoC中實(shí)為翹楚，而PowerVR SGX544MP3運(yùn)行在533MHz的高頻下，假如不考慮信息尚不明確的Tegra 4，性能也足以進(jìn)入ARM世界的前三：僅次于iPad4的SGX554MP4和驍龍800的Adreno 330。工藝方面，三星使用了自家最新的28nm HKMG LP，根據(jù)三星的宣傳資料，

34、相對(duì)于32nm HKMG，28nm HKMG主要的提升在于集成度，也就是單位面積下可以實(shí)現(xiàn)更多的晶體管，提升幅度大約在35%左右。至于漏電等工藝性能，我們有理由認(rèn)為不會(huì)和32nm HKMG，也就是上一代的Exynos 4412所采用的工藝有太大的差別，具體原因在上篇中我們也多有提及。三星32nm HKMG實(shí)際上是一個(gè)性能相當(dāng)強(qiáng)悍的工藝，Exynos 5 Octa的基礎(chǔ)至少也是有所保障的。不過，如同之前說過的，Cortex A15本身不是一個(gè)利于手機(jī)使用的架構(gòu)，只要把它做進(jìn)手機(jī)，都要面對(duì)功耗難題，三星也不能例外。Exynos 5 Octa的最高頻率目前并沒有明確的說法，也許會(huì)在1.7到1.9GH

35、z之間，但我們知道的是，在Galaxy S4上，Exynos 5 Octa的最高頻率只開放到了1.6GHz。1.6GHz的標(biāo)準(zhǔn)Cortex A15核心滿載功耗不會(huì)低于1.8W，三星即使經(jīng)過大量?jī)?yōu)化，Exynos 5410四顆A15核心的總功率也依然要在6W以上，這大大超越了2.5W乃至4.15W的散熱極限。實(shí)際情況可以作為這個(gè)推斷的最佳例證：Galaxy S4的CPU滿載工作的時(shí)間只能達(dá)到區(qū)區(qū)10秒，之后就不得不因?yàn)楹诵臏囟韧黄?0度而被迫關(guān)閉Cortex A15核心。Exynos 5 Octa是一個(gè)明顯的市場(chǎng)導(dǎo)向產(chǎn)品，三星在設(shè)計(jì)它的時(shí)候，考慮優(yōu)先點(diǎn)是市場(chǎng)對(duì)于參數(shù)的需求，而完全不顧這樣規(guī)模的硬

36、件是否可以安全的工作。當(dāng)然，作為應(yīng)對(duì)，ARM提出了big.LITTLE，三星也將其引進(jìn)到產(chǎn)品中，但是這樣的行為并不能本質(zhì)上改變這個(gè)設(shè)計(jì)的失敗之處。有人也許會(huì)說，這不是很好嗎，何來失??？那就讓我們繼續(xù)研究下去?，F(xiàn)在讓我們來打個(gè)賭：如果你是Galaxy S4八核版的用戶，你絕對(duì)會(huì)有這樣的體會(huì)：Exynos 5410處理器主頻在實(shí)際運(yùn)行中非常不穩(wěn)定，低于標(biāo)稱的1.6GHz是常態(tài)。在Exynos 5410中，Cortex A15四核的最低工作頻率是1.2GHz，而Cortex A7四核的最高工作頻率也是1.2GHz。問題是，這兩者的同頻性能并不一樣，導(dǎo)致以頻率為控制參數(shù)的算法比較難寫。于是三星在系統(tǒng)中

37、將Cortex A7的有效頻率顯示為實(shí)際頻率的一半，并以此作為控制參數(shù)，就實(shí)現(xiàn)了較為線性的頻率性能曲線。運(yùn)行5秒鐘以后，獵戶座5處理器的A15核心即開始降頻也就是說，只要你看到Exynos 5 Octa的工作頻率是1.2GHz以上，就意味著現(xiàn)在是Cortex A15在工作，而600MHz則意味著Cortex A15已經(jīng)關(guān)閉，系統(tǒng)已經(jīng)切換到1.2GHz的Cortex A7。由于頻率調(diào)節(jié)十分頻繁，所以這給我們計(jì)算Exynos 5 Octa的效率帶來了一定的困難，不過我們依然可以從實(shí)際工作的情況下對(duì)于極限性能給出近似的計(jì)算。Exynos 5410 CPU + GPU同時(shí)滿載的情況，注意下方的頻率曲線

38、enet的測(cè)試結(jié)果顯示，在滿負(fù)荷工作的時(shí)候，Exynos 5410的工作模式大約如下：Cortex A15于1.6GHz工作6秒左右，于1.2或1.4GHz工作4秒左右，然后切換到1.2GHz的Cortex A7工作10秒左右，并且在這樣的序列下循環(huán)。由于頻率調(diào)節(jié)的目標(biāo)是功耗以及溫度，因此我們可以近似認(rèn)為在這樣的工作序列下，處理器系統(tǒng)的平均功耗大約是2.5W左右。如果將Cortex A15的性能歸一化為同頻Cortex A9的1.5倍，Cortex A7為0.7倍，因此我們可以得到在這20秒內(nèi)，Exynos 5 Octa所輸出的總性能相當(dāng)于四核Cortex A9運(yùn)行在1.53GHz時(shí)的性能。也

39、就是說，Exynos 5 Octa所能提供的持續(xù)性能，甚至還不如Exynos 4412，因?yàn)楹笳咴?.5W的功耗限制下可以運(yùn)行在1.6GHz。當(dāng)然，這個(gè)結(jié)論有些粗略，我們只驗(yàn)證了基準(zhǔn)測(cè)試時(shí)獵戶座5處理器的CPU頻率變化，實(shí)際應(yīng)用中可能有所不同，但有一點(diǎn)可以確定，那就是Exynos 5410在手機(jī)上可以發(fā)揮的性能遠(yuǎn)遠(yuǎn)低于硬件設(shè)計(jì)的極限性能。Cortex A7與Cortex A15聯(lián)合的效率，大約和Cortex A9不相上下，這也就意味著配備了Exynos 5 Octa的設(shè)備，其體效值并不會(huì)比Exynos 4412高。然而，這并非Exynos 5 Octa的最佳工作模式。ARM big.LITTL

40、E技術(shù)其實(shí)包含有三種工作模式：整體遷移、非對(duì)稱多核心與異構(gòu)多核心。整體遷移模式指Cortex A15或Cortex A7輪流工作，兩者無法同時(shí)激活，具體開啟的核心數(shù)字根據(jù)系統(tǒng)負(fù)載決定。非對(duì)稱多核心則是將Cortex A15四核簇和Cortex A7四核簇看作兩組非對(duì)稱多核心簇，依靠外部總線工作在異步模式下，從而啟動(dòng)所有的八個(gè)核心。而第三種是最誘人的，也就是將每一個(gè)A15與A7組合成為一個(gè)“處理器對(duì)”，將其看作一個(gè)單獨(dú)的處理器，系統(tǒng)根據(jù)需求開啟若干個(gè)“處理器對(duì)”，而每一對(duì)處理器究竟使用Cortex A15還是Cortex A7，完全根據(jù)該核心的負(fù)載決定。從理論上來說，Exynos 5 Octa支

41、持全部的三個(gè)模式，但是三星目前在系統(tǒng)中卻只支持了第一種模式，產(chǎn)品中的工作模式也只有整體遷移。這導(dǎo)致一些人認(rèn)為三星這顆CPU的技術(shù)開發(fā)尚未完成，是“半成品”，因此并沒有實(shí)現(xiàn)最佳的工作效果。甚至有一些分析表示，這是源于Exynos 5 Octa的硬件設(shè)計(jì)缺陷導(dǎo)致的，需要在未來的產(chǎn)品中才能修復(fù)。對(duì)此，我們認(rèn)為這樣的說法既是對(duì)的，也是錯(cuò)的。為什么這樣說？前提是，單純的降低功耗并沒有意義，只有提升體效值才可以獲得更強(qiáng)的性能。對(duì)于Exynos 5 Octa而言，其他的兩種工作模式似乎可以降低功耗，但可以提升每瓦特性能嗎？這是一個(gè)未知數(shù)，而且是一個(gè)相當(dāng)不容樂觀的未知數(shù)，原因之一就在于Exynos 5 Oct

42、a的兩組處理器，二級(jí)緩存的大小不同。根據(jù)架構(gòu)圖，Exynos 5 Octa的Cortex A15部分，二級(jí)緩存為2MB，而Cortex A7部分只有512KB。如果是Cortex A9時(shí)代，這并不是問題，因?yàn)樗械亩?jí)緩存都是靠總線實(shí)現(xiàn)的訪問。但是在Cortex A15和A7時(shí)代，ARM為了提升緩存效能，將L2 Cache整合進(jìn)了多核心控制器SCU中，它的壞處就在這里：一旦系統(tǒng)內(nèi)同時(shí)存在著激活的Cortex A7和Cortex A15，那么由于二級(jí)緩存的大小不同，兩組核心之間的聯(lián)合工作將會(huì)變得非常麻煩。二級(jí)緩存是內(nèi)存的映射，所以所有核心所訪問的二級(jí)緩存的數(shù)據(jù)必須完全相同。Cortex A15和

43、Cortex A7各自擁有自己獨(dú)占的二級(jí)緩存，當(dāng)兩者協(xié)同工作時(shí)，緩存是無法共享的，維護(hù)兩組L2之間的數(shù)據(jù)一致性會(huì)變成一件非常重要同時(shí)也非常影響性能的事情。高通的異步架構(gòu)之所以有性能損失，一致性開銷就是其中很重要的因素之一。在Exynos 5 Octa中，兩組A15和A7核心的二級(jí)緩存大小不同，這就意味著即便是在最好的情況下，也會(huì)導(dǎo)致Cortex A15處理器簇的有效L2從2MB縮減到512KB，這對(duì)性能的影響極為巨大。所以，三星選擇了只實(shí)現(xiàn)第一種工作模式。在這個(gè)模式下，緩存一致性無需維持，只需要在切換時(shí)通過內(nèi)存將緩存數(shù)據(jù)復(fù)制即可（A7到A15可以視作部分填充，而A15到A7可以丟棄超出512K

44、B的部分），甚至可以更簡(jiǎn)單的直接丟棄L2數(shù)據(jù)，令其重新填充。因?yàn)橄鄬?duì)于聯(lián)合工作所需要的一致性維護(hù)需求（其頻繁程度與緩存命中率相關(guān)，可能只比處理器時(shí)鐘頻率低23個(gè)量級(jí)）而言，由于動(dòng)態(tài)頻率控制導(dǎo)致的核心切換要少的多，至多只有每秒百次的水平，因此這樣的損失是最少的，換句話說，另外兩種big.little模式雖然看起來更美好，但實(shí)際上反而會(huì)導(dǎo)致系統(tǒng)效率的降低，從而進(jìn)一步降低搭載Exynos 5 Octa設(shè)備的體效值，使其變得比Cortex A9更慢。從這個(gè)意義上說，如果你需要一顆手機(jī)處理器，至少在CPU部分，Exynos 5 Octa實(shí)際上相對(duì)于Exynos 4412而言是倒退的。這無疑是對(duì)于畸形市場(chǎng)

45、需求的最佳打臉：超高的規(guī)格，強(qiáng)大的指標(biāo)，性能卻在偷偷的后退，不知道這到底迎合了誰(shuí)的需求。當(dāng)然，Exynos 5 Octa也不全都是壞處。由于LPDDR3的引入，翻倍的內(nèi)存帶寬可以極大提升系統(tǒng)在日常使用中的感受，因此總體而言Exynos 5 Octa的體驗(yàn)不會(huì)有之前評(píng)價(jià)的那么悲觀，只是會(huì)距離你所認(rèn)為的強(qiáng)大相去甚遠(yuǎn)罷了。至于另一個(gè)好處則來源于PowerVR SGX544MP3這枚GPU。就如同PC一樣，手機(jī)對(duì)于GPU的需求也慢慢超過了CPU。不客氣的說，現(xiàn)在的日常需求，一枚四核心Cortex A7就可以滿足了，但是游戲所需要的性能卻是永無止境的。在Exynos 4210“獵戶座”剛剛發(fā)布的時(shí)候，M

46、ali400MP4幾乎可以滿足所有游戲，這枚GPU不僅速度飛快，而且極為省電，能耗比相當(dāng)高。但是隨著手機(jī)游戲的進(jìn)步，在Exynos 4412上這枚GPU已經(jīng)顯出了疲態(tài)。三星在Exynos 5 Octa上作出更換GPU的決定非常及時(shí)。Exynos 5 Octa的3D性能達(dá)到了目前手機(jī)處理器的頂級(jí)水平，在日常使用中你有很多機(jī)會(huì)可以體驗(yàn)到它帶來的提升。根據(jù)粗略測(cè)試，搭載Exynos 5 Octa的Galaxy S4在運(yùn)行3Dmark的時(shí)候，整機(jī)功耗不會(huì)超過2.5W，這也就意味著這枚GPU的滿載功耗將不會(huì)超過1.5W。這無疑是一個(gè)非常振奮人心的數(shù)據(jù)，這意味著PowerVR SGX544MP3在維持了M

47、ali 400MP4能耗比的基礎(chǔ)上（嚴(yán)格來說仍然有一定的下滑，但是遠(yuǎn)遠(yuǎn)高于繼任者M(jìn)ali T604）將其的最大性能擴(kuò)展了幾乎四倍，這樣的提升才是符合用戶需求的提升。對(duì)于這樣的進(jìn)步，我們需要高舉雙手給予掌聲。新一代處理器性能對(duì)比分析雖然說我們之前通篇都在論述的觀點(diǎn)是目前旗艦手機(jī)平臺(tái)的性能受限于功耗，無法在日常使用中體現(xiàn)，但是不得不承認(rèn)基準(zhǔn)測(cè)試也是部分用戶日常使用的功能之一，而且這些芯片“不管實(shí)際情況，就跑分到底誰(shuí)最快”也是很多人很有興趣的問題之一。當(dāng)然，相對(duì)于前幾年的產(chǎn)品而言，現(xiàn)在的平臺(tái)下跑分的意義不論如何都在變得越來越小，因此我們不會(huì)再像上篇一樣做連篇累牘的深入分析。取而代之的，我們只會(huì)從幾個(gè)

48、理論測(cè)試軟件的成績(jī)里大概的看一下它們之間的勝負(fù)關(guān)系與潛力。由于新一代手機(jī)處理器的降頻問題十分嚴(yán)重，因此我們不能簡(jiǎn)單的去比較頻率與分?jǐn)?shù)，因?yàn)闊o法確定在實(shí)際測(cè)試中它們運(yùn)行在什么頻率下。這個(gè)問題對(duì)于驍龍800而言相對(duì)小一些，因?yàn)镵rait 400核心的實(shí)際功耗并沒有超越設(shè)備散熱極限太遠(yuǎn)，因此我們有理由認(rèn)為在諸如Antutu跑分這類間歇性滿載，且滿載時(shí)間不超過一分鐘的測(cè)試程序中，驍龍800是可以運(yùn)行在全負(fù)荷的2.3GHz的（除非廠商設(shè)定的溫度控制閾值極為激進(jìn)，）。Exynos 5 Octa的情況在之前已經(jīng)有所說明，但是由于Antutu的滿載壓力并沒有系統(tǒng)穩(wěn)定性測(cè)試軟件那么高，因此我們假設(shè)Octa在跑A

49、ntutu時(shí)的頻率分布為1.6GHz、1.4GHz Cortex A15和1.2GHz Cortex A7各占1/3時(shí)間。這樣根據(jù)DMIPS的數(shù)據(jù)折算，整體性能相當(dāng)于1.19GHz的Cortex A15?？紤]到Cortex A7在整數(shù)部份的同頻性能與Cortex A15的差距并沒有DMIPS所顯示的大，但是浮點(diǎn)性能方面的差距非常明顯，因此在整數(shù)部分，等效頻率將會(huì)接近1.5GHz，而浮點(diǎn)部分則維持1.19GHz。至于Tegra 4，對(duì)于一般手機(jī)而言它幾乎不可能跑到1.9GHz的滿載頻率，但是我們找到了nVIDIA Shield的測(cè)試結(jié)果。由于Shield擁有足夠的空間安裝散熱片，因此可以避免頻率

50、的下降，因此在測(cè)試全程中，頻率應(yīng)當(dāng)都可以維持在1.9GHz。下面就讓我們來看看結(jié)果。只采集CPU的整數(shù)和浮點(diǎn)部分。結(jié)果一如我們的預(yù)料。如果不降頻，那么Cortex A15的絕對(duì)性能將是最為強(qiáng)大的，即便驍龍800擁有高達(dá)2.3GHz的主頻，它也不是全速運(yùn)行的Tegra 4的對(duì)手。同時(shí)，和Cortex A9的代表Exynos 4412比較的話，我們發(fā)現(xiàn)驍龍800的整數(shù)性能領(lǐng)先幅度并沒有頻率所表現(xiàn)的那么大，而Exynos 5 Octa由于過高的功耗，也沒有表現(xiàn)出應(yīng)有的性能。下面我們計(jì)算一下每MHz下各個(gè)平臺(tái)的對(duì)應(yīng)性能：這個(gè)結(jié)果就比較有意思了?？梢钥吹剑琓egra 4在整數(shù)和浮點(diǎn)性能方面，單位功率的性

51、能都沒有超過Cortex A9，甚至整數(shù)方面的能耗比下降了一半。而Exynos 5 Octa在整數(shù)方面相對(duì)于Tegra 4的效率進(jìn)步，更多的歸功于能耗比更高的Cortex A7內(nèi)核，畢竟不論是A7、A9還是A15，整數(shù)運(yùn)算單元都是兩個(gè)，理論上同頻整數(shù)吞吐量沒有區(qū)別，但是依然沒能對(duì)Cortex A9實(shí)現(xiàn)實(shí)質(zhì)性的提升。而驍龍800延續(xù)了之前產(chǎn)品在整數(shù)性能方面能耗比不如Cortex A9的傳統(tǒng)。因此，結(jié)論就十分清晰了：在限制運(yùn)行在相同功耗的前提下，以對(duì)日常使用影響最大的整數(shù)性能而言，不論是驍龍800還是Exynos 5 Octa，都無法表現(xiàn)得比Cortex A9更好。當(dāng)然這是理論測(cè)試，實(shí)際運(yùn)行App

52、時(shí)，由于處理器內(nèi)部亂序執(zhí)行和分支預(yù)測(cè)等方面的增強(qiáng)，幾大主流新產(chǎn)品的表現(xiàn)會(huì)還是比上一代Exynos 4412強(qiáng)大一些，但是我們要重復(fù)之前說過的話：你不可能得到像測(cè)試分?jǐn)?shù)那樣巨大的體驗(yàn)提升，尤其是考慮到Tegra 4的跑分成績(jī)已經(jīng)高達(dá)40000分，驍龍800的跑分成績(jī)超過了33000分，Exynos 5 Octa雖然不及以上兩者但也接近29000分，而Exynos 4412只有區(qū)區(qū)16500分?？傮w來說，雖然有著諸如GPU性能的良性提升與內(nèi)存性能的良性提升，但是星星點(diǎn)點(diǎn)的美好并不能掩蓋新一代處理器所面臨的整體的問題。在我們已經(jīng)分析過的三個(gè)產(chǎn)品中，實(shí)際上沒有一個(gè)實(shí)現(xiàn)了效率的明顯進(jìn)步。這意味著雖然它們

53、每一個(gè)都宣稱自己比前一代提速xx%，但是實(shí)際使用中由于體效值的原地踏步，我們實(shí)際上無法感受到所宣稱的速度。這樣的情況維持一兩代還可以勉強(qiáng)接受，但是如果一直持續(xù)下去，相信消費(fèi)者終究會(huì)疲勞，就像現(xiàn)如今陷入困境的PC市場(chǎng)一樣，最終不再有人愿意為新產(chǎn)品買單，而這顯然是手機(jī)廠家所不愿意看到的。從核心上尋找提高能耗比的方式，以ARM的技術(shù)實(shí)力似乎已經(jīng)走到了盡頭。那還有什么辦法可以推進(jìn)效率的進(jìn)步呢？答案也許只有工藝了。關(guān)鍵之中的關(guān)鍵：半導(dǎo)體工藝通過改進(jìn)處理器微架構(gòu)來獲得性能提升是最體面的方法，也是最難的方法。從40年前的英特爾4004，再到今天的酷睿i7，IPS（每周期指令吞吐量）也就是從1提升到2再提升到

54、3的進(jìn)步。再往上，就撞到了難以逾越的功耗之墻。如何打破這堵高高的墻壁？答案只有一個(gè)：更好的工藝。對(duì)于ARM而言尤其如此。5年前的ARM11處理器還在使用老掉牙的130nm普通CMOS工藝。而最近一到兩年，由于無法從核心上榨取更多的油水，業(yè)界開始用越來越新的工藝制作最先進(jìn)的ARM處理器，從45nm到32nm甚至現(xiàn)在的28nm，ARM處理器在工藝上的進(jìn)步速度要遠(yuǎn)超同期PC處理器。正是這些新工藝，支撐著ARM處理器在近幾年內(nèi)以每年200%的速度在提升。但是提到工藝，我們就不得不再一次提到一個(gè)詞：極限。沒錯(cuò)，通過超量應(yīng)用工藝，我們獲得了超量的性能提升，但是工藝的儲(chǔ)備并不是無窮無盡的，現(xiàn)在的我們已經(jīng)走在

55、了工藝的極限上。如果是傳統(tǒng)的工程極限，隨著新技術(shù)和新方法的發(fā)明，最終都可以實(shí)現(xiàn)突破，但是工藝面臨的這道極限的背后是物理定律。在28nm以后，晶體管實(shí)在是太小了，小到我們必須重新梳理物理定律，才能準(zhǔn)確掌握它的物理性質(zhì)。隨著半導(dǎo)體工藝線寬邁入20nm以下，集成電路中的某些結(jié)構(gòu)已經(jīng)開始邁入介觀和微觀之間的灰色地帶。對(duì)于微觀世界，也就是量子世界，人們目前所掌握的物理學(xué)，并不能給出太多具備足夠工程價(jià)值的答案。也許你很難想象，現(xiàn)代為處理器所使用的晶體管，其柵極漏電的很大一部分原因已經(jīng)是量子隧穿效應(yīng)。這是因?yàn)閷?duì)于一個(gè)線寬只有30nm的晶體管而言，它的柵極絕緣材料的厚度只有不到2nm，也就是說，只有不到10層

56、原子的厚度。而工藝最先進(jìn)的英特爾，其量產(chǎn)晶體管的柵極絕緣層厚度已經(jīng)不到1nm，只有5層原子的厚度。在這樣的規(guī)模下，宏觀的物理定律已經(jīng)有相當(dāng)程度的失效，這個(gè)規(guī)模的晶體管會(huì)做出什么行為？更多的只能靠猜測(cè)，靠無數(shù)次的實(shí)驗(yàn)。當(dāng)經(jīng)典物理定律失效，人們需要在盲目的實(shí)驗(yàn)中找到解決方案時(shí)，進(jìn)步的速度就變得不再可以預(yù)測(cè)。2013年已經(jīng)是28nm的時(shí)代，按照預(yù)測(cè)，2014年業(yè)界就將往20nm邁進(jìn)。但是這一步能順利走出去么？相信沒人對(duì)此能有足夠的信心。作為世界上最大的代工廠，臺(tái)積電TSMC的工藝路線對(duì)于業(yè)界的影響力是最為巨大的，早在2009年，TSMC就已經(jīng)宣布將要量產(chǎn)28nm邏輯電路工藝，但是實(shí)際情況是直到201

57、1年底，TSMC都沒能拿出哪怕只用于性能測(cè)試的樣品芯片，而最終的量產(chǎn)一直到2012年6月才在跌跌撞撞中開始，前后延期達(dá)三年。那么，面對(duì)TSMC“2013年底量產(chǎn)20nm”的豪言壯語(yǔ)，你又能相信多少呢？TSMC的下一代20納米工藝還面臨一個(gè)問題性能提升將非常有限。從官方演示文檔中我們可以看到，TSMC的20nm規(guī)劃中，針對(duì)移動(dòng)設(shè)備的工藝也就是LP、HPL和HPM被整合成了一種，名為20SoC。它的性能，以TSMC官方的預(yù)計(jì)，僅能實(shí)現(xiàn)漏電比28HPM降低20%、性能比28HPM提升15%的水平。希望各位注意，對(duì)比的對(duì)象是28HPM，而28HPM的漏電水平與28LP是接近的，也就是說從28nm到20

58、nm，TSMC只實(shí)現(xiàn)了20%的漏電降低。這是官方最樂觀的預(yù)計(jì)，而實(shí)際情況可能要比這個(gè)悲觀的多，一如TSMC對(duì)于28nm量產(chǎn)時(shí)間的預(yù)計(jì)一樣。那么我們就可以得到一個(gè)自然而然的預(yù)計(jì)：20nm時(shí)代，我們除了更高的集成度，什么都得不到。這就意味著，以20nm工藝制造的芯片，固然可以通過規(guī)模的擴(kuò)大而獲得更大的理論性能，卻幾乎無法從工藝的進(jìn)步得到單位功耗效率的提升。在目前手機(jī)處理器絕對(duì)性能已經(jīng)超過體效值的大前提下，這樣的結(jié)論幾乎就已經(jīng)宣布了，未來的產(chǎn)品不會(huì)為我們帶來更快的實(shí)際性能。那么更先進(jìn)的工藝呢？例如16nm？根據(jù)目前的規(guī)劃，TSMC將在16nm引入近年來半導(dǎo)體工藝中繼HKMG后最大也可能是最后的進(jìn)步，

59、也就是3D晶體管，又叫finfet。這個(gè)技術(shù)可以為單個(gè)晶體管帶來40%的性能提升，同時(shí)降低30%的功耗，目前已由英特爾量產(chǎn)，而整個(gè)業(yè)界只有英特爾實(shí)現(xiàn)了量產(chǎn)，由此可見其技術(shù)難度水平。我們沒有理由認(rèn)為，TSMC對(duì)于finfet的引入會(huì)一帆風(fēng)順，外加16nm對(duì)于EUV的需求以及EUV產(chǎn)業(yè)目前的狀況，至少在筆者看來，TSMC可以在2015年量產(chǎn)16nm finfet的概率幾乎為0。至于GlobalFoundries或者三星，前者目前剛剛實(shí)現(xiàn)28nm的量產(chǎn)，雖然幻燈片已經(jīng)寫到了10nm，但是我們不應(yīng)對(duì)其抱有太大的信心，而三星的產(chǎn)能過小，即便有良好的工藝，也無法支撐業(yè)界的需求，因此不需要投以太大的注意力。

60、這就意味著，2014年和2015年對(duì)于ARM而言會(huì)非常艱難。因?yàn)橄冗M(jìn)工藝在這兩年將出現(xiàn)空窗期，而沒有先進(jìn)工藝的支持，ARM系產(chǎn)品的性能進(jìn)步就只能停留在紙面。當(dāng)然，也有一種選擇，那就是提前在20nm上就像英特爾所做的那樣引入finfet，但這會(huì)給本來就已充滿變數(shù)的20nm工藝增添新的難度，最極端情況下也許會(huì)導(dǎo)致2014年的徹底空白。因此我們似乎必須接受2014到2015年的空窗期。那么，更先進(jìn)，比16nm還先進(jìn)的工藝呢？業(yè)界普遍認(rèn)為，由于物理規(guī)律限制，目前常規(guī)晶體管的極限將在2nm左右到來，在這個(gè)規(guī)模下，基于宏觀原理工作的硅基半導(dǎo)體晶體管將徹底無法運(yùn)行。而考慮到工程實(shí)際情況，也許在10nm時(shí)就已

人人文庫(kù)> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

手機(jī)主流處理器CPU參數(shù)及性能的總論(暨高通,聯(lián)發(fā)科,ARM

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

手機(jī)主流處理器CPU參數(shù)及性能的總論(暨高通,聯(lián)發(fā)科,ARM

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔