2024年AI手機(jī)行業(yè)專題報(bào)告：AI手機(jī)走向AIOS-系統(tǒng)級(jí)AI定位端側(cè)智能助理

上傳人：小*** IP屬地：重慶上傳時(shí)間：2024-05-31 格式：DOCX 頁數(shù)：23 大小：362.30KB 積分：28 舉報(bào) 版權(quán)申訴

2024年AI手機(jī)行業(yè)專題報(bào)告：AI手機(jī)走向AIOS-系統(tǒng)級(jí)AI定位端側(cè)智能助理_第2頁

2024年AI手機(jī)行業(yè)專題報(bào)告：AI手機(jī)走向AIOS-系統(tǒng)級(jí)AI定位端側(cè)智能助理_第3頁

2024年AI手機(jī)行業(yè)專題報(bào)告：AI手機(jī)走向AIOS-系統(tǒng)級(jí)AI定位端側(cè)智能助理_第4頁

2024年AI手機(jī)行業(yè)專題報(bào)告：AI手機(jī)走向AIOS-系統(tǒng)級(jí)AI定位端側(cè)智能助理_第5頁

已閱讀5頁，還剩18頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2024年AI手機(jī)行業(yè)專題報(bào)告：AI手機(jī)走向AIOS_系統(tǒng)級(jí)AI定位端側(cè)智能助理1.云端協(xié)同是AI手機(jī)未來，端側(cè)AI成本、隱私安全多方面占優(yōu)AI手機(jī)是基于大模型的高智能化手機(jī)終端。根據(jù)IDC定義，AI手機(jī)是NPU算力大于30TOPS（INT8）、搭載支持生成式AI的SoC并支持端側(cè)大模型的手機(jī)?！禔I手機(jī)白皮書》認(rèn)為基于大模型的AI手機(jī)需具備強(qiáng)大的計(jì)算能力、復(fù)雜信息感知能力、自學(xué)習(xí)能力與創(chuàng)作能力。通過重構(gòu)手機(jī)現(xiàn)有服務(wù)生態(tài)與操作系統(tǒng)，賦予用戶全新AI體驗(yàn)。云端大模型協(xié)同滿足AI手機(jī)不同場景需求。云側(cè)：（1）具備高算力，適宜進(jìn)行模型訓(xùn)練?？芍С謪?shù)量千億以上的大模型，推理與多模態(tài)交互能力強(qiáng)；（2）知識(shí)儲(chǔ)備豐富，如GPT-4-Turbo外部文檔和數(shù)據(jù)庫截止日期更新至2023年4月；（3）泛化能力強(qiáng)，可作為AI應(yīng)用開發(fā)基座。端側(cè)：（1）成本低，避免數(shù)據(jù)中心高昂的運(yùn)營、網(wǎng)絡(luò)傳輸、能耗成本；（2）隱私安全性高，用戶隱私信息存儲(chǔ)及處理均在終端進(jìn)行；（3）低延時(shí)，僅為單一用戶服務(wù)，避免需求高峰時(shí)任務(wù)處理擁擠；（4）支持離線使用。基于云側(cè)及端側(cè)大模型特點(diǎn)，我們認(rèn)為云側(cè)大模型適用于復(fù)雜度高、專業(yè)性強(qiáng)、涉及多模態(tài)交互的任務(wù)處理，端側(cè)大模型適用于復(fù)雜度低、隱私敏感度高的任務(wù)以及離線任務(wù)處理。針對(duì)復(fù)雜度高且涉及用戶隱私的復(fù)合任務(wù)場景，可首先在端側(cè)進(jìn)行信息脫敏，再上傳至云側(cè)進(jìn)行處理；并且端側(cè)大模型可通過學(xué)習(xí)用戶個(gè)人信息，在復(fù)雜任務(wù)處理中給予云側(cè)大模型更佳提示，賦予用戶更佳服務(wù)體驗(yàn)?；谠苽?cè)、端側(cè)大模型協(xié)同的AI手機(jī)可滿足用戶不同場景需求，更高效地利用資源并提供更佳服務(wù)體驗(yàn)。端側(cè)模型推理成本是云側(cè)模型1/100以下。根據(jù)高通《混合AI是AI未來》，生成式AI單次搜索查詢成本是傳統(tǒng)搜索方法的10倍，目前每天搜索查詢次數(shù)超過100億次，每年增量成本可能達(dá)到數(shù)十億美元。并且由于大模型的推理成本與終端用戶數(shù)量正相關(guān)，云側(cè)大模型推理成本將伴隨日活用戶數(shù)量及使用頻率快速增長，規(guī)模化拓展難以持續(xù)。根據(jù)面壁智能CEO李大海測算，以搭載驍龍855的OPPO手機(jī)為例，假定搭載參數(shù)量2B、每秒處理量7.5Tokens的MiniCPM端側(cè)模型，運(yùn)行5年后報(bào)廢，推理成本約為600元，測算可得170萬Tokens推理成本僅1元，是Mistral的1/100，GPT-4的1/360。根據(jù)OpenAI，其在5月13日最新發(fā)布的GPT-4o可免費(fèi)向用戶提供服務(wù)，但仍在用量方面進(jìn)行限制。根據(jù)OpenAIDeveloperForum，免費(fèi)用戶在3小時(shí)內(nèi)僅允許向ChatGPT發(fā)送40條以內(nèi)的消息。ChatGPT能耗達(dá)50萬千瓦時(shí)/天，終端部署大模型降低數(shù)據(jù)傳輸能耗。根據(jù)紐約客報(bào)道，ChatGPT每天需處理約2億個(gè)用戶請(qǐng)求，消耗超過50萬千瓦時(shí)電力，相當(dāng)于1.7萬個(gè)美國家庭平均一天的用電量。根據(jù)《混合AI是AI未來》，手機(jī)終端能夠以很低的能耗運(yùn)行生成式AI模型，可有效避免數(shù)據(jù)傳輸至云服務(wù)器中導(dǎo)致的高能耗。端側(cè)AI保障用戶隱私安全，并可基于用戶信息提供個(gè)性化服務(wù)。生成式AI由于交互方式革新，不僅可收集用戶郵箱、手機(jī)號(hào)等可唯一標(biāo)識(shí)個(gè)人的信息，也會(huì)收集用戶語音聊天記錄，一旦泄露會(huì)嚴(yán)重影響用戶的個(gè)人隱私安全。2023年3月ChatGPT的API出現(xiàn)錯(cuò)誤，導(dǎo)致Redis內(nèi)存中的數(shù)據(jù)并未及時(shí)清除，用戶的聊天記錄片段，甚至信用卡的最后四位數(shù)字、到期日期、姓名、電子郵件地址和付款地址等信息可能泄露至其他ChatGPT使用者。根據(jù)OpenAI官方調(diào)查報(bào)告，約有1.2%的ChatGPTPlus用戶面臨數(shù)據(jù)泄露。與云側(cè)AI相比，端側(cè)AI模型將用戶個(gè)人信息儲(chǔ)存在本地，無需上傳至云服務(wù)器中，并且手機(jī)終端可通過安全芯片或操作系統(tǒng)進(jìn)一步保護(hù)用戶信息安全。同時(shí)端側(cè)AI可在不犧牲用戶隱私安全的前提下，利用儲(chǔ)存在終端的用戶信息以及用戶的表情、喜好和個(gè)性等進(jìn)行學(xué)習(xí)和演進(jìn)，增強(qiáng)和打造定制化的生成式AI提示，提供更個(gè)性化的服務(wù)體驗(yàn)。高推理需求可導(dǎo)致云側(cè)模型宕機(jī)，端側(cè)模型可靠性好且延時(shí)低。生成式AI查詢對(duì)云側(cè)模型需求達(dá)到高峰時(shí)可能會(huì)出現(xiàn)高時(shí)延甚至拒絕服務(wù)。2023年11月ChatGPT更新導(dǎo)致用戶需求火爆，ChatGPT及其API出現(xiàn)周期性中斷，OpenAI耗時(shí)3個(gè)多小時(shí)解決問題，期間收到用戶6614份中斷報(bào)告；2024年3月20日Kimi受系統(tǒng)流量持續(xù)異常升高影響，用戶無法正常使用。終端側(cè)AI模型針對(duì)單一用戶提供服務(wù)，可有效避免短期需求大幅提升，可靠性更佳。并且端側(cè)AI在無網(wǎng)絡(luò)連接情況下仍可正常使用，用戶可隨時(shí)隨地享受AI服務(wù)體驗(yàn)。2.AI手機(jī)仍處早期階段，AIOS賦予完整AI體驗(yàn)2.1.初級(jí)AI手機(jī)形態(tài)：基礎(chǔ)AI應(yīng)用+AI增強(qiáng)功能目前AI手機(jī)主要是在原有操作系統(tǒng)上集成AI功能或AI應(yīng)用。集成AI功能：以原有操作系統(tǒng)為基礎(chǔ)，通過搭載端側(cè)大模型增加或增強(qiáng)AI功能，如增加AI助理智能摘要生成、實(shí)時(shí)翻譯功能等；集成AI應(yīng)用：通過OpenAI發(fā)布的GPTStore下載定制化、個(gè)性化的AIAPP，如ChatGPTAPP等，可通過自然語言交互實(shí)現(xiàn)旅行規(guī)劃、智能問答、圖像識(shí)別生成等功能?；谏墒紸I的美圖秀秀APP可支持AI繪畫、AI修圖、AI美容等功能。基于原有操作系統(tǒng)的AI手機(jī)通過集成AI應(yīng)用或AI功能，能夠以自然語言與用戶進(jìn)行交互并高效處理任務(wù)，但本質(zhì)仍是通過API接口調(diào)用生成式AI模型，未實(shí)現(xiàn)AI系統(tǒng)級(jí)應(yīng)用。GalaxyAI賦能多項(xiàng)應(yīng)用，GalaxyS24系列AI體驗(yàn)全面升級(jí)。GalaxyAI首創(chuàng)即圈即搜功能，用戶只需長按Home鍵并在當(dāng)前文本、圖片或視頻界面圈選圖像即可獲得優(yōu)質(zhì)結(jié)果。GalaxyS24系列內(nèi)置筆記助手，可根據(jù)內(nèi)容智能排版、生成摘要和封面；內(nèi)置轉(zhuǎn)錄助手可識(shí)別多人講話并轉(zhuǎn)錄為支持編輯的文本，也可直接翻譯錄音并生成摘要；原生通話應(yīng)用程序引入通話實(shí)時(shí)翻譯功能，支持13種語言實(shí)時(shí)雙向和文本翻譯；圖像應(yīng)用具有智能修圖建議、生成式編輯等功能，可快速去除反光、改變?nèi)宋锘驅(qū)ο笪恢么笮〉取９雀鑀ixel8系列增強(qiáng)圖像編輯，個(gè)人助理Gemini智能提升。谷歌Pixel8系列內(nèi)置的MagicEditor可以通過生成式人工智能編輯照片，ZoomEnhance通過生成式AI預(yù)測照片細(xì)節(jié)，填充像素間間隙，增強(qiáng)變焦；個(gè)人助理Gemini支持文本、語音及圖片交互，可幫助朗讀和翻譯網(wǎng)頁并生成摘要；錄音機(jī)增加AI功能，可自動(dòng)總結(jié)對(duì)話并生成摘要；AudioMagicEraser通過AI識(shí)別聲音，可直接從視頻刪除不想要聲音。HarmonyOS4率先接入AI大模型，小藝同學(xué)增加多項(xiàng)AI功能。HarmonyOS4采用全新華為方舟引擎，與HarmonyOS3相比，滑動(dòng)流暢性提升約20%，續(xù)航增加約30分鐘；并且對(duì)超級(jí)中轉(zhuǎn)站等進(jìn)行優(yōu)化，支持手機(jī)、平板、PC等不同端口，具備跨端流轉(zhuǎn)能力。HarmonyOS4將AI大模型技術(shù)接入小藝，全新小藝增強(qiáng)自然語言理解能力，支持用戶更日常的表述方式；增加智能摘要和文案輔助創(chuàng)作功能；可依托多模態(tài)大模型技術(shù)，對(duì)已有圖像進(jìn)行個(gè)性化二次創(chuàng)作。小米14搭載底層重構(gòu)的澎湃OS，支持人車家全生態(tài)。小米澎湃OS重構(gòu)子系統(tǒng)，優(yōu)化內(nèi)存管理提高應(yīng)用啟動(dòng)速度。澎湃OS擁有AI大模型植入系統(tǒng)，基于端側(cè)大模型的小愛助手可智能創(chuàng)作文本、快速撰寫購物評(píng)價(jià)、生成發(fā)言稿等。小米14內(nèi)嵌圖像應(yīng)用可實(shí)現(xiàn)AI妙畫、AI搜圖、AI寫真、AI擴(kuò)圖等功能。搭載的XiaomiHyperConnect可實(shí)現(xiàn)所有智能設(shè)備實(shí)時(shí)統(tǒng)一組網(wǎng)，可在手機(jī)、平板等設(shè)備的“融合設(shè)備中心”進(jìn)行快捷控制。搭載ColorOS14的OPPOFindX7實(shí)現(xiàn)AndesGPT模型端云協(xié)同。ColorOS14系統(tǒng)端側(cè)支持70億參數(shù)的AndesGPT·Tiny大模型，云端支持AndesGPT·Turbo/Titan大模型。OPPOFindX7搭載ColorOS14系統(tǒng)，內(nèi)置小布助手具有智能摘要、智能消除、內(nèi)容創(chuàng)作等AI功能，并且系統(tǒng)內(nèi)置的圖像軟件具有AIGC消除效果，可智能生成寫真照片。VivoOriginOS4搭載自研BlueLM，X100系列具備豐富AI功能?；?0億參數(shù)BlueLM的VivoX100系列，其內(nèi)置的AI助手“藍(lán)心小v”具備超能語義搜索、超能問答、超能寫作、超能創(chuàng)圖和超感智慧交互等功能，能夠?qū)崿F(xiàn)智能問答、文案撰寫、摘要生成、圖片編輯。攝影應(yīng)用基于生成式AI，通過人像識(shí)別、場景識(shí)別等功能可優(yōu)化拍攝效果。2.2.進(jìn)階版AI手機(jī)：基于意圖交互的AIOS意圖交互升華AI認(rèn)知，AIOS深度融合端側(cè)大模型。AIOS改變?cè)胁僮飨到y(tǒng)指令式的工作邏輯，通過集成智能感知技術(shù)實(shí)時(shí)獲取用戶行為、偏好等環(huán)境信息，實(shí)現(xiàn)意圖式人機(jī)交互，使AI或系統(tǒng)可更好地理解用戶當(dāng)下所處場景及基于自然語言的用戶指令；通過將端側(cè)大模型融入底層架構(gòu)，AIOS可持續(xù)從與用戶交互過程中學(xué)習(xí)并優(yōu)化自身性能，為用戶提供更個(gè)性化、精準(zhǔn)的服務(wù)；基于AIOS的AI助理可理解應(yīng)用界面及相應(yīng)功能，通過調(diào)用應(yīng)用APP，自動(dòng)完成用戶任務(wù)，簡化重復(fù)枯燥的操作過程。榮耀MagicOS8.0首次實(shí)現(xiàn)意圖識(shí)別人機(jī)交互。與主要負(fù)責(zé)管理硬件資源的傳統(tǒng)OS內(nèi)核不同，MagicLive平臺(tái)級(jí)AI負(fù)責(zé)“管理”與人相關(guān)的因子，如個(gè)人知識(shí)庫、位置與狀態(tài)、習(xí)慣與畫像等，幫助OS精準(zhǔn)識(shí)別用戶意圖，高效調(diào)度系統(tǒng)服務(wù)?；贛agicLive平臺(tái)級(jí)AI的場景感知、意圖決策、用戶理解能力，MagicOS8.0支持自然語言、語音、圖片、手勢、眼動(dòng)等多模態(tài)交互方式，可智能識(shí)別用戶意圖，進(jìn)行快速推理決策，主動(dòng)提供個(gè)人化服務(wù)，提升交互效率。MagicOS8.0內(nèi)嵌的任意門功能可基于意圖識(shí)別讓服務(wù)實(shí)現(xiàn)跨應(yīng)用、跨設(shè)備一步直達(dá)、智慧流轉(zhuǎn)，支持100多款國內(nèi)主流應(yīng)用服務(wù)，覆蓋出行、辦公、社交、搜索、娛樂、購物、美食等應(yīng)用場景。內(nèi)置的YOYO智能助理可理解用戶意圖，高效安全地連接云側(cè)大模型，分發(fā)、融合、調(diào)度原子化服務(wù)，完成復(fù)雜任務(wù)閉環(huán)。蘋果FerretUI模型增強(qiáng)iOS意圖識(shí)別，致力打造AIOS。FerretUI以Ferret模型為基礎(chǔ)，通過將手機(jī)UI界面分割為更小的子圖像捕捉UI界面細(xì)節(jié)特征，并將所有子圖像單獨(dú)編碼獲取圖像特征，最后將子圖像與全局圖像特征輸入端側(cè)大模型中，使端側(cè)大模型可更好地捕捉UI界面細(xì)節(jié)信息。并且FerretUI通過收集各種初級(jí)UI任務(wù)的訓(xùn)練數(shù)據(jù)，如圖標(biāo)識(shí)別、查找文本、組件列表等，以精準(zhǔn)定位和理解UI組件；通過收集與AI交互相關(guān)的高級(jí)任務(wù)數(shù)據(jù)集，如詳細(xì)描述、感知/交互對(duì)話和功能推理，以增強(qiáng)模型與UI相關(guān)的推理能力。基于FerretUI可顯著增強(qiáng)AIOS對(duì)手機(jī)UI界面的理解能力，并可根據(jù)用戶指令找到具體元素完成交互。iPhone環(huán)境下FerretUI性能接近或超過GPT-4V。FerretUI模型可完成簡單的UI定位和查詢?nèi)蝿?wù)，在iPhone環(huán)境下130億參數(shù)的FerretUI模型在初級(jí)UI任務(wù)中超越GPT-4V。并且可根據(jù)UI與用戶進(jìn)行感知對(duì)話、交互對(duì)話，告訴用戶相應(yīng)位置具體的UI內(nèi)容，如何與UI進(jìn)行交互，根據(jù)UI元素推斷軟件功能，在高級(jí)任務(wù)中的表現(xiàn)與GPT-4V接近。若將FerretUI與AI助理進(jìn)行結(jié)合，AI助理可深入理解用戶意圖，并基于用戶自然語言指令與手機(jī)APP進(jìn)行交互，實(shí)現(xiàn)AI系統(tǒng)級(jí)應(yīng)用。Siri將迎來重大革新，iOS18預(yù)計(jì)搭載更多AI功能。根據(jù)彭博社，蘋果正在改進(jìn)Siri和消息應(yīng)用程序間的交互，使Siri更有效地自動(dòng)生成文本并回答復(fù)雜問題；根據(jù)Theinformation報(bào)道，Siri將與Shortcuts應(yīng)用程序進(jìn)行更深入的集成，進(jìn)而可自動(dòng)執(zhí)行復(fù)雜任務(wù)。2024年5月13日OpenAI發(fā)布GPT-4o，其具備強(qiáng)大的語音和視覺感知功能。用戶無需等待模型完成發(fā)言即可插話，回應(yīng)音頻輸入平均時(shí)間僅為320毫秒，較GPT-3.5/GPT-4下降88.6%/94.1%，并且可根據(jù)語氣判斷用戶情緒，針對(duì)用戶情緒改變自身語氣，擬人化程度大幅提升。根據(jù)OpenAI官網(wǎng)，GPT-4o在MMLU、GPQA、MATH、HumanEval等推理測試中超越GPT-4Turbo、Claude3Opusn、GeminiPro1.5等前沿模型，并且在MLS基準(zhǔn)測試中優(yōu)于Whisper-v3以及Meta、谷歌的語音模型。根據(jù)彭博社報(bào)道，蘋果已與OpenAI達(dá)成合作協(xié)議，計(jì)劃在6月11日WWDC全球開發(fā)者大會(huì)公布一系列全新人工智慧技術(shù)。OpenAI技術(shù)加持的Siri有望以低延遲進(jìn)行語音對(duì)話，提高人機(jī)語音交互的自然流暢度。并且有望增強(qiáng)用戶情緒感知，大幅提升擬人化水平。根據(jù)彭博社，蘋果與OpenAI雙方正確認(rèn)一項(xiàng)新協(xié)議，將ChatGPT技術(shù)應(yīng)用在iOS18中。根據(jù)macrumors，iOS18中多款應(yīng)用程序如Spotlight、AppleMusic、Keynote、Shortcuts等將具備生成式AI功能。2.3.高級(jí)版AI手機(jī)：全自主執(zhí)行能力的AIAgentAIOS的最終形態(tài)是具有全自主執(zhí)行能力的數(shù)字人格?！禤ERSONAL大模型AGENTS:INSIGHTSANDSURVEYABOUTTHECAPABILITY,EFFICIENCYANDSECURITY》基于AIAgent智能水平將其分為L1-L5五個(gè)級(jí)別。具有意圖交互與自我學(xué)習(xí)能力的AIOS將幫助AI助理深入理解用戶需求，持續(xù)學(xué)習(xí)用戶個(gè)人習(xí)慣等信息。伴隨手機(jī)硬件配置升級(jí)以及端側(cè)大模型推理性能提升，基于AIOS的AI助理有望成長為高度智能化的數(shù)字人格，可根據(jù)用戶指令自主生成任務(wù)規(guī)劃，完美執(zhí)行用戶任務(wù)并進(jìn)行反饋。AutoGPT具備長期和短期記憶管理，可實(shí)現(xiàn)任務(wù)自主規(guī)劃及執(zhí)行。AutoGPT是基于GPT-3.5或GPT-4API接口開發(fā)的AIAgent，其可將用戶提出的復(fù)雜任務(wù)拆解為多項(xiàng)子任務(wù)，自動(dòng)生成相應(yīng)任務(wù)提示并執(zhí)行，無需用戶進(jìn)行干預(yù)和指導(dǎo)。并且可以基于互聯(lián)網(wǎng)搜索獲取最新數(shù)據(jù)、新聞等信息，實(shí)現(xiàn)知識(shí)庫實(shí)時(shí)更新。通過集成Pinecone數(shù)據(jù)庫，AutoGPT可保存與用戶的對(duì)話、文本和上下文信息，并在對(duì)話中快速檢索相關(guān)的內(nèi)容，回顧歷史對(duì)話，進(jìn)而更好地理解用戶需求，提供更個(gè)性化的服務(wù)。Mobile-agent打破APP界限，聯(lián)用多款應(yīng)用實(shí)現(xiàn)擬人化操作。Mobile-Agent基于視覺感知模塊可從設(shè)備屏幕截圖中準(zhǔn)確定位視覺和文本元素以及圖標(biāo)信息，并通過視覺信息將語言模型生成的操作指令映射到具體的屏幕位置執(zhí)行點(diǎn)擊等操作。其具備自主規(guī)劃能力，能夠根據(jù)操作歷史和系統(tǒng)提示自主規(guī)劃新的任務(wù)。并且引入自我反思機(jī)制，在執(zhí)行過程中若遇到錯(cuò)誤或無效操作，可根據(jù)屏幕截圖和操作歷史進(jìn)行反思，嘗試替代操作或修改當(dāng)前操作的參數(shù)。目前Mobile-agent已學(xué)會(huì)阿里巴巴、TikTok、Youtube等10項(xiàng)APP使用，并在部分跨應(yīng)用場景中取得出色的結(jié)果。2.4.具備豐富大模型技術(shù)儲(chǔ)備、出色AIOS與硬件開發(fā)能力的手機(jī)廠商將取得領(lǐng)先地位高性能端側(cè)大模型、AIOS與出色硬件配置是AI手機(jī)核心。端側(cè)大模型是AI手機(jī)智能核心，其性能將直接影響AI手機(jī)的使用體驗(yàn)；將端側(cè)大模型融入底層架構(gòu)的AIOS具備出色的意圖交互能力，深化AI手機(jī)對(duì)用戶需求的理解，并且可更好地調(diào)用硬件資源，充分發(fā)揮端側(cè)大模型性能；CPU、GPU和NPU等硬件滿足端側(cè)大模型運(yùn)算的算力需求，具有更高硬件配置的AI手機(jī)可率先搭載更強(qiáng)性能的端側(cè)大模型，為用戶提供更佳AI服務(wù)體驗(yàn)。蘋果AIOS系統(tǒng)開發(fā)領(lǐng)先，自研芯片性能強(qiáng)勁，端側(cè)大模型進(jìn)展順利，有望率先開發(fā)具備完整AI體驗(yàn)的AI手機(jī)。AIOS：蘋果開發(fā)的FerretUI模型增強(qiáng)AIOS對(duì)手機(jī)UI界面的理解能力，可根據(jù)用戶指令與手機(jī)應(yīng)用進(jìn)行交互。結(jié)合AI助理將賦予AI助理對(duì)手機(jī)應(yīng)用的深度理解，有望實(shí)現(xiàn)AI助理自主調(diào)用APP，完美執(zhí)行用戶指令。通過與OpenAI進(jìn)行合作，預(yù)計(jì)將實(shí)現(xiàn)Siri重大革新并且iOS18將增加多項(xiàng)AI功能；芯片：蘋果自研A系列芯片性能出眾，根據(jù)Geekbench6，最新的A17Pro單核性能較驍龍8Gen3高26%，NPU算力達(dá)35TOPS；端側(cè)大模型：2024年4月蘋果在HuggingFace發(fā)布4款OpenELM，參數(shù)量分別為2.7億、4.5億、11億和30億。其采用層級(jí)縮放策略，通過在Transformer模型的每一層有效分配參數(shù)，顯著提升模型的準(zhǔn)確率。根據(jù)《OpenELM:AnEfficientLanguageModelFamilywithOpenTrainingandInferenceFramework》，在使用1/2的預(yù)訓(xùn)練數(shù)據(jù)下，參數(shù)1B的OpenELM在零樣本訓(xùn)練、leaderbroad任務(wù)和大模型360任務(wù)中的準(zhǔn)確性較OLMo高1.28%/2.36%/1.72%。蘋果有望憑借出色的芯片研發(fā)能力以及對(duì)操作系統(tǒng)的深刻理解，在AI手機(jī)開發(fā)中取得領(lǐng)先地位。谷歌率先布局大模型，積極推進(jìn)Tensor處理器研發(fā)彌補(bǔ)硬件短板。端側(cè)大模型：2023年谷歌發(fā)布具備萬億參數(shù)的大模型，Gemini。并以Gemini為基座模型開發(fā)參數(shù)量1.8B/3.25B的GeminiNano，目前已應(yīng)用至谷歌Pixel8pro、三星GalaxyS24系列手機(jī)中。AIOS：谷歌發(fā)布的screenAI模型通過采用圖像編碼器和語言編碼器提取圖像與文本特征，可以識(shí)別UI元素的類型和位置，增強(qiáng)圖像理解等多模態(tài)任務(wù)能力，深化對(duì)手機(jī)界面的理解。最新推出的Android14系統(tǒng)搭載AI助理Gemini，增加生成式AI功能。AICore可調(diào)用管理GeminiNano等端側(cè)模型，便于開發(fā)者進(jìn)行大模型調(diào)整和創(chuàng)新，助力構(gòu)建AI應(yīng)用生態(tài)；處理器：TensorG3處理器CPU單核及多核性能分別為A17Pro的60.4%/61.7%。自研TPU芯片，可提高AI手機(jī)中AI消除、AI視頻強(qiáng)化等性能。根據(jù)9to5google，TensorG4將采用三星4nm制程工藝與更先進(jìn)的FOWLP封裝工藝，進(jìn)一步提高能效比以及散熱水平，為AI手機(jī)提供更佳性能支持。谷歌在大模型、操作系統(tǒng)領(lǐng)域具有豐富的技術(shù)積累，但自研處理器性能具有較大改進(jìn)空間，未來仍需增強(qiáng)處理器性能以將更高性能端側(cè)大模型搭載至AI手機(jī)。3.AIOS需搭載10B~100B端側(cè)大模型，高性能需求掀起硬件革新浪潮AIOS的端側(cè)大模型參數(shù)量應(yīng)在百億~千億水平。意圖交互能力是實(shí)現(xiàn)AIOS的前提，可使AI手機(jī)更懂用戶訴求，提供更優(yōu)質(zhì)的服務(wù)體驗(yàn)。通過進(jìn)一步增加端側(cè)大模型參數(shù)量、改進(jìn)端側(cè)大模型的自學(xué)習(xí)性能可提高AIAgent的智能化水平，實(shí)現(xiàn)AIAgent自主規(guī)劃并完美執(zhí)行用戶指令，無需用戶進(jìn)行干預(yù)。因此AI手機(jī)搭載的端側(cè)大模型，其參數(shù)量至少需達(dá)到意圖交互功能所需的參數(shù)量要求，然后通過硬件性能優(yōu)化等方式支撐更高性能端側(cè)大模型，逐步接近高智能AIAgent所需參數(shù)水平。根據(jù)榮耀官網(wǎng)，MagicOS8.0系統(tǒng)搭載的端側(cè)大模型模型參數(shù)量為7B，蘋果FerretUI模型的參數(shù)量為13B，意圖交互能力所需端側(cè)大模型參數(shù)在百億級(jí)別?？蓪?shí)現(xiàn)任務(wù)自主規(guī)劃及執(zhí)行的AutoGPT和具備出色視覺感知、可自主規(guī)劃并調(diào)用Tiktok、淘寶等應(yīng)用程序的Mobile-Agent分別依賴參數(shù)量175B的GPT-3.5及參數(shù)量萬億以上的GPT-4V。考慮到手機(jī)終端算力性能有限，我們認(rèn)為手機(jī)搭載的AIAgent所需端側(cè)大模型參數(shù)量將顯著低于ChatGPT的175B，預(yù)計(jì)將通過模型壓縮等方法將模型參數(shù)量降低至千億以下。3.1.異構(gòu)計(jì)算突破算力瓶頸，驍龍、天璣、蘋果A更新迭代提供堅(jiān)實(shí)算力支撐百億參數(shù)端側(cè)大模型峰值算力需求達(dá)100TOPS以上。蘋果提出的具有意圖識(shí)別能力的FerretUI模型參數(shù)量達(dá)13B，我們基于此計(jì)算搭載AIOS的AI手機(jī)所需最低算力。假定用戶手機(jī)屏幕分辨率為1920*1080，用戶最大可允許屏幕推理時(shí)間為2s，硬件算力利用率為60%。根據(jù)OpenAI，1張高分辨率圖像=85+170*（圖像分辨率/512×512）tokens，經(jīng)測算模型所需峰值算力達(dá)99TOPS。因此搭載AIOS的AI手機(jī)，處理器算力需達(dá)到100TOPS以上。集成NPU的異構(gòu)計(jì)算具備最高能效比。生成式AI部署增加手機(jī)終端計(jì)算需求，主要可分為：（1）按需型需求，由用戶觸發(fā)需立即響應(yīng)，包括圖像生成、代碼和會(huì)議摘要生成等；（2）持續(xù)型需求，運(yùn)行時(shí)間較長，包括語音識(shí)別、視頻優(yōu)化、實(shí)時(shí)翻譯等；（3）泛在型需求，在后臺(tái)持續(xù)運(yùn)行，包括始終開啟的預(yù)測性AI助手、基于情境感知的AI個(gè)性化和高級(jí)文本自動(dòng)填充。手機(jī)終端搭載的通用CPU和GPU難以滿足生成式AI嚴(yán)苛且多樣化的計(jì)算訴求。通過集成專為AI定制的NPU，以降低部分易編程性為代價(jià)可實(shí)現(xiàn)更高的峰值性能、能效和面積效率，進(jìn)而可運(yùn)行機(jī)器學(xué)習(xí)所需的大量乘法、加法和其他運(yùn)算?；贑PU+GPU+NPU異構(gòu)計(jì)算的處理器能夠?qū)崿F(xiàn)最佳手機(jī)應(yīng)用性能、能效和電池續(xù)航，賦予增強(qiáng)的生成式AI體驗(yàn)。驍龍8Gen3搭載全新HexagonNPU，AI算力大幅升級(jí)。驍龍8Gen3搭載HexagonNPU為持續(xù)型AI推理帶來98%性能提升和40%能效提升，處理器整體峰值算力達(dá)73TOPS，支持100億參數(shù)端側(cè)大模型。通過升級(jí)微切片推理降低內(nèi)存帶寬占用，并支持4.8GHzLPDDR5x，內(nèi)存帶寬可達(dá)77GB/s。CPU和GPU性能較前代提升30%/25%，能效提升20%/25%。高通在MWC2024宣布驍龍8Gen4將采用臺(tái)積電3nm工藝制程，放棄Arm公版架構(gòu)，采用高通自研Oryon內(nèi)核，并將集成Adreno830GPU，有望進(jìn)一步提升處理器算力。天璣9300+內(nèi)置硬件級(jí)生成式AI引擎，最高支持330億參數(shù)AI模型。天璣9300+是業(yè)界首款生成式AI端側(cè)雙LORA融合的芯片，Llama2-7B端側(cè)大模型運(yùn)行速度可達(dá)22tokens/秒，最高支持運(yùn)行330億參數(shù)模型。聯(lián)發(fā)科與百度、百川智能、阿里云、谷歌、Meta等國內(nèi)外大模型巨頭達(dá)成合作，支持阿里云通義千問、百川大模型、文心大模型、谷歌GeminiNano、零一萬物等AI大模型。根據(jù)CNMO，天璣9400預(yù)計(jì)將在2024Q4發(fā)布，采用臺(tái)積電3nm制程并沿用ARM內(nèi)核，CPU大核由Cortex-X4升級(jí)至Cortex-X5。蘋果A17Pro率先采用3nm制程工藝，NPU算力達(dá)35TOPS。A17Pro搭載16核神經(jīng)網(wǎng)絡(luò)引擎，NPU算力較A16Bionic提高100%。CPU和GPU均采用6核設(shè)計(jì)，性能核心提升最高可達(dá)10%/20%。根據(jù)9to5Mac，A18芯片具備更大的尺寸，并將大幅增加內(nèi)置AI計(jì)算核心數(shù)量，預(yù)計(jì)將搭載至iPhone16和iPhone16Pro。根據(jù)GIZMOCHINA，A18Pro在Geekbench6上的單核和多核跑分分別為3570/9310，較A17Pro高22%/28%。工藝制程升級(jí)+先進(jìn)封裝是處理器未來發(fā)展方向。根據(jù)臺(tái)積電，與5nm制程技術(shù)相比，3nm制程的邏輯密度增加約70%，可實(shí)現(xiàn)相同功耗下頻率提升10-15%，或相同頻率下功耗降低25-30%，進(jìn)一步提高芯片的運(yùn)算能力以及能效比。目前臺(tái)積電規(guī)劃的3nm制程包括N3B、N3E、N3P、N3X、N3AE，其中N3B已應(yīng)用至蘋果的A17Pro，預(yù)計(jì)驍龍8Gen4將使用成本優(yōu)化后的N3E。N3P性能將進(jìn)一步提升，預(yù)計(jì)2024年下半年投產(chǎn)；N3X聚焦高性能計(jì)算設(shè)備，預(yù)計(jì)2025年進(jìn)入量產(chǎn)階段。以Chiplet為代表的3D封裝技術(shù)，通過芯片封裝小型化、高密度化，可實(shí)現(xiàn)異質(zhì)異構(gòu)的系統(tǒng)集成以及高互聯(lián)密度與低信號(hào)傳輸延遲。并且先進(jìn)封裝有望延續(xù)摩爾定律，持續(xù)提升芯片性能并降低先進(jìn)制程工藝成本。AI手機(jī)處理器有望基于先進(jìn)封裝突破摩爾定律限制，持續(xù)增強(qiáng)AI算力。圖20：以Chiplet為代表的先進(jìn)封裝技術(shù)將持續(xù)提升處理器算3.2.內(nèi)存升級(jí)+模型優(yōu)化加速AI手機(jī)智能進(jìn)化端側(cè)大模型部署驅(qū)動(dòng)手機(jī)內(nèi)存升級(jí)，16GB是AI手機(jī)基本配置。根據(jù)智源社區(qū)，F(xiàn)P32全精度的llama213B模型推理所需最低內(nèi)存為52GB，經(jīng)過Int4量化后，其推理占用內(nèi)存仍有6.5GB，考慮到手機(jī)運(yùn)行安卓操作系統(tǒng)使用內(nèi)存為4GB左右，后臺(tái)運(yùn)行其他手機(jī)APP需要6GB左右內(nèi)存，累計(jì)內(nèi)存需求達(dá)16.5GB。根據(jù)IDC，16GB內(nèi)存將成為AI手機(jī)基礎(chǔ)配置。目前OPPO、vivo、小米、榮耀等安卓廠商AI手機(jī)的最大內(nèi)存達(dá)到16GB，可滿足百億參數(shù)端側(cè)大模型運(yùn)行的基本要求。蘋果手機(jī)受益于更高效的iOS系統(tǒng)，內(nèi)存占用需求更低，目前iPhone15Pro及iPhone15ProMax的最大內(nèi)存為8GB。伴隨具有更高智能水平與更多參數(shù)量的端側(cè)大模型部署至AI手機(jī)，AI手機(jī)內(nèi)存容量有望升級(jí)至24GB以上?；谀Ｐ蛪嚎s可在有限內(nèi)存下部署更高性能端側(cè)大模型。目前模型壓縮方法主要包括數(shù)值量化、稀疏化處理、知識(shí)蒸餾等。數(shù)值量化通過簡化數(shù)據(jù)或減少表示數(shù)值的比特?cái)?shù)壓縮模型大小。根據(jù)OPPO，F(xiàn)indX7部署的70億參數(shù)AndesGPT-Tiny模型，正常的內(nèi)存占用為28GB，無法搭載至AI手機(jī)中。經(jīng)過INT4對(duì)模型進(jìn)行壓縮后，內(nèi)存占用由28GB降低至3.9GB，實(shí)現(xiàn)AndesGPT-Tiny模型端側(cè)部署。稀疏化處理主要是去除模型中數(shù)值為0或接近0的權(quán)值。微軟提出的SliceGPT技術(shù)可在保持llama-270B模型99%零樣本任務(wù)性能的前提下，剪除25%模型參數(shù)。知識(shí)蒸餾則是基于參數(shù)多、結(jié)構(gòu)復(fù)雜的教師網(wǎng)絡(luò)訓(xùn)練小參數(shù)學(xué)生網(wǎng)絡(luò)，以期獲得相似或更好性能。通過模型壓縮可突破內(nèi)存限制，加速更高參數(shù)端側(cè)大模型部署，加快打造智能化AIOS。蘋果通過優(yōu)化閃存內(nèi)存交互和內(nèi)存管理，可加載較設(shè)備DRAM大兩倍的端側(cè)大模型。目前調(diào)用大模型的方法是將整個(gè)模型加載至DRAM中進(jìn)行推理，需占用較大內(nèi)存容量。蘋果提出將模型參數(shù)存儲(chǔ)在容量更高的閃存中，在推理過程中僅從閃存中加載所需參數(shù)。其通過滑動(dòng)窗口技術(shù)僅增量加載與之前不同的神經(jīng)元數(shù)據(jù)并釋放滑窗外token占用的內(nèi)存。同時(shí)以行列捆綁方式讀取更大數(shù)據(jù)塊，提高閃存數(shù)據(jù)吞吐量。通過及時(shí)刪除冗余神經(jīng)元、將新神經(jīng)元插入預(yù)先分配數(shù)據(jù)結(jié)構(gòu)消除DRAM重新分配內(nèi)存和復(fù)制現(xiàn)有數(shù)據(jù)的需要，減少推理延遲?；谠摲椒杉虞d較設(shè)備DRAM大兩倍的端側(cè)大模型，并且在CPU和GPU上加載速度分別比傳統(tǒng)方法提高4-5倍和20-25倍。內(nèi)存帶寬限制AI手機(jī)性能，LPDDR6預(yù)計(jì)將加速滲透。根據(jù)聯(lián)發(fā)科，運(yùn)行130億參數(shù)端側(cè)大模型所需內(nèi)存帶寬為130GB/s，目前已發(fā)布的AI手機(jī)搭載的最優(yōu)DRAM為LPDDR5×，數(shù)據(jù)傳輸速度為

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

2024年AI手機(jī)行業(yè)專題報(bào)告：AI手機(jī)走向AIOS-系統(tǒng)級(jí)AI定位端側(cè)智能助理

文檔簡介

溫馨提示

最新文檔

評(píng)論

2024年AI手機(jī)行業(yè)專題報(bào)告：AI手機(jī)走向AIOS-系統(tǒng)級(jí)AI定位端側(cè)智能助理

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔