AI硬件的突圍方向和可能性未來(lái)202410_第1頁(yè)
AI硬件的突圍方向和可能性未來(lái)202410_第2頁(yè)
AI硬件的突圍方向和可能性未來(lái)202410_第3頁(yè)
AI硬件的突圍方向和可能性未來(lái)202410_第4頁(yè)
AI硬件的突圍方向和可能性未來(lái)202410_第5頁(yè)
已閱讀5頁(yè),還剩37頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

ChatGPT推出以后,AI硬件就成為了熱門賽道。AIPin、RabbitR1、以及Meta的雷朋眼鏡,還有豆包即將推出的智能耳機(jī),有成功的,也有不少失敗的。在大模型熱潮持續(xù)一年之后,或許可以看一下,AI硬件未來(lái)的機(jī)會(huì)硬件是中國(guó)的主場(chǎng)在今年前9個(gè)月見(jiàn)過(guò)的108個(gè)團(tuán)隊(duì)中,具身智能項(xiàng)目有14個(gè),AI硬件項(xiàng)目8個(gè),XR相關(guān)5個(gè),共占25%。相較于軟件,偏硬件的賽道國(guó)內(nèi)團(tuán)隊(duì)優(yōu)勢(shì)更加明顯,特別是AI硬件方向大多圍繞深圳世界領(lǐng)先的供應(yīng)鏈生態(tài)打造團(tuán)隊(duì)。我們也正與兩家企業(yè)深入接洽。AI硬件需要明確的基本原則原則#1這一波AI硬件將由軟件驅(qū)動(dòng)我在上一篇分享中提到新交互方式出現(xiàn)前現(xiàn)階段AI應(yīng)用依然是移動(dòng)互聯(lián)網(wǎng)邏輯。回顧移動(dòng)互聯(lián)網(wǎng)時(shí)代,4G/5G的成熟在底層技術(shù)架構(gòu)上為短視頻等高信息密度應(yīng)用的新形態(tài)打下了基礎(chǔ),而iPhone開創(chuàng)的觸控交互體驗(yàn)真正為應(yīng)用的繁榮打開了大門。蘋果也因?yàn)樵诮换ツJ缴系膭?chuàng)新獲得了移動(dòng)互聯(lián)網(wǎng)時(shí)代最大的紅利,時(shí)至今日依然可以向軟件生態(tài)征收“蘋果稅”。強(qiáng)如Meta,幾乎盤踞了海外C端流量和廣告收入,也因?yàn)槿狈τ布O(shè)備而如鯁在喉。Zuckerberg近年來(lái)在RealityLabs上的激進(jìn)投入,狂燒500億美金就是為了占據(jù)下一個(gè)時(shí)代的硬件入口/計(jì)算中心。在當(dāng)前格局下,Google,Meta,蘋果和字節(jié)跳動(dòng)等移動(dòng)互聯(lián)網(wǎng)巨頭從硬件到軟件牢牢把持了用戶生態(tài),并基于計(jì)算中心/物理空間、流量/網(wǎng)絡(luò)效應(yīng)、時(shí)間/用戶習(xí)慣這幾個(gè)核心要素形成了深厚的壁壘。如果這個(gè)局面不被打破,AI大模型技術(shù)將停留在更先進(jìn)的生產(chǎn)工具("enabler”)定位,從結(jié)果上豐富了移動(dòng)互聯(lián)網(wǎng)生態(tài)的內(nèi)容供給和用戶體驗(yàn),“為他人做嫁衣”??萍季揞^依然是最大受益者,過(guò)去5年強(qiáng)者恒強(qiáng)的局面將會(huì)延續(xù)。過(guò)去五年科技巨頭市場(chǎng)份額不斷提升因此針對(duì)AI大模型重新設(shè)計(jì)的硬件和交互將是GenAI時(shí)代挑戰(zhàn)者必須攻克的堡壘。這也是為什么SamAltman很早就聯(lián)系傳奇設(shè)計(jì)師JonyIve開始在硬件方向進(jìn)行探索。事實(shí)上這樣的嘗試對(duì)挑戰(zhàn)者來(lái)說(shuō)從未停止。在硬件層面,智能手表、TWS耳機(jī)成為體量可觀的新硬件品類,但沒(méi)有擺脫手機(jī)配件的定位。在軟件層面,前兩年大熱的crypto在某種意義上創(chuàng)造了新的獲客貨幣,在高企的流量紅海中提供了一種bootstrap的可能性,但因?yàn)槿狈罄m(xù)承接能力而已失敗告終。直到AI大模型技術(shù)在最近兩年取得突破,特別是GPT4o在多模態(tài)領(lǐng)域的進(jìn)展讓人們看到了一絲希望:軟件突破帶來(lái)的智慧和擬人感如同一道「魔法」給硬件賦予生命。軟件帶來(lái)的變量主要體現(xiàn)在以下兩個(gè)方面AI硬件的三層架構(gòu)在原生多模態(tài)AI大模型出現(xiàn)后,結(jié)合硬件會(huì)出現(xiàn)新的信息交互和處理模式,大體上可以分為三個(gè)層次(為表述方便下稱“AI硬件三層架構(gòu)”1.多模態(tài)信號(hào)輸入->傳感器2.模型處理和計(jì)算->計(jì)算中心3.交互方式->UIUX設(shè)計(jì)在這三層架構(gòu)中,計(jì)算中心(如手機(jī))將為AI大模型提供端側(cè)和云端運(yùn)行能力,而AI大模型技術(shù)的能力進(jìn)步驅(qū)動(dòng)整個(gè)閉環(huán)用戶體驗(yàn)的提升,具體表現(xiàn)為讓硬件在原有功能的基礎(chǔ)上拓展能力邊界,在第三層輸出更好的效果。反過(guò)來(lái)中間層需要硬件作為傳感器獲得更多context來(lái)更好地輸出模型運(yùn)算結(jié)果?,F(xiàn)階段AI硬件,特別是新品類新團(tuán)隊(duì)的機(jī)會(huì)大多在第一層,即新式傳感器,但長(zhǎng)期中如果不能將價(jià)值向第二和第三層延伸,則會(huì)陷入消費(fèi)電子卷成本的深淵無(wú)限競(jìng)爭(zhēng)(參考激光雷達(dá)之于自動(dòng)駕駛)。LUI是否能成為下一代交互方式「TheUIofAGI」是AI硬件從業(yè)者需要思考的圣杯問(wèn)題?!疤讱ぁ逼鋵?shí)就是一種最直接的嘗試,Arc瀏覽器,Perplexity,Monica.im都在各個(gè)方向積極探索。但LUI(LanguageUserInterface)或者基于語(yǔ)音的交互方式(Voice-firstUI)是否能取代觸控時(shí)代主流的GUI(GraphicalUserInterface)是在行業(yè)內(nèi)被討論最多的問(wèn)題。我認(rèn)為GPT4o為代表的低延遲、多情感、高智能原生多模態(tài)模型雖然為L(zhǎng)UI的落地提供了技術(shù)支持,并在某些特定場(chǎng)景有較好的體驗(yàn),但現(xiàn)在看起來(lái)LUI并不能獨(dú)立成為最主流的交互方式。我認(rèn)為思考這個(gè)問(wèn)題的關(guān)鍵因素是I/O密度。I即input,指在人機(jī)交互中用戶向系統(tǒng)輸入信息。O即output,指系統(tǒng)向用戶反饋信息。在I端,LUI能很好地解決當(dāng)下信息輸入門檻過(guò)高的問(wèn)題,陣列麥克風(fēng)技術(shù)的發(fā)展配合AI大模型的多語(yǔ)言識(shí)別和總結(jié)能力,讓用戶在I端更加輕松自如(flowvoice.ai等公司已經(jīng)有產(chǎn)品落地)。但在O端,LUI的信息密度有很大的局限,特別是與GUI相比。Vela在「Voice-first,閉關(guān)做一款語(yǔ)音產(chǎn)品的思考」中做了詳細(xì)的解析。聲音在交互上的局限性主要表現(xiàn)在:1.輸出線性很難實(shí)現(xiàn)多線程多任務(wù)操作用戶很難通過(guò)前進(jìn)倒退精準(zhǔn)定位碎片化信息點(diǎn)2.記不住LUI是線性的而思維是樹/圖結(jié)構(gòu),語(yǔ)音無(wú)法單獨(dú)呈現(xiàn)人腦所需要的信息組織形式結(jié)果需要簡(jiǎn)單明確,最好用最小來(lái)回對(duì)話解決在音頻自身限制和AI大模型現(xiàn)階段長(zhǎng)程推理能力缺失的情況下,LUI目前只適合做目標(biāo)明確的單點(diǎn)任務(wù),且輸出結(jié)果信息密度不宜過(guò)高。從數(shù)據(jù)上看,天貓精靈使用最多的場(chǎng)景是詢問(wèn)天氣和設(shè)定鬧鐘。鋼鐵俠的Javis形態(tài)目前在技術(shù)邊界之外。因此,LUI配合GUI結(jié)合使用我認(rèn)為是能將I/O密度最大化的交互體驗(yàn)。原則#2熟悉的陌生感:從「+AI」開始做新的硬件產(chǎn)品一般有兩種思路:a)定義全新的品類;b)在已有品類上做創(chuàng)新和提升。22年裴宇剛做新銳手機(jī)品牌Nothing的時(shí)候,我和他有過(guò)一次交流。當(dāng)時(shí)Humane還沒(méi)有像今天這樣出圈,但也完成了頂級(jí)機(jī)構(gòu)領(lǐng)投的融資。我問(wèn)Carl:“你已經(jīng)在手機(jī)領(lǐng)域證明了自己,現(xiàn)在創(chuàng)業(yè)為什么不像Imran一樣嘗試全新的品類?”多年之后在SanaAISummit上他給出了更精華的回答:「Survivalisthenameofthegame」。Kickstarter大中華區(qū)首席戰(zhàn)略代表彭奕亨在談到AI硬件時(shí)提到了一種說(shuō)法“熟悉的陌生感”,這個(gè)形容非常準(zhǔn)確?!窰ardwareishard」,與軟件開發(fā)不同,硬件的試錯(cuò)成本更高,團(tuán)隊(duì)需要保持敬畏心。特別是對(duì)產(chǎn)品線單薄的新團(tuán)隊(duì)來(lái)說(shuō),每一款產(chǎn)品都至關(guān)重要。HumaneAIPin和RabbitR1在定義全新品類的路線上進(jìn)行了勇敢的嘗試,但截止目前結(jié)果不佳。我認(rèn)為核心原因是對(duì)現(xiàn)有的技術(shù)邊界沒(méi)有準(zhǔn)確的認(rèn)識(shí)。短期內(nèi)基于已有成熟硬件品類,在保證優(yōu)秀的基礎(chǔ)體驗(yàn)的前提下,思考如何融入AI大模型技術(shù)錦上添花(為表述方便下稱“+AI”)將是短期內(nèi)較為穩(wěn)妥的路線。原則#3「Lessismore」在確定產(chǎn)品方向時(shí),務(wù)必要遵守「lessismore」的原則,能用一個(gè)產(chǎn)品覆蓋的功能,絕不做兩個(gè)設(shè)備,特別是在個(gè)人便攜設(shè)備品類。理想的方式是做品類和功能之間的整合,如在智能眼鏡中整合耳機(jī)和音頻功能,而不是在用戶有限的褲兜/手包里再裝進(jìn)一個(gè)產(chǎn)品。另一方面,特別是對(duì)可穿戴設(shè)備,輕量化是最重要的設(shè)計(jì)標(biāo)準(zhǔn),在現(xiàn)有電池密度和芯片功耗有限的邊界下,每添加一項(xiàng)功能都會(huì)造成額外的配重和續(xù)航消耗。取舍是產(chǎn)品定義中最重要的課題。方向1:「手機(jī)+傳感器」生態(tài)「手機(jī)+傳感器」和「AI陪伴具身化」在已經(jīng)需求驗(yàn)證的場(chǎng)景中,我認(rèn)為以上兩個(gè)生態(tài)是現(xiàn)階段最大的兩個(gè)機(jī)會(huì)。手機(jī)短期內(nèi)依然是生態(tài)位核心。算力中心一直是消費(fèi)電子生態(tài)位的核心,從個(gè)人電腦(PC)到筆電,再帶手機(jī)和平板,信息處理和運(yùn)算方式很大程度上決定了硬件的物理形態(tài)。從長(zhǎng)遠(yuǎn)來(lái)看,基于Transformer架構(gòu)的大模型從算法上進(jìn)行了根本的創(chuàng)新,隨著技術(shù)的演進(jìn)可能會(huì)誕生新的計(jì)算機(jī)形態(tài),但目前看來(lái)這個(gè)過(guò)程不會(huì)在5年內(nèi)完成。手機(jī)作為算力中心,短期內(nèi)依然可以覆蓋絕大部分用戶的大多數(shù)生產(chǎn)和娛樂(lè)需求。非技術(shù)角度,從臺(tái)式個(gè)人電腦向手機(jī)演進(jìn)的過(guò)程中,輕便可攜帶是明顯的用戶需求趨勢(shì)。經(jīng)過(guò)近30年的迭代,如今手機(jī)的物理形態(tài)在重量、體積、續(xù)航、交互模式上已經(jīng)高度成熟,在某種意義上手機(jī)是第一款成為人類「電子器官」的產(chǎn)品。iPhone取代了諾基亞的歷史地位,但并沒(méi)有從本質(zhì)上改變手機(jī)的物理形態(tài)。類似的,在短期內(nèi),搭載端測(cè)模型能力后手機(jī)將繼續(xù)占據(jù)雙手的使用場(chǎng)景,依然是主要的核心生態(tài)位。實(shí)踐中也有很明確的例證:.高通為可穿戴設(shè)備研制的AR2芯片采用分體式設(shè)計(jì),芯片將分為兩個(gè)部分,一部分集成在可穿戴設(shè)備上,另一部分會(huì)在手機(jī)等計(jì)算單元上·MetaOrion和XREALBeam等采用算力分離式設(shè)計(jì)的XR設(shè)備,算力單元的物理設(shè)計(jì)本質(zhì)上就是手機(jī)的形態(tài)手機(jī)在AI硬件三層架構(gòu)可以在一定程度上覆蓋所有三個(gè)維度,并占據(jù)計(jì)算中心的核心價(jià)值位。現(xiàn)階段對(duì)其他硬件設(shè)備的主要機(jī)會(huì)在于成為手機(jī)的傳感器,收集手機(jī)目前尚不能覆蓋的細(xì)分場(chǎng)景信息-主要是息屏、用戶雙手被占用無(wú)法拿起手機(jī)、無(wú)法快速開啟手機(jī)內(nèi)置傳感器(為描述方便,下文統(tǒng)稱“手機(jī)空白場(chǎng)景”)-并嘗試探索新的交互體驗(yàn)。在這樣的系統(tǒng)設(shè)定下,可穿戴設(shè)備最適合扮演傳感器的角色。而人本身的信號(hào)傳感器–眼、耳、鼻都集中位于頭部–圍繞頭部的可穿戴設(shè)備必將成為必爭(zhēng)之地。今年5月,我在社交媒體即刻上轉(zhuǎn)發(fā)了下面這張圖,非常生動(dòng)地展示了這個(gè)事實(shí)。但需要明確的是,由于輕量化和目前硬件技術(shù)的瓶頸,可穿戴設(shè)備都難以獨(dú)立支撐好的用戶體驗(yàn)(包括眼鏡在內(nèi)需要和手機(jī)配合使用。輕量化是穿戴設(shè)備成功的金標(biāo)準(zhǔn)。因?yàn)橐a(bǔ)充手機(jī)空白場(chǎng)景,長(zhǎng)時(shí)間使用(“alwayson/available”)是對(duì)穿戴設(shè)備作為傳感器功能的核心要求。同等條件下,用手機(jī)能更快地捕獲信息并進(jìn)行輸入,穿戴設(shè)備就會(huì)變成累贅。因此,輕量化無(wú)感佩戴是這類產(chǎn)品能否普及必須實(shí)現(xiàn)的目標(biāo)。在圍繞頭的穿戴品類中,主要有手表、耳機(jī)、眼鏡、掛件、戒指、手環(huán)等。這些產(chǎn)品大多都是成熟品類,在好的基礎(chǔ)體驗(yàn)上創(chuàng)新也符合「+AI」的策略。久謙咨詢對(duì)這些品類的市場(chǎng)規(guī)模做了如下估算:在個(gè)人便攜式設(shè)備中,數(shù)碼相機(jī)和運(yùn)動(dòng)相機(jī)較難滿足長(zhǎng)時(shí)間無(wú)感佩戴(一定程度上可以被眼鏡覆蓋且市場(chǎng)集中度高。對(duì)AI硬件團(tuán)隊(duì)來(lái)說(shuō),市場(chǎng)足夠大的品類依次是耳機(jī)、智能手表、眼鏡和配飾類設(shè)備。整個(gè)智能穿戴設(shè)備生態(tài)都脫離不了一個(gè)主題:Survivalisthenameofthegame手機(jī)廠商因?yàn)檎甲×撕诵纳鷳B(tài)位,穿戴設(shè)備的新機(jī)會(huì)都在其射程之內(nèi),我們討論的所有穿戴設(shè)備品類都逃脫不了激烈的競(jìng)爭(zhēng)。對(duì)新玩家來(lái)說(shuō)有兩種現(xiàn)實(shí)的選擇:1)在市場(chǎng)足夠大的賽道,爭(zhēng)取成為小米華為蘋果身后的第三/四名;2)在大廠看不上,小公司搞不定的賽道做差異化競(jìng)爭(zhēng)。第一種路線考驗(yàn)的是團(tuán)隊(duì)的執(zhí)行力,需要面對(duì)的競(jìng)爭(zhēng)包括:.硬件玩家第一梯隊(duì):華為,小米,蘋果;優(yōu)勢(shì)無(wú)需贅述,且已經(jīng)有手機(jī)、耳機(jī)、眼鏡等成熟產(chǎn)品線,用戶基數(shù)大第二梯隊(duì):Oppo/Vivo,大疆,安克等;有成熟的供應(yīng)鏈資源和分銷渠道,成熟業(yè)務(wù)可以產(chǎn)生穩(wěn)定現(xiàn)金流第三梯隊(duì):科大訊飛、韶音、雷鳥、Rokid等;在垂類中有領(lǐng)先市場(chǎng)份額·互聯(lián)網(wǎng)公司:字節(jié)跳動(dòng)、阿里、騰訊等;擁有大量承接UIUX的場(chǎng)景競(jìng)爭(zhēng)確實(shí)激烈,但也并不是全無(wú)機(jī)會(huì)。AI硬件時(shí)代的一個(gè)重要變量是對(duì)團(tuán)隊(duì)的復(fù)合型要求:即軟硬件結(jié)合的能力。正如文初提到的,這一輪AI硬件本質(zhì)上是軟件驅(qū)動(dòng)的,與硬件龍頭競(jìng)爭(zhēng),新團(tuán)隊(duì)需要具備更強(qiáng)的軟件能力,努力將產(chǎn)品向AI硬件三層架構(gòu)的后兩層做價(jià)值延伸。而互聯(lián)網(wǎng)公司,強(qiáng)如字節(jié)跳動(dòng),雖然目前在積極探索布局豆包大模型與硬件的結(jié)合,但從決心和能力上都無(wú)法與Meta相提并論。更重要的是,硬件的邏輯與字節(jié)跳動(dòng)信奉的數(shù)據(jù)驅(qū)動(dòng)的方法論有本質(zhì)區(qū)別,對(duì)人才的審美和組織管理形式也大相徑庭。收購(gòu)PICO后的整合就是例證。PICO的鎩羽動(dòng)搖了字節(jié)在這個(gè)方向投入的信心,造成了陰影(從目前的信息來(lái)看,字節(jié)可能從下一章節(jié)陪伴硬件的角度先切入)。當(dāng)然,也可以選擇第二條路線。這就要求團(tuán)隊(duì)對(duì)消費(fèi)者需求有深度的洞察和提前的預(yù)判。一個(gè)可以參考的思路是將軟件功能硬件化。核心是找到一個(gè)軟件端有需求的場(chǎng)景,并通過(guò)極簡(jiǎn)的設(shè)計(jì),將多步操作壓縮到一步。Plaud就是看到LiveTranscribe這個(gè)app巨大的用戶基礎(chǔ),將錄音這個(gè)本來(lái)可以在app端完成的場(chǎng)景硬件化。將原本需要掏出手機(jī),解鎖,找到app,打開app,開啟錄音的一系列操作融合到簡(jiǎn)單的一鍵到位。雖然Plaud的軟件端目前還非常拉胯,但硬件的極致設(shè)計(jì),已經(jīng)讓它成為了我的必備用品。在可穿戴設(shè)備的眾多品類中,我最看好眼鏡這個(gè)品類,因此獨(dú)立一個(gè)小節(jié)進(jìn)行分析。智能眼鏡:連接人類與機(jī)器的第三只眼?在展開討論之前,需要明確的是,這里討論的智能眼鏡主要是RaybanMeta的形態(tài)。這不是一款A(yù)I眼鏡(至少現(xiàn)在不是而是以攝像為核心功能的智能音頻眼鏡,且需要和手機(jī)配合使用。而VST方案的眼鏡會(huì)在XR章節(jié)中展開討論。智能眼鏡的優(yōu)勢(shì)和機(jī)會(huì)近期RaybanMeta意外大賣,增強(qiáng)了Zuckerberg對(duì)智能眼鏡這個(gè)形態(tài)的信心。Connect大會(huì)上,Meta發(fā)布了研發(fā)9年之久的AR眼鏡原型機(jī)Orion。小扎對(duì)此如此篤定不無(wú)道理,因?yàn)檠坨R作為傳感器定位的智能穿戴設(shè)備確實(shí)有得天獨(dú)厚的優(yōu)勢(shì).信息密度最大:眼睛是人類的窗戶,因?yàn)橐曈X(jué)是人類獲取信息密度最大的渠道;同理眼鏡同樣可以便捷地獲取視覺(jué)和音頻信息·第一視角POV:“seewhatyousee”+“hearwhatyourhear”,POV視角不但可以提供了模型最需要的用戶視角的context;解放雙手的設(shè)定也適配手機(jī)空白場(chǎng)景·在現(xiàn)有形態(tài)上創(chuàng)新空間相對(duì)最大:相比耳機(jī)和智能手表(疊加AI功能對(duì)本身形態(tài)改變不大帶攝像頭的智能眼鏡相對(duì)是新的形態(tài),為新玩家提供空間此外,攝像眼鏡在傳播上也有天生的優(yōu)勢(shì),從目前用戶的行為來(lái)看,攝影攝像是主要的使用場(chǎng)景。RaybanMeta在內(nèi)容創(chuàng)作者和大V中非常受歡迎,他們創(chuàng)作的POV視角的內(nèi)容在社交媒體傳播容易形成潮流效應(yīng),從而形成自傳播。在RaybanMeta取得成功后,海外大廠已經(jīng)形成共識(shí):Google決定與硬件合作伙伴三星探索類似形態(tài),落地在GoogleI/O上驚鴻一瞥的ProjectAstra,蘋果也開始重新審視自己的Vision產(chǎn)品線。RaybanMeta:偶然的爆款,這一次不一樣?這并不是科技公司在眼鏡上的第一次嘗試,實(shí)際上這是一個(gè)命途多舛的品類。從MagicLeap,HoloLens一直到MetaOrion,鋼鐵俠Javis形態(tài)的智能眼鏡一直是大家心目中的終極形態(tài)。在諸多落地挑戰(zhàn)中,最核心的問(wèn)題是無(wú)法達(dá)到輕量化要求。具體到眼鏡,行業(yè)普遍認(rèn)為超過(guò)60g的眼鏡(普通眼鏡20g左右)無(wú)法提供長(zhǎng)時(shí)間無(wú)感的舒適體驗(yàn),而RaybanMeta在保持足夠好的基礎(chǔ)體驗(yàn)的前提下,將重量控制在50g左右。另外,近年來(lái)TikTok和Instagram等視覺(jué)系社交軟件的風(fēng)靡也為智能眼鏡的普及掃清了障礙:在公共場(chǎng)景使用攝像頭拍攝變得司空見(jiàn)慣。這曾是阻礙GoogleGlass普及的最大原因(GoogleGlass也極致輕量化)。然而與Rayban的聯(lián)名更像是一個(gè)計(jì)劃外的產(chǎn)物,更準(zhǔn)確地說(shuō)是Orion做減法得到的產(chǎn)物。Meta負(fù)責(zé)研發(fā)硬件的RealityLabs由CTOAndrew"Boz"Bosworth負(fù)責(zé),這是一個(gè)超過(guò)15,000人的龐大部門。Boz是Zuckerburg最信任的親信之一,但在產(chǎn)品方向上Zuckerburg兩次親自做出了與Boz意見(jiàn)相左的決定,一次是在早期決定Quest走無(wú)線的一體機(jī)頭顯方案,另一次則是在2019年在評(píng)估Orion短期內(nèi)無(wú)法量產(chǎn)后,要求轉(zhuǎn)變方向與Rayban合作探索新的產(chǎn)品形態(tài)。從科技角度來(lái)說(shuō),RaybanMeta是Orion技術(shù)的一次下放,但這樣的功能取舍和組合,卻意外地在重量、功能、設(shè)計(jì)和成本之間達(dá)到了消費(fèi)者能接受的平衡。從產(chǎn)品定義上,這與傳統(tǒng)意義上通過(guò)視覺(jué)顯示增強(qiáng)現(xiàn)實(shí)(“AR”)的定位不同,這是一款定位“l(fā)ivinginthemoment”,以攝影攝像為主要功能的產(chǎn)品。RaybanMeta是第二代產(chǎn)品,相比第一代產(chǎn)品RaybanStories(第一代產(chǎn)品并沒(méi)有AI功能由于高通AR1芯片升級(jí),在攝像(5MP提升至12MP)和音頻上(3陣列到5陣列麥克風(fēng),加入空間音頻;音量提升50%)都有明顯的提升,并加入AI功能。此外,EssilorLuxottica也為RaybanMeta提供了更多的線下渠道覆蓋。智能眼鏡形態(tài)的主要?jiǎng)澐趾蛢?yōu)劣勢(shì)智能眼鏡根據(jù)功能組合和視場(chǎng)角(“FOV”)大致可以分為以下幾類:1.不帶顯示的智能眼鏡(已經(jīng)能將重量控制在50g以內(nèi),符合輕量化要求)音頻眼鏡:因?yàn)榍拔姆治鯨UI的局限性,在用戶端提供的功能非常有限攝像+音頻眼鏡:RaybanMeta取得階段性成功,價(jià)位$3002.帶顯示的智能眼鏡(能控制在100g以內(nèi),但在輕量化上還有提升空間)40-50度FOV(雷鳥X2輕顯示,價(jià)位$500-1,00050-70度FOV(Orion現(xiàn)實(shí)增強(qiáng),有原型機(jī),無(wú)法量產(chǎn)100度FOV:接近VR視覺(jué)體驗(yàn),但采用OST方案;在目前技術(shù)邊界之外不帶顯示的智能眼鏡在輕量化和成本控制上已經(jīng)相對(duì)成熟。但目前只覆蓋AI硬件三層架構(gòu)的第一層,并通過(guò)LUI提供有限的交互。純音頻眼鏡收集信號(hào)密度有限,同時(shí)受制于系統(tǒng)權(quán)限,產(chǎn)品功能單薄,且與TWS耳機(jī)重合度高。另外電子消費(fèi)品追求標(biāo)準(zhǔn)化的模式,并不能滿足消費(fèi)者對(duì)眼鏡個(gè)性化多SKU的需求。從華為和小米的實(shí)際銷量上看,只搭載音頻帶來(lái)的功能增強(qiáng)并沒(méi)有提供足夠強(qiáng)的說(shuō)服力。AI語(yǔ)音秘書而帶有攝像頭的智能眼鏡,在保留音頻功能的同時(shí),通過(guò)與手機(jī)配合使用,能解鎖更多延伸場(chǎng)景,提供較好的基礎(chǔ)體驗(yàn)。在帶顯示方案的眼鏡產(chǎn)品中,現(xiàn)有的成熟量產(chǎn)方案只能提供40-50度FOV的輕顯示,定位雞肋。一方面需要搭載光機(jī)帶來(lái)額外的重量和成本,另一方面視場(chǎng)角有限,實(shí)際上只起到了通知中心(pushcenter)和widget看板的功能。運(yùn)用新一代技術(shù)的EvenRealitiesG1等產(chǎn)品,雖然在輕量化上更進(jìn)一步,但這類產(chǎn)品的落地場(chǎng)景目前集中于:實(shí)時(shí)翻譯、導(dǎo)航、提詞器等場(chǎng)景。這些場(chǎng)景中確實(shí)有不錯(cuò)的體驗(yàn),但可以試想一下普通人使用上述三個(gè)場(chǎng)景的頻次。AI功能目前也僅限基于識(shí)圖的任務(wù)延伸(類似Apple16展示的功能)。除此之外,不少人幻想的使用場(chǎng)景,在OST方案中都在目前的技術(shù)邊界之外。Orion也只能勉強(qiáng)提供幾個(gè)雞肋的場(chǎng)景。在某種程度上智能眼鏡除攝影攝像和音頻之外的功能都可以被智能手表覆蓋。選擇比努力重要。對(duì)試錯(cuò)成本更高的硬件創(chuàng)業(yè)公司來(lái)說(shuō)更是如此,雖然上海顯耀等MicroLED公司近年取得一些技術(shù)突破,但顯示方案受制于FOV,即使落地也無(wú)法獨(dú)立支撐太多的應(yīng)用場(chǎng)景,現(xiàn)在看來(lái)并不是最優(yōu)的技術(shù)路線。而RaybanMeta則為智能眼鏡指明了方向,短期內(nèi)取代不了手機(jī),但眼鏡保有量大,若出現(xiàn)類似汽車電動(dòng)化的眼鏡智能化趨勢(shì),市場(chǎng)體量也相當(dāng)可觀。但目前的主要缺陷是因?yàn)檩p量化無(wú)法搭載高容量電池的情況下,如何控制芯片功耗從而實(shí)現(xiàn)更長(zhǎng)續(xù)航。方向2:硬件為AI陪伴提供物理載體各類AI陪伴和助手產(chǎn)品已經(jīng)在軟件層面驗(yàn)證了用戶需求。在上一篇文章中已有詳細(xì)論述。這里簡(jiǎn)單提三個(gè)可以硬件化的品類:AI語(yǔ)音秘書、AI智能玩具和陪伴機(jī)器人(電子寵物)。這幾個(gè)方向同樣需要軟硬件結(jié)合的團(tuán)隊(duì),同時(shí)理解AI大模型能力的邊界,也能調(diào)動(dòng)供應(yīng)鏈資源投入量產(chǎn)。基于AI大模型在長(zhǎng)文本理解和信息提取上的優(yōu)勢(shì),一些團(tuán)隊(duì)開始在將長(zhǎng)音頻信息通過(guò)硬件收集并結(jié)合軟件處理的AI語(yǔ)音秘書/第二大腦的方向進(jìn)行探索。Rewind最先提出這個(gè)概念,并在軟件場(chǎng)景得到需求驗(yàn)證后推出智能掛件Limitless(并將公司改名)。Plaud也在第一款產(chǎn)品Note在通話錄音方向取得成功后,推出面向更長(zhǎng)時(shí)長(zhǎng)更廣泛場(chǎng)景的NotePin。這些產(chǎn)品都有類似的特點(diǎn):輕便隨身且長(zhǎng)時(shí)間待機(jī),隨時(shí)隨地收集用戶所處環(huán)境的音頻信息。HumaneAIPin雖然在功能和交互上慘敗,但在硬件形態(tài)和佩戴方式上不無(wú)可取之處。離嘴和耳近且能方便觸發(fā)功能是核心的用戶需求,在外觀上還不能太有侵略性。胸針、項(xiàng)鏈等配件是更加合適的選項(xiàng)。這其中PlaudNotePin的設(shè)計(jì)非常聰明,類似小米手環(huán)的設(shè)計(jì)不但容易適配多種場(chǎng)景,同時(shí)可以復(fù)用供應(yīng)鏈資源。如何在有限的空間內(nèi)通過(guò)陣列麥克風(fēng)組合實(shí)現(xiàn)空間音頻適配,以及低功耗長(zhǎng)續(xù)航是這類產(chǎn)品在硬件端需要攻克的難題。而在軟件端,如何在海量的信息中,萃取信息價(jià)值是體現(xiàn)產(chǎn)品價(jià)值差異化的關(guān)鍵。AI智能玩具玩具是搭載LUI的理想硬件載體。一方面,小朋友需要的信息密度和精度要求相對(duì)不高,且語(yǔ)音的流式交互也可以被硬件一部分承載。另一方面,相比于純軟件的形態(tài),通過(guò)硬件具象化也更方便用戶代入情感寄托,提供更高的情緒價(jià)值。這個(gè)品類也符合“熟悉的陌生感”邏輯,用戶教育門檻低,基本上手即可使用。需要注意的是玩具的使用者和購(gòu)買決策者分離,團(tuán)隊(duì)需要在軟件后臺(tái)針對(duì)家長(zhǎng)的訴求(主要是安全控制和成長(zhǎng)記錄)有相對(duì)應(yīng)的設(shè)計(jì)。國(guó)內(nèi)的躍然創(chuàng)新Haivivi和海外的Curio都陸續(xù)推出了產(chǎn)品,且獲得不錯(cuò)的市場(chǎng)反響。Haivivi的第一款產(chǎn)品BubblePal取巧地采用了掛件的設(shè)計(jì),一方面硬件形態(tài)相對(duì)簡(jiǎn)單容易快速量產(chǎn),另一方面“蹭”了用戶現(xiàn)有玩具的形象設(shè)計(jì),規(guī)避了冷啟動(dòng)時(shí)外形設(shè)計(jì)的風(fēng)險(xiǎn)。但長(zhǎng)期中,IP的授權(quán)和綁定將是這個(gè)品類的核心競(jìng)爭(zhēng)力。陪伴機(jī)器人同樣,針對(duì)成年人類似豆包的AI個(gè)人助理也可以被賦予硬件的“肉身”,將情緒和陪伴價(jià)值進(jìn)一步延伸和固化。Looi是一款可移動(dòng)手機(jī)支架形態(tài)的桌面機(jī)器人,在搭載基礎(chǔ)AI大模型交互功能的基礎(chǔ)上,團(tuán)隊(duì)還開發(fā)了配合物理移動(dòng)的表情設(shè)計(jì)及世界觀設(shè)定。這類產(chǎn)品在軟件AI個(gè)人助理的基礎(chǔ)上更進(jìn)一步,通過(guò)與用戶的物理交互建立更深層的情感連接。本質(zhì)上這類產(chǎn)品是對(duì)桌面智能音箱、時(shí)鐘等硬件的整合和體驗(yàn)提升。同時(shí)Looi的設(shè)計(jì)巧妙的將攝像傳感器轉(zhuǎn)移給手機(jī),在一定程度上規(guī)避了這個(gè)品類中潛在的數(shù)據(jù)收集和隱私風(fēng)險(xiǎn)。同樣的思路也可以延伸至家庭地面機(jī)器人。三星的Ballie就是這個(gè)方向的一個(gè)代表,這個(gè)形態(tài)的產(chǎn)品可以結(jié)合掃地機(jī)器人和智能音箱的功能,甚至在某種程度上分擔(dān)了寵物的部分情感陪伴功能。XR:頭號(hào)玩家是否ready?影視作品「頭號(hào)玩家ReadyPlayerOne」生動(dòng)地描繪了人類對(duì)XR產(chǎn)品的想象。從早期的OculusRift,HTCVive到MagicLeap,HoloLens,再到現(xiàn)在的Quest,VisionPro和Pico。XR產(chǎn)品的發(fā)展在過(guò)去10年,已經(jīng)走過(guò)了“10個(gè)元年”,在技術(shù)程度曲線(thehypecurve)上經(jīng)過(guò)了從「過(guò)高期望的峰值」跌落「去泡沫的谷底」的過(guò)程,目前正處于線性穩(wěn)步向前的階段,但離大規(guī)模普及實(shí)現(xiàn)指數(shù)性增長(zhǎng)的階段尚有距離。除了軟件和硬件的技術(shù)邊界之外,XR設(shè)備本身具有單次使用門檻/儀式感高、佩戴和使用體驗(yàn)高度個(gè)人化且不易分享的特性,使得產(chǎn)品入門閾值一直較高。總的來(lái)說(shuō),VR方向硬件產(chǎn)業(yè)鏈、光學(xué)方案和軟件生態(tài)的方向都已經(jīng)基本確定,在VisionPro指明OS和交互邏輯后,未來(lái)3年行業(yè)將持續(xù)穩(wěn)步打磨產(chǎn)品。而在AR方向,光學(xué)方案尚未收斂,產(chǎn)業(yè)鏈也處在早期階段,雖然夢(mèng)想美好,但現(xiàn)實(shí)很殘酷。就算是天頂星的Orion,在3-5年之內(nèi)都不會(huì)量產(chǎn)。行業(yè)在AR領(lǐng)域的迷茫,一部分原因是現(xiàn)階段硬件技術(shù)邊界的限制,但我認(rèn)為也有很大一部分原因是從業(yè)者被對(duì)顯示的執(zhí)念束縛。AR(augmentedreality)現(xiàn)實(shí)增強(qiáng)的定義簡(jiǎn)單可以概括為:增強(qiáng)能力,解放雙手。視頻顯示固然能帶來(lái)最強(qiáng)的現(xiàn)實(shí)增強(qiáng),但人有五感(即多模態(tài)通過(guò)音頻等其他形式帶來(lái)的能力增強(qiáng),雙手解放,廣義上也是AR。RaybanMeta因?yàn)椴粠э@示不被部分從業(yè)者認(rèn)為是AR眼鏡(包括MetaCTOBoz一度也這么認(rèn)為但在廣義下,卻實(shí)現(xiàn)了AR的目標(biāo)。蘋果和Meta無(wú)疑是過(guò)去5年為爭(zhēng)奪「頭號(hào)玩家」投入最多的兩家廠商。兩家分別采用了不同的戰(zhàn)略路徑,這里做一個(gè)簡(jiǎn)要的總結(jié)和現(xiàn)狀的分析。蘋果戰(zhàn)略側(cè)重VST的MR方向,閉源路徑,高端定位,希望從效率場(chǎng)景切入。從目前的情況來(lái)看,萬(wàn)眾期待的首款產(chǎn)品VisionPro已經(jīng)失敗,失敗的核心點(diǎn)不在于銷量(本身也沒(méi)有很高的預(yù)期而是沒(méi)有在先鋒人群中形成時(shí)尚效應(yīng)。在過(guò)往新品類發(fā)布中,無(wú)論是AppleWatch還是AirPods,蘋果都能通過(guò)頂尖的廣告和推廣在最酷的人群中產(chǎn)生示范效應(yīng)從而帶動(dòng)后續(xù)更大眾系列的普及,但在VisionPro上并沒(méi)有成功。但這款產(chǎn)品也并非一無(wú)是處,其出色的交互設(shè)計(jì)和空間定位,為行業(yè)指明方向。Meta同時(shí)布局OST方向AR產(chǎn)品(Orion)和VST方向VR產(chǎn)品(Quest)Quest以游戲主機(jī)定位起步,無(wú)論從定價(jià)還是內(nèi)容供給都進(jìn)行強(qiáng)錨定以帶動(dòng)銷量和用戶覆蓋。Quest2取得階段性成功步入千萬(wàn)量級(jí)銷量。從Quest3開始加入彩透功能開始向MR結(jié)合的更多場(chǎng)景拓展,在VisionPro發(fā)布后,明確OS和交互模式將會(huì)向蘋果靠攏。Quest4的主要定位預(yù)計(jì)是無(wú)限靠近VisionPro的體驗(yàn),但有明顯價(jià)格優(yōu)勢(shì)。AR方向產(chǎn)品Orion3-5年內(nèi)不會(huì)量產(chǎn)落地。比較可惜的是國(guó)內(nèi)的PICO,在被字節(jié)收購(gòu)后被沒(méi)有得到應(yīng)有的整合。砸出100億人民幣后,便戰(zhàn)略收縮。最可惜的是研發(fā)并未占投入大頭,且沒(méi)有像蘋果和Meta一樣形成技術(shù)體系(研發(fā)成果可以在多款產(chǎn)品繼承)。總的來(lái)說(shuō),未來(lái)3年的主力機(jī)型(MetaQuest3/3s/4和AppleVision/Pro)都無(wú)法將用戶基數(shù)帶過(guò)指數(shù)級(jí)增長(zhǎng)的拐點(diǎn),而只能在千萬(wàn)級(jí)別線性增長(zhǎng)。這個(gè)級(jí)別的用戶體量可能對(duì)游戲之外的應(yīng)用品類來(lái)說(shuō)相對(duì)有限,但在XR用戶的價(jià)值在于對(duì)低齡用戶的滲透:無(wú)論是海外的GorillaTag,VRChat還是國(guó)內(nèi)的輕世界都有比例相當(dāng)大的低齡用戶。隨著這個(gè)年齡XR原生用戶的發(fā)展壯大和購(gòu)買力增強(qiáng),長(zhǎng)期滲透率的拐點(diǎn)將可能出現(xiàn)。另外,AI大模型技術(shù)的出現(xiàn)可能也會(huì)在VST方案的設(shè)備中引入新的趨勢(shì)。在內(nèi)容生產(chǎn)端,AI多模態(tài)內(nèi)容生成工具將有效降低VR內(nèi)容制作門檻(特別是3D內(nèi)容長(zhǎng)期中可能會(huì)出現(xiàn)Roblox、蛋仔派對(duì)形態(tài)的UGC平臺(tái)。更為重要的是在交互端,顯示渲染系統(tǒng)與AI內(nèi)容生成技術(shù)天然易結(jié)合,可能出現(xiàn)一個(gè)重要的交互場(chǎng)景變化,即將內(nèi)容創(chuàng)作者的攝像頭向另一端投射-「POV視角」-的創(chuàng)作,而AI內(nèi)容生成技術(shù)將讓「世界濾鏡」成為可能,從而衍生出更多的玩法,在真正意義上實(shí)現(xiàn)現(xiàn)實(shí)增強(qiáng)("AR")的體驗(yàn)。SnapchatSpectacles的宣傳片中已經(jīng)demo了這種場(chǎng)景,蘋果內(nèi)部對(duì)這個(gè)方向的確定性也非常篤定。目前已有一些GenAI公司嘗試在這條路線探索,AI圖像生成公司Midjourney因?yàn)閯?chuàng)始團(tuán)隊(duì)MagicLeap的背景更是對(duì)此深信不疑,據(jù)我了解團(tuán)隊(duì)目前在同時(shí)研發(fā)VR設(shè)備在內(nèi)的多條技術(shù)路線。但目前的主要挑戰(zhàn)是:1.AI內(nèi)容生成的速度和渲染成本:目前AI渲染的延時(shí)明顯,離實(shí)時(shí)渲染還有很遠(yuǎn)的差距,同時(shí)成本極高。2.硬件輕量化和續(xù)航:頭戴設(shè)備的重量是影響長(zhǎng)時(shí)間/戶外使用的核心因素,如何平衡算力+續(xù)航和重量也是目前的一大瓶頸。具身智能:更近還是更遠(yuǎn)?受篇幅限制,不在這里展開討論現(xiàn)階段具身智能方向的投資價(jià)值。主要談一談兩個(gè)問(wèn)題:1)造成目前行業(yè)投資熱情的原因;2)當(dāng)下需要面對(duì)的主要技術(shù)挑戰(zhàn)具身智能同時(shí)在中美兩個(gè)市場(chǎng)掀起熱潮,無(wú)疑是今年國(guó)內(nèi)市場(chǎng)融資最活躍的賽道。背后的核心原因是資本需求和項(xiàng)目供給的關(guān)系。在資本需求端,海外市場(chǎng)明星項(xiàng)目TeslaOptimus,F(xiàn)igure,1X等在市場(chǎng)制造聲量,一定程度上起到示范科普作用,黃仁勛在英偉達(dá)GTC大會(huì)上和一眾機(jī)器人的同框亮相更是將市場(chǎng)的熱情拉滿。另一方面,我國(guó)的政策也十分支持機(jī)器人相關(guān)的高端制造業(yè)。結(jié)果上導(dǎo)致美元和人民幣背景的基金都有配置的興趣和需求。在項(xiàng)目供給端,具身智能主要包括大腦、小腦和本體三個(gè)系統(tǒng),分別要求團(tuán)隊(duì)在機(jī)器視覺(jué)、AI大模型、通用移動(dòng)、運(yùn)動(dòng)控制、硬件機(jī)械等多個(gè)跨學(xué)科交叉領(lǐng)域都有深厚的技術(shù)儲(chǔ)備。根據(jù)我們對(duì)人才庫(kù)的梳理,在具身智能創(chuàng)業(yè)方向可以獨(dú)當(dāng)一面的頂級(jí)華人人才不超過(guò)30人。具身智能是最近幾年興起的前沿研究方向,更多的人才還在學(xué)界和業(yè)界做研究,或者對(duì)產(chǎn)業(yè)缺乏經(jīng)營(yíng)上的認(rèn)識(shí)和經(jīng)驗(yàn)。而從機(jī)器視覺(jué)、自動(dòng)駕駛等領(lǐng)域跨界創(chuàng)業(yè)的團(tuán)隊(duì)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論