2023年10月4日,Google在紐約舉辦了「Made by Google」硬件發(fā)布會,并正式發(fā)布了Pixel 8和Pixel 8 Pro。Pixel 8系列作為首批搭載Android 14系統(tǒng)的手機,據(jù)官方介紹其最大亮點就是AI功能。在發(fā)布會持續(xù)的一小時內(nèi),「AI」一詞被提及超過50次,可見Google對這一功能的重視,以及AI是Pixel 8核心賣點的事實。
然而讓人意外的是,日前Google以「硬件限制」為理由,拒絕在Pixel 8上運行最新的人工智能模型「Gemini Nano」。Google隨后宣布即將在6月的季度更新中為Pixel 8提供「Gemini Nano」功能,但用戶只能在隱藏的開發(fā)者選項中開啟。

圖源:Unsplash
對于此事,谷歌設(shè)備和服務(wù)軟件副總裁Seang Chau解釋稱,為了能隨時調(diào)用「Gemini Nano」模型,部分AI模型會常駐內(nèi)存。而Pixel 8只有8GB內(nèi)存,如果貿(mào)然啟用「Gemini Nano」功能,很可能會影響用戶的使用體驗。與之相反,Pixel 8 Pro擁有12GB內(nèi)存,能比較好地釋放AI模型性能。
從Seang Chau的回復(fù)來看,Pixel 8并不是不能使用「Gemini Nano」,而是使用后會占用大量手機系統(tǒng)內(nèi)存,導(dǎo)致其他應(yīng)用的體驗感下降。作為參考,三星Galaxy S24系列8GB內(nèi)存版本就可運行Gemini Nano模型,而沒有這方面的限制。
“一刀切”能否克服端側(cè)大模型劣勢?
目前,大模型已經(jīng)成為手機廠商們的「必爭之地」,小米、華為、榮耀、OPPO、vivo等手機廠商均已發(fā)布搭載大模型的旗艦機型。像華為的盤古大模型、小米的MiLM、OPPO的安第斯大模型、vivo的藍心大模型以及榮耀的魔法大模型,也隨著新機發(fā)布首次走進消費者的視野。在以上大模型解決方案中,有以云端為主的,也有云端與端側(cè)相結(jié)合的,但幾乎沒有純端側(cè)的大模型。
所謂的「端側(cè)」,指的是將大模型服務(wù)布置在手機設(shè)備內(nèi)部的芯片之中,僅利用芯片的算力生成結(jié)果。與云端大模型相比,這種方案的優(yōu)勢是不需要聯(lián)網(wǎng),因此數(shù)據(jù)不用上傳至云端,減少了泄露風(fēng)險,并在一定程度上減輕了云成本。
但純端側(cè)方案也有其不可忽視的劣勢,就是算力有限。如果手機設(shè)備只是接入云端大模型,自然不需要終端設(shè)備擁有多強的算力和AI芯片,但如果在手機本地運營端側(cè)大模型,則對算力有著極高的要求。盡管從理論上來說,常規(guī)手機芯片中的GPU、CPU都能進行并行計算,但在效率和能耗控制方面仍比不上AI芯片中專門用于AI加速計算的NPU/TPU等神經(jīng)處理單元,更別提動輒擁有幾百上千張頂級顯卡的云端后臺了。

圖源:谷歌
而Google的「Gemini Nano」在發(fā)布之初,就已經(jīng)將其定位為在移動設(shè)備上本地運行的端側(cè)大模型,并且其內(nèi)置在Android 14系統(tǒng)中。也就是說,未來如果其他開發(fā)者想通過AICore API直接調(diào)用其他Android手機的Gemini AI能力,將會遇到與Pixel 8相同的硬件要求問題。
在雷科技看來,Google之所以限制Pixel 8調(diào)用Gemini Nano模型,一方面是擔(dān)心Gemini Nano模型在占用大量手機系統(tǒng)內(nèi)存后,影響用戶使用其他應(yīng)用程序時的體驗感,為了保險起見,干脆直接一刀切;另一方面,Pixel 8標(biāo)準(zhǔn)版與Pixel 8 Pro標(biāo)準(zhǔn)版的售價相差大約2000元,在核心配置相差不大的情況下,AI功能或許能驅(qū)使目標(biāo)用戶選擇更貴的Pixel 8 Pro。
內(nèi)存壓縮技術(shù),是端側(cè)大模型的必經(jīng)之路?
我們暫且不討論運行內(nèi)存對端側(cè)大模型的影響是否真的有那么大,站在行業(yè)角度,如何在算力有限的手機上實現(xiàn)較好的大模型效果,是所有手機廠商都需要考慮的問題。
此前微軟推出的Copilot Pro訂閱服務(wù)對AI PC的算力和內(nèi)存提出了明確要求,但在AI手機領(lǐng)域,至今還沒有任何一家企業(yè)給出大模型手機的類似標(biāo)準(zhǔn)。
或許大部分人都不知道,其實最早被曝出規(guī)劃手機端側(cè)路線的企業(yè),是至今仍未在iPhone用上大模型的蘋果。蘋果在招聘介紹中提及了本地推理引擎中實現(xiàn)壓縮和加速大模型的相關(guān)要求,雖然iOS 18還未正式推出,但蘋果對AI大模型的探索從其取得的專利就能窺見一二。
