近日,智譜AI(人工智能)推出自主智能體AutoGLM,只需接收簡(jiǎn)單的文字或語(yǔ)音指令,就可以模擬人類操作手機(jī)的“Phone use能力”。相關(guān)消息引發(fā)市場(chǎng)關(guān)注,甚至催生出“智譜AI概念股”。
10月29日,二級(jí)市場(chǎng)“智譜AI概念股”開盤即延續(xù)周一以來(lái)的漲勢(shì),如豆神教育、思美傳媒、正和生態(tài)等個(gè)股連續(xù)兩日漲停。
一名接近智譜的人士對(duì)《每日經(jīng)濟(jì)新聞》記者表示,AutoGLM在開發(fā)、適配的過(guò)程中,優(yōu)先考慮了用戶使用手機(jī)時(shí)最頻繁的場(chǎng)景,當(dāng)前,智譜依舊在持續(xù)迭代AutoGLM現(xiàn)有功能,并將基于用戶使用高頻場(chǎng)景,不斷拓展AutoGLM的應(yīng)用邊界。
據(jù)悉,智譜已與中國(guó)三星深度合作,核心是將智譜的GLM大模型與三星的硬件技術(shù)相結(jié)合,以提升用戶的智能體驗(yàn)。其實(shí),AI在手機(jī)端的應(yīng)用探索并非僅此一例,vivo、榮耀等都有類似功能升級(jí),蘋果也計(jì)劃在未來(lái)進(jìn)一步集成ChatGPT服務(wù)到Siri中。有學(xué)者在受訪時(shí)指出,AI與手機(jī)的結(jié)合正逐漸成為行業(yè)共識(shí),這背后反映的是生成式AI在提升個(gè)性化體驗(yàn)方面的潛力。
但也有業(yè)內(nèi)人士向記者指出,當(dāng)前的“個(gè)人智能助手”與此前的語(yǔ)音交互能力并無(wú)太大差別,從長(zhǎng)期來(lái)看,服務(wù)端應(yīng)該是越弱越好,難點(diǎn)并不在于技術(shù)或商業(yè)模式,而在于用戶習(xí)慣。
推出AutoGLM 智譜加速布局個(gè)人智能助理
據(jù)智譜發(fā)布的演示Demo(樣本),基于AutoGLM,用戶向手機(jī)下達(dá)“幫我在淘寶下單淘寶里上個(gè)月買過(guò)的牙膏”的指令,手機(jī)就能自動(dòng)執(zhí)行“AI打開App—找到歷史訂單—完成訂單篩選—請(qǐng)求用戶支付—完成支付”的過(guò)程。
智譜方面表示,理論上,AutoGLM可以完成人類在電子設(shè)備上可以做的任何事,它不受限于簡(jiǎn)單的任務(wù)場(chǎng)景或API調(diào)用,也不需要用戶手動(dòng)搭建復(fù)雜繁瑣的工作流,操作邏輯與人類類似。
中信證券在研報(bào)中提到,隨著互聯(lián)網(wǎng)軟件的種類、功能越來(lái)越豐富,智能體能否熟練地掌握每個(gè)軟件的使用方法,滿足不同用戶的個(gè)性化需求,真正成為個(gè)人助手值得期待。從以聊天為主的大模型1.0時(shí)代邁入個(gè)人智能助理的大模型2.0時(shí)代,以智譜為代表的國(guó)產(chǎn)AI公司完成了從追趕者到領(lǐng)路人的身份轉(zhuǎn)換。
圖片來(lái)源:視覺中國(guó)-VCG41N1256249270
從用戶的日常操作到潛在的商業(yè)應(yīng)用,AutoGLM除了在“Phone use能力”層面的想象空間,未來(lái)的應(yīng)用場(chǎng)景會(huì)如何拓展?
一名接近智譜的人士對(duì)《每日經(jīng)濟(jì)新聞》記者表示,AutoGLM在開發(fā)、適配的過(guò)程中,優(yōu)先考慮了用戶使用手機(jī)時(shí)最頻繁的場(chǎng)景。作為一個(gè)內(nèi)測(cè)版本,AutoGLM還存在一些問題,當(dāng)前智譜依舊在持續(xù)迭代AutoGLM現(xiàn)有功能,并將基于用戶使用高頻場(chǎng)景,不斷拓展AutoGLM的應(yīng)用邊界,同時(shí)保護(hù)用戶隱私。
在技術(shù)突破層面,上述人士表示,AutoGLM基于智譜自研的“基礎(chǔ)智能體解耦合中間界面”和“自進(jìn)化在線課程強(qiáng)化學(xué)習(xí)框架”。其中的核心技術(shù)WebRL,克服了大模型智能體在任務(wù)規(guī)劃與動(dòng)作執(zhí)行中存在的能力拮抗、訓(xùn)練任務(wù)和數(shù)據(jù)稀缺、反饋信號(hào)稀少和策略分布漂移等智能體研究和應(yīng)用難題,同時(shí),借助自適應(yīng)學(xué)習(xí)策略,能夠在迭代過(guò)程中不斷改進(jìn)、持續(xù)穩(wěn)定地提高自身性能。“就像一個(gè)人,在成長(zhǎng)過(guò)程中,不斷獲取新技能。”
共識(shí)與非共識(shí):端側(cè)語(yǔ)音交互是進(jìn)步還是倒退?
大模型在端側(cè)應(yīng)用的探索正在加速。
華鑫證券在其研報(bào)中預(yù)測(cè),AI Agent的中國(guó)市場(chǎng)規(guī)模有望從2023年的554億元增長(zhǎng)至2028年的8520億元,年復(fù)合增長(zhǎng)率高達(dá)72.7%。中信建投則在研報(bào)中表示,預(yù)計(jì)在不久的將來(lái)會(huì)進(jìn)入大模型時(shí)代的2.0時(shí)代:AI Agent。
在接受《每日經(jīng)濟(jì)新聞》采訪時(shí),清華大學(xué)新聞學(xué)院和人工智能學(xué)院雙聘教授沈陽(yáng)指出,AI與手機(jī)結(jié)合正逐漸成為行業(yè)共識(shí),而這背后反映的是生成式AI在提升個(gè)性化體驗(yàn)方面的潛力。同時(shí),隨著硬件與AI服務(wù)的一體化設(shè)計(jì)日趨完善,AI正在引發(fā)人機(jī)交互的范式變革,推動(dòng)手機(jī)與用戶之間的關(guān)系從簡(jiǎn)單的操作工具轉(zhuǎn)變?yōu)閯?dòng)態(tài)互動(dòng)。沈陽(yáng)認(rèn)為,這一趨勢(shì)同樣將深刻影響國(guó)內(nèi)市場(chǎng),預(yù)計(jì)未來(lái)將有更多智能設(shè)備采用AI驅(qū)動(dòng)的交互模式,從而極大提升用戶體驗(yàn)。
在國(guó)內(nèi),除了智譜推出的AutoGLM,僅今年10月,就有數(shù)家廠商在端側(cè)有所動(dòng)作。vivo推出藍(lán)心端側(cè)大模型3B,稱服務(wù)超5億手機(jī)用戶;字節(jié)發(fā)布首款A(yù)I智能體耳機(jī)Ola Friend,與豆包集成;榮耀推出MagicOS 9.0,打造AI OS實(shí)現(xiàn)一句話充值、一句話點(diǎn)外賣等服務(wù)。
在國(guó)際市場(chǎng)上,科技巨頭們同樣動(dòng)作頻頻。蘋果在10月28日宣布推出AI功能,并計(jì)劃在未來(lái)進(jìn)一步集成ChatGPT服務(wù)到Siri中;微軟則開源了OmniParser工具,為用戶提供了如自動(dòng)訂票等便捷功能;谷歌計(jì)劃將推出Gemini 2.0,并正在開發(fā)能自動(dòng)化執(zhí)行Chrome網(wǎng)頁(yè)任務(wù)的“Project Jarvis”,該項(xiàng)目將幫助用戶執(zhí)行諸如“收集研究、購(gòu)買產(chǎn)品或預(yù)訂航班”等任務(wù)。
不過(guò),也有人對(duì)當(dāng)前AI應(yīng)用在端側(cè)類似“個(gè)人智能助手”的探索持反對(duì)態(tài)度。“在我看來(lái)端側(cè)是倒退。”一家AI應(yīng)用公司創(chuàng)始人在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示,從長(zhǎng)期來(lái)看,服務(wù)端應(yīng)該是越弱越好。他認(rèn)為,當(dāng)前無(wú)論是硬件設(shè)備、軟件應(yīng)用,還是交互方式,均未超越上一輪語(yǔ)音交互熱潮期間入局企業(yè)所進(jìn)行的探索范疇。或許在某些特定場(chǎng)景下,諸如蘋果這樣的行業(yè)巨頭,具備教育用戶或改變用戶需求的潛力,但極為困難,其難點(diǎn)并不在于技術(shù)或商業(yè)模式,而在于用戶習(xí)慣。
上述AI應(yīng)用公司創(chuàng)始人認(rèn)為,99%的用戶在表達(dá)需求時(shí),不可能用一句話闡明具體意圖,更多是以一種“擠牙膏式”的互動(dòng)一步步完成,例如,用戶需要訂一張北京飛往上海的機(jī)票,大部分用戶往往發(fā)出的第一句指令只有簡(jiǎn)單的幾個(gè)字:訂機(jī)票,余下需求則需要通過(guò)提問再完成。“第一是用戶沒這個(gè)需求 ,第二是真正用起來(lái),肯定會(huì)出現(xiàn)各種奇奇怪怪的問題,我對(duì)語(yǔ)音助手是非常悲觀的。”
他進(jìn)一步補(bǔ)充道,盡管相關(guān)技術(shù)已經(jīng)經(jīng)歷了多次迭代,相較于過(guò)去已有顯著提升,但問題的核心仍在于需求的精準(zhǔn)把握與滿足。