由ChatGPT引發(fā)的大模型熱已一年有余,圍繞大模型創(chuàng)業(yè)的公司也如雨后春筍,技術(shù)最終要為產(chǎn)業(yè)所用才能創(chuàng)造價(jià)值,當(dāng)大模型落地千行百業(yè),能夠發(fā)揮怎樣的價(jià)值?澎湃科技走進(jìn)產(chǎn)業(yè)一線,訪談創(chuàng)始人、專(zhuān)家、投資人,調(diào)研大模型落地產(chǎn)業(yè)現(xiàn)狀。本文為c訪談。
·大模型在金融領(lǐng)域成功落地的關(guān)鍵是選擇合適的應(yīng)用場(chǎng)景,打通大模型、垂域AI “小”模型、傳統(tǒng)金融工程模型、行業(yè)內(nèi)外部知識(shí)庫(kù)和應(yīng)用系統(tǒng)。輕量化模型的出現(xiàn)降低了大模型應(yīng)用門(mén)檻,促進(jìn)了AI平權(quán)和知識(shí)平權(quán)。選擇一個(gè)適合自己的基座模型,模型不一定越大就越強(qiáng),數(shù)據(jù)是決定模型效果的關(guān)鍵因素。
恒生聚源CEO吳震操。
大模型進(jìn)入金融領(lǐng)域,能更順利找到市場(chǎng)的“阿爾法”(超額收益)投資機(jī)遇嗎?金融、產(chǎn)業(yè)數(shù)據(jù)資訊服務(wù)提供商恒生聚源CEO吳震操日前對(duì)澎湃科技(www.thepaper.cn)表示,不要認(rèn)為大模型來(lái)了就可以直接用來(lái)做投資或者交易決策,這樣是走不通的。
數(shù)據(jù)是決定大模型效果的關(guān)鍵因素
“金融行業(yè)最大愿望就是使用AI做投資決策,找出好的標(biāo)的,尋找自己的 ‘阿爾法’(超額收益)。”但吳震操表示,不要認(rèn)為大模型來(lái)了就可以直接用來(lái)做投資或者交易決策。
成立于2000年的恒生聚源是恒生電子(600570.SH)旗下子公司,擁有金融數(shù)據(jù)庫(kù)、智能投研、金融市場(chǎng)終端等產(chǎn)品線。吳震操希望未來(lái)能發(fā)揮生成式大模型更快、更強(qiáng)、更高效處理信息的優(yōu)勢(shì),與現(xiàn)有金融工程模型結(jié)合,“大模型成功落地,關(guān)鍵是打通大模型、垂域AI小模型、傳統(tǒng)金融工程模型、行業(yè)內(nèi)外部知識(shí)庫(kù)和應(yīng)用系統(tǒng)。其中,數(shù)據(jù)是決定大模型效果的關(guān)鍵因素。”
“金融數(shù)據(jù)行業(yè)靠信息、知識(shí)和生態(tài)連接賺錢(qián)。大模型出現(xiàn)后,對(duì)信息的抽取、整合以及知識(shí)的生成范式產(chǎn)生極大改變。”吳震操表示。
恒生聚源有大量的員工在負(fù)責(zé)數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)治理等技術(shù)和分析工作。在內(nèi)部,利用AI提升數(shù)據(jù)自動(dòng)化處理能力是最基本的訴求。對(duì)外銷(xiāo)售數(shù)據(jù)和知識(shí),讓客戶更精準(zhǔn)地發(fā)現(xiàn)其所需的知識(shí)和信息是首要目標(biāo)。
海外金融大模型興起后,恒生聚源在2023年中旬,基于自己訓(xùn)練的垂域金融大模型升級(jí)了新一代的智能投研平臺(tái)WarrenQ,面對(duì)金融行業(yè)的研究、投資、交易、風(fēng)控、合規(guī)場(chǎng)景,把投資研究作為大模型的第一個(gè)落地場(chǎng)景,通過(guò)WarrenQ上的Chat、ChatMiner等智能產(chǎn)品服務(wù)買(mǎi)方和賣(mài)方的研究團(tuán)隊(duì)。
金融機(jī)構(gòu)長(zhǎng)期以來(lái)積累的業(yè)務(wù)文檔、投教文案、法律法規(guī)政策文檔、研究報(bào)告、投行底稿等是機(jī)構(gòu)內(nèi)部大模型落地的理想語(yǔ)料。通過(guò)“大語(yǔ)言模型+搜索+向量數(shù)據(jù)庫(kù)”的方式將私域知識(shí)數(shù)據(jù)與大模型結(jié)合,做到私有知識(shí)庫(kù)問(wèn)答。舉個(gè)例子:在動(dòng)輒數(shù)百頁(yè)的招股書(shū)、年報(bào)、半年報(bào)中,干貨藏于大量模板套話和風(fēng)險(xiǎn)免責(zé)提示中。WarrenQ可以基于大語(yǔ)言模型+向量庫(kù)的定向文檔問(wèn)答檢索和定位溯源,從海量文檔中挖掘重點(diǎn)信息,同時(shí)利用研究員高頻重點(diǎn)關(guān)注的內(nèi)容優(yōu)化提示工程,進(jìn)一步優(yōu)化推薦“猜你想要”功能。
“大模型工具化越來(lái)越明顯。”吳震操說(shuō),從問(wèn)答工具到Copilot(輔助工具)再到智能體(Agent),大模型對(duì)于生產(chǎn)力的效率提升幅度越來(lái)越高。過(guò)去基于自然語(yǔ)言處理(NLP)等技術(shù)將研報(bào)財(cái)報(bào)分詞、語(yǔ)義分析,但效率低下,準(zhǔn)確率不高,仍然需要大量人工干預(yù)。基于知識(shí)圖譜開(kāi)展智能投研可以做到信息精準(zhǔn),缺點(diǎn)在于有多少人工就有多少智能,需要持續(xù)投入大量資源維系不停生長(zhǎng)的圖譜。大模型出現(xiàn)后,這些工作的效率和效果突飛猛進(jìn)。“以‘AI智能客服’為例,我們用這個(gè)工具準(zhǔn)確并高效地對(duì)各類(lèi)數(shù)據(jù)產(chǎn)品進(jìn)行解讀和答疑解惑,全面提升了服務(wù)效率,讓智能客服能夠精準(zhǔn)識(shí)別用戶意圖,從而實(shí)現(xiàn)金融數(shù)據(jù)的端到端實(shí)時(shí)查詢。”
關(guān)鍵是數(shù)據(jù)和Know-How
“在金融行業(yè),對(duì)大模型響應(yīng)最快的是彭博,彭博利用自己的內(nèi)部語(yǔ)料訓(xùn)練模型,在ChatGPT出現(xiàn)沒(méi)多久就推出了BloombergGPT。行業(yè)第二大廠商倫交所走了另一條路,他們和微軟合作,微軟又是OpenAI的最大股東。”
大模型迭代速度快,訓(xùn)練成本高。“上述金融機(jī)構(gòu)的大模型之路也說(shuō)明脫離場(chǎng)景講大模型,商業(yè)模式很難長(zhǎng)久。”吳震操表示,自研基座大模型本身不是一條寬廣的賽道,很多機(jī)構(gòu)一沒(méi)有充足的算力,二沒(méi)有充足的算法人才,此外缺乏足夠的領(lǐng)域數(shù)據(jù)支撐大模型業(yè)務(wù)生態(tài)。在他看來(lái),未來(lái)大模型一定要和應(yīng)用場(chǎng)景緊密結(jié)合。基座大模型的玩家有限,但把大模型應(yīng)用在垂直場(chǎng)景中,市場(chǎng)將是無(wú)限的。
進(jìn)入垂直行業(yè)解決實(shí)際問(wèn)題時(shí),必須提高大模型的可控性、可靠性、可解釋、可追溯,這是吳震操最深刻的體會(huì)。金融等強(qiáng)監(jiān)管行業(yè)對(duì)可靠性和合規(guī)性要求極高,幻覺(jué)是大模型落地面臨的挑戰(zhàn)。恒生聚源解決這個(gè)問(wèn)題的方式是把大模型當(dāng)作知識(shí)入口,相當(dāng)于搜索引擎或圖書(shū)管理員,讓大模型的生成可回溯。
“我們沒(méi)有用大模型本身來(lái)做知識(shí)生成,因?yàn)樗腔诟怕实乃惴ǎ豢赡馨俜职贉?zhǔn)確。金融行業(yè)有很多復(fù)雜金融工程模型,現(xiàn)在的大模型還無(wú)法超越當(dāng)前所學(xué)的復(fù)雜統(tǒng)計(jì)學(xué)知識(shí),生成復(fù)雜的金融工程模型,計(jì)算出一個(gè)復(fù)雜衍生品的價(jià)格波動(dòng)。以現(xiàn)在的模型情況,再給它三五年,它也做不到,海外的模型也一樣。”在吳震操看來(lái),大模型成功落地的關(guān)鍵是選擇合適的應(yīng)用場(chǎng)景,打通大模型、垂域AI“小”模型、傳統(tǒng)金融工程模型、現(xiàn)有知識(shí)庫(kù)和應(yīng)用系統(tǒng)。輕量級(jí)模型的出現(xiàn)降低了大模型應(yīng)用門(mén)檻,促進(jìn)了AI平權(quán)和知識(shí)平權(quán)。“沒(méi)有場(chǎng)景的支撐都是在浪費(fèi)資源。其次,選擇一個(gè)適合自己的基座模型,模型不一定越大就越強(qiáng)。更大模型需要更多的算力,也需要算法和技術(shù)團(tuán)隊(duì)維系。”
吳震操認(rèn)為,大模型繼續(xù)往前發(fā)展,一定會(huì)改變企業(yè)內(nèi)外部的知識(shí)交互,未來(lái)也一定會(huì)改變?nèi)藱C(jī)交互方式,Agent+知識(shí)管理是大模型賦能的最佳組合。但在金融領(lǐng)域,銀行、交易所的歷史長(zhǎng)達(dá)四百多年,從工業(yè)時(shí)代到信息時(shí)代、人工智能時(shí)代,銀行、交易所的商業(yè)模式本質(zhì)上都沒(méi)有發(fā)生任何改變。“大模型徹底顛覆金融機(jī)構(gòu)的商業(yè)模式很難發(fā)生,但當(dāng)大模型改變一些場(chǎng)景中的范式,就會(huì)帶來(lái)新的業(yè)態(tài),這一點(diǎn)在C端應(yīng)用中將更加突出。”吳震操說(shuō),這就像移動(dòng)支付實(shí)際上并沒(méi)有改變買(mǎi)賣(mài)和支付這件事的本質(zhì),但給整個(gè)市場(chǎng)帶來(lái)了新的紅利和便利,創(chuàng)造了新生態(tài)。“大模型同樣如此,大模型短期內(nèi)不會(huì)徹底改變金融機(jī)構(gòu)的商業(yè)模式。在B端應(yīng)用當(dāng)中,大模型的作用仍是降本增效;而在C端應(yīng)用中,倒是可以期待大模型帶來(lái)的生態(tài)變革。”