“十年前,全世界最好的人工智能系統(tǒng)都無法以人類水平對(duì)圖像中的物體進(jìn)行分類。人工智能在語言理解方面困難重重,更無法破解數(shù)學(xué)領(lǐng)域。如今,人工智能系統(tǒng)在標(biāo)準(zhǔn)基準(zhǔn)上的表現(xiàn)已廣泛超過人類。”
今年,斯坦福 HAI 研究所的人工智能指數(shù)報(bào)告如期而至。據(jù) AI Index 聯(lián)合總監(jiān) Ray Perrault 介紹,2023 年人工智能領(lǐng)域進(jìn)展迅猛,科技公司正在競(jìng)相構(gòu)建相關(guān)產(chǎn)品,GPT-4、Gemini 和 Claude 3 等先進(jìn)工具帶來令人印象深刻的多模態(tài)功能,正越來越多地被公眾使用;但當(dāng)前的人工智能技術(shù)仍存在重大問題,如無法可靠處理事實(shí)、進(jìn)行復(fù)雜推理以及結(jié)論解釋。
在長達(dá) 393 頁的《2024 人工智能指數(shù)報(bào)告》中,斯坦福 HAI 研究所不僅更廣泛地涵蓋基本趨勢(shì),如人工智能的技術(shù)進(jìn)步、公眾對(duì)技術(shù)的看法以及圍繞其發(fā)展的地緣政治動(dòng)態(tài),還詳細(xì)分析了比以往更多的原始數(shù)據(jù)。
下面 15 張圖表反映了整個(gè) AI 領(lǐng)域 2023 年的狀況和 2024 年的態(tài)勢(shì)。
生成式 AI 投資激增
雖然去年人工智能的私人投資下降、全球?qū)θ斯ぶ悄艿目傮w投資連續(xù)第二年下降,但生成式 AI 領(lǐng)域的私人投資激增,比 2022 年增長了近八倍,達(dá)到 252 億美元。并且,大部分對(duì)生成式 AI 的私人投資都發(fā)生在美國。
報(bào)告的主編 Nestor Maslej 表示,“去年的資本形勢(shì)代表了人們對(duì)生成式 AI 的反應(yīng),無論是在政策和公眾輿論上,還是行業(yè)投資中。”
谷歌在基礎(chǔ)模型競(jìng)賽中占據(jù)主導(dǎo)地位
2023 年,工業(yè)界產(chǎn)生了 51 個(gè)著名的機(jī)器學(xué)習(xí)模型,而學(xué)術(shù)界僅貢獻(xiàn)了 15 個(gè)。其中,谷歌發(fā)布的基礎(chǔ)模型數(shù)量最多。
科技公司發(fā)布基礎(chǔ)模型既是為了推動(dòng)先進(jìn)技術(shù)向前發(fā)展,也是為了給開發(fā)人員提供構(gòu)建產(chǎn)品和服務(wù)的基礎(chǔ)。自 2019 年以來,谷歌一直在發(fā)布基礎(chǔ)模型方面處于領(lǐng)先地位,OpenAI 次之。
封閉模型優(yōu)于開源模型
目前,人工智能領(lǐng)域的熱門爭(zhēng)論之一是基礎(chǔ)模型應(yīng)該是開源的還是封閉的,一些人認(rèn)為開源模型是危險(xiǎn)的,而另一些人表示是開源模型推動(dòng)了創(chuàng)新。該報(bào)告并沒有對(duì)其進(jìn)行權(quán)衡,而是著眼于各自的發(fā)布趨勢(shì)和基準(zhǔn)表現(xiàn)。
2023 年全球發(fā)布的新大型語言模型數(shù)量比上一年翻了一番,在發(fā)布的 149 個(gè)基礎(chǔ)模型中,98 個(gè)是開源的,23 個(gè)通過 API 提供部分訪問,28 個(gè)是封閉的。雖然三分之二是開源的,但性能最高的模型來自擁有封閉系統(tǒng)的行業(yè)參與者。在許多常用的基準(zhǔn)測(cè)試中,封閉模型的表現(xiàn)優(yōu)于開源模型。