- 微軟正在訓(xùn)練一種新的內(nèi)部 AI 語言模型,目的是與谷歌和 OpenAI 的模型競爭
- 新模型由谷歌 DeepMind 聯(lián)合創(chuàng)始人梅斯塔法?蘇萊曼領(lǐng)導(dǎo)開發(fā),預(yù)計參數(shù)規(guī)模將達(dá)到5000億
- 微軟將在未來的 Build 開發(fā)者大會上預(yù)覽新模型
站長之家(ChinaZ.com) 5月7日 消息:據(jù)外媒the Information報道,微軟正準(zhǔn)備推出一種新的、內(nèi)部 AI 語言模型。
新模型內(nèi)部代號為 MAI-1,由最近加入微軟的梅斯塔法?蘇萊曼負(fù)責(zé),他是谷歌 DeepMind 的聯(lián)合創(chuàng)始人,也是人工智能初創(chuàng)公司 Inflection 的前 CEO。兩名了解該努力的微軟員工透露說,這一模型的確切目的尚未確定,將取決于其表現(xiàn)如何。微軟可能會在本月晚些時候的 Build 開發(fā)者大會上預(yù)覽這一新模型。

圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney
據(jù)報道,MAI-1的規(guī)模將 “遠(yuǎn)遠(yuǎn)大于” 微軟此前訓(xùn)練過的較小的開源模型,這意味著成本將更高昂。微軟上個月推出了一種規(guī)模較小的人工智能模型 Phi-3-mini,目的是吸引更廣泛的客戶群體,提供成本效益較高的選擇。該公司已經(jīng)向 OpenAI 投資了數(shù)十億美元,并在其一系列辦公軟件中部署了 ChatGPT 技術(shù),使其在生成式人工智能競賽中處于領(lǐng)先地位。微軟一直在預(yù)留大量配備英偉達(dá)圖形處理單元和大量數(shù)據(jù)的服務(wù)器集群,以改進(jìn)模型。
據(jù)報道,MAI-1將擁有大約5000億參數(shù),而 OpenAI 的 GPT-4據(jù)說擁有一萬億參數(shù),Phi-3mini 的參數(shù)數(shù)量為38億。微軟于三月份任命梅斯塔法?蘇萊曼為其新成立的消費(fèi)者人工智能部門負(fù)責(zé)人,并雇傭了 Inflection 的多名員工。報道補(bǔ)充說,新模型并非來自 Inflection,盡管它可能基于該初創(chuàng)公司的訓(xùn)練數(shù)據(jù)。