10月12日消息,據(jù)金融時報報道,埃隆·馬斯克的 xAI 正在努力構建所謂的世界模型,與 Meta 和谷歌等競爭對手一起競相開發(fā)能夠?qū)Ш胶驮O計物理環(huán)境的人工智能系統(tǒng)。
這家總部位于舊金山的初創(chuàng)公司今年夏天聘請了英偉達的專家來研發(fā)這些下一代人工智能模型,這些模型通過機器人的視頻和數(shù)據(jù)進行訓練,以了解現(xiàn)實世界。
世界模型可以使人工智能的能力超越以文本訓練的大型語言模型,而大型語言模型是 ChatGPT 和 xAI 的 Grok 等流行人工智能工具的基礎。
兩位知情人士表示,該公司正在構建世界模型,旨在將其應用于游戲領域,從而生成交互式 3D 環(huán)境。其中一位知情人士補充說,這些模型還可以應用于機器人的 AI 系統(tǒng)。
xAI聘請了兩位來自 Nvidia 的 AI 研究員 Zeeshan Patel 和 Ethan He,他們在世界模型方面擁有豐富的經(jīng)驗。Nvidia 憑借其 Omniverse 平臺(該平臺可以創(chuàng)建和運行模擬)在開發(fā)這項技術方面處于領先地位。
一些科技集團對世界模型抱有遠大的期望,認為它能夠?qū)⑷斯ぶ悄艿膽猛卣沟杰浖陀嬎銠C以外的領域,例如人形機器人等實體產(chǎn)品。
上個月,英偉達向英國《金融時報》表示,世界模型的潛在市場規(guī)模可能幾乎相當于目前的全球經(jīng)濟規(guī)模。
馬斯克在 X 的一篇文章中表示,xAI 將在明年年底之前發(fā)布一款“出色的人工智能游戲”,這證實了這位億萬富翁去年設定的目標。
周二,xAI 推出了其最新的圖像和視頻生成模型,據(jù)稱該模型進行了“大規(guī)模升級”并且可以免費使用。
當前的視頻生成模型,例如 OpenAI 的 Sora,通過預測從訓練數(shù)據(jù)中學習到的模式來為視頻生成圖像幀。
世界模型將是一個巨大的進步,因為它們將對物理學以及物體如何在不同環(huán)境中實時相互作用有因果理解。
該公司正在招聘圖像和視頻生成方面的技術人員加入其“全能團隊”,該團隊“創(chuàng)造超越文本的神奇人工智能體驗,實現(xiàn)對圖像、視頻和音頻等各種模式內(nèi)容的理解和生成”。
這些職位的薪資從18萬美元到44萬美元不等。該公司還招聘一名“視頻游戲?qū)?rdquo;,負責培訓Grok制作視頻游戲,并讓“用戶探索人工智能輔助游戲設計”,時薪為45美元到100美元。
馬斯克效仿了谷歌和 Meta 等其他領先的人工智能實驗室,他們也在研究這些系統(tǒng)。
然而,世界模型仍然是一個巨大的技術挑戰(zhàn)。事實證明,尋找足夠的數(shù)據(jù)來模擬現(xiàn)實世界并訓練這些模型既困難又昂貴。
開發(fā)視頻游戲《博德之門 3》的Larian Studios的發(fā)行主管邁克爾·杜斯 (Michael Douse)本周在 X 上表示,人工智能無法解決游戲行業(yè)的“大問題”,即“領導力和愿景”。
他補充說,該行業(yè)不需要“更多數(shù)學制作、心理訓練的游戲循環(huán),而是需要更多人們參與或想要參與的世界的表達”。
xAI、Patel 和他沒有回應置評請求。