一周縱覽
本周大模型頻頻出新。馬斯克官宣Grok-1.5大模型,推理能力大升級。人工智能公司Databricks宣布開源通用混合專家(MoE)大語言模型DBRX,最強開源大模型就此易主。以色列AI初創公司AI21 Labs推出SSM-Transformer模型Jamba,據稱是世界上首個基于Mamba的量產級模型。
更多消息依然來自OpenAI。OpenAI本周新發布了語音生成模型Voice Engine,以及藝術家的Sora最新作品實例。圍繞GPT商店困境,本周OpenAI宣布,將挑選少量美國開發者測試GPT商店收入分成模式。周末又有消息稱,微軟OpenAI將斥資千億美元打造“Stargate”先進人工智能超級計算機。
其他科技巨頭動作不斷。亞馬遜宣布將向Anthropic追加投資 27.5 億美元,以完成去年承諾的投資協議。而包括高通、谷歌和英特爾在內的科技公司聯盟,則準備從軟件入手,與英偉達芯片“脫鉤”。
Key Points
- OpenAI發布語音模型Voice Engine
- 馬斯克官宣Grok-1.5
- DBRX成當前最強大開源模型
- AI21 Labs首推基于Mamba架構的量產級模型
- 微軟和OpenAI制定千億美金AI超算計劃
- OpenAI與開發者聯合測試GPT創收
- OpenAI發布Sora首批藝術家作品實例
- 高通、谷歌、英特爾等聯合開發AI軟件
- Transformer作者公開承認參與保密項目Q*
- 百度或為國行iPhone16提供AI功能
- 字節跳動推出AI角色互動App“話爐”
- 亞馬遜追投Anthropic 27.5億美元
- AI視頻生成創企HeyGen正進行6000萬美元融資
- 90后天才少年稚暉君再獲融資
- Heygen發布Avatar in Motion 1.0
- 騰訊開源“照片說話”視頻生成框架
- 谷歌推出AI圖像插入新“神器”
大模型第一線
OpenAI發布語音模型Voice Engine
據界面新聞,3月30日,OpenAI在官網上公開了其最新的研究成果——“Voice Engine”。這項技術可通過簡短的15秒音頻樣本和文本輸入,生成與原始說話者極為相似的自然語音。
公告中,OpenAI給出了Voice Engine的一些早期應用場景。如通過自然、富有情感的聲音輔助兒童閱讀、翻譯視頻和播客等內容、改善偏遠地區的社區服務、幫助患有突發性或退化性言語病癥的患者恢復聲音等。
馬斯克官宣Grok-1.5
當地時間 3 月 28 日,馬斯克旗下的人工智能公司 xAI 正式推出了 Gork 大模型的最新版本 Grok-1.5。相比一周前開源的Grok-1.0,Grok-1.5上下文長度飆升,從8192增長到128k,和GPT-4齊平。二是推理性能大幅提升,數學能力直接漲點50%之多、HumanEval數據集上得分超過GPT-4。Grok-1.5預計將在未來幾天向早期測試者和 X 平臺的現有用戶開放。
圖源:X
DBRX成當前最強大開源模型
當地時間3月27日,AI初創公司Databricks宣布旗下Mosaic Research團隊開發的通用大語言模型DBRX將開源。DBRX的表現都優于現有的一切開源模型。根據DBRX在MMLU、HumanEval和 GSM8K公布的測試數據顯示,DBRX不僅性能超過了LLaMA2-70B和馬斯克最近開源的Grok-1,推理效率比LLaMA2-70B快2倍,總參數卻只有Grok-1的三分之一,是一款功能強算力消耗低的大模型。
AI21 Labs首推基于Mamba架構的量產級模型
智東西3月29日消息,以色列AI初創公司AI21 Labs昨日在官網推出SSM-Transformer模型Jamba,據稱是世界上第一個基于Mamba的量產級模型。通過利用傳統Transformer架構的元素增強Mamba結構化狀態空間模型,Jamba彌補了純SSM模型的固有局限性。它提供了256k上下文窗口,在吞吐量和效率方面展現了顯著的進步。
大事件
微軟和OpenAI制定千億美金AI超算計劃
3月30日消息,據The Information獨家報道,消息人士稱,微軟和OpenAI的高管們在為一個可能花費高達1000億美元的數據中心項目制定計劃。該項目將包含1臺擁有數百萬個專用服務器芯片的AI超級計算機Stargate,為OpenAI的AI提供動力。項目成本是當今一些最大的數據中心的100倍,微軟可能會負責為該項目提供資金。高管們已經討論了最快在2028年啟動Stargate,并將其擴建至2030年。
OpenAI與開發者聯合測試GPT創收
3月28日消息,根據X平臺,OpenAI宣布其正與一小部分美國開發者合作,測試基于使用量的GPT收費。OpenAI表示:“我們的目標是創建一個充滿活力的生態系統,讓開發者因其創造力和影響力而獲得獎勵,我們期待與建設者合作,找到實現這一目標的最佳方法。”
圖源:X
OpenAI發布Sora首批藝術家作品實例
3月26日凌晨,OpenAI 發布七個最新 Sora 作品實例,意在展示藝術家、設計師、創意工作者和電影人等業內人士對于 Sora 融入自身工作與業務的看法。
高通、谷歌、英特爾等聯合開發AI軟件
3月26日,由高通、谷歌、英特爾等科技巨頭聯合參與的UXL基金會宣布,將啟動一項開源軟件開發計劃,旨在為多種AI加速器芯片提供跨平臺支持。該項目旨在實現計算機代碼在不同芯片和硬件平臺上的無縫運行。高通AI與機器學習主管Vinesh Sukumar表示,此舉將幫助開發者從英偉達平臺順利遷移。
Transformer作者公開承認參與保密項目Q*
據Wired雜志,Transformer作者現身英偉達GTC大會后,接受Wired雜志采訪,揭示了許多鮮為人知的研發細節。其中一位作者Lukasz Kaiser公開承認自己參與了OpenAI的一項高度保密項目——Q,引發了廣泛關注。當記者試圖進一步探究Q項目時,OpenAI的公關人員迅速介入,阻止了Kaiser的發言。
百度或為國行iPhone16提供AI功能
3月25日,一位百度內部人士向時代周報記者透露,百度將為蘋果今年即將發布的iPhone16、Mac系統和ios18提供AI功能。但《中國日報》后援引接近蘋果公司的知情人士稱,到目前為止,蘋果尚未與百度就AI合作達成協議。
字節跳動推出AI角色互動App“話爐”
據新浪科技,3月25日下午消息,近日,字節跳動推出AI角色互動App“話爐”。據了解,“話爐”由字節跳動的Flow部門打造。而Flow部門隸屬于字節跳動的產品研發與工程部(內部簡稱“PDI”),目前下設四大業務線,包括AI教育、國際化、社區和豆包,“話爐”則屬于社區業務線旗下。
融資動態
亞馬遜追投Anthropic 27.5億美元
當地時間 3 月 27 日,亞馬遜宣布將向 AI 公司 Anthropic 追加投資 27.5 億美元(約 198.8 億人民幣),以完成去年承諾的投資協議,并將擴大兩家公司之間的合作關系。追加投資之后,亞馬遜對 Anthropic 的總投資額將達到 40 億美元,這也是亞馬遜 30 年歷史上最大的一筆外部投資。通過投資,亞馬遜將獲取 Anthropic 的少數股份,但不會在 Anthropic 的董事會占有席位。
AI視頻生成創企HeyGen正進行6000萬美元融資
當地時間3月23日,據The Information援引知情人士消息,HeyGen目前正在進行一輪 6000 萬美元的融資,完成融資后總估值將達到 4.4 億美元,是四個月前估值的六倍,本輪融資由Benchmark領投,它是 Snap 和 Uber 的早期投資者之一。HeyGen 的上一輪融資則是去年 11 月的560萬美元融資,由知名投資人Sarah Guo創立的Conviction Partners領投。
90后天才少年稚暉君再獲融資
據投資界,智元機器人關聯公司上海智元新創技術有限公司新增股東紅杉中國、M31資本、上汽投資。此前消息流出,智元機器人投前估值達70億。公司背后的90后創始人曾是華為“天才少年”稚暉君彭志輝,同時在B站坐擁250萬粉絲。公開資料顯示,上海智元新創技術有限公司法定代表人為舒遠春,使命為“以智能機器創造無限生產力”,致力于以Al+機器人的融合創新,打造世界級領先的具身智能機器人產品及應用生態。
新玩意
Heygen發布Avatar in Motion 1.0
Heygen近期發布了其Avatar in Motion1.0新功能,這一技術革新在虛擬角色動作捕捉和聲音克隆方面取得了重大突破。該功能可以精確地保持口型同步,并克隆用戶的語音語調,甚至能保留背景聲,使得虛擬角色的語音表達更為生動真實。