近日,Open AI正式推出最新旗艦?zāi)P虶PT-4o(o代表Omni,全能)。
GPT-4o作為最新旗艦?zāi)P?,可以?shí)時(shí)對音頻、視覺、文本進(jìn)行推理,支持文本、音頻和圖像的任意組合輸入,并能生成文本、音頻和圖像的任意組合輸出。其在多語言、音頻和視覺能力方面相較前代也有所提升。
在發(fā)布會(huì)現(xiàn)場,GPT-4o講述了一個(gè)關(guān)于機(jī)器人與愛情的故事,在這個(gè)過程中,GPT-4o不斷挑戰(zhàn)用更加情緒化、戲劇化的方式進(jìn)行朗讀,用戶可以明顯感受到其中情感與音色的變化。
Sam Altman在社交媒體上
留下一句“her”。
科幻電影《Her》似乎已走進(jìn)現(xiàn)實(shí)。
站在“Her”來臨的當(dāng)下,
AI底層技術(shù)有哪些趨勢或方向?
邱鋰力
微軟亞洲研究院副院長
微軟亞洲研究院(上海)負(fù)責(zé)人
最關(guān)鍵的不再是掌握復(fù)雜的技術(shù)細(xì)節(jié),而是依賴于你的想象力和目標(biāo)設(shè)定。大模型可以幫助我們處理許多具體的技術(shù)問題。
@上??萍?/p>
站在這個(gè)時(shí)間節(jié)點(diǎn),您覺得AI底層技術(shù)有哪些趨勢或方向?
@邱鋰力
AI的應(yīng)用已經(jīng)涵蓋了生活的各個(gè)方面,我們特別關(guān)注以下三個(gè)方向:
一是效率。目前AI的訓(xùn)練和使用成本仍然較高,我們正在不同層面上努力提升效率,包括從引擎到平臺,再到實(shí)際應(yīng)用的各個(gè)環(huán)節(jié)。
二是多模態(tài)。AI技術(shù)已經(jīng)能處理不同的數(shù)據(jù)模態(tài),如文本、圖片、視頻和語音。然而,要支持醫(yī)療等特定應(yīng)用,我們還需處理更多如生理信號、無線感知技術(shù)(包括WiFi、毫米波和激光雷達(dá))等不同于傳統(tǒng)模態(tài)的數(shù)據(jù)。我們致力于更好地支持這些新模態(tài),并探索如何將它們與傳統(tǒng)模態(tài)結(jié)合,這一領(lǐng)域有巨大的發(fā)展?jié)摿Α?/p>
三是應(yīng)用。盡管大模型的能力非常強(qiáng)大,但要將它們應(yīng)用到具體行業(yè)中,仍面臨許多新的問題和挑戰(zhàn)。在解決這些問題的同時(shí),也帶來了很多機(jī)遇。
@上??萍?/p>
在未來的人才引進(jìn)策略上,微軟亞洲研究院(上海)有哪些計(jì)劃?目前團(tuán)隊(duì)的年齡結(jié)構(gòu)是怎樣的?
@邱鋰力
我們的團(tuán)隊(duì)非常年輕,我們在持續(xù)招聘全職研究員和實(shí)習(xí)生。上海是一個(gè)國際化的平臺,比較容易吸引來自全球各地的人才。最近,我們還吸引了兩位跨學(xué)科的人才。一位是醫(yī)學(xué)專業(yè)畢業(yè)的創(chuàng)業(yè)者,他曾開發(fā)過應(yīng)用于醫(yī)療領(lǐng)域的AI技術(shù),所以在我們討論醫(yī)療項(xiàng)目時(shí)貢獻(xiàn)了很多寶貴意見,碰撞出很多火花,我們在醫(yī)療方面也有很多新的研究方向正在推動(dòng)中。另一位是神經(jīng)科學(xué)家,他有理論物理的背景,對AI非常熟悉。我們認(rèn)為,許多前沿技術(shù)的發(fā)展需要跨學(xué)科和跨領(lǐng)域的合作。