北京時間5月22日凌晨,在距離蘋果WWDC 2024舉行還有不到半個月之際,微軟一年一度的Build開發者大會如期而至。
在發布會上,微軟正式推出Team Copilot,將Copilot for Microsoft 365從幕后的個人AI助手,擴展為團隊助手。此外,微軟也宣布自己成為首批提供英偉達最新Blackwell AI 芯片的云服務商之一,與英偉達建立了“深厚的合作伙伴關系”。
值得注意的是,微軟Build 2024開發者大會并沒有如之前的預測一樣推出「All in AI」的Windows 12,也沒有針對性地推出消費者期待的AI產品,而是將重點回歸到與開發者建立聯系身上。
由此可見,微軟此次最具想象力的升級圍繞著AI Agent(AI個人助手)展開。“AI Agent本質上是通過對話式的UI來展現出部分人的屬性,相當于很重要的連接器。并且增加算力后,其智力可以無限擴張。”瀾碼科技創始人兼CEO周健對21世紀經濟報道記者表示,2023年是大語言模型的元年,2024年將是AI Agent的爆發年,AI Agent是大語言模型優先落地的最佳形態。
AI虛擬員工
微軟再次掀起了一場由AI驅動的“生產力革命”浪潮。
在發布會上,微軟方面宣布Microsoft Copilot Studio推出全新的Agent代理功能,讓開發者能夠根據特定任務和功能,構建主動響應數據和事件。基于新功能,開發者可通過記憶和知識了解上下文、推理操作和輸入,并基于用戶反饋進行學習,從而獨立管理復雜、長期運行的業務流程。
“用戶可在Teams、Loop、Planner等協作工具中調用Copilot。Team Copilot能夠在會議中擔任主持人,管理會議議程、跟蹤會議時間并記錄會議要點,也可以在聊天中作為協作者,提供重要信息、跟蹤行動項目并解決未決問題。它還可以擔任項目經理,幫助確保每個項目順利推進,并及時通知團隊進行輸入。這些功能將在今年晚些時候推出預覽版。”微軟CEO薩蒂亞?納德拉(Satya Nadella)說道。
此外,Copilot還能成為項目經理,通過創建和分配任務、跟蹤截止日期等方式推動團隊協作。在另一項產品更新中,微軟也表示將在今年晚些時候推出一款“AI代理”工具——類似于“AI虛擬員工”,可以執行監控電子郵件、幫助新員工入職、輸入數據等一系列瑣碎的自動化任務。微軟小心翼翼地強調,Copilot不會接管人們的工作,只會接手其中一些無聊的部分。
而在底層芯片方面,微軟宣布Azure AI Studio現已支持提供GPT-4o API 將率先使用英偉達Blackwell AI芯片。納德拉介紹,由OpeanAI開發的最新旗艦模型GPT-4o,現已在Azure AI Studio中提供,并作為API提供。該多模態模型集成了文本、圖像和音頻處理能力,帶來了全新的生成式和對話式AI體驗。
此外,由微軟開發的Phi-3列AI小型語言模型(SLM)中的一種新型多模態模型Phi-3-vision現已在Azure中推出。Phi-3模型功能強大、經濟高效,并且針對個人設備進行了優化。Phi-3-vision提供了輸入圖像和文本并接收文本響應的功能。例如,用戶可以詢問有關圖表的問題,或詢問有關特定圖像的開放式問題。
開發人員可以在Azure AI Playground中試驗這些前沿模型,并且可以開始使用Azure AI Studio中的模型進行構建和自定義。
AI Agent落地何時到來?
此前在OpenAI首屆開發者大會(OpenAI DevDay)上,OpenAI發布了AI Agent初期形態產品GPTs,并推出了相應的制作工具GPT Builder。用戶僅僅通過跟GPT Builder聊天,把想要的GPT功能描述一遍,就能生成專屬GPT。
比爾·蓋茨在一篇名為《人工智能將徹底改變你使用計算機的方式》的文章中,對AI Agent將對人類帶來的改變進行了詳細描述。
“你不必為不同的任務使用不同的應用程序。你只需用簡單通俗的語言告訴你的設備你想做什么。根據你選擇與軟件分享多少信息,基于對你的生活有豐富的了解,軟件將能夠作出個性化的回應。在不久的將來,任何上網的人都可以擁有一個由人工智能驅動的個人助理,這遠遠超出了當今的技術水平。”比爾·蓋茨說道。
由此可見,在大模型這一“巨人的肩膀之上”,AI Agent的應用之花才得以綻放。
“大語言模型有特點,它能夠與人交互,從而帶來范式的轉變。過去我們所有的系統都是機器,人需要適應機器,才會造成人作為一個數據的搬運工作去填充空間。但今天因為有了大語言模型,我們就有機會讓機器去適應人,而機器適應人就會使得大語言模型背后的這個領域模型能發揮更大的作用。”周建對記者分析稱,因為人可以在機器的引導之下完成任務,人機協同完成任務才能成為可能。
在具體的商業路徑方面,東吳證券發布研報指出,AI Agent未來有兩大落地場景方向。
首先是智能體模擬。國內情緒消費市場仍有較大想象空間,陪伴類智能體或受益于情緒消費趨勢紅利,成為LLM(大語言模型)時代重要的AI原生應用。東吳證券預計,陪伴類智能體大部分商業價值集中在供給方而非平臺,更加看好具備豐富IP儲備或者能讓用戶定制智能體的玩家。
其次則是交互智能體。“智能體之間、智能體與虛擬世界內事物之間可互動,可能涌現出超越設計者規劃的場景和能力,特別是對開放世界游戲等行業,可增強玩家沉浸感,解決開放世界內容消耗快的問題;多可信agent技術成熟后可能會孵化出新的游戲品類。”東吳證券指出。