蘋果全球開發者大會WWDC將由6月10日美東時間下午1點(北京時間11日凌晨1點)的主旨演講拉開序幕。外界普遍將其定義為蘋果把AI功能全面整合進各大硬件操作系統的關鍵時刻。
WWDC歷來是以軟件為中心的發布活動,去年推出Vision Pro蘋果首款混合現實頭顯設備而成為例外。分析稱,今年蘋果或專注于宣傳軟件功能的AI更新來追趕競爭對手,例如將人工智能添加到表情符號emoji、照片編輯、短信和電子郵件中,而不會宣布任何真正具有革命性的東西。
預計下周將發布新一代iOS 18手機操作系統和macOS 15電腦操作系統的更新,智能手表、iPad平板電腦和Vision Pro混合現實頭顯的操作系統應該也會融入更多AI功能,例如可以在蘋果手表使用虛擬助手Siri在其他設備上播放音樂等。
還有分析稱,iPad和iPhone上的眼動追蹤以及VisionOS上的實時字幕功能已經官宣,下周可能聽到更多有關這些與無障礙功能相關的更新以及確切發布時間。
AI助力“更智能的Siri”,但更復雜功能可能明年才推出
在最有可能基于人工智能而大力增強的功能中,首當其沖的便是蘋果虛擬助手Siri。
據信蘋果正在全面重建一個能夠由大語言模型提供支持的Siri,這些大語言模型可能會由蘋果自研的端側AI Ajax LLM和微軟支持的OpenAI ChatGPT技術相結合而成。
但利用人工智能對Siri改頭換面的任務規模巨大,可能要到明年某個時候才能全面推出,下周在iOS 18最新手機操作系統中可能僅會發布一個初始版本,擁有一些基本AI功能。
例如,Siri處理多步驟任務的能力或推遲到明年發布,今年9月iOS 18中的新版Siri可能每次只能處理一條語音指令。蘋果最終的計劃是令Siri允許用戶一次性輸入多個指令,例如利用AI總結會議錄音、或智能剪裁修飾完照片后,再馬上用郵件發送給相關人士。
重建后,除了完成多步驟任務的能力,AI助力下“更智能的Siri”預計還將實現以下功能:
更智能地理解用戶需求,利用AI分析用戶在設備上的操作,并自動啟用由Siri控制的功能;
用語音回答用戶提問,而不是顯示網絡鏈接,而且聲音聽上去更自然;
為短信提供基于端側大語言模型生成的自動回復建議,并用AI生成自定義表情符號emoji;
了解用戶的聯系人、約會日程、方位等,以便作出更智能的響應;
能將語音備忘錄實時轉寫成文字版,能夠總結通知、短信、網頁、長篇文檔等所有內容;
能夠與其他應用程序交互,例如用戶可以要求“將這篇筆記Note移動到我的新主文件夾”,或者打開Apple News應用中的特定出版物;
通過語音控制應用程序內的單個功能,例如可以要求Siri執行刪除電子郵件、通過電子郵件發送網絡連接,或智能編輯照片等高級操作;
使用人工智能自動確定某項功能在端側AI還是云端服務器處理,更好地保護用戶數據隱私。
有分析稱,蘋果將評級新版Siri正式進入AI時代。