亚洲一区二区三区无吗_中文视频一区_yw.尤物在线精品视频_亚洲一区中文在线

首頁 > 活動線報 > 每日福利 > 周伯文:AI安全與性能發展失衡,探索AI 45°平衡律

周伯文:AI安全與性能發展失衡,探索AI 45°平衡律

發布時間:2024-07-05 17:38:58

·當前AI模型安全能力的提升遠遠落后于性能,導致AI的發展是跛腳的,失衡的背后是兩者投入上的巨大差異。目前世界上99%的算力用于模型預訓練,只有不到1%用于對齊或更多安全優先的考量。

發展可信AGI,需要探索AI 45度平衡律,長期來看,AI要大體上沿著45度安全與性能平衡發展。短期內可以有波動,但不能長期低于45度,也不能長期高于45度,這會阻礙技術和產業應用的發展。

7月4日,2024世界人工智能大會暨人工智能全球治理高級別會議在上海開幕。上海人工智能實驗室主任、首席科學家、清華大學惠妍講席教授周伯文提出探索“人工智能45度平衡律”的技術主張。

當前,以大模型為代表的生成式人工智能快速發展,但隨著能力不斷提升,模型自身及其應用帶來一系列潛在風險顧慮。以公眾對AI風險的關注順序來看,首先是數據泄露、濫用、隱私及版權相關的內容風險,其次是惡意使用帶來的偽造虛假信息等相關的使用風險,也可能誘發偏見、歧視等相關的倫理問題,人們擔心是否會帶來就業結構和社會系統性的挑戰,甚至在科幻電影中出現了AI失控、人類喪失自主權等設定。

“這些AI風險有的已經出現,但更多是潛在的。防范這些風險需要共同努力,需要科學設計,做出更多貢獻。”周伯文表示,對AI擔憂的根本原因是目前人類的發展是失衡的。

如果橫軸代表AI技術能力的提升,那么以Transformer為代表的基礎模型架構,加以大數據、大參數量、大計算量的尺度定律,讓目前的AI能力呈指數級增長。但在縱軸的AI安全維度,紅隊測試、安全標識、安全護欄與評估測量等典型技術呈現離散化、碎片化及后置性。最近的一些對齊技術兼顧了性能和安全性,比如監督式微調SFT、人類反饋的強化學習RLHF等技術,幫助將人類的偏好傳遞給大模型,助推涌現出了ChatGPT、GPT-4等令人興奮的AI系統。

但總體上,AI模型安全能力的提升還遠遠落后于性能,這種失衡導致AI的發展是跛腳的,發展不均衡的背后是兩者投入上的巨大差異。周伯文表示,從人才密集度、商業驅動力、算力投入度方面對比來看,對安全的投入遠遠落后于AI能力提升。目前世界上99%的算力用于模型預訓練,只有不到1%用于對齊或更多安全優先的考量。

“發展可信AGI(通用人工智能),要兼顧安全與性能,因此需要找到AI安全優先但又能保證AI能力長期發展的技術體系,我們把這樣一種技術思想體系叫作AI 45度平衡律,長期來看要大體上沿著45度安全與性能平衡發展。”周伯文表示,所謂的平衡是指短期內可以有波動,但不能長期低于45度,如同我們所處的現在;也不能長期高于45度,這會阻礙技術和產業應用的發展。

45度平衡的技術思想體系要求強技術驅動、全流程優化、多主體參與以及敏捷治理。周伯文表示,實現AI 45度平衡律有很多技術路徑,上海人工智能實驗室最近探索以因果為核心的路徑,它被稱為可信AGI的“因果之梯”,以此致敬因果推理領域的先驅——圖靈獎得主Judea Pearl。

可信AGI的“因果之梯”將可信AGI的發展分為三個遞進階段:泛對齊、可干預、能反思。

“泛對齊”主要包含當前最前沿的人類偏好對齊技術。但需要注意的是,這些安全對齊技術僅依賴統計相關性而忽視真正的因果關系,可能導致錯誤推理和潛在危險。一個典型的例子是巴甫洛夫的狗:當狗僅僅基于鈴聲和食物的統計相關性形成條件反射時,它可能在任何聽到鈴聲的場合都觸發行為分泌唾液。

“可干預”主要包含通過對AI系統進行干預,探究其因果機制的安全技術。“能反思”則要求AI系統不僅追求高效執行任務,還能審視自身行為的影響和潛在風險,從而在追求性能的同時,確保安全和道德邊界不被突破。這個階段的技術包括基于價值的訓練、因果可解釋性、反事實推理等。

周伯文表示,目前AI安全和性能技術發展主要停留第一階段,部分在嘗試第二階段,但要真正實現AI的安全與性能平衡,必須完善第二階段并勇于攀登第三階段。沿著可信AGI的“因果之梯”拾級而上,相信可以構建真正可信AGI,實現人工智能的安全與卓越性能的完美平衡。“最終,像安全可控的核聚變技術為全人類帶來清潔、豐富的能源一樣,我們希望通過深入理解AI的內在機理和因果過程,從而安全且有效地開發和使用這項革命性技術。”

每日福利更多>>

奇駿榮耀定價11.98萬元起,日產是在打價格戰嗎? 上汽奧迪A5L預售價公布 價格誘人配置還超出想象? 中興1949:重載不降速,效率與實力的全能擔當 智駕新標桿,小鵬G7震撼上市,重塑20萬級SUV市場格局! 1-5月全球電池累計裝車量:寧德時代152.7GWh、比亞迪70GWh…… 比亞迪純電重卡Q3在上海虹口北外灘開啟試運營 小米“車規級紙巾盒”可能是一片藍海 比亞迪海豹06DM-i旅行版上市,10.98萬起開創全民新旅時代 One UI 8動畫文件揭秘三星三折疊手機:采用雙內折設計 限時40.39萬元起 Jeep牧馬人/角斗士侏羅紀世界探索版上市 6月主流車企銷量:比亞迪一哥,零跑新勢力一哥,小米或未來一哥! 價格有驚喜還增配了 2026款起亞賽圖斯限時售7.79萬起 小米YU7爆賣,特斯拉漲價? 啟辰放大招!2026款啟辰大V 6.98萬起煥新,好省好開好看全拿下 樂道L90內飾圖解讀,內飾溫馨三排配置有驚喜! 方程豹6月銷量近1.9萬輛創新高:鈦3破萬重塑純電格局,豹5蟬聯硬派越野冠軍 刪掉了“星紀”二字,恢復“魅族科技”,微信公眾號悄然改名 理想架構再度調整,汽車、AI協同共進 新車市場探訪,沒有了高息高返,油車也得賣啊 全新寶馬M3純電動版內飾諜照曝光!于27年3月份正式推出 歐拉好貓2025款上市!設計煥新+配置下放 家用B級車該怎么選?蒙迪歐VS雅閣,看完對比你就明白了! 如何將一加手機備份到電腦?2024年5種安全方法 5月各省汽車銷冠品牌榜:比亞迪徹底封神 霸榜27省 扎克伯格為AI斥重金“招兵買馬”,消息稱Meta再挖角OpenAI四名研究員 硅谷華人AI大牛被瘋狂挖角!小扎打包帶走4名OpenAI研究員 微軟稱Win11電腦比Win10電腦快2.3倍引爭議:實為新舊硬件對比 韋爾股份更名豪威集團后,向香港聯交所遞交上市申請 小米人車家全生態發布會召開:首款SUV小米YU7等新品重磅發布 三星S26 Ultra確認取消插筆槽!S-Pen需單獨攜帶?
主站蜘蛛池模板: 新泰市| 奉贤区| 教育| 通城县| 彰武县| 鄄城县| 呼图壁县| 兰州市| 襄樊市| 凌源市| 茌平县| 壶关县| 兴海县| 临猗县| 兴仁县| 文安县| 阳江市| 合水县| 佛冈县| 花垣县| 武清区| 洪湖市| 沾益县| 岗巴县| 乌兰察布市| 金塔县| 七台河市| 青神县| 大足县| 尼玛县| 宁强县| 浪卡子县| 昌平区| 宽城| 九龙坡区| 始兴县| 安乡县| 滦平县| 弥渡县| 凤凰县| 曲麻莱县|