據(jù)央視新聞3月21日?qǐng)?bào)道,法國(guó)市場(chǎng)監(jiān)管機(jī)構(gòu)日前宣布,已向美國(guó)谷歌公司開出一張2.5億歐元(約合人民幣19.7億元)的罰單,原因是谷歌未經(jīng)同意使用法國(guó)出版商和新聞機(jī)構(gòu)的內(nèi)容訓(xùn)練旗下的聊天機(jī)器人“巴德”(其升級(jí)版名為“雙子座”),違反了歐盟知識(shí)產(chǎn)權(quán)的相關(guān)法規(guī)。谷歌就此成為了第一家因?yàn)橛?xùn)練數(shù)據(jù)而被罰款的人工智能(AI)公司。對(duì)此,學(xué)者向澎湃新聞(www.thepaper.cn)表示,谷歌遭到處罰,可能會(huì)導(dǎo)致今后出現(xiàn)越來(lái)越多類似的訴訟。
在AI技術(shù)更新迭代非常迅速的前提下,AI公司在獲取訓(xùn)練大模型的數(shù)據(jù)時(shí),如何界定獲取語(yǔ)料的合法性?專家認(rèn)為,目前數(shù)據(jù)權(quán)益保護(hù)問(wèn)題仍存在模糊地帶,但可以出臺(tái)健全市場(chǎng)和管理的方法應(yīng)對(duì)這些問(wèn)題。
谷歌被首罰成先例,不排除有更多類似訴訟
報(bào)道稱,法國(guó)監(jiān)管機(jī)構(gòu)表示,作為和解條件,谷歌對(duì)其違規(guī)行為不作辯解,并將提出有關(guān)措施,以修正產(chǎn)品和服務(wù)缺陷。谷歌對(duì)此回應(yīng)稱,希望尋求和解是因?yàn)?ldquo;該往前走了”。“我們希望專注于更大的、可持續(xù)的方法,把用戶和高質(zhì)量的內(nèi)容聯(lián)系起來(lái),并與法國(guó)出版機(jī)構(gòu)進(jìn)行建設(shè)性合作。但需要注意的是,監(jiān)管機(jī)構(gòu)沒有充分考慮我們?yōu)榻鉀Q問(wèn)題所做的努力,因?yàn)樵?lsquo;探索新路’的過(guò)程中,我們無(wú)法預(yù)測(cè)未來(lái)的風(fēng)向。”
谷歌與法國(guó)出版機(jī)構(gòu)之間的紛爭(zhēng),始于2019年。當(dāng)時(shí),法新社等多家法國(guó)媒體機(jī)構(gòu)曾向監(jiān)管機(jī)構(gòu)投訴,稱谷歌未經(jīng)允許,擅自使用這些機(jī)構(gòu)出版的網(wǎng)絡(luò)內(nèi)容。2020年,監(jiān)管機(jī)構(gòu)要求谷歌與相關(guān)出版機(jī)構(gòu)就內(nèi)容付費(fèi)進(jìn)行談判,但因?yàn)檎勁形垂O(jiān)管機(jī)構(gòu)于2021年向谷歌開出了5億歐元的罰單。2022年,谷歌與相關(guān)媒體出版商達(dá)成和解協(xié)議。
在此次的聲明中,監(jiān)管機(jī)構(gòu)稱,谷歌違反了和解協(xié)議中的幾項(xiàng)條款,包括與相關(guān)出版機(jī)構(gòu)談判、提供透明信息等。監(jiān)管機(jī)構(gòu)特別提到,谷歌利用媒體平臺(tái)和新聞機(jī)構(gòu)的數(shù)據(jù),用于訓(xùn)練2023年推出的“巴德”,但未告知相關(guān)出版機(jī)構(gòu)和監(jiān)管機(jī)構(gòu)。為此,監(jiān)管機(jī)構(gòu)表示,“對(duì)谷歌的AI服務(wù)感到擔(dān)憂”。
因?yàn)榇舜螤?zhēng)端,谷歌成為首家因?yàn)橛?xùn)練數(shù)據(jù)而被罰款的AI公司。在AI更新迭代迅速的前提下,谷歌的案例對(duì)于其他AI公司是一個(gè)警示,還是今后會(huì)有更多類似的訴訟?復(fù)旦大學(xué)計(jì)算機(jī)學(xué)院教授、復(fù)旦大學(xué)上海大數(shù)據(jù)實(shí)驗(yàn)室主任肖仰華向澎湃新聞表示,類似的訴訟可能會(huì)越來(lái)越多,這些訴訟可以被認(rèn)為是AI產(chǎn)業(yè)發(fā)展過(guò)程中的必然問(wèn)題。“AI發(fā)展核心在于數(shù)據(jù),所以AI公司非常渴求高質(zhì)量數(shù)據(jù)。在收集和使用數(shù)據(jù)的過(guò)程中,這些公司會(huì)加大數(shù)據(jù)收集力度,但會(huì)有意無(wú)意地侵犯其他主體的數(shù)據(jù)權(quán)益。另一方面,數(shù)據(jù)權(quán)益保護(hù)目前仍存在模糊地帶,包括制度供給、實(shí)踐案例等。”
從法律的角度看,上海交通大學(xué)媒體與傳播學(xué)院教授陳堂發(fā)認(rèn)為,法國(guó)監(jiān)管機(jī)構(gòu)對(duì)于谷歌的處罰具有法律依據(jù),這對(duì)其他的AI公司應(yīng)該具有警示功能,處罰行為表明AI研發(fā)及產(chǎn)品使用如果涉及大規(guī)模使用他人作品的訓(xùn)練,無(wú)疑存在法律風(fēng)險(xiǎn)。
傳統(tǒng)媒體與AI公司之間的版權(quán)之爭(zhēng)
為確保獲得使用出版機(jī)構(gòu)內(nèi)容作為數(shù)據(jù)訓(xùn)練的許可,另一家科技公司OpenAI于2023年與美聯(lián)社、德國(guó)媒體巨頭Axel Springer等達(dá)成有關(guān)協(xié)議。不過(guò),該公司沒有與《紐約時(shí)報(bào)》就有關(guān)問(wèn)題達(dá)成協(xié)議,因此在2023年12月被該報(bào)起訴。《紐約時(shí)報(bào)》稱,OpenAI和科技巨頭微軟“非法復(fù)制和使用該報(bào)獨(dú)特、有價(jià)值的作品”,要求兩家公司銷毀任何使用到該報(bào)版權(quán)材料的聊天機(jī)器人模型和訓(xùn)練數(shù)據(jù)。《紐約時(shí)報(bào)》表示曾與兩家公司接洽,提出對(duì)他們使用其版權(quán)內(nèi)容的擔(dān)憂,并希望探索“友好的解決方案”,比如提出圍繞生成式AI產(chǎn)品的商業(yè)協(xié)議等,但當(dāng)時(shí)的談判未得出解決方案。
《紐約時(shí)報(bào)》就此成為第一家就版權(quán)問(wèn)題起訴AI公司的美國(guó)媒體。起訴內(nèi)容顯示,大量由該報(bào)刊發(fā)的文章被用作訓(xùn)練聊天機(jī)器人的數(shù)據(jù),且有分析認(rèn)為,這些聊天機(jī)器人正在與傳統(tǒng)新聞出版平臺(tái)競(jìng)爭(zhēng),同樣希望成為“可靠的消息源”。此外,《紐約時(shí)報(bào)》還在訴訟中引用一些案例,表明一些在該報(bào)網(wǎng)站上需要付費(fèi)訂閱閱讀的文章,ChatGPT等聊天機(jī)器人可以免費(fèi)向用戶提供。
目前的多項(xiàng)爭(zhēng)端,多由《紐約時(shí)報(bào)》、法新社等媒體機(jī)構(gòu)提起。肖仰華分析稱,由于目前媒體界呈現(xiàn)出新媒體挑戰(zhàn)傳統(tǒng)媒體的局面,再加上生成式AI會(huì)侵犯?jìng)鹘y(tǒng)出版機(jī)構(gòu)的利益,因此傳統(tǒng)媒體在這個(gè)問(wèn)題上更敏感。
對(duì)于這項(xiàng)訴訟,OpenAI曾多次回應(yīng)稱“感到驚訝”,“因?yàn)殡p方本處于非常積極和富有成效的談判中”。OpenAI方面表示,旗下的聊天機(jī)器人ChatGPT“不會(huì)成為代替訂閱《紐約時(shí)報(bào)》的選項(xiàng)”,稱“包括《紐約時(shí)報(bào)》在內(nèi)的單一數(shù)據(jù)源,對(duì)大模型的預(yù)期學(xué)習(xí)并不重要,因?yàn)榇竽P褪菑娜祟愔R(shí)的巨大集合中學(xué)習(xí)”