據(jù)介紹,該模型以前所未有的精確度預(yù)測(cè)了蛋白質(zhì)與其他生物分子的結(jié)構(gòu)和相互作用。該研究團(tuán)隊(duì)表示,阿爾法折疊3將有助于改變?nèi)藗儗?duì)生物世界和藥物發(fā)現(xiàn)的理解,進(jìn)而開(kāi)啟人工智能細(xì)胞生物學(xué)的新時(shí)代。
(來(lái)源/《自然》)
繪制蛋白質(zhì)結(jié)構(gòu)約600萬(wàn)種
早在2018年的CASP13(蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)評(píng)估)競(jìng)賽中,阿爾法折疊1就引起了廣泛關(guān)注,因?yàn)樗诘鞍踪|(zhì)結(jié)構(gòu)預(yù)測(cè)方面表現(xiàn)出色,當(dāng)時(shí)阿爾法折疊1的表現(xiàn)遠(yuǎn)超其他參賽團(tuán)隊(duì)。
2020年,Deep Mind發(fā)布了阿爾法折疊2。在那年的CASP14競(jìng)賽中,阿爾法折疊2展示了前所未有的準(zhǔn)確率,在預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)方面取得了突破性進(jìn)展。據(jù)當(dāng)時(shí)的評(píng)估結(jié)果報(bào)告,阿爾法折疊2的平均誤差大概只有一個(gè)原子的直徑(0.1納米),其預(yù)測(cè)準(zhǔn)確度與傳統(tǒng)實(shí)驗(yàn)方法相當(dāng),當(dāng)時(shí)在科學(xué)界引起了巨大反響。Deep Mind隨后也與科學(xué)界合作,通過(guò)使用阿爾法折疊2解析了多種生物學(xué)上重要的蛋白質(zhì)結(jié)構(gòu),加速了生物醫(yī)學(xué)研究的進(jìn)程。
據(jù)了解,2021年,Deep Mind與歐洲生物信息學(xué)研究所合作,公開(kāi)了阿爾法折疊DB,這是一個(gè)包含數(shù)以萬(wàn)計(jì)的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的數(shù)據(jù)庫(kù)。這些數(shù)據(jù)的公開(kāi)讓全球的科研人員都能夠免費(fèi)訪問(wèn)這些蛋白質(zhì)結(jié)構(gòu)信息。在2022年,阿爾法折疊2也進(jìn)行了全面升級(jí)。
據(jù)Deep Mind此前表示,在短短3年里,阿爾法折疊2已被180萬(wàn)研究人員使用,繪制出約600萬(wàn)種不同的蛋白質(zhì)結(jié)構(gòu)。但這些圖是單個(gè)靜態(tài)蛋白質(zhì)的圖像,不包含細(xì)胞內(nèi)部發(fā)生的化學(xué)通訊。“生物學(xué)是一個(gè)動(dòng)態(tài)系統(tǒng),”Deep Mind首席執(zhí)行官戴密斯·哈薩比斯解釋,“你必須了解細(xì)胞中不同分子之間的相互作用如何產(chǎn)生生物學(xué)特性。”
AI助力治療疾病、藥物研發(fā)
6年后的今天,谷歌Deep Mind推出了最新的阿爾法折疊3,旨在幫助科學(xué)家更有效地設(shè)計(jì)藥物和針對(duì)疾病。Isomorphic Labs首席人工智能官馬克斯·賈德伯格表示,阿爾法折疊3的功能為研究人員快速識(shí)別潛在的新藥物分子提供了新的機(jī)會(huì)。據(jù)了解,此前Isomorphic Labs已與制藥公司禮來(lái)和諾華建立了合作伙伴關(guān)系。
馬克斯·賈德伯格說(shuō):“這使得我們的科學(xué)家、藥物設(shè)計(jì)師能夠在原子水平上創(chuàng)建和測(cè)試假設(shè),然后在幾秒鐘內(nèi)使用阿爾法折疊3生成高度準(zhǔn)確的結(jié)構(gòu)預(yù)測(cè)。相比之下,傳統(tǒng)實(shí)驗(yàn)方法可能需要數(shù)月甚至數(shù)年的時(shí)間。”
據(jù)該團(tuán)隊(duì)稱,與許多現(xiàn)有的專用工具(包括基于其前身的工具)相比,阿爾法折疊3的預(yù)測(cè)準(zhǔn)確性“顯著提高”。與現(xiàn)有的預(yù)測(cè)方法相比,這個(gè)版本的阿爾法折疊在預(yù)測(cè)蛋白質(zhì)與其他分子之間的結(jié)構(gòu)和相互作用方面至少提高了50%。在一些關(guān)鍵的研究領(lǐng)域,其預(yù)測(cè)準(zhǔn)確度甚至提高了一倍,達(dá)到了100%的改進(jìn)。阿爾法折疊3能夠精確預(yù)測(cè)蛋白質(zhì)、DNA、RNA和配體的結(jié)構(gòu)及它們之間的相互作用。這一進(jìn)展為治療癌癥、自身免疫性病癥等疾病提供了希望。
Deep Mind的阿爾法折疊團(tuán)隊(duì)負(fù)責(zé)人約翰·詹珀表示:“我們看到了令人難以置信的進(jìn)步,我們認(rèn)為這些進(jìn)步將解鎖許多新科學(xué)。”他指出該技術(shù)在提高植物生物學(xué)知識(shí)以及糧食安全方面同樣具有潛力。“我們已經(jīng)開(kāi)始看到生物學(xué)家和早期測(cè)試人員使用它來(lái)了解細(xì)胞如何工作,并開(kāi)始思考它可能會(huì)出現(xiàn)什么樣的誤差。”他說(shuō)。
記者梳理其論文概述后發(fā)現(xiàn),最新的阿爾法折疊3有著幾項(xiàng)重大的更新。
最新版本的阿爾法折疊將更少依賴于與目標(biāo)序列相關(guān)的蛋白質(zhì)信息。同時(shí)阿爾法折疊3還使用一種稱為擴(kuò)散模型的機(jī)器學(xué)習(xí)網(wǎng)絡(luò),該網(wǎng)絡(luò)可以被圖像生成式人工智能使用。約翰·詹珀表示:“這是一個(gè)相當(dāng)大的變化。”
同時(shí),研究人員表示,阿爾法折疊3在預(yù)測(cè)蛋白質(zhì)及其結(jié)構(gòu)方面遠(yuǎn)遠(yuǎn)優(yōu)于現(xiàn)有的軟件工具。例如,對(duì)尋找新藥感興趣的科學(xué)家通常使用一款名為docking的軟件來(lái)模擬化學(xué)物質(zhì)與蛋白質(zhì)的結(jié)合程度,而阿爾法折疊3被證明優(yōu)于這個(gè)軟件,同時(shí)也被證明優(yōu)于另一個(gè)名為RoseTTAFoldAll-Atom4的基于人工智能的工具。
約翰·詹珀和他的同事在稍早的報(bào)告中也用數(shù)據(jù)驗(yàn)證了他們的說(shuō)法。報(bào)告顯示,在400多個(gè)測(cè)試案例中,阿爾法折疊3能夠正確模擬已知的蛋白質(zhì)和類藥小分子之間的相互作用,其中76%的案例能夠正確模擬,而RoseTTAFoldAll-Atom的這一比例約為40%。對(duì)于蛋白質(zhì)和抗體之間的相互作用,阿爾法折疊3的正確率為62%,而AlphaFoldMultimer(該公司之前用于模擬蛋白質(zhì)與其他生物分子相互作用的軟件包)的正確率為30%。
據(jù)了解,為了鼓勵(lì)新模型被廣泛采用,Deep Mind研究人員還發(fā)布了阿爾法折疊服務(wù)端,這是一個(gè)免費(fèi)的在線使用平臺(tái),Deep Mind研究人員為此發(fā)布了一個(gè)包含約2億個(gè)蛋白質(zhì)結(jié)構(gòu)的數(shù)據(jù)庫(kù)。
新模型的優(yōu)與劣
波士頓咨詢集團(tuán)本周發(fā)表的一項(xiàng)研究表明,與其他方法發(fā)現(xiàn)的藥物相比,人工智能發(fā)現(xiàn)的藥物在早期試驗(yàn)中的成功率更高。該研究指出這些數(shù)據(jù)是對(duì)該技術(shù)在藥物發(fā)現(xiàn)及有效性的早期分析,研究表示人工智能可以使制藥研發(fā)的生產(chǎn)力提高一倍。
據(jù)另一國(guó)際知名學(xué)術(shù)期刊《科學(xué)》對(duì)這一模型的介紹與解讀,倫敦國(guó)王學(xué)院的生物學(xué)家朱利安·伯杰龍獲得了測(cè)試阿爾法折疊3的機(jī)會(huì),他稱該軟件在加快研究速度方面具有變革性。研究人員無(wú)需花費(fèi)數(shù)年時(shí)間在實(shí)驗(yàn)室研究蛋白質(zhì),而是可以在幾分鐘內(nèi)得到結(jié)果。“我們可以開(kāi)始在計(jì)算機(jī)中測(cè)試假設(shè),”朱利安·伯杰龍說(shuō),“我非常確定世界上每個(gè)結(jié)構(gòu)生物學(xué)和蛋白質(zhì)生物化學(xué)研究小組都會(huì)立即采用這個(gè)系統(tǒng)。”
加州大學(xué)舊金山分校的藥物化學(xué)家布賴恩·肖伊切特一直在使用阿爾法折疊來(lái)尋找藥物,他說(shuō),由于對(duì)蛋白質(zhì)與可能的藥物相互作用建模的限制,他并不覺(jué)得阿爾法折疊3具有阿爾法折疊2在之前所帶來(lái)的影響大。
正如該研究團(tuán)隊(duì)在報(bào)告所介紹,阿爾法折疊3仍在很多方面存在局限性,需要進(jìn)一步的迭代和改進(jìn)。包括立體化學(xué)限制、預(yù)測(cè)準(zhǔn)確性問(wèn)題、結(jié)構(gòu)構(gòu)象限制、缺乏動(dòng)態(tài)信息、特定目標(biāo)預(yù)測(cè)限制等。