AlphaGo和AlphaZero又有新兄弟,這次輪到科學家驚呆了。
DeepMind近日宣布,過去兩年一直在研發(fā)AlphaFold:一個用人工智能加速科學發(fā)現(xiàn)的系統(tǒng)。
它僅僅基于蛋白質(zhì)的基因序列,就能預(yù)測蛋白質(zhì)的3D結(jié)構(gòu),而且結(jié)果比以前的任何模型都要精確。
在“蛋白質(zhì)結(jié)構(gòu)預(yù)測奧運會”CASP比賽中,力壓其他97個參賽者?!缎l(wèi)報》報道稱,AlphaFold預(yù)測出了43種蛋白質(zhì)中25種蛋白質(zhì)的最精確結(jié)構(gòu)。在同一類別中排名第二的隊伍,只預(yù)測出了3種。
△競賽結(jié)果,谷歌為G043
相關(guān)的研究者紛紛表示,DeepMind厲害!很想知道他們方法的細節(jié)。
對于這項研究,DeepMind稱其為“DeepMind在科學發(fā)現(xiàn)領(lǐng)域的第一個重要里程碑”,在生物學的核心挑戰(zhàn)之一上取得了重大進展。
《衛(wèi)報》評論稱,這將“開啟醫(yī)學進步的新時代”。
到底是個多大的進展?
任何給定的蛋白質(zhì)能做什么,取決于它獨特的3D結(jié)構(gòu)。 所以,能精確預(yù)測蛋白質(zhì)的3D結(jié)構(gòu)意義非凡。
首先,它能夠幫助科學家更好地理解蛋白質(zhì)在人體內(nèi)的作用。對于診斷和治療由蛋白質(zhì)錯誤折疊引起的疾病,比如阿爾茨海默氏癥、帕金森氏癥、亨廷頓氏癥等,至關(guān)重要。
其次,它會提高我們對身體及其工作原理的認識,使科學家能夠更有效地設(shè)計新的、有效的疾病治療方法。
隨著我們通過模擬和模型獲得更多關(guān)于蛋白質(zhì)形狀和它們?nèi)绾芜\作的知識,會使藥物開發(fā)方面更容易,同時也會降低相關(guān)的實驗成本。
第三,它也有助于更好地設(shè)計蛋白質(zhì),一個例子是,可以推動可生物降解酶的進步,幫助我們控制像塑料和石油這樣的污染物。
事實上,研究人員已經(jīng)開始對細菌進行工程改造,使其分泌蛋白質(zhì),讓廢物可生物降解,進而變得更容易處理。
不過,僅僅根據(jù)基因序列來確定蛋白質(zhì)的3D形狀是一項復(fù)雜的任務(wù)。
挑戰(zhàn)在于,基因序列中只包含蛋白質(zhì)組成部分氨基酸殘基的序列信息,這些氨基酸殘基會形成長鏈。 預(yù)測這些長鏈如何折疊成復(fù)雜的3D結(jié)構(gòu),被稱為“蛋白質(zhì)折疊問題”(protein folding problem)。
蛋白質(zhì)越大,氨基酸之間的相互作用越多,建模也就更復(fù)雜,困難度也會成倍上升。正如利文索爾佯謬(Levinthal’s paradox)中指出的那樣,在找到一個蛋白質(zhì)正確的3D結(jié)構(gòu)之前,要列舉一個典型的蛋白質(zhì)所有可能的構(gòu)型,需要的時間比宇宙存在的時間還要長。
那么,DeepMind解決這個問題的思路是怎樣的呢?
DeepMind方案:基于深度神經(jīng)網(wǎng)絡(luò)
DeepMind表示,他們專注于從零開始模擬目標形狀,而不是使用以前解決的蛋白質(zhì)作為模板。
因此,在預(yù)測蛋白質(zhì)結(jié)構(gòu)的物理性質(zhì)方面,DeepMind達到了非常高的準確性,然后使用兩種不同的方法,來構(gòu)建完整的蛋白質(zhì)結(jié)構(gòu)預(yù)測。
這兩種方法都依賴深度神經(jīng)網(wǎng)絡(luò),需要訓練深度神經(jīng)網(wǎng)絡(luò)從基因序列中預(yù)測蛋白質(zhì)的兩種特性:
1) 成對的氨基酸之間的距離;
2) 連接這些氨基酸的化學鍵之間的角度。
具體的操作步驟為:
訓練一個神經(jīng)網(wǎng)絡(luò)來預(yù)測蛋白質(zhì)中每對殘基之間的距離分布。然后,將這些概率組合成一個分數(shù),用來估計一個蛋白質(zhì)結(jié)構(gòu)的準確度。
此外,DeepMind還訓練了一個單獨的神經(jīng)網(wǎng)絡(luò),基于所有距離的總和來評估初步給出的蛋白質(zhì)結(jié)構(gòu)與正確答案的接近程度。
然后,基于這些評分函數(shù),去找到符合預(yù)測的結(jié)構(gòu)。
DeepMind使用的第一種方法,基于結(jié)構(gòu)生物學中常用的技術(shù),用新的蛋白質(zhì)片段反復(fù)替換蛋白質(zhì)結(jié)構(gòu)的片段,他們訓練了一個生成神經(jīng)網(wǎng)絡(luò)來發(fā)明新的片段,用來不斷提高蛋白質(zhì)結(jié)構(gòu)的評分。
第二種方法是通過梯度下降法優(yōu)化得分,這是機器學習中常用的一種數(shù)學技術(shù),可以進行小的、增量的改進,從而得到高精度的結(jié)構(gòu)。
他們將這項技術(shù)應(yīng)用于整個蛋白質(zhì)鏈,而不是那些在組裝前必須單獨折疊的片段,從而減少了預(yù)測過程的復(fù)雜性。
還有“一噸”多的想法
DeepMind的目標,是將AlphaFold打造成基礎(chǔ)科學領(lǐng)域的AlphaGo和AlphaZero。他們表示,
我們首次涉足蛋白質(zhì)折疊領(lǐng)域的成功表明,機器學習系統(tǒng)可以整合各種信息來源,幫助科學家快速找到復(fù)雜問題的創(chuàng)造性解決方案。
正如我們已經(jīng)看到人工智能如何通過AlphaGo和AlphaZero等系統(tǒng)幫助人們掌握復(fù)雜的游戲一樣,我們同樣希望有一天,人工智能的突破也將幫助我們掌握基礎(chǔ)的科學問題。
DeepMind的首席執(zhí)行官Demis Hassabis對此信心滿滿。
“我們還沒有完全解決蛋白質(zhì)折疊問題,這只是第一步,”他說?!斑@是一個極具挑戰(zhàn)性的問題,但是我們有一個良好的體系,我們還有’一噸’多的想法還沒有實施?!?/p>
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103544 -
DeepMind
+關(guān)注
關(guān)注
0文章
131瀏覽量
11564
原文標題:谷歌DeepMind再一次擊敗人類!這一次AI 成功預(yù)測蛋白質(zhì)3D結(jié)構(gòu)!AlphaGo有了新兄弟!
文章出處:【微信號:FPGAer_Club,微信公眾號:FPGAer俱樂部】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
評論