生物學最大謎團"蛋白質折疊"被人工智慧破解!太強了啦(上)
因開發出橫掃棋壇的圍棋 AI「AlphaGo」而廣為世人所知的人工智慧實驗室 DeepMind 又傳出捷報──這次他們開發出名叫「AlphaFold」的 AI,解決了困擾生物學界超過 50 年的「蛋白質折疊」難題,以往要精確得知一個蛋白質的完整結構,需要數月、數年甚至數十年的實驗研究,而人工智慧只要花費幾小時就能完成。
推薦閱讀:
且由於蛋白質的結構影響它的 功能,許多疾病又和蛋白質的功能有關,若能解決這個難題,就表示醫療領域可以再進一大步,未來人類將能更了解包括新型冠狀肺炎等疾病,亦能加速新藥物的開發。
蛋白質折疊:生物學最大謎團之一
胺基酸是構成蛋白質的基本單位,蛋白質是由一條氨基酸鏈摺疊成特定三維結構所構成,而蛋白質的功能就取決於這個三維結構,甚至被稱為「理解生命的密碼」。這半個世紀以來,科學家一直試圖掌握不同蛋白質的形狀,以期深入理解它們的作用及引起疾病的方式。然而因為氨基酸鏈摺疊的可能性太多,「蛋白質摺疊」(Protein folding)難題便成為生物學最重大的挑戰之一。
▲ DeepMind 上傳說明影片,解釋何謂「蛋白質折疊」。
自 1972 年,諾貝爾化學獎得主克里斯蒂安.安芬森(Christian Anfinsen)就表示:若要從胺基酸序列預測蛋白質架構,折疊的可能方式會多到無法估計;生物學家塞瑞斯.列文塔爾(Cyrus Levinthal)具體指出,蛋白質折疊有「10 的 300 次方」種可能方式,想靠人工計算來暴力破解,花費時間可能比宇宙存在的時間都長。
這也是為什麼 DeepMind 開發出可以預測蛋白質最終結構的 AlphaFold,會讓全世界震驚於 AI 的突破。
能預測蛋白質結構的 AI 系統「AlphaFold」
DeepMind 表示,AlphaFold 可以藉由胺基酸序列,快速且準確預測蛋白質的三維立體結構。
AlphaFold 的神經網路上添加了注意力機制(Attention Mechanism),並且用資料庫中 17 萬種已知蛋白質結構、6 千萬筆胺基酸序列來訓練,它分析目前已知蛋白質形狀後,就能預測其他蛋白質的形狀,前後只需要花費幾小時、甚至幾分鐘內的時間。
▲ AlphaFold 主要神經網絡模型架構。 圖片來源:DeepMind 官網。
DeepMind 團隊表示,可以將蛋白質折疊看作一個「空間圖」(spatial graph),節點表示殘基(residue),邊緣將殘基緊密連接起來。這個空間圖對於理解蛋白質內部的物理交互至關重要。
團隊使用深度學習的端對端(End-to-End)進行訓練,以理解空間圖的結構,並使用進化相關序列、多重序列比對(MSA)和氨基酸殘基的表示等方法來細空間圖。
已於 CASP 大賽中二次奪冠的 AlphaFold
從 1994 年起,John Moult 教授和 Krzysztof Fidelis 教授創立了蛋白質結構預測關鍵評估實驗(Critical Assessment of Structure Prediction,CASP)。CASP 的競賽模式為:主辦單位會選擇近期才經過實驗確認的蛋白質結構,讓參賽團隊測試自己的蛋白質結構預測方法,最後將預測結果與實驗數據進行比對。
因為嚴苛的評比規則,CASP 一直被稱為預測技術評估的「黃金標準」,CASP 也是期望能透過兩年一次的競賽,來廣邀各方投入相關研究,但都沒有找到成效顯著的方法。
直到 AlphaFold 於 2018 的 CASP13 亮相,首次參加國際比賽就已達到有史以來最高精準度,而且第二名的準確率與 AlphaFold 相差甚遠;並且,在近日舉辦的 CASP14 中,AlphaFold 更上一層樓,中位分數為 92.4(滿分100分),而在 AlphaFold 之前的參賽者,中位分數從未超過50。
「這是該研究領域激動人心的一刻。」DeepMind 聯合創始人兼執行長傑米斯‧哈薩比斯(Demis Hassabis)表示。「人工智慧今天已經足夠成熟強大,足以被應用於真正具有挑戰性的科學問題上了。」
同時他也表示,DeepMind 可能要等到明年才能公開詳細實驗內容,團隊也正在準備相關論文,以適時提交給同行進行評審。
人工智慧 AlphaFold 如何突破現有生物、醫學瓶頸?請點此接續看下去!
相關文章:
人工智慧協助設計新食譜!Sony 將研發超越廚師的美食 AI
外貌影響面試?放心!新世代人工智慧Tengai面試不再以貌取人