有望治愈癌癥!微軟開源新模型,諾獎級重大突破

      后臺-系統設置-擴展變量-手機廣告位-內容正文頂部

      今天凌晨,微軟在官網開源了,最新動態蛋白質生成模型BioEmu-1。

      BioEmu-1能在單個GPU上每小時生成數千種蛋白質結構,生成效率比傳統 MD 模擬提高了幾個數量級。這種超高效率的蛋白質生成,可以幫助醫學家更全面、快速地了解靶點蛋白質的動態變化,設計出有效治療癌癥等絕癥藥物。

      例如,p53 是一種重要的腫瘤抑制蛋白,其突變與多種癌癥的發生密切相關。但p53 的結構復雜且動態變化非常大,傳統方法很難設計出有效的靶向藥物。通過BioEmu-1可以快速生成p53蛋白數千種變體結構,幫助醫生找到穩定的結合點,設計出準確的治愈癌癥藥物。

      此外,每位癌癥患者的腫瘤細胞都具有獨特的基因突變和蛋白質表達譜。而BioEmu-1 可以根據患者特定的基因序列預測蛋白質的結構變化,提供個性化癌癥治療方案


       


       

      開源地址:https://github.com/microsoft/bioemu

      有網友看到這個新蛋白質模型激動表示,就是現在!治愈癌癥!


       

      生物技術領域的又一次顛覆性突破


       

      研究界一定在歡呼慶祝!


       

      癌癥遲早成為歷史。


       

      微軟真是在搞一些硬核科技啊!


       

      BioEmu-1架構簡單介紹

      BioEmu-1采用了類似于DistributionalGraphormer的模型架構,但在訓練方法上進行了大幅度創新。從輸入的蛋白質序列開始,BioEmu-1首先通過一個復雜的序列編碼器提取單個和成對表示。

      這個編碼器基于AlphaFold 2中的evoformer模塊,利用多層Transformer網絡來捕捉序列內部各位置之間的依賴關系。


       

      每個氨基酸被映射到高維向量空間,作為后續操作的基礎。再通過多次自注意力運算計算序列中各個位置之間的相似度矩陣,從而捕獲全局依賴關系。

      接著,通過跨層連接和殘差連接進一步加工和提煉特征,確保模型能夠更好地處理長序列和復雜的結構模式。這些序列表示隨后被送入一個去噪擴散模型,該模型逐步生成粗粒度的蛋白質結構。


       

      在去噪擴散模型中,BioEmu-1定義了一個前向擴散過程,其中每一步都向輸入數據添加少量噪聲,直到最終變成完全隨機的狀態。然后,通過學習逆向過程中的條件概率分布,逐步去除噪聲,最終生成目標樣本。

      為了提高效率,BioEmu-1采用了一種新穎的二階積分方法,使得每次去噪步驟只需進行少量迭代即可達到較好的效果。還通過引入注意力機制,BioEmu-1確保模型在處理不同尺度的結構時具備良好的不變性和魯棒性,避免局部噪聲對全局結構的影響,保證生成的蛋白質結構具有較高的準確性。


       

      在訓練過程中,BioEmu-1的數據處理流程分為預訓練和微調兩個階段。預訓練階段利用了超過2億條來自AFDB數據庫的蛋白質序列,并進行了多級過濾和聚類,最終得到約5萬個具有多樣化結構的序列簇。


       

      這些序列簇不僅覆蓋了廣泛的蛋白質家族,還包含了豐富的結構信息。然后研究人員對這些序列簇進行了進一步增強,通過多結構增強技術,將每個序列簇中的代表性序列與其他結構相結合,生成多樣化的訓練樣本。

      BioEmu-1測試數據

      為了驗證BioEmu-1的有效性,研究人員設計了一系列測試案例,涵蓋了多種類型的蛋白質。例如,在快速折疊蛋白的測試中,BioEmu-1展示了其卓越的速度優勢,僅需數百小時的GPU時間即可完成一次完整的折疊過程,而傳統的MD模擬則需要數十萬小時。

      更重要的是,BioEmu-1生成的結構與實際觀測結果高度一致,平均絕對誤差控制在較小范圍內

      對于CATH域,BioEmu-1不僅能夠準確預測二級結構,還能捕捉到結構靈活性的變化。特別是在處理復雜蛋白如Complexin II時,BioEmu-1同樣表現出色,其螺旋含量和回轉半徑的預測結果與兩種全原子力場高度一致。


       

      此外,在預測人類血管緊張素轉換酶2的構象柔性方面,BioEmu-1成功揭示了ACE2在不同構象下的動態特性,證明了其在解析生物大分子相互作用及預測蛋白質功能方面的巨大潛力。

      本文素材來源微軟,如有侵權請聯系刪除

      未經允許不得轉載:RPA中國 | RPA全球生態 | 數字化勞動力 | RPA新聞 | 推動中國RPA生態發展 | 流 > 有望治愈癌癥!微軟開源新模型,諾獎級重大突破

      后臺-系統設置-擴展變量-手機廣告位-內容正文底部
      主站蜘蛛池模板: 乌恰县| 丰台区| 云林县| 洛浦县| 新河县| 丘北县| 太仆寺旗| 双柏县| 龙胜| 莒南县| 延边| 文安县| 彰武县| 虹口区| 平和县| 上虞市| 扎赉特旗| 读书| 房山区| 永平县| 泗水县| 临猗县| 佛教| 仁怀市| 白城市| 土默特左旗| 蕉岭县| 龙海市| 澳门| 高雄市| 西宁市| 长汀县| 北辰区| 禹州市| 融水| 新沂市| 电白县| 个旧市| 澄江县| 温宿县| 福海县|