精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

4000萬蛋白結構訓練,西湖大學開發基于結構詞表的蛋白質通用大模型,已開源

人工智能 開源
本文利用Foldseek將蛋白質進行編碼,生成了一維的3Di結構序列(使用了Foldseek的結構詞表,每種3Di token代表不同的局部結構),這樣的結構序列與氨基酸序列是等長的。

蛋白質結構相比于序列往往被認為更加具有信息量,因為其直接決定了蛋白質的功能。而隨著AlphaFold2帶來的巨大突破,大量的預測結構被發布出來供人研究使用。如何利用這些蛋白質結構來訓練強大且通用的表征模型是一個值得研究的方向。

西湖大學的研究人員利用Foldseek來處理蛋白質結構,將其編碼成一維的離散token,并與傳統的氨基酸進行結合,形成了結構感知詞表(Structure-aware Vocabulary),以此將結構信息嵌入到模型輸入中,增強模型的表征能力。

圖片

在預訓練上,論文使用了目前最多的蛋白質結構(identity過濾后4000萬),在64張A100上訓練了3個月,最終開源了具備650M參數量的模型SaProt(同時包括了35M的版本)。實驗結果表明SaProt各種蛋白質任務上都要好于之前的序列和結構模型。

研究《SaProt: Protein Language Modeling with Structure-aware Vocabulary》的預印版本,于 2024 年 3 月 21 日發布在 bioRxiv 預印平臺。

圖片

論文鏈接:https://www.biorxiv.org/content/10.1101/2023.10.01.560349v4

github鏈接:https://github.com/westlake-repl/SaProt

方法

本文利用Foldseek將蛋白質進行編碼,生成了一維的3Di結構序列(使用了Foldseek的結構詞表,每種3Di token代表不同的局部結構),這樣的結構序列與氨基酸序列是等長的。

因此本文使用了一種簡單而有效的結構嵌入方式:將結構詞表和氨基酸詞表計算笛卡爾積(即兩兩組合),形成新的結構感知詞表。這樣對于蛋白質的每個位點,其氨基酸類型和對應的局部結構都能組合成新詞表中的某個元素,從而讓模型同時考慮到蛋白質的序列與結構信息。

本文使用Bert架構進行掩碼語言建模(Masked Language Modeling )預訓練(關于訓練的更多細節可參考原論文)。

圖片

圖:結構感知詞表

實驗

方法對比

一個可能令人疑惑的問題就是為什么需要這樣編碼結構?論文展示了使用不同的結構編碼方式進行預訓練的結果圖:

圖片

圖:不同結構模型訓練的loss曲線圖

圖左和圖中是兩種經典的蛋白質結構建模方式,即將結構信息編碼成bias后添加到transformer的attention map中(如Evoformer,Uni-Mol),或者使用圖神經網絡的方式建模蛋白質的空間關系(如MIF,GearNet等)。

然而從loss圖中可以發現,當上述兩種建模方式在AF2結構上使用MLM的訓練目標進行預訓練時,模型會非常迅速地過擬合(表現為在AF2預測結構上預測loss非常低,但在PDB真實結構上loss停滯甚至上升)。

作者推測這是由于AF2預測出來的蛋白質結構帶有一些隱藏的模式(patterns),由于前兩種方式是直接對蛋白質的三維坐標進行建模,這些隱藏的pattern可能很輕易地就被模型識別出來,從而造成了信息泄露的問題,讓模型無需真正學習到蛋白質的進化信息就能輕松地完成訓練目標。

而結構感知詞表通過將蛋白質結構編碼成一維的結構序列,在盡可能保留結構模式的情況下忽略了精細的坐標數值,因此模型能夠有效地利用結構信息而不受到隱藏pattern的影響。

Zero-shot測試

作者在蛋白質突變數據集(ProteinGym)上和真實人類臨床疾病數據集(ClinVar)上測試了SaProt的zero-shot能力,結果如下:

圖片

圖:Zero-shot實驗結果

SaProt在兩個數據集上都超越了以往的所有結構和序列模型,證明了其在zero-shot預測突變上具備優異的能力。

監督微調測試

本文還涵蓋了各種下游任務來測試模型表現,結果如下:

圖片

圖:下游任務fine-tune結果

SaProt在各個下游任務上都超越了以往的序列和結構模型,展示出了其強大且通用的表征能力。

結構信息測試

SaProt在4000萬的蛋白質結構上進行訓練,獲得了強大的表征能力。一個可能的疑問是如何確定SaProt學到了更多的結構信息而不是模型被訓練得更好?

論文對SaProt和ESM-2在殘基接觸預測任務(Contact Prediction Task)上進行了測試。作者凍住了模型的backbone,只訓練一個線性分類層。實驗結果如下:

圖片

圖:Contact Prediction Task的結果

從結果可以看到,由于結構token的嵌入,SaProt的表現大大超越了ESM-2,這表明SaProt蘊含了非常豐富的結構信息,使其能夠在結構預測任務上獲得十分優異的結果。同時,論文在SCOPe數據庫上對alpha蛋白質和beta蛋白質進行了可視化,結果如下:

圖片

圖:在SCOPe數據庫上的Embedding可視化

SaProt的可視化結果非常清晰地將alpha蛋白質和beta蛋白質區分開來,而ESM-2的可視化結果卻將兩種蛋白質混雜在一起,這說明了SaProt對結構的變化有很強的感知能力。

不同結構預測方法的比較

除了AF2,目前還存在許多其他的單序列結構預測方法(如ESMFold),因此本文額外測試了其他方法預測出來的結構對SaProt性能的作用。結果如下:

圖片

圖:不同結構預測方法的fine-tune結果

從測試結果可以看出,雖然SaProt在AF2結構上的表現最好(模型本身也是基于AF2結構進行訓練的),但其他的結構預測方法也能讓SaProt與ESM-2等模型性能相當。這意味著考慮到計算與時間成本,單序列結構預測模型也能作為替代方法輸入到SaProt中。

局限

雖然SaProt經過訓練展示出了優異的性能,但依然還有一些可以改進的地方,例如:

Foldseek默認的結構詞表大小只有20,如果有更加精準的結構編碼模型,擴大結構表征的詞表大小,是不是能進一步提升模型利用結構的能力?

由于計算能力的限制,SaProt只在650M上完成了訓練。如果能夠繼續擴大模型規模,是否可以進一步地提升模型表現?

論文雖然已經測試了很多的蛋白質任務,但還有一些其他任務可以應用探索,例如蛋白質序列設計(給定backbone預測氨基酸序列)等。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-05-23 09:28:23

模型蛋白質

2021-07-24 10:21:46

模型人工智能深度學習

2022-10-08 12:38:23

模型開源

2023-03-03 14:00:00

模型深度學習

2022-11-02 13:41:46

2023-09-20 12:44:00

AI訓練

2025-07-14 16:59:06

AI蛋白質模型

2023-07-06 16:59:56

英特爾

2023-07-06 13:23:49

2022-02-14 00:04:24

AI蛋白質結構

2022-03-07 14:45:21

昇思MindSpore開源

2025-09-28 09:12:00

2021-12-20 10:07:35

AI 數據人工智能

2023-10-04 09:23:21

微軟開發

2023-07-13 12:53:02

FrameDiffAI

2022-07-28 19:31:39

AlphabetDeepMind擴展數據庫

2022-12-25 13:36:47

論文

2023-01-13 21:13:31

AI人工智能醫療

2025-02-04 11:11:07

2024-08-26 12:43:46

點贊
收藏

51CTO技術棧公眾號

国产一区欧美日韩| 久久99高清| 亚洲午夜羞羞片| 国产精品一区二区欧美黑人喷潮水 | 久久久精品免费视频| 日本人添下边视频免费| 中文字幕免费一区| 欧美一区二区三区免费大片| 日韩精品一区二区在线视频 | 日韩欧美一区二区三区在线观看| 国产精品视频一区二区三区不卡| 不卡视频一区二区三区| 日韩三级一区二区| 欧美午夜电影在线观看 | 国产精品10p综合二区| 欧美亚洲另类小说| 亚洲午夜伦理| 日韩在线免费av| 国产制服丝袜在线| 久久久久亚洲精品中文字幕| 日韩欧美在线看| 日本免费成人网| 调教视频免费在线观看| a在线播放不卡| 91欧美激情另类亚洲| 天天爽夜夜爽人人爽| 黄色日韩在线| 久久国产精彩视频| a资源在线观看| 女一区二区三区| 欧美大胆人体bbbb| 欧美性受xxxxxx黑人xyx性爽| 亚洲风情在线资源| 亚洲午夜精品网| 欧洲xxxxx| 日本不卡在线| 国产人妖乱国产精品人妖| 国产嫩草一区二区三区在线观看| jlzzjlzzjlzz亚洲人| 奇米在线7777在线精品 | 亚洲一区二区三区av无码| 中文日本在线观看| 久久久www成人免费毛片麻豆 | 性久久久久久久久久久久久久| 成人网ww555视频免费看| 疯狂蹂躏欧美一区二区精品| 国产色一区二区三区| 日本资源在线| 一片黄亚洲嫩模| 最近中文字幕2019免费| 一起草在线视频| 国产一区二区三区亚洲| 精品国产免费视频| 国产成人av片| 97精品久久| 欧美mv日韩mv国产网站| 国产伦理在线观看| 丁香综合av| 亚洲国产精品推荐| 青青草成人免费视频| 啪啪国产精品| 亚洲欧美日韩中文视频| 亚洲国产日韩一区无码精品久久久| 亚洲人成网亚洲欧洲无码| 亚洲精品在线视频| 微拍福利一区二区| 日韩欧美视频| 美女av一区二区| 青娱乐国产在线| 影音先锋久久| 日本亚洲欧洲色| 无码人妻一区二区三区免费| 日本色综合中文字幕| 国产日韩欧美在线播放| 欧美日韩偷拍视频| 欧美日韩视频| 69av成年福利视频| 毛片在线免费播放| 经典一区二区三区| 高清视频一区二区三区| 色吊丝在线永久观看最新版本| 蜜臀av性久久久久蜜臀aⅴ流畅| 国产精品九九九| 国产人妖一区二区三区| 成人性视频免费网站| 久久国产精品 国产精品| 国产小视频在线播放| 国产精品乱码一区二三区小蝌蚪| 韩国黄色一级大片| 手机在线观看av网站| 欧美性受xxxx| 91成人在线观看喷潮蘑菇| 亚洲自拍电影| 久久久精品一区二区| 精品午夜福利在线观看| 青椒成人免费视频| 国内外成人免费视频| 77777影视视频在线观看| 亚洲一区精品在线| 热久久精品免费视频| 日韩视频一二区| 尤物yw午夜国产精品视频明星| 久久久久久福利| 日本欧美一区二区三区| 国产嫩草一区二区三区在线观看| av大片在线看| 亚洲成人综合网站| 日本黄色的视频| 亚欧洲精品视频在线观看| 久久伊人色综合| 国产又粗又猛又黄视频| 国产999精品久久| 亚洲美女搞黄| 国产高清在线观看| 一片黄亚洲嫩模| 色www免费视频| 亚洲精品进入| 久久久女女女女999久久| 中文字幕在线播放av| 97成人超碰视| 丁香六月激情网| 91精品亚洲一区在线观看| 亚洲欧美综合v| 日本一区二区欧美| 国产精品资源站在线| 婷婷久久五月天| 亚洲黄色网址| 亚洲精品99久久久久| 青青草偷拍视频| 久久99久久99小草精品免视看| 精品乱码一区二区三区| 欧洲在线视频| 日韩午夜精品视频| 成年人二级毛片| 麻豆成人91精品二区三区| 日韩视频精品| 日韩一区二区三区免费| 精品偷拍一区二区三区在线看| 久久97人妻无码一区二区三区| 精品亚洲成a人| 一区二区精品在线| 欧美成a人片免费观看久久五月天| 亚洲色图日韩av| 亚洲综合久久网| www激情久久| 熟女性饥渴一区二区三区| 麻豆一区二区| 欧美一区二区三区……| 欧美午夜免费| 欧美一级二级三级区| 看女生喷水的网站在线观看| 亚洲精品网站在线观看| 中文字幕欧美视频| 欧美+亚洲+精品+三区| 成人高清视频观看www| 日本蜜桃在线观看| 555夜色666亚洲国产免| 糖心vlog免费在线观看| 精品一区在线看| 老司机午夜网站| 久久久精品区| 国产做受高潮69| 图片区 小说区 区 亚洲五月| 精品高清美女精品国产区| 亚洲国产精品成人综合久久久| 亚洲综合精品| 日产中文字幕在线精品一区| 日本一道高清亚洲日美韩| 色青青草原桃花久久综合| 在线观看亚洲一区二区| 亚洲欧美日韩成人高清在线一区| 精产国品一区二区三区| 亚洲激情专区| 日韩精品欧美在线| 3d动漫一区二区三区在线观看| 欧美大胆a视频| 天堂av资源网| 欧美三级韩国三级日本三斤| 国产人妻精品一区二区三区不卡| 岛国一区二区在线观看| 黄色免费福利视频| 日韩大片在线播放| 成人av免费看| 婷婷综合六月| 久热在线中文字幕色999舞| 欧美熟妇另类久久久久久不卡| 色综合天天综合给合国产| 国精产品久拍自产在线网站| 丁香一区二区三区| av在线无限看| 亚洲视频中文| 亚洲欧美在线网| aiss精品大尺度系列| 国产成人鲁鲁免费视频a| 国产黄a三级三级三级av在线看 | 韩国美女主播一区| 超碰免费在线观看| 欧美精品一区二| 中文字幕一区二区免费| 亚洲成人自拍网| 娇小11一12╳yⅹ╳毛片| 成人小视频免费观看| 小泽玛利亚视频在线观看| 黄色av一区| 中文字幕在线中文字幕日亚韩一区| 久久综合社区| 2019国产精品视频| 欧美精品总汇| 羞羞色国产精品| av在线免费网站| 一区二区三区精品99久久 | 国产欧美自拍| 91国内产香蕉| 青草青在线视频| 久久精品成人一区二区三区 | 久久精品男人天堂av| 乳色吐息在线观看| 老司机免费视频一区二区三区| 亚洲色成人一区二区三区小说| 91精品一区二区三区综合| 日韩精品一区二区三区外面| 国产伦精品一区二区三区在线播放| 成人精品在线视频| 成人国产一区| 国产成人avxxxxx在线看 | 色噜噜狠狠色综合中国| 日韩成人av毛片| 夜色激情一区二区| 免费国产羞羞网站美图| 中文字幕中文在线不卡住| 欧美 日韩 国产 成人 在线观看| 欧美涩涩网站| 夜夜爽99久久国产综合精品女不卡| 亚洲v天堂v手机在线| 国产日韩亚洲精品| aiss精品大尺度系列| 亚洲最大的免费| 精品一区二区三区中文字幕视频| 国产欧美一区二区三区视频| 日韩精品免费观看视频| 日韩av电影在线免费播放| 亚洲性受xxx喷奶水| 国内久久久精品| 国产三线在线| 午夜精品一区二区三区av| sis001亚洲原创区| 性色av一区二区三区| a国产在线视频| 91精品国产高清久久久久久| av剧情在线观看| 91po在线观看91精品国产性色 | 欧美精品大片| 国产精品videossex国产高清 | 日本道不卡免费一区| 四虎影院一区二区三区 | 国产理论片在线观看| 欧美精选午夜久久久乱码6080| 中文字幕免费播放| 欧美蜜桃一区二区三区| 国产xxxx在线观看| 精品国产免费人成电影在线观看四季 | 国产中文在线播放| 51ⅴ精品国产91久久久久久| av资源亚洲| 国产精品自拍网| 免费观看性欧美大片无片| 国产精品久久亚洲7777| 丝袜连裤袜欧美激情日韩| 日本精品一区二区| 97国产成人高清在线观看| 男人草女人视频| 亚洲美女色禁图| 久久久久国产精品熟女影院| 乱一区二区av| 四虎精品一区二区| 国产午夜久久久久| 国产suv精品一区二区68| 亚洲成人动漫在线观看| 国产一级片免费在线观看| 7878成人国产在线观看| 亚洲欧美黄色片| 一区二区三区日韩在线| 久草免费在线观看| 97在线看免费观看视频在线观看| 全亚洲第一av番号网站| 91精品综合久久久久久五月天| 精品亚洲免a| 亚洲人体一区| 精品96久久久久久中文字幕无| 无遮挡又爽又刺激的视频| 韩国三级电影一区二区| 日本丰满少妇裸体自慰| 18欧美亚洲精品| 中文字字幕在线中文| 91精品国产高清一区二区三区| 婷婷在线观看视频| 久久激情视频久久| 筱崎爱全乳无删减在线观看| 91久久精品日日躁夜夜躁国产| 久久影院资源站| 400部精品国偷自产在线观看| 久久电影一区| 在线观看一区二区三区四区| 亚洲国产精品黑人久久久| 国产午夜视频在线| 欧美二区乱c少妇| 麻豆影视在线| 久久久噜噜噜久久| 国产日韩在线观看视频| 品久久久久久久久久96高清| 亚洲成人资源| 交换做爰国语对白| 中文字幕巨乱亚洲| 91九色丨porny丨肉丝| 日韩一卡二卡三卡国产欧美| 成人一区二区不卡免费| 欧美一级在线播放| 久久激情av| 日韩小视频网站| 国产精品综合在线视频| 亚洲黄色网址大全| 色偷偷成人一区二区三区91| 天天躁日日躁狠狠躁伊人| 欧美另类高清videos| 日本午夜免费一区二区| 日韩伦理一区二区三区av在线| 一区二区三区成人精品| 稀缺小u女呦精品呦| 亚洲在线视频一区| 国产熟女一区二区三区四区| 视频在线观看99| av成人免费| 手机成人在线| 日韩激情一区二区| av中文字幕免费观看| 日韩欧美精品中文字幕| av女名字大全列表| 亚州欧美日韩中文视频| 成人午夜三级| 毛片av在线播放| 国产suv一区二区三区88区| 欧美日韩在线观看免费| 欧美一区二区在线播放| av官网在线播放| 91成人免费视频| 欧美激情第二页| 激情av中文字幕| 黄色成人av网| 男女视频在线观看免费| 国产精品户外野外| 精品亚洲成人| 在线观看免费视频高清游戏推荐 | 亚洲成人生活片| 欧美成人精品二区三区99精品| 中文字幕在线三区| 国产精品中出一区二区三区| 亚洲区一区二| 欧洲美一区二区三区亚洲| 日本久久电影网| 69久久夜色| 91在线观看免费网站| 欧美在线三级| 182在线视频| 在线亚洲欧美专区二区| 在线中文资源天堂| av一本久道久久波多野结衣| 1024成人| 天天舔天天操天天干| 91精品国产综合久久久久久漫画| 亚洲精品白浆| 久久av一区二区三区漫画| 日韩在线观看一区二区| 5566中文字幕| 亚洲精品动漫100p| 欧美国产日韩电影| 国产精品igao激情视频 | 欧美日韩精品综合| 麻豆91小视频| 日韩成人av毛片| 中文字幕亚洲无线码在线一区| 国产95亚洲| www一区二区www免费| 国产精品福利一区| 亚洲欧美另类综合| 国产精品久久久久77777| 在线精品国产| 人妻精品久久久久中文字幕| 欧美男女性生活在线直播观看| 24小时免费看片在线观看| 污视频在线免费观看一区二区三区 | 98精品久久久久久久| 成年人小视频在线观看| 欧美影院一区二区| 国产又色又爽又黄刺激在线视频| 日本一区二区在线视频观看| 国产麻豆成人传媒免费观看| 久久精品视频1| 色中色综合影院手机版在线观看| 神马久久一区二区三区| 大桥未久恸哭の女教师|