精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

哈佛、哥大開源1600萬組蛋白質序列,解決AlphaFold 2訓練數據私有難題!

人工智能 新聞
這個叫OpenProteinSet的開源數據集,提供1600萬個開源蛋白質多序列對齊(MSA)和相關數據。它涵蓋了所有蛋白質數據庫的蛋白質和各種UniProt集群,可以實現廣泛的AI模型訓練。

蛋白質是生命的主力軍,了解它們的序列和結構,是設計新酶、開發救命藥物等生物學和醫學挑戰的關鍵。

DeepMind的AlphaFold 2,能夠以前所未有的準確性預測蛋白質結構。

然而,由于缺乏開放的訓練數據,這一領域的進展被嚴重阻礙。

但來自哈佛大學、哈佛醫學院、哥倫比亞大學、紐約大學和Flatiron Institute的研究者,引入了一個開源數據庫。

這個名為OpenProteinSet的開源數據庫,可以通過大規模提供蛋白質比對數據,來大大改善這種狀況。

它提供的數據集,和用于訓練AlphaFold 2的數據集質量相同。

因為AlphaFold 2,MSA的實用性爆炸性增長

蛋白質的功能,就編碼在氨基酸序列中。

在進化過程中,這些序列會積累一些微小的變化,而蛋白質的整體結構和功能卻一直保持不變。

多序列對齊(MSA)是一組和進化相關的蛋白質序列,通過插入間隙進行對齊,使匹配的氨基酸最終出現在同一列中。

通過分析這些MSA中的模式,可以深入了解蛋白質的結構和功能。

MSA的每一行,都是一個蛋白質序列。蛋白質是由20個氨基酸(或「殘基」)組成的一維字符串,每個氨基酸或「殘基」由一個字母表示。

目標或「查詢」 蛋白質在MSA的第一行中給出。后續行是根據與查詢序列的相似性,從大型序列數據庫中檢索到的進化相關(「同源」) 蛋白質。

為了改進比對、適應長度隨時間變化的同源序列,MSA比對軟件可以在同源序列中插入「缺口」(此處用破折號表示)或刪除殘基。

MSA中同源序列的數量(「深度」)及其多樣性,都有助于MSA的實用性。

圖片MSA引物

長期以來,MSA對蛋白質研究都至關重要,不過在2021年,因為AlphaFold 2的出現,MSA的實用性呈現了爆炸性增長。

通過MSA,AlphaFold 2能夠以近乎實驗級的準確性預測蛋白質結構。

然而有一個問題:雖然AlphaFold 2是開源的,但它的訓練數據仍然是私有的。

這樣做的計算成本很高。根據目標序列長度和正在搜索的序列數據庫的大小生成一個具有高靈敏度的MSA,可能需要幾個小時。

這樣,蛋白質機器學習和生物信息學的前沿研究除了少數大型研究團隊外,其他所有人都無法訪問。

1600萬個MSA全部開源

因此,團隊提出了OpenProteinSet,這是一個在AlphaFold 2及其以上規模訓練生物信息學的模型。

它包含了AlphaFold 2未發布的訓練集,包括所有唯一的蛋白質數據庫(PDB)鏈的MSAs和結構模板。

現在,OpenProteinSet提供了1600萬個MSA和相關數據,并且全部開源。

PDB是實驗確定的蛋白質結構的權威數據庫,而OpenProteinSet包括PDB中所有140,000種蛋白質的MSA。

它甚至還包括來自UniProt知識庫的序列,該序列按相似性聚類。

對于PDB蛋白質,OpenProteinSet能夠提供來自多個序列數據庫的原始MSA。

通過搜索PDB,它還能找到結構相似的蛋白質。

AlphaFold 2預測的結構,包括270,000個不同的UniProt集群。

使用開源數據集重新創建AlphaFold 2

開發者還會使用OpenProteinSet來訓練OpenFold,這是AlphaFold 2的一個開放版本。

他們發現,OpenFold的性能與DeepMind的原始數據相當,證明了這種開放數據的充分性。

團隊表示,「通過OpenProteinSet,我們大大提高了分子機器學習社區可用的預計算MSA的數量和質量,」

該數據集可直接應用于結構生物學的各種任務。

實驗方法

OpenProteinSet由超過1600萬個獨特的MSAs組成,這些MSAs是根據AIphaFold2論文中的程序生成的。

這一計數包括截至2022年4月PDB中所有14萬個唯一鏈的MSAs,以及針對同一數據庫為Uniclust30中的每個序列集群計算的1,600萬個MSAs。

從后一組中,研究者確定了270,000個最大多樣性代表性集群,比如可以適用于AphaFold2訓練過程中的自我蒸餾集。

對于每個PDB鏈,研究者使用了不同的對齊工具和序列數據庫計算三個MSAs。

使用OpenFold中的腳本,可以從公開可用的PDBmmCIF文件中,檢索相應的結構。

與用于生成AIphaFold2訓練集的過程一樣,研究者更改了MSA生成工具的一些默認選項。

隨后,產生了大約1600萬個MSAs,每個集群一個。

為了創建一個不同的、深度的MSAs子集,研究者通過迭代去除代表性鏈出現在其他MSAs中最多的MSAs。

這樣重復,直到每個代表鏈只出現在它自己的MSA中。

為了與對應的(未發布的)AlphaFold 2集進行奇偶性檢驗,研究者進一步刪除了代表序列大于1024個殘基或小于200個殘基的簇。

最后,他們剔除了相應MSAs少于200個序列的簇,只剩下270,262個MSAs。

總的來說,OpenProteinSet中的MSAs代表了超過400萬小時的計算。

OpenProteinSet大大提高了分子機器學習社區可用的預計算MSAs的數量和質量,它可以直接應用于結構生物學中的各種任務。

隨著模型對數據的需求越來越大,像OpenProteimnSet這樣的數據庫既可以作為多模態語言模型的生物知識寶庫,也可以作為多模態訓練本身的實證研究工具。

總之,OpenProteinSet將進一步推動生物信息學、蛋白質機器學習等領域的研究。

責任編輯:張燕妮 來源: 新智元
相關推薦

2021-07-24 10:21:46

模型人工智能深度學習

2025-09-28 09:12:00

2024-04-22 07:20:00

訓練開源

2023-06-05 15:41:10

AI算法

2022-02-14 00:04:24

AI蛋白質結構

2023-07-06 16:59:56

英特爾

2023-07-06 13:23:49

2022-07-22 14:49:37

語言模型DeepMindAlphaFold2

2024-08-26 12:43:46

2021-09-09 17:57:04

AI

2022-06-21 11:48:13

AI隱私計算

2021-07-21 17:13:17

DeepMind開源AlphaFold 2

2023-03-02 13:49:25

開發蛋白質

2023-10-04 09:23:21

微軟開發

2022-02-22 16:33:58

深度學習人工智能模型

2024-06-26 13:21:50

2021-07-30 15:36:54

開源技術 軟件

2025-06-27 08:56:51

2022-03-07 14:45:21

昇思MindSpore開源
點贊
收藏

51CTO技術棧公眾號

美女又黄又免费的视频| 亚洲人一区二区| 亚洲综合久久网| 欧美激情理论| 日韩精品一区二区三区视频播放 | 六月婷婷七月丁香| 欧美大片高清| 亚洲猫色日本管| 久中文字幕一区| 97人妻精品一区二区三区动漫 | 亚洲欧洲日韩在线| 国内视频一区| 国产精品高潮呻吟AV无码| 亚洲视频碰碰| 久久九九国产精品怡红院| 日韩Av无码精品| 成人日韩视频| 一本色道久久综合亚洲aⅴ蜜桃| 最近看过的日韩成人| 视频一区二区在线播放| 蜜臀久久99精品久久久画质超高清| 色综合久久久久久中文网| 国产免费一区二区三区网站免费| 亚洲成人偷拍| 欧美日韩一区高清| 欧美在线观看成人| 黄色影院在线看| 国产精品亲子乱子伦xxxx裸| 欧美lavv| 亚洲aaaaaaa| 精品制服美女丁香| 国产精品久久9| 亚洲黄色小说图片| 亚洲国产一区二区精品专区| 欧美成人精品xxx| 国产主播av在线| 亚洲综合图色| 日韩av在线最新| 国产黑丝在线观看| 成人在线视频你懂的| 欧美一区二区三区视频免费| 久久久精品高清| 本网站久久精品| 色综合久久中文字幕综合网 | 免费久久99精品国产| 欧美尤物巨大精品爽| 中文字幕一区二区三区手机版 | 日韩一区中文字幕| 相泽南亚洲一区二区在线播放| 青青草在线免费观看| 99精品视频在线播放观看| 成人激情直播| 亚洲精品一区二区三区蜜桃| 国产一区二区在线电影| 91在线精品播放| 国产jzjzjz丝袜老师水多 | 欧美xxxx×黑人性爽| 中文字幕区一区二区三| 精品免费国产二区三区 | 国产色爱av资源综合区| 日韩av电影在线观看| 国产三级在线看| 国产精品久久久久影院亚瑟| 色香蕉在线观看| av毛片在线免费| 亚洲国产精品天堂| 99色精品视频| 国产国产一区| 欧美一区二区三区性视频| 91福利视频免费观看| 8848成人影院| 日韩精品丝袜在线| 日本少妇xxxxx| 天天射天天综合网| 欧美激情综合色| 婷婷激情五月网| 日本亚洲三级在线| 91丨九色丨国产在线| 亚洲欧美激情另类| 2020国产精品自拍| 亚洲午夜高清视频| 牛牛精品在线视频| 黑人巨大精品欧美一区二区免费| 丁香婷婷激情网| 国产欧美视频在线| 亚洲精品理论电影| 99国产精品无码| 国产尤物精品| 国产91在线播放| 国产美女永久免费| 91视频在线看| 欧美 另类 交| 欧美少妇精品| 日韩一区二区麻豆国产| a毛片毛片av永久免费| 国产精品国产三级国产在线观看| 欧美精品videossex性护士| 在线免费黄色av| 久久69国产一区二区蜜臀| 国产一区二区三区免费不卡| 91免费在线| 亚洲成人免费观看| 一道本在线免费视频| 美女视频免费精品| 另类少妇人与禽zozz0性伦| 国产欧美一区二区三区在线看蜜臂| 日本在线播放一区二区三区| 精品国产一二| 成年视频在线观看| 色狠狠色狠狠综合| 亚洲欧美高清在线| 97精品国产福利一区二区三区| 98精品国产高清在线xxxx天堂| 91极品身材尤物theporn| 91丝袜美腿高跟国产极品老师 | caopeng在线| 欧美这里有精品| 艳妇乳肉亭妇荡乳av| 一本一道久久综合狠狠老| 国产精品吹潮在线观看| 无码国产色欲xxxx视频| 亚洲精品国产a久久久久久| 亚洲少妇第一页| 亚洲69av| 97视频在线观看免费高清完整版在线观看 | 三级毛片在线免费看| 亚洲一二三四久久| 亚洲天堂网站在线| 久久中文视频| 国产精品普通话| 国产精品99999| 日韩欧美国产激情| 西西大胆午夜视频| 亚洲高清电影| 国产一级特黄a大片99| 中文字幕在线三区| 欧美一级欧美三级在线观看| 操她视频在线观看| 久久丁香综合五月国产三级网站| 日韩精品福利视频| 日韩精品专区| 亚洲一区二区久久久| 一区二区三区在线观看av| 久久日韩粉嫩一区二区三区| 日韩中文字幕三区| 特黄特色欧美大片| 日韩免费av片在线观看| 麻豆app在线观看| 91福利在线看| 日本人亚洲人jjzzjjz| 日本午夜精品一区二区三区电影 | 在线精品视频一区二区三四| 国产特级黄色录像| 青青草国产精品97视觉盛宴| 视频一区亚洲| 国产91亚洲精品久久久| 日韩日本欧美亚洲| 99久久国产免费| 亚洲一区二区三区三| 日韩www视频| 久久久久国产精品一区二区| 日本一区二区在线| 色婷婷成人网| 欧美日产国产成人免费图片| 精品国产无码一区二区三区| 亚洲图片欧美色图| 欧洲女同同性吃奶| 激情综合色丁香一区二区| 青青视频免费在线| 日本中文字幕在线一区| 国产成人精品视频| 免费a级毛片在线播放| 欧美一级在线视频| 国产精品suv一区二区三区| 国产亚洲精品aa午夜观看| 五月花丁香婷婷| 伊人久久亚洲热| 日韩中文一区二区三区| 国产精品亚洲欧美一级在线 | 在线观看久久av| 国产免费视频一区二区三区| 午夜久久福利影院| 大胸美女被爆操| 国产风韵犹存在线视精品| www.爱色av.com| 午夜影院欧美| 久久久久高清| 96视频在线观看欧美| 91av在线免费观看| 美女av在线播放| 日韩国产精品一区| 国产男女裸体做爰爽爽| 欧美日韩午夜剧场| 免费看特级毛片| 91亚洲精品久久久蜜桃网站 | 国产精品高清无码| 亚洲综合精品久久| 九九九视频在线观看| 成人晚上爱看视频| 亚洲一区在线不卡| 亚洲激情精品| 午夜啪啪福利视频| 欧美肉体xxxx裸体137大胆| 成人自拍视频网站| 日韩成人一区| 日本精品久久久久久久| 免费在线播放电影| www.欧美精品一二三区| 欧美女子与性| 亚洲成人黄色网址| av网站免费大全| 欧美日韩精品欧美日韩精品| 91在线视频在线观看| 一区二区三区不卡视频| 麻豆网址在线观看| 国产欧美日韩在线看| 久久午夜夜伦鲁鲁片| 国产精品亚洲专一区二区三区| 噼里啪啦国语在线观看免费版高清版| 在线观看亚洲| 中文字幕精品在线播放| 久久伦理在线| 日韩亚洲欧美精品| 久久91麻豆精品一区| 精品在线视频一区二区三区| 亚洲精品高潮| 91视频婷婷| 国产区一区二| 91在线观看免费| 四虎视频在线精品免费网址| 国产成人啪精品视频免费网| 一个人www视频在线免费观看| 久久久噜久噜久久综合| 日本在线观看高清完整版| www.色综合| 久cao在线| 精品国产一区二区三区久久久狼| 不卡在线视频| 自拍亚洲一区欧美另类| 91这里只有精品| 国产一区二区三区免费视频| 精品无吗乱吗av国产爱色| 国产视频精品一区二区三区| 五月婷婷伊人网| 亚洲精品国产精品国自产在线 | 欧美亚洲激情在线| 极品在线视频| 欧美专区在线观看| 影视一区二区三区| 国产精品久久久久久av下载红粉| 免费欧美电影| 国产欧美日韩中文字幕在线| 国产资源一区| 91丝袜美腿美女视频网站| 警花av一区二区三区| 99c视频在线| 国产精东传媒成人av电影| 黄色国产精品一区二区三区| 亚洲精品小区久久久久久| 日韩免费av一区二区三区| 人人狠狠综合久久亚洲婷婷| 在线视频不卡一区二区| 欧美黄在线观看| 免费一级特黄特色毛片久久看| 亚洲视频播放| 国产一二三四在线视频| 精品一区二区三区免费观看 | 久久久国产综合精品女国产盗摄| 欧美性猛交xxxx乱| 亚洲欧洲精品一区二区精品久久久 | 日本亚洲精品在线观看| 黄色成人小视频| 91亚色免费| 一区二区导航| 亚洲美女自拍偷拍| 99热精品在线观看| 中文字幕视频在线免费观看| 国产一区福利在线| 亚洲第九十七页| 国产精品久久久久久亚洲毛片| 欧美成人精品欧美一| 欧美三级免费观看| 夜夜躁狠狠躁日日躁av| 337p日本欧洲亚洲大胆精品 | 国产精品入口麻豆九色| 黄色一级片在线免费观看| 日韩欧美国产成人| a在线观看视频| 亚洲欧美成人网| 在线观看中文字幕的网站| 欧美一区二粉嫩精品国产一线天| 欧美在线se| 久久精品国产第一区二区三区最新章节| 欧美日韩中字| a√天堂在线观看| 精品一区二区三区在线观看国产 | www.黄色片| 国产一区二区激情| 草草影院在线| 91精品久久久久久久久久久| 亚洲动漫在线观看| 欧美做暖暖视频| 美腿丝袜在线亚洲一区| 成人h动漫精品一区| 亚洲男女毛片无遮挡| 欧美brazzers| 亚洲精品成人久久电影| 国产一区久久精品| 国产精品黄色av| 欧美天堂影院| 国产精品69久久久| 精品一区二区三区视频在线观看 | 91精品一区国产高清在线gif| 国产午夜大地久久| 国产sm精品调教视频网站| 国产馆在线观看| 色婷婷av一区二区三区gif| 理论片中文字幕| 欧美精品制服第一页| 欧美少妇激情| 涩涩涩999| 久久亚洲精选| 欧美黑人欧美精品刺激| 亚洲韩国精品一区| 国产18精品乱码免费看| 久久这里有精品| 91精品麻豆| 一本久久a久久精品vr综合| 石原莉奈一区二区三区在线观看| 黄色片视频免费观看| 亚洲激情中文1区| 国产色视频在线| 久久精品久久久久| 日韩五码电影| 一区二区冒白浆视频| 日本三级亚洲精品| www久久久久久久| 在线观看日产精品| 国产黄色在线播放| 国产精品精品视频一区二区三区| 国精一区二区| 亚洲福利精品视频| 国产精品国产三级国产a| 影音先锋国产在线| 三级精品视频久久久久| 日韩护士脚交太爽了| 一区二区精品在线观看| 精品一区二区三区在线播放视频| 亚洲天堂网av在线| 日韩一区二区在线看片| 日本一本在线免费福利| 成人免费视频视频在| 亚洲欧洲日本mm| 日本丰满少妇裸体自慰| 色婷婷久久综合| 成年女人的天堂在线| 国产日韩专区在线| 欧美+日本+国产+在线a∨观看| 岛国大片在线免费观看| 亚洲国产精品麻豆| 激情小视频在线| 国产在线a不卡| 欧美精品观看| 精品夜夜澡人妻无码av| 在线视频一区二区三区| 男人在线资源站| 懂色一区二区三区av片| 久久99伊人| 国产一区二区三区视频播放| 欧美成人性战久久| 欧美aa在线观看| 亚洲国产精品一区二区第一页| 激情综合网av| www.毛片.com| 中文字幕国产精品久久| 亚洲亚洲一区二区三区| 免费在线激情视频| 中文字幕一区二区在线观看| 亚洲第一天堂影院| 日本sm极度另类视频| 亚洲国产一成人久久精品| 中国xxxx性xxxx产国| 欧美视频在线一区二区三区| 羞羞的视频在线看| 免费在线观看一区二区| 精品一区二区三区在线播放 | 欧美夫妻性生活| 国产福利片在线观看| 日韩av一区二区三区美女毛片| 国产麻豆精品在线| www五月天com| 色综合天天狠天天透天天伊人| 亚州av日韩av| 中文字幕第三区| 一本一道久久a久久精品| 中国av在线播放| 午夜精品电影在线观看| 99在线视频精品| 国产露脸无套对白在线播放| 欧洲亚洲免费视频|