精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ChemBench:大語言模型化學能力評測數據集

發布于 2024-5-28 10:25
瀏覽
0收藏

ChemBench 是上海人工智能實驗室 AI for Science 團隊自建的化學語言模型評測數據集,實現了大模型能力在化學領域的全面評估。

研究團隊從互聯網公開資源中采集并設計構建了 4100 多道多項選擇題,每個選擇題只有一個正確答案。覆蓋了 基于文本的分子生成、名稱轉換、性質預測、溫度預測、分子描述、產率預測、溶劑預測、逆合成分析、產物預測 九大化學任務。

ChemBench 評測任務介紹

隨著大語言模型的飛速發展,一系列特定領域的垂類模型也不斷涌現,這其中就包含化學大模型。但是如何全面的評估一個大模型的化學能力仍然是一個比較棘手的問題。

目前對化學領域大語言模型的能力評估會存在以下問題:

1. 目前很多已有的化學任務評測基準,往往只是針對某個具體的化學任務進行評測,或是為了特定領域模型所設計,并不適用于測試大語言模型。

2. 現有的對化學大語言模型的評測基準大多采用問答形式,使用 BLEU 或者 ROUGE 等指標進行評測,這些類型的評估指標會受到語言模型輸出風格的顯著影響,不適合科學事實正確性的評測,在這種情況下,如果模型輸出了更好的語言風格,但是包含事實性錯誤,可能會獲得更高的評估分數。

為了解決這些問題,上海 AI Lab 化學大模型團隊提出了 ChemBench,由多項選擇題構建,用來評估大語言模型的化學能力。

評測的任務以及每個任務題目數量分布如下圖:

ChemBench:大語言模型化學能力評測數據集-AI.x社區



Name Conversion:名稱轉換任務,指分子的 IUPAC chemical name 和 smiles 互相的轉換,測試了模型對分子不同描述的認知

Property Prediction:性質預測任務,針對分子預測其不同有用的化學性質

Mol2Caption:分子描述任務,針對特定分子進行多樣的描述表征?

Caption2mol:基于文本的分子生成,用戶給定特定對分子的描述,模型預測出相應的分子的結構式?

Product Prediction:產物預測任務,預測化學反應能得到的產物

Yield Prediction:產量預測任務,預測特定化學反應能得到的產量

Retrosynthesis:逆合成分析任務,根據成品分子預測其合成的路徑

Solvent Prediction:溶劑預測任務,預測化學反應中所需要的溶劑

Temperature Prediction:溫度預測任務,預測特定化學反應需要的溫度條件

在多項選擇題的構建中,團隊還借助 ChatGPT,通過對每個任務設計專用的提示工程,構建每個題目的錯誤選項,使得模型的錯誤選項有足夠難度的混淆,保證了選項的辨別難度。

數據集題目展示

下面將選取 ChemBench 中不同任務的題目進行展示。

Name Conversion 名稱轉換任務的題目展示如下:

```
{
        "question": "\nHow would you express this IUPAC name in SMILES format? CC1(C2=C(N=C1C=CC=C3C(C4=C(N3CCCS(=O)(=O)O)N=CC=C4)(C)C)[N+](=CC=C2)CCCCCC(=O)O)C",
        "answer": "D",
        "D": "6-[2-[3-[3,3-dimethyl-1-(3-sulfopropyl)pyrrolo[2,3-b]pyridin-2-ylidene]prop-1-enyl]-3,3-dimethyl-pyrrolo[2,3-b]pyridin-7-ium-7-yl]hexanoic acid",
        "A": "6-[2-[3-[3,3-dimethyl-1-(3-phosphonopropyl)pyrrolo[2,3-c]pyridin-2-ylidene]ethylidene]-3,3-dimethyl-pyrrolo[2,3-a]pyridin-7-ium-7-yl]hexanoic acid",
        "B": "6-[2-[3-[1-(3-carboxypropyl)-3,3-dimethylindolizin-2-ylidene]prop-1-enyl]-3,3-dimethyl-1H-pyrrolo[3,2-b]pyridin-7-yl]hexanoic acid",
        "C": "6-[2-[3-[3,3-dimethyl-1-(3-sulfopropyl)pyridin-2(1H)-one]-prop-1-enyl]-3,3-dimethyl-pyrrolo[2,3-b]pyridin-7-ium-7-yl]hexanoic acid"
    },
```

Retrosynthesis 逆合成分析任務的題目展示如下:

```
  {
        "question": "Which ingredients are commonly selected for creating Cc1oc(-c2ccccc2)nc1COc1ccc2cc(CC3SC(=O)NC3=O)cnc2c1 ?\n",
        "answer": "A",
        "A": "Chemicals employed in the creation of Cc1oc(-c2ccccc2)nc1COc1ccc2cc(CC3SC(=O)NC3=O)cnc2c1  can be chosen from CCO and Cc1oc(-c2ccccc2)nc1COc1ccc2cc(CC3SC(=N)NC3=O)cnc2c1. There's a chance that reactions will emerge, with Cc1oc(-c2ccccc2)nc1COc1ccc2cc(CC3SC(=N)NC3=O)cnc2c1.CCO>Cl>Cc1oc(-c2ccccc2)nc1COc1ccc2cc(CC3SC(=O)NC3=O)cnc2c1. potentially representing the reaction equations.",
        "C": "The possibility of reactions exists, and CCOC(=O)c1c(C(F)(F)F)cc(-c2ccc(OC(F)(F)F)cc2)nc1CC1CC1.[H].[H][Al+3].[Li+].[H].[H].>>redients are commonly selected for creating Cc1oc(-c2ccccc2)nc1COc1ccc2cc(CC3SC(=O)NC3=O)cnc2c1. could portray the reaction equations. Chemicals used in the formulation of redients are commonly selected for creating Cc1oc(-c2ccccc2)nc1COc1ccc2cc(CC3SC(=O)NC3=O)cnc2c1  can be chosen from CCOC(=O)c1c(C(F)(F)F)cc(-c2ccc(OC(F)(F)F)cc2)nc1CC1CC1.",
        "B": "It's possible for reactions to manifest, with CC(F)(F)c1cc(B2OC(C)(C)C(C)(C)O2)ccc1Cl.Cc1nccn1Cc1cc(Cl)cnn1>>redients are commonly selected for creating Cc1oc(-c2ccccc2)nc1COc1ccc2cc(CC3SC(=O)NC3=O)cnc2c1. potentially representing reaction equations. Materials used in the composition of Cc1nccn1Cc1cc(-c2ccc(Cl)c(C(C)(F)F)c2)cnn1 and Cl  can be selected from CC(F)(F)c1cc(B2OC(C)(C)C(C)(C)O2)ccc1Cl and Cc1nccn1Cc1cc(Cl)cnn1.",
        "D": "Materials used for manufacturing redients are commonly selected for creating Cc1oc(-c2ccccc2)nc1COc1ccc2cc(CC3SC(=O)NC3=O)cnc2c1  can be chosen from COc1cccc2c1ccc1c(C(=O)O)cc3c(c12)OCO3. Reactions could potentially emerge, with COc1cccc2c1ccc1c(C(=O)O)cc3c(c12)OCO3.Cl.c1ccncc1>Cl>redients are commonly selected for creating Cc1oc(-c2ccccc2)nc1COc1ccc2cc(CC3SC(=O)NC3=O)cnc2c1. possibly serving as indicators of reaction equations."
    },
```

Mol2Caption 分子描述任務的題目展示如下:

```
 {
        "question": "Describe this molecule.\nO=C(NCc1ccco1)c1cc2ccccc2o1",
        "answer": "B",
        "B": "The molecule is a benzofuran derivative.",
        "A": "The molecule is a member of steroids.",
        "C": "The molecule is a member of carboxylic acids.",
        "D": "The molecule is a member of flavonoids."
    },
```


同時,7B開源模型、GPT-3.5、GPT-4 在 ChemBench 上的化學能力由弱變強,符合人們對于這些模型使用上能力的認知,也進一步反映了ChemBench測評的有效性和客觀性。

ChemBench:大語言模型化學能力評測數據集-AI.x社區

本文轉載自 ??司南評測體系??,作者: 司南 OpenCompass

收藏
回復
舉報
回復
相關推薦
亚洲色图第一区| 在线观看免费av片| 福利视频在线| 国产69精品一区二区亚洲孕妇| 久久久久久久久久婷婷| 一级黄色片大全| 9999精品免费视频| 偷拍与自拍一区| 一本一道久久久a久久久精品91| 怡红院亚洲色图| 国产三级第一页| blacked蜜桃精品一区| 91精品国产综合久久久久| 九九久久99| 一二三区在线播放| 性8sex亚洲区入口| 欧美精品亚州精品| av手机在线播放| 国内视频在线精品| 7777精品伊人久久久大香线蕉超级流畅| 欧美精品自拍视频| 黄网站在线免费| 国产喂奶挤奶一区二区三区| 国产91一区二区三区| 在线免费看av的网站| 亚洲永久字幕| 韩剧1988免费观看全集| 久久久久久无码精品人妻一区二区| 三级在线看中文字幕完整版| 亚洲蜜臀av乱码久久精品| 日韩免费电影一区二区三区| 999视频在线| 亚洲一级特黄| 久青草国产97香蕉在线视频| 2019男人天堂| 日韩三级一区| 色婷婷av一区二区| 日韩三级电影免费观看| 天堂在线观看免费视频| 国产亚洲精品bv在线观看| 亚洲精品suv精品一区二区| 日本高清一区二区视频| 国产精品传媒麻豆hd| 日韩欧美在线免费| 99re在线视频免费观看| av在线播放资源| 亚洲美女免费在线| 欧美aaa在线观看| 精品免费久久久| 激情六月婷婷久久| 91在线观看免费观看| 91精品国产乱码久久久| 蜜桃精品视频在线| 国产欧美日韩中文| 在线免费观看av片| 久久99蜜桃精品| 国产精品久久久久久久午夜| 最近中文字幕在线视频| 日本欧美加勒比视频| 国产精品成人在线| 老司机成人免费视频| 国产精品国产一区| 久久久成人精品视频| 欧美色图亚洲视频| 国产精品草草| 9.1国产丝袜在线观看| 色欲AV无码精品一区二区久久| 亚洲第一二三区| 一区二区三区视频观看| 大地资源高清在线视频观看| 亚洲字幕久久| 午夜精品久久久久久久久久久久久| 国产一级做a爱免费视频| 99精品久久| 日韩在线视频一区| 日韩一级片av| 一区二区福利| 国产精品美女久久久免费| 中文字幕福利视频| 国产一区二区精品久久91| 国产91精品入口17c| 天堂资源最新在线| 极品少妇xxxx精品少妇| 动漫一区二区在线| 日本成人一区二区三区| 国产精品婷婷午夜在线观看| 91传媒免费视频| 亚洲国产欧美91| 三区四区电影在线观看| 亚洲人123区| 黄色免费视频大全| 日本欧美在线| 亚洲精品一区二区三区99| 91l九色lporny| 综合天堂久久久久久久| 欧洲日本亚洲国产区| 91tv国产成人福利| av在线一区二区| 一区二区不卡在线视频 午夜欧美不卡' | 国产亚洲在线观看| 国产精品中文字幕久久久| 亚洲黄色精品视频| 丝袜亚洲另类欧美| 91老司机在线| 蜜桃视频在线观看网站| 成人av免费观看| 亚洲精品中文字幕在线| tube8在线hd| 欧美日韩美女一区二区| 日b视频在线观看| 66国产精品| 国产91精品网站| 亚洲精品字幕在线观看| 中文字幕在线不卡一区| 欧美成人一区二区在线观看| 免费一级欧美片在线观看网站| 亚洲人成电影在线| 亚洲激情视频小说| 国产精品www994| 国产一区二中文字幕在线看| 深夜福利在线看| 一级日本不卡的影视| jizz欧美性11| 欧美禁忌电影| 欧美又大粗又爽又黄大片视频| 久久久久香蕉视频| 久久97超碰色| 日韩福利一区二区三区| 老司机午夜福利视频| 欧美激情综合五月色丁香| 国产精品videossex国产高清 | 亚洲日韩中文字幕| 久久激情免费视频| 狠狠色丁香婷婷综合| 日本在线观看不卡| 久久男人天堂| 亚洲国产精品久久久久秋霞蜜臀 | 星空大象在线观看免费播放| 9191国语精品高清在线| 国产欧美一区二区三区在线| 国产视频精品久久| 日韩欧美有码在线| 精品人妻一区二区三区香蕉| 影音先锋久久精品| av一区二区三区在线观看| fc2ppv国产精品久久| 91精品国产高清一区二区三区蜜臀| 欧美在线中文字幕| 男人操女人的视频网站| 久久精品国产一区二区三| 国产大片精品免费永久看nba| 欧洲av在线播放| 亚洲国产精品精华液网站| 无码人妻丰满熟妇区毛片蜜桃精品| 亚洲第一偷拍| 999精品视频一区二区三区| 超碰porn在线| 日韩免费一区二区| 久久久精品一区二区涩爱| 成人丝袜高跟foot| 久久久久免费看黄a片app| 精品国产影院| 1769国产精品| 爱爱爱免费视频在线观看| 欧美在线观看视频一区二区 | 日本一区二区不卡视频| 中文字幕永久视频| 香蕉视频国产精品 | 国产黄色特级片| 日韩欧美1区| 亚洲a中文字幕| sm久久捆绑调教精品一区| 精品久久久视频| 蜜桃精品成人影片| 日本最新不卡在线| aaa免费在线观看| 国产成人高清精品免费5388| 97精品国产91久久久久久| 可以在线观看的av| 欧美人与z0zoxxxx视频| 国产性一乱一性一伧一色| 久久蜜桃av一区精品变态类天堂| 少妇一级淫免费放| 在线精品视频在线观看高清| 国产亚洲欧美一区二区| 日韩免费小视频| 欧美成人免费全部| 巨骚激情综合| 日韩欧美视频一区| www.色国产| 亚洲激情五月婷婷| 在哪里可以看毛片| 国产一区免费电影| 国产综合免费视频| 亚洲色图插插| 免费久久一级欧美特大黄| 亚洲爽爆av| 日韩美女视频在线观看| 91国内在线| 7777精品伊人久久久大香线蕉超级流畅 | 国产精品欧美激情| 白白色在线观看| 日韩中文字幕欧美| 色视频在线观看福利| 欧美一区二区在线不卡| 欧美性猛交bbbbb精品| 依依成人精品视频| 一二三四国产精品| 91丨九色丨黑人外教| 欧美一级特黄aaa| 午夜在线精品| 精品少妇在线视频| 一区二区免费不卡在线| 视频在线一区二区三区| 欧美日韩一区二区三区四区不卡| 92国产精品久久久久首页| 偷拍中文亚洲欧美动漫| 久久久欧美一区二区| 欧美激情视频在线播放| 亚洲日本va午夜在线影院| 少妇被狂c下部羞羞漫画| 国产乱子伦一区二区三区国色天香| 亚洲综合欧美日韩| 激情网站五月天| 午夜久久久久| 在线观看一区二区三区三州| 美日韩中文字幕| 国产在线精品一区| 欧美国产亚洲精品| 成人高清视频观看www| 成人自拍视频网| 日本欧美精品在线| 在线天堂资源www在线污| 欧美激情视频在线观看| 黄色免费在线网站| 色哟哟亚洲精品一区二区| 男人av在线| 亚洲欧洲日韩国产| 三区在线观看| 亚洲精品国产精品乱码不99按摩 | 色诱女教师一区二区三区| 国产玉足榨精视频在线观看| 国产丝袜一区二区| 天堂资源中文在线| 日韩精品中文字幕在线播放| 日本毛片在线观看| 亚洲精品国产精品国自产观看浪潮 | 欧美电影免费观看| 日本久久久久久久久久久| 二区三区不卡| 国产精品白嫩美女在线观看| 欧美一区久久久| 国产精品久久久久免费a∨| 色天使综合视频| 成人国产精品一区| 精品视频一二| 国内视频一区二区| 天堂99x99es久久精品免费| 麻豆av一区二区三区| 久久爱www成人| 亚洲自拍三区| 狠狠综合久久| 少妇无码av无码专区在线观看 | 午夜视频在线网站| 国产麻豆视频一区| 中文字幕人妻熟女在线| 99re8在线精品视频免费播放| 欧美图片一区二区| 欧美国产日韩亚洲一区| 三级黄色在线观看| 亚洲专区一二三| 综合网在线观看| 欧美日韩精品高清| 亚洲不卡免费视频| 日韩精品在线观看一区| 二区三区在线播放| 欧美老女人性生活| 欧美xoxoxo| 91手机视频在线观看| 国内自拍欧美| 神马影院午夜我不卡| 欧美黄免费看| 国产精品wwwww| 国产乱人伦偷精品视频不卡 | 亚洲av无码乱码在线观看性色| 亚洲福利视频网站| 在线观看av的网站| 国外视频精品毛片| 狠狠久久综合| 激情欧美一区二区三区中文字幕 | 亚洲乱码日产精品bd在线观看| 亚洲专区一区| 伊人免费视频二| 久久久高清一区二区三区| 亚洲国产成人精品综合99| 日韩欧美一区二区三区久久| 99国产精品99| 国产亚洲一区二区精品| 日本伦理一区二区| 国产精品成人av性教育| 看全色黄大色大片免费久久久| 色综合久久久久久久久五月| 亚洲第一毛片| 极品粉嫩美女露脸啪啪| 91婷婷韩国欧美一区二区| 欧美激情一区二区视频| 欧美日韩专区在线| 偷拍精品一区二区三区| 久久夜色精品国产亚洲aⅴ| 电影网一区二区| 国产一区视频观看| 这里只有精品在线| 久久这里只精品| 99国产精品视频免费观看| 波多野结衣家庭教师| 欧美午夜精品一区二区三区| 午夜福利视频一区二区| 欧美高清第一页| 一区二区三区| 日韩av一区二区三区在线| 亚洲精品系列| 久久久午夜精品福利内容| 亚洲精品美国一| 国产又粗又黄又爽的视频| 国产午夜精品一区二区三区| 天堂а√在线最新版中文在线| 99久久自偷自偷国产精品不卡| 久久综合99| 天天干天天综合| 久久精品欧美一区二区三区麻豆| 男女视频免费看| 精品国产制服丝袜高跟| 视频在线观看入口黄最新永久免费国产 | 99国产精品一区| 欧美一级视频免费观看| 精品成a人在线观看| av大全在线| 91精品国产99久久久久久红楼| 国产福利久久久| 91久久精品日日躁夜夜躁欧美| 色哟哟在线观看| 清纯唯美日韩制服另类| 欧美人与物videos另类xxxxx| 免费看一级大黄情大片| 91女神在线视频| 亚洲欧美一区二区三区在线观看| 亚洲欧美激情精品一区二区| 超碰国产一区| 日本不卡在线播放| 免费成人在线视频观看| 中文字幕精品亚洲| 欧美日韩国产在线观看| 国产精品一区二区三区视频网站| 成人久久18免费网站图片| 7777久久香蕉成人影院| 韩国一区二区三区四区| 亚洲成人精品在线观看| 男女污污视频在线观看| 国产精品美腿一区在线看| 久久久久久久久久久久久久久久久久| 亚洲精品手机在线观看| 亚洲免费高清视频在线| 黄频在线免费观看| 欧美一级黄色网| 成人影院在线| 国产精品19p| 五月天亚洲婷婷| 国产片在线观看| 91免费看片在线| 在线欧美三区| 日本精品在线观看视频| 欧美精品丝袜中出| 成人影音在线| 日本在线成人一区二区| 国产一区 二区 三区一级| 国产亚洲欧美久久久久| 亚洲美女av在线播放| 亚洲高清影院| 免费无码毛片一区二三区| 久久精品男人天堂av| 91好色先生tv| 91精品国产乱码久久久久久蜜臀 | 日日夜夜狠狠操| www.欧美精品一二三区| 高清精品视频| 欧美伦理片在线观看| 亚洲国产aⅴ成人精品无吗| 国产黄色片在线观看| 97影院在线午夜| 三级亚洲高清视频| 午夜69成人做爰视频| 亚洲欧美在线第一页| 91丨精品丨国产| 50路60路老熟妇啪啪| 亚洲精品ww久久久久久p站| 每日更新av在线播放| 粉嫩高清一区二区三区精品视频| 日韩激情一二三区| 亚洲欧美一区二区三区四区五区| 亚洲人成亚洲人成在线观看|