精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

開源垂直領(lǐng)域高質(zhì)量數(shù)據(jù)合成框架!專業(yè)QA自動(dòng)生成,無需人工標(biāo)注,來自上海AI Lab

人工智能 新聞
通過“知識(shí)圖譜引導(dǎo)+雙模型協(xié)同”機(jī)制,顯著增強(qiáng)模型對(duì)垂域的理解能力。

垂域模型訓(xùn)練,高質(zhì)量問答數(shù)據(jù)稀缺一直是行業(yè)痛點(diǎn)。

在垂直領(lǐng)域大模型訓(xùn)練中,人工標(biāo)注成本高昂,合成數(shù)據(jù)又常陷入質(zhì)量與專業(yè)性難以兼得的困境。

為此,上海AI實(shí)驗(yàn)室等提出GraphGen。

通過“知識(shí)圖譜引導(dǎo)+雙模型協(xié)同”機(jī)制,顯著增強(qiáng)模型對(duì)垂域的理解能力。

同時(shí),研究團(tuán)隊(duì)已經(jīng)在OpenXLab部署了Web應(yīng)用,上傳你的文本塊(如海事、海洋知識(shí))、填寫SliconCloud API Key,即可在線生成LLaMA-Factory、XTuner所需的訓(xùn)練數(shù)據(jù)。

背景說明

垂域模型(如醫(yī)療、農(nóng)業(yè))訓(xùn)練中,獲取QA(問答對(duì))數(shù)據(jù)常常面臨以下難題:

量大。只是學(xué)習(xí)回復(fù)風(fēng)格只需數(shù)百條,尚且能人工標(biāo)注;用SFT(Supervised Fine-Tuning)給模型注入新知識(shí),需要數(shù)十萬的樣本量,此時(shí)數(shù)據(jù)合成手段是剛需。

專業(yè)背景。開源LLM在小眾領(lǐng)域已經(jīng)表現(xiàn)不錯(cuò),但垂域應(yīng)對(duì)的是真正的“硬骨頭”。面對(duì)領(lǐng)域數(shù)據(jù),普通人可能每個(gè)字都認(rèn)識(shí),但連在一起并不知道什么含義。比如,不借助工具,請(qǐng)?jiān)囍x懂這句:

1AGIS_Os01g033640是一個(gè)怎樣的數(shù)量性狀基因(QTG),與鹽脅迫表達(dá)是否有關(guān)聯(lián)?

質(zhì)量把控。“LLM-RAG-打分”通常也被拿來合成 SFT 數(shù)據(jù),但這條pipeline存留一些問題:

正確性。在LLM不具備領(lǐng)域知識(shí)時(shí),直接給領(lǐng)域問答數(shù)據(jù)打分,容易陷入“先有雞先有蛋”的難題

簡單的關(guān)聯(lián)度得分也不足以衡量數(shù)據(jù)質(zhì)量,不僅沒有回復(fù)長度、信息豐度等指標(biāo),更缺少語義層面的保證

方案介紹

為了解決以上問題,上海AI Lab開源了GraphGen,一個(gè)在知識(shí)圖譜引導(dǎo)下的合成數(shù)據(jù)生成框架,旨在知識(shí)密集型任務(wù)中生成問答

這是基于GraphGen和SiliconCloud Qwen2.5-7B-Instruct API實(shí)跑的 QA 樣例:

1Q:隆兩優(yōu)1212是什么品種的水稻,其機(jī)播時(shí)間是什么時(shí)候?
2A:首先,隆兩優(yōu)1212是一種早熟品種,于2017年引入福建省龍巖市長汀縣試種。這種水稻在煙草收獲后進(jìn)行種植,因此被稱為煙后稻。隆兩優(yōu)1212的機(jī)播時(shí)間定在了6月15日。隨著時(shí)間的推移,到了2019年,隆兩優(yōu)1212進(jìn)一步擴(kuò)大了示范種植的范圍。此外,隆兩優(yōu)1212還具有抽穗整齊的生長特點(diǎn),這進(jìn)一步證明了其優(yōu)良的種植性能。
3
4Q:What role does the BG1 gene play in plant growth and development, and how is its expression regulated?
5A:AUXIN, a class of plant hormones that regulate various aspects of plant growth and development, plays a crucial role in the induction of the BG1 gene. Specifically, BG1 is induced by auxin treatment, indicating its involvement in auxin transport regulation. This gene is preferentially expressed in the vascular tissue of culms, further highlighting its localization in these tissues. The function of BG1 extends beyond auxin transport regulation, as it is also linked to the regulation of grain size and tiller angle. Tiller angle, a critical architectural feature of rice plants that influences grain yield, is directly affected by the expression of BG1. Therefore, the role of BG1 in regulating both grain size and tiller angle underscores its importance in plant architecture and overall yield.

GraphGen會(huì)使用到兩個(gè)LLM,一個(gè)是合成模型,負(fù)責(zé)構(gòu)建知識(shí)圖譜、合成數(shù)據(jù)等;另一個(gè)是學(xué)生模型,用來識(shí)別它自己的知識(shí)盲點(diǎn),方便針對(duì)性的選擇數(shù)據(jù)。

圖片

上圖是GraphGen工作流:

首先輸入一段原始文本,使用合成模型從源文本構(gòu)建細(xì)粒度的知識(shí)圖譜。

然后,利用預(yù)期校準(zhǔn)誤差(Expected Calibration Error, 簡稱 ECE)來識(shí)別學(xué)生模型的知識(shí)盲點(diǎn),針對(duì)知識(shí)盲點(diǎn)優(yōu)先生成針對(duì)高價(jià)值、長尾知識(shí)的問答對(duì)。

接著,GraphGen框架結(jié)合多跳鄰域采樣來捕捉復(fù)雜的關(guān)聯(lián)信息,并采用風(fēng)格控制生成技術(shù)來使生成的問答數(shù)據(jù)多樣化。

最終得到一系列和原始文本相關(guān)的問答對(duì)。用戶可以直接用這批數(shù)據(jù)在llama-factory或者xtuner這樣的訓(xùn)練框架中進(jìn)行SFT。

優(yōu)秀的數(shù)據(jù)合成方法有很多,研究團(tuán)隊(duì)在論文中做了對(duì)比測試:

圖片

研究團(tuán)隊(duì)采用的是客觀指標(biāo):

MTLD(Measure of Textual Lexical Diversity)通過計(jì)算文本中連續(xù)詞串的平均長度來評(píng)估詞匯的多樣性

Uni(Unieval Score)是基于對(duì)話模型的自然度、一致度、可理解度評(píng)價(jià)指標(biāo)

Rew(Reward Score)是BAAI和OpenAssistant開源的兩個(gè)Reward Model計(jì)算的得分

由上圖可見,GraphGen能給出相對(duì)較好的合成數(shù)據(jù)。

同時(shí)研究團(tuán)隊(duì)在開源數(shù)據(jù)集(SeedEval、PQArefEval、HotpotEval 分別對(duì)應(yīng)農(nóng)業(yè)、醫(yī)學(xué)、通用)訓(xùn)練測試,結(jié)果表明GraphGen自動(dòng)合成的數(shù)據(jù)能夠降低Comprehension Loss(越低代表學(xué)生模型的知識(shí)盲點(diǎn)越少),增強(qiáng)模型對(duì)垂域的理解力。

圖片

工具使用

研究團(tuán)隊(duì)已經(jīng)在OpenXLab平臺(tái)推出了一個(gè)便捷的Web應(yīng)用。用戶可以輕松上傳各類文本塊(例如海事、海洋知識(shí)等),并通過填寫SiliconCloud API Key,快速生成適配LLaMA-Factory和XTuner訓(xùn)練框架所需的高質(zhì)量訓(xùn)練數(shù)據(jù)。

圖片

需要注意的是:

為了方便試用,默認(rèn)配置免費(fèi)的7B模型。真實(shí)業(yè)務(wù)中請(qǐng)用更大的合成模型(14B 及以上),并開啟Trainee 難例挖掘

Web應(yīng)用默認(rèn)配置SiliconCloud做API Key,也支持本地vllm部署,請(qǐng)自行修改base URL

GitHub 和論文地址:https://github.com/open-sciencelab/GraphGenOpenXLab Web

體驗(yàn)地址:https://g-app-center-000704-6802-aerppvq.openxlab.space

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2020-12-01 13:56:56

人工智能AI數(shù)據(jù)

2025-04-15 09:22:00

AI訓(xùn)練模型

2025-02-18 15:03:58

數(shù)據(jù)AI模型

2025-04-15 09:08:51

系統(tǒng)數(shù)據(jù)模型

2024-05-09 08:33:33

2025-08-27 07:17:00

數(shù)據(jù)驅(qū)動(dòng)數(shù)據(jù)治理大數(shù)據(jù)

2022-08-25 16:46:29

人工智能AI

2022-11-03 15:10:24

前端數(shù)據(jù)結(jié)構(gòu)算法

2025-08-11 17:58:00

AI圖像生成數(shù)據(jù)

2015-06-19 16:28:28

InformaticaCRM廣州銀行

2023-12-10 15:17:59

開源模型3D

2025-06-25 08:53:00

模型AI強(qiáng)化學(xué)習(xí)

2015-08-19 08:54:23

Android開發(fā)框架

2025-06-18 08:47:00

2025-04-25 09:20:00

數(shù)據(jù)模型AI

2024-06-11 07:02:00

大模型3D內(nèi)容生成技術(shù)

2025-11-12 08:40:00

數(shù)據(jù)AI模型

2023-07-04 08:35:52

MetaGPT開源

2010-07-06 11:52:59

數(shù)據(jù)庫RationalJazz
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

日韩欧美一级二级| 国产成人免费在线观看不卡| 视频直播国产精品| 亚洲在线观看网站| 岛国av在线网站| 久久精品一二三| 91精品在线观看视频| 国产乡下妇女做爰| 日本成人小视频| 欧美草草影院在线视频| 免费黄色特级片| 男人在线资源站| 99精品视频在线播放观看| 国产精品女主播视频| 精品无码免费视频| 日韩电影二区| 日韩av在线免费观看| 第一区免费在线观看| 国产精品探花在线| 综合久久久久久| 欧美一区二视频在线免费观看| 国产三级三级在线观看| 久久免费国产| 久久久久久亚洲精品不卡| 日本黄区免费视频观看| 神马午夜久久| 亚洲成人精品视频| 红桃视频 国产| 香蕉视频亚洲一级| 精品久久久久久| 99热这里只有精品免费| av在线播放网| 久久久久国色av免费看影院| 国产精品日韩欧美一区二区三区| 91久久久久国产一区二区| 免费在线播放第一区高清av| 欧美日韩国产成人| 91久久国产综合| 爽成人777777婷婷| 中文在线不卡视频| 欧美 日韩 国产 成人 在线观看| 精品按摩偷拍| 亚洲成人精品视频| www.四虎精品| 成人性生交大片免费看96| 欧美一区二区视频观看视频| 亚洲国产日韩欧美在线观看| 123成人网| 色狠狠一区二区| 中文字幕无码不卡免费视频| 中文在线аv在线| 黄色一区二区三区| 日韩精品视频一区二区在线观看| 9999精品成人免费毛片在线看| 亚洲激情综合网| 好吊色视频988gao在线观看| 国产精品久久久久久福利| 中文字幕精品在线不卡| 亚洲高清在线播放| 生活片a∨在线观看| 中文字幕在线观看不卡| 不卡中文字幕在线| sm国产在线调教视频| 亚洲欧美另类小说| 国产片侵犯亲女视频播放| 欧美xxxx做受欧美88bbw| 亚洲一区成人在线| 欧美 丝袜 自拍 制服 另类| 最近高清中文在线字幕在线观看1| 狠狠久久五月精品中文字幕| 一本久道综合色婷婷五月| 欧美日一区二区三区| 欧美日韩午夜在线| 一本之道在线视频| 欧美自拍一区| 一区二区三区动漫| 国产午夜精品理论片| 欧美日韩调教| 91av在线看| 亚洲精品国产精品国自产网站按摩| 麻豆一区二区三| 91嫩草在线| 天堂av资源网| 亚洲国产成人午夜在线一区| 好吊色这里只有精品| 大黄网站在线观看| 在线亚洲一区二区| 免费高清视频在线观看| 一区二区美女| 久久久999精品免费| 国产精品999久久久| 久久免费国产| 999热视频| 国产亚洲依依| 一区二区三区鲁丝不卡| 国产福利视频在线播放| 超碰国产精品一区二页| 亚洲精品美女免费| 精品在线观看一区| 国产精品一二| 3d动漫精品啪啪一区二区三区免费| 日日躁夜夜躁白天躁晚上躁91| 欧美激情一区二区在线| 日韩成人三级视频| 日韩一区二区三免费高清在线观看| 欧美r级电影在线观看| 免费成人深夜天涯网站| 亚洲婷婷在线| 国产视频观看一区| 日韩午夜影院| 亚洲图片欧美一区| 老司机午夜性大片| 你懂的一区二区三区| 欧美第一黄色网| 中文字幕在线一| 91香蕉视频在线| 成年人三级视频| 色香欲www7777综合网| 欧美r级在线观看| 爱爱视频免费在线观看| 日本麻豆一区二区三区视频| 精品国产免费久久久久久尖叫| 国产在线观看91| 欧洲视频一区二区| 日韩精品卡通动漫网站| 激情文学一区| 岛国视频一区免费观看| 久操视频在线| 欧美精品第一页| 欧美a在线播放| 老妇喷水一区二区三区| 精品久久久久久乱码天堂| 呦呦在线视频| 在线不卡a资源高清| 人妻熟人中文字幕一区二区| 久久精品五月| 欧美连裤袜在线视频| 国产激情在线播放| 亚洲激情视频网站| www.youjizz.com亚洲| 国产精品123| av中文字幕av| 日韩一二三区| 欧美国产乱视频| www.97超碰| 亚洲自拍偷拍网站| jjzz黄色片| 99精品国产福利在线观看免费| 成人片在线免费看| 丰满的护士2在线观看高清| 精品日韩一区二区| 久久午夜无码鲁丝片午夜精品| 国产精品一级黄| 成人在线视频一区二区三区| 中文字幕区一区二区三| 欧美精品video| 蜜桃av鲁一鲁一鲁一鲁俄罗斯的| 亚洲一区自拍偷拍| 中文字幕日韩三级片| 国产欧美一区二区色老头| 欧美成ee人免费视频| 国产精品久久久久av电视剧| 一区二区成人精品| 一区二区三区午夜| 一区二区三区美女| www.88av| 三级一区在线视频先锋| 影音欧美亚洲| 中文字幕视频精品一区二区三区| 97精品免费视频| 九色在线观看视频| 欧美日韩久久一区二区| 成年人一级黄色片| 成人国产精品视频| 99re在线视频免费观看| 超碰成人久久| 97中文在线观看| 丁香六月综合| 精品国产一区二区三区久久久| h片在线免费看| 狠狠色香婷婷久久亚洲精品| 国产在线免费av| 高清不卡在线观看av| 青青视频在线播放| 欧美激情黄色片| 国产欧美日韩一区| 精品欧美日韩精品| 欧美激情精品久久久久| 蜜桃视频在线观看视频| 91精品一区二区三区久久久久久| 久久精品国产亚洲av香蕉| 国产拍欧美日韩视频二区| 中文字幕avav| 日韩一区精品字幕| 日韩免费在线观看av| 国产精品一区二区av日韩在线| 成人夜晚看av| 欧美特大特白屁股xxxx| 蜜臀久久99精品久久久久久宅男| 五月婷婷在线播放| 制服丝袜亚洲色图| 亚洲欧美一区二区三区在线观看| 综合色天天鬼久久鬼色| 欧美做受xxxxxⅹ性视频| 国产精品白丝av| 中文字幕有码av| 在线视频免费在线观看一区二区| 一本一道久久a久久精品综合 | 国产精品av电影| gogogogo高清视频在线| 亚洲区一区二区| 男人天堂综合网| 这里只有精品99re| 天天爱天天做天天爽| 亚洲地区一二三色| 一区视频免费观看 | 欧美日韩免费做爰视频| 国产欧美日韩卡一| 国产亚洲色婷婷久久99精品91| 国产一区二区三区在线观看免费视频 | 中文字幕99| 中文字幕免费精品一区高清| 精品国产av鲁一鲁一区| 欧美性生交片4| 在线天堂中文字幕| 一区二区三区蜜桃网| 亚洲视频重口味| 国产欧美日韩亚州综合| 少妇光屁股影院| aaa国产一区| 亚洲一区和二区| 国产精品69久久久久水密桃| 亚洲另类第一页| 日韩中文字幕一区二区三区| 男人添女人下部高潮视频在观看| 欧美一区二区三区另类| 亚洲一区二区三区免费观看| 欧美日韩爱爱| 欧美区高清在线| 香蕉久久夜色精品国产更新时间 | 欧美日韩一二三四区| 亚洲国产一区二区a毛片| 久久久精品人妻一区二区三区四| 伊人开心综合网| 中文字幕人妻一区二| 亚洲人精品午夜| 国产少妇在线观看| 亚洲蜜臀av乱码久久精品| 蜜臀久久精品久久久用户群体| 国产精品久久久久四虎| 最新黄色av网址| 中文字幕亚洲综合久久菠萝蜜| 妖精视频在线观看免费| 国产精品免费视频一区| 国产日韩精品中文字无码| 国产精品久久久久久久久免费桃花 | 99精品视频网站| 91精品成人| 久青草视频在线播放| 亚洲午夜久久久久久尤物| www在线观看免费| 亚洲欧美日韩综合国产aⅴ| 六月丁香婷婷在线| 青草国产精品久久久久久| 欧美成人三级在线播放| 国产一区二区三区av电影 | 日本少妇高潮喷水视频| 午夜在线精品偷拍| 校园春色 亚洲色图| 国产在线精品免费| 久草视频福利在线| 久久久噜噜噜久久中文字幕色伊伊 | 白嫩白嫩国产精品| 免费试看一区| 97精品视频| 成人免费播放器| 日韩精品1区2区3区| 日本女人黄色片| 91丨porny丨中文| 免费一级suv好看的国产网站 | 中文字幕视频网| 欧美久久一区二区| 色屁屁草草影院ccyycom| 亚洲色图校园春色| 99热国产在线中文| 欧美在线视频一二三| 国产精品亚洲成在人线| 国产精品高清一区二区三区| 视频精品在线观看| 成年人视频大全| 久久精品综合| 国偷自产av一区二区三区麻豆| 久久婷婷久久一区二区三区| 91高清免费看| 91久久精品一区二区三| 精品黑人一区二区三区在线观看| 国产视频久久网| 91高清在线观看视频| 国产精品99久久99久久久二8| 欧美高清hd| 日韩欧美三级一区二区| 国产一区欧美| 天天干天天操天天做| 91网站最新网址| 激情五月少妇a| 欧美日韩免费观看一区三区| 婷婷久久久久久| 久久精品国产精品亚洲| 欧美私密网站| 超碰97在线资源| 欧美激情偷拍自拍| av免费中文字幕| 972aa.com艺术欧美| 欧美黄色免费在线观看| 欧美日韩一区二区三区免费看| 五月婷中文字幕| 欧美日韩成人精品| 激情综合婷婷| 中国成人亚色综合网站| 久久天堂精品| xxxx黄色片| 一区二区三区四区在线免费观看| 亚洲国产无线乱码在线观看| 日韩精品在线第一页| 超清av在线| av日韩中文字幕| 亚洲精品99| 精品综合久久久久| 中文字幕不卡在线| 午夜视频网站在线观看| 亚洲精品综合精品自拍| 欧美三级网站| 九九99玖玖| 一本色道久久综合亚洲精品不卡| 91亚洲一线产区二线产区| 亚洲欧美视频在线观看视频| 国产又粗又猛又色又| 中文字幕日韩欧美| 国产一区精品福利| 亚洲一区三区电影在线观看| 免费在线看一区| 性色国产成人久久久精品| 欧美日韩aaa| 黄网站视频在线观看| 91人人爽人人爽人人精88v| 国产精品精品国产一区二区| 亚洲精品久久久中文字幕| 国产精品免费观看视频| 中文字幕在线观看精品| 日韩中文字幕网站| www久久久| 久艹在线免费观看| jlzzjlzz亚洲日本少妇| 亚洲男人的天堂在线视频| 国产视频自拍一区| 欧美性xxx| 亚洲免费视频一区| 国产在线一区观看| 黄色一级片在线| 亚洲丁香久久久| 香蕉久久免费电影| 一区中文字幕在线观看| 国产福利不卡视频| 国产对白videos麻豆高潮| 日韩精品视频在线观看免费| 原纱央莉成人av片| 亚洲欧洲精品一区二区| 国产一区二区三区免费| 久久久一区二区三区四区| 亚洲国产精品一区二区久| 在线黄色的网站| 亚洲一区二区在| 国产99久久久国产精品| 制服.丝袜.亚洲.中文.综合懂色| 亚洲性生活视频| 国产精品日韩精品在线播放| 国产aaa免费视频| 国产网红主播福利一区二区| 国产精品亚洲lv粉色| 久久噜噜噜精品国产亚洲综合 | 亚洲午夜精品福利| 国产成人av影院| 国产精品久久久久久人| 日韩在线观看精品| 国产区精品视频在线观看豆花| 黑鬼大战白妞高潮喷白浆| 亚洲欧美在线高清| 女人18毛片一区二区三区| 国产精品91在线| 欧美激情精品久久久六区热门| 久久国产精品无码一级毛片| 欧美日韩和欧美的一区二区| 女人天堂av在线播放| 三级三级久久三级久久18| 国产精品1区2区3区在线观看| 精产国品一区二区| 欧美人与性动交| 日韩精品首页| 久久久久麻豆v国产精华液好用吗| 欧美日韩午夜在线|