精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DB-GPT-Hub:text2sql的微調框架及基準測試套件 原創

發布于 2024-11-28 16:53
瀏覽
0收藏

text2sql任務是將自然語言問題轉換為SQL查詢。使用大模型來進行 sql 生成的方式也越來越常見。根據大模型用于文本到SQL生成的方式,text2sql可以分為兩種場景:零樣本/少樣本提示和微調。

DB-GPT-Hub:text2sql的微調框架及基準測試套件-AI.x社區

盡管少樣本提示的大模型取得了顯著進展,但僅依靠其參數知識和提示來準確處理高度復雜的SQL查詢對于預訓練的大型語言模型來說仍然是一個巨大的挑戰。DB-GPT-Hub側重于微調更大的大型語言模型。

框架設計

DB-GPT 框架下提出了一個端到端大模型 Text2SQL 微調子框架 DB-GPT-Hub。在 DB-GPT 框架下,構架了 Text2SQL 領域下的數據預處理 - 模型微調 - 模型預測 - 模型驗證 - 模型評估的全鏈路工作流程,如下圖所示:

DB-GPT-Hub:text2sql的微調框架及基準測試套件-AI.x社區

DB-GPT-Hub 的架構流程圖

代碼庫設計

  • 數據集構建:將原始文本到SQL數據加工成適合微調LLM的格式(例如,列表1中顯示的TRF),這包括將模式和數據庫描述整合到提示中作為指令,以及在訓練和評估期間增強性能的各種問題表示。此外,我們還將選擇不同的少樣本策略,例如示例選擇和組織,來構建評估數據集(Gao等人,2023)。
  • 訓練:支持使用PEFT策略對開源LLM進行微調。我們支持從小到大的模型規模的大多數公共架構,例如Qwen、Llama、Baichuan和ChatGLM。
  • 預測:支持對開源LLM的微調版本以及閉源LLM進行SQL查詢推理。我們支持少樣本和零樣本方法,以生成特定場景下的SQL。
  • 評估:包含不同的指標(EX、EM、有效效率得分(VES)),以從不同角度評估生成的SQL的性能。

數據集

Spider是一個大規模跨域數據集,包含10,181個自然語言查詢,5,693個獨特的復雜SQL查詢,涵蓋200個數據庫,覆蓋138個領域。該數據集的標準協議將其分為8,659個訓練樣本和2,147個測試樣本,分布在34個數據庫中。SQL查詢分為四個難度級別,即簡單、中等、困難和超難。如下:

簡單:
      Question: What is the number of cars with more than 4 cylinders?
      SQL:SELECT COUNT (*)FROM cars_dataWHERE cylinders > 4

中等:
      Question: For each stadium, how many concerts are there?
      SQL:SELECT T2.name, COUNT (*) FROM concert AS T1 JOIN stadium AS T2ON T1.stadium_id = T2.stadium_idGROUP BY T1.stadium_id

較難:
      Question: Which countries in Europe have at least 3 car manufacturers?
      SQL:SELECT T1.country name FROM countries AS T1 JOIN continents AS T2 ON T1.continent T2.cont_id JOIN car makers AS T3 O N T1.country_id = T3.country WHERE T2.continent = 'Europe' GROUPBY T1.country_name HAVINGCOUNT (*) >= 3

極難:
      Question: What is the average life expectancy in the countries where English is not the official language?
      SQL:SELECT AVG(life_expectancy) FROM country WHERE name NOT IN ( SELECT T1.name FROM country AS T1 JOIN country_language AS T2 ON T1.code = T2.country_code WHERE T2.language = "English" AND T2.is_official = "T")

其他數據集:

  • WikiSQL: 一個大型的語義解析數據集,由80,654個自然語句表述和24,241張表格的sql標注構成。WikiSQL中每一個問句的查詢范圍僅限于同一張表,不包含排序、分組、子查詢等復雜操作。
  • CHASE: 一個跨領域多輪交互text2sql中文數據集,包含5459個多輪問題組成的列表,一共17940個<query, SQL>二元組,涉及280個不同領域的數據庫。
  • BIRD-SQL:數據集是一個英文的大規模跨領域文本到SQL基準測試,特別關注大型數據庫內容。該數據集包含12,751對文本到SQL數據對和95個數據庫,總大小為33.4GB,跨越37個職業領域。BIRD-SQL數據集通過探索三個額外的挑戰,即處理大規模和混亂的數據庫值、外部知識推理和優化SQL執行效率,縮小了文本到SQL研究與實際應用之間的差距。
  • CoSQL:是一個用于構建跨域對話文本到sql系統的語料庫。它是Spider和SParC任務的對話版本。CoSQL由30k+回合和10k+帶注釋的SQL查詢組成,這些查詢來自Wizard-of-Oz的3k個對話集合,查詢了跨越138個領域的200個復雜數據庫。每個對話都模擬了一個真實的DB查詢場景,其中一個工作人員作為用戶探索數據庫,一個SQL專家使用SQL檢索答案,澄清模棱兩可的問題,或者以其他方式通知。

按照NSQL的處理模板,對數據集做簡單處理,共得到約20w條訓練數據

為了充分利用數據庫中的表和字段等相關信息,對 Spider 中的原始數據進行處理,用自然語言表示數據庫包含的表結構以及表結構包含的字段以及相應的主鍵和外鍵等,經過數據預處理后,可以得到如下的數據格式:

{
    "instruction": "concert_singer(數據庫名) contains tables(表) such as stadium, singer, concert, singer_in_concert. Table stadium has columns(列) such as stadium_id, location, name, capacity, highest, lowest, average. stadium_id is the primary key(主鍵). Table singer has columns such as singer_id, name, country, song_name, song_release_year, age, is_male. singer_id is the primary key. Table concert has columns such as concert_id, concert_name, theme, stadium_id, year. concert_id is the primary key. Table singer_in_concert has columns such as concert_id, singer_id. concert_id is the primary key. The year of concert is the foreign key(外鍵)of location of stadium. The stadium_id of singer_in_concert is the foreign key of name of singer. The singer_id of singer_in_concert is the foreign key of concert_name of concert.",
    "input": "How many singers do we have?",
    "response": "select count(*) from singer"
}

{
    "instruction": "concert_singer(數據庫名)包含表(表),例如stadium, singer, concert, singer_in_concert。表體育場有列(列),如stadium_id、位置、名稱、容量、最高、最低、平均。Stadium_id是主鍵(主鍵)。表singer有這樣的列:singer_id、name、country、song_name、song_release_year、age、is_male。Singer_id為主鍵。表concert有如下列:concert_id、concert_name、theme、stadium_id、year。Concert_id是主鍵。表singer_in_concert有如下列:concert_id, singer_id。Concert_id是主鍵。演唱會年份是場館位置的外鍵(外鍵)。singer_in_concert的stadium_id是歌手名的外鍵。singer_in_concert的singer_id是concert的concert_name的外鍵。",
    "input": "我們有多少歌手?",
    "response": "select count(*) from singer"
}

為了更好的利用大語言模型的理解能力,使用了 prompt dict 以優化輸入,如下所示:

SQL_PROMPT_DICT = {
    "prompt_input": (
        "I want you to act as a SQL terminal in front of an example database. "
        "Below is an instruction that describes a task, Write a response that appropriately completes the request.\n\n"
        "###Instruction:\n{instruction}\n\n###Input:\n{input}\n\n###Response: "
    ),
    "prompt_no_input": (
        "I want you to act as a SQL terminal in front of an example database. "
        "Below is an instruction that describes a task, Write a response that appropriately completes the request.\n\n"
        "###Instruction:\n{instruction}\n\n### Response: "
    ),
}

DB-GPT-Hub:text2sql的微調框架及基準測試套件-AI.x社區

Spider數據集上TRP格式的查詢-響應對

指標:

使用兩個常用的指標,精確集匹配準確率(EM)和執行準確率(EX),來評估所有模型的性能。EM衡量預測SQL查詢與其對應真實值之間的匹配SQL關鍵字,而EX比較預測SQL查詢的執行輸出與某些數據庫實例上真實SQL查詢的執行輸出。由于對于給定問題可能存在多個有效的SQL查詢,EX提供了對模型性能更精確的估計。在這兩種指標中,較高的值被認為更好。主要使用EX來評估論文中SQL的準確性。

DB-GPT-Hub:text2sql的微調框架及基準測試套件-AI.x社區

DB-GPT-Hub:text2sql的微調框架及基準測試套件-AI.x社區

LLM

DB-GPT-Hub:text2sql的微調框架及基準測試套件-AI.x社區

支持基座模型

DB-GPT-Hub:text2sql的微調框架及基準測試套件-AI.x社區

微調資源

為了確保公平比較,對所有LLM使用相同的最大上下文長度2048。在評估期間,留下512個token用于響應生成。將參數溫度設置為0,以消除隨機性的影響。

實驗

DB-GPT-Hub:text2sql的微調框架及基準測試套件-AI.x社區

DB-GPT-Hub:text2sql的微調框架及基準測試套件-AI.x社區

參考文獻

  • paper:DB-GPT-Hub: Towards Open Benchmarking Text-to-SQL Empowered by Large Language Models,https://arxiv.org/abs/2406.11434
  • code:https://github.com/eosphoros-ai/DB-GPT-Hub
  • text2sql benchmark:https://github.com/eosphoros-ai/Awesome-Text2SQL


本文轉載自公眾號大模型自然語言處理  作者:余俊暉

原文鏈接:??https://mp.weixin.qq.com/s/Llyb77BSTnyzfOIrBMIPFw??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2024-11-28 18:46:09修改
收藏
回復
舉報
回復
相關推薦
国产精品欧美久久久久一区二区| 日本中文字幕一区二区视频| 成人午夜在线播放| 亚洲欧美日韩精品久久奇米色影视| 337p粉嫩大胆噜噜噜鲁| 不卡在线视频| 福利一区二区在线观看| 国产91在线播放九色快色| 国产精品视频看看| 欧美一区二区三区久久| 欧美剧情电影在线观看完整版免费励志电影 | 亚洲精品电影在线一区| 99视频国产精品免费观看a| 国产亚洲一级| 超在线视频97| 人妻精品久久久久中文| 日韩精品成人| 欧美视频一二三区| 国产欧美在线一区二区| 亚洲中文字幕无码爆乳av| 欧美1区二区| 欧美无砖专区一中文字| 国产手机免费视频| 99reav在线| 91原创在线视频| 91啪国产在线| 日韩综合在线观看| 精品动漫3d一区二区三区免费| 中文字幕av一区二区三区谷原希美| 久草免费资源站| 亚洲影视资源| 欧美性猛交一区二区三区精品| 久久人人爽人人爽人人av| aaa在线观看| 久久久午夜电影| 国产伦精品一区二区三区在线 | 国产成人a人亚洲精品无码| 日韩精品电影在线| 91精品国产高清久久久久久| 婷婷色中文字幕| 国产精品毛片久久| 日韩在线免费av| 在线视频第一页| 国产欧美日韩视频在线| 国产视频欧美视频| 中文字幕乱码在线| 超碰97久久国产精品牛牛| 91精品国产综合久久香蕉的特点| 久久国产这里只有精品| 桃花岛tv亚洲品质| 在线视频国产一区| 亚洲精品一二三四五区| 极品美女一区| 日本高清成人免费播放| 人妻无码视频一区二区三区| 在线观看的黄色| 一本久道久久综合中文字幕| 一区二区传媒有限公司| 蜜桃视频在线观看播放| 欧美日韩国产中字| 浮妇高潮喷白浆视频| 热色播在线视频| 日韩欧美一区二区三区久久| 欧洲一区二区日韩在线视频观看免费 | 在线综合+亚洲+欧美中文字幕| 校园春色 亚洲色图| 国产91亚洲精品久久久| 精品视频在线免费观看| 天天爱天天做天天操| 欧洲美女少妇精品| 亚洲猫色日本管| 欧美国产视频一区| 国内精彩免费自拍视频在线观看网址 | 91在线看视频| 久久视频一区| 国产欧美精品xxxx另类| 国产精品久久影视| 粉嫩绯色av一区二区在线观看| 国产高清在线一区二区| 视频一区二区三区国产| 国产女同性恋一区二区| eeuss中文| 成人影院在线视频| 在线影视一区二区三区| 手机免费av片| 91午夜精品| 亚洲欧洲日产国产网站| 老司机深夜福利网站| 欧美在线亚洲| 97人人做人人爱| 最新国产中文字幕| 成人av网在线| 日韩久久久久久久| 2024最新电影免费在线观看| 婷婷激情综合网| 手机看片一级片| 在线观看视频一区二区三区| 色狠狠色狠狠综合| 亚洲一区二区偷拍| 日韩黄色网络| 久久艳片www.17c.com | 久草资源在线观看| 精品免费在线观看| 日韩va在线观看| 色爱综合av| 久久成人18免费网站| 波多野结衣视频免费观看| 国产剧情av麻豆香蕉精品| 国产欧美日韩精品在线观看| 丰满人妻一区二区三区免费视频| 国产亚洲成aⅴ人片在线观看 | 99精品国产99久久久久久福利| 国产黑人绿帽在线第一区| 亚洲经典一区二区三区| 国产精品欧美一区喷水| 99色精品视频| 成人免费在线电影网| 日韩在线视频国产| 波多野结衣 久久| 成人福利在线看| 这里只有精品66| 极品美女一区| 亚洲精品久久久久中文字幕欢迎你| 羞羞在线观看视频| 日韩综合在线视频| 蜜桃狠狠色伊人亚洲综合网站| 97超碰资源站在线观看| 欧美日韩国产一级二级| 亚洲理论片在线观看| 中文精品一区二区| 欧美激情视频网| 96日本xxxxxⅹxxx17| 久久综合资源网| 少妇av一区二区三区无码| 久久99成人| 精品动漫一区二区三区在线观看| www.99re6| 美腿丝袜亚洲色图| 日韩精品一区二区三区丰满| 亚洲黄色网址| 亚洲精品久久久久国产| 久久免费看少妇高潮| 欧美久久精品一级黑人c片| 亚洲午夜无码久久久久| 91免费观看国产| 国产91xxx| 欧美大胆a级| 97久久超碰福利国产精品…| 蜜桃视频污在线观看| 亚洲一区二区av电影| 久久久久无码精品| 午夜亚洲福利| 风间由美久久久| 性欧美ⅴideo另类hd| 日韩三级视频在线看| 在线免费观看亚洲视频| 国产成人三级在线观看| 无码av天堂一区二区三区| 999精品视频在这里| 国内精品模特av私拍在线观看| 后进极品白嫩翘臀在线视频| 午夜激情久久久| av网站免费在线播放| 久久亚洲不卡| 亚洲国产精品久久久久婷婷老年| 日韩午夜视频在线| 欧美日韩国产成人在线观看| 黄色av免费观看| 欧美日韩另类视频| 免费一级黄色录像| 国内精品免费**视频| 成人免费a级片| 你懂的一区二区三区| 国产男人精品视频| 日本大片在线播放| 亚洲国产精品欧美一二99| 黑人玩弄人妻一区二区三区| 日韩亚洲国产精品| 天天久久人人| 午夜视频一区二区在线观看| 91成品人片a无限观看| 第三区美女视频在线| 3d动漫精品啪啪一区二区竹菊| 久久一区二区三| 久久久久久免费网| 欧美国产日韩在线视频| 国产精品尤物| 香蕉视频在线网址| 免费萌白酱国产一区二区三区| 国产精品大片wwwwww| 黑人操亚洲女人| 在线观看免费一区| 精国产品一区二区三区a片| 91蝌蚪porny| 亚洲一区二区在线视频观看| 影音先锋亚洲电影| 亚洲精品一品区二品区三品区| 亚洲精品福利| 国产精品pans私拍| 久久99亚洲网美利坚合众国| 亚洲视频欧洲视频| 午夜老司机福利| 欧美亚洲国产一卡| 1级黄色大片儿| 亚洲色图都市小说| japanese中文字幕| 成人永久免费视频| 伊人网在线综合| 天堂精品中文字幕在线| 乱熟女高潮一区二区在线| 精品国产一区探花在线观看| 国产精品久久波多野结衣| av成人在线观看| 26uuu另类亚洲欧美日本一 | 久久综合五月天婷婷伊人| 伊人国产精品视频| 日韩专区在线视频| 亚洲中文字幕无码专区| 欧美久久综合| 吴梦梦av在线| 欧美色女视频| 欧美不卡三区| 极品国产人妖chinesets亚洲人妖| 91九色在线视频| 国产成人77亚洲精品www| 77777亚洲午夜久久多人| 怡红院红怡院欧美aⅴ怡春院| 在线视频中文亚洲| 黄色毛片在线看| 日韩人在线观看| 黄色小视频在线免费看| 亚洲欧美日韩国产综合| 国产精品麻豆一区| 欧美国产视频在线| 中文字幕人妻一区二区三区在线视频| 北条麻妃国产九九精品视频| japan高清日本乱xxxxx| 国产一区二区不卡在线| 激情文学亚洲色图| 美女视频黄频大全不卡视频在线播放| 日本成年人网址| 国产亚洲亚洲| 国产精品无码av无码| 香蕉视频成人在线观看| 久久无码高潮喷水| 久久成人亚洲| 成人午夜视频免费在线观看| 一本久道久久综合狠狠爱| 日本中文字幕网址| 国产精品久久国产愉拍| 黄色一级片播放| 久久午夜精品| 日日噜噜夜夜狠狠| 精品一区二区三区欧美| 亚洲三级在线观看视频| 国产一区二区不卡在线| 免费国偷自产拍精品视频| 国产99久久久国产精品潘金| 亚洲精品无码一区二区| 99久久综合色| 永久免费成人代码| 亚洲欧美在线aaa| 永久看片925tv| 午夜欧美一区二区三区在线播放| 国产真实乱人偷精品视频| 午夜日韩在线电影| 波多野结衣绝顶大高潮| 欧美日韩精品欧美日韩精品| 国产免费无遮挡| 亚洲精品在线网站| 青青草视频免费在线观看| 亚洲天堂成人在线| 久久精品视频观看| 久久人91精品久久久久久不卡| 筱崎爱全乳无删减在线观看| 国产精品久久久久久久电影| 国产精品高清一区二区| 成人毛片网站| 国产精品一区二区av交换| 亚洲资源在线网| 欧美日韩a区| 大肉大捧一进一出好爽动态图| 老司机午夜精品| 久久久久亚洲AV成人网人人小说| 久久免费美女视频| 国产av 一区二区三区| 精品久久久精品| 国产一区二区三区黄片| 亚洲大胆人体视频| 成人18在线| 97国产在线视频| 国内自拍亚洲| 久久久综合香蕉尹人综合网 | 轻点好疼好大好爽视频| 免费亚洲视频| 少妇丰满尤物大尺度写真| 久久久久久久久免费| 国产波霸爆乳一区二区| 日本高清不卡一区| 亚洲精品久久久久久无码色欲四季| 亚洲人精品午夜在线观看| 亚洲第一图区| 国产精品视频在线播放| 欧美三级午夜理伦三级在线观看| 亚洲一区在线直播| 亚洲免费网址| 久久久久99人妻一区二区三区| 亚洲国产高清aⅴ视频| 一区二区三区视频免费看| 91精品免费在线观看| 精品美女视频在线观看免费软件| 欧美精品免费在线| 黄色日韩网站| 欧美日韩一区二区视频在线| 欧美视频日韩| 91女神在线观看| 久久九九99视频| 亚洲男人第一av| 五月天亚洲精品| 精品二区在线观看| 日韩中文字幕网址| 国产鲁鲁视频在线观看特色| 欧美一级在线播放| 极品国产人妖chinesets亚洲人妖| 色中文字幕在线观看| 日本欧美一区二区三区乱码| 亚洲成人av免费在线观看| 亚洲一区二区在线免费看| 国产一区二区三区中文字幕| 中文字幕亚洲欧美在线| 欧美成人黑人| 久久婷婷国产综合尤物精品| 在线欧美福利| 国产女主播在线播放| 一区二区三区日韩精品| 99久久久久久久| 欧美精品一区二区免费| 99热这里有精品| 久久免费视频2| 国内精品自线一区二区三区视频| 疯狂撞击丝袜人妻| 欧美精品一级二级| 男人资源在线播放| 成人免费网站在线| 亚洲国产精品成人| 老太脱裤让老头玩ⅹxxxx| 国产成a人无v码亚洲福利| 久热这里有精品| 日韩午夜激情av| 久久不射影院| 久久久久久一区| 久久激情中文| 在线观看免费小视频| 欧美性猛片xxxx免费看久爱| 永久免费av在线| 久久久这里只有精品视频| 51社区在线成人免费视频| 精品无码国产一区二区三区av| 粉嫩13p一区二区三区| 国产亚洲精品码| 日韩国产精品一区| 欧美黄色三级| 亚洲福利av在线| 国产一区二三区| 日本少妇性生活| 亚洲免费av电影| 岛国一区二区| a级片一区二区| 91丨porny丨在线| 综合久久中文字幕| 欧美肥老妇视频| 亚洲色图美女| 超碰成人在线播放| 亚洲图片有声小说| 久草在线免费福利资源| 国产日本欧美一区二区三区| 欧美国产高潮xxxx1819| 人妻丰满熟妇av无码久久洗澡| 在线精品视频一区二区| av片在线观看永久免费| 激情久久av| 亚洲精品a级片| 中文字幕在线视频播放| 在线视频欧美区| 日韩三级电影视频| 日韩av一级大片| 国产99精品在线观看| 中文字幕在线看人| 欧美精品免费在线观看| 国产一区二区在线| 中文字幕乱码在线人视频| 色综合色综合色综合色综合色综合 | 久久久精品影院| 欧美成人一区在线观看| 做a视频在线观看| 日本精品一级二级| 麻豆蜜桃在线| 尤物一区二区三区| 91免费观看视频| 亚洲精品一区二区三区新线路|