精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

浙大開源“最懂Excel的GPT”!首次將結構化數據作為獨立模態訓練,刷榜提升40百分點

人工智能 新聞
這就是由LeCun高徒、浙江大學博導趙俊博領銜打造的TableGPT2。

大模型理解復雜表格,能力再次飛升了!

不僅能在不規則表格中精準找到相關信息,還能直接進行計算。

比如提問:

如果2022年出口總額的人民幣計價比實際數值少了10%,請計算新的出口總額并與實際數據比較。

普通的大模型要么找不到正確的單元格信息,要么會計算錯誤。

而最新模型給出了正確回答:

實際出口總額為121324327.3663萬元,減少10%后的出口總額為109191894.62967001萬元。

圖片

這就是由LeCun高徒、浙江大學博導趙俊博領銜打造的TableGPT2。

它首次將結構化數據作為獨立模態進行訓練,這意味著大模型將不再依賴長上下文窗口,而是直接理解數據庫、Excel、數倉中的數據,進而搞定SQL、分析、增刪改查等相關任務。

圖片

要知道,結構化數據已是無處不在,從BI(商業智能)到當下爆火的具身智能,大模型想要被更充分精準應用于這些領域,就不能再單純以“文科生”的形式去學習。

圖片

由此趙俊博等人耗時1年帶來了更強大的TableGPT2。

在23個基準測試中,TableGPT2都表現優異,平均性能提高35.20%(7B模型)和49.32%(72B模型)。

目前團隊已將兩個版本的模型、一個Agent工作流以及RealTabBench中的一個子集開源。

關鍵在表格編碼器

在TableGPT2之前,業界幾乎沒有人嘗試將結構化數據作為獨立模態。這主要有兩方面原因——

第一,數據庫中表格的空間關系存在特殊性。比如在圖像視頻上任意交換像素或者詞的token,都會改變數據的本質,這說明兩種模態之間具備空間依賴關系。但是在數據庫的表格中,隨機交換2行或2列數據,表格本身并不會變化。目前我們缺乏工具和手段去應對結構化數據這種特點。

第二,結構化數據存在異質性。比如在CV領域,RGB是很客觀的表達,紅色就是紅色,藍色就是藍色,自然語言也是一樣。但是在結構化數據中,同樣一個表格字段下面的標記,在不同數據庫里的意義可能截然不同。比如都是“1,2,3”,不同圖表中表示的內容可能完全不同。所以這種“異質性”要求大模型對整體的庫、表和字段都有理解,才能給出實際意義。這部分的對齊和傳統LLM對齊不太一樣。

圖片

不過這些問題也不是完全不能解決。

趙俊博介紹,針對表格數據,如果掩碼掉一個“子表”的一些單元格,加上字段、數據庫的信息輔助,是可以才出來掩碼信息的內容。這意味著盡管結構化數據的空間關系比較弱,但是本身還是有分布可以去學習的。

由此,研究團隊提出了TableGPT2工作。

它基于Qwen2.5系列模型,使用超過860億token進行預訓練,給大模型喂入了超過59.38萬張表和236萬高質量的查詢-表-輸出樣本,并創新性加入了一個表格編碼器,專門用于讀取和解釋表格數據。

圖片

模型主要框架包括以下幾個部分:

  • 表格編碼器
  • LLM解碼器
  • 持續預訓練
  • 監督微調
  • Agent工作流

表格編碼器支持輸入整個表格,生成每列的緊湊嵌入。

采用雙維注意力機制,無需位置嵌入,同時進行分層特征提取,確保行和列的關系被有效捕捉。

再使用列對比方法,鼓勵模型學習有意義的、結構感知的語義表示。

具體實現上,通過Q-former樣式適配器對齊嵌入和文本輸入,引入可學習的查詢。

使用特殊標記(如”“和”“)區分表格特征與文本,這樣模型可以同時處理兩種模態。

應用聯合指令微調來增強文本信息、列嵌入和模式單元數據之間的對齊,提高模型對表格數據的理解和解釋能力。

值得一提的是,這個表格編碼器可以單獨使用。作者團隊透露,后續還將發表相關論文。

圖片

LLM解碼器則基于Qwen-2.5模型,用于自然語言生成。

具體訓練部分,預訓練階段首先針對模型的編碼和推理能力進行加強。80%的預訓練數據是有優質注釋的代碼,這和DeepSeek-v2的方法一致,以確保強大的編碼能力。

同時還融入了大量推理數據和特定領域知識(比如金融、制造、生物等),以增強推理能力。

在數據處理層面,采用兩級過濾策略。

文檔層面將數據標記為54個不同類別,token層面利用RHO-1來微調高質量token。

圖片

預訓練部分的數據由86B個token組成。

圖片

進行監督式微調主要是為了提高模型在BI特定任務中的表現。

作者構建了一個包含236萬條樣本的數據集,主要覆蓋多輪對話、復雜推理、工具使用和高度特定的業務查詢場景,包含代碼生成、數據可視化、統計測試和預測建模等表格任務。

通過模糊化字段引用、匿名化字段名等方法增強模型在處理復雜任務時的魯棒性。

最后來看Agent框架。

該框架由運行時prompt、代碼沙箱和agent評估模塊共同增強agent的能力和可靠性。

具體工作流如下。首先通過prompt模塊處理輸入查詢,經過檢索增強處理后將查詢輸入到主模型中。然后TableGPT2與VLM協作,生成工具調用、代碼或其他相關操作。利用智能體的反思能力,觀察中間結果,判斷是否需要迭代。最終得到輸出。

圖片

部分基準下超越GPT-4o

實驗階段,作者將TableGPT2與其他大模型進行性能對比。

對比對象主要分為兩類。

第一類為主流開源大模型,包括DeepSeek-Coder-V2-Lite-16B、YiCoder-9B-Chat、Qwen2.5-Coder-7B-Instruct和Qwen2.5-7B-Instruct。

第二類為針對表格相關任務進行微調或專門開發的模型。包括TableLLMs和CodeLlama-13B。

實驗主要評估模型的6方面任務:表格理解、問答、事實論證、表格到文本、自然語言到SQL、整體評估。

圖片

在不同benchmark上,各個模型表現如下。TableGPT2顯著優于絕大部分其他模型,并在一些基準上超越GPT-4o。

圖片

結果顯示,TableGPT2的7B模型和72B模型的平均準確率分別提高了35.20%和49.32%。

此外,考慮到當下benchmark中針對表格異形問題、匿名問題或者治理較差的情況兼顧不佳,而實際落地中90%以上case都會出現類似情況。

作者還構建了一個新的benchmark—— RealTabBench。它更加關注實際應用中真實出現的問題。

結果顯示在RealTabBench上,TableGPT2表現也是最好。

圖片

另外,TableGPT2不會導致基座模型通用能力下降。

圖片

LeCun高徒“砸鍋賣鐵”開發

該研究來自浙江大學計算機與科學技術學院計算創新研究所。

由助理教授、博士生導師趙俊博領銜。

圖片

趙俊博于2019年獲得紐約大學計算機專業博士學位,師從圖靈獎得主、Meta首席AI科學家、紐約大學教授Yann LeCun。

他曾在Meta(原Facebook)人工智能實驗室(Facebook AI Research)任研究員,期間深度參與了深度學習主流框架PyTorch和向量數據庫Faiss的開發,并曾參與了內部通用對話機器人項目的前沿研究,該工作被視為大模型方向的早期產品化工作之一。

曾于2015年供職于英偉達半年時間,聯合主持開發了全球首個端到端的自動駕駛解決方案,該工作由英偉達創始人Jensen Huang在次年的GTC 大會上做隆重介紹。

截至目前論文總被引數已超過20000次。

圖片

去年,趙俊博主持研發了TableGPT。

這是全球首款對接關系數據庫和數據倉的大模型產品。

圖片

2024年,團隊又繼續“砸鍋賣鐵”,給TableGPT升級了V2版本。

圖片

作為高校團隊,開發一個大模型意味著算力上要砸錢、數據收集工程優化上要出人,這中間有非常多的坑,需要消耗巨大人力財力。

而且TableGPT2的開發還有著諸多難點。

首先在技術上,構建一個在table上單獨模態的編碼器很難弄。它獨有的復雜結構和空間特點,以及字段語義信息對齊等,都有考驗。

其次在數據方面。結構化數據怎么收集、清洗?標簽體系怎么定制?如何把合成數據和人工數據合并?怎么做到成本可控,都是問題。

以及監督微調部分,不光需要輸入輸出樣本對,而且需要收集表,專業領域的數據表還需要專業人士進行標注……

不過為啥還是要做呢?

因為他們看到了大模型理解結構化數據背后更廣闊的應用前景。

趙俊博向量子位介紹,作為高校團隊,他們現在的工作更多是為了“趟路”。

做結構化這件事,我們不會停留在Excel或者數據庫上面,下一步技術發展肯定是往硬件和具身智能領域上走。

靈巧手的觸覺信息,還有具身智能領域的視覺、聽覺等,廣義來說都屬于結構化數據,我們還想往這個方向再往前一步。

與此同時,TableGPT2也會在產業落地上試水,希望能給從業者提供更好用的底座模型。

目前,團隊已經開源了這項工作的多個成果,后續也會發布表格編碼器的相關研究,感興趣的童鞋可以進一步了解~

[1]論文地址:https://arxiv.org/html/2411.02059v1

[2]一個可用agent的git倉庫: https://github.com/tablegpt/tablegpt-agent

[3]模型開源:https://huggingface.co/tablegpt/TableGPT2-7B 

責任編輯:張燕妮 來源: 量子位
相關推薦

2016-08-12 16:20:30

2009-01-08 09:26:53

AMD拆分AMD股份AMD股票

2015-11-25 13:58:40

2021-10-14 18:55:17

百分點科技DeepMatrix

2017-07-12 15:30:59

人工智能知識圖譜深度學習

2023-03-31 09:08:33

百分點數據科學

2016-03-24 15:12:33

2015-12-04 14:49:21

ios9

2017-12-15 14:52:55

百分點

2024-12-06 14:19:50

2018-05-25 18:52:16

百分點,大數據

2018-05-25 18:49:27

百分點,AI,人工智能

2025-03-03 07:39:23

2013-09-03 10:11:37

Windows 8Mac OS X

2015-09-13 09:29:52

百分點

2025-11-17 10:51:05

2023-05-04 08:07:38

微軟Windows

2009-02-12 09:50:55

軟件出口外包增長

2024-11-07 15:30:00

2024-09-24 13:00:00

大語言模型AI
點贊
收藏

51CTO技術棧公眾號

国产精品毛片久久久久久久av| 三上悠亚影音先锋| 欧美78videosex性欧美| 岛国精品在线播放| 国产成人啪精品视频免费网| 顶级黑人搡bbw搡bbbb搡| 亚洲图色一区二区三区| 黄色成人在线播放| 一本一生久久a久久精品综合蜜| 99久久免费国产精精品| 西西人体一区二区| 久久久av电影| 成人影视免费观看| 精品一区二区三区免费看| 精品久久久久久久久久久| 亚洲区一区二区三区| 欧美 日韩 人妻 高清 中文| 日本午夜一区二区| 久久久久久久久久久免费| 少妇人妻好深好紧精品无码| 成人性生交大片免费看96| 欧美日韩一二三区| 日韩avxxx| 欧美6一10sex性hd| 一色屋精品亚洲香蕉网站| 国产伦精品一区二区三区高清版 | 欧美少妇性xxxx| 精品国产免费人成在线观看| 亚洲免费黄色网| 2022成人影院| 亚洲电影第三页| 桥本有菜av在线| 福利视频在线播放| 91丨porny丨国产| 成人高清在线观看| 国产精品福利电影| 蜜桃av一区二区在线观看| 81精品国产乱码久久久久久| 久久免费在线观看视频| 亚洲人metart人体| 日韩在线欧美在线国产在线| b站大片免费直播| 欧美成人一区在线观看| 精品欧美乱码久久久久久1区2区| 成年网站免费在线观看| jizzyou欧美16| 日本道精品一区二区三区| 免费观看日韩毛片| 手机在线观看av| 午夜私人影院久久久久| 18禁裸男晨勃露j毛免费观看| 黄色一级片在线观看| 国产精品理伦片| 亚洲自拍三区| 麻豆电影在线播放| 亚洲天堂精品在线观看| 国产系列第一页| 老司机午夜在线视频| 中文字幕亚洲区| 一区二区视频在线观看| 免费a级在线播放| 亚洲男人的天堂在线观看| www亚洲国产| 超碰最新在线| 亚洲一二三级电影| 国产人妻777人伦精品hd| 成人免费观看在线观看| 精品女厕一区二区三区| 国产午夜伦鲁鲁| 精品3atv在线视频| 欧美日韩五月天| 一二三av在线| 高潮久久久久久久久久久久久久| 亚洲精品在线免费播放| 国产视频久久久久久| 杨幂一区二区三区免费看视频| 亚洲欧洲日产国码av系列天堂| 国产传媒国产传媒| 国产精品88久久久久久| 九九视频这里只有精品| 国产成人精品片| 日韩精品五月天| 亚洲精品欧美日韩| 少妇无码一区二区三区| 国产三级久久久| 国产成人三级视频| 在线精品亚洲欧美日韩国产| 欧美情侣在线播放| 亚洲一区和二区| 午夜a一级毛片亚洲欧洲| 国产一区二区动漫| 老女人性淫交视频| 久久久精品午夜少妇| 国产精品夫妻激情| www.天堂av.com| 久久久久久亚洲综合影院红桃| 亚洲精品一区国产精品| 肉肉视频在线观看| 色婷婷激情一区二区三区| 91看片破解版| 亚洲宅男一区| 久久97久久97精品免视看| 欧美日韩综合在线观看| 久久99蜜桃精品| 精品久久久久亚洲| 日本在线观看免费| 亚洲午夜免费电影| 欧美成年人视频在线观看| 91麻豆精品国产91久久久久推荐资源| 亚洲男子天堂网| 久久久久久久久艹| 美女在线观看视频一区二区| 国产精品一区在线播放| 91看片在线观看| 精品久久久精品| 波多野结衣在线免费观看| 蜜乳av综合| 欧美精品久久久久久久| 中文字幕免费播放| 久久综合九色综合97_久久久| 强伦女教师2:伦理在线观看| 欧美日韩免费看片| 亚洲福利视频免费观看| 亚洲一级二级片| 巨乳诱惑日韩免费av| 国产99视频精品免费视频36| 免费av网站在线观看| 日本韩国一区二区| 国产又黄又粗又猛又爽的视频| 欧美精品日韩| 亚洲a∨日韩av高清在线观看| 超碰国产在线| 色综合久久综合网欧美综合网| 亚洲视频天天射| 欧美日本一区二区视频在线观看| 成人天堂噜噜噜| www免费网站在线观看| 欧美性极品xxxx娇小| 女性生殖扒开酷刑vk| 午夜日韩电影| 91成人在线看| 二区三区在线观看| 在线成人小视频| 国产人与禽zoz0性伦| 日韩电影在线免费观看| 欧美色欧美亚洲另类七区| 中文字幕资源网在线观看免费| 亚洲第一色中文字幕| 久久精品免费在线| 成人性生交大片免费看中文网站| 国产精品久久成人免费观看| 日韩久久一区| www国产精品视频| 一二三四区在线| 亚洲欧美在线另类| 蜜臀一区二区三区精品免费视频| 日韩欧美午夜| 成人两性免费视频| 中文字幕中文字幕在线中高清免费版| 欧美一区二区三区视频免费| 玖玖爱免费视频| 大美女一区二区三区| 日韩欧美不卡在线| 另类在线视频| 国产成人福利视频| 日本不卡不卡| 欧美大片顶级少妇| 亚洲视频免费播放| 国产亚洲精品aa午夜观看| 免费看污污网站| 亚洲国产不卡| 国产高清自拍99| 成人免费影院| 日韩在线观看免费高清| 亚洲va天堂va欧美ⅴa在线| 亚洲成人av电影在线| 中国毛片在线观看| 精品在线播放午夜| 国产自产在线视频| 久草在线成人| 成人在线播放av| 蜜臀av在线| 亚洲性69xxxbbb| av免费在线不卡| 欧美日韩国产精品| 国产第一页精品| 国产成都精品91一区二区三| 欧美污视频网站| 国产大片一区| 精品网站在线看| 亚洲综合伊人| 欧美在线视频a| 麻豆传媒在线完整视频| 亚洲精品国产品国语在线| 中文字幕乱码中文字幕| 亚洲午夜精品一区二区三区他趣| japanese中文字幕| 国产精品一区二区果冻传媒| 欧美日韩第二页| 欧美一区成人| 日本一区二区三区四区高清视频| 麻豆国产一区| 国产精品福利观看| 国产99在线| 久久这里只有精品视频首页| 日本午夜在线视频| 日韩欧美一区二区三区在线| 伊人久久久久久久久久久久 | 亚洲日本韩国在线| 国产精品成人免费在线| jizz欧美性20| 国产sm精品调教视频网站| 欧美日韩在线观看不卡| 一本一本久久| 少妇一晚三次一区二区三区| 久久亚洲影视| 日本一区二区精品视频| 动漫3d精品一区二区三区乱码| 国产精品永久免费| 在线天堂资源www在线污| 欧美高清视频一区二区| 日本不卡视频| 中文字幕久久精品| 日本电影一区二区在线观看| 欧美大片一区二区| 国产成a人亚洲精v品无码| 欧美视频在线一区二区三区| 黑人精品无码一区二区三区AV| 亚洲一区自拍偷拍| 亚洲不卡在线播放| 国产精品国产三级国产aⅴ无密码 国产精品国产三级国产aⅴ原创 | 国产另类xxxxhd高清| 91tv亚洲精品香蕉国产一区7ujn| 天堂av中文在线| 免费av在线一区| 毛片在线看片| 久久亚洲欧美日韩精品专区 | 久久久亚洲成人| 在线免费观看的av| 久久精品中文字幕| 国产精品实拍| 久久福利视频导航| 成人免费网站在线观看视频| 日韩在线不卡视频| 黄色在线播放网站| 美女久久久久久久久久久| 免费高清在线观看| 日韩有码在线电影| 国产在线二区| 欧美激情国产精品| 丁香花在线观看完整版电影| 久久久久国产一区二区三区| 波多野结衣在线高清| 欧美精品18videosex性欧美| 乱插在线www| 久久久在线视频| 麻豆网站免费在线观看| 日韩av日韩在线观看| 日韩高清中文字幕一区二区| 国产91露脸中文字幕在线| 四虎成人在线| 91精品免费看| 97品白浆高清久久久久久| 韩国成人动漫在线观看| 自拍欧美一区| 国产成人精品免费看在线播放| 久久久久免费av| 免费高清一区二区三区| 999在线观看精品免费不卡网站| 欧美v在线观看| 久久午夜精品| 久久久久久久久久久久久久久国产| 国产麻豆91精品| 国产一级黄色录像| 国产亚洲欧美色| 老司机成人免费视频| 亚洲一区二区中文在线| 国产婷婷色一区二区在线观看| 欧美日本韩国一区| 亚洲国产精品无码久久| 精品偷拍一区二区三区在线看| 在线观看免费网站黄| 欧美日韩国产成人在线观看| 免费成人动漫| 91亚洲精品一区| 精品国产一区二区三区成人影院| 日韩精品资源| 欧美日韩 国产精品| 欧美黄网站在线观看| 激情五月婷婷综合| 最近中文字幕无免费| 国产精品久久久久一区| 欧美一级高潮片| 欧美日韩综合一区| 狠狠躁日日躁夜夜躁av| 中文日韩在线观看| 男女在线观看视频| 国产精品美女主播在线观看纯欲| 97久久精品| 中国成人亚色综合网站 | 久久久久久噜噜噜久久久精品| 亚洲www.| 国产麻豆日韩| 97视频精品| 不要播放器的av网站| 成人综合婷婷国产精品久久蜜臀| 人人妻人人澡人人爽| 亚洲国产另类av| 国产免费高清视频| 国产一区二区激情| 999福利在线视频| 91精品中国老女人| 国产在线日韩精品| 亚洲色成人www永久在线观看 | 国产欧美一区二区白浆黑人| 精品国产乱子伦一区二区| 亚洲国产精品女人| 美国av一区二区| 亚洲黄色小说视频| 亚洲va中文字幕| www.久久综合| 久色乳综合思思在线视频| 97欧美成人| 欧美日韩成人一区二区三区| 激情文学一区| 一区二区三区四区影院| 亚洲色图在线视频| 亚洲天堂视频网| 亚洲色图35p| www.日韩| 欧美三级网色| 男人的天堂亚洲在线| 91丝袜在线观看| 亚洲国产日韩a在线播放| av老司机久久| 欧美成人免费大片| 欧美一级大片在线视频| 在线免费观看成人| 毛片一区二区三区| 精品伦精品一区二区三区视频密桃| 日韩欧美黄色动漫| 飘雪影院手机免费高清版在线观看| 国内伊人久久久久久网站视频 | 激情综合色播激情啊| 天堂а√在线中文在线鲁大师| 欧美日韩激情一区| 免费在线看黄色| 亚洲精品日产aⅴ| 午夜精品影院| 免费看毛片的网站| 欧美性高潮在线| 番号集在线观看| 国产精品美女午夜av| 91亚洲国产| 日韩a一级欧美一级| 一区二区三区欧美| 欧洲精品久久一区二区| 97人洗澡人人免费公开视频碰碰碰| 高潮按摩久久久久久av免费| 亚洲熟女乱色一区二区三区| 久久亚洲精品小早川怜子| 夜夜爽妓女8888视频免费观看| 中文字幕精品网| www一区二区三区| 妺妺窝人体色777777| 91亚洲国产成人精品一区二三| 国产一级片毛片| 国产午夜精品视频| 欧美电影在线观看网站| 男人的天堂成人| 成人av电影在线| 国产精品熟女视频| 爽爽爽爽爽爽爽成人免费观看| www999久久| 国产中文字幕二区| 国产日韩欧美综合一区| 亚洲天堂手机版| 欧美激情在线观看| 亚洲国产精品嫩草影院久久av| 色片在线免费观看| 一区二区三区在线免费观看| 五月激情婷婷网| 国产精品美女在线| 极品av少妇一区二区| 蜜桃av免费看| 日韩一区二区三区精品视频| 中文在线资源| www.国产二区| 国产亚洲一区二区三区| 国产成人麻豆精品午夜在线| 欧美成年人在线观看| 伊人久久大香线蕉无限次| 成人日韩在线视频| 狠狠综合久久av一区二区小说 | 国内精品久久久久久久久| 精品国产一区二区三区四区 | 久久久久国产精品人| 国产精品爽爽久久| 热久久这里只有精品| 欧美日韩视频一区二区三区|