精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

從少樣本到千樣本!MachineLearningLM給大模型上下文學習裝上「機器學習引擎」

人工智能 新聞
這項名為 MachineLearningLM 的新研究提出了一種輕量且可移植的「繼續預訓練」框架,無需下游微調即可直接通過上下文學習上千條示例,在金融、健康、生物信息、物理等等多個領域的二分類 / 多分類任務中的準確率顯著超越基準模型(Qwen-2.5-7B-Instruct)以及最新發布的 GPT-5-mini。

盡管大型語言模型(LLM)擁有廣泛的世界知識和強大的推理能力,被廣泛視為優秀的少樣本學習者,但在處理需要大量示例的上下文學習(ICL)時仍存在明顯局限。

已有工作表明,即使提供多達上百甚至上千條示例,LLM 仍難以從中有效學習規律,其表現往往很快進入平臺期,甚至對示例的順序、標簽偏差等較為敏感。在利用上下文學習解決新任務時,LLM 往往更依賴于自身的強先驗以及示例的表面特征,而難以真正挖掘出示例中潛在的因果機制或統計依賴。

這項名為 MachineLearningLM 的新研究突破了這一瓶頸。該研究提出了一種輕量且可移植的「繼續預訓練」框架,無需下游微調即可直接通過上下文學習上千條示例,在金融、健康、生物信息、物理等等多個領域的二分類 / 多分類任務中的準確率顯著超越基準模型(Qwen-2.5-7B-Instruct)以及最新發布的 GPT-5-mini。

相比于已有的用于表格數據的機器學習方法,MachineLearningLM 幾乎完全保留了 LLM 通用能力,這意味著它可以無縫集成到更復雜的對話工作流中。

  • 論文鏈接: https://arxiv.org/abs/2509.06806
  • 模型和數據集: https://huggingface.co/MachineLearningLM
  • 代碼: https://github.com/HaoAreYuDong/MachineLearningLM

核心創新一:百萬級合成任務「授人以漁」

研究團隊旨在賦予 LLM 一種「舉一反三」的元能力 —— 不依賴對真實任務數據的機械記憶,而是通過海量且多樣化的合成任務,從根本上訓練模型在大量上下文示例中挖掘規律并進行預測的能力。

傳統的指令微調方法通?;谟邢抟幠#s為千數量級)的真實任務數據,這在很大程度上限制了模型向新任務的泛化能力。與之相比,MachineLearningLM 構建了一個超過 300 萬合成任務的大規模預訓練語料庫。

任務生成器基于結構因果模型(Structural Causal Model, SCM)來采樣生成二分類及多分類任務。SCM 通過有向無環圖(DAG)和結構方程(采用神經網絡與樹模型實現)明確定義變量間的因果關系,能夠精確控制特征的邊際分布、類型(如數值型或類別型)以及標簽生成機制。

該方法確保預訓練數據與下游真實評估集沒有任何重疊,從而保證評估過程對模型泛化能力的檢驗具備充分公平性。同時,通過控制示例數量從數個到 1024 個不等,該機制能夠專門訓練模型處理「多示例」場景的推理能力。

 核心創新二:隨機森林模型「循循善誘」

在海量合成任務上直接訓練大型語言模型(LLM)容易因任務質量不一致 —— 例如存在信號微弱或類別極度不平衡等情況 —— 而導致訓練崩潰或陷入局部最優。為解決這一問題,本研究引入隨機森林(Random Forest)模型,利用其強大且穩健的建模能力,設計了如下兩級過濾機制:

  • 樣本級共識過濾(熱身訓練階段):在熱身訓練中,為每個合成任務訓練一個隨機森林模型,并引導 LLM 學習模仿其預測行為。具體而言,僅保留隨機森林預測結果與真實標簽一致的那些樣本用于 LLM 的訓練。該方法通過提供清晰且高置信度的監督信號,使 LLM 初步建立起準確的上下文建模能力,尤其是數值建模能力,為后續過渡到自主上下文學習奠定基礎。
  • 任務級過濾(全程訓練階段):在整個訓練過程中,除為每個任務構建隨機森林模型外,還引入保守隨機基線(如隨機猜測或坍塌到多數類的預測方法),以剔除那些隨機森林表現未顯著優于基線的無效任務。評估指標包括機會校正一致性、失衡魯棒準確率、宏平均準確率以及避免預測坍塌等指標。

為何選擇隨機森林?除了強大且穩健的建模能力,隨機森林具有高度透明的決策過程,可分解為清晰的規則路徑與特征重要性評估,這種可解釋性與 LLM 的思維鏈(Chain-of-Thought, CoT)推理模式天然契合,有助于后續推進思維鏈預測及解釋性預測任務。

同時,隨機森林能夠提供預測置信度,為進一步減少 LLM 幻覺問題引入置信度機制提供了可能。

核心創新三:高效上下文示例編碼「多維擴容」

在大模型時代,如何高效地在上下文學習中處理海量表格數據,是一項重要挑戰。傳統的「自然語言描述」方式(例如:「收入是 29370,職業是博士,年增長率是 - 12.34% → 標簽:1」),占用 token 多、計算開銷大,嚴重限制了實際應用中可支持的示例數量;數值型特征經分詞器處理時,一個小數可能被拆成多個 token,既浪費長度又可能導致數值比較錯誤,如模型容易誤認為「1.11」(1|.|11)比「1.9」(1|.|9)大。

為此,作者提出了三項核心優化策略,顯著提升了上下文學習的數據容納能力與推理效率:

  • 告別「小作文」,樣本用表格來組織: SpreadsheetLLM 等研究已廣泛證明,LLM 能很好地理解結構化表格,因此作者放棄相關工作將結構化數據展開成冗長自然語句的做法,轉而采用緊湊的表格編碼格式。

  • 把數字「打包」成整數,告別 token 碎片化:先遵循機器學習工程的常見操作,將所有數值基于訓練集數據分布逐列進行 z-score 標準化;然后將 z-norm 下 ±4.17(絕大多數情況)的浮點數區間整體線性映射到 [0, 999] 的整數區間。這樣,每個數值在 GPT 和 LLaMA 3 的詞表中僅需 1 個 token 表示(Qwen 分詞器也僅需 1 到 3 個 token),既節省空間,還避免了小數點和正負號單獨切詞帶來的數值理解錯誤。該流程只是改進了傳統機器學習中的數值標準化,而沒有改變 LLM 原生分詞器,因此模型的數值推理能力可以全部繼承。

  • 推理也要「團購」:序列級批量預測——傳統上下文學習一次只處理一個查詢,在多樣本學習時效率極低。作者將多個查詢(如 50 條)拼成一條序列,統一前向推理,一次性輸出所有預測結果。這不僅大幅提升推理速度,還能在訓練階段提高自回歸穩定性。

驚艷效果:多項能力突破

MachineLearningLM 的繼續預訓練方案無需改變模型架構或分詞器,只使用了 Qwen2.5-7B 基座模型和低秩適配(LoRA rank=8)這種輕量級配置,MachineLearningLM 展現出了前所未有的上下文樣本利用能力:

  • 「千示例」上下文學習:模型性能隨著提供的示例數量增加而持續穩定提升,從 8 條示例到 1024 條示例,準確率單調增長。這樣的上下文樣本效率是已有 LLM 都難以做到的。 
  • 遠超 GPT-5-mini 等強大基準模型:在金融、生物信息、物理信號和醫療健康等領域的表格分類任務上,其純上下文學習的準確率平均超越 GPT-5-mini 等強大基準模型約 13 到 16 個百分點。
  • 在無需任何任務特定訓練的情況下,其準確率已能達到與需要任務級參數更新的隨機森林模型相差無幾的水平(平均相對差距在 2% 以內),并顯著優于 K 近鄰(kNN)算法。
  • 通用能力無損:最關鍵的是,注入 ML 能力后,模型原有的對話、知識和推理能力幾乎完好無損。在 MMLU 基準測試中,其零樣本準確率達 73.2%,50 樣本設置下達 75.4%,與基準通用 LLM(Qwen-2.5-7B-Instruct)持平,甚至在特定領域(如統計和物理)有一定提升,這意味著它可以無縫集成到更復雜的對話工作流中。

  • 實證研究表明,MachineLearningLM 能夠同時處理數值特征與自然語言描述,無需像傳統方法那樣對文本進行分桶或轉換為嵌入向量,實現了真正的異構(多模態)輸入推理。然而,該模型仍存在一定局限,例如在面對非獨立同分布的時間序列數據以及類別數量極其龐大的數據集時,性能尚有待提升,這也為后續研究指明了改進方向。

應用領域

基于大幅提升的多樣本上下文學習和數值建模能力,MachineLearningLM 有望在金融、醫療健康與科學計算等廣泛場景中擴展大型語言模型的實際應用邊界。

未來展望

MachineLearningLM 為未來研究開辟了多個充滿潛力的方向。以下是論文里列出的幾個重點方向:

  1. 超越文本與數字:合成多模態分類任務,使 MachineLearningLM 能夠直接在海量合成數據上練習處理異構信號的多模態上下文預測,這依然可以建立在表格預測的框架之上,例如利用 HTML 表格來嵌入圖像。
  2. 通過系統優化突破上下文長度限制:例如采用張量 / 流水線并行、高效內存注意力與 KV 緩存等系統優化技術。
  3. 不確定性預測 (Uncertainty):預測的同時輸出置信度(比如利用隨機森林的置信度做熱身訓練),以減少模型 OpenAI 近期提出的由于缺乏承認不確定性(Honesty about uncertainty)引發的幻覺(Hallucination)。
  4. 提升可解釋性 (Interpretability):敘事蒸餾與推理增強學習,既可以利用底層的 SCM(變量、關系與機制)作為預測任務的輔助目標,也可以從集成模型中蒸餾規則,形成緊湊、人類可讀的推理鏈條。
  5. 集成檢索增強方法(RAG):為 MachineLearningLM 集成一個檢索模塊,使其能在預訓練和推理時動態注入最相關的示例。
  6. 賦能智能體(Agent):與 Agent 記憶機制(Memory)深度融合,提升其在復雜環境中利用多樣本的上下文學習,賦予智能體強大的從大量經驗記憶中挖掘和學習的能力。

作者介紹

本文作者:董浩宇(中國科學院大學)、張鵬昆(華南理工大學)、陸明哲(中國科學院大學)、沈言禎(斯坦福大學)、柯國霖(個人貢獻者)

董浩宇:中國科學院大學在讀博士(預計 2025 年底畢業)。研究方向涵蓋表格與半結構化數據理解與推理、LLM 后訓練與強化學習、數據集與評測基準等。曾提出 SpreadsheetLLM 并獲得 Hugging Face Paper of the Day、聯合發起并持續共同組織 NeurIPS 2022–2024 表格表征學習(TRL)系列研討會,推動表格智能社區發展。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-06-15 15:45:42

自然語言語言模型

2023-03-13 14:41:22

機器學習算法

2025-02-06 11:25:50

2023-09-16 13:47:47

人工智能數據

2024-06-19 12:50:39

2023-07-09 15:09:18

機器學習能力

2023-03-31 13:37:34

研究

2023-11-24 17:01:30

模型推理

2025-02-06 10:21:51

2024-09-12 08:00:00

2022-04-29 15:51:16

模型自然語言人工智能

2024-03-14 08:11:45

模型RoPELlama

2025-02-07 10:10:05

MusicMagus擴散模型音樂編輯

2024-06-25 09:35:04

模型訓練

2024-02-29 12:23:54

AI數據

2024-07-17 16:59:51

AI訓練

2021-10-25 09:06:29

模型人工智能計算

2025-03-18 08:14:05

2023-11-28 09:00:00

機器學習少樣本學習SetFit

2025-01-27 00:57:43

點贊
收藏

51CTO技術棧公眾號

国模一区二区三区白浆| 爽成人777777婷婷| 色综合久久久久综合体| 色一情一区二区三区四区 | 色婷婷视频在线观看| 粉嫩aⅴ一区二区三区四区| 性欧美亚洲xxxx乳在线观看| 性欧美精品中出| 日韩欧国产精品一区综合无码| 亚洲综合精品久久| 日韩免费中文专区| 成人av无码一区二区三区| 久久久久久一区二区| 伊人婷婷欧美激情| 蜜桃999成人看片在线观看| 伊人亚洲综合网| 在线综合欧美| 久久精品视频在线观看| 久久人人爽人人人人片| 成人在线免费观看黄色| 国产欧美一区二区三区在线看蜜臀 | 丁香婷婷综合激情五月色| 国产精品扒开腿做| 黄网站免费在线| 91亚洲国产| 亚洲性日韩精品一区二区| 性一交一黄一片| 992tv国产精品成人影院| 懂色aⅴ精品一区二区三区蜜月| 亚洲午夜在线观看| 精品无吗乱吗av国产爱色| 国产成人免费视频网站| 国产日韩精品综合网站| 大又大又粗又硬又爽少妇毛片| 亚洲精品tv| 欧美中文字幕一二三区视频| www.99热这里只有精品| 日韩在线观看视频一区二区三区| 久久精品噜噜噜成人av农村| 欧美在线视频网| 久久网中文字幕| 亚洲成人tv| 日韩在线视频观看| 欧美丰满老妇熟乱xxxxyyy| 欧美日韩破处| 色偷偷成人一区二区三区91| 97干在线视频| 丰满大乳少妇在线观看网站| 亚洲欧美一区二区不卡| 亚洲日本理论电影| 国产二区在线播放| 久久精品夜色噜噜亚洲aⅴ| 精品久久蜜桃| 午夜视频福利在线| 97成人超碰视| 欧美日韩精品免费看| 亚洲 欧美 激情 另类| 成人av网站在线| 欧美性在线观看| 亚欧视频在线观看| 亚洲国产日本| 456亚洲影院| www欧美在线| 精品一区二区三| 亚洲欧美另类国产| 精品国产av无码| 精品国产99| 综合久久五月天| 天天做夜夜爱爱爱| 欧美日韩p片| 高清一区二区三区四区五区| 国产在线观看免费av| 伊人久久婷婷| 久久精品国产91精品亚洲| 色欲狠狠躁天天躁无码中文字幕| 亚洲三级性片| 中日韩美女免费视频网址在线观看 | 综合激情国产一区| 亚洲av鲁丝一区二区三区| 欧美成人tv| 欧美一级成年大片在线观看| 中文字幕手机在线视频| 久久99九九99精品| http;//www.99re视频| 天堂中文网在线| 中文字幕欧美三区| 精品日韩在线播放| 欧美理论电影| 狠狠色香婷婷久久亚洲精品| 国内自拍视频网| jizz一区二区三区| 欧美视频中文字幕在线| 天天色综合社区| 蜜桃精品一区二区三区| 日韩精品免费在线| 亚洲欧美综合7777色婷婷| 天海翼精品一区二区三区| 亚洲天堂日韩电影| 懂色av懂色av粉嫩av| 亚洲伦理精品| 成人淫片在线看| 亚洲欧美一区二区三| 亚洲欧洲日韩在线| 国产精品无码一区二区在线| 成人全视频免费观看在线看| 欧美电影精品一区二区| 日韩在线免费观看av| 亚洲影视一区二区三区| 日本一欧美一欧美一亚洲视频| 国产又大又粗又硬| 久久嫩草精品久久久久| 成年在线观看视频| 黄页免费欧美| 日韩精品视频在线观看网址| 91久久久久久久久久久久久久| 国产欧美在线| 91精品国产乱码久久久久久蜜臀| 波多野结衣视频观看| 成人国产精品视频| 日本一区二区免费高清视频| 91久久国产综合久久91猫猫| 日韩欧美国产系列| 91狠狠综合久久久久久| 日韩精品一区二区三区免费观影| 亚洲人午夜精品| 久久久综合久久| 精品一区二区三区久久| 日韩精品国内| 惠美惠精品网| 日韩成人av网| 国产乡下妇女做爰毛片| 国产在线视频一区二区三区| 日本不卡一区| 91看片一区| 亚洲精品福利免费在线观看| 欧美精品xxxxx| 精品一区二区三区在线视频| 日韩欧美一区二区三区四区| 天天综合av| 亚洲精品成人网| 精品少妇theporn| 国产精品性做久久久久久| 亚洲一区3d动漫同人无遮挡| 亚洲高清黄色| 亚洲欧美国产视频| 老熟妇仑乱一区二区av| 91在线视频在线| 精品视频免费在线播放| 极品国产人妖chinesets亚洲人妖| 九色精品美女在线| 精品成人久久久| 成人美女视频在线观看18| 粉嫩av一区二区三区天美传媒 | 精品无人乱码| 日本黄色一区二区| 久久精品国产亚洲av久| 久久久久久黄| 日本视频精品一区| 日韩精品三区| 中文字幕亚洲综合久久筱田步美| 久久精品99北条麻妃| 国产片一区二区| 色婷婷综合网站| **女人18毛片一区二区| 97中文在线| 日韩伦理在线| 国产亚洲精品激情久久| 亚洲第一区av| 日韩一区在线看| 久久久高清视频| 先锋影音国产一区| 亚洲 国产 欧美一区| 黄色成人小视频| 欧美激情精品久久久久久久变态| 韩国av免费在线| 91福利精品视频| 极品色av影院| 菠萝蜜视频在线观看一区| 欧美性久久久久| 欧美国产一区二区三区激情无套| 亚洲在线一区二区| av白虎一区| 一区二区欧美日韩视频| 国产成人毛毛毛片| 欧美日韩国内自拍| 精品在线观看一区| 成人18视频在线播放| aaaaaa亚洲| 第四色中文综合网| 不卡av电影院| 天天综合天天综合| 欧美色网一区二区| 久久久www成人免费毛片| 91一区一区三区| 中文字幕亚洲影院| 一本久道久久久| 亚洲综合首页| 久久夜色电影| 国产美女久久久| 鲁鲁在线中文| 久久天天躁狠狠躁夜夜爽蜜月| 色网站免费观看| 正在播放亚洲一区| 国产又色又爽又高潮免费| 国产91在线看| 中文字幕第38页| 中文久久精品| 2021国产视频| 国产一区二区三区四区五区| 97人人模人人爽视频一区二区| 全亚洲第一av番号网站| 欧美高清视频在线| 色多多视频在线观看| 亚洲精品国产精品自产a区红杏吧 亚洲精品国产精品乱码不99按摩 亚洲精品国产精品久久清纯直播 亚洲精品国产精品国自产在线 | 在线视频一区二区三| 欧美精品99久久久| 亚洲欧美自拍偷拍色图| 亚洲乱码国产乱码精品精大量| 国产精品一区一区| 中文字幕亚洲影院| 日本视频免费一区| 激情网站五月天| 日韩视频不卡| 18禁裸男晨勃露j毛免费观看| 三区四区不卡| 天堂资源在线亚洲视频| 欧美大胆视频| 国产麻豆日韩| 日韩最新av| 成人自拍性视频| 久久天堂影院| 国产精品女视频| 亚州一区二区三区| 欧美孕妇性xx| 欧洲一区精品| 国内精品在线一区| 成人爽a毛片免费啪啪动漫| 粗暴蹂躏中文一区二区三区| 色多多视频在线观看| 中文字幕精品一区久久久久| 国产美女性感在线观看懂色av| 亚洲国产精品中文| 天天爱天天干天天操| 精品99999| 天堂网av手机版| 亚洲午夜激情av| 麻豆亚洲av熟女国产一区二| 亚洲精品videosex极品| 国产精品久久久久久久精| 亚洲免费av在线| 三级全黄做爰视频| 亚洲免费电影在线| 久久免费播放视频| 五月天激情小说综合| 91在线无精精品白丝| 久久久久久久久伊人| 人人妻人人藻人人爽欧美一区| 国产亚洲综合av| 成人在线手机视频| 国产精品免费人成网站| 日本爱爱小视频| 亚洲曰韩产成在线| 久草手机在线观看| 欧美怡红院视频| 亚洲图片中文字幕| 日韩欧美国产1| 亚州视频一区二区三区| 中文精品99久久国产香蕉| 午夜视频在线观看网站| 精品中文字幕在线观看| av成人 com a| 日韩av大片免费看| 在线免费观看亚洲| 成人动漫视频在线观看完整版| 久久亚洲黄色| 婷婷四月色综合| 欧美另类视频| 日韩欧美在线播放视频| 精品一区二区三区不卡| 国产性猛交96| 久久久午夜精品理论片中文字幕| 中文字幕91视频| 午夜久久久影院| 亚洲在线免费观看视频| 精品久久久久久综合日本欧美| 完全免费av在线播放| 日本888xxxx| 国产激情一区二区三区桃花岛亚洲| 午夜视频在线观看国产| 国产精品美女久久久久久久久久久 | 国产在线观看免费| 久99久在线视频| 亚洲成人不卡| 国产精品成人一区二区三区| 成人午夜一级| 99中文视频在线| av一区二区高清| 亚洲精品蜜桃久久久久久| 日韩和欧美一区二区| 又黄又色的网站| 中国色在线观看另类| 日本三级免费看| 在线播放91灌醉迷j高跟美女 | 一本一道精品欧美中文字幕| 精品国产免费久久| 9191在线观看| 最好看的2019年中文视频| 超碰在线最新网址| 成人福利在线观看| 一本久久青青| 国产日韩亚洲欧美在线| 久久超碰97中文字幕| 精品中文字幕在线播放| 亚洲日本成人在线观看| 精品一区二三区| 亚洲激情免费观看| 2024最新电影在线免费观看| 国产精品欧美风情| 全国精品免费看| 一本久道高清无码视频| 国产麻豆精品theporn| 粉嫩精品久久99综合一区| 黑人精品xxx一区一二区| 性生活三级视频| 久久久国产精品视频| 99久久久国产精品免费调教网站| 精品国产乱码久久久久久郑州公司 | 久久久久福利视频| 麻豆视频一区二区| 人妻一区二区视频| 欧美日韩在线视频观看| 丁香花免费高清完整在线播放| 久久精品99久久香蕉国产色戒| 亚洲第一二三四区| 欧美一级二级三级九九九| 国产美女精品| av网站免费在线播放| 欧美性xxxxx极品| 日韩欧美在线观看一区二区| 韩剧1988在线观看免费完整版| 视频二区欧美毛片免费观看| 法国空姐在线观看免费| 国产一区二区免费在线| 久久久久久久久久97| 欧美日本免费一区二区三区| 国产欧美日韩成人| 久久精品一偷一偷国产| 亚洲高清影院| 99re99热| 国产精品夜夜嗨| 久久视频免费看| 亚洲国产精品99| 中文字幕资源网在线观看免费 | 五月婷婷在线视频| 国产日韩欧美夫妻视频在线观看 | 日韩伦理在线免费观看| 从欧美一区二区三区| 国产午夜激情视频| 亚洲第一区在线观看| 国产精品论坛| 蜜桃成人免费视频| 日韩av一区二区三区| 日本伦理一区二区三区| 日韩一区二区在线看| av在线最新| 奇米影视首页 狠狠色丁香婷婷久久综合| 久久精品九九| 日韩在线不卡av| 精品久久五月天| 亚洲十八**毛片| 亚洲精品在线观看免费| 国产精品 日产精品 欧美精品| 国产精品第9页| 国产亚洲欧洲在线| 久久久久亚洲精品中文字幕| 99久久国产综合精品五月天喷水| 波波电影院一区二区三区| 最新中文字幕一区| 中文日韩电影网站| 最新国产精品精品视频| 亚洲第一导航| 国产老肥熟一区二区三区| 免费日韩一级片| 中文字幕亚洲欧美| 成人免费直播在线| mm131午夜| 91免费视频网| 国产麻豆一精品一男同| 91精品国产91久久久久福利| 精品日本12videosex| 中文字幕第10页| 欧美日韩一区二区三区| 免费av不卡| 欧美成人蜜桃| 国产一区二区三区在线观看免费视频| 久久精品性爱视频| 中文字幕欧美日韩在线| 精品网站aaa| 激情在线观看视频| 欧美日韩综合视频网址|