精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DianJin-R1:金融領域推理增強大模型,全面超越DeepSeek-R1

發布于 2025-4-27 00:24
瀏覽
0收藏

大型語言模型(LLMs)在推理能力上的進展引發了對其在復雜任務中表現的關注,尤其是在金融領域。DianJin-R1是一個針對金融領域的推理增強框架,通過推理增強監督和強化學習,提升金融推理任務的表現。

DianJin-R1模型在金融測試集(CFLUE、FinQA、CCC)上顯著優于基礎模型,尤其在CFLUE和CCC上表現突出,DianJin-R1-32B在CFLUE上準確率從77.95提升至86.74,CCC上從56.50提升至96.00,超越DeepSeek-R1。

DianJin-R1:金融領域推理增強大模型,全面超越DeepSeek-R1-AI.x社區

摘要

DianJin-R1是一個針對金融領域的推理增強框架,旨在解決大語言模型在該領域的推理挑戰。該框架使用DianJin-R1Data數據集,結合CFLUE、FinQA和中國合規檢查(CCC)數據,涵蓋多樣的金融推理場景。模型DianJin-R1-7B和DianJin-R1-32B基于Qwen2.5進行微調,采用結構化格式生成推理步驟和最終答案。通過應用群體相對策略優化(GRPO)強化學習,模型獲得了結構化輸出和答案正確性的雙重獎勵信號。

在五個基準測試上,DianJin-R1模型在復雜金融任務中表現優于非推理模型,尤其在真實世界的CCC數據集上,單次推理模型的表現超過多代理系統。DianJin-R1展示了通過結構化監督和獎勵對齊學習提升金融推理的有效性,提供了可擴展的實際應用解決方案。

簡介

大型語言模型(LLMs)在推理能力上的進展引發了對其在復雜任務中表現的關注,尤其是在金融領域。DianJin-R1模型通過推理增強監督和強化學習,提升金融推理任務的表現。構建了高質量的推理數據集DianJin-R1-Data,來源包括CFLUE、FinQA和合規性數據集CCC。采用GPT-4o進行驗證,確保生成答案與推理步驟的一致性。

DianJin-R1-7B和DianJin-R1-32B模型通過結構化輸出格式進行監督微調,并使用GRPO強化學習算法優化推理質量。在CFLUE、FinQA、CCC等基準測試中,DianJin-R1模型表現優于非推理模型,尤其在金融領域。實際應用中,基于LLMs的多代理系統在CCC數據集上進行條件合規檢查,整合中間推理步驟以得出最終判斷。DianJin-R1結合高質量監督、結構化推理生成和獎勵驅動的強化學習,提供了一種可擴展的金融推理增強策略。

DianJin-R1-Data建設

數據源

CFLUE數據集。包含38,638道金融考試多選題,經過長度、難度和模糊性三步篩選,確保問題清晰且具備深度推理能力,適合評估LLMs的金融推理能力。

FinQA數據集。包含8,281個金融問答對,經過相同的長度和難度篩選,適合評估英語金融推理。

CCC數據集。內部數據集,評估服務代理的合規性,包含客戶與服務代理的對話,經過人工審核,確保合規與非合規案例的平衡分布。

推理數據集構建

針對CCC、CFLUE和FinQA數據集的差異,采用不同的推理構建方法。

CFLUE問題的推理生成

定義DCFLUE MCQ為包含問題、解釋和答案的多選題數據集。使用GPT-4o將DCFLUE MCQ中的多選題轉換為開放式問題,生成DCFLUE OE數據集。利用DeepSeek-R1生成推理鏈和預測答案,并用GPT-4o驗證答案和推理的一致性。滿足條件的實例保留為有效推理樣本,未滿足的實例最多重試3次,最終未成功的實例歸為難題樣本。

生成的推理增強數據集為RCFLUE MQC,難題數據集為GCFLUE MQC。對DCFLUE OE應用相同流程,生成RCFLUE OE和GCFLUE OE數據集。

FinQA問題的推理生成

FinQA數據集的QA對已為開放式格式,表示為D FinQA。將CFLUE中的推理生成過程應用于D FinQA,得到推理增強數據集R FinQA。生成的非推理數據集為G FinQA。

基于多Agent的CCC對話推理生成

CCC數據集DCCC包含對話x_i及其對應的合規性判斷答案y_i,判斷過程復雜,需遵循指導原則。開發了一個工作流程,從開始節點到兩個結果節點,評估合規性違規與否。

使用多代理LLM系統生成推理,采用Qwen2.5-72B-Instruct為每個條件節點生成中間推理鏈(CoTs)和答案。最終答案a_i由結果節點決定,若與金標準答案y_i匹配,則合并中間推理鏈生成統一推理r_i。若不匹配,最多重試T次,生成的推理增強數據集為RCC,未增強數據集為GCC。

DianJin-R1:金融領域推理增強大模型,全面超越DeepSeek-R1-AI.x社區

模型訓練

訓練大型語言模型(LLMs)進行金融推理分為兩個階段:

  • 通過監督微調(SFT)學習推理。
  • 通過強化學習(RL)增強推理能力。

DianJin-R1:金融領域推理增強大模型,全面超越DeepSeek-R1-AI.x社區

使用SFT學習推理

使用R CFLUE MCQ、RCFLUE OE、R FinQA和RCCC數據集對LLMs進行微調,以生成推理鏈(CoT)和最終答案。每個訓練實例包含問題x、推理路徑r和答案y。在微調過程中,問題x作為模型輸入,推理r和答案y作為目標輸出,幫助模型學習生成連貫的推理步驟和正確的解決方案。

使用強化學習增加推理能力

GCFLUE MCQ數據集用于強化學習(RL),旨在提升推理能力。采用Group Relative Policy Optimization(GRPO)算法,結合兩種獎勵機制:

  • 格式獎勵:輸出需包含一個推理段(...)和一個最終答案(...),格式正確得1分,錯誤得0分。
  • 準確性獎勵:若標簽內內容與參考答案完全一致,得1分;否則得0分,鼓勵生成準確答案。

實驗

實驗設置

DianJin-R1-Data的統計信息總結在表1中,CFLUE MCQ占SFT數據的大部分,數據經過洗牌以防止過擬合。

DianJin-R1:金融領域推理增強大模型,全面超越DeepSeek-R1-AI.x社區

模型訓練分為兩個階段,使用NVIDIA A100 GPU,7B模型在單節點8 GPU上訓練,32B模型在4節點32 GPU上訓練。SFT階段使用DeepSpeed的Zero-3優化,學習率1.0 × 10^-5,序列長度16K,bf16精度,訓練3個epoch,梯度累積16步。RL階段每個樣本進行8次回合,訓練批量大小1024,回合批量大小256,學習率1.0 × 10^-6,采樣溫度0.6,訓練5個epoch。

評估模型使用三個金融基準數據集:CFLUE、FinQA和自有數據集CCC,以及兩個推理能力評估基準:MATH500和GPQA-Diamond。報告準確率,即正確回答問題的比例,并計算所有測試集的平均準確率。CFLUE和CCC為中文數據集,其余為英文。FinQA和CCC的答案正確性由GPT-4o評估,其他數據集通過規則方法提取答案并與標準答案比較。

DianJin-R1:金融領域推理增強大模型,全面超越DeepSeek-R1-AI.x社區

基線模型分為兩類:一類為無明確推理能力的通用LLM(如GPT-4o、DeepSeekV3等);另一類為具備推理能力的通用LLM(如DeepSeek-R1及其衍生模型)。

結果

DianJin-R1模型在金融測試集(CFLUE、FinQA、CCC)上顯著優于基礎模型,尤其在CFLUE和CCC上表現突出,DianJin-R1-32B在CFLUE上準確率從77.95提升至86.74,CCC上從56.50提升至96.00,超越DeepSeek-R1。

DianJin-R1:金融領域推理增強大模型,全面超越DeepSeek-R1-AI.x社區

在一般領域測試集(MATH-500、GPQA-Diamond)上,DianJin-R1模型也有提升,但由于未使用一般領域推理數據,表現仍低于大型模型或經過一般推理數據微調的模型。

一般推理模型(如DeepSeek-R1、QwQ-32B)在一般推理基準上表現優異,但在金融基準上不一定更好,DeepSeek-R1在CFLUE和CCC上優于DeepSeek-V3,但在FinQA上表現下降,DeepSeek-R1-Distill-Qwen-7B在所有金融測試集上均不及Qwen-2.5-7B-Instruct。

討論

SFT顯著提升了模型在所有數據集上的表現,增強了推理能力。RL在所有數據集上均有改善,唯獨FinQA例外,可能因RL實例為中文,FinQA為英文,未來將加入英文示例。

DianJin-R1:金融領域推理增強大模型,全面超越DeepSeek-R1-AI.x社區

SFT使用的三個數據源為CFLUE、FinQA和CCC,其中CFLUE對性能影響最大,包含31,000多個推理實例,單獨使用時準確率從59.26提升至65.67。添加FinQA或CCC主要提升各自測試集的表現,對整體影響有限。

DianJin-R1:金融領域推理增強大模型,全面超越DeepSeek-R1-AI.x社區

多代理LLM系統用于檢測CCC數據集中的合規性違規,采用條件節點的推理生成工作流程。引入多代理方法后,準確率從55.50提升至95.00,顯示出結構化推理的有效性,但平均每個實例需8.15次API調用。DianJin-R1-7B和DianJin-R1-32B模型在僅一次API調用的情況下,表現出與多代理方法相當或更優的性能,體現了有效推理和組織推理路徑的能力。

DianJin-R1:金融領域推理增強大模型,全面超越DeepSeek-R1-AI.x社區

總結和未來工作

DianJin-R1是一個針對金融領域的大型語言模型的推理增強框架,結合結構化監督和強化學習算法(GRPO),提升復雜金融和合規任務的表現。實驗表明,推理感知訓練顯著提高了模型的準確性和可解釋性。

本文轉載自???靈度智能???,作者:靈度智能

收藏
回復
舉報
回復
相關推薦
九一国产精品视频| 亚洲mm色国产网站| 99精品全国免费观看| vam成人资源在线观看| 亚洲一区自拍偷拍| 欧美中文娱乐网| 国产伦精品一区二区三区四区 | 粉嫩av一区二区三区在线播放| 国内揄拍国内精品| 国产aaaaaaaaa| 91精品啪在线观看国产爱臀| 91福利在线观看| 成人av在线播放观看| 欧美色图另类| 国产福利一区在线| 国产精品高精视频免费| 欧美色图亚洲天堂| 精品理论电影在线| 亚洲第一视频在线观看| av亚洲天堂网| 欧美电影网址| 五月天亚洲婷婷| 欧洲精品视频在线| 成人高潮成人免费观看| heyzo一本久久综合| 91热福利电影| 91porny九色| 99视频一区| 久久不射电影网| 九九九视频在线观看| 国产伦乱精品| 精品久久久久久久久久久久包黑料 | av在线免费观看网站| 99re热这里只有精品免费视频| 成人乱色短篇合集| 中文字幕一区2区3区| 亚洲综合国产激情另类一区| 欧美精品久久久久| 91视频免费在线看| 66国产精品| 久久九九国产精品怡红院 | 亚洲综合色噜噜狠狠| 亚洲一区精彩视频| jizz视频在线观看| 久久午夜老司机| 麻豆av一区二区| 亚洲日本国产精品| 91在线观看免费视频| 国产伦精品一区二区三区高清版 | 国产精一品亚洲二区在线视频| 国产精品久久久久免费a∨大胸 | 日韩欧美一二三区| 91香蕉视频在线观看视频| 日本久久一区| 91麻豆精品国产91久久久久久久久 | 成人免费91| 欧美人牲a欧美精品| 天天做天天干天天操| 亚洲精品tv| 日韩一区二区在线观看视频播放| 欧美精品色视频| 亚洲大奶少妇| 亚洲国产欧美一区二区丝袜黑人 | 黄网站在线观看| 国产女人18水真多18精品一级做 | 亚洲香蕉网站| 97精品久久久| 精产国品一区二区| 奇米四色…亚洲| 国产欧美韩国高清| 国产黄色片网站| 成人国产精品免费观看| 久久精品国产一区二区三区日韩| 蜜桃成人在线视频| 国产精品免费看片| 免费观看国产视频在线| 好看的中文字幕在线播放 | 中文字幕人妻互换av久久| 久久精品国产99国产| 91pron在线| 香蕉久久一区二区三区| 国产婷婷色一区二区三区| 一区二区三区av在线| 污污的网站在线看| 天天射综合影视| 黄色免费网址大全| 日韩三级久久| 亚洲欧美日韩天堂| tube国产麻豆| 99伊人成综合| 国产一区玩具在线观看| 高潮一区二区三区乱码| 国产亚洲精品中文字幕| 91网站在线观看免费| 成人av观看| 制服丝袜亚洲播放| 四虎永久免费影院| 我不卡伦不卡影院| 欧美在线观看视频| 99久久精品免费看国产交换| 91美女片黄在线观看| 正在播放一区二区三区| 丝袜老师在线| 日韩一区二区中文字幕| 中文字幕av久久爽一区| 在线成人欧美| 国产日韩欧美中文在线播放| 成人小说亚洲一区二区三区| 中文字幕不卡的av| 男人日女人视频网站| 国产精品一区二区精品视频观看| 亚洲欧美激情另类校园| 精品亚洲永久免费| 久久成人精品无人区| 欧美精品免费观看二区| 久久大胆人体| 91精品国产福利在线观看| 不卡一区二区在线观看| 亚洲私拍自拍| 亚洲一区二区三区乱码aⅴ蜜桃女| 欧美精品a∨在线观看不卡| 亚洲在线视频一区| 日本黄色福利视频| 国产剧情在线观看一区| 性色av一区二区三区在线观看| 国产精品爽爽久久| 欧美激情在线看| 国产亚洲精品网站| 老司机aⅴ在线精品导航| 欧美插天视频在线播放| 97人妻精品一区二区三区动漫| 国产亚洲欧美在线| av观看免费在线| 巨人精品**| 国产做受高潮69| 高清乱码毛片入口| 亚洲综合激情小说| 国产成人精品一区二区三区在线观看 | 美女视频一区在线观看| 日本不卡一区| 羞羞影院欧美| 欲色天天网综合久久| 无码无套少妇毛多18pxxxx| 91亚洲精华国产精华精华液| 亚洲熟妇无码另类久久久| 中文字幕日韩高清在线| 欧美激情免费在线| 亚洲国产精品久久人人爱潘金莲 | 中文字幕亚洲区| 中文字幕av专区| 手机在线电影一区| 国产精品扒开腿做| 91福利在线视频| 欧美日韩免费一区二区三区| 男女男精品视频网站| 免费视频最近日韩| 制服丝袜综合日韩欧美| 成人免费91| 久久久久久久97| 污污视频在线观看网站| 欧美午夜久久久| 免费福利视频网站| 久久精品国产99国产精品| 91九色国产ts另类人妖| 2021年精品国产福利在线| 欧美激情18p| 亚洲人妻一区二区三区| 欧美性一级生活| 久久精品亚洲a| 国产成人免费视| 奇米精品一区二区三区| 精品产国自在拍| 成人免费在线视频网站| 国精一区二区三区| 亚洲欧洲一区二区三区久久| 亚洲 小说区 图片区| 亚洲天堂精品视频| 国产日韩视频一区| 肉色丝袜一区二区| www.-级毛片线天内射视视| 澳门精品久久国产| 国产成人在线一区| 国产黄a三级三级三级av在线看 | 天堂av中文在线资源库| 欧美日韩三级一区二区| 欧美日韩综合一区二区| 91丝袜国产在线播放| 色噜噜狠狠永久免费| 亚洲小说欧美另类社区| 视频三区二区一区| 亚洲国产视频二区| 国产精品久久久久77777| av在线播放国产| 亚洲美女性视频| 999免费视频| 色婷婷狠狠综合| 免费在线黄色片| 亚洲国产精华液网站w| 激情av中文字幕| 青娱乐精品视频| 黄色大片在线免费看| 66视频精品| 日韩av电影免费观看| 国产成人在线中文字幕| 国产在线视频2019最新视频| 深夜av在线| 欧美夫妻性视频| 91在线高清| 国产视频综合在线| 亚洲国产综合一区| 欧美日韩免费视频| 亚洲av无码精品一区二区| 亚洲一区中文日韩| 国产黄色小视频网站| 久久这里只精品最新地址| 亚洲一区二区在线视频观看| 久久高清国产| 精品少妇在线视频| 午夜日韩电影| 欧美日韩视频免费在线观看| 国产欧美日韩一区二区三区四区| 国产精品美女黄网| 青草伊人久久| 亚洲影院色无极综合| 狠狠久久伊人中文字幕| 国产97在线|亚洲| 欧美调教sm| 性欧美长视频免费观看不卡 | 国产不卡精品视男人的天堂| av免费不卡国产观看| 欧美夫妻性生活xx| 永久免费网站在线| 美女国内精品自产拍在线播放| 在线观看黄av| 一区二区在线视频| 国家队第一季免费高清在线观看| 日韩美女av在线| 青青草av免费在线观看| 日韩国产精品视频| 五月婷婷开心中文字幕| 亚洲国产天堂久久综合| 熟妇人妻一区二区三区四区| 精品久久人人做人人爰| 老司机午夜福利视频| 日韩一区二区三| www.日日夜夜| 精品少妇一区二区三区| 亚洲精品久久久蜜桃动漫| 精品国产区一区| 免费看黄色一级视频| 精品国内二区三区| 风流老熟女一区二区三区| 亚洲高清一二三区| 色播色播色播色播色播在线| 国产视频精品久久久| 精品资源在线看| 国产亚洲精品久久久久久牛牛| 国产经典自拍视频在线观看| 日韩中文字幕欧美| 中中文字幕av在线| 性欧美xxxx| 精品三区视频| 91九色视频在线| 成人午夜大片| 欧美男人的天堂| 欧美www视频在线观看| 无码人妻精品一区二区三区99v| 欧美精品成人| 成人久久久久久久久| 蜜乳av一区二区| 台湾佬美性中文| 91美女片黄在线观看| 免费黄色国产视频| 亚洲午夜久久久| 中文字幕在线观看视频免费| 欧美麻豆精品久久久久久| 精品国产区一区二| 亚洲精品视频二区| 国产丝袜在线| 国产91成人在在线播放| 久久不卡日韩美女| 国产精品乱码一区二区三区| 成人午夜国产| 日韩一区二区高清视频| 性欧美暴力猛交另类hd| 91看片破解版| www激情久久| 日韩一级片av| 色哟哟一区二区在线观看| 国产美女www爽爽爽视频| 日韩国产在线看| 国产成人l区| 国产精品扒开腿做爽爽爽男男| 国产一区二区三区免费观看在线| 久久精品成人一区二区三区蜜臀| 999国产精品999久久久久久| 精品这里只有精品| 国产美女视频91| 亚洲午夜精品久久久久久高潮| 一区二区在线电影| 天天天天天天天干| 亚洲成人网在线观看| 日本不卡三区| 7777kkkk成人观看| 日本在线视频一区二区三区| 日韩一区国产在线观看| 亚洲精品激情| 欧美一区二区三区影院| 国产精品拍天天在线| 精品人妻一区二区三区免费看| 日韩一区二区精品在线观看| 91在线看黄| 国产精品高清网站| 亚洲va久久| 青青草视频在线免费播放| 国产一区日韩二区欧美三区| 日本人亚洲人jjzzjjz| 欧美日韩另类在线| 亚洲男人第一天堂| 久久夜精品香蕉| 巨大黑人极品videos精品| 免费看成人午夜电影| 亚洲天堂男人| 国产伦理在线观看| 亚洲欧美电影院| 国产又黄又粗又猛又爽| 色香阁99久久精品久久久| 欧美成人精品一区二区男人小说| 国产在线观看一区| 国产精品草草| 95视频在线观看| 亚洲一二三级电影| 丰满人妻一区二区三区四区53| 久久影视电视剧免费网站清宫辞电视| jizzjizz少妇亚洲水多| 日韩欧美精品在线不卡| 日本最新不卡在线| 欧美熟妇激情一区二区三区| 91福利在线导航| 成人在线免费电影| 国产精品揄拍500视频| 欧美一级精品| 欧美成年人视频在线观看| 国产精品乱码久久久久久| 一区二区视频网| 久久久www成人免费精品| 国产精品久久免费视频| 国产精品88久久久久久妇女| 国产成人亚洲精品狼色在线| 欧美黄色一区二区三区| 欧美成人在线直播| av中文字幕在线看| 久久大香伊蕉在人线观看热2| 国产精品外国| 卡一卡二卡三在线观看| 欧美人与性动xxxx| 性欧美高清come| 国产一区二区三区av在线| 国产精品永久| 亚洲第一视频区| 欧美一级理论片| a'aaa级片在线观看| 精品一区二区三区视频日产| 久久久久久色| 亚洲少妇xxx| 欧美成人vps| 一区二区三区四区日本视频| 日韩av高清| 国产精品88888| 中国一级免费毛片| 中文精品99久久国产香蕉| 欧一区二区三区| 黄色国产精品视频| 亚洲欧洲三级电影| 亚洲精品国产一区二| 人人澡人人澡人人看欧美| 欧美freesextv| 中文字幕免费在线播放| 在线观看日韩电影| 影音先锋在线播放| 欧美性天天影院| 国模娜娜一区二区三区| 日韩福利片在线观看| 在线不卡国产精品| 精品国产一区二区三区2021| 欧美视频在线播放一区| 国产精品激情偷乱一区二区∴| 丰满肉肉bbwwbbww| 国产精品极品在线| 精品二区视频| 亚洲一级理论片| 日韩高清免费在线| 亚洲一区av| 女性女同性aⅴ免费观女性恋| 国产精品成人午夜| 婷婷在线观看视频| 91亚洲精品在线| 日韩国产精品久久久久久亚洲| 国产一级一片免费播放放a| 最近更新的2019中文字幕|