精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

STOCKBENCH: 大模型現實環境股票交易盈利及風險評估

發布于 2025-10-13 07:10
瀏覽
0收藏

大型語言模型(LLMs)在推理、工具使用和決策方面表現出色,但金融領域的研究仍然不足。現有金融基準主要測試靜態知識,未能反映交易的動態和迭代特性。

本文提出STOCKBENCH基準,旨在評估LLM在真實股票交易環境中的盈利能力和風險管理能力。評估結果顯示,大多數LLM智能體未能超越簡單的買入持有基準,表明靜態問答能力與動態市場交易策略之間存在差距。

STOCKBENCH: 大模型現實環境股票交易盈利及風險評估-AI.x社區

摘要

大型語言模型(LLMs)在推理、工具使用和決策方面表現出色,但金融領域的研究仍然不足。現有金融基準主要測試靜態知識,未能反映交易的動態和迭代特性。

STOCKBENCH用于評估LLM在多月股票交易環境中的表現。智能體每天接收市場信號(價格、基本面、新聞),并需做出買、賣或持有的決策。評估指標包括累計回報、最大回撤和Sortino比率。

評估結果顯示,大多數LLM智能體未能超越簡單的買入持有策略,但部分模型在回報和風險管理上表現出潛力。研究表明,靜態金融知識的優秀表現不一定能轉化為成功的交易策略。STOCKBENCH作為開源資源發布,以支持可重復性和未來研究。

簡介

大型語言模型(LLMs)推動了自主智能體的發展,展現出在推理、工具使用和長期決策中的強大能力。現有金融智能體基準主要集中在靜態問答任務,未能反映實際交易場景。

本文提出STOCKBENCH基準,旨在評估LLM在真實股票交易環境中的盈利能力和風險管理能力。STOCKBENCH特點:真實市場互動、連續決策、數據無污染。評估結果顯示,大多數LLM智能體未能超越簡單的買入持有基準,表明靜態問答能力與動態市場交易策略之間存在差距。

STOCKBENCH: 大模型現實環境股票交易盈利及風險評估-AI.x社區

STOCKBENCH

STOCKBENCH由兩個主要構建塊組成:

  • 回測環境,包含歷史數據用于股票交易決策,模擬真實股票交易。
  • 股票交易智能體工作流,評估LLM骨干作為智能體在回測環境中的表現。

STOCKBENCH: 大模型現實環境股票交易盈利及風險評估-AI.x社區

環境

交易環境設計:模擬真實股票交易,交易智能體僅接觸決策時可用數據。

投資目標:選擇20只道瓊斯工業平均指數中權重最高的股票,確保評估結果穩定,避免短期情緒驅動的波動。

STOCKBENCH: 大模型現實環境股票交易盈利及風險評估-AI.x社區

歷史市場數據:收集股票的開盤價及基本面指標(市值、P/E比率、股息收益率等),防止未來信息泄露。

新聞語料庫:每日收集過去48小時內的相關股票新聞,保留五篇最相關的文章,模擬零售投資者的反應。

數據收集時間窗口:評估窗口為2025年3月3日至6月30日,確保不與訓練數據重疊,涵蓋波動和趨勢反轉。

股票交易智能體工作流程

本文提供一個股票交易智能體工作流程,使大型語言模型(LLM)能與回測環境互動。設計目標:1) 簡化工作流程,避免引入偏見;2) 真實反映零售投資者的決策過程。

工作流程分為四個階段:

  • 投資組合概覽:智能體掃描市場所有股票,獲取相關數據(新聞、持倉、歷史操作、開盤價)。
  • 深入股票分析:選擇特定股票進行詳細分析,獲取基本面數據(市值、市盈率、股息收益率)。
  • 決策生成:基于分析結果,生成對每只股票的決策(增加、減少或持有)。
  • 執行與驗證:將決策轉化為股數,檢查流動性,確保決策可執行,鎖定新組合權重,進入下一天。

STOCKBENCH的特點

真實市場互動:通過精選投資目標、可靠的價格和基本數據、及時的新聞語料,模擬真實交易環境,避免不切實際的輸入。

持續決策:智能體進行投資組合概覽、深入股票分析,并基于分析生成每日交易決策,反映零售投資者的決策過程。

數據無污染:確保智能體在訓練期間未接觸測試數據,通過使用近期市場數據實現時間上的分離,避免與現代大語言模型的訓練數據重疊。

主要實驗

實驗設置

實驗設置:評估LLM智能體在STOCK BENCH交易工作流中的表現,包括交易環境、基準模型、被動基線和評估指標。

交易環境:選擇20只道瓊斯工業平均指數(DJIA)股票,評估期為2025年3月3日至6月30日,共82個交易日。模型以$100,000現金和零持倉開始,每日開盤交易,輸入包括過去7天的歷史操作、48小時內的新聞和基本面數據。

評估模型:基準包括多種LLM模型(如Qwen3、DeepSeek、Kimi-K2等)和閉源API(如OpenAI的O3、Anthropic的Claude-4-Sonnet),所有模型使用32,768個token上下文窗口,運行三次以確保結果可靠。

被動基線:實施等權重買入持有策略,初始資本均勻分配于所有股票,作為比較的基準。

評估指標:

  • 最終回報:投資組合價值的百分比變化,反映整體盈利能力。
  • 最大回撤:投資組合價值從峰值到谷底的最大下降,衡量下行風險。
  • Sortino比率:風險調整回報指標,僅懲罰下行波動,適用于非對稱收益。

綜合排名:通過計算每個指標的z-score并平均,得出單一性能評分,平衡盈利能力與風險管理。

結果

LLM智能體在真實市場中能夠盈利,大多數模型超越了被動買入持有基準(0.4%回報,-15.2%最大回撤,Sortino比率0.0155),部分智能體回報超過2%,風險更低。

LLM智能體有效管理下行風險,所有模型的最大回撤均低于基準,最佳智能體的回撤在-11%至-14%之間。

STOCKBENCH: 大模型現實環境股票交易盈利及風險評估-AI.x社區

理性模型不一定表現更佳,盡管Qwen3-235B-Think等模型在復雜推理任務中表現強勁,但在交易任務中,指令調優模型如Qwen3-235B-Ins表現更好,最大回撤更低(-11.2%對比-14.9%),顯示出推理能力與動態決策之間的差距。

分析

投資目標規模的影響

投資目標規模對智能體性能的影響顯著,隨著目標規模(5、10、20、30個DJIA成分股)的擴大,投資組合的權重差異增加,表現出更高的波動性。

STOCKBENCH: 大模型現實環境股票交易盈利及風險評估-AI.x社區

可擴展性挑戰:所有模型在投資組合規模增加時表現下降,平均收益降低,收益波動性上升,表明多資產決策的復雜性。

模型規模的穩健性:較大規模模型Kimi-K2在中等投資組合規模(10-20只股票)下保持相對穩定的風險收益特征,正收益;而較小模型GPT-OSS-120B則表現出嚴重的性能下降和過度波動,說明模型容量的增加有助于提升多資產決策的泛化能力和穩定性。

錯誤對交易流程的影響

交易過程中常見的錯誤有:算術錯誤(計算買賣股數時出錯)和格式錯誤(未遵循JSON格式導致解析失敗)。

STOCKBENCH: 大模型現實環境股票交易盈利及風險評估-AI.x社區

思維模型的算術錯誤發生率低于指令模型,符合其在數學推理任務中的優異表現。

思維模型的格式錯誤發生率高于指令模型,可能因其輸出過于復雜,導致偏離預期格式。

數據來源消融研究

LLM智能體依賴新聞文章和基本財務數據兩種信息源,前者反映市場情緒,后者提供關鍵財務指標。進行消融研究,逐步去除輸入,發現累計回報隨著信息源的減少而下降。Kimi-K2模型在去除新聞后仍較為穩健,但缺失兩者時表現顯著下降。GPT-OSS-120B對新聞和基本面信號依賴更強,表現下降更明顯。研究表明,LLM交易智能體能夠有效整合文本和數值信息,提升交易策略的有效性。

STOCKBENCH: 大模型現實環境股票交易盈利及風險評估-AI.x社區

評價窗口的影響

研究不同市場條件下模型表現,使用2025年1月至4月的下行期和5月至8月的上行期進行實驗。模型包括Kimi-K2、DeepSeek系列、GPT-OSS系列和被動基準。

STOCKBENCH: 大模型現實環境股票交易盈利及風險評估-AI.x社區

模型排名在下行期和上行期顯著變化,GPT-OSS120B在下行期排名靠后,上行期排名靠前,表明其適合牛市。Kimi-K2在兩個時期保持相對穩定的排名,顯示出對市場波動的魯棒性。在下行期,所有LLM智能體未能超越被動基準,而在上行期,大多數LLM智能體表現優于基準,表明LLM智能體在熊市中表現不佳,需改進。

總結

STOCKBENCH是一個新穎的基準,用于評估LLM智能體在真實股票交易場景中的表現。該基準模擬動態市場環境,要求在多個月的時間內進行持續決策,評估盈利能力和風險管理能力。實驗表明,當前LLM智能體能夠盈利,但難以持續超越簡單基線,顯示出該領域的挑戰。STOCKBENCH將為研究社區提供重要資源,推動智能金融智能體的發展。未來工作將增強基準,增加市場場景,并探索新智能體架構以提升交易表現。

本文轉載自??靈度智能??

已于2025-10-13 07:10:39修改
收藏
回復
舉報
回復
相關推薦
九色porny丨入口在线| 亚洲大尺度视频| 99精品美女| 欧美变态tickle挠乳网站| 高清欧美精品xxxxx| 你懂的好爽在线观看| 免费的成人av| 欧美高清电影在线看| 精品少妇一区二区三区免费观| 中文字幕乱码中文乱码51精品| 国产精品国产三级国产| 国产精品jizz视频| 日韩污视频在线观看| 日本电影一区二区| 亚洲国产一区二区三区在线观看| 亚洲天堂av线| 波多野结衣在线观看| 国产精品午夜电影| 国产一区二区免费电影| 亚洲香蕉在线视频| 99精品国产在热久久下载| 久久精品国产电影| 久久人人妻人人人人妻性色av| 久久人体av| 黄色精品在线看| 亚洲免费av网| 国产精品毛片一区二区三区四区| 丁香六月久久综合狠狠色| 国产美女久久久| 国产原创视频在线| 国一区二区在线观看| 社区色欧美激情 | 亚洲精品视频大全| 国内精品免费| 日韩一级免费观看| xxxx在线免费观看| 日本а中文在线天堂| 亚洲综合免费观看高清完整版| 视频一区二区在线| 你懂的视频在线| 99久久久国产精品免费蜜臀| 91传媒免费看| 一区二区三区免费观看视频| 日韩av一二三| 日韩美女在线观看一区| 欧美一二三区视频| 精品二区视频| 国产69精品久久久| 国产精品.www| 国产一区二区中文| 超薄丝袜一区二区| 91人妻一区二区三区蜜臀| 欧美伦理影院| 中文字幕久热精品视频在线| 亚洲做受高潮无遮挡| 全国精品免费看| 亚洲成人黄色网| 国产伦精品一区二区三区88av| 国产一区一区| 欧美电影精品一区二区| 欧美一级大片免费看| 日本一区二区三区播放| 717成人午夜免费福利电影| 污网站在线免费| 欧美三级电影网址| 欧美一区二区三区在| 亚洲 自拍 另类 欧美 丝袜| 青青久久精品| 日韩女优av电影| 亚洲高清无码久久| 亚洲欧洲免费| 伊人伊成久久人综合网小说| 色欲AV无码精品一区二区久久 | 一本一道波多野毛片中文在线| 国产色爱av资源综合区| 一本一本久久a久久精品综合妖精| av成人手机在线| 亚洲精品少妇30p| 久草免费福利在线| 亚洲女同av| 欧美视频三区在线播放| 天天干天天操天天玩| 国产亚洲精aa在线看| 精品久久久三级丝袜| 中文字幕日韩三级片| 黑人操亚洲人| 欧美成人自拍视频| 黄色片网站在线免费观看| 日韩精品一级二级| 91在线播放国产| 色wwwwww| 国产精品嫩草99a| 免费人成在线观看视频播放| 依依综合在线| 正在播放一区二区| 巨胸大乳www视频免费观看| 欧美gay男男猛男无套| 欧美夫妻性视频| 中文字幕在线观看视频免费| 国产综合成人久久大片91| 国产精品区一区| 成人影视在线播放| 亚洲一区二区欧美| 无限资源日本好片| 欧美三级电影在线| 久久久国产成人精品| 国产欧美一区二区三区在线看蜜臂| 看电视剧不卡顿的网站| 国产伦精品一区二区三区四区免费 | 国内精品免费在线观看| 麻豆精品视频| www免费在线观看| 一本到高清视频免费精品| 51自拍视频在线观看| 国产一区二区观看| 97视频国产在线| 国产精品久久久久久无人区| 久久伊99综合婷婷久久伊| 亚洲av综合色区| 粉嫩av一区二区三区四区五区| 亚洲а∨天堂久久精品9966 | 日本黄色免费视频| 综合亚洲深深色噜噜狠狠网站| 99爱视频在线| 中文在线免费一区三区| 日韩少妇与小伙激情| 国产成人a v| 26uuu亚洲| 欧美男女爱爱视频| 亚洲天堂av资源在线观看| 自拍视频国产精品| 国产91国语对白在线| 成人教育av在线| 一本大道东京热无码aⅴ| 国产91欧美| 国产亚洲欧洲高清| 日本高清不卡码| 91麻豆国产香蕉久久精品| 日本免费a视频| 欧美中文高清| 伦伦影院午夜日韩欧美限制| 一区二区视频免费| 国产精品系列在线| 三级av免费观看| 成人羞羞在线观看网站| 国产精品久久久av| 国产美女性感在线观看懂色av| 欧美性猛交xxxxx水多| 182在线视频| 亚洲少妇诱惑| 蜜桃999成人看片在线观看| 亚洲福利影院| 国产婷婷97碰碰久久人人蜜臀| 91蜜桃视频在线观看| eeuss鲁片一区二区三区在线观看| 91国在线高清视频| 综合激情久久| 97在线视频免费看| 无码精品一区二区三区在线 | 日韩av黄色网址| 影视先锋久久| 国产精品日韩精品| 三区四区在线视频| 日韩三级免费观看| 国产亚洲欧美久久久久| 不卡欧美aaaaa| 免费无码av片在线观看| 美女毛片一区二区三区四区| 国产精品精品视频一区二区三区| 国产精品免费观看| 777a∨成人精品桃花网| 久久午夜鲁丝片午夜精品| 成人黄色在线视频| 日韩亚洲在线视频| 欧美3p在线观看| 成人xxxxx色| 碰碰在线视频| 日韩视频在线免费观看| 国产av无码专区亚洲av麻豆| 亚洲成av人片在线观看无码| 扒开jk护士狂揉免费| 美女视频黄a大片欧美| 经典三级在线视频| 免费成人三级| 国产精品一区二区三区在线播放 | 婷婷五月综合久久中文字幕| 色哟哟一区二区三区| 国产探花在线视频| 成人美女视频在线观看| 中文字幕网av| 国语精品一区| 中文字幕精品—区二区日日骚| 成人高潮视频| 国产一区视频在线播放| 超碰中文在线| 久久精品国产亚洲精品2020| 午夜视频1000| 3d动漫精品啪啪1区2区免费| 中文字幕亚洲高清| 亚洲免费观看高清完整版在线观看熊 | 秋霞无码一区二区| 成人综合一区| 精品国产综合| 日韩三级网址| 国产欧美精品在线| 亚洲精品一区| 国内精品久久久久久久| 草莓福利社区在线| 国产一区二区三区视频在线观看 | 91网站在线观看视频| 欧美激情第一区| 奇米在线7777在线精品| 日本www在线视频| 亚洲欧美综合| 爱爱爱视频网站| 欧美日韩国产高清电影| 久久99精品久久久久久秒播放器 | 欧美黄网站在线观看| 91高清一区| 动漫3d精品一区二区三区| 男人亚洲天堂| 日本高清不卡在线| av中文字幕电影在线看| 美女999久久久精品视频| 精彩国产在线| 亚洲福利小视频| 中文字幕在线日亚洲9| 91精品福利视频| 麻豆一区产品精品蜜桃的特点| 国产嫩草影院久久久久| 国产全是老熟女太爽了| 成人久久18免费网站麻豆| 免费成人黄色大片| 男人的天堂亚洲一区| 国产成人综合一区| 中文一区二区| 91成人综合网| 欧美日韩国产色综合一二三四| 中文字幕久久一区| 成人影院在线| 欧美日韩高清在线一区| 亚洲日本视频在线| 亚洲va久久久噜噜噜| 久久精品 人人爱| 国产精品99久久久久久久久久久久| 男人av在线播放| 久久久久久有精品国产| 污污网站在线看| 欧美激情在线狂野欧美精品| 免费av不卡| 日韩视频在线免费观看| 日韩三级电影网| 亚洲小视频在线观看| 青青草手机在线| 亚洲精品www久久久| 欧美黄色小说| 亚洲精品影视在线观看| 污视频在线免费观看| 精品亚洲一区二区三区| 午夜国产在线视频| 国产午夜精品理论片a级探花| 丰满少妇被猛烈进入| 亚洲成人av中文字幕| 手机看片福利在线| 亚洲国产小视频在线观看| 九色在线播放| 亚洲性无码av在线| av天在线观看| 久久精品在线视频| av免费网站在线| 久久久久久久久久久免费| 在线免费三级电影网站| 奇米4444一区二区三区| 欧美大片免费| 国产精品自拍视频| 91成人精品在线| 久久国产日韩欧美| 欧美综合在线视频观看| 久久久久亚洲av无码专区喷水| 欧美va天堂| 欧日韩免费视频| 日韩**一区毛片| 欧美一级特黄aaa| 大桥未久av一区二区三区中文| 国产男女猛烈无遮挡a片漫画| 久久先锋影音av鲁色资源网| www亚洲色图| 中文字幕在线观看一区| 欧美日韩成人免费观看| 黄色成人av网| 依依成人在线视频| 亚洲第一级黄色片| 国产永久免费高清在线观看视频| 日韩网站免费观看高清| av女在线播放| 国产欧美日韩丝袜精品一区| 日韩一区网站| 日韩精品久久一区| 欧美.www| 日本黄网站免费| 风间由美一区二区三区在线观看| 国产精品无码专区| 亚洲欧洲成人精品av97| 欧美激情黑白配| 欧美一区二区视频在线观看2020 | 五月天综合激情网| 欧美日韩电影一区| 天堂在线资源库| 另类天堂视频在线观看| 欧美一级大黄| av免费观看久久| 国产精品久久久久久久久久10秀| 欧美在线一区视频| 狠狠色综合色综合网络| 国产中年熟女高潮大集合| 亚洲欧美另类久久久精品2019| a v视频在线观看| 欧美成人三级电影在线| 992tv免费直播在线观看| 97精品在线观看| 99综合99| 日本不卡高清视频一区| 在线观看一区| 欧美熟妇精品一区二区蜜桃视频| 国产精品私人影院| 午夜精品久久久久久久久久久久久蜜桃 | 岛国一区二区在线观看| 国产精品国产三级国产传播| 色哟哟一区二区| 日韩中文字幕综合| 久久国产精品久久国产精品| 只有精品亚洲| 色女人综合av| 美女黄网久久| av女人的天堂| 欧美日韩国产综合视频在线观看中文| 国产视频手机在线| 久久综合久久88| 国产精品伦一区二区| 欧美二区三区| 日本视频在线一区| 人妻精品久久久久中文字幕| 亚洲国产日产av| 免费看黄网站在线观看| 欧美超级免费视 在线| 日韩成人精品一区二区三区| 伊人情人网综合| 免费久久99精品国产| 国产精品久久无码| 狠狠躁夜夜躁人人躁婷婷91 | 蜜桃av免费观看| 青春有你2免费观看完整版在线播放高清| 欧美日韩国产一区在线| 蜜桃91麻豆精品一二三区| 欧美福利视频网站| 亚洲国产一区二区三区网站| 黄色成人在线免费观看| 国产一区二区调教| 成人黄色a级片| 91麻豆精品国产91| 91网在线看| 国产精品自拍首页| 在线亚洲自拍| www.色多多| 欧美视频一区二区三区在线观看| 国产一区电影| 青青草99啪国产免费| 日韩精品第一区| 激情文学亚洲色图| 亚洲国产精品久久久男人的天堂 | 欧美二区在线看| 久久天堂精品| 日本少妇aaa| 欧美一区二区三区系列电影| 男插女视频久久久| 另类欧美小说| 日日噜噜夜夜狠狠视频欧美人 | 99久久久国产精品无码免费| 草民午夜欧美限制a级福利片| 高清日韩欧美| 久久久久久久久久久福利| 久久久精品欧美丰满| 中文字幕第99页| 操日韩av在线电影| 国产精品手机在线播放 | 久久中文字幕人妻| 亚洲aⅴ怡春院| 国产精品四虎| 97超碰在线播放| 日韩精品电影一区亚洲| 艳妇荡乳欲伦69影片| 亚洲美女黄色片| 亚洲伊人精品酒店| 成人精品视频在线播放| 欧美激情中文字幕一区二区| 99久久精品国产一区色| 青青久久av北条麻妃黑人| 国产精品久久久久久麻豆一区软件| 亚洲妇女无套内射精| 欧美日韩一区二区三区高清|