精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

?LangGraph 助力代碼生成新境界

發布于 2025-8-28 06:59
瀏覽
0收藏

研究初衷

在大型語言模型(LLMs)的眾多應用中,代碼生成與分析尤為關鍵,這從產品 GitHub co-pilot 的廣泛應用和 GPT-engineer 等項目的熱度可見一斑。AlphaCodium 的最新進展展示出,與傳統“提示-應答”方法不同,“流程”式編程通過測試與反思答案,進而迭代改進,能更好地推動代碼的生成。

?LangGraph 助力代碼生成新境界-AI.x社區

AlphaCodium 的流程法則

我們最近推出了 LangGraph,這是一種以圖表形式表示與設計流程的工具。受到 AlphaCodium 和 Reflexion 工作的激勵,我們想借助 LangGraph 在代碼生成中實現類似的迭代循環和關鍵決策點。

具體而言,我們試圖構建并比較兩種架構:

  • 基于提示與上下文填充的代碼生成
  • 涉及校驗執行代碼的流程化代碼生成,出現錯誤時能自我糾錯

這個嘗試旨在探究:這種代碼檢驗能在多大程度上提升代碼生成系統的性能?

結果如何呢?

??

?與僅進行單次生成的基本方法相比,涉及校驗與自我修正的系統展現出顯著進步( 81% 對 55%

問題背景

為了在有限的文檔庫上展示代碼生成能力,我們選擇了 LangChain 的文檔子集,著重于 LangChain 表達式語言(LCEL),其范圍小(大約 60k 標記)且備受關注。我們篩選了連續 30 天的 ??chat-langchain??? 中與 LCEL 相關的問題(代碼在此)。從 ??>60k 聊天記錄??? 共篩選出 ??~500?? 條提到 LCEL 的記錄。我們對這約 500 條記錄進行聚類,由 LLM(GPT-4,128k)歸納總結,以得出每個類別中的代表性問題。每個問題我們都進行了手動審核,并制定了標準答案(含 20 個問題的評估集在這里)。我們把此數據集加到了 LangSmith。

?LangGraph 助力代碼生成新境界-AI.x社區

生成 LCEL 教材評估集合流程

利用 LangGraph 進行反射式代碼生成

我們設計并實踐了一個包含如下環節的代碼生成流程:

  • 受到長上下文 LLMs 的新動向啟發,我們利用 GPT-4(128k 令牌上下文窗口)的能力將 60k 令牌的 LCEL 文檔詳盡填充。我們向經處理過的 LCEL 鏈條提交 LCEL 相關問題,以啟動初步答案的生成。
  • 我們使用 OpenAI 工具對成果進行了解析,將輸出轉化為擁有三個部分的 Pydantic 對象:(1)問題描述,(2)導入模塊部分,(3)代碼本體。
  • 我們首先對導入模塊進行執行測試,因為我們曾發現在代碼生成過程中,幻覺可能悄然滲入導入語句之中。
  • 導入模塊測試通過后,我們接著確認代碼本身是否可執行。在代碼生成時,我們特別指導 LLM 防止代碼中出現偽代碼或未定義變量,以確保代碼能夠被執行。
  • 其中,若上述任一測試失敗,我們就會將錯誤堆棧與先前的回答一起傳回生成環節以供反思。默認我們會重試 3 次,當然這個次數根據需求還可以增加。

?LangGraph 助力代碼生成新境界-AI.x社區

集錯誤檢測、反饋及反思于一體的 LangGraph 代碼執行流程

利用 LangSmith 進行的評估

我們設立了不涉及 LangGraph 的 “上下文填充” 基準線,即在我們的流程圖中這一環節并未執行任何檢測或反饋:同樣利用 GPT-4 的 128k 令牌上下文窗口,我們將 60k 令牌的 LCEL 文檔進行充實。我們提交了與 LCEL 相關的問題以生成答案。

我們為兩個部分

(1)導入模塊的評估

(2)代碼執行的評估

實現了 LangSmith 的自定義評價功能。

我們在 “上下文填充” 的 20 個問題評估集上進行了四輪評估。評估結果在此。通過上下文填充進行的評估表明 ??~98%??? 的導入模塊測試是準確的,而代碼執行成功率約 ??~55%???(??N=79?? 次成功嘗試)。

我們通過 LangSmith 分析了失敗的案例:案例分析,一個典型的錯誤是沒能注意到 ??RunnableLambda??? 函數的輸入應當是 ??dict???,反而將其誤認為 ??string???:??AttributeError: 'dict' object has no attribute 'upper'??

接下來,我們對“通過上下文填充 + LangGraph”的情況進行了測試,通過執行測試以篩查導入和代碼執行中的錯誤,并在生成更新的答案時進行反思。在相同的評估集上,我們觀察到 ??100%??? 的導入測試是準確的,以及 ??~81%??? 的代碼執行測試是成功的(??N=78?? 次嘗試)。

以上述失敗案例為例,我們可以看到系統是如何進行處理的:完整的錯誤跟蹤顯示,我們在回答問題的第二次嘗試中遇到了同樣的錯誤詳情。在后續的反思環節中,我們提供了先前的解決方案和隨之出現的錯誤:

您之前嘗試解決過這個問題。
...
--- 最近的運行錯誤 ---
執行錯誤:'dict' 對象沒有 'upper' 屬性
...
請再次嘗試回答這個問題。
...

最終的代碼正確處理了 ??RunnableLambda??? 函數中的輸入字典,避免了 ??上下文填充??? 情況中出現的錯誤。總的來看,通過使用 LangGraph 添加這個簡單的反思步驟進行重試后,代碼執行的準確率得到了 ??~47%?? 的提高:

?LangGraph 助力代碼生成新境界-AI.x社區

使用與不使用 LangGraph 的導入及代碼執行 LangSmith 評測對比

結論總結

LangGraph 以其流程設計的便捷性,助力了復雜循環和決策點的設置。最新研究證明,這種設計對于代碼生成極具價值,能夠迭代并利用測試來檢驗答案,通過反思錯誤,不斷完善最終的解決方案。我們使用 LangGraph 實現了這一流程,并在關于 LCEL 的 20 個問題中進行了代碼導入和執行的測試。結果顯示,“上下文填充 + LangGraph” 結合反思的模式相比于僅有的“上下文填充”,在代碼執行方面取得了 ??~47%?? 的顯著提升。這一流程的應用案例在這里,并且可以輕松擴展至其他代碼庫,供相關人員參考。

已于2025-8-28 17:07:25修改
收藏
回復
舉報
回復
相關推薦
亚洲女同二女同志奶水| 亚洲成熟丰满熟妇高潮xxxxx| 一级淫片免费看| 亚洲人挤奶视频| 日韩欧美成人精品| 日产国产精品精品a∨| 国产乱码精品一区二区| 欧美日韩国产一区精品一区| 精品国产乱码久久久久久老虎| 成年人视频网站免费观看| 草草影院在线观看| 成人免费福利片| 日韩美女写真福利在线观看| 青青操视频在线播放| 亚州精品视频| 欧美丰满少妇xxxbbb| 男人的天堂狠狠干| av天在线观看| 久久嫩草精品久久久久| 91久久久久久久久久久| 国产亚洲精品女人久久久久久| 欧美电影免费网站| 在线观看视频91| 极品美女扒开粉嫩小泬| 毛片免费不卡| 国产天堂亚洲国产碰碰| 丁香婷婷久久久综合精品国产| 天堂网av手机版| 欧美日韩爆操| 中文字幕日韩专区| aa片在线观看视频在线播放| 欧美97人人模人人爽人人喊视频| 狠狠干狠狠久久| 在线观看成人av| 香蕉人妻av久久久久天天| 国产成人综合亚洲网站| 国产精品第三页| 久久国产黄色片| 欧美久久99| 自拍偷拍亚洲一区| 色婷婷av777| 欧美日韩一区二区三区在线电影| 91精品国产欧美日韩| 日韩a级在线观看| 二人午夜免费观看在线视频| 99久久精品国产网站| 91九色对白| 国产精品一区二区三区在线免费观看| 久久在线91| 人人爽久久涩噜噜噜网站| 久久精品国产亚洲av香蕉| 精品产国自在拍| 日韩av在线免费观看| 成人免费黄色av| 国产视频一区二| 欧美色窝79yyyycom| 美女黄色片视频| 亚洲美女尤物影院| 一区二区日韩av| 天堂av在线中文| 黄色av电影在线观看| 中文字幕在线观看不卡视频| 亚洲午夜在线观看| 欧美黄色激情| 中文字幕日韩欧美一区二区三区| 乱一区二区三区在线播放| 四虎精品一区二区三区| 99精品视频在线观看| 久久久久久久有限公司| 午夜视频在线播放| 国产亚洲婷婷免费| 欧美亚洲一级二级| 手机亚洲第一页| 亚洲国产精华液网站w| 欧美在线视频二区| 欧美激情二区| 亚洲欧美另类在线| 女人色极品影院| 精品一性一色一乱农村| 一区二区三区久久| 日韩网站在线免费观看| h片视频在线观看| 亚洲18女电影在线观看| 男人的天堂99| 精品国产欧美日韩一区二区三区| 欧美午夜影院在线视频| av在线无限看| va天堂va亚洲va影视| 精品国产凹凸成av人导航| 扒开伸进免费视频| 欧洲视频一区| 欧美成人自拍视频| 久久艹精品视频| 午夜在线一区二区| 国产有码一区二区| 国产刺激高潮av| 337p粉嫩大胆噜噜噜噜噜91av| 午夜精品福利一区二区| 久久国产精品一区| 婷婷国产在线综合| 国产视频手机在线播放| 日韩黄色三级在线观看| 亚洲成av人乱码色午夜| 亚洲av无码一区二区二三区| 影音先锋成人在线电影| 午夜精品久久久久久久99黑人| 亚洲第一网站在线观看| 国内精品久久久久影院一蜜桃| 国产精品一区二区三区在线观 | 97蜜桃久久| 欧美最新大片在线看| 久久综合在线观看| 91精品店在线| 亚洲黄色片网站| 色综合99久久久无码国产精品| 欧美日韩一视频区二区| 热草久综合在线| 亚洲成人久久精品| 中文字幕免费不卡在线| 午夜免费福利小电影| 国产成人午夜性a一级毛片| 精品国产1区二区| 亚洲一级片在线播放| 伊人成人在线视频| 国产精品看片资源| 天堂在线视频免费观看| 亚洲男同性恋视频| 国产福利影院在线观看| 亚洲色图美女| 欧美尺度大的性做爰视频| 国产成人无码精品亚洲| 国产美女精品一区二区三区| 久久大片网站| 成人影院在线播放| 777色狠狠一区二区三区| 国产美女网站视频| 久久午夜影视| 久久久久综合一区二区三区| 18+激情视频在线| 欧美日精品一区视频| 人妻丰满熟妇aⅴ无码| 日韩伦理视频| 国产精品老女人精品视频| 五月婷婷丁香六月| 亚洲午夜久久久久久久久电影网 | 在线观看成人av| 日韩欧美少妇| 日韩电影大片中文字幕| 日韩污视频在线观看| 国产精品一卡二卡| www婷婷av久久久影片| 久久精品xxxxx| 亚洲欧美另类人妖| 天天干天天干天天| 99精品国产91久久久久久| 国产v片免费观看| 中文字幕一区日韩精品| 久久久女女女女999久久| 国产尤物在线观看| 亚洲精品中文字幕乱码三区 | 日韩一级特黄| 国产亚洲欧美日韩美女| 日韩 欧美 亚洲| 99re在线视频这里只有精品| 免费国产黄色网址| 亚洲欧洲美洲国产香蕉| 欧美专区日韩视频| 国产精品四虎| 在线视频欧美精品| 日韩欧美国产成人精品免费| 精品系列免费在线观看| 国产91沈先生在线播放| jizz性欧美2| 国产91色在线| 成年人视频网站在线| 欧美日韩一区二区三区免费看| 精品人体无码一区二区三区| 日韩精品电影在线观看| 中文字幕不卡每日更新1区2区| 91精品国产一区二区在线观看| 久久久久久999| 日韩一级中文字幕| 欧美影片第一页| 我要看一级黄色录像| 国产91精品露脸国语对白| 男人插女人视频在线观看| 伊人久久综合影院| 国产伦精品一区二区三区精品视频 | 久久精品国产一区二区三 | 136fldh精品导航福利| 黄色av网站在线免费观看| 欧美日韩在线不卡| 日本免费一二三区| 久久久久高清精品| 性色av浪潮av| 老鸭窝毛片一区二区三区 | av网站有哪些| 蜜桃在线一区二区三区| 亚洲精品蜜桃久久久久久| 亚洲人成伊人成综合图片| 成人在线视频网站| 精品丝袜在线| 亚洲天堂成人在线| 国产一区二区女内射| 亚洲免费资源在线播放| 毛片网站免费观看| 久久国产剧场电影| 久久网站免费视频| 亚洲精品va| 日本一区视频在线播放| 日韩高清二区| 91精品久久久久| а√在线天堂官网| 欧美日韩国产成人高清视频| 午夜av免费观看| 欧美一级在线观看| 国产成人无码专区| 亚洲成人高清在线| 日韩在线一卡二卡| 久久久蜜桃精品| 妖精视频在线观看| 蜜桃一区二区三区四区| 日韩欧美国产免费| 国产一区亚洲| 亚洲综合网中心| 亚洲宅男一区| 国产精品一区二区三区精品| 日韩网站中文字幕| 欧美诱惑福利视频| 韩国日本一区| 久久91精品国产91久久跳| 搞黄视频免费在线观看| 日韩精品在线观看一区二区| 国产黄色大片网站| 69堂成人精品免费视频| 成人免费视频国产免费| 色综合天天做天天爱| 久久网免费视频| 一区二区三区**美女毛片| 日韩一区二区三区四区视频| 国产日韩欧美高清在线| 老司机免费视频| 成人18精品视频| 极品白嫩的小少妇| 丰满亚洲少妇av| 无套内谢丰满少妇中文字幕| 精品在线亚洲视频| 五月婷婷六月丁香激情| 日韩极品在线观看| 欧美色图色综合| 国产精品老牛| 蜜臀av无码一区二区三区| 在线精品一区| 成人免费性视频| 99av国产精品欲麻豆| 男人插女人视频在线观看| 亚洲视频二区| 日韩av三级在线| 老司机午夜精品视频| 777米奇影视第四色| 日本伊人色综合网| 鲁一鲁一鲁一鲁一av| 美女久久久精品| 亚洲免费成人在线视频| 国产在线精品视频| av影片在线播放| 北条麻妃一区二区三区| 国产在线不卡av| 久久蜜臀精品av| 国产又粗又猛又爽视频| 中文文精品字幕一区二区| 天堂网av2018| 亚洲综合网站在线观看| 国产午夜视频在线播放| 色综合色狠狠综合色| 亚洲天堂五月天| 91精品国产入口在线| 亚洲第一天堂在线观看| 日韩精品在线免费观看视频| 日本精品专区| 久久精品国产欧美激情| 午夜成年人在线免费视频| 日本韩国欧美精品大片卡二| 成人mm视频在线观看| 91手机在线播放| 国内精品国产成人国产三级粉色| 农村寡妇一区二区三区| 精品美女久久| 99热这里只有精品免费| 99精品免费| 午夜视频在线观| av午夜精品一区二区三区| 一级黄色毛毛片| 亚洲午夜在线电影| 亚洲最新av网站| 精品国产成人系列| 日本成a人片在线观看| 久久久久久久国产| av亚洲一区| 18成人免费观看网站下载| 欧美美女在线观看| 国产91av视频在线观看| 国产精品一级| 亚洲视频第二页| 26uuu久久天堂性欧美| 国产黄a三级三级| 欧美性猛交视频| 国产口爆吞精一区二区| 一区二区福利视频| 天使と恶魔の榨精在线播放| 国产成人精品在线观看| 精品中文在线| 日韩欧美一区二区在线观看 | 可以免费看的av毛片| 欧美精品自拍偷拍| 免费在线黄色网址| 久久人人爽人人| 成人精品三级| 欧美在线激情| 亚洲精品乱码| 国产无套精品一区二区三区| 国产清纯美女被跳蛋高潮一区二区久久w| 精品午夜福利在线观看| 欧美色视频一区| 九色在线视频| 欧美日韩成人在线播放| 成人在线视频国产| av一区观看| 91成人精品视频| 欧美第一页浮力影院| 国产三级精品视频| 无码人妻精品一区二区三区不卡| 欧美成人精品高清在线播放| 在线观看av免费| 国产日本欧美一区二区三区| 欧美一站二站| 欧美污视频网站| 久久男人中文字幕资源站| 五月婷婷激情网| 亚洲精品999| 18av在线视频| 国产激情一区二区三区在线观看| 亚洲欧美日韩高清在线| 色婷婷综合网站| 国产精品毛片大码女人| 久久这里只有精品9| 一区二区三区黄色| 三级成人黄色影院| 日韩久久久久久久| 欧美一级一区| 天天干天天舔天天操| 色偷偷88欧美精品久久久| 欧美男男同志| 欧美一区二区三区艳史| 久草在线成人| 亚欧在线免费观看| 国产精品嫩草99a| 91亚洲欧美激情| 色婷婷久久一区二区| 国产麻豆精品| 欧美性猛交内射兽交老熟妇| 不卡电影一区二区三区| 日韩三级小视频| 一本色道久久综合亚洲精品小说 | 欧美 日韩 人妻 高清 中文| 韩剧1988免费观看全集| 欧美中文一区| 黄色国产小视频| 国产精品久久久久久久蜜臀| 国产普通话bbwbbwbbw| 亚洲毛片在线观看.| 欧美性aaa| 人妻av无码专区| 99国产精品久久久久| 中文字幕av久久爽| 日韩视频永久免费观看| 伊人久久大香线蕉av超碰| 免费超爽大片黄| 国产欧美一区二区精品久导航 | 老司机亚洲精品| 国产传媒在线看| 欧美一卡在线观看| 毛片电影在线| 色女孩综合网| 国产传媒欧美日韩成人| 好吊色在线视频| 在线观看欧美日韩| 凹凸成人在线| 黄色成人免费看| 亚洲最新视频在线播放| 国产精品影院在线| 97久久人人超碰caoprom欧美| 国产欧美短视频| 国精产品视频一二二区| 欧美成人性战久久| 婷婷激情一区| 国产又大又长又粗又黄| 99久久er热在这里只有精品66| 一级淫片免费看| 亚洲2020天天堂在线观看|