精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

補齊Transformer規劃短板,田淵棟團隊的Searchformer火了

人工智能 新聞
為了提升 Transformer 的推理和規劃性能,近些年研究社區也提出了一些方法。一種最常見且有效的方法是模擬人類的思考過程:先生成中間「思維」,然后再輸出響應。

最近幾年,基于 Transformer 的架構在多種任務上都表現卓越,吸引了世界的矚目。使用這類架構搭配大量數據,得到的大型語言模型(LLM)等模型可以很好地泛化用于真實世界用例。

盡管有如此成功,但基于 Transformer 的架構和 LLM 依然難以處理規劃和推理任務。之前已有研究證明 LLM 難以應對多步規劃任務或高階推理任務。

為了提升 Transformer 的推理和規劃性能,近些年研究社區也提出了一些方法。一種最常見且有效的方法是模擬人類的思考過程:先生成中間「思維」,然后再輸出響應。比如思維鏈(CoT)提示法就是鼓勵模型預測中間步驟,進行按步驟的「思考」。思維樹(ToT)則使用了分支策略和評判方法,讓模型生成多個不同的思維路徑,然后從中選出最佳路徑。盡管這些技術通常是有效的,但也有研究表明,在很多案例中,這些方法會讓模型的性能下降,原因包括自我強制(self-enforcing)。

另一方面,在一個數據集上有效的技術可能無法很好地處理其它數據集,原因可能包括所涉及的推理類型發生了變化,比如從空間推理變成了數學推理或常識推理。

相較之下,傳統的符號式規劃和搜索技術卻能表現出很好的推理能力。此外,這些傳統方法計算得到的解決方案通常有形式上的保證,因為符號規劃算法通常遵循明確定義的基于規則的搜索過程。

為了讓 Transformer 具備復雜推理能力,Meta FAIR 田淵棟團隊近日提出了 Searchformer。


  • 論文標題:Beyond A?: Better Planning with Transformers via Search Dynamics Bootstrapping
  • 論文地址:https://arxiv.org/pdf/2402.14083.pdf

Searchformer 是一種 Transformer 模型,但針對迷宮導航和推箱子等多步規劃任務,它卻能計算出最優規劃并且所用搜索步驟數也能遠少于 A? 搜索等符號規劃算法。

為了做到這一點,該團隊提出了一種新方法:搜索動態引導(search dynamics bootstrapping)。該方法首先是訓練一個 Transformer 模型來模仿 A? 的搜索過程(如圖 1 所示,然后對其進行微調,使其能用更少的搜索步數找到最優規劃。

更詳細地說,第一步,訓練一個模仿 A? 搜索的 Transformer 模型。這里,該團隊的做法是針對隨機生成的規劃任務實例運行 A* 搜索。在執行 A? 時,該團隊會記錄執行的計算和最優規劃并將其整理成詞序列,即 token。這樣一來,所得到的訓練數據集就包含了 A? 的執行軌跡并編碼了有關 A? 本身的搜索動態的信息。然后,訓練一個 Transformer 模型,讓其能針對任意規劃任務沿最優規劃生成這些 token 序列。

第二步,使用專家迭代(expert iteration)方法進一步提升使用上述經過搜索增強的序列(包含 A? 的執行軌跡)訓練的 Searchformer。專家迭代方法可讓 Transformer 憑借更少的搜索步驟生成最優解。這個過程會得到一種神經規劃算法,其隱式地編碼在該 Transformer 的網絡權重之中,并且它有很高的概率以少于 A? 搜索的搜索步數找到最優規劃。比如說,在執行推箱子任務時,新模型能解答 93.7% 的測試任務,同時搜索步數比 A? 搜索平均少 26.8%。

該團隊表示:這為 Transformer 超越傳統符號規劃算法鋪平了道路。

實驗

為了更好地理解訓練數據和模型參數量對所得模型性能的影響,他們進行了一些消融研究。

他們使用了兩類數據集訓練模型:一種的 token 序列中只包含解(solution-only,其中只有任務描述和最終規劃);另一種則是搜索增強型序列(search-augmented,其中包含任務描述、搜索樹動態和最終規劃)。

實驗中,該團隊使用了 A? 搜索的一種確定性和非確定性變體來生成每個序列數據集。

迷宮導航

在第一個實驗中,該團隊訓練了一組編碼器 - 解碼器 Transformer 模型來預測 30×30 迷宮中的最優路徑。

圖 4 表明,通過預測中間計算步驟,可在數據量少時獲得更穩健的性能表現。

圖片

圖 5 給出了僅使用解訓練的模型的性能。

圖 6 展示了任務難度對每個模型的性能的影響。

整體而言,盡管當使用的訓練數據集足夠大和足夠多樣化時,僅使用解訓練的模型也能預測得到最優規劃,但當數據量少時,經過搜索增強的模型的表現明顯好得多,并且也能更好地擴展用于更困難的任務。

推箱子

圖片

為了測試能否在不同且更復雜的任務(具有不同的 token 化模式)上得到類似的結果,該團隊還生成了一個推箱子的規劃數據集進行測試。

圖 7 展示了每種模型針對每個測試任務生成正確規劃的概率。

可以看到,和上一個實驗一樣,通過使用執行軌跡進行訓練,搜索增強型模型的表現優于僅使用解訓練的模型。

Searchformer:通過引導方法提升搜索動態

最后一個實驗,該團隊研究了搜索增強型模型可以如何迭代提升,從而憑借更少的搜索步數計算出最優規劃。這里的目標是在縮短搜索軌跡長度的同時依然得到最優解。

圖 8 表明,新提出的搜索動態引導方法能夠迭代式地縮短 Searchformer 模型生成的序列的長度。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-10-16 13:50:00

模型AI

2025-10-08 10:19:29

2024-12-12 09:00:00

2024-12-19 09:48:07

2023-06-12 09:57:22

AIChatGPT

2023-03-17 08:28:17

GPT-4AI

2024-10-28 08:50:00

2025-02-17 09:30:00

AI訓練模型

2022-05-06 07:31:01

useEventReactHook

2023-12-07 06:51:18

AI模型

2024-10-17 14:10:00

模型訓練

2023-06-30 09:49:23

模型Meta

2023-08-04 13:42:41

2023-06-28 18:10:27

羊駝家族大模型集體進化

2025-06-20 08:47:00

量子計算AI模型

2020-09-22 09:54:19

谷歌Android開發者

2021-10-28 15:41:07

計算機AI 技術

2025-10-23 12:28:40

2019-04-25 10:20:24

Transformer神經網絡模型

2022-12-25 13:46:37

生成器
點贊
收藏

51CTO技術棧公眾號

亚洲大胆人体av| 国产精品情趣视频| 5566日本婷婷色中文字幕97| 三上悠亚ssⅰn939无码播放| 日韩护士脚交太爽了| 亚洲制服丝袜av| 免费观看成人在线| 91国在线视频| 99精品免费视频| 日韩视频第一页| 在线天堂www在线国语对白| 99久久久国产精品免费调教网站 | 在线亚洲伦理| 中文字幕欧美日韩va免费视频| 日本少妇一级片| 99欧美精品| 午夜视频在线观看一区二区三区| 日韩高清国产一区在线观看| 国产综合在线播放| 蜜臀av一级做a爰片久久| 久久久久国产精品www| 女人裸体性做爰全过| 欧美激情15p| 欧美一卡2卡3卡4卡| av无码精品一区二区三区| 一色桃子av在线| 国产精品沙发午睡系列990531| 国产日韩欧美一区二区三区四区| 国产裸体永久免费无遮挡| 亚洲尤物影院| 欧美国产第一页| 午夜激情福利电影| 精品99在线| 精品偷拍一区二区三区在线看| 男生和女生一起差差差视频| 日本中文字幕一区二区| 精品久久久视频| 91黄色在线看| 最新av在线播放| 中文字幕视频一区二区三区久| 欧美在线视频二区| 熟妇人妻中文av无码| 国产麻豆欧美日韩一区| 国产在线高清精品| 羞羞色院91蜜桃| 久久一二三区| 国产mv免费观看入口亚洲| 五月婷婷激情网| 欧美激情亚洲| 欧美日本在线视频中文字字幕| 国产探花在线视频| 欧美r级电影| 色综合影院在线| a一级免费视频| 欧美韩日一区| 日韩视频免费大全中文字幕| 一二三四在线观看视频| 欧美h版在线| 久久视频中文字幕| 久久久久久久久久久久久女过产乱| 日本高清免费电影一区| 中文字幕日本精品| 波多野结衣在线网址| 91精品综合| 久久99热这里只有精品国产| 欧美精品99久久久| 亚洲国内自拍| 国产69精品久久久久9999| 日本一级淫片色费放| 夜夜嗨一区二区| 国产xxx69麻豆国语对白| 无码免费一区二区三区| 免费欧美在线视频| 91夜夜揉人人捏人人添红杏| 性生交生活影碟片| 99精品视频在线免费观看| 久久人人九九| 懂色av中文在线| 中文字幕在线不卡| 成年人视频大全| 九色porny丨入口在线| 日本丶国产丶欧美色综合| 91日韩视频在线观看| 不卡精品视频| 亚洲国产精品va在线| 亚洲AV无码国产成人久久| 91免费精品| 国内精品美女av在线播放| 中文字字幕在线中文| 免费人成在线不卡| 国产精品xxxx| 成人免费在线观看| 亚洲曰韩产成在线| av网址在线观看免费| 高清一区二区| 亚洲精品网站在线播放gif| 国产大屁股喷水视频在线观看| 欧美 日韩 国产一区二区在线视频 | 日本在线不卡一区二区| 精品一区毛片| 美乳少妇欧美精品| 久久亚洲天堂网| 开心九九激情九九欧美日韩精美视频电影| 亚洲专区国产精品| 欧美美女搞黄| 一级日本不卡的影视| 狠狠操精品视频| 综合伊人久久| 中文字幕日韩欧美| 亚洲视频免费播放| 韩国女主播成人在线| 久久av免费观看| www.久久ai| 欧美主播一区二区三区美女| www国产视频| 91高清一区| 国产精品夫妻激情| 日本美女一级视频| 亚洲乱码日产精品bd| 人人爽人人av| 欧美五码在线| 欧美另类在线播放| 一级α片免费看刺激高潮视频| av日韩在线网站| 六月婷婷激情网| 成人精品动漫| 亚洲天堂开心观看| 日本道在线观看| 成人高清视频在线| 男人添女人下部视频免费| 青娱乐极品盛宴一区二区| 亚洲天堂影视av| 久久久精品福利| 99精品在线免费| 91丨porny丨探花| 97久久超碰| 欧美乱妇40p| 国产av无码专区亚洲a∨毛片| 国产精品私房写真福利视频| 日韩在线第三页| 亚洲毛片免费看| 欧美一区二区视频97| 人妻精品一区二区三区| 亚洲一区在线观看网站| 亚洲成人福利视频| 激情91久久| 懂色av一区二区三区在线播放| av在线看片| 3d动漫精品啪啪一区二区竹菊 | 自拍偷拍欧美一区| 88xx成人精品| 欧洲综合视频| 色综合色综合色综合| 深爱五月激情网| 天堂成人免费av电影一区| 日韩激情视频| 国产精品久久乐| 日韩在线视频中文字幕| 91久久精品无码一区二区| 国产精品看片你懂得| 九九精品久久久| 欧美一区二区三区另类 | 1024亚洲合集| 欧美体内she精高潮| 午夜亚洲福利| 国产日韩欧美一区二区三区四区| 日本а中文在线天堂| 亚洲美女av在线播放| 中文字幕在线欧美| 中文字幕精品在线不卡| 天天综合天天添夜夜添狠狠添| 999久久久亚洲| 99久久自偷自偷国产精品不卡| 午夜伦理在线视频| 日韩hd视频在线观看| 日韩在线 中文字幕| 欧美国产日韩一二三区| 91精品视频国产| 一区在线免费观看| 欧美亚洲另类在线一区二区三区| 国产一区二区三区四区五区3d | a在线视频v视频| 亚洲欧美精品在线| 国产精品免费无遮挡| 亚洲一区二区三区在线看| jizz欧美性20| 精品中文av资源站在线观看| 4444亚洲人成无码网在线观看| 亚洲成aⅴ人片久久青草影院| 91精品久久久久| 18av在线视频| 亚洲少妇激情视频| 精品人妻一区二区三区换脸明星| 午夜精品一区二区三区电影天堂| 老熟妇一区二区| 国产成人高清在线| 毛葺葺老太做受视频| 欧美午夜一区| 四虎影院一区二区三区 | 亚洲国产精品一区二区第一页| 国产精品视频一区二区三区综合| 久久全国免费视频| 思思99re6国产在线播放| 精品国产99国产精品| 中文字幕在线播放av| 亚洲成人资源在线| 美女网站视频色| 91色porny| 无套内谢丰满少妇中文字幕| 免费日韩一区二区| 男同互操gay射视频在线看| 蜜桃一区二区| 国产精品日韩欧美一区二区| 国产精品久久久久77777丨| 午夜精品久久久久久久99黑人| 中文字幕在线观看日本| 日韩精品极品在线观看| 精品人妻一区二区三区三区四区| 在线亚洲免费视频| 日韩免费一级片| 亚洲精品国产高清久久伦理二区| 精品国产成人亚洲午夜福利| 99精品视频在线播放观看| 久久久久亚洲AV成人网人人小说| 韩国v欧美v亚洲v日本v| 中文久久久久久| 久久精品伊人| 黄www在线观看| 一本久道久久久| 日韩一级片免费视频| 欧美激情日韩| 麻豆视频传媒入口| 91精品天堂福利在线观看| 亚洲一区二区精品在线| 国产欧美日韩在线一区二区| 精品一区二区三区视频日产| 精品三级av| 国产一区二区久久久| 国内精品偷拍| 九九九热999| 日韩精选在线| 久久伊人一区二区| 亚洲动漫精品| 欧美日韩一区二区视频在线观看| 日本中文字幕在线一区| 国产综合动作在线观看| 狠狠久久伊人| 九色综合婷婷综合| 免费久久久久久久久| 欧美在线一二三区| 国产免费久久| 亚洲精品久久久久久一区二区| 亚洲区小说区图片区qvod按摩 | 91精品啪在线观看国产81旧版| 日本不卡一区二区三区四区| 国产精品久久久久无码av| 中国老女人av| 精品av久久久久电影| 日本欧美黄色片| 男人的天堂成人在线| 九九视频精品在线观看| 老鸭窝一区二区久久精品| 91福利免费观看| 国产91精品精华液一区二区三区| 午夜福利三级理论电影| 久久先锋资源网| 成年人看的免费视频| 日韩久久一区二区| 免费麻豆国产一区二区三区四区| 亚洲成av人片在线观看无码| 日韩久久中文字幕| 欧美天堂一区二区三区| 夜夜爽8888| 亚洲精品一区二区三区99| 五月激情六月婷婷| 一区二区在线视频播放| 成人免费观看视频大全| 97精品久久久中文字幕免费| 欧美日韩精品免费观看视完整| 国产精品视频久久| 日本精品在线观看| 精品国产乱码久久久久软件| 欧美色婷婷久久99精品红桃| 久久久久久久免费视频| 国产精品腿扒开做爽爽爽挤奶网站| 欧美午夜性生活| 国产91精品在线观看| 伊人网在线视频观看| 成人欧美一区二区三区黑人麻豆| 久久精品国产亚洲AV无码男同| 色视频欧美一区二区三区| 国产精品区在线观看| 亚洲国产精品久久| 日本在线天堂| 97精品伊人久久久大香线蕉| 国产成人免费精品| 国产一区二区不卡视频| 外国成人免费视频| 国产一区亚洲二区三区| 国产精品主播直播| 久久久视频6r| 亚洲国产sm捆绑调教视频| 真实新婚偷拍xxxxx| 精品国产一区二区三区四区四| 成年在线电影| 7777免费精品视频| 国产情侣一区在线| 日韩欧美激情一区二区| 日韩视频一区二区三区在线播放免费观看| 亚洲综合色在线观看| 99久久久精品| 欧美日韩精品一区二区三区视频播放 | 日韩激情在线视频| 伊人电影在线观看| 国产在线观看91精品一区| 美女精品一区最新中文字幕一区二区三区| 最新中文字幕久久| 日本特黄久久久高潮| 亚洲国产精品无码久久久久高潮| 亚洲黄色小视频| 亚洲天堂男人网| 亚洲午夜色婷婷在线| 国产资源在线观看入口av| 99国产在线观看| 亚洲最新av| 中文字幕视频三区| 国产午夜精品一区二区三区视频 | 欧美午夜精品久久久久久超碰| 凸凹人妻人人澡人人添| 欧美大秀在线观看| 免费精品一区二区三区在线观看| 亚洲一区二区在线免费观看| 水蜜桃久久夜色精品一区的特点 | 日韩精品福利一区二区三区| 国产真实老熟女无套内射| 国产麻豆视频一区二区| √天堂中文官网8在线| 欧美三级日韩三级国产三级| 国产综合视频一区二区三区免费| 欧美一级片免费在线| 老牛精品亚洲成av人片| 欧美男女爱爱视频| 成人短视频下载| 日韩久久精品视频| 亚洲第一精品福利| 国产网站在线| 久精品国产欧美| 美女视频一区免费观看| 日本黄色特级片| 色诱视频网站一区| 国产女人在线观看| 国产精品欧美久久久| 日韩电影免费网址| 国产精品嫩草影院8vv8| 亚洲图片激情小说| 精品人妻一区二区三区日产乱码| 精品自在线视频| 国产精品白丝av嫩草影院| 日本xxxxxxxxxx75| 91免费国产在线观看| 无码任你躁久久久久久久| 国产一区二区三区视频| 少妇精品视频在线观看| 一级黄色片播放| 成人性生交大片免费| 国产午夜福利精品| 亚洲精品午夜精品| 青娱乐极品盛宴一区二区| 日本一本草久p| www.66久久| 91丨九色丨海角社区| 日韩在线播放一区| 日韩中文字幕在线一区| 国产96在线 | 亚洲| 久久久久久夜精品精品免费| 亚洲资源在线播放| 久久久久久国产精品| 亚洲bt欧美bt精品777| 亚洲少妇久久久| 亚洲精品久久久蜜桃| 五月天婷婷视频| 国产精品久久久久久久久| 亚洲精品小说| 国产人妻人伦精品1国产丝袜| 欧洲中文字幕精品| 蜜桃传媒在线观看免费进入 | 午夜免费播放观看在线视频| 1卡2卡3卡精品视频| 国产精品久久久久久模特| 夫妇露脸对白88av| 亚洲国产精品va在线看黑人动漫| 欧洲成人一区| 成人国产在线看| 国产亚洲成av人在线观看导航| 国产一区二区三区中文字幕| 91高清视频在线免费观看| 久久高清免费| 美女又爽又黄视频毛茸茸| 制服丝袜一区二区三区| 欲香欲色天天天综合和网|