精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

告訴大模型「深呼吸,一步一步來」有奇效,DeepMind發現最有效的提示方法

人工智能 新聞
本文提出了一種簡單而有效的方法 OPRO,其利用大型語言模型作為優化器,優化任務用自然語言描述就可以,優于人類設計的提示。

優化對于所有領域都至關重要。 

有些優化是從初始化開始的,然后迭代的更新解以優化目標函數。這種優化算法通常需要針對單個任務進行定制,以應對決策空間帶來的特定挑戰,特別是對于無導數的優化。

接下來我們要介紹的這項研究,研究者另辟蹊徑,他們利用大型語言模型 (LLM) 充當優化器,在各種任務上的性能比人類設計的提示還好。

這項研究來自 Google DeepMind,他們提出了一種簡單而有效的優化方法 OPRO(Optimization by PROmpting),其中優化任務可以用自然語言來描述,例如 LLM 的提示語可以是「深呼吸,一步一步地解決這個問題」,也可以是「讓我們結合我們的數字命令和清晰的思維來快速準確地破譯答案」等等。

在每個優化步驟(step)中,LLM 根據先前生成的解決方案及其值的提示生成新的解決方案,然后對新解決方案進行評估并將其添加到下一個優化步驟的提示中。

最后,該研究將 OPRO 方法用于線性回歸和旅行商問題(著名的 NP 問題),然后繼續進行提示優化,目標是找到最大化任務準確率的指令。

本文對多個 LLM 進行了綜合評估,包括 PaLM-2 模型家族中的 text-bison 和 Palm 2-L,以及 GPT 模型家族中的 gpt-3.5-turbo 和 gpt-4 。實驗在 GSM8K 和 Big-Bench Hard 上對提示進行了優化,結果表明經過 OPRO 優化的最佳提示在 GSM8K 上比人工設計的提示高出 8%,在 Big-Bench Hard 任務上比人工設計的提示高出高達 50%。

圖片

論文地址:https://arxiv.org/pdf/2309.03409.pdf

論文一作、 Google DeepMind 的研究科學家 Chengrun Yang 表示:「為了進行提示優化,我們從『讓我們開始解決問題』這樣的基本指令開始,甚至是空字符串,最終 OPRO 生成的指令會使 LLM 性能逐漸變好,如下圖所示的向上的性能曲線看起來就像傳統優化中的情況一樣!」

圖片

「每個 LLM 即使是從相同的指令開始,經過 OPRO 的優化,不同 LLM 的最終優化指令也顯示出不同的風格,優于人類編寫的指令,并且可以遷移到類似的任務上。」

圖片

圖片

從上表中我們也可以得出,作為優化器的 LLM 最終找到的指令風格差異很大,PaLM 2-L-IT 和 text-bison 的指令偏簡潔,而 GPT 的指令又長又詳細。盡管一些頂級指令包含「一步一步(step-by-step)」提示,但 OPRO 都能找到其他的語義表達方式,實現了相媲美或更好的準確性。

不過有研究者表示:「深呼吸,一步一步地來」這個提示在谷歌的 PaLM-2 上非常有效(準確率為80.2)。但我們不能保證它適用于所有模型和所有情況,所以我們不應該盲目地到處使用它。

圖片

OPRO:將 LLM 作為優化器

圖 2 展示了 OPRO 整體框架。在每個優化步驟中,LLM 根據優化問題描述以及元提示(meta-prompt)中先前評估的解決方案(圖 2 右下部分)生成優化任務的候選解決方案。

接下來,LLM 在對新的解決方案進行評估并將其添加到元提示中以進行后續優化過程。

當 LLM 無法提出具有更好優化分數的新解決方案或達到最大優化步驟數時,優化過程終止。 

圖片

圖 3 為一個示例展示。元提示包含兩個核心內容,第一部分是先前生成的提示及其相應的訓練準確率;第二部分是優化問題描述,包括從訓練集中隨機選擇的幾個示例來舉例說明感興趣的任務。 

圖片

本文首先展示了 LLM 作為「數學優化」優化器的潛力。在線性回歸問題中的結果如表 2 所示:

圖片

接下來,論文還探討了 OPRO 在旅行商( TSP )問題上的結果,具體來說, TSP 是指給定一組 n 個節點及其坐標,TSP 任務是找到從起始節點開始遍歷所有節點并最終返回到起始節點的最短路徑。

圖片

實驗

實驗中,本文將預訓練的 PaLM 2-L 、經過指令微調的 PaLM 2-L 以及 text-bison、gpt-3.5-turbo、gpt-4 作為 LLM 優化器;預將訓練的 PaLM 2-L 和 text-bison 作為評分器 LLM。

評估基準 GSM8K 是關于小學數學的,有 7473 個訓練樣本和 1319 個測試樣本;Big-Bench Hard (BBH) 基準包含算術推理以外的廣泛主題,包括符號操作和常識推理。

GSM8K 結果

圖 1 (a) 顯示了使用預訓練的 PaLM 2-L 作為評分器和 PaLM 2-L-IT 作為優化器的即時優化曲線,可以觀察到優化曲線整體呈上升趨勢,在整個優化過程中出現了幾次跳躍:

圖片

接下來,本文展示使用 text-bison 評分器和 PaLM 2-L-IT 優化器生成 Q_begin 指令的結果,本文從空指令開始,這時的訓練準確率為 57.1,之后訓練準確率開始上升。圖 4 (a) 中的優化曲線顯示了類似的上升趨勢,在此期間訓練準確率出現了一些飛躍:

圖片

BBH 結果

圖 5 直觀地顯示了所有 23 個 BBH 任務與「讓我們一步一步思考」的指令相比,每個任務的準確率差異。表明 OPRO 找到的指令優于「讓我們一步一步思考」。在幾乎所有任務上都有很大優勢:本文找到的指令在使用 PaLM 2-L 評分器的 19/23 任務上以及使用 text-bison 評分器的 15/23 任務上表現優于 5% 以上。

圖片

與 GSM8K 類似,本文觀察到幾乎所有 BBH 任務的優化曲線都呈上升趨勢,如圖 6 所示。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2022-08-29 15:19:09

CSS煙花動畫

2009-07-06 19:29:37

云計算私有云服務器虛擬化

2013-03-18 16:09:27

JavaEEOpenfire

2023-09-09 12:56:36

2012-03-22 10:33:33

思杰XenDesktop

2011-06-07 16:03:48

匿名SQL Server

2022-09-30 15:37:19

Web網站服務器

2018-03-07 15:24:41

PythonMySQL

2011-05-10 09:19:55

數據庫設計

2011-04-25 15:22:26

數據庫設計

2017-08-24 08:31:41

2009-12-18 16:27:43

Cisco路由器配置

2010-07-12 17:10:23

Android應用程序

2019-11-04 10:06:19

MySQL索引

2017-11-29 11:14:52

離線緩存URL協議緩存

2017-09-28 09:40:36

圖像分類準確率

2017-07-15 21:10:58

CTOCEO技術

2025-04-08 09:30:00

SeataDocker分布式系統

2009-12-17 08:57:28

Windows 7磁盤分區

2024-07-22 11:43:28

LVMPnetLab網絡
點贊
收藏

51CTO技術棧公眾號

欧美日中文字幕| 超碰97国产精品人人cao| 一本久久综合| 日韩av在线导航| 1024av视频| 精品视频一二三| 免费一级欧美片在线观看| 日韩在线欧美在线| 日本r级电影在线观看| 波多野结衣乳巨码无在线观看| hitomi一区二区三区精品| 欧美亚洲国产视频| 欧美xxxx精品| 综合成人在线| 一本一本大道香蕉久在线精品 | 国产一级免费av| 婷婷综合电影| 欧美日韩国产综合草草| 日本精品久久久久久久久久| 东凛在线观看| 成人免费视频网站在线观看| 国产91色在线免费| 91插插插插插插| 五月综合久久| 欧美肥妇毛茸茸| 久久无码高潮喷水| av在线网址观看| 久久综合九色欧美综合狠狠| 国产成人中文字幕| 久草视频中文在线| 日韩在线观看| 精品视频在线播放| 亚洲熟妇一区二区| 黄色成人小视频| 精品成人av一区| 一道本在线观看视频| 免费h视频在线观看| 亚洲性图久久| 伊是香蕉大人久久| 中文字幕在线视频播放| 成人亚洲免费| 精品日韩中文字幕| 粉嫩av一区二区三区天美传媒| 日本一二三区在线视频| 国产一区二三区好的| 日韩av电影手机在线| 亚洲女性喷水在线观看一区| 国产精品久久久久久久7电影 | 久久精品亚洲国产奇米99 | 亚洲视频中文字幕| 日本91av在线播放| a级片在线观看免费| 精品久久91| 亚洲高清久久网| 能看毛片的网站| 91九色综合| 一本色道**综合亚洲精品蜜桃冫| 男人天堂新网址| 国产精品久久久久久福利| 久久午夜免费电影| 久久99精品久久久久子伦| www日本高清| 久草在线在线精品观看| 国产欧美精品久久久| 波多野结衣在线观看一区| 一本色道88久久加勒比精品| 欧美—级a级欧美特级ar全黄| 黄色一级片中国| 五月精品视频| 久久精品99无色码中文字幕 | 日韩精品第二页| 欧美日韩在线一区二区| 韩国中文字幕av| 国产综合色在线观看| 欧美三级在线看| 国产一二三区av| 91久久久久久白丝白浆欲热蜜臀| 欧美日韩你懂得| 污污的网站免费| 成人51免费| 日韩一区二区视频在线观看| 4438x全国最大成人| 亚洲日本va午夜在线电影| 欧美不卡激情三级在线观看| 一边摸一边做爽的视频17国产| 黄色网一区二区| 国产视频在线观看一区二区| 四虎国产精品成人免费入口| 日韩情爱电影在线观看| 精品国产欧美成人夜夜嗨| 日本a级片视频| 国一区二区在线观看| 亚洲2020天天堂在线观看| 国产无精乱码一区二区三区| 亚洲自啪免费| 国产日本欧美在线观看 | 亚洲综合电影一区二区三区| 国产精品爱久久久久久久| 中文字幕在线观看免费| 国产精品一区二区无线| 九九九热999| 高清性色生活片在线观看| 亚洲女人的天堂| 阿v天堂2017| 国产经典一区| 日韩欧美国产电影| 久久久久国产精品区片区无码| 精品久久成人| 欧美裸体xxxx极品少妇| 国产一级精品视频| 日韩不卡手机在线v区| 51国偷自产一区二区三区| 日本亚洲一区| 亚洲免费在线电影| 动漫av网站免费观看| 精品午夜视频| 亚洲毛茸茸少妇高潮呻吟| 欧美三级黄色大片| 性感少妇一区| 147欧美人体大胆444| 日本不卡视频一区二区| 亚洲激情图片qvod| 中文字幕第36页| 精品在线网站观看| 久久国产精品影视| 日韩欧美一级大片| 99这里只有精品| 一道本在线观看视频| 视频一区在线免费看| 亚洲第一在线视频| 久久嫩草捆绑紧缚| 天堂久久久久va久久久久| av在线亚洲男人的天堂| 亚洲s色大片| 日韩欧美第一页| 国产精九九网站漫画| 97精品国产| 国产成人97精品免费看片| 开心激情综合网| 中文字幕一区二区三区色视频| www黄色在线| 久久影视三级福利片| 欧美日本亚洲视频| 国产人妻精品一区二区三区| 国产精品三级视频| 久久久国产欧美| 九九热线有精品视频99| 久久乐国产精品| 99产精品成人啪免费网站| 国产精品色婷婷久久58| 日本熟妇人妻中出| 久久不见久久见中文字幕免费| 国模吧一区二区| 亚洲国产精品久久久久爰性色| 国产精品国产馆在线真实露脸 | 午夜精品小视频| 1024国产精品| 国产三级三级看三级| 欧美老女人另类| 日本免费久久高清视频| 手机福利小视频在线播放| 亚洲1区2区3区4区| 国产ts在线观看| 欧美精品日韩| 成人国产一区二区| 国产区美女在线| 精品国产乱码久久久久久浪潮| 欧美激情精品久久| 国产成人av电影免费在线观看| 青青草综合在线| 一区二区三区四区精品视频| 色综合久久久久久中文网| 亚洲精品.www| 图片区日韩欧美亚洲| 你懂的在线观看网站| 亚洲影视综合| 手机在线观看国产精品| 久久不卡日韩美女| 超碰97人人做人人爱少妇| av网站免费大全| 亚洲一区二区三区四区五区中文 | 欧美丰满艳妇bbwbbw| 国产91精品精华液一区二区三区 | 亚洲一区在线电影| 国产精品久久久久久亚洲色| 一区二区精品| 日本一区二区三区视频在线播放| 91p九色成人| 久久久久北条麻妃免费看| 超碰在线观看99| 欧美日韩视频在线| 长河落日免费高清观看| 国产美女在线精品| 欧美日韩精品在线一区二区| 国内精品久久久久久久影视简单| 国产精品一区久久久| 亚洲婷婷噜噜| 日韩精品久久久久久福利| 欧美日韩 一区二区三区| 17c精品麻豆一区二区免费| 午夜不卡久久精品无码免费| 视频一区视频二区中文字幕| 成人短视频在线看| 人人网欧美视频| 国产欧美日韩精品丝袜高跟鞋| 欧美激情成人动漫| 亚洲天堂av在线播放| 国产成人精品一区二区无码呦| 欧美日韩午夜剧场| 国产精品久久久久久久精| 337p粉嫩大胆色噜噜噜噜亚洲| 天天干天天操天天做| 亚洲三级免费| 亚洲人成网站在线观看播放| 国产精品nxnn| 91精品久久久久久久久久 | 国产精品久久毛片| 亚洲成年人av| 免播放器亚洲一区| 免费观看美女裸体网站| 婷婷综合亚洲| 欧洲精品国产| 91精品入口| 91精品美女在线| 樱桃视频成人在线观看| 欧美巨乳在线观看| 成年女人的天堂在线| 亚洲成人网av| 国产绳艺sm调教室论坛| 在线观看亚洲精品视频| 成年人午夜视频| 亚洲欧美国产三级| 韩国一区二区三区| 成人欧美一区二区三区视频| 黄色精品视频| 91精品国产精品| 2024最新电影在线免费观看| 亚洲图片欧洲图片av| 日本免费网站在线观看| 91精品国产日韩91久久久久久| 久久精品视频2| 香蕉影视欧美成人| 欧美三级韩国三级日本三斤| 一色道久久88加勒比一| 丰满少妇久久久久久久| 超碰人人草人人| 久久久天天操| 亚洲 自拍 另类小说综合图区| 久久久人成影片免费观看| 日本高清久久一区二区三区| 人妖一区二区三区| 国产在线观看一区| 999久久精品| 亚洲精品欧美极品| 日韩精品第二页| 国产啪精品视频网站| 亚洲国产又黄又爽女人高潮的| 极品久久久久久| 国产精品久久久久久久久果冻传媒| 国产中文字幕一区二区| 国产成人精品免费网站| 午夜影院免费版| 久久精品国产在热久久| 亚洲 欧美 日韩系列| 欧美a一区二区| 91人人澡人人爽人人精品| 美女视频黄久久| www.色欧美| 国产呦精品一区二区三区网站| 欧美视频国产视频| 国产精品综合网| 一级全黄裸体片| 成人久久18免费网站麻豆 | 欧美日韩影视| 亚洲新声在线观看| 日韩黄色影院| 乱亲女秽乱长久久久| av在线网址观看| 久久久免费观看| 女人让男人操自己视频在线观看| 欧美一乱一性一交一视频| 人人鲁人人莫人人爱精品| 国产精品日韩在线观看| 自拍偷拍亚洲图片| 国产99在线免费| 欧美亚洲大陆| 亚洲不卡中文字幕| 欧美精品不卡| 亚洲熟妇国产熟妇肥婆| 日韩成人一级大片| 日本网站在线看| av高清不卡在线| 阿v天堂2014| 亚洲免费观看高清完整版在线 | www日本在线| 国产视频精品一区二区三区| 伊人免费在线| 久久久久久久久久久国产| 91精品产国品一二三产区| 国产精品黄页免费高清在线观看| 91精品国产一区二区在线观看| 国产精品乱子乱xxxx| 狠狠综合久久av一区二区蜜桃| 国产又黄又爽免费视频| 国产精品综合色区在线观看| 天天操,天天操| av一区二区久久| 亚洲精品电影院| 性久久久久久久久久久久| 一区二区视频免费| 亚洲第一精品久久忘忧草社区| www 日韩| 午夜精品一区二区三区在线视频| 九色成人搞黄网站| 国产精品一区二区av| 欧美一区二区三| 岛国大片在线播放| 免费成人av在线| 黄色片视频免费观看| 日韩美女久久久| 亚洲s码欧洲m码国产av| 日韩一级欧美一级| av女优在线| 午夜剧场成人观在线视频免费观看| 日韩av黄色| 秋霞在线观看一区二区三区| 亚洲黄色视屏| 亚洲男人天堂2021| 日本一区二区三区在线不卡| 九九九国产视频| 7777精品伊人久久久大香线蕉 | 狠狠色丁香婷婷综合影院| 成品人视频ww入口| 激情综合网最新| 国产免费无遮挡吸奶头视频| 亚洲第一在线综合网站| 国产婷婷一区二区三区久久| 中文国产亚洲喷潮| 欧美人体一区二区三区| 精品国产福利| 国产综合自拍| 日本亚洲一区二区三区| 亚洲欧洲av一区二区三区久久| 国产主播第一页| 亚洲欧美另类自拍| 亚洲精品88| 久久综合入口| 国产视频久久| 久久久国产精品无码| 亚洲国产精品久久久久婷婷884| 国产成人精品一区二三区四区五区 | 日韩亚洲欧美高清| 麻豆传媒视频在线观看免费| 国产精品亚洲美女av网站| 欧美艳星介绍134位艳星| 欧美黄网站在线观看| 26uuu亚洲综合色欧美| 99热国产在线观看| 亚洲国产天堂久久综合网| 91视频欧美| 精品欧美国产| 亚洲一区二区动漫| 亚洲一区二区观看| 日韩欧美成人网| 超碰免费97在线观看| 国产精品网站视频| 婷婷综合激情| 色欲无码人妻久久精品| 亚洲一区二区精品视频| 天堂在线视频免费| 欧洲精品在线视频| 欧美精品一区二区久久| 日日噜噜夜夜狠狠| 最近日韩中文字幕| 国产高清视频免费| 欧美精品久久一区二区| 色综合www| 国产成人手机视频| 国产精品久久午夜| 亚洲av无码乱码国产麻豆| 性色av一区二区三区在线观看| 美女亚洲一区| www.cao超碰| 一区二区不卡在线视频 午夜欧美不卡在| 韩国中文字幕hd久久精品| 91成人国产在线观看| 不卡av一区二区| 亚洲高清视频免费| 亚洲成av人**亚洲成av**| 嫩草研究院在线观看| 国产综合久久久久| 好吊日精品视频| 在线不卡av电影| 欧美福利一区二区| av资源在线播放| 日韩精品欧美专区| 国产成人免费视| 波多野结衣 久久| 久久精品国产清自在天天线| 高清精品视频|