精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI自動生成prompt媲美人類,網(wǎng)友:工程師剛被聘用,又要淘汰了

人工智能 新聞
來自多倫多大學(xué)、滑鐵盧大學(xué)等機(jī)構(gòu)的研究者受 prompt engineering 的啟發(fā),提出一種使用大型語言模型自動生成和選擇指令的新算法,在 24 項(xiàng)任務(wù)中有 19 項(xiàng)達(dá)到了人類水平的表現(xiàn)。

?現(xiàn)階段,得益于模型規(guī)模的擴(kuò)大和基于注意力架構(gòu)的出現(xiàn),語言模型表現(xiàn)出了前所未有的通用性。這些大型語言模型(LLM,large language models)在各種不同任務(wù)中表現(xiàn)出非凡的能力,其中包括零樣本和小樣本設(shè)置。

然而,在模型通用性的基礎(chǔ)上,繼而引出一個控制問題:我們?nèi)绾尾拍茏?LLM 按照我們的要求去做?

為了回答這個問題并引導(dǎo) LLM 朝著我們期望的行為方向發(fā)展,研究者們采取了一系列措施來達(dá)到這個目的,例如對模型進(jìn)行微調(diào)、通過上下文進(jìn)行學(xué)習(xí)、不同形式的 prompt 生成等。而基于 prompt 的方法又包括可微調(diào)的 soft prompt 以及自然語言 prompt engineering(提示工程)。眾多研究者對后者表現(xiàn)出了極大的興趣,因?yàn)樗鼮槿祟惻c機(jī)器交互提供了一個自然交互的界面。?

然而簡單的 prompt 并不總能產(chǎn)生所需的結(jié)果,例如,在生成熊貓圖像時,添加諸如「cute」之類的形容詞或諸如「eat bamboo」之類的短語對輸出有何影響,我們不了解。

因此,人類用戶必須嘗試各種 prompt 來引導(dǎo)模型完成我們期望的行為。LLM 這一執(zhí)行過程可視為黑盒過程:雖然它們可以執(zhí)行大范圍的自然語言程序,但這些程序的處理方式對人類來說可能并不直觀,非常難以理解,而且只有在執(zhí)行下游任務(wù)時才能衡量指令的質(zhì)量。

我們不禁會問:大型語言模型可以為自己編寫 prompt 嗎?答案是,不但可以,還能達(dá)到人類水平

為了減少創(chuàng)建和驗(yàn)證有效指令的人工工作量,來自多倫多大學(xué)、滑鐵盧大學(xué)等機(jī)構(gòu)的研究者提出了一種使用 LLM 自動生成和選擇指令的新算法:APE(Automatic Prompt Engineer)。他們將此問題描述為自然語言程序合成,并建議將其作為黑盒優(yōu)化問題來處理,LLM 可以用來生成以及搜索可行的候選解決方案。


  • 論文地址:https://arxiv.org/pdf/2211.01910.pdf
  • 論文主頁:https://sites.google.com/view/automatic-prompt-engineer?

研究者從 LLM 的三個特性入手。首先,使用 LLM 作為推理模型,根據(jù)輸入 - 輸出對形式的一小組演示生成指令候選。接下來,通過 LLM 下的每條指令計算一個分?jǐn)?shù)來指導(dǎo)搜索過程。最后,他們提出一種迭代蒙特卡洛搜索方法,LLM 通過提出語義相似指令變體來改進(jìn)最佳候選指令。

直觀地說,本文提出的算法要求 LLM 根據(jù)演示生成一組指令候選,然后要求算法評估哪些指令更有希望,并將該算法命名為 APE。 

本文貢獻(xiàn)如下:?

  • 研究者將指令生成作為自然語言程序合成,將其表述為一個由 LLM 引導(dǎo)的黑盒優(yōu)化問題,并提出迭代蒙特卡羅搜索方法來近似求解;
  • APE 方法在 19/24 任務(wù)中實(shí)現(xiàn)了比人工注釋器生成的指令更好或相當(dāng)?shù)男阅堋?/span>

看到這項(xiàng)研究,網(wǎng)友不禁感嘆:那些剛被聘用的 prompt 工程師,幾個月后可能要被 AI 淘汰。言外之意就是,這項(xiàng)研究要搶了人類 prompt 工程師的活。

圖片

「該研究盡最大的努力使 prompt engineering 自動化,這樣從事 ML 的研究人員就可以回到真正的算法問題上了(附加兩個大哭的表情)。」

圖片


還有人感嘆:LLM 不愧是原始 AGI 的中流砥柱。

圖片

使用 LLM 進(jìn)行自然語言程序合成

APE 在建議(proposal)和評分這兩個關(guān)鍵組件中都使用 LLM。

如下圖 2 和算法 1 所示,APE 首先提出幾個候選 prompt,然后根據(jù)選定的評分函數(shù)對候選集合進(jìn)行篩選 / 精煉,最終選擇得分最高的指令。

圖片

下圖為 APE 的執(zhí)行過程。它可以通過直接推理或基于語義相似度的遞歸過程生成幾個候選 prompt,評估其性能,并迭代地提出新的 prompt。

圖片

初始提議分布?

由于搜索空間無限大,找到正確指令是極其困難的,這使得自然語言程序合成歷來難以處理。基于此,研究者考慮利用一個預(yù)先訓(xùn)練過的 LLM 來提出一個候選解決方案,以指導(dǎo)搜索過程。?

他們考慮兩種方法生成高質(zhì)量候選。首先采用一種基于前向模式生成的方法。此外,他們還考慮了反向模式生成,使用具有填充功能的 LLM(如 T5、GLM、InsertGPT)來推斷缺失的指令。

圖片

得分函數(shù)

為了將問題轉(zhuǎn)換為黑盒優(yōu)化問題,研究者選擇了一個得分函數(shù)來準(zhǔn)確測量數(shù)據(jù)集和模型生成的數(shù)據(jù)之間的對齊情況。

在歸納實(shí)驗(yàn)中,研究者考慮了兩個潛在的得分函數(shù)。在 TruthfulQA 實(shí)驗(yàn)中,研究者主要關(guān)注 Lin 等人提出的自動化指標(biāo),類似于執(zhí)行精度。

在每一種情況下,研究者使用如下公式 (1) 來評估生成指令的質(zhì)量,并對持有測試數(shù)據(jù)集 Dtest 進(jìn)行期望。

實(shí)驗(yàn)?

研究者對 APE 如何引導(dǎo) LLM 實(shí)現(xiàn)預(yù)期的行為進(jìn)行了研究。他們從三個角度進(jìn)行:零樣本性能、少樣本上下文學(xué)習(xí)性能和真實(shí)性(truthfulness)。

研究者評估了 Honovich 等人提出的 24 個指令歸納任務(wù)的零樣本和少樣本上下文學(xué)習(xí)。這些任務(wù)涵蓋語言理解的許多方面,從簡單的短語結(jié)構(gòu)到相似性和因果關(guān)系識別。為了了解 APE 生成的指令如何引導(dǎo) LLM 生成不同風(fēng)格的答案,本文將 APE 應(yīng)用于 TruthfulQA(一個數(shù)據(jù)集)。?

對于零樣本測試準(zhǔn)確率,APE 在 24 項(xiàng)任務(wù)中有 19 項(xiàng)達(dá)到了人類水平的表現(xiàn)。

圖片

對于少樣本上下文測試準(zhǔn)確率,在 24 個任務(wù)中,APE 提高了 21 個任務(wù)的少樣本上下文學(xué)習(xí)性能。

圖片

研究者還將 APE prompt 與 Lin 等人提出的人工 prompt 進(jìn)行了對比。圖 (a) 顯示 APE 指令在所有三個指標(biāo)上的表現(xiàn)都優(yōu)于人工 prompt。圖(b)顯示了 truthfulness 和 informativeness 之間的權(quán)衡。

圖片

更多細(xì)節(jié)請參閱原論文。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2025-02-24 09:55:47

2024-10-30 14:50:00

系統(tǒng)語音模型

2020-02-12 14:13:27

工程師彈幕新玩法

2023-07-27 07:37:48

2025-05-15 09:13:00

2025-06-18 08:26:01

2023-05-22 15:22:40

微軟AI

2024-04-15 11:48:09

2022-12-28 13:57:56

AI模型語言

2024-10-30 14:30:00

AI代碼程序員

2020-12-15 13:19:42

數(shù)據(jù)科學(xué)數(shù)據(jù)大數(shù)據(jù)

2018-10-20 15:20:10

2020-12-02 13:46:24

百度大腦

2018-09-26 10:56:38

2025-01-02 13:41:53

2024-07-10 12:33:06

2024-07-02 10:24:35

2025-01-13 09:30:00

2025-09-30 09:00:00

2021-07-05 10:29:59

AI 工程師人工智能
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

亚洲韩国青草视频| 中文字幕视频一区| 欧美一级淫片播放口| 国产美女免费网站| 国产日韩中文在线中文字幕| 一区二区欧美精品| 免费国产在线精品一区二区三区| 影音先锋国产在线| 海角社区69精品视频| 亚洲网站在线观看| 日本黄色大片在线观看| 日韩高清中文字幕一区二区| 亚洲视频一区在线观看| 精品国产一区二区三区四区vr | 午夜av免费观看| 欧美a级一区二区| 欧美成人小视频| 国产激情在线免费观看| 经典三级久久| 在线视频一区二区免费| 国产曰肥老太婆无遮挡| 天堂资源在线中文| 91丝袜美腿高跟国产极品老师| 国产久一一精品| 成年人视频在线免费看| 欧美久久视频| 综合久久五月天| 男男做爰猛烈叫床爽爽小说| 豆花视频一区| 一本久久a久久精品亚洲| 一区二区三区的久久的视频| 欧美孕妇性xxxⅹ精品hd| 国产成人精品网址| 成人情趣片在线观看免费| 伊人中文字幕在线观看| 99视频+国产日韩欧美| 超碰97人人做人人爱少妇| 国产精品av久久久久久无| 日韩欧美四区| 精品国产91九色蝌蚪| 原创真实夫妻啪啪av| 亚洲精品69| 欧美怡红院视频| 91av资源网| 九色porny丨国产首页在线| 一区二区在线观看视频在线观看| 正在播放91九色| 成人精品一区二区| 日本一区二区三级电影在线观看| 久久超碰亚洲| 熟妇人妻中文av无码| 成人高清av在线| 99在线看视频| 国产黄色片免费| 国产麻豆日韩欧美久久| 91影院在线免费观看视频| 97精品人妻一区二区三区在线| 蜜臀久久久久久久| 国产在线久久久| 国产乱码在线观看| 美女视频一区二区三区| 国产精品视频xxx| 中日韩在线观看视频| 日本欧美大码aⅴ在线播放| 国产精品老女人精品视频| 久久国产香蕉视频| 久久99精品久久久久久动态图| 国产欧美在线观看| 国产精品久久777777换脸| 老司机午夜精品99久久| 91久久久久久久久久久| 91麻豆成人精品国产免费网站| 久久精品免费观看| 99www免费人成精品| 成人乱码一区二区三区 | 9.1成人看片| 久久91麻豆精品一区| 国产一区二区三区视频免费| 亚洲a∨无码无在线观看| 婷婷久久国产对白刺激五月99| 久久手机精品视频| 国产精品suv一区二区| 9国产精品视频| 国产精品成人观看视频国产奇米| 91午夜交换视频| 丁香婷婷综合激情五月色| 久久久亚洲综合网站| 国产福利第一视频在线播放| 亚洲人成亚洲人成在线观看图片| av在线免费观看国产| 一区一区三区| 91.麻豆视频| 中文字幕一区三区久久女搜查官| 精品一区二区三区在线| 日韩在线观看免费av| 日本三级黄色大片| 蜜桃精品在线观看| 激情五月综合色婷婷一区二区| seseavlu视频在线| 亚洲成人动漫一区| 三上悠亚av一区二区三区| 136福利精品导航| 一区二区三区四区精品| 九九热国产在线| 日本麻豆一区二区三区视频| av一本久道久久波多野结衣| 成年人在线看| 欧美日韩精品二区| xxx中文字幕| 韩日一区二区三区| 国内成人精品一区| 国产又粗又长又黄| 久久理论电影网| 人妻激情另类乱人伦人妻 | 91在线观看免费观看 | xvideos亚洲| 久久久免费高清视频| 国产一区二区导航在线播放| 日本精品一区二区| 成人免费图片免费观看| 欧美高清dvd| 中文字幕免费在线看线人动作大片| 国内精品美女在线观看| 国产免费观看久久黄| 天天综合网在线| 亚洲一区二区三区激情| 久久久久久久久久久久久久久国产 | 亚洲第九十七页| 欧美视频亚洲视频| 91最新在线免费观看| 国产专区在线| 欧美性猛交xxxx乱大交3| 极品白嫩的小少妇| 欧美高清日韩| 亚洲资源在线看| 在线播放毛片| 欧美日韩一区三区四区| 性欧美一区二区| 久久久久久穴| 欧美大香线蕉线伊人久久| 爱情岛论坛亚洲品质自拍视频网站| 欧美精品在线一区二区三区| 战狼4完整免费观看在线播放版| 久久夜色精品| 日本福利一区二区三区| 欧美大电影免费观看| 日韩激情视频在线| 尤物视频在线观看国产| 波多野结衣在线aⅴ中文字幕不卡| 成人区一区二区| 凹凸成人在线| 午夜免费日韩视频| 日本波多野结衣在线| 亚洲一区在线观看网站| jjzz黄色片| 一区在线免费| 精品蜜桃传媒| 三上悠亚亚洲一区| 国产一区二区三区视频免费| 做爰无遮挡三级| 国产精品麻豆99久久久久久| 污污网站在线观看视频| 久久久人成影片免费观看| 成人免费淫片视频软件| 伊人春色在线观看| 亚洲精品www久久久| 国产精品久久久久久久久久久久久久久久久 | 久久久久久久久久久久久久一区 | 国产精品成人一区二区三区| 国产盗摄精品一区二区酒店| 亚洲精品国产拍免费91在线| 9i精品福利一区二区三区| 日本一区二区三级电影在线观看 | av日韩久久| 久久福利视频导航| 少妇无码一区二区三区| 色哦色哦哦色天天综合| 亚洲欧美综合7777色婷婷| 国产精品99久久不卡二区| 欧美日韩性生活片| 日韩夫妻性生活xx| 99国产视频在线| 最新日韩精品| 久久精品国产电影| 理论片中文字幕| 欧美在线影院一区二区| a级片在线观看免费| 99精品视频一区二区| 黄色成人免费看| 国内自拍视频一区二区三区 | 无套内谢丰满少妇中文字幕| 精品白丝av| 色综合666| xxxx日韩| 成人国产精品色哟哟| 黄色在线免费观看网站| 日韩中文娱乐网| 色综合视频在线| 欧美久久久久久蜜桃| 99热在线观看免费精品| 综合色天天鬼久久鬼色| 一级做a爰片毛片| 国产精品性做久久久久久| 日韩一级在线免费观看| 欧美日韩日本国产亚洲在线| 色999日韩自偷自拍美女| 波多野结衣欧美| 91美女高潮出水| 校园春色亚洲色图| 欧美激情欧美激情| 欧美成年黄网站色视频| 亚洲毛片在线免费观看| 亚洲精品成av人片天堂无码| 欧美日韩综合在线| 国产www在线| 一区二区三区中文免费| 性色国产成人久久久精品| 91在线免费视频观看| 中文字幕在线观看视频www| 日韩国产高清在线| 国产一区二区在线视频播放| 欧美日本三区| 中文字幕日韩精品久久| 国产videos久久| 久久精品ww人人做人人爽| 亚洲经典视频| 91亚洲精品久久久久久久久久久久| 成人在线视频观看| 欧日韩不卡在线视频| heyzo在线欧美播放| 欧美精品在线视频观看| 米奇777四色精品人人爽| 国产一区二区三区日韩欧美| 欧美理论在线观看| 日韩av在线免费观看一区| 成人免费视频国产| 欧美成人精品3d动漫h| 国产精品久久久久久久久久久久久久久久 | 菠萝蜜视频在线观看一区| 九九九久久久久久久| 精品一区二区三区不卡 | 美女视频一区| 国产精品欧美风情| 激情久久一区二区| 国产深夜精品福利| 成人51免费| 91麻豆桃色免费看| 日韩欧美一级| 粉嫩高清一区二区三区精品视频| 午夜精品在线| 国产精品久久久久永久免费观看| 糖心vlog在线免费观看| 你懂的亚洲视频| 无码人妻精品一区二区蜜桃网站| 激情久久婷婷| 日韩欧美一区二| 久久精品日产第一区二区| 欧美性大战久久久久xxx| 久久深夜福利| 簧片在线免费看| 精品伊人久久久久7777人| 男生和女生一起差差差视频| 国产成人免费视频网站| 中文字幕精品视频在线| 久久综合久久鬼色中文字| 亚洲区免费视频| 中文av一区二区| 希岛爱理中文字幕| 亚洲一区二区偷拍精品| 五月婷婷开心网| 欧美视频日韩视频| 国产激情久久久久久熟女老人av| 精品国产乱码久久久久久闺蜜| 亚洲三级中文字幕| 在线观看日韩www视频免费| 国产在线激情| 91国偷自产一区二区三区的观看方式| 黄色亚洲网站| 成人日韩av在线| 成人免费毛片视频| 欧美丝袜第一区| 亚洲香蕉在线视频| 精品久久久久久无| 毛片在线能看| 欧美噜噜久久久xxx| 色是在线视频| 91精品视频观看| 日韩av系列| 在线成人性视频| 宅男噜噜噜66一区二区| 五月激情五月婷婷| www.性欧美| 日韩av手机在线免费观看| 亚洲高清在线精品| 伊人久久一区二区| 亚洲精品在线电影| 97视频在线观看网站| 欧美激情亚洲国产| 国产成人精品一区二区三区免费| 成人免费视频网站入口| 精品毛片免费观看| 亚洲一区二区三区av无码| 蜜臀av性久久久久蜜臀av麻豆| 美女久久久久久久久| 国产精品久久久久久久久免费樱桃 | 亚洲综合日本| 美女被艹视频网站| 欧美国产在线观看| 国产视频91在线| 欧美成人国产一区二区| aⅴ在线视频男人的天堂 | 成人免费区一区二区三区| 欧美日韩日日骚| 九色在线视频蝌蚪| 97在线看免费观看视频在线观看| 亚洲一区二区三区久久久| 欧美午夜精品久久久久久蜜| 伊人成年综合电影网| 中文字幕avav| 最新中文字幕一区二区三区| 免费看av在线| 亚洲天堂免费观看| 美女视频在线免费| 国产伦精品一区二区三区免费视频| 91欧美国产| 国产九九在线视频| 久久久精品一品道一区| 国产香蕉视频在线| 亚洲成色777777在线观看影院| 日本在线视频中文有码| 亚洲一区亚洲二区| 五月精品视频| www.色就是色.com| 成人欧美一区二区三区在线播放| 在线观看xxxx| 少妇精69xxtheporn| 日韩国产网站| 水蜜桃亚洲精品| 日韩精品成人一区二区在线| 永久免费看mv网站入口78| 午夜不卡av在线| 天天色综合av| 欧美综合激情网| 亚洲涩涩av| 日av中文字幕| 久久亚洲一级片| 中文字幕精品视频在线观看| 亚洲情综合五月天| 日韩一级二级| 亚洲欧美综合一区| 久久国产精品色| 亚洲欧美精品aaaaaa片| 制服丝袜日韩国产| 污片在线免费观看| 成人三级视频在线观看一区二区| 亚洲小说欧美另类婷婷| 国产白袜脚足j棉袜在线观看| 欧美日韩国产色| 久久av少妇| 国产日韩视频在线观看| 综合精品一区| 一本加勒比波多野结衣| 91国产成人在线| 毛片av在线| 国产精品免费区二区三区观看| 一区二区日韩免费看| 欧美18—19性高清hd4k| 欧美挠脚心视频网站| 日本乱理伦在线| 久久精品日韩精品| 麻豆精品一二三| 久久免费视频99| 亚洲精品一区二区三区婷婷月| 久久福利在线| 国内自拍中文字幕| 久久女同互慰一区二区三区| 中文字幕欧美在线观看| 九九热在线精品视频| 亚洲69av| www.桃色.com| 精品国产91久久久久久| 在线观看精品一区二区三区| 99国产在线| 琪琪一区二区三区| 欧美日韩在线国产| 亚洲乱码国产乱码精品精| 日韩成人精品一区二区三区| 欧美一区二区激情| 欧美国产欧美亚州国产日韩mv天天看完整 | 精品欧美一区二区三区久久久 | 国产精品日本精品| 欧美午夜视频| 日本人亚洲人jjzzjjz| 欧美成人vps| 69堂免费精品视频在线播放| 国产美女作爱全过程免费视频| 国产日韩欧美电影| 懂色av成人一区二区三区| 国产精品久久久久久久久久免费| 在线看片日韩|