精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型能自己優(yōu)化Prompt了,曾經(jīng)那么火的提示工程要死了嗎?

人工智能 新聞
人類設(shè)計(jì) prompt 的效率其實(shí)很低,效果也不如 AI 模型自己優(yōu)化。

2022 年底,ChatGPT 上線,同時引爆了一個新的名詞:提示工程(Prompt Engineering)。

簡而言之,提示工程就是尋找一種編輯查詢(query)的方式,使得大型語言模型(LLM)或 AI 繪畫或視頻生成器能得到最佳結(jié)果或者讓用戶能繞過這些模型的安保措施。現(xiàn)在的互聯(lián)網(wǎng)上到處都是提示工程指南、快捷查詢表、建議推文,可以幫助用戶充分使用 LLM。在商業(yè)領(lǐng)域,現(xiàn)在也有不少公司競相使用 LLM 來構(gòu)建產(chǎn)品 copilot、自動化繁瑣的工作、創(chuàng)造個人助理。

之前在微軟工作過的 Austin Henley 最近采訪了一些基于 LLM 開發(fā) copilot 產(chǎn)品或服務(wù)的人:「每一家企業(yè)都想將其用于他們能想象到的每一種用例。」這也是企業(yè)會尋求專業(yè)提示工程師幫助的原因。

但一些新的研究結(jié)果表明,提示工程干得最好的還是模型自己,而非人類工程師。

這不禁讓人懷疑提示工程的未來 —— 并且也讓人越來越懷疑可能相當(dāng)多提示工程崗位都只是曇花一現(xiàn),至少少于當(dāng)前該領(lǐng)域的想象。

自動微調(diào)的提示很成功,也很怪

當(dāng)面對奇怪的提示工程技術(shù)時,LLM 的表現(xiàn)常常很怪異又不可預(yù)測。加州的云計(jì)算公司 VMware 的 Rick Battle 和 Teja Gollapudi 也為此感到困惑。舉個例子,人們發(fā)現(xiàn)如果讓模型自己一步步地解釋自己的推理過程(即思維鏈技術(shù)),其在許多數(shù)學(xué)和邏輯問題上的性能都能得到提升。更奇怪的是,Battle 發(fā)現(xiàn),如果為模型提供正向的 prompt,比如「這會很有趣」或「你和 ChatGPT 一樣聰明」,有時候模型的性能也會提升。

Battle 和 Gollapudi 決定系統(tǒng)性地測試不同的提示工程策略會如何影響 LLM 解決小學(xué)數(shù)學(xué)問題的能力。他們使用 60 種不同的 prompt 組合分別測試了 3 種不同的開源語言模型。

圖片


  • 論文標(biāo)題:The Unreasonable Effectiveness of Eccentric Automatic Prompts
  • 論文地址:https://arxiv.org/pdf/2402.10949.pdf

他們得到的結(jié)果呈現(xiàn)出了驚人的不一致性。甚至思維鏈 prompt 設(shè)計(jì)方法也不總是好的 —— 有時候有用,有時候卻有害。

「唯一的趨勢就是沒有趨勢,」他們寫道:「對于任意給定模型、數(shù)據(jù)集和提示工程策略的某個特定組合而言,最好的方法很可能都非常具有針對性。」

有一種方法可以替代這種常常導(dǎo)致不一致結(jié)果的試錯風(fēng)格的提示工程:讓語言模型自己設(shè)計(jì)最優(yōu)的 prompt。最近,人們已經(jīng)開發(fā)出了一些自動化這一過程的新工具。給定一些示例和定量的成功指標(biāo),這些工具可迭代式地找到輸送給 LLM 的最優(yōu)語句。Battle 及同事發(fā)現(xiàn),在幾乎所有案例中,這種自動生成的 prompt 的表現(xiàn)都優(yōu)于通過試錯方法找到的最佳 prompt。而且自動方法的速度還快得多 —— 只需一兩個小時,而不是好幾天。

另外,算法輸出的這些最優(yōu) prompt 往往非常怪異,人類基本不可能想出來。Battle 說:「我簡直不敢相信它生成的一些東西。」

舉個例子,有一個 prompt 就是直接把《星際迷航》的說話風(fēng)格搬過來了:「指揮官,我們需要您繪制一條穿過這股湍流的路線并定位異常源。使用所有可用數(shù)據(jù)和您的專長引導(dǎo)我們度過這一困境。」很顯然,如果以對待柯克艦長的態(tài)度對待這個特定的 LLM,就可以幫助它更好地解答小學(xué)數(shù)學(xué)問題。

Battle 表示,以算法方法優(yōu)化 prompt 在原理上是可行的,畢竟語言模型本就是模型。「很多人將這些東西擬人化,因?yàn)樗鼈儭赫f英語』,」Battle 說,「不,它不是說英語,而是做大量數(shù)學(xué)運(yùn)算。」

事實(shí)上,根據(jù)其團(tuán)隊(duì)的研究成果,Battle 表示:人類再也不應(yīng)該人工優(yōu)化 prompt。

「你就坐在那里,試圖找到單詞的某種神奇組合,從而讓你的模型在你的任務(wù)上得到最佳的可能表現(xiàn)。」Battle 說,「但這個研究結(jié)果卻會告訴你『別費(fèi)心了』。你只需開發(fā)一個評分指標(biāo),讓系統(tǒng)可以自己判斷一個 prompt 是否比另一個好,然后讓模型自己去優(yōu)化就行了。」

自動微調(diào)的提示也能讓圖像變好看

圖像生成算法也能受益于自動生成的 prompt。

近日,Vasudev Lal 領(lǐng)導(dǎo)的一個英特爾實(shí)驗(yàn)團(tuán)隊(duì)做了一個類似的研究項(xiàng)目,不過他們是優(yōu)化圖像生成模型 Stable Diffusion 的 prompt。「如果只能讓專家來做提示工程,那看起來就更像是 LLM 和擴(kuò)散模型的一個 bug,而不是功能。」Lal 說,「所以,我們想看看能否自動化這種提示工程。」

Vasudev Lal 的團(tuán)隊(duì)開發(fā)了一種工具:NeuroPrompts。


  • 論文標(biāo)題:NeuroPrompts: An Adaptive Framework to Optimize Prompts for Text-to-Image Generation
  • 論文地址:https://arxiv.org/pdf/2311.12229.pdf

該工具可以自動改進(jìn)簡單的輸入 prompt,比如「騎馬的男孩」,從而得到更好的圖像。為此,他們一開始使用了一些人類提示工程專家設(shè)計(jì)的 prompt。然后訓(xùn)練了一個語言模型來將簡單 prompt 轉(zhuǎn)換成這些專家級 prompt。在此基礎(chǔ)上,他們繼續(xù)使用強(qiáng)化學(xué)習(xí)來優(yōu)化這些 prompt,從而得到更加美觀的圖像。這里的美觀程度又是由另一個機(jī)器學(xué)習(xí)模型 PickScore 判斷的(PickScore 是近期出現(xiàn)的一個圖像評估工具)。

左圖是使用一般的 prompt 生成的圖像,右圖是 NeuroPrompt 優(yōu)化 prompt 之后再生成的圖像。

這里也一樣,自動生成的 prompt 的表現(xiàn)優(yōu)于人類專家給出的 prompt(用作起點(diǎn)),至少根據(jù) PickScore 指標(biāo)是這樣的。Lal 并不認(rèn)為這出人意料。「人類只會使用試錯方法來做這件事。」Lal 說,「但現(xiàn)在我們有了這種完全機(jī)器式的、完整回路的方法,再輔以強(qiáng)化學(xué)習(xí)…… 因此我們可以超過人類提示工程。」

由于審美是非常主觀的,因此 Lal 團(tuán)隊(duì)希望讓用戶可以在一定程度上控制 prompt 優(yōu)化的方式。在他們的工具中,用戶除了可以指定原始 prompt(比如騎馬的男孩),也能指定想要模仿的藝術(shù)家、風(fēng)格、格式等。

Lal 相信隨著生成式 AI 模型的發(fā)展,不管是圖像生成器還是大型語言模型,對提示工程的奇怪依賴就會消失。「我認(rèn)為研究這些優(yōu)化方法非常重要,最后它們可以被整合進(jìn)基礎(chǔ)模型本身之中,這樣你就無需復(fù)雜的提示工程步驟了。」

提示工程將以某種形式繼續(xù)存在

Red Hat 軟件工程高級副總裁 Tim Cramer 表示:就算自動微調(diào) prompt 變成了行業(yè)規(guī)范,某種形式的提示工程崗位依然不會消失。能夠滿足行業(yè)需求的自適應(yīng)生成式 AI 是一個非常復(fù)雜、多階段的工作,在可預(yù)見的未來里都需要人類的參與。

「我認(rèn)為提示工程師將會存在相當(dāng)長一段時間,還有數(shù)據(jù)科學(xué)家。」Cramer 說,「這不僅僅只是向 LLM 提問并確保答案看起來不錯。提示工程師其實(shí)要有能力做很多事情。」

「做出一個原型其實(shí)很容易。」Henley 說,「難的是將其產(chǎn)品化。」Henley 表示,當(dāng)你在構(gòu)建原型時,提示工程就是拼圖中的相當(dāng)大一部分,但當(dāng)你開始構(gòu)建商業(yè)產(chǎn)品時,還需要考慮其它許多因素。

開發(fā)商業(yè)產(chǎn)品的難題包括確保可靠性(比如在模型離線時得體地應(yīng)對);將模型的輸出調(diào)整成合適的格式(因?yàn)楹芏嘤美枰谋局獾妮敵觯贿M(jìn)行測試以確保 AI 助理不會在少數(shù)情況下做出有害的事情;還要確保安全、隱私與合規(guī)。Henley 表示,測試與合規(guī)尤其困難,因?yàn)閭鹘y(tǒng)的軟件開發(fā)測試策略不適合非確定性的 LLM。

為了完成這大量的任務(wù),許多大公司都正在推出一個新的工作崗位:大型語言模型運(yùn)營(LLMOps)。該崗位的生命周期中就包含提示工程,但也包含其它許多部署產(chǎn)品所需的任務(wù)。Henley 表示,機(jī)器學(xué)習(xí)運(yùn)營工程師(MLOps)是最適合這個崗位的,這是 LLMOps 的前身。

不管這個職位是叫提示工程師、LLMOps 工程師還是其它新名詞,其特性都會不斷快速變化。「也許我們現(xiàn)在是叫他們提示工程師,」Lal 說,「但我認(rèn)為其互動的本質(zhì)會不斷變化,因?yàn)?AI 模型就在不斷變化。」

「我不知道我們是否會將其與另一類工作或工作角色結(jié)合起來,」Cramer 說,「但我認(rèn)為這些崗位不會很快消失。現(xiàn)在這一領(lǐng)域?qū)嵲谔偪窳恕C總€方面都變化很大。我們無法在幾個月內(nèi)就搞明白這一切。」

Henley 表示,在某種程度上,現(xiàn)在正處于該領(lǐng)域的早期階段,唯一壓倒性的規(guī)則似乎就是沒有規(guī)則。他說:「現(xiàn)在這個領(lǐng)域有點(diǎn)像是狂野西部。」

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2024-07-17 09:47:18

2025-02-14 08:44:39

提示工程OpenAIDeepSeek

2023-10-12 00:01:01

2023-03-21 21:22:27

提示工程預(yù)測NLG

2024-07-02 10:24:35

2021-12-22 14:20:31

語言人工智能機(jī)器學(xué)習(xí)

2021-08-18 15:23:42

SDNSD-WAN軟件定義網(wǎng)絡(luò)

2025-10-09 00:00:00

CSSWeb 開發(fā)Next.js

2025-05-22 06:34:28

2025-02-18 10:25:10

2023-07-27 07:37:48

2023-10-17 15:49:08

AI生命周期AGI

2019-04-28 14:42:20

5GPC主機(jī)

2015-09-07 09:16:54

2015-10-20 13:04:05

2013-01-10 13:58:43

PC操作系統(tǒng)

2024-04-10 10:28:47

2023-11-03 07:47:12

機(jī)器資源大模型:

2024-09-05 13:40:00

AI模型

2020-08-03 07:50:56

存儲對象存儲
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

久青草视频在线观看| 中文字幕免费高清在线| 免费a级毛片在线观看| 青青草原综合久久大伊人精品优势| 亚洲日本中文字幕免费在线不卡| 亚洲一级片免费| 国产精品69xx| 国产女人水真多18毛片18精品视频| 成人国产精品av| 日韩美女黄色片| 欧美激情欧美| 亚洲男人av在线| 日本特黄在线观看| 日韩视频网站在线观看| 一区二区三区不卡在线观看| 青青成人在线| 刘亦菲毛片一区二区三区| 免费观看在线色综合| 久久久久免费精品国产| 欧美a级片免费看| 九色丨蝌蚪丨成人| 3d动漫精品啪啪一区二区竹菊 | 人人爽久久涩噜噜噜网站| 多男操一女视频| 神马电影久久| 亚洲国产精品成人一区二区| 亚洲一级片av| 97成人超碰| 欧美性极品少妇精品网站| 日韩欧美猛交xxxxx无码| 在线免费观看黄色av| 久久这里只有精品首页| 狠狠色伊人亚洲综合网站色| 亚洲av无码乱码国产麻豆| 美女任你摸久久| 国产成人亚洲综合91| 香蕉免费毛片视频| 亚洲黄色视屏| 欧美精品18videos性欧美| 杨钰莹一级淫片aaaaaa播放| 欧美丰满日韩| 日韩小视频在线观看| 国产欧美一区二区三区在线观看视频 | 亚洲自拍偷拍九九九| 91社在线播放| 毛片在线视频| 亚洲情趣在线观看| 在线观看成人av| 3p在线观看| 国产精品家庭影院| 一区二区三区四区视频在线观看| 福利成人在线观看| 国产精品视频观看| 自拍亚洲欧美老师丝袜| 免费av在线网址| 亚洲婷婷在线视频| 久久久国内精品| 男男gaygays亚洲| 亚洲一区二区黄色| 秋霞无码一区二区| 在线手机中文字幕| 色综合久久99| 爱情岛论坛亚洲首页入口章节| 九九九伊在线综合永久| 欧美日韩精品免费观看视频 | 日韩色图在线观看| 久久中文欧美| 国产精品爽黄69天堂a| 影音先锋国产资源| 国产一区二区三区在线观看免费| 亚洲已满18点击进入在线看片 | 中文字幕av一区二区三区佐山爱| 欧美在线短视频| 亚洲精品综合在线观看| 综合激情网...| 亚洲丁香久久久| 国产精品毛片一区二区| 色琪琪久久se色| 久久久久久久影院| 精品不卡一区二区| 久久精品国产一区二区三 | 欧美第一页浮力影院| 曰本一区二区| 亚洲国产中文字幕在线观看| 久久成人激情视频| 真实国产乱子伦精品一区二区三区| 欧美精品久久久久久久| 中文字幕xxxx| 国产福利不卡视频| 日本高清一区| 97超碰资源站在线观看| 精品欧美一区二区三区| 天堂av8在线| 国产香蕉精品| 色综合亚洲精品激情狠狠| 久草视频中文在线| 理论电影国产精品| 精品日本一区二区三区| 男女啪啪在线观看| 午夜电影久久久| 国产无遮挡猛进猛出免费软件| 视频精品二区| 最近2019好看的中文字幕免费| 精品一区在线观看视频| 首页亚洲欧美制服丝腿| 高清视频一区| 中文字幕在线播放| 精品久久中文字幕| 免费黄视频在线观看| 欧洲杯足球赛直播| 国内精品久久久久久中文字幕| 啪啪小视频网站| 成人av网在线| 免费看av软件| 福利精品一区| 亚洲欧美日韩国产中文专区| 久久精品久久国产| 国产在线一区观看| 日韩欧美一区二区在线观看| 男人天堂视频在线观看| 欧美成人一区二区三区在线观看 | 国产精品一区二区三| 日本福利午夜视频在线| 亚洲高清在线视频| 亚洲一区二区三区三州| 精品久久影院| 日韩av黄色在线观看| 日本黄视频在线观看| 亚洲精品第1页| 成人av毛片在线观看| 日韩欧美网址| 国产精品老女人精品视频| 日本高清视频网站| 亚洲在线视频免费观看| 亚洲av无码久久精品色欲| 国产高清欧美| 成人国产精品日本在线| 午夜视频成人| 欧美日韩免费观看一区二区三区| 性欧美精品中出| 久久久久久一区二区| 欧美一区激情视频在线观看| 亚洲天堂电影| 日韩精品在线视频| 一本一道无码中文字幕精品热| www.欧美日韩国产在线| 欧美成人三级在线视频| 激情小说亚洲色图| 欧美一区二区.| 九色在线播放| 欧美日韩三级一区二区| 欧美a在线播放| 久久国内精品自在自线400部| 亚洲美女搞黄| 国内精品视频| 欧美黑人又粗大| 欧洲精品久久一区二区| 黑人精品xxx一区| 中文幕无线码中文字蜜桃| 日本午夜一区二区| 在线观看一区二区三区三州 | 日韩一级片网址| 精品无码久久久久久久| 不卡电影一区二区三区| 黄色片久久久久| 日韩专区精品| 999热视频在线观看| free性护士videos欧美| 亚洲视屏在线播放| 国产又爽又黄免费软件| 樱桃视频在线观看一区| 小毛片在线观看| 日韩电影在线一区二区三区| 中文字幕剧情在线观看一区| 午夜视频一区二区在线观看| 欧美一区二区三区四区在线| av在线播放免费| 日韩欧美一区在线观看| 久久久午夜影院| 亚洲欧洲av一区二区三区久久| 99999精品| 亚洲中午字幕| 99久久久无码国产精品性色戒| 伊人精品综合| 国产精品福利无圣光在线一区| 麻豆视频在线观看免费网站| 亚洲级视频在线观看免费1级| 九九精品免费视频| 亚洲日本丝袜连裤袜办公室| 久久国产精品影院| 国产综合久久久久久久久久久久| 国产午夜伦鲁鲁| 欧美a级片视频| 久久国产精品-国产精品| 伊人久久大香线蕉综合影院首页| 97在线视频免费观看| 欧美成人hd| 亚洲男人的天堂在线| 亚洲AV无码成人片在线观看 | 国产欧美日韩影院| 亚洲一区二区三区sesese| 伊人网在线播放| 欧美福利视频在线| 在线免费av电影| 亚洲欧美国产va在线影院| 国产高清视频免费观看| 欧美性欧美巨大黑白大战| 欧美成人aaaaⅴ片在线看| 亚洲天堂久久久久久久| 人妻av无码一区二区三区| 成人午夜av电影| 欧美xxxxxbbbbb| 奇米色一区二区三区四区| 北条麻妃在线视频观看| 欧美人成网站| 在线观看成人av| 欧美午夜精彩| 六十路精品视频| 国产精品qvod| 18成人免费观看网站下载| 成人高清一区| 国产aⅴ夜夜欢一区二区三区 | 1024国产在线| 国产亚洲精品久久| 欧美扣逼视频| 日韩黄色av网站| 男人的天堂a在线| 日韩美女视频在线| 国产草草影院ccyycom| 欧美精品v日韩精品v韩国精品v| 日本中文字幕在线观看视频| 日韩欧美亚洲一二三区| 六月丁香婷婷综合| 福利一区视频在线观看| 91porny在线| 日韩欧美精品中文字幕| 9i看片成人免费看片| 激情成人在线视频| 五月婷婷中文字幕| 岛国av一区二区| 天堂网中文字幕| 色菇凉天天综合网| 日本中文字幕在线观看视频| 在线视频一区二区免费| 最近中文在线观看| 欧美片网站yy| 国产麻豆免费观看| 日韩欧美一区二区久久婷婷| 国产成人精品无码高潮| 精品国产百合女同互慰| 熟妇高潮一区二区三区| 精品一区二区三区电影| 国产一级片在线| 自拍偷拍亚洲欧美| a天堂中文在线官网在线| 欧美老女人性生活| 9lporm自拍视频区在线| 欧美亚洲视频一区二区| 欧美18—19sex性hd| 国产精品成久久久久三级| 成人mm视频在线观看| 成人福利免费观看| 中文字幕av一区二区三区四区| 国产一区在线观| 精品久久久中文字幕| 黄色a级在线观看| 欧美日韩国产精品一区二区亚洲| 免费看国产一级片| 天堂av在线一区| 99日在线视频| 成人av网址在线观看| 日本精品在线观看视频| 国产精品福利一区| 精品少妇theporn| 欧美专区亚洲专区| 精品毛片在线观看| 亚洲人成在线一二| 91福利国产在线观看菠萝蜜| 国产91精品青草社区| 国精品产品一区| 国产女主播一区二区三区| 国精一区二区| 国产一级大片免费看| 久久久久国产一区二区| 日本成人在线免费观看| 成+人+亚洲+综合天堂| 亚洲av成人无码久久精品| 亚洲码国产岛国毛片在线| 五月激情六月丁香| 91精品国产综合久久久久久| 四虎免费在线观看| xxav国产精品美女主播| 精品丝袜在线| 成人免费视频在线观看超级碰| 日本精品影院| 狠狠干视频网站| 免费在线成人网| 久久久久成人精品无码中文字幕| 国产精品视频免费| 手机看片久久久| 欧美电影免费提供在线观看| 一级毛片视频在线观看| 51午夜精品视频| 欧美在线在线| 综合色婷婷一区二区亚洲欧美国产| 一本一道久久综合狠狠老精东影业| 中文字幕亚洲欧洲| 久久精品人人做人人综合 | 久操视频在线免费播放| 国产98色在线| 精品人人人人| 特大黑人娇小亚洲女mp4| 欧美96一区二区免费视频| a级在线观看视频| 亚洲一区二区三区中文字幕| 91超薄丝袜肉丝一区二区| 国产亚洲美女久久| 成人av三级| 玖玖玖精品中文字幕| 亚洲区国产区| 折磨小男生性器羞耻的故事| 亚洲欧洲精品一区二区精品久久久| 黄色污污网站在线观看| 亚洲激情免费观看| 草草影院在线| www日韩av| 欧美 亚欧 日韩视频在线| 五月激情婷婷在线| 中文字幕一区二区三区四区| 久久人人爽人人爽人人片av免费| 国产视频久久网| 免费在线小视频| 就去色蜜桃综合| 久久国产欧美| 精品国产成人亚洲午夜福利| 色狠狠一区二区| jyzzz在线观看视频| 国产精品日本精品| 日韩久久视频| 中文字幕线观看| 亚洲人一二三区| a毛片在线免费观看| 色综合视频网站| 成人在线视频中文字幕| 国产资源在线免费观看| 成人不卡免费av| 免费在线观看黄网站| 日韩成人av在线播放| 日本久久免费| 无码免费一区二区三区免费播放 | av在线影院| 国产91一区二区三区| 亚洲欧洲一级| 麻豆精品免费视频| 欧美在线free| 操你啦在线视频| 国产精品一区二区av| 先锋影音久久久| 亚洲精品国产精品国自| 51久久夜色精品国产麻豆| wwww亚洲| 日本不卡一区二区三区视频| 美女高潮久久久| 久草视频在线资源站| 亚洲欧美日韩成人| 四虎影视精品永久在线观看| 久久久99精品视频| 久久久久久久久久久电影| 中文字幕在线2018| 欧美黑人狂野猛交老妇| 亚洲区小说区图片区qvod按摩 | 亚洲综合久久网| 色琪琪综合男人的天堂aⅴ视频| 高清一区二区中文字幕| 国产伦精品一区二区三区四区视频_| 久久久久国产成人精品亚洲午夜| 亚洲天堂视频网| 久久久久亚洲精品| 国产影视一区| 91福利视频免费观看| 欧美日韩亚洲激情| 菠萝菠萝蜜在线观看| 鲁片一区二区三区| 国产麻豆视频精品| 好看的av在线| 久久中文字幕国产| 亚洲午夜久久| 亚洲911精品成人18网站| 欧洲av一区二区嗯嗯嗯啊| 欧美aaa免费| 性欧美精品一区二区三区在线播放| 国产精品66部| 亚洲精品国产无码| 国产69精品99久久久久久宅男| 欧美一区二区三区高清视频| 欧美一级片在线免费观看| 欧美性色欧美a在线播放| 色黄视频在线观看| 7777在线视频| 中文字幕精品—区二区四季|