精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

一句話,性能暴漲49%!馬里蘭MIT等力作:Prompt才是大模型終極武器

人工智能 新聞
提示詞才是AI隱藏的王牌!馬里蘭MIT等頂尖機構研究證明,一半提示詞,是讓AI性能飆升49%的關鍵。

AI性能的提升,一半靠模型,一半靠提示詞。

最近,來自馬里蘭大學、MIT、斯坦福等機構聯手驗證,模型升級帶來的性能提升僅占50%,而另外一半的提升,在于用戶提示詞的優化。

他們將其稱之為「提示詞適應」(prompt adaptation)。

論文地址:https://arxiv.org/pdf/2407.14333v5

為此,他們讓DALL-E 2和DALL-E 3來了一場PK,1,893名「選手」在10次嘗試中,用隨機分配三種模型之一復現目標圖像。

令人驚訝的是,DALL-E 3圖像相似度顯著優于DALL-E 2。

其中,模型升級本身僅貢獻了51%的性能,剩余的49%全靠受試者優化的提示詞。

關鍵是,那些沒有技術背景的人,也能通過提示詞,讓DALL-E 3模型生成更好的圖片。

OpenAI總裁Greg Brockman也同樣認為,「要充分發揮模型的潛力,確實需要一些特殊的技巧」。

他建議開發者們去做「Prompt庫」管理,不斷探索模型的邊界。

換言之,你的提示詞水平,決定了AI能不能從「青銅」變成「王者」。

別等GPT-6了!

不如「調教」提示詞

GenAI的有效性不僅取決于技術本身,更取決于能否設計出高質量的輸入指令。

2023年,ChatGPT爆紅之后,全世界曾掀起一股「提示詞工程」的熱潮。

盡管全新的「上下文工程」成為今年的熱點,但「提示詞工程」至今依舊炙手可熱。

然而共識之下,提示詞設計作為一種動態實踐仍缺乏深入研究。

多數提示詞庫和教程,將有效提示視為「可復用成品」,但卻用到新模板中可能會失效。

這就帶來了一些現實的問題:提示策略能否跨模型版本遷移?還是必須持續調整以適應模型行為變化?

為此,研究團隊提出了「提示詞適應」這一可測量的行為機制,用以解釋用戶輸入如何隨技術進步而演進。

他們將其概念化為一種「動態互補能力」,并認為這種能力對充分釋放大模型的經濟價值至關重要。

為評估提示詞適應對模型性能的影響,團隊采用了Prolific平臺一項預注冊在線實驗數據,共邀請了1,893名參與者。

每位受試者被隨機分配三種不同性能的模型:DALL-E 2、DALL-E 3,或自動提示優化的DALL-E 3。

除模型分配外,每位參與者還獨立分配到15張目標圖像中的一張。這些圖像選自商業營銷、平面設計和建筑攝影三大類別。

實驗明確告知參與者模型無記憶功能——每個新提示詞均獨立處理,不繼承先前嘗試的信息。

每人需要提交至少10條提示詞,需通過模型盡可能復現目標圖像,最優表現者將獲得高額獎金。

任務結束后參與者需填寫涵蓋年齡、性別、教育程度、職業及創意寫作/編程/生成式AI自評能力的人口統計調查。

隨機分配,10次生成

實驗的核心結果指標,是參與者生成的每張圖像與指定目標圖像之間的相似度。

這項指標通過CLIP嵌入向量的余弦相似度進行量化。

由于生成模型的輸出具有隨機性,同一提示詞在不同嘗試中可能產生不同的圖像。

為控制這種變異性,研究人員為每個提示詞生成10張圖像,并分別計算它們與目標圖像的余弦相似度,隨后取這10個相似度得分的平均值作為該提示詞的預期質量分數。

回放分析:是模型,還是提示詞?

實驗的另一個核心目標在于,厘清圖像復現性能的提升中,有多少源于更強大的模型,又有多少來自提示詞的優化?

根據概念框架的表述,當模型從能力水平θ1升級至更高水平θ2時,其輸出質量的總改進可表示為:

研究人員將這一變化分解為兩部分:

1. 模型效應:將相同提示詞應用于更優模型時,獲得的性能提升;

2. 提示詞效應:通過調整提示詞以充分發揮更強大模型優勢所帶來的額外改進。

為實證評估這兩個組成部分,研究人員對DALL-E 2和DALL-E 3(原詞版)實驗組參與者的提示詞進行了額外分析。

具體方法是將實驗過程中參與者提交的原始提示詞,重新提交至其原分配模型和另一模型,并分別生成新圖像。

· 分離模型效應

針對DALL-E 2參與者編寫的提示詞(x*(θ1,s)),團隊同時在DALL-E 2和DALL-E 3模型上進行評估,分別獲得Q[θ1s,x*(θ1,s)]和Q[θ2,s,x*(θ_1,s)]的實測值。

這一對比可分離出模型效應:即在固定提示詞情況下,僅通過升級模型獲得的輸出質量提升。

· 比較提示效應

為了評估提示詞效應,作者還比較了以下兩組數據:

1. 在DALL-E 3上回放DALL-E 2提示詞的質量(即Q[θ2,s,x*(θ1,s)]估計值)

2. DALL-E 3的參與者專門為模型編寫的提示詞在相同模型上的質量(即Q[θ2,s,x*(θ2,s)]估計值)

這一差異恰恰能反映,用戶通過調整提示詞,模型本身得到的額外改進。

那么,這項實驗的具體結果如何?

DALL-E 3強大的生圖能力

提示詞解鎖了一半

實驗中,研究團隊主要探討了三大問題:

(i) 接入更強大的模型(DALL-E 3)是否能提升用戶表現;

(ii) 用戶在使用更強模型時如何改寫或優化他們的提示詞;

(iii) 整體性能提升中有多少應歸因于模型改進,多少應歸因于提示詞的適應性調整。

模型升級,是核心

首先,團隊驗證了使用DALL-E 3的參與者,是否比使用DALL-E 2的參與者表現更優?

如下圖1所示,匯總了所有發現。

A展示了三組代表性目標圖像,每組都包含了從兩種模型中抽取的三張圖像。

中間行是,目標圖像余弦相似度最接近全體參與者平均值的生成結果,上行(下行)則呈現比均值相似度高(低)約一個平均處理效應(ATE)的圖像。

在10次必要提示嘗試中,使用DALL-E 3的參與者生成圖像與目標圖像的余弦相似度平均高出0.0164。

這個提升相當于0.19個標準差,如下圖1 B所示。

而且,這種優勢在10次嘗試中持續存在,因此不可否認,模型升級一定會比前代有著顯著的性能提升。

而且,參與者的動態提示行為在兩種模型間也存在顯著差異:

圖C表明,DALL-E 3使用者的提示文本平均比DALL-E 2組長24%,且該差距隨嘗試次數逐漸擴大。

他們更傾向于復用或優化先前提示,這表明當發現模型能處理復雜指令后,他們會采取更具開發性的策略。

此外詞性分析證實,增加的詞匯量提供的是實質性描述信息而非冗余內容:

名詞和形容詞(最具描述性的兩類詞性)占比在兩種模型間基本一致(DALL-E 3組48% vs DALL-E 2組49%,p = 0.215)。

這說明了,提示文本的延長反映的是——語義信息的豐富化,而非無意義的冗長。

模型51%,提示詞49%

研究人員觀察到提示行為的差異表明,用戶會主動適應所分配模型的能力。

DALL-E 3使用者的整體性能提升中,有多少源自模型技術能力的增強,又有多少歸因于用戶針對該能力重寫提示?

為解答這一問題,研究人員采用前文所述的回放(replay)分析法,以實證分離這兩種效應。

模型效應

將DALL-E 2參與者編寫的原始提示,分別在DALL-E 2和DALL-E 3上評估性能。

結果顯示,相同提示在DALL-E 3上運行時余弦相似度提升0.0084(p<10^-8),占兩組總性能差異的51%。

提示效應

將DALL-E 2參與者的原始提示與DALL-E 3參與者編寫的提示(均在DALL-E 3上評估)進行對比。

結果顯示,該效應貢獻了剩余48%的改進,對應余弦相似度提升0.0079(p=0.024)。

總處理效應

總處理效應為0.0164,關鍵的是,當DALL-E 3用戶編寫的提示應用于DALL-E 2時,性能較原始DALL-E 2提示無顯著提升(Δ=0.0020;p=0.56)。

這種不對稱性,印證了提示優化的效果依賴于模型執行復雜指令的能力邊界。

圖2 B通過單一目標圖像直觀呈現這些效應:

  • 上行展示DALL-E 2參與者的原始提示,在DALL-E 3上生成更高保真度的圖像,證明固定提示下模型升級的效果;
  • 下行顯示DALL-E 3參與者的提示在DALL-E 2上輸出質量顯著下降,凸顯當模型能力不足時,提示優化的效果存在天花板。

這些發現研究人員的理論主張,提供了實證支持:

提示優化是一種動態互補策略——用戶根據模型能力提升而主動調整行為,且這種調整對實際性能增益的貢獻不可忽視。

技能異質性

如下表1呈現了「回歸分析結果」,測試了模型效應、提示詞效應以及總效應是否會在不同技能水平的參與者之間系統性地變化。

主要發現如下:

1. 總效應與表現十分位數的交互項呈負相關且統計顯著(?0.000115,p = 0.0152)。

這表明模型改進縮小了高、低績效用戶之間的整體差距,這與概念框架中的命題1一致。

2. 模型效應與表現十分位數的交互項,同樣呈負相關且統計顯著(?0.000059,p=0.0210)。

這說明模型升級主要惠及低技能用戶。這與命題2的理論預測相符,因為接近性能上限的高技能用戶存在收益遞減效應。

3. 并沒有發現提示詞適應的效益,在技能分布上存在顯著差異(?0.000056,p=0.2444)。

此外,研究團隊還評估了自動化提示詞的效果。

結果發現,GPT-4經常添加無關細節或微妙改變參與者的原意,導致模型輸出質量下降58%。

用簡單的話來說,AI寫的提示詞曲解了意圖,不如用戶精心編制的提示詞。

對此,Outbox.ai的創始人Connor Davis給出了建議,不要去過度自動化提示詞,人還應該在其中發揮主動性。

作者介紹

Eaman Jahani

Eaman Jahani是馬里蘭大學商學院信息系統專業的助理教授。

他曾在UC伯克利統計系擔任博士后研究員,還獲得了MIT的社會工程系統與統計學雙博士學位。

Benjamin S. Manning

Benjamin S. Manning目前是MIT斯隆管理學院IT組的四年級博士生。他曾獲得MIT碩士學位和華盛頓大學學士學位。

他的研究圍繞兩個相輔相成的方向:(1) 利用AI系統進行社會科學發現;(2) 探索AI系統如何代表人類并按照人類指令行事。

Joe Zhang

Joe Zhang目前是斯坦福大學博士生,此前,曾獲得了普林斯頓大學的學士學位。

個人的研究喜歡從人機交互到社會科學等多個學術領域汲取靈感,試圖理解新興的人機協作系統及其對商業和社會的影響。

責任編輯:張燕妮 來源: 新智元
相關推薦

2015-08-03 10:21:04

設計模式表達

2020-11-27 09:57:11

Python代碼PyPy

2023-09-05 23:34:52

Kubernetes云原生

2021-11-29 09:45:32

模型人工智能深度學習

2023-05-08 15:44:23

3D數字人

2010-03-29 11:55:12

無線上網報錯

2023-02-10 15:45:05

ChatGPTAIGPT-3

2024-02-08 09:33:37

蘋果AI

2022-12-12 13:45:46

模型修圖

2025-01-02 07:00:00

2018-01-15 10:45:43

社交網絡互聯網巨頭百度

2014-05-07 10:47:51

移動金融互聯網金融GMIC

2020-12-16 10:43:44

PythonPyPy代碼

2019-09-05 10:13:28

2023-08-28 00:53:03

AI3D

2019-08-15 11:42:56

程序員電腦軟件

2023-09-06 15:23:30

Docker容器K8S

2011-06-03 16:42:47

SEO

2023-12-13 21:50:59

騰訊AI模型
點贊
收藏

51CTO技術棧公眾號

日本大胆在线观看| 九九视频在线免费观看| 日本精品网站| 欧美国产日韩亚洲一区| 国产精品免费久久久| 免费成人深夜夜行网站| 日韩精品亚洲专区在线观看| 亚洲一区视频在线观看视频| 欧美一区二区三区四区在线观看地址| 中文字幕久久网| 欧美在线网站| 日韩成人在线视频| 久久黄色片网站| 久草在线视频资源| 国产三级久久久| 444亚洲人体| www.欧美色| 欧美日韩国产亚洲一区| 亚洲视频欧美视频| 日本一区二区三区在线免费观看| 黄色在线观看www| 国产精品另类一区| 国产伦精品一区二区三区高清版| 亚洲成人av网址| 欧美人与禽猛交乱配视频| 亚洲剧情一区二区| 色哟哟网站在线观看| 精品国模一区二区三区| 亚洲国产婷婷综合在线精品| 视频一区二区在线观看| 高h放荡受浪受bl| 麻豆国产精品777777在线| 午夜精品久久久久久99热| www中文在线| 亚洲成人一品| 亚洲成成品网站| 欧洲美女亚洲激情| 国产另类xxxxhd高清| 亚洲国产一区二区在线播放| 国产又大又长又粗又黄| 国产资源在线观看| 91麻豆国产福利在线观看| 91在线精品观看| 中文字幕在线日亚洲9| 久久久蜜桃一区二区人| 久久久午夜视频| 精品国产视频在线观看| 日韩av片子| 亚洲免费伊人电影在线观看av| 成年人看片网站| 国产精品高清一区二区| 欧美日韩国产首页| 国产aaaaa毛片| a日韩av网址| 性感美女极品91精品| 日本a级片在线观看| 国产黄色小视频在线| 国产精品久久久久aaaa樱花| 日韩中文字幕一区二区| 国产在线视频网站| 久久精品人人做人人综合 | 91久久偷偷做嫩草影院电| 777精品伊人久久久久大香线蕉| 日韩av一二三四| 在线观看欧美日韩电影| 欧美日韩午夜剧场| 大陆极品少妇内射aaaaa| 不卡视频观看| 欧美性感美女h网站在线观看免费| 搞av.com| 小h片在线观看| 日韩欧美黄色动漫| 中文字幕欧美人妻精品一区| 校园春色亚洲色图| 欧美日韩综合色| 天天干天天操天天玩| 不卡一区视频| 精品国产免费一区二区三区四区| 99久久综合网| 久本草在线中文字幕亚洲| 亚洲精品久久久久久久久久久久久 | 亚洲线精品一区二区三区八戒| 国产精品igao激情视频| 国产精品—色呦呦| 欧美网站在线观看| 在线免费观看av的网站| 成人在线日韩| 亚洲第一黄色网| 亚洲色图14p| 成人在线免费观看网站| 美女福利精品视频| 日本三级欧美三级| 久久影院亚洲| 91老司机在线| 三级在线视频| 国产精品少妇自拍| 欧美这里只有精品| 成人在线爆射| 91精品国产aⅴ一区二区| 午夜不卡久久精品无码免费| 精品freesex老太交| 久久福利视频导航| av大片免费观看| 久久国产生活片100| 国产精品国色综合久久| 精品美女视频在线观看免费软件| 亚洲色图.com| 国产视频一视频二| 成人精品在线| 亚洲图片欧洲图片av| 国产乱国产乱老熟300| 男人的天堂亚洲在线| 91在线高清视频| 久久视频www| 亚洲综合在线免费观看| jizz欧美激情18| 9l视频自拍九色9l视频成人| 中文字幕精品—区二区| 伊人久久综合视频| 久久成人免费网| 国产在线一区二区三区欧美| 欧美jizz18性欧美| 色综合中文综合网| 日本一区二区免费视频| 欧美成人激情| 亲子乱一区二区三区电影| 国产99久久九九精品无码免费| 久久只精品国产| 国产在线视频在线| 2020国产精品小视频| 亚洲视频在线免费观看| xxxxxx国产| 国产乱人伦精品一区二区在线观看 | 日韩专区在线播放| 天天干天天干天天操| 国产99一区视频免费| 亚洲一区3d动漫同人无遮挡| 免费成人动漫| 亚洲精品wwwww| 国产一国产二国产三| 国产乱国产乱300精品| 色综合视频二区偷拍在线| 欧亚av在线| 亚洲国产精品网站| 久久久久亚洲av成人片| 国产呦精品一区二区三区网站| 日韩一区免费观看| 日韩网站中文字幕| 亚洲欧美日韩在线一区| 在线观看亚洲天堂| 91美女在线观看| 日韩国产欧美亚洲| 久久视频在线观看| 97在线看福利| 天堂av中文字幕| 午夜婷婷国产麻豆精品| 亚洲国产精品无码久久久久高潮| 欧美午夜在线视频| 国产精品国产三级欧美二区| 毛片在线导航| 亚洲精品第一页| 久久国产视频一区| 久久久久久久久久美女| 日韩欧美精品在线观看视频| 要久久电视剧全集免费| 日韩av男人的天堂| av免费在线一区二区三区| 欧美亚洲一区二区三区四区| 1024手机在线观看你懂的| 奇米色777欧美一区二区| 先锋影音网一区| 欧美亚洲人成在线| 久久成人国产精品| 亚洲第一天堂网| 亚洲电影第三页| 中文字幕av网址| 日韩电影在线观看网站| 在线观看日韩羞羞视频| www.久久草.com| 久久久久久久久久国产精品| 五月天婷婷在线观看| 色婷婷综合久色| 中文字幕求饶的少妇| 国产精品66部| 少妇性饥渴无码a区免费| 精品国产一区二区三区久久久樱花 | 3d动漫精品啪啪一区二区三区免费| 91麻豆国产福利在线观看宅福利| 欧美成人r级一区二区三区| 日韩av无码中文字幕| 久久精品视频免费观看| 亚洲精品第三页| 激情久久五月| 日本一区视频在线观看| 激情视频亚洲| 4438全国成人免费| 91在线看片| 亚洲第一精品夜夜躁人人爽| 无码人妻精品一区二区三区蜜桃91 | 午夜一区二区三区视频| www.涩涩爱| 99在线精品观看| 潘金莲激情呻吟欲求不满视频| 国内精品久久久久久久影视蜜臀 | 中文字幕日韩av资源站| 熟妇高潮一区二区| 日韩电影一二三区| 日韩国产成人无码av毛片| 国产精品一区二区99| 999精品在线观看| 亚洲不卡系列| 久久久最新网址| 激情成人四房播| 亚洲欧美变态国产另类| 国产女人18毛片18精品| 日本丶国产丶欧美色综合| 欧美成人三级在线观看| 国产精品无码永久免费888| 亚洲一级Av无码毛片久久精品| 秋霞午夜av一区二区三区| 亚洲熟妇国产熟妇肥婆| 影音先锋日韩在线| 日韩精彩视频| 麻豆成人入口| 91久久精品一区二区别| www.久久| 日韩av免费在线看| 欧美a级在线观看| 欧美成aaa人片免费看| eeuss影院www在线播放| 日韩精品日韩在线观看| 亚洲国产精品久久人人爱潘金莲 | 精品国产一级片| 欧美性色黄大片手机版| www五月天com| 欧美日韩加勒比精品一区| 99久久99久久精品国产| 国产精品女主播在线观看| 老鸭窝一区二区| 成人激情免费网站| 国产裸体视频网站| 国产美女精品人人做人人爽| 在线免费视频一区| 视频一区二区三区入口| 国产l精品国产亚洲区久久| 99国产精品久久久久久久| 2019日韩中文字幕mv| 欧美日韩少妇| 男女爱爱视频网站| 亚洲欧美网站在线观看| 亚洲 欧洲 日韩| 天天天综合网| 国产成年人在线观看| 91亚洲国产高清| 综合久久国产| 欧美在线视屏| 日韩久久久久久久久久久久| 欧美三级免费| 国产 国语对白 露脸 | av中文字幕亚洲| 999精品免费视频| av中文一区二区三区| 亚洲AV无码国产精品| 久久午夜电影网| 黄色aaa视频| 国产女人18水真多18精品一级做| 美国黑人一级大黄| 国产精品视频yy9299一区| 中文字幕无码日韩专区免费| 日韩美女视频一区| 欧美日韩偷拍视频| 性欧美大战久久久久久久久| 影音先锋在线国产| 欧洲国产伦久久久久久久| www.亚洲激情| 在线播放91灌醉迷j高跟美女| 五月婷婷激情五月| 91精品免费观看| 性网爆门事件集合av| 亚洲精品福利在线| 国产高清免费av在线| 久久视频在线视频| 波多野结依一区| 2025国产精品视频| 国模私拍国内精品国内av| 亚洲影影院av| 日韩欧美四区| 亚洲精品一品区二品区三品区 | 一卡二卡三卡视频| 亚洲欧美不卡| 五月天视频在线观看| 国产高清精品在线| 好吊视频在线观看| 亚洲欧美激情插| 国产又大又黄视频| 欧美色倩网站大全免费| 亚洲第一色视频| 亚洲图片欧美午夜| 羞羞网站在线免费观看| 日本三级韩国三级久久| 999精品嫩草久久久久久99| 国产99视频精品免费视频36| 精品高清在线| 免费一级特黄毛片| 另类中文字幕网| 国产精品福利导航| 中文字幕一区二区三区在线播放 | 性xxxx18| 久久精品成人欧美大片| 男人的天堂免费在线视频| 91精品久久久久久久久久另类 | 久久久久久黄| 久久国产免费视频| 国产欧美日韩激情| 日本熟妇成熟毛茸茸| 69av一区二区三区| 精品乱码一区二区三四区视频 | 精品久久久久久久久久久院品网| 国产在线网站| 91精品国产高清自在线| 国语精品视频| 先锋影音一区二区三区| 六月丁香综合| 无码av免费精品一区二区三区| 中文字幕在线免费不卡| 9i看片成人免费看片| 亚洲国产精品va在线看黑人| 韩国中文字幕在线| 国产精品日韩专区| 免费视频国产一区| av免费观看网| 不卡一区二区三区四区| wwwav国产| 在线播放中文一区| 亚洲视频tv| 国产精品久久激情| 天美av一区二区三区久久| 国产精品久久久久7777| 国产成人丝袜美腿| 欧美大片xxxx| 5858s免费视频成人| 91ph在线| 国产拍精品一二三| 色综合久久网| 奇米影视四色在线| 国产欧美日本一区二区三区| 久久99国产综合精品免费| 亚洲精品视频免费| 在线毛片观看| 久久一区二区精品| 亚洲欧美日韩视频二区| 国内精品久久99人妻无码| 欧美午夜片欧美片在线观看| 亚洲精品97久久中文字幕| 欧美成人一区在线| 日本高清久久| 欧美亚洲色图视频| 丁香婷婷综合色啪| 国产一级片网址| 亚洲成人动漫在线播放| 都市激情国产精品| 久久久久免费网| 性高湖久久久久久久久| 亚洲自拍偷拍一区二区| 91黄色在线观看| 91电影在线播放| 亚洲mm色国产网站| 国产精品激情| 给我看免费高清在线观看| 色噜噜久久综合| 69视频在线| 91中文字幕在线观看| 国产精品豆花视频| 粉嫩av蜜桃av蜜臀av| 欧美日韩一区二区欧美激情 | 4438全国亚洲精品观看视频| 91午夜在线观看| 91免费小视频| 中文字幕在线观看高清| 欧美精品性视频| 美女扒开腿让男人桶爽久久动漫| www.com毛片| 中文字幕日韩欧美一区二区三区| www男人的天堂| 欧美在线观看一区二区三区| 欧美理论在线播放| 色男人天堂av| 黑人巨大精品欧美一区免费视频| 美女欧美视频在线观看免费| 国产一区二区丝袜| 激情亚洲成人| 娇妻被老王脔到高潮失禁视频| 91精品国产综合久久国产大片| segui88久久综合| 日产精品高清视频免费| 国产精品一品二品| 天码人妻一区二区三区在线看| 久久五月天综合| 蜜桃一区二区三区| 欧美专区第二页|