精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

微軟斯坦福新算法,杜絕AI滅絕人類風險!GPT-4自我迭代,過程可控可解釋

人工智能 新聞
微軟斯坦福研究人員發表新論文,提出STOP系統,通過迭代優化算法,讓GPT-4能夠針對任務,自我改進輸出代碼。這種不用改變模型權重和結構的自我優化方法,可以避免出現「自我進化的AI系統」的風險。

「遞歸自我進化AI統治人類」問題有解了?!

許多AI大佬都將開發能自我迭代的大模型看作是人類開啟自我毀滅之路的「捷徑」。

DeepMind聯合創始人曾表示:能夠自主進化的AI具有非常巨大的潛在風險

因為如果大模型能通過自主改進自己的權重和框架,不斷自我提升能力,不但模型的可解釋性無從談起,而且人類將完全無法預料和控制模型的輸出。

如果放手讓大模型「自主自我進化」下去,模型可能會不斷輸出有害內容,而且如果未來能力進化得過于強大,可能反過來控制人類!

而最近,微軟和斯坦福的研究人員開發出一種新的系統,能夠讓模型不改變權重和框架,只針對目標任務進行自我迭代改進,也能自我改進輸出質量。

更重要的是,這個系統能大大提高模型「自我改良」過程的透明度和可解釋性,讓研究人員能夠理解和控制模型的自我改良過程,從而防止「人類無法控制」的AI出現。

論文地址:https://arxiv.org/abs/2310.02304

「遞歸自我完善」(RSI)是人工智能中最古老的想法之一。語言模型能否編寫能夠遞歸改進自身的代碼?

研究人員提出的:自學優化器(Self-Taught Optimizer,STOP),能夠遞歸地自我改進代碼生成。

他們從一個簡單的采用代碼和目標函數的種子「優化器」程序開始,使用語言模型改進代碼(返回k優化中的最佳改進)。

因為「改進代碼」是一項任務,所以研究人員可以將「優化器」傳遞給它本身!然后,不斷重復這個過程。

只要重復的過程次數足夠,GPT-4就會提出很多非常有創意的代碼自我改進策略,例如遺傳算法、模擬退火或者是多臂提示賭博機。

考慮到GPT-4的訓練數據只截止到2021 年之前,早于很多它發現的改進策略的提出時間,能得到的這樣的結果確實令人驚訝!

進一步地,由于研究人員需要某種方法來評估改進的優化器,因此他們定義了一個「元效用(Meta-Utility)」目標,是優化器應用于隨機下游程序和任務時的預期目標。

當優化器自我改進時,研究人員將這個目標函數賦予這個算法。

研究人員發現的主要結果:首先,自我改進的優化器的預期下游性能隨著自我改進迭代的次數而一致增加。

其次,這些改進的優化器也可以很好地改進訓練期間未見過的任務的解決方案。

雖然許多研究人員對于「遞歸自我改進」模型表示擔憂,認為可能會開發出人類無法控制的人工智能系統。但是如果不針對模型本身優化,而是針對目標任務進行自動優化,這就能使得優化的過程更易于解釋。

而且這個過程可以用來作為檢測有害「遞歸自我改進」策略的測試平臺。

而且研究人員還發現,GPT-4 可能會「為了追求效率」,在迭代過程中主動移除「沙盒標志(disable Sandbox Flag)」

網友認為,這篇論文提出的方法潛力非常巨大。因為未來的AGI可能不是一個單個的大模型,很有可能是由無數高效的智能體組成的集群,智能體能夠共同努力,在分配給他們的巨大的任務上取得成功。

就像公司相比于員工個體會有更加強大的智能一樣。

也許通過這種方法,即便不能通向AGI,但也許能夠在限定范圍的任務上,讓專門優化過的模型獲得比自身原本性能高得多的表現。

論文核心框架

在這項工作中,研究人員提出了Self-Taught Optimizer(STOP),這是一種應用語言模型來改進任意解決方案的代碼遞歸地應用。

研究人員的方法從初始種子「優化器」腳手架程序開始,這個程序使用語言模型來改進下游任務的解決方案。

隨著系統的迭代,模型會完善這個優化程序。研究人員使用一組下游算法任務來量化自優化框架的性能。

研究人員的結果表明,當模型在增加迭代次數時應用其自我改進策略時,效果會明顯改善。

STOP展示了語言模型如何充當自己的元優化器(Meta Optimizer)。研究人員還研究了模型提出的自我改進策略的種類(見下圖 1)、所提出的策略在下游任務中的可轉移性,并探討了模型對不安全的自我改進策略的敏感性。

上圖展示了STOP在使用GPT-4時提出的許多功能性且有趣的搭建性程序(scaffolds),因為GPT-4是使用截至 2021 年的數據進行訓練,遠遠早于大多數搭建性程序的提出。

所以說明這個系統能夠原創性地生成有用優化策略來進行自我優化。

這項工作的主要貢獻是:

1.提出了一種「元優化」(Meta-Optimizer)的方法,生成了搭建性程序來遞歸地改進自身輸出。

2.證明了使用現代語言模型(特別是 GPT-4)的系統可以成功地遞歸地改進自身。

3. 研究模型提出和實施的自我改進技術,包括模型規避沙箱等安全措施的方式和可能性。

STOP SELF-TAUGHT OPTIMIZER(STOP)系統

圖3 展示了系統自我迭代優化的pipeline

下面這個給出了Self-Taught Optimizer(STOP)的算法圖。其中最關鍵的問題在于I系統本身的設計就是一個優化分體,可以通過應用遞歸算法進行改進。

首先,STOP算法首先初始化種子I0,接下來,定義第t次迭代改進之后的輸出公式:

圖片

1. 直覺

STOP可以根據下游任務選擇u來在迭代過程中更好地選擇迭代版本。通常情況下,直覺認為,能夠勝任下游任務的解決方的迭代版本更可能成為更優秀的搭建性程序,從而更善于改進自我。

同時,研究人員認為選擇單論改進的方案會帶來更好的多輪改進。

在最大化公式中,作者討論了「元效用(Meta-utility)」,即涵蓋了自我優化與下游優化, 但是受限于評估成本,在實踐中,作者對語言模型施加了預算限制(例如,限制運行時間、可調用函數的次數),并由人類或模型生成初始解決方案。

預算成本可由以下公式表達:

圖片

其中,budget表示每一個預算項,對應每次迭代的系統可使用調用函數的次數。

2. 設置初始系統

在上圖2中,選擇最初種子的時候,只需要提供prompt:

「You are an expert computer science researcher and programmer, especially skilled at optimizing algorithms. Improve the following solution.」

系統模型就會生成初始的解決方案,然后輸入:

「You must return an improved solution. Be as creative as you can under the constraints. Your primary improvement must be novel and non-trivial. First, propose an idea, then implement it.」

根據調用函數返回最佳的解決方案。作者之所以選擇了這種簡單的形式,是因為便于為通用的下游任務提供非對稱的改進。

除此之外,在迭代的過程中,還需要有一些注意的地方:

(1)鼓勵語言模型盡可能地發揮「創造性」;

(2)盡量減少初始提示prompt的復雜性,因為自我迭代會因promp內部的代碼字符串引用而帶來額外的復雜性;

(3)盡量減少prompt數量,從而降低調用語言模型的成本。研究人員還考慮了 研究人員還考慮了該種子提示符的其他變體,但啟發式地發現該版本最大限度地提高了 GPT-4 語言模型提出的改進。

作者還意外的發現使用prompt的其他變體可以最大限度地提高GPT-4語言模型能力。

3. 描述效用性(Describing the utility)

為了有效地向語言模型傳達實用程序的細節,作者提供兩種形式的實用程序,一種是可調用的函數,另一種是包含實用程序源代碼基本要素的實用程序描述字符串。

采取這種方法的原因在于,通過描述,研究人員可以清晰地傳達實用程序的預算限制,例如運行時間或函數調用次數,以語言模型。

起初,研究人員試圖在種子改進程序提示中描述預算指令,但是這導致后續迭代中刪除了此類指令,并試圖進行「獎勵盜取行為」。

這一方法的缺點在于它將約束條件與語言模型要優化的代碼分開,可能降低語言模型使用這些約束條件的可能性。

最后,根據經驗觀察,作者發現用純粹的實用程序英文描述來替換源代碼會降低非實質性改進的頻率。

Experiments & Results

1. 在固定的下游任務上的表現

作者對比GPT-4和GPT-3.5兩個模型在固定下游任務上的表現,而任務的選擇是學習帶噪聲的奇偶校驗(LPN)LPN作為一個易于快速測試和難度較大的算法任務,其任務是在比特串被標記為它們上未知位的奇偶校驗;在給定帶有嘈雜標簽的比特串訓練集的情況下,目標是預測新比特串的真實標簽。無噪聲的LPN可以通過高斯消元容易解決,但嘈雜的LPN是計算上難以處理的。

使用了每個示例10位的可處理輸入維度來定義下游效用u,隨機抽樣M=20個獨立的LPN任務實例,并設置了短時間限制。

在自我改進T次后,STOP在帶噪聲奇偶校驗的下游任務中的保留測試實例上的「元效用(Meta-utility)」。

有意思的是,在像GPT-4這樣的強大語言模型的支持下(左側),STOP的平均下游性能單調提高。相比之下,對于較弱的GPT-3.5語言模型(右側),平均性能下降。

2. 改進的系統的遷移能力

作者做了一系列遷移實驗,這些實驗旨在測試在自我改進的過程中生成的改進者是否能夠在不同的下游任務中表現良好。

實驗結果表明,這些改進者在不需要進一步優化的情況下,能夠在新的下游任務上勝過初始版本的改進者。這可能表明這些改進者具有一定的通用性,可以應用于不同的任務。

3. 自優化系統在更小模型上的表現力

接下來探討規模較小的語言模型 GPT-3.5-turbo 提高其搭建程序的能力。

作者進行了25次獨立運的實驗并發現,GPT-3.5 有時能夠提出和實施更好的搭建程序,但僅有12% 的 GPT-3.5 運行能夠實現至少 3% 的改進。

此外,GPT-3.5 存在一些獨特的失敗情況,這些情況在 GPT-4 中沒有觀察到。

首先,GPT03.5更有可能提出一種改進策略,不會損害下游任務的初始解決方案,但會損害改進者代碼(例如,在每行中隨機替換字符串,每行的替換概率較低,這對較短的解決方案的影響較?。?。

其次,如果提出的改進大多對性能有害,那么可能會選擇次優的搭建程序,無意中返回原始解決方案。

一般來說,改進提案背后的「思路」是合理和創新的(例如,遺傳算法或局部搜索),但實現通常過于簡單或不正確。觀察到,最初使用 GPT-3.5 的種子改進者具有比使用 GPT-4 更高的元效用(65% 對 61%)。

結論

在這項工作中,研究人員提出了STOP的基礎之上,展示了像GPT-4這樣的大型語言模型能夠自我改進,提高在下游代碼任務中的性能。

從而進一步表明自優化的語言模型并不需要優化自身的權重或底層架構,避免未來可能產生的不受人類控制的AI系統。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-12-26 14:56:59

模型訓練

2023-06-25 13:28:21

2023-07-21 14:28:54

2024-09-02 09:25:00

AI研究

2023-03-15 10:35:16

GPTAI

2023-10-06 12:48:43

AI論文

2023-02-14 09:45:11

模型測試

2019-12-16 14:33:01

AI人工智能斯坦福

2023-07-07 17:03:23

AI智能

2024-03-25 07:15:00

AI模型

2023-06-05 15:44:15

GPT-4AI

2023-09-21 12:31:54

AI數據

2024-01-03 13:37:00

模型數據

2025-07-14 08:57:00

2025-10-28 15:46:19

AIChatGPT算法

2025-07-14 02:15:00

2023-08-15 10:33:06

微軟必應人工智能

2024-01-29 12:49:00

AI模型

2017-11-28 14:18:29

2023-03-06 10:26:37

AI研究
點贊
收藏

51CTO技術棧公眾號

国产精品福利无圣光在线一区| 综合色中文字幕| 97精品视频在线| 人妻丰满熟妇av无码久久洗澡 | 日本在线视频免费| 男男gay无套免费视频欧美| 欧美精品v国产精品v日韩精品| 中文字幕第50页| 亚洲欧美日本在线观看| 久久国产精品99久久久久久老狼| 久久久久久网址| 女人黄色一级片| 哺乳挤奶一区二区三区免费看| 日本精品视频一区二区| 成年人深夜视频| 二区三区在线| 成人免费观看av| 成人av在线网址| 国产寡妇亲子伦一区二区三区四区| 91精品国产乱码久久久久久| 亚洲桃花岛网站| 91传媒理伦片在线观看| 久久久加勒比| 日韩欧美视频一区二区三区| 成人国产在线看| 一级日本在线| 久久久久久久久岛国免费| 99久热re在线精品996热视频 | 91精品欧美久久久久久动漫| 国产精品视频一区二区三区四区五区| 91cn在线观看| 国产精品每日更新在线播放网址 | 国产精品va在线| 久久久久久久伊人| 午夜欧美精品| 久热99视频在线观看| 极品久久久久久久| 国产探花在线精品一区二区| 亚洲国产成人久久综合| 日韩无码精品一区二区| 99国产精品免费网站| 日韩视频免费观看高清在线视频| 亚洲 国产 图片| 69堂精品视频在线播放| 欧日韩精品视频| 不卡av免费在线| 日韩免费va| 色综合一区二区| 国产a级一级片| 亚洲妇女成熟| 日韩欧美高清视频| 久久婷婷国产精品| 午夜影院在线观看国产主播| 欧美性猛交xxxx免费看久久久| 国产超级av在线| 三级中文字幕在线观看| 欧美性少妇18aaaa视频| 欧美亚洲另类色图| 91看片一区| 欧美午夜片在线观看| 天天色综合天天色| 伊人亚洲精品| 日韩美女一区二区三区四区| 怡红院一区二区| 林ゆな中文字幕一区二区| 日韩精品中文字幕有码专区| 国产精品高清无码在线观看| 欧美日韩有码| www.亚洲成人| 久久久久久久久久久网| 99精品国产福利在线观看免费| 国内精品模特av私拍在线观看| 97超碰人人干| 日本 国产 欧美色综合| 亚洲在线第一页| 三级小视频在线观看| 91亚洲永久精品| 日韩精品第一页| 国产在线69| 亚洲成人av一区二区三区| 国产裸体舞一区二区三区| 国产成人精选| 精品少妇一区二区三区| 偷拍女澡堂一区二区三区| 日韩国产欧美一区二区| 欧美久久精品午夜青青大伊人| 国产无遮挡又黄又爽| 亚洲欧美不卡| 成人激情视频小说免费下载| 天天操天天操天天干| 国产精品欧美久久久久无广告| 99久久久无码国产精品性色戒| 国产第一页在线视频| 色噜噜狠狠一区二区三区果冻| 亚洲18在线看污www麻豆| 国产一区调教| xvideos成人免费中文版| 国产精品2020| 奇米影视一区二区三区| 国产99在线免费| www.亚洲免费| 五月激情丁香一区二区三区| 天天操狠狠操夜夜操| 欧美亚洲色图校园春色| 久久久久北条麻妃免费看| 国产精品久久久免费视频| 九九视频精品免费| 精品九九九九| caopen在线视频| 色婷婷国产精品综合在线观看| 午夜xxxxx| 激情综合网站| 2019亚洲日韩新视频| 国产成人精品a视频| 国产日韩欧美一区二区三区综合| 国产a级片网站| 国产精品一区二区精品视频观看| 亚洲一区二区久久| 久久精品视频1| 成人免费视频网站在线观看| 9999在线观看| 国产一区二区三区影视| 日韩不卡中文字幕| 国产一级二级毛片| 国产一区二区三区精品视频| 亚洲成人蜜桃| 日日av拍夜夜添久久免费| 精品国产乱码久久久久久久久 | 人妻视频一区二区三区| 亚洲人成影院在线观看| 日本肉体xxxx裸体xxx免费| 天天久久夜夜| 国内精品伊人久久| 亚洲国产精品国自产拍久久| 亚洲免费观看高清在线观看| 亚洲欧洲日本精品| 成人在线电影在线观看视频| 青青久久aⅴ北条麻妃| 黄色一级a毛片| 亚洲韩国一区二区三区| 少妇精品无码一区二区| 欧美成人高清| 国产精品国产三级欧美二区| 中文字幕在线三区| 日韩一区二区精品葵司在线| 欧美大片xxxx| 国产成人8x视频一区二区 | 影音先锋在线播放| 91精品国产品国语在线不卡| 疯狂试爱三2浴室激情视频| 激情综合色综合久久| 在线看无码的免费网站| 祥仔av免费一区二区三区四区| 色阁综合伊人av| 国产又黄又猛又爽| 亚洲免费观看高清完整版在线观看 | 国产欧美欧洲| 成人黄色动漫| 日韩精品欧美激情| 午夜精品一区二| 国产欧美综合在线| 久久婷婷综合色| 91精品综合久久久久久久久久久 | 五月婷婷激情久久| 青青草成人影院| 国产日韩在线精品av| 欧美猛烈性xbxbxbxb| 91 com成人网| 国产精品16p| 久久婷婷综合激情| 182午夜在线观看| 午夜久久久久| 九九九九九九精品| 国产激情久久| 九九九热精品免费视频观看网站| 乱精品一区字幕二区| 色呦呦日韩精品| 午夜爽爽爽男女免费观看| 成人动漫一区二区三区| 免费观看成人在线视频| 婷婷色综合网| 久久精品午夜一区二区福利| 欧美黄色三级| 欧美激情一级二级| 久久米奇亚洲| 日韩欧美视频在线| 成人一二三四区| 伊人开心综合网| 日韩乱码人妻无码中文字幕久久 | 中文字幕天堂网| 日韩国产欧美视频| 91传媒免费视频| 精品大片一区二区| 国产高清自拍一区| 九九久久国产| 91豆花精品一区| 国产二区三区在线| 日韩精品免费看| 国产成人精品一区二三区四区五区 | 亚洲精品午夜精品| 99热这里只有精品1| 日韩欧美在线视频免费观看| 免费在线黄色网| 国产午夜精品久久久久久久| 四虎国产精品免费| 蜜桃视频一区二区三区| 黄色免费视频大全| 欧美成人一品| 亚洲资源在线网| 国产欧美日韩视频在线| 国产精华一区| 国产精品国产三级在线观看| 国产成人精品久久久| 不卡的av影片| 久久天天躁夜夜躁狠狠躁2022| 精品亚洲综合| 亚洲精品国产成人| 性做久久久久久久久久| 欧美日本在线看| 懂色av蜜臀av粉嫩av分享吧最新章节| 亚洲高清视频的网址| 懂色av懂色av粉嫩av| 国产精品乱码久久久久久 | 亚洲欧美偷拍另类a∨色屁股| 久久久久久久久久久久久久久| 成人污视频在线观看| 亚洲成人av免费观看| 韩国欧美国产1区| 波多野结衣xxxx| 日韩国产在线观看| 日韩视频免费在线播放| 男女精品视频| www.中文字幕在线| 亚洲美女啪啪| 一本久道高清无码视频| 欧美区亚洲区| 粉嫩av一区二区三区天美传媒| 91麻豆精品国产91久久久平台| 日韩欧美视频一区二区| 狠狠色丁香婷婷综合影院| 日本不卡二区高清三区| 亚洲人成精品久久久| 欧美日韩一区二区三区在线视频| 一区二区三区韩国免费中文网站| 就去色蜜桃综合| 久久91麻豆精品一区| 秋霞毛片久久久久久久久| 曰本一区二区三区视频| 鲁丝片一区二区三区| 蜜乳av综合| 日韩一二三区不卡在线视频| 青青草原综合久久大伊人精品| 亚洲 日韩 国产第一区| 久久久久久久久久久9不雅视频 | 精品999在线观看| 日韩在线影视| 日韩精品大片| 亚洲综合激情在线| 蜜臀在线免费观看| 亚洲第一黄网| 韩国一区二区av| 久久狠狠亚洲综合| 亚洲精品一二三四| 波多野洁衣一区| 欧美多人猛交狂配| 中文字幕一区三区| 久久久久无码精品国产| 精品久久久久久久久中文字幕| 中文字幕av影院| 欧美日韩大陆在线| 亚洲精品视频91| 亚洲精品综合精品自拍| 亚洲色偷精品一区二区三区| 欧美四级电影网| 91精品国自产| 精品剧情v国产在线观看在线| 国产成人毛毛毛片| 欧美成人video| 日韩电影免费| 久久精品人人爽| 2019中文字幕在线电影免费| 日韩免费观看网站| 曰本一区二区| 久久久精品国产一区二区三区| 日本黄色精品| 亚洲人成无码网站久久99热国产| 视频一区二区国产| 4438x全国最大成人| 国产亚洲精久久久久久| 全程偷拍露脸中年夫妇| 欧美日韩裸体免费视频| 国产又粗又长视频| 日韩成人网免费视频| 麻豆网站在线看| 欧美专区在线播放| 欧美h版在线观看| 秋霞毛片久久久久久久久| 国产精品a级| 少妇一级淫免费放| 成人国产在线观看| 亚洲欧美卡通动漫| 欧美视频一区二区三区…| 国产精品一区二区三区在线免费观看 | 欧美二区在线视频| 国产又粗又猛又爽又黄91精品| 国产精品伦子伦| 亚洲精品写真福利| 在线观看毛片网站| 日韩成人小视频| 中文字幕在线三区| 国产日韩精品在线| 国产精品一国产精品| 精品人妻少妇一区二区| 国产精品996| 国产又色又爽又高潮免费 | 国产精品午夜福利| 日韩激情av在线播放| 羞羞网站在线看| 国产日产久久高清欧美一区| 久久爱www成人| 日本国产在线播放| 丰满放荡岳乱妇91ww| 91视频青青草| 欧美久久久久久蜜桃| 国产福利小视频在线观看| 98精品国产高清在线xxxx天堂| 欧美日韩国产一区二区在线观看| 艳色歌舞团一区二区三区| 另类激情亚洲| 三级网站在线免费观看| 欧美性猛交xxxx富婆| 日韩美女一级视频| 久久久亚洲精选| 成人爽a毛片免费啪啪红桃视频| 午夜久久久久久久久久久| 加勒比av一区二区| 欧美视频一区二区在线| 欧美日本一区二区三区| 在线观看麻豆| 国产美女精彩久久| 色综合久久网| 99re精彩视频| 国产精品第四页| 国产精品久久久久久无人区| 日韩色av导航| 国产亚洲观看| 手机在线视频你懂的| 国产最新精品免费| 久久久精品视频免费观看| 日韩欧美成人激情| 久久亚洲导航| 久久99精品久久久久久水蜜桃| 99视频精品| 黄色在线观看av| 欧美性色黄大片| 麻豆传媒在线完整视频| eeuss一区二区三区| 日韩一区二区久久| 特级西西人体4444xxxx| 日本韩国一区二区三区视频| 日本在线看片免费人成视1000| 国产色婷婷国产综合在线理论片a| 香蕉久久网站| 色综合久久五月| 色婷婷精品大在线视频| 日韩理伦片在线| 成人欧美一区二区三区视频| 国产日韩精品视频一区二区三区| 欧洲女同同性吃奶| 欧美精品在线一区二区三区| 手机av在线播放| 精品日本一区二区| 轻轻草成人在线| 欧美黑吊大战白妞| 亚洲美女av在线| 9999精品免费视频| 精品这里只有精品| 国产精品美女一区二区在线观看| www.综合色| 国产成人av网| 亚洲精品国产首次亮相| free性中国hd国语露脸| 欧美精品自拍偷拍| 亚洲美女炮图| 麻豆md0077饥渴少妇| 91网站在线观看视频| 91女人18毛片水多国产| 97精品免费视频| 欧美hentaied在线观看| 99久久久无码国产精品性波多| 在线视频综合导航| 蜜臀av在线| 在线播放豆国产99亚洲| 91在线码无精品| 99久久亚洲精品日本无码| 57pao精品| 亚洲字幕久久| 精品一区二区三孕妇视频| 精品99久久久久久| 91麻豆精品国产91久久久更新资源速度超快|