精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型免微調解鎖對話能力,RLHF沒必要了!一作上交大校友:節省大量成本和時間

人工智能 新聞
新論文指出,預訓練完成剛出爐的基礎模型已經掌握了遵循指令的能力,只需要提示工程就能引導出來,引起開發社區強烈關注。

要搞大模型AI助手,像ChatGPT一樣對齊微調已經是行業標準做法,通常分為SFT+RLHF兩步走。

來自艾倫研究所的新研究卻發現,這兩步都不是必要的???

新論文指出,預訓練完成剛出爐的基礎模型已經掌握了遵循指令的能力只需要提示工程就能引導出來,引起開發社區強烈關注。

因為RLHF的成本非常高訓練還不穩定,這樣可就省了大錢了。

圖片

研究據此提出一種新的免微調對齊法URIAL

論文中把新方法形容為“解鎖基礎模型潛力的咒語”,能夠節省大量算力資源和時間。

更值得關注的是,不掌握穩定RLHF(人類強化學習)能力的小型團隊,也能低成本開發出可以聊天對話、遵循指令的對齊模型了。

圖片

目前URIAL代碼和新評估基準Just-Eval-Instruct已開源,剛剛上傳不久。

圖片

研究來自艾倫研究所和華盛頓大學Yejin Choi團隊,過去曾提出Top_p采樣,在如今大模型API調用中是常用參數。

圖片

一作研究員林禹辰是上交大校友。

圖片

打破SFT+RLHF神話

最早讓人們開始質疑對齊微調的,是一項Meta等在5月份一項研究LIMA

LIMA指出只需要1000個樣本做SFT(監督微調),就可以匹配ChatGPT的性能。

圖片

論文中LIMA團隊還探討了“表面對齊假設”(Superficial Alignment Hypothesis)

模型的知識和能力幾乎都是在預訓練階段學到的,對齊則是教會模型在與用戶互動時應使用哪些特定格式的子集。

換句話說,對齊階段只是調整模型的語言風格,沒有增強模型的能力。

從表面對齊假設出發,URIAL團隊做了充分的實驗,對比基礎模型和對齊模型之間的token分布偏移(TDS,token distribution shifts)

圖片

實驗選用3組基礎模型與對齊模型做對比,結果表明:

圖片

  • 對齊僅影響一小部分token。基礎模型和對齊模型在大多數位置的解碼中表現相同,共享排名靠前的一組token。
  • 對齊主要涉及文風相關的token,如話語標志(discourse markers,“首先、其次、總之、然而……”這些)、過渡詞和安全免責聲明,只占5-8%。
  • 對齊對較早出現的token更重要(生成內容的開頭),在后續位置對齊模型排名最高的token,基本位于基本模型排top-5的token之內。
  • 基礎模型已經獲得了足夠的知識來遵循指令,給定合適的上下文作為前綴時,它們的行為與對齊模型非常相似。

接下來的問題就是,不用SFT和RLHF的情況下,如何把一個基礎模型變成能多輪對話、遵循指令的AI助手?

免微調對齊法URIAL

團隊的免微調對齊法URIAL(Untuned LLMs with Restyled In-context ALignment),純粹利用基礎模型的上下文學習能力實現有效對齊,只需三個風格示例和一個系統提示。

圖片

在實驗中,團隊使用URIAL方法對齊7B、70B的Llama2以及Mistral-7B大模型。

圖片

結果表明當基礎模型很強時,URIAL的表現甚至優于SFT和RLHF

圖片

團隊認為URIAL方法的主要貢獻有:

  • 實施起來非常簡單,并且可完美重現,從而有助于未來新的免微調和微調對齊方法的開發和評估。
  • 可輕松對齊大尺寸模型(如Llama2-70b甚至Falcon-180b),節省大量算力和時間。
  • 可用于在預訓練過程中頻繁評估基礎模型,監控基礎模型的質量。
  • 可用于公平比較不同基礎模型之間的對齊潛力。過去不同模型的微調過程可能差異很大(例如數據、訓練方法、超參數等),不能直接反映基礎模型的質量。
  • 還可用于探索大模型對齊的科學,例如分析基礎模型在預訓練期間已經獲得的知識和技能,識別缺失的內容,而不是盲目地利用大量數據進行微調,從而產生不必要的計算成本。

圖片

實驗也探索了URIAL中示例的不同數量,如果提高到8個,一些指標中有明顯提升,但一些指標中也有下降,最終作者推薦用3個比較平衡

圖片

對于改用不同的示例也比較穩健

圖片

如果把之前對話作為示例的一部分,URIAL也可以讓基礎模型獲得多輪對話的能力

圖片

One More Thing

論文中實驗的Llama-2和Mistral,其實總體來說都屬于羊駝家族。

URIAL免微調對齊法是否用于羊駝架構之外的大模型?

由于不是羊駝的開源大模型不好找,我們試了試剛剛發布的Transformer挑戰者,Mamba架構基礎模型

Mamba是一種狀態空間模型,別說不是羊駝了,連Transformer都不是。

使用論文附錄提供的一份URIAL標準提示詞,簡單測試發現同樣適用。

圖片

使用URIAL詢問“你能用6歲小朋友也能聽懂的方式解釋什么是狀態空間模型嗎?”

Mamba將數學定義的狀態比喻成了車在路上的位置,比較簡單易懂,甚至給出markdown格式的圖片鏈接,試圖圖文并茂回答問題。

圖片

如果不使用URIAL直接輸入這個問題,Mamba的表現就是基礎模型那樣補全下文而不是回答問題了,解釋的內容也是車轱轆話來回說。

圖片

論文:https://allenai.github.io/re-align/

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-07-03 10:34:13

2024-10-28 07:20:00

AI模型

2016-05-12 16:22:43

IBM大型機LinuxONE

2022-12-19 14:39:29

機器人論文

2023-10-16 12:31:17

人工智能數據

2021-11-19 10:13:01

模型人工智能計算

2024-08-20 07:55:03

2023-06-16 09:45:36

AI視頻

2024-07-22 08:17:00

模型性能

2025-09-15 14:44:59

圖像生成AI模型

2024-06-20 07:23:29

2023-10-20 17:53:05

2023-09-18 11:25:00

2019-12-30 21:50:16

物聯網暖通空調IOT

2025-05-13 05:11:00

推理模型微調

2023-07-17 09:21:12

Meta模型

2024-02-02 21:42:41

2024-09-29 13:40:00

2023-06-16 09:49:11

人工智能研究

2025-07-07 08:56:00

點贊
收藏

51CTO技術棧公眾號

久草这里只有精品视频| 一区二区三区自拍视频| 久久久91精品国产一区二区精品| 国产精品福利在线观看网址| 黄色录像免费观看| 精品国产一区二区三区不卡蜜臂| 色噜噜久久综合| 激情五月五月婷婷| 四虎影院在线播放| 久久激情五月激情| 欧美极品美女视频网站在线观看免费| 日本二区在线观看| 成人三级毛片| 欧美老年两性高潮| www.爱色av.com| av在线影院| 久久久久九九视频| 国产精品乱码一区二区三区| 天天天天天天天干| 亚洲激情婷婷| 九九精品视频在线观看| 天天躁日日躁aaaa视频| 国产 日韩 欧美 综合 一区| 欧美猛男超大videosgay| 国产成人无码精品久久久性色| 黄色在线论坛| 国产欧美日韩一区二区三区在线观看| 国产精品白丝jk白祙| 91午夜交换视频| 久久伊人亚洲| 琪琪亚洲精品午夜在线| 黄色小视频在线免费看| 9191国语精品高清在线| 伊人久久久久久久久久| theav精尽人亡av| 99re8这里有精品热视频免费| 在线不卡一区二区| 色播五月综合网| 欧美××××黑人××性爽| 欧美色道久久88综合亚洲精品| 欧美极品少妇无套实战| 久久黄色美女电影| 国产精品久久久久毛片软件| 日本一区二区三区视频免费看| 亚洲欧美日韩综合在线| 高清不卡一区二区在线| 91视频免费进入| 国产精品视频第一页| 另类成人小视频在线| 国产精品久久电影观看| 国产美女www爽爽爽| 日日夜夜精品视频免费| 国产精品r级在线| 亚洲天堂五月天| 日本午夜精品一区二区三区电影 | 91精品人妻一区二区| 啪啪国产精品| 亚洲男人的天堂网站| 给我看免费高清在线观看| 免费成人高清在线视频theav| 日韩国产在线看| 日韩精品卡通动漫网站| 国产精品羞羞答答在线观看| 亚洲香蕉成人av网站在线观看| 中文字幕丰满乱子伦无码专区| 亚洲宅男网av| 一区二区三区www| 日日操免费视频| 在线精品国产| 欧美黄色片免费观看| 国产福利拍拍拍| 日韩和欧美一区二区| 国产欧美韩国高清| 精品国产亚洲av麻豆| 成人福利视频网站| 欧美一卡2卡3卡4卡无卡免费观看水多多 | 青青青视频在线免费观看| 91久久电影| 国语自产在线不卡| 男操女视频网站| 国产资源在线一区| 精品卡一卡二| 91九色在线porn| 一区二区三区在线播放| av之家在线观看| 日本精品久久| 精品国产一区二区三区不卡 | 蜜桃一区二区三区| 久久精品视频播放| 日本污视频在线观看| 日韩和欧美一区二区| 96pao国产成视频永久免费| 天堂av一区二区三区| 中文av一区特黄| 久久久久久久久久网| 国产精品久久久久久妇女| 91精品国产免费| 久久久久久久久久久国产精品| 91精品国产福利在线观看麻豆| 91精品国产乱码久久久久久久久 | 日本青青草视频| 亚洲永久免费精品| 91久久国产自产拍夜夜嗨| 四虎精品在永久在线观看| 亚洲欧洲日产国产综合网| 一区二区传媒有限公司| 成人在线日韩| 伊人亚洲福利一区二区三区| 四虎永久在线精品| 久久精品国产一区二区| 欧美18视频| 在线欧美三级| 欧美日韩在线一区二区| 久久国产精品无码一级毛片| 欧美一区二区三区久久精品| 国产成人高潮免费观看精品| 天堂网在线资源| 亚洲乱码中文字幕综合| 免费看污污网站| 校花撩起jk露出白色内裤国产精品| 欧美超级乱淫片喷水| 91视频久久久| 久久在线观看免费| 国产高清av在线播放| 欧美影院视频| 色一区av在线| 久草热在线观看| 91一区二区在线| 日本人体一区二区| 亚洲国产中文在线| 久久亚洲精品成人| 一级特黄aa大片| 欧美国产一区二区| 青青在线视频免费| 在线视频亚洲专区| 日本韩国在线不卡| 亚洲av成人无码久久精品老人 | 日韩久久中文字幕| 9人人澡人人爽人人精品| 777久久精品一区二区三区无码| 亚洲精品乱码日韩| 久久精品视频va| 国产精品久久久久久69| 亚洲人成小说网站色在线| 亚洲精品www.| 天天射综合网视频| 亚洲一区精品电影| gogo在线高清视频| 日韩一级片在线观看| 欧美成人综合色| 成人性视频免费网站| 日韩人妻无码精品久久久不卡| 福利欧美精品在线| 91av免费观看91av精品在线| 三区在线观看| 欧美性淫爽ww久久久久无| 中字幕一区二区三区乱码| 日韩av中文字幕一区二区三区| 日韩欧美一区二区三区四区| 日本精品另类| 日韩中文字幕在线播放| 国产特级aaaaaa大片| 亚洲在线中文字幕| 大乳护士喂奶hd| 男人的天堂亚洲| 亚洲精品视频一区二区三区| 免费一区二区三区在线视频| 国外成人在线播放| 蜜桃视频在线观看视频| 欧美色涩在线第一页| 好吊色视频在线观看| 成人高清免费观看| 男女视频一区二区三区| 99成人在线视频| 国产成人精品福利一区二区三区| 日韩深夜视频| 日韩有码在线观看| 亚洲免费成人在线| 日韩欧美一区二区三区久久| 婷婷国产成人精品视频| 福利视频网站一区二区三区| 国产亚洲欧美在线视频| 久久理论电影| 国产一区二区三区免费不卡| 亚洲精品国产嫩草在线观看| 欧美精品在线第一页| 日韩精品视频在线观看一区二区三区| 欧美日韩高清一区| 日本视频www| 国产精品久久久爽爽爽麻豆色哟哟| 俄罗斯女人裸体性做爰| 久久精品日产第一区二区| 一区二区三区四区国产| 红杏一区二区三区| 国产区精品视频| 精精国产xxxx视频在线野外 | 18video性欧美19sex高清| 一区二区亚洲精品国产| 欧美一级在线免费观看| 欧美怡红院视频| 亚欧视频在线观看| 亚洲欧美偷拍卡通变态| 久久精品无码一区| 不卡电影免费在线播放一区| 久久成年人网站| 久久中文在线| 91丨porny丨探花| 欧美3p在线观看| 欧美综合激情| 国产精品xxx在线观看| 成人两性免费视频| 日韩欧美精品电影| 欧美在线激情网| 狂野欧美激情性xxxx欧美| 色偷偷av一区二区三区乱| 黄色网址在线播放| 精品国产污污免费网站入口 | 日本免费在线观看视频| 一区二区三区产品免费精品久久75| 国产精品久久久视频| 91在线观看一区二区| 韩国三级在线看| 狠狠v欧美v日韩v亚洲ⅴ| 国产一线二线三线在线观看| 亚洲综合日本| 国产99久久九九精品无码| 激情综合久久| 中文字幕日韩一区二区三区 | 青青青在线观看视频| 国产精品99久久久久久动医院| 日韩欧美视频一区二区| 综合国产视频| 欧美国产综合视频| 亚州av一区| 久久精品99久久| 欧美一级全黄| 精品久久一区二区三区蜜桃| 欧美日韩导航| 久久精品99| 亚洲人成精品久久久 | 欧美一区二区三区在线看| 亚洲天堂中文网| 欧美久久一区二区| 国产精品玖玖玖| 欧美一区二区三区在线观看| 国产伦精品一区二区三区视频痴汉 | 国产成人精品久久| 韩国成人动漫| 国产成人一区二区三区电影| 极品美女一区| 国产精品成人国产乱一区 | 香蕉亚洲视频| 日本三区在线观看| 免费黄网站欧美| 欧美激情第3页| 国产在线精品一区二区夜色| 亚洲热在线视频| 懂色一区二区三区免费观看| 私密视频在线观看| 国产午夜精品理论片a级大结局| 摸摸摸bbb毛毛毛片| 亚洲欧洲一区二区三区| 久久亚洲AV无码| 欧美网站在线观看| 久久精品99北条麻妃| 欧美精品久久久久久久多人混战| 国产三级第一页| 亚洲白虎美女被爆操| 欧洲成人av| 精品国产欧美一区二区五十路| 污污片在线免费视频| 97在线视频免费播放| 色尼玛亚洲综合影院| 91精品国产综合久久男男| 超碰成人在线免费| 欧美一区二区高清在线观看| 色中色综合网| 国产高清av在线播放| 久久亚洲一区| www.偷拍.com| 久久久久九九视频| 69av视频在线| 色久优优欧美色久优优| av网站免费大全| 亚洲经典中文字幕| 瑟瑟视频在线| 久久久免费高清电视剧观看| 99精品国自产在线| 国产精品国产一区二区| 欧美色图在线播放| 国产又粗又猛又爽又黄的网站 | 亚洲成精国产精品女| 波多野结衣二区三区| 精品久久一二三区| av网站大全在线观看| 午夜精品一区二区三区在线视| 国产综合色在线观看| 国产一区喷水| 天天影视综合| 可以在线看的黄色网址| 国产电影精品久久禁18| 蜜桃传媒一区二区亚洲| 亚洲成人tv网| av高清一区二区| 在线播放精品一区二区三区| 国产黄大片在线观看| 91网站在线看| 欧美色图在线播放| 成人免费观看视频在线观看| 国产老妇另类xxxxx| 精品国产aaa| 欧美日韩国产一区中文午夜| 国产黄色一区二区| xvideos成人免费中文版| 一个人看的www视频在线免费观看| 91精品国产99久久久久久红楼 | 色偷偷噜噜噜亚洲男人的天堂| 国产在线精彩视频| 成人在线看片| 自拍偷拍欧美| 香蕉视频色在线观看| 中文字幕av一区 二区| 亚洲视频 欧美视频| 日韩精品久久久久久久玫瑰园| 日韩少妇视频| 成人在线看片| 黄色日韩精品| 韩国三级在线看| 自拍偷自拍亚洲精品播放| 国产三级理论片| 一区二区三区美女xx视频| 午夜不卡影院| 久久久久久久久久久久久久一区| 亚洲第一黄网| a级一a一级在线观看| 精品久久久久久久久久| 日韩在线视频观看免费| 欧美激情综合色| 成人爽a毛片| 中文字幕无码精品亚洲资源网久久| 懂色中文一区二区在线播放| 九九热这里有精品视频| 欧美tickling网站挠脚心| 在线观看免费视频你懂的| 99国产超薄肉色丝袜交足的后果| 这里只有精品在线| 中文字幕无码毛片免费看| 亚洲精品国产a| 丰满少妇被猛烈进入| 97在线观看视频国产| 香蕉久久夜色精品国产使用方法| 乱子伦视频在线看| 国产精品美日韩| 国产人妻精品一区二区三区| 欧美国产极速在线| 国产精品午夜av| 情侣黄网站免费看| 日本一区二区三区久久久久久久久不| 最近中文字幕在线观看| 精品国产一区二区三区久久狼5月| 国产麻豆一区二区三区| 国产精品国三级国产av| 99精品欧美一区二区三区小说| 9i看片成人免费看片| 色综合影院在线| 97人人澡人人爽91综合色| 免费在线观看视频a| 国产欧美精品国产国产专区| 国产精品玖玖玖| 午夜免费日韩视频| 成人羞羞网站入口免费| 日韩欧美色视频| 精品久久久久久国产91| av中文字幕在线| 91免费观看| 亚洲综合精品| 爱爱视频免费在线观看| 亚洲国产精久久久久久| 日韩欧美精品电影| 欧美做受777cos| 久久伊99综合婷婷久久伊| 91精品国产乱码久久| 国产+人+亚洲| 清纯唯美亚洲综合一区| 亚洲av无码一区东京热久久| 一本色道久久综合亚洲aⅴ蜜桃| 老司机精品视频在线观看6| 黑人另类av| 久久99精品一区二区三区 | 国产丝袜精品丝袜| 日本精品免费| 成人午夜伦理影院| 亚洲天堂999| 91av视频在线播放| 亚洲综合专区| 亚洲图片另类小说| 亚洲第一天堂av| 97久久中文字幕| 国产精品人人妻人人爽人人牛| 一区二区在线免费|