精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

清華SuperBench全球測評出爐,Claude 3拿下多個冠軍!合成數據才是人類未來?

發布于 2024-5-6 09:48
瀏覽
0收藏

就在最近,清華大學SuperBench團隊的新一輪全球大模型評測結果出爐了!


此次測評,還增加了Llama 3-8b 和Llama 3-70b兩個最近炙手可熱的模型。


在語義理解、智能體能力、代碼能力三個測評中,我們發現:Claude-3拿下兩個top 1,穩穩位于前三之列。

清華SuperBench全球測評出爐,Claude 3拿下多個冠軍!合成數據才是人類未來?-AI.x社區

清華SuperBench全球測評出爐,Claude 3拿下多個冠軍!合成數據才是人類未來?-AI.x社區

清華SuperBench全球測評出爐,Claude 3拿下多個冠軍!合成數據才是人類未來?-AI.x社區

Claude 3果然實強。

技術報告曝出:Claude 3靠合成數據

在技術報告中,大家發現了Claude 3的亮點——


它是在合成數據上訓練的。


鑒于大模型的參數數量和數據都是可以縮放的,所以以后計算就是瓶頸了。

清華SuperBench全球測評出爐,Claude 3拿下多個冠軍!合成數據才是人類未來?-AI.x社區

所以,Claude 3的成功,可以說是對合成數據而言是一個巨大的進步。


其實,此前艾倫人工智能研究所的科學家Nathan Lambert就曾經就Anthropic的合成數據做了一些猜測。


而現在詳細技術報告的發布,將他的猜測完全證實了!

清華SuperBench全球測評出爐,Claude 3拿下多個冠軍!合成數據才是人類未來?-AI.x社區

合成數據的探索

關于合成數據,Lambert曾在23年11月寫下了一篇文章《合成數據:Anthropic 的 CAI,從微調到預訓練,OpenAI 的超對齊,提示、類型和開放示例》。


在這篇文章里,他做出判斷——合成數據是AI下一階段的加速器,并且詳細解釋了合成數據是什么,以及它意味著什么。

清華SuperBench全球測評出爐,Claude 3拿下多個冠軍!合成數據才是人類未來?-AI.x社區

合成數據,也就是由機器生成而非人工創建的數據,在自然語言處理(NLP)和整個機器學習(ML)領域都有著長久的歷史背景。與之密切相關的概念是數據增強,即通過對數據進行細微調整來豐富數據集的多樣性。


在NLP領域,一個經典的應用是回譯,即利用ML模型的輸出對原始文本進行重新翻譯,生成新的數據。


如今,合成數據的使命變得更加重大:通過去除人類的介入,讓AI更加符合預期且用戶友好。


這一任務由Anthropic的訓練方法和OpenAI新成立的、充滿神秘色彩的超對齊團隊牽頭,后者致力于利用AI反饋解決對齊問題。


同時,合成數據已經成為眾多知名開源模型供應商微調Meta和Mistral模型的首選工具。

合成數據,能成為下一次技術突破的關鍵嗎?


隨著當前或下一代模型很可能已經用盡了互聯網上所有的高質量數據源,模型開發者正在尋找新的途徑來獲取所需的大規模數據,以支持模型的持續擴展。


合成數據的支持者認為,增加更多的數據有助于模型更好地解決那些長尾任務或評估問題。為了模型能夠擴大100倍,將需要大量的合成或數字化數據。


反對者則認為,我們生成的所有數據都來源于與當前SOTA模型相同的分布,因此不太可能推動技術產生新的進展。


盡管如此,開源領域仍然遠遠落后于GPT-4和GPT-4-Turbo,這意味著我們想要在開發的各個階段復制這些數據,還有很長的路要走。


開源的支持者和HuggingFace Hub 上的大多數趨勢模型都將合成數據作為一種快速行動的方式,并有能力在行業中嘗試 SOTA 語言模型背后的技術。


開源支持者和HuggingFace Hub上大多數流行模型,都將合成數據作為一種快速發展,并嘗試業內最先進SOTA語言模型的方法。


像Anthropic和OpenAI這樣的公司使用合成數據,因為這是他們在規模和能力上取得進展的唯一方式,而小模型之所以使用合成數據,是因為相同規模的人類數據的成本要高出數千倍。


在這種二分法中,雖然方法看起來相似,但大公司會在創建數據集(預訓練規模的合成數據)上投入超過1000萬美元的推理計算成本,而開源競爭者可能只需要花費大約10美元。

盡管開源和閉源這兩個社區追求的目標截然不同,合成數據卻同時為他們雙方提供了支持。


合成數據可以讓模型在訓練中能多次看到某些不常見的數據點,從而使模型的魯棒性得到提升。


通過投喂大量數據,模型在小眾事實、語言和任務的處理能力也都將顯著提高。

Anthropic的CAI技術與合成數據的復雜性

關于Anthropic大量使用合成數據的傳言眾所周知,這種做法顯著提升了他們的模型魯棒性。


盡管Meta的Llama 2聊天機器人因基于隱藏的觸發詞列表而做出荒謬的拒絕而受到批評,但Anthropic的模型在拒絕不了解的問題時表現出了更加合理的判斷,值得我們給予肯定。


Anthropic在其Claude系列模型中廣泛采用的憲法AI(Constitutional AI, CAI)技術,是迄今為止已知最大規模的合成數據應用實例。


具體來說,憲法AI通過兩種方式利用合成數據:

1. 對指令調整數據進行評估,確保其遵循一系列原則,如「答案是否鼓勵暴力」或「答案是否真實」。模型在生成問題答案時會根據這些原則進行檢查,并隨時間優化答案。之后,模型會根據這些經過篩選的數據進行微調。

2. 利用語言模型生成成對偏好數據,評估在特定原則指導下哪個答案更為恰當(類似于某篇論文中對原則引導獎勵模型的使用)。隨后,模型通過合成數據進行正常的從人類反饋中學習(RLHF),這一過程也稱為RLAIF。

清華SuperBench全球測評出爐,Claude 3拿下多個冠軍!合成數據才是人類未來?-AI.x社區

如今,RLAIF已成為業界廣泛認可的術語,很多研究人員都會通過使用GPT-4來獲取評分或選擇,這些評分或選擇可以轉化為RLHF所需的接受/拒絕樣本。


然而,由于在生成批評/對多個答案進行評分與在合成數據生成階段確定一套經驗穩定原則之間存在細微差別,CAI的復雜性和細節并未被充分理解。


在進行CAI的兩個核心步驟時,Anthropic必須確保各項原則長度一致,避免概念上的重疊,并且不能隨意更改其規模。此外,有些原則所生成的數據在數值上可能會出現不穩定。

合成指令、偏好和評論

在開源模型里,我們可以清晰地看到合成數據應用方式的演進。


2023年初,模型如Alpaca和Vicuna通過使用合成指令數據對Llama模型進行監督式微調(SFT),在7-13B參數規模上實現了顯著的性能提升。


其中,很多開源指令數據集都是基于Self-Instruct方法的進步——先創建一組「種子」指令,然后利用大語言模型(LLM)生成類似的指令。目前有許多方法可以實現這一點,但都還在探索如何為數據集增加多樣性的初期階段。


與此同時,一些研究人員通過從互聯網上抓取提示,并用GPT-4將這些提示轉化為指令。但要注意,像ShareGPT這樣的提示數據集,其平均質量較低,分布也較為窄。


如今,合成偏好開始出現。這主要是通過評分或比較哪個更好來實現,類似于MT Bench和AlpacaEval的評分方法,但是會保留分數或勝負作為訓練數據。


例如,UltraFeedback就是從用戶來源(如ShareGPT)和現有的指令數據集(如FLAN)中收集提示,并生成模型的評論和完成情況。


最新的進展是通過AI評論生成的偏好或指令數據。評論是一個反復利用經過特定原則或問題微調的大語言模型(LLM)的過程。期間,增加更多的上下文信息,會大幅提高模型評論合成數據的能力,但系統設計也更加復雜。


像Meta的Shephard和KAIST的Prometheus這樣的評論模型開始出現,它們能夠對提示-生成對做出響應。但我們距離模型、意圖和知識協同作用的反饋循環還有很長的路要走

下面是一張簡單的圖表,用來展示合成指令生成是偏好上游,而偏好既是評論的上游,也是訓練難度的上游。


盡管原始的ChatGPT模型(GPT-3.5-turbo)在執行一些任務時會遇到困難,比如返回一個1到10之間的單個整數,但最新的模型輕松做到了這一點。


當開源模型能夠穩定地生成評論時,將迎來另一個轉折點。


雖然目前還不完全清楚,評論數據相比通用偏好評分對于模型的改進到底有多重要,但如果以Claude為例,它肯定是有用的。

清華SuperBench全球測評出爐,Claude 3拿下多個冠軍!合成數據才是人類未來?-AI.x社區

兩個合成數據的小竅門

1. 始終使用最優的模型來生成數據:

眾所周知,模型的效果完全依賴于數據的質量。

很多研究者可能不愿意支付OpenAI的數據訓練費用,但從成本效益來看,使用SOTA模型絕對是值得的。


這甚至包括使用一些非傳統方法,例如通過網頁版的ChatGPT來生成一系列的提示詞,這是作者親自嘗試過的。


2.API會發生變化,因此需要盡可能鎖定版本:

這一建議來自于作者數百次的MT-Bench評估經驗——模型API端點的變化可能會導致研究結果出現重大偏差。


例如,某個API端點會在評分時變得非常嚴厲,并且無緣無故地給出只有1分的評價。

如果不固定API的版本,你可能會遇到一些意想不到的問題,進而無法使合成數據完全可靠或符合邏輯。


本文轉自 新智元 ,作者:新智元


原文鏈接:??https://mp.weixin.qq.com/s/eF4eTJ_FeadW_r5SBfyvkw??

標簽
收藏
回復
舉報
回復
相關推薦
99久久夜色精品国产亚洲狼| 久久亚洲国产精品尤物| www精品美女久久久tv| 国产精品xxx视频| 日韩欧美综合视频| 欧美亚洲国产日韩| 欧美精品久久天天躁| 成年人看的毛片| 91精品专区| 成人午夜短视频| 国产欧美在线看| 中文字幕日韩一级| 国产精品久久久久一区二区三区厕所 | 欧美日韩精品专区| 国产自产在线视频| 欧美日韩在线资源| 91免费小视频| 99久re热视频这里只有精品6| 国产成人无码专区| 好看的亚洲午夜视频在线| 国产亚洲欧美日韩美女| xfplay5566色资源网站| 亚洲国产伊人| 欧美性高跟鞋xxxxhd| av 日韩 人妻 黑人 综合 无码| 男人久久精品| 99久久99久久精品国产片果冻| 成人写真福利网| 精品国产青草久久久久96| 亚洲久久成人| 色综合天天综合网国产成人网| 国产jjizz一区二区三区视频| 欧美国产不卡| 精品日韩一区二区三区免费视频| 五月激情婷婷在线| 高清电影一区| 欧美性xxxx在线播放| 九一国产精品视频| 日本成人不卡| 亚洲精品免费看| 亚洲欧洲国产日韩精品| 国产有码在线| 国产亚洲精品bt天堂精选| 国内精品视频在线播放| www.久久成人| 国产精品自拍在线| 亚洲一区二区中文字幕| 99在线无码精品入口| 国产综合成人久久大片91| 国产精品视频1区| 中文字幕人妻精品一区| 日韩av高清在线观看| 国产97在线|日韩| 麻豆精品久久久久久久99蜜桃| 国产精品久久久免费| 91精品国产乱码久久久久久久久 | 日韩一级网站| 26uuu另类亚洲欧美日本老年| 日本一级一片免费视频| 一本色道久久精品| 欧美中文在线免费| 亚洲毛片一区二区三区| 秋霞电影一区二区| 国产视频福利一区| 国产高清在线免费| 成人国产精品免费观看| 久久偷看各类wc女厕嘘嘘偷窃| 亚洲欧洲国产综合| 国产欧美日韩综合精品一区二区| 四虎影视永久免费在线观看一区二区三区 | 国产在线精品免费| 不卡视频一区| 亚洲av毛片成人精品| 久久久久九九视频| 一区二区三区三区在线| 在线视频国产区| 亚洲第一在线综合网站| 麻豆av免费在线| 久久99国产精品二区高清软件| 欧美一区二区三区成人| 五月天激情小说| 狠狠操综合网| 久久亚洲精品网站| 国产在线视频你懂的| 天堂精品中文字幕在线| 91视频国产精品| 午夜福利理论片在线观看| 久久精品男人天堂av| 老司机午夜网站| 在线最新版中文在线| 欧美色视频在线| 亚洲精品国产成人av在线| 精品国产日韩欧美| 久久综合伊人77777| 久久久精品免费看| 久久福利资源站| 精品综合久久久| 麻豆网在线观看| 黑人巨大精品欧美一区二区一视频 | 中文字幕乱码免费| 在线手机中文字幕| 欧美一区二区三区爱爱| 国产精品无码久久久久一区二区| 国产精品99一区二区三| 7777精品久久久久久| 国产乱码精品一区二区| 91麻豆国产福利在线观看| 美女在线免费视频| 亚洲第一会所001| 亚洲白虎美女被爆操| 狂野欧美性猛交| 午夜亚洲性色福利视频| 91久久极品少妇xxxxⅹ软件| 成人高潮成人免费观看| 亚洲成人激情av| 色偷偷中文字幕| 日韩久久久久| 人九九综合九九宗合| 亚洲av无码乱码在线观看性色| 国产日韩欧美在线一区| 18禁免费无码无遮挡不卡网站| 国产日韩欧美中文在线| 最近中文字幕日韩精品| 色av性av丰满av| 91在线视频播放| 国产91在线亚洲| 高清久久一区| 中文字幕日韩视频| 日韩电影在线观看一区二区| aa级大片欧美| 黄色一级片黄色| 精品一区二区三区亚洲| 最近日韩中文字幕中文| wwwwww在线观看| 久久久久久久免费视频了| 久激情内射婷内射蜜桃| 国产丝袜一区| 久久久爽爽爽美女图片| 亚洲国产精品欧美久久 | 欲色天天网综合久久| 国产午夜在线播放| jlzzjlzz亚洲日本少妇| 日本阿v视频在线观看| 91蜜桃臀久久一区二区| 久久91精品国产91久久久| 97人妻精品一区二区三区动漫| 国产精品午夜电影| 中文字幕亚洲乱码| 97色伦图片97综合影院| 91精品国产综合久久香蕉的用户体验 | www.欧美亚洲| 无码专区aaaaaa免费视频| 欧美男人操女人视频| 91国语精品自产拍在线观看性色| 日韩中文字幕免费观看| 粉嫩老牛aⅴ一区二区三区| 五月开心播播网| 欧美一级专区| 亚洲ai欧洲av| 国产日韩中文在线中文字幕| 欧美福利视频在线| 亚洲精品视频网| 亚洲成人自拍偷拍| 国产麻豆天美果冻无码视频| 久久国产日韩| 亚洲一二区在线| 韩国三级大全久久网站| 欧美激情在线视频二区| 五月色婷婷综合| 色老头久久综合| 国产又粗又长又黄的视频| 精品亚洲国产成人av制服丝袜| 妞干网这里只有精品| 91在线一区| 国产91久久婷婷一区二区| av亚洲在线| 欧美大片国产精品| 亚洲久久在线观看| 中文字幕乱码日本亚洲一区二区| 色18美女社区| 亚洲激情午夜| 亚洲mv在线看| 国产成人澳门| 国产精品视频免费观看www| 在线你懂的视频| 亚洲美女久久久| 91精品国产乱码久久| 亚洲成a天堂v人片| 刘亦菲国产毛片bd| eeuss影院一区二区三区| 国产性生交xxxxx免费| 亚洲电影影音先锋| 久久人人九九| 欧美a在线观看| 国产成人午夜视频网址| 天堂av最新在线| 中国人与牲禽动交精品| 亚洲第一免费视频| 欧美三级中文字| 国产在线观看免费av| 国产精品久久午夜夜伦鲁鲁| 亚洲午夜久久久久久久久| 蜜桃av噜噜一区二区三区小说| 成人黄色大片网站| 97精品视频在线看| 欧美日韩一区二 | 精品国产乱码久久| 中文无码av一区二区三区| 亚洲成人在线免费| wwwav国产| 中文子幕无线码一区tr| 日本xxxx裸体xxxx| 国产福利91精品一区二区三区| av无码精品一区二区三区| 一区二区自拍| 桥本有菜av在线| 国产一区二区三区电影在线观看| 国产精品美女诱惑| 国产精品亚洲一区二区在线观看| 国产成人自拍视频在线观看| av午夜在线观看| 欧美大尺度激情区在线播放| 91精彩视频在线观看| 亚洲美女久久久| 五月婷婷六月丁香综合| 日韩美一区二区三区| 国产精品国产三级国产普通话对白| 色偷偷久久一区二区三区| 日韩成人在线免费视频| 亚洲一区二区三区视频在线| 人妻久久一区二区| 国产精品美女久久久久av爽李琼| 欧美日韩高清丝袜| 久久久久国产成人精品亚洲午夜| 污污污www精品国产网站| 成人免费毛片嘿嘿连载视频| 欧美性猛交xx| 国产成人免费高清| 丰满人妻一区二区三区大胸| 国产一区二区三区免费看| 天堂一区在线观看| 久久精品国产第一区二区三区| 成人免费视频久久| 日本不卡视频一二三区| 国产九九在线观看| 美国一区二区三区在线播放| 五月天亚洲视频| 久久福利资源站| 国产又粗又猛大又黄又爽| 国产黑丝在线一区二区三区| 日韩大尺度视频| 成人h动漫精品| 美国黄色a级片| 国产日韩欧美制服另类| 久久噜噜色综合一区二区| 日韩美女久久久| 精品午夜福利视频| 精品久久久视频| av毛片在线免费观看| 欧美色图12p| 国产成人精品一区二三区四区五区| 欧美成人女星排行榜| 少妇高潮一区二区三区99小说 | 成人国产精品免费视频| 国产亚洲高清一区| 国产一区福利视频| 国产精品免费不| 一区二区91美女张开腿让人桶| 小处雏高清一区二区三区| 国产精品久久国产| 美女视频一区免费观看| 中文字幕丰满乱码| 福利电影一区二区三区| 亚洲午夜福利在线观看| 中文字幕在线视频一区| 久久久精品视频在线 | 91麻豆成人精品国产| 日韩欧美黄色影院| 欧美日韩激情视频一区二区三区| 中文字幕成人精品久久不卡| 中文字幕在线三区| 欧美最猛性xxxx| 亚洲一区二区小说| 看高清中日韩色视频| 久久视频精品| 人妻久久久一区二区三区| 免费在线一区观看| 日本人添下边视频免费| 国产农村妇女精品| 不卡的免费av| 精品视频一区二区三区免费| 丰满人妻一区二区三区免费| 国产亚洲精品va在线观看| 丝袜综合欧美| 国产精品扒开腿做爽爽爽视频| 亚洲电影一区| 亚洲 国产 欧美一区| 亚洲美女视频在线免费观看| 国产高潮免费视频| 91在线码无精品| 男人操女人的视频网站| 欧美色视频日本版| 国产三级漂亮女教师| 亚洲精品自在久久| 欧美aaaaaaa| 成人免费黄色网| 国语产色综合| 亚洲熟妇av一区二区三区漫画| 国产一区在线视频| 国产亚洲精品精品精品| 五月天网站亚洲| 亚洲经典一区二区三区| 日韩中文字幕在线精品| 在线天堂资源www在线污| 国产视频精品网| 欧美freesex交免费视频| 亚洲一级片网站| 国产日韩欧美a| 国语对白永久免费| 亚洲国产天堂久久国产91| 一区二区三区伦理| 91中文字幕一区| 四季av一区二区凹凸精品| 激情综合网婷婷| 91丨porny丨国产| 91久久国产视频| 亚洲精品一区二区三区四区高清 | 天天操精品视频| 国产精品国产三级国产专播品爱网| 国产91精品看黄网站在线观看| 亚洲а∨天堂久久精品9966| 日本欧美电影在线观看| 亚洲一区二区三区视频播放| 亚洲色图88| 欧美精品色视频| 亚洲欧美日韩久久精品| 一级黄色大毛片| 日韩中文字幕av| 四虎在线精品| 在线视频不卡国产| 国产一区高清在线| 顶臀精品视频www| 欧美一区二区在线不卡| 91福利国产在线观看菠萝蜜| 91视频免费网站| 国内自拍视频一区二区三区| 极品白嫩少妇无套内谢| 亚洲成人中文在线| 神马久久久久| 欧美最猛黑人xxxx黑人猛叫黄| 欧美人与物videos另类xxxxx| 91激情视频在线| 中文字幕av一区二区三区免费看| 在线观看中文字幕码| 北条麻妃在线一区二区| 国产亚洲精aa在线看| av在线免费观看国产| 成人av在线看| 亚洲毛片一区二区三区| 搡老女人一区二区三区视频tv| www.久久99| 老太脱裤让老头玩ⅹxxxx| 久久一区二区三区国产精品| 久久久999久久久| 久久高清视频免费| 成人三级毛片| 欧美黄色一级片视频| 中文字幕中文字幕一区二区| 亚洲a视频在线| 欧美亚洲视频一区二区| 久久在线电影| 农村末发育av片一区二区 | 91欧美日韩麻豆精品| 九九热最新视频//这里只有精品| 国产精品qvod| 激情视频综合网| 亚洲精品视频一区| 少妇激情av一区二区| 国产日本欧美在线观看| 在线精品在线| 三年中国中文观看免费播放| 日韩一级二级三级| 偷拍精品精品一区二区三区| 亚洲综合激情五月| 91在线高清观看| 国产精品伦一区二区三区| 91精品国产99| 亚洲激情中文| 免费在线观看你懂的| 在线成人免费视频| 亚洲天堂手机| 青青草免费在线视频观看| 久久一夜天堂av一区二区三区| 国产毛片毛片毛片毛片毛片| 国产91|九色| 中文字幕亚洲精品乱码| 久久精品三级视频| 亚洲国产精品推荐| 国产精品视频首页| 国产精品无码一本二本三本色|