精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

剛剛,開源大模型的新王誕生了:超越GPT-4o,模型還能自動糾錯

人工智能
橫掃 MMLU、MATH、IFEval、GSM8K,在每項基準測試上都超過了 GPT-4o,還擊敗了 405B 的 Llama 3.1。

快速更迭的開源大模型領域,又出現了新王:Reflection 70B。

橫掃 MMLU、MATH、IFEval、GSM8K,在每項基準測試上都超過了 GPT-4o,還擊敗了 405B 的 Llama 3.1。

這個新模型 Reflection 70B,來自 AI 寫作初創公司 HyperWrite。

圖片

HyperWrite 公司的 CEO Matt Shumer 表示,Reflection-70B 現在是「世界上最頂級的開源 AI 模型」。

Reflection 70B 的底層模型建立在 Meta 的 Llama 3.1 70B Instruct 上,并使用原始的 Llama chat 格式,確保了與現有工具和 pipeline 的兼容性。

Reflection 70B 已在多個基準測試中經過嚴格測試,包括 MMLU 和 HumanEval。測試結果表明, Reflection 的表現始終優于 Meta 的 Llama 系列,并與 GPT-4o 等全球頂尖的商用模型展開了激烈競爭。

圖片

其中,它在 GSM8K 的得分甚至達到了 99.2%。要知道,GSM8k 中可能有有超過 1% 的被標為正確的答案實際上有錯,也就是說,Reflection 70B 的得分幾乎與滿分無異。

值得注意的還有 Reflection 70B 的零樣本推理能力。面對從未接觸過的內容,Reflection 70B 的表現超越了 Claude 3.5、Gemini 1.5 以及 Llama 405 在五次樣本測試中的得分。

圖片

Reflection 70B 特別適用于需要高精度的任務,它將推理分為不同的步驟以提高精度。該模型可通過 Hugging Face 下載,API 訪問將于今天晚些時候通過 GPU 服務提供商 Hyperbolic Labs 提供。

  • Hugging Face:https://huggingface.co/mattshumer/Reflection-70B
  • 試用網址:https://reflection-playground-production.up.railway.app/

假設訓練有素  模型自動糾錯

在通用能力之外,Reflection 70B 的亮點還包括「錯誤識別」和「錯誤糾正」。

一種名為「Reflection-Tuning」的技術,使得模型能夠在最終確定回復之前,先檢測自身推理的錯誤并糾正。

Reflection 70B 引入了幾個用于推理和糾錯的特殊 token,使用戶能夠以更結構化的方式與模型交互。在推理過程中,模型會在特殊標簽內輸出其推理,以便在檢測到錯誤時進行實時糾正。

圖片

Playground 演示網站包含供用戶使用的建議提示詞,比如那些很經典的例子:詢問 Reflection 70B 單詞「Strawberry」中有多少個「r」,以及哪個數字更大(9.11 還是 9.9),這兩個簡單的問題曾經難倒過很多大模型。

Reflection 70B 在測試中顯得有些遲緩,但最終 60 多秒后給出了正確的答案。

圖片

Reflection 70B 的發布只是 Reflection 系列的開端。與此同時,Reflection 405B 也在推出的路上了,預計下周上市。Shumer 表示,它的性能將遠遠超過目前的專有或閉源 LLM,例如目前全球領先的 OpenAI 的 GPT-4o。

Shumer 宣布,HyperWrite 正致力于將 Reflection 70B 模型集成到其主要的 AI 寫作助手產品中。

Reflection 405B 有望超越當今市場上最頂尖的閉源模型。HyperWrite 將發布一份報告,詳細介紹訓練過程和基準,以及 Reflection 模型背后的創新之處。

兩個人在幾周內完成  歸功于 Glaive 的合成數據

Shumer 表示完成 Reflection 70B 只花了三周,團隊只有他和另一位 AI 創業公司的創始人 Sahil Chaudhary 兩個人。

圖片

在這么短的時間內做出效果如此好的模型,Shumer 稱,都要拜 Sahil 的公司 Glaive 所賜。Glaive 是一家專門為特定需求構建數據集的初創公司。Shumer 在 X 平臺上反復 que 這一點:「聯系了 Sahil 之后,訓練數據幾小時內就生成好了?!顾€親自站臺安利:「如果你在訓練 AI 模型,一定要試試 Glaive 提供的服務。」

圖片

Glaive 專注于解決 AI 開發中最大的瓶頸之一:高質量、任務特定數據的可用性。在去年獲得了一輪 350 萬美元的種子輪融資。

圖片

Sahil Chaudhary 

小型、更專業化的語言模型在使用 Glaive 提供的服務后,能夠更快地完成訓練。已經有一些小模型使用該公司已經證明了 Glaive 的能力,例如一個 3B 參數模型在 HumanEval 等任務上的表現超過了許多參數規模更大的開源模型。

火得措手不及  GPU 不夠用了

Reflection 70B 一經發布,就火了,跑去試用的人太多,模型已經反應不過來了。

圖片

圖片

本來可以在線試用 Reflection 70B,但現在和它聊天反應很慢。

圖片

但是根據手快的網友發來的測評,Reflection 70B 也確實沒辜負六個基礎測試集里有四個都打敗了 Claude 3.5 Sonnet 的戰績。

比如,它是首個能想明白這道纏繞不清的邏輯題的大模型。

圖片

提示詞:有人在某地殺了 Agatha。Agatha、管家和 Charles 住在 此地,并且是那里唯一的居民。殺手恨他的目標,并且比受害者窮。Charles 不恨 Agatha 恨的任何人。Agatha 除了管家之外恨所有人。管家恨所有不如 Aunt Agatha 富有的人。管家恨所有 Agatha 恨的人。沒有人恨所有人。誰殺了 Agatha?

向它提問:「柏林的魏森湖地區當地人通常在哪里聚會?當地有哪些景點?」。對于這些本地人才知道的答案,其他模型雖然也能給出一些正確的回復,但是總會冒出一些在柏林之外的地點。Reflection 70B 是第一個能正確地說出主要地點,并且沒有幻覺的模型。

圖片

Reflection-70B 的編碼能力也得到了認證。有網友在 ProLLM 的編碼輔助任務中對 Reflection-70B 進行了基準測試。它確實是最好的開源模型之一,擊敗了 Llama-3.1 405B。

圖片

不過,爆火的同時,由于 Reflection 70B 的底層模型采用了 Meta 的 Llama 3.1 70B Instruct,這也引發了一些爭議。

有網友認為:「Reflection 70B 只是一種元提示(Meta-Prompting)的進步,似乎不能算是一種創新。」

圖片

但也有人對此提出反對,認為「利用思維鏈和讓大模型說出自己的工作流程」這種方法能讓大模型更好地模擬人類思考的過程。

「萬一 Shumer 的方法 Reflection-tuning,就是 OpenAI 的 Strawberry 的方法呢?」

圖片

團隊介紹

乍一看,Reflection 70B 似乎是橫空出世,HyperWrite 的知名度并不高。但其實 Shumer 已是 AI 領域的創業老將了:2020 年,他與就 Jason Kuperberg 共同創立了 Otherside AI。

圖片

從左至右分別為 Otherside AI 的聯合創始人:Matt Shumer, Miles Feldstein 與 Jason Kuperberg。

Otherside AI 憑借其當家產品 HyperWrite 收獲了一波流量。HyperWrite 最初是一款根據要點撰寫郵件和消息的 Chrome 插件。后來,它的功能越來越強大,拓展出了起草文章、總結文本等功能。截至 2023 年 11 月,HyperWrite 擁有兩百萬用戶。隨著兩位聯合創始人登上了福布斯年度「30 歲以下精英」榜單,Otherside AI 也正式更名為 HyperWrite。 

在最新一輪融資中, HyperWrite 獲得了 280 萬美元的投資。在這筆資金的加持下,HyperWrite 引入了 AI 驅動功能,升級成了可以從網頁瀏覽器自動完成預定航班、在 LinkedIn 上篩簡歷的智能管家。 

HyperWrite 在線幫你訂達美樂披薩的外賣。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-08-07 14:05:40

OpenAI大模型開源

2024-11-12 14:00:00

AI編程

2024-10-17 14:05:34

2025-06-06 14:17:11

模型訓練AI

2024-06-05 13:09:26

2024-09-06 13:31:31

2025-08-05 09:15:15

2024-08-14 12:54:46

2024-05-14 11:29:15

2025-11-06 08:55:00

2025-05-26 08:33:00

2024-06-27 12:45:30

2024-08-09 12:50:02

2024-08-30 14:35:00

2024-08-15 15:45:00

AI訓練

2024-12-27 10:27:58

2024-06-21 09:58:38

2025-09-28 15:35:32

AI模型強化學習

2025-04-08 02:26:00

點贊
收藏

51CTO技術棧公眾號

亚洲电影在线免费观看| 久久99精品久久久久久国产越南| 亚洲精品一线二线三线无人区| 激情伊人五月天| xxxxx日韩| 国产综合色精品一区二区三区| 欧美精品激情视频| 国产精品亚洲无码| 国产精品一区二区三区www| 一区二区三区在线不卡| 久久精品中文字幕一区二区三区 | 开心九九激情九九欧美日韩精美视频电影 | 精品三级久久久久久久电影聊斋| 国产一区二区在线影院| 欧美一级大片视频| 黑鬼狂亚洲人videos| 亚洲精品亚洲人成在线| 日韩欧美一区在线观看| 国产成人黄色片| 浪潮av一区| 国产午夜亚洲精品不卡| 粉嫩av一区二区三区免费观看| 日韩不卡高清视频| 99热在线精品观看| 美女啪啪无遮挡免费久久网站| 精品久久久久久中文字幕人妻最新| 成人av在线播放| 色8久久人人97超碰香蕉987| 久久男人资源站| 黄色av电影在线观看| 2020国产精品久久精品美国| 国产成人精品福利一区二区三区| 中文字幕一区二区三区波野结| 一区二区动漫| 欧美激情中文网| 亚洲不卡在线播放| 精品日韩免费| 亚洲欧美日韩精品| 欧美一级片黄色| 亚洲91网站| 日韩亚洲欧美一区二区三区| www.午夜av| 欧洲亚洲精品| 欧美丰满美乳xxx高潮www| 国产成人无码一二三区视频| 亚洲色图官网| 欧美丝袜美女中出在线| 一区二区传媒有限公司| segui88久久综合9999| 一区二区国产盗摄色噜噜| 中国一级大黄大黄大色毛片| 麻豆影院在线| 1区2区3区精品视频| 亚洲国产一区二区三区在线播| 男女污视频在线观看| 久久综合色之久久综合| 精品蜜桃传媒| 日本ー区在线视频| 久久精品视频在线免费观看 | 91欧美在线| 色婷婷**av毛片一区| 亚洲图片第一页| 日韩综合一区| 欧美成人激情在线| 精品人妻伦九区久久aaa片| jizzjizz欧美69巨大| 中文字幕日韩精品在线观看| 欧美日韩生活片| 国产精品不卡| 欧美国产中文字幕| 日韩av片在线播放| 久久不射网站| 成人免费观看网址| 99国产精品99| 成人精品电影在线观看| 九色一区二区| 色三级在线观看| 亚洲精品美腿丝袜| 精品少妇在线视频| 欧美日韩国产v| 精品污污网站免费看| www,av在线| 超碰成人在线观看| 亚洲欧美www| 国产精品18在线| 国产字幕视频一区二区| 日韩av免费在线看| 97超碰资源站| aa级大片欧美| 亚洲欧美日韩另类精品一区二区三区 | 欧美激情小视频| 精品人妻一区二区三区免费看| 视频一区免费在线观看| 亚洲www在线观看| 亚洲欧美日本在线观看| 国产精品免费aⅴ片在线观看| 国产一二三四五| 欧美大片免费| 欧美一区二区网站| 一卡二卡三卡四卡| 91精品啪在线观看国产81旧版| 97香蕉久久超级碰碰高清版| 中文字幕乱码在线观看| 成人视屏免费看| 午夜精品视频在线观看一区二区| 日本大胆在线观看| 欧美视频一区二区三区| 91精品人妻一区二区三区蜜桃2| 成人免费在线电影网| 一区二区亚洲精品国产| 日本少妇性高潮| 黑人巨大精品欧美一区| 日本高清视频一区二区三区| 国产三级伦理在线| 欧美日韩国产综合一区二区三区| 亚洲一区二区三区四区五区六区| 亚洲欧洲日韩| 国产精品久久久久7777婷婷| 老熟妇高潮一区二区高清视频| 国产精品毛片无遮挡高清| 97在线国产视频| 粉嫩一区二区三区在线观看| 亚洲色图欧美制服丝袜另类第一页| 九九精品在线观看视频| 蜜桃av一区二区三区| 蜜桃网站成人| 黄在线观看免费网站ktv| 日韩一区二区麻豆国产| 国产日韩精品中文字无码| 免费在线亚洲欧美| 国产成人av一区二区三区| av免费网站在线| 欧美日韩视频在线一区二区 | 欧美一区二区三区黄片| 亚洲天堂福利av| 久久人人爽av| 精品国产精品| 日韩美女在线播放| 日韩一区二区三区不卡| 亚洲一区精品在线| 精品无码av一区二区三区不卡| 久久精品欧美一区| 国产一区红桃视频| 77777影视视频在线观看| 色呦呦网站一区| 少妇大叫太粗太大爽一区二区| 亚洲天堂偷拍| 国产欧美日韩亚洲| 国内在线视频| 亚洲精品国产精品乱码不99按摩 | 在线日韩av片| 久久国产柳州莫菁门| 久久久青草婷婷精品综合日韩| 精品免费二区三区三区高中清不卡| 国产网红在线观看| 亚洲成人黄色在线观看| 久热精品在线观看| 丁香天五香天堂综合| 和岳每晚弄的高潮嗷嗷叫视频| 日韩一区二区三区精品| 欧美大片在线影院| 日韩专区第一页| 欧美日韩色婷婷| 亚洲最大成人网站| 日韩黄色在线观看| 亚洲人一区二区| 国产乱码精品一区二区三区亚洲人| 成年人精品视频| 国产刺激高潮av| 精品magnet| 添女人荫蒂视频| 国产精品久久久亚洲一区| 免费成人在线观看av| 岛国一区二区| 欧美黑人xxx| 三级av在线| 欧美日韩一区在线| 午夜三级在线观看| 成人涩涩免费视频| av之家在线观看| 日韩精品一区二区三区免费观影 | 日本一本不卡| 99r国产精品视频| 欧美电影网站| 久久久www成人免费精品| 亚洲第一精品网站| 色综合久久66| 91麻豆精品成人一区二区| www.亚洲在线| 亚洲欧美视频二区| 在线成人国产| 亚洲欧美精品| 欧美男男freegayvideosroom| 国产精品www网站| 色yeye免费人成网站在线观看| 亚洲精品国精品久久99热一| 怡红院成永久免费人全部视频| 一区二区三区四区高清精品免费观看 | 先锋影音网一区二区| 久久久久久久久综合| 99中文字幕一区| 亚洲国产精品一区二区三区| 国产精品传媒在线观看| 一区二区日韩av| 蜜桃av乱码一区二区三区| 国产成人午夜电影网| 精品少妇无遮挡毛片| 欧美激情一区| 亚洲精品一区二区三| 动漫视频在线一区| 国产啪精品视频网站| 日本а中文在线天堂| 日韩专区在线观看| 天堂影院在线| 欧美大胆人体bbbb| 在线观看不卡的av| 欧美性xxxxhd| 国产精品第九页| 成人免费一区二区三区在线观看| 亚洲色成人网站www永久四虎| 大陆成人av片| 捷克做爰xxxⅹ性视频| 视频在线观看国产精品| 99热自拍偷拍| 亚洲人人精品| www婷婷av久久久影片| 99久久精品费精品国产| 欧美尤物一区| 久久超碰99| 久久婷婷人人澡人人喊人人爽| 91欧美极品| 91手机在线播放| 粉嫩一区二区三区在线观看| 国产一区二区在线免费视频| 成人久久网站| 国产噜噜噜噜噜久久久久久久久| 第84页国产精品| 日本道色综合久久影院| 蜜桃视频www网站在线观看| 色综合视频一区中文字幕| 永久免费网站在线| 久久天天躁狠狠躁夜夜av| 欧洲日本在线| 久久综合88中文色鬼| 麻豆传媒在线观看| 日韩在线资源网| 日本不卡不卡| 久久精品国产一区二区电影| 成视频免费观看在线看| 美女啪啪无遮挡免费久久网站| 里番在线观看网站| 久久天天躁狠狠躁夜夜躁| 久草免费在线观看| 久久资源免费视频| 调教一区二区| 久久久久久亚洲精品中文字幕 | 日本免费久久高清视频| 正在播放日韩精品| 日韩av手机在线观看| 日韩久久一区二区三区| 国产成人亚洲综合91精品| 福利视频一区| 99视频在线免费观看| 久久久久久毛片免费看| 欧美高清性xxxxhd | 久久久久久久久伊人| 黄色片网站免费| 国产精品初高中害羞小美女文| 久久人妻无码aⅴ毛片a片app| 一区二区三区四区激情| 中国一级免费毛片| 91成人网在线| 国产精品久久久久久久免费看| 精品少妇一区二区三区日产乱码| 少妇精品视频一区二区 | а√资源新版在线天堂| 欧美福利视频在线| 欧洲一区精品| 国产色综合天天综合网| 麻豆精品久久| 久久国产精品久久精品国产| 成人一区二区| 黄色三级中文字幕| 久久久国产亚洲精品| 亚洲一二三不卡| 成人激情综合网站| 一级特黄曰皮片视频| 尤物视频一区二区| 日日骚av一区二区| 51精品秘密在线观看| 亚洲欧美日韩成人在线| 日韩亚洲欧美成人| √8天堂资源地址中文在线| 国产精品成人aaaaa网站| 欧美午夜网站| 日韩影视精品| 亚洲激精日韩激精欧美精品| 欧美一级裸体视频| 国产91精品露脸国语对白| 人人妻人人澡人人爽| 亚洲午夜电影在线| 在线观看国产黄| 精品亚洲永久免费精品| 91高清在线观看视频| 欧美在线性视频| 一区二区三区自拍视频| 亚洲毛片aa| 亚洲一区欧美激情| 亚洲 自拍 另类 欧美 丝袜| 国产欧美日韩视频在线观看| 人人干人人干人人干| 6080午夜不卡| 午夜伦全在线观看| 日本91av在线播放| 97久久综合区小说区图片区| 在线观看欧美一区| 日韩有码一区二区三区| 中文字幕无码人妻少妇免费| 樱桃国产成人精品视频| 91黄色在线视频| 一区二区av在线| 性欧美18xxxhd| 国产在线精品二区| 欧美另类视频| 两女双腿交缠激烈磨豆腐| 中文字幕日韩一区| 特级西西444www高清大视频| 国产亚洲精品美女| 成人教育av| 欧美高清视频一区| 另类激情亚洲| 欧美 日韩 国产 成人 在线观看| 欧美日韩国产页| 五月婷婷丁香六月| 久久久亚洲精选| 蜜桃久久久久| 少妇高潮喷水在线观看| 菠萝蜜视频在线观看一区| 男人操女人的视频网站| 欧美精品一二三区| eeuss影院www在线播放| 欧美专区国产专区| 亚洲免费观看高清完整版在线观| 水蜜桃色314在线观看| 成人avav影音| 久久久无码精品亚洲国产| 欧美无乱码久久久免费午夜一区| 日韩欧美在线观看一区二区| 国内精品久久久久久影视8| 欧美三级午夜理伦三级小说| av日韩在线看| www.欧美日韩| 国产无遮挡又黄又爽| 亚洲国产高清福利视频| 俺来也官网欧美久久精品| 含羞草久久爱69一区| 亚洲伦理精品| 久久人妻一区二区| 五月婷婷综合激情| 日本高清视频网站| 欧美中文字幕第一页| 午夜a一级毛片亚洲欧洲| 成年人免费在线播放| 久久影院午夜片一区| 日韩乱码人妻无码中文字幕| 亚洲国产另类 国产精品国产免费| 97人人在线| 亚洲bt欧美bt日本bt| 国产精品videosex极品| 欧美精品黑人猛交高潮| 91极品美女在线| 国产最新在线| 国产精品国产精品国产专区蜜臀ah| 亚洲免费激情| 国产综合精品久久久久成人av| 9191成人精品久久| 欧美hdxxxxx| 极品日韩久久| 性一交一乱一区二区洋洋av| aa片在线观看视频在线播放| 欧美日韩亚洲综合一区二区三区| 在线看三级电影| 久久婷婷开心| 精品中文字幕一区二区| 国产真人真事毛片| 亚洲性无码av在线| 日本成人精品| 欧美一区二区中文字幕| 国产精品传媒视频| 欧美 日韩 国产 成人 在线| 国产精品久久久久久影视| 亚洲一区欧美| 一道本在线观看| 日韩欧美国产午夜精品| 福利影院在线看| eeuss中文| 97se亚洲国产综合在线| 国产视频在线观看视频| 午夜精品一区二区三区av| 婷婷亚洲五月|