精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

創造歷史!DeepSeek超越ChatGPT登頂中美AppStore

人工智能 新聞
DeepSeek 發布的 iOS 應用甚至超越了 ChatGPT 的官方應用,直接登頂 AppStore。

DeepSeek 20 日發布以來獲得的熱度至今依然沒有任何消退的跡象。一覺醒來,DeepSeek 發布的 iOS 應用甚至超越了 ChatGPT 的官方應用,直接登頂 AppStore。

圖片


不少網友都認為這是他們當之無愧。

圖片

畢竟,正如 a16z 合伙人、Mistral 董事會成員 Anjney Midha 說的那樣:從斯坦福到麻省理工,DeepSeek-R1 幾乎一夜之間就成了美國頂尖大學研究人員的首選模型。

圖片

甚至有網友認為 DeepSeek 是 OpenAI 與英偉達都未曾預見的黑天鵝。

圖片

與此同時,圍繞 DeepSeek-R1 的各路消息也正層出不窮 ——Hugging Face 等組織正在嘗試復現 R1、DeepSeek 之前接受的采訪被翻譯成了英文版并正在 AI 社區引發熱議、開發了 Llama 系列模型的 Meta 似乎陷入了焦慮之中…… 下面我們就來簡單盤點一下最近兩天圍繞 DeepSeek 的幾個熱點議題。

圖片

DeepSeek 創始人梁文鋒之前接受的采訪被翻譯成了英文版,正在 AI 社區引發熱議

AI 社區開啟 R1 復現熱潮

DeepSeek-R1 是開源的,但也沒有完全開源 —— 相關的訓練數據、訓練腳本等并未被公布出來。不過,因為有技術報告,也就有了復現 R1 的指導方針,也因此,最近有不少人都在強調復現 R1 的重要性與可行性。

圖片

圖片

?? 博主 @Charbax 總結了 DeepSeek 文檔中沒有介紹的地方以及復現 R1 的一些難點。

  • 訓練流程的細節。雖然其技術報告中介紹了強化學習階段和蒸餾,但省略了關鍵的實現細節,包括超參數(例如,學習率、批量大小、獎勵縮放因子)、用于生成合成訓練數據的數據管道(例如,如何編排 800K 蒸餾樣本)、需要人類偏好對齊的任務的獎勵模型架構(多語言輸出的「語言一致性獎勵」)。
  • 冷啟動數據生成。報告中雖然提到了創建「高質量冷啟動數據」(例如,人工標準、少樣本提示)的過程,但缺乏具體的示例或數據集。
  • 硬件和基礎設施。沒有關于計算資源(例如,GPU 集群、訓練時間)或軟件堆棧優化(例如,DeepSeek-V3 的 AMD ROCM 集成)的詳細信息。
  • 復現難題。缺少多階段強化學習的腳本等組件。

當然,也確實有些團隊已經開始行動了。

Open R1:復現一個真?開源版 R1

在復現 R1 的各式項目中,最受人關注的當屬 Hugging Face 的 Open R1 項目。

  • 項目地址:https://github.com/huggingface/open-r1

Open R1 宣稱是 DeepSeek-R1 的「完全開放復現(A fully open reproduction)」,可以補齊 DeepSeek 沒有公開的技術細節。該項目目前還在進行中,已經完成的部分包括:

  • GRPO 實現
  • 訓練與評估代碼
  • 用于合成數據的生成器

圖片

Hugging Face CEO Clem Delangue 的推文

據其項目介紹,Open R1 項目計劃分三步實施:

圖片

第一步:復現 R1-Distill 模型,具體做法是蒸餾一個來自 DeepSeek-R1 的高質量語料庫。

第二步:復現 DeepSeek 用于創建 R1-Zero 的純強化學習管線。這一步涉及到編排一個新的大規模數據集,其中包含數學、推理和代碼數據。

第三步:通過多階段訓練從基礎模型得到強化學習微調版模型。

7B 模型 8K 樣本復現 R1-Zero 和 R1

另一個復現 R1 的團隊是來自香港科技大學的何俊賢(Junxian He)團隊,并且他們采用的基礎模型和樣本量都非常小:基于 7B 模型,僅使用 8K 樣本示例,但得到的結果卻「驚人地強勁」。

  • 項目地址:https://github.com/hkust-nlp/simpleRL-reason

圖片

需要注意,該團隊的這個實現的實驗大都是在 R1 發布之前完成的。他們發現,僅使用 8K MATH 示例,7B 模型就能涌現出長思維鏈 (CoT)和自我反思能力,而且在復雜的數學推理上的表現也非常不錯。

具體來說,他們從基礎模型 Qwen2.5-Math-7B 開始,僅使用來自 MATH 數據集的 8K 樣本直接對其進行強化學習。最終得到了 Qwen2.5-SimpleRL-Zero 與  Qwen2.5-SimpleRL。

或者按其博客的說法:「沒有獎勵模型,沒有 SFT,只有 8K 用于驗證的 Math 樣本,得到的模型在 AIME 上成績為(pass@1 準確率)33.3%、在 AMC 上實現了 62.5%、在 MATH 上實現 77.2%,優于 Qwen2.5-math-7B-instruct,可與使用多 50 倍數據和更復雜組件的 PRIME 和 rStar-MATH 相媲美。」

圖片

Qwen2.5-SimpleRL-Zero 的訓練動態

圖片

所得模型與基線模型的 pass@1 準確度

基于 3B 模型用 30 美元復現 R1

TinyZero 則是一個嘗試復現 DeepSeek-R1-Zero 的項目,據其作者、伯克利 AI 研究所在讀博士潘家怡(Jiayi Pan)介紹,該項目是基于 CountDown 游戲實現的,完整配方有一句話就能說完:「遵照 DeepSeek R1-Zero 的算法 —— 一個基礎語言模型、提示詞和 ground-truth 獎勵,然后運行強化學習。」

圖片

實驗過程中,模型一開始的輸出很蠢笨,但逐漸發展出修改和搜索等策略。下面展示了一個示例,可以看到模型提出解決方案,自我驗證,并反復修改,直到成功。

圖片

實驗中,該團隊也得到了一些有意思的發現:

基礎模型的質量很重要。0.5B 的小模型在猜測一個解答之后就會停止,而從 1.5B 規模開始,模型會開始學習搜索、自我驗證、修正解答,從而可以得到遠遠更高的分數。

基礎模型和指令模型都可行。實驗發現,指令模型的學習速度更快,但性能會收斂到與基礎模型同等的程度;同時指令模型的輸出更加結構化、更可讀。

具體采用什么強化學習算法并不重要。該團隊嘗試了 PPO、GRPO 和 PRIME,但它們的差異并不大。

模型的推理行為嚴重取決于具體任務。對于 CountDown 游戲,模型會學習執行搜索和自我驗證;對于數值乘法,模型會學習使用分配律分解問題并逐步解決。

圖片

模型學會乘法分配律

而最驚人的是,整個項目的計算成本不到 30 美元。

Meta 的焦慮:下一代 Llama 可能趕不上 R1

數天前,機器之心報道文章《Meta 陷入恐慌?內部爆料:在瘋狂分析復制 DeepSeek,高預算難以解釋》引起廣泛關注與討論。

文章中, Meta 員工在美國匿名職場社區 teamblind 上面發布了一個帖子提到,國內 AI 創業公司 DeepSeek 最近的一系列動作讓 Meta 的生成式 AI 團隊陷入了恐慌。

今日,The Information 最新的文章爆料出更多內容。

圖片

在文章中,The Information 爆料稱包括 Meta 人工智能基礎設施總監 Mathew Oldham 在內的領導表示,他們擔心 Meta Llama 的下一個版本性能不會像 DeepSeek 的那樣好。

Meta 也暗示 Llama 的下一個版本將于本季度發布。

此外,文章也爆料,Meta 生成式 AI 小組和基礎設施團隊組織了四個作戰室來學習 DeepSeek 的工作原理。

其中兩個作戰室,正在試圖了解幻方是如何降低訓練和運行 DeepSeek 模型的成本。其中一名員工表示:Meta 希望將這些技術應用于 Llama。

其中一些開發人員透露,盡管 Meta 的模型是免費的,但它們的運行成本通常比 OpenAI 的模型更高,部分原因是 OpenAI 可以通過批量處理其模型客戶的數百萬條查詢來降低價格。但是,使用 Llama 的小型開發人員卻沒有足夠的查詢來降低成本。

據一位直接了解情況的員工透露,第三個作戰室正在試圖弄清楚幻方可能使用哪些數據來訓練其模型。

第四作戰室正在考慮基于 DeepSeek 模型的新技術,重構 Meta 模型。Meta 考慮推出一個與 DeepSeek 相似的 Llama 版本,它將包含多個 AI 模型,每個模型處理不同的任務。這樣,當客戶要求 Llama 處理某項任務時,只需要模型的某些部分進行處理。這樣做可以使整個模型運行得更快,并且以更少的算力來運行。

不知道,在這樣的壓力下,2025 年 Meta 會拿出什么樣的開源模型?說不定,Meta 也會加入到復現 R1 的浪潮中。

圖片

不過可以預料的是,在 DeepSeek 這條鯰魚的攪動下,新一年的大模型格局正在發生轉變。

對新一年的 AI 技術發展與應用,你有什么樣的期待?歡迎留言討論。


責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-04-01 07:00:00

DeepSeekAI人工智能

2025-01-27 12:28:55

2025-09-16 09:00:00

2024-01-15 00:40:43

C#Java編譯器

2025-02-08 08:30:00

2025-05-30 07:40:56

2013-03-29 10:39:04

2011-06-28 10:11:41

Top Girl應用

2009-05-30 08:39:20

2021-01-07 14:56:55

AI 數據人工智能

2025-02-10 08:37:04

2025-05-06 15:39:53

DeepSeek-R英偉達開源

2020-12-30 13:58:36

比特幣金融加密貨幣

2025-02-08 09:15:00

2025-02-03 10:00:00

DeepSeekChatGPT人工智能

2023-05-15 12:11:24

2023-10-11 13:21:12

模型數據

2025-02-05 12:53:21

2025-03-14 13:12:53

點贊
收藏

51CTO技術棧公眾號

蜜桃导航-精品导航| 97精品视频在线| 亚洲av无日韩毛片久久| 高h视频在线观看| 成人毛片视频在线观看| 人体精品一二三区| 亚洲国产精品一区二区久久hs| 久久9999免费视频| 精品免费在线视频| 亚洲最新免费视频| 亚洲女同志亚洲女同女播放| 久久一区二区三区超碰国产精品| 日韩最新中文字幕电影免费看| jjzz黄色片| 日韩精品一区二区三区| 亚洲精品国产一区二区精华液| 精品乱码一区二区三区| 亚洲最大成人在线视频| 国产亚洲毛片在线| 久久精品国产免费观看| 精品无码人妻一区| 日韩欧美一级| 欧美性大战久久久| 搞av.com| 成人在线直播| 国产午夜精品福利| 成人三级视频在线观看一区二区| 草莓视频18免费观看| 国产一区视频在线观看免费| 日韩中文有码在线视频| 国产精品无码网站| 风间由美一区二区av101| 777午夜精品免费视频| 成人一对一视频| 中中文字幕av在线| 国产精品污www在线观看| 久久青青草综合| www视频在线| 精品亚洲国产成人av制服丝袜| 欧美一区二区影院| 国产亚洲欧美精品久久久久久 | 国产精品一区二区你懂得| 又色又爽又黄无遮挡的免费视频| 美日韩精品视频| 国内免费精品永久在线视频| 少妇影院在线观看| 91精品综合| 久久精品亚洲国产| 青青草华人在线视频| 成人在线丰满少妇av| 亚洲男人天堂网站| 久久精品一区二区免费播放| 日韩欧美ww| 亚洲成人中文字幕| 美女黄色一级视频| 果冻天美麻豆一区二区国产| 欧美成人精品高清在线播放| 韩国三级丰满少妇高潮| 日本精品视频| 精品国内片67194| 丰满人妻一区二区三区大胸| 日韩一级淫片| 欧美成人三级电影在线| 老司机免费视频| 久久狠狠久久| 亚洲欧美www| 亚洲第一综合网| 日韩在线二区| 久久手机免费视频| 国产av无码专区亚洲av毛网站| 欧美va天堂在线| 欧美精品videossex88| 亚洲国产精一区二区三区性色| 亚洲经典在线看| 欧美一级片在线播放| 成人一二三四区| 精品一区精品二区高清| 91九色对白| 日本黄色大片视频| 国产三级精品三级| 中文字幕一区二区三区四区五区| 色呦呦网站在线观看| 亚洲h精品动漫在线观看| 欧美 国产 小说 另类| 亚洲精品555| 日韩欧美一区二区免费| 538国产视频| 精品国产一区二区三区小蝌蚪 | 亚洲欧美日韩国产一区二区| 91视频一区二区三区| 97人人澡人人爽| 日本韩国免费观看| 久久久久久久网| 黄瓜视频免费观看在线观看www| 婷婷在线播放| 欧美午夜视频在线观看| 性猛交ⅹ×××乱大交| 91精品久久久久久综合五月天 | 欧美日韩国产丝袜另类| 五月婷婷狠狠操| 日韩影片在线观看| 日韩激情在线视频| 国产免费一区二区三区四区| 一本色道久久综合亚洲精品高清| 国产精品日韩在线观看| 亚洲国产中文字幕在线| 久久久久99精品国产片| av 日韩 人妻 黑人 综合 无码| 欧美日韩大片| 日韩精品一区二区三区四区| 男人舔女人下部高潮全视频| 欧美日韩p片| 国产精品美女久久久免费| 国产小视频免费观看| 欧美国产激情一区二区三区蜜月| 97在线国产视频| 久久av影院| 亚洲男人第一网站| 麻豆changesxxx国产| 老司机精品视频网站| 国产乱码精品一区二区三区卡 | 一区二区三区精彩视频| 波多野结衣91| 伊人久久在线观看| 国产日本久久| 亚洲一区二区精品| 六月丁香在线视频| 成人免费三级在线| 亚洲一区 在线播放| 欧美aaaaaaaa| 亚洲热线99精品视频| 国产在线拍揄自揄拍无码视频| 老司机精品视频一区二区三区| 欧美精彩一区二区三区| 91色在线看| 精品久久久久av影院| 手机在线免费看毛片| 日本不卡123| 欧美日韩一区二区视频在线| 国产自产自拍视频在线观看| 精品久久久久av影院| 久久久久性色av无码一区二区| 黄色日韩网站视频| 中文字幕中文字幕在线中一区高清 | 欧美精品久久久久久久久久久| 国产色99精品9i| 日韩视频精品在线| 亚洲天堂一二三| 国产精品免费久久| 麻豆一区二区三区视频| av影片在线一区| 国产精品成人国产乱一区 | 99re在线精品| 男人天堂999| 亚州综合一区| 国产91色在线免费| 国产在线网站| 欧美日韩一本到| 色哟哟一一国产精品| 韩国欧美国产一区| 久久av喷吹av高潮av| 精品国产欧美| 久久久噜噜噜久久中文字免| 少妇无码一区二区三区| 精品人伦一区二区三区蜜桃网站| 免费观看一级一片| 三级在线观看一区二区| 亚洲无玛一区| 狂野欧美xxxx韩国少妇| 久久久久久免费精品| 香港三日本三级少妇66| 欧美性猛交xxxx免费看漫画| 国产熟女一区二区| 极品尤物av久久免费看| 国产精品三级一区二区| 欧美午夜寂寞| 日韩女在线观看| 91美女视频在线| 欧美一区二视频| 国产精品成人av久久| 久久午夜国产精品| 污污动漫在线观看| 国产精品激情| 欧美性大战久久久久| 欧美videos粗暴| 久久免费视频网站| 国模精品一区二区| 91精品国产欧美日韩| 日韩精品一区二区三区国语自制| 久久久久国产一区二区三区四区| 国产精品自在自线| 亚洲人人精品| 亚洲韩国在线| 久久影视三级福利片| 国产欧美一区二区白浆黑人| 牛牛在线精品视频| 国产亚洲一级高清| 国产福利第一页| 在线亚洲欧美专区二区| 久草视频在线资源| 欧美激情一区二区三区蜜桃视频| www.四虎在线| 久久精品国产网站| 日韩免费视频播放| 一区二区三区午夜探花| 农村寡妇一区二区三区| 91嫩草精品| 国产精品丝袜白浆摸在线| 狠狠躁少妇一区二区三区| 俺去亚洲欧洲欧美日韩| 亚州av在线播放| 日韩一级视频免费观看在线| 天堂免费在线视频| 精品日韩中文字幕| 久久久精品国产sm调教| 国产精品美女久久久久久| www.超碰97| 国产99久久久精品| 国产精品自拍视频在线| 国产人成精品一区二区三| 欧美日韩中文字幕在线播放| 久久人人99| 日本高清不卡三区| 欧美黄色网视频| 2019国产精品视频| 欧美三级电影网址| 国产精品久久久久77777| wwwww亚洲| 久久中文久久字幕| 黄色av网站在线播放| 在线观看国产精品91| 日韩一区av| 亚洲美女福利视频网站| 熟妇人妻中文av无码| 日韩欧美一区二区免费| 国产农村妇女毛片精品久久| 欧美人妖巨大在线| 一本久道久久综合无码中文| 在线观看亚洲精品| 国产精品视频一区在线观看| 欧美日韩国产综合新一区 | 日韩一级欧洲| 91黄色在线看| 国产一区二区三区四区老人| 男女爱爱视频网站| 亚洲天堂免费| 国产女人18毛片| 亚洲一级淫片| 久久精品在线免费视频| 欧美.www| 日本一区午夜艳熟免费| 亚洲国产精品一区| 女性女同性aⅴ免费观女性恋| 99精品国产在热久久下载| 国产午夜福利100集发布| 国产欧美精品久久| 国产男女在线观看| 欧美专区18| 亚洲精品一二三四五区| 蜜桃视频在线观看一区二区| 一女二男3p波多野结衣| 国产一区91精品张津瑜| 日韩大尺度视频| 99麻豆久久久国产精品免费| theav精尽人亡av| 国产亚洲欧洲997久久综合| 欧美日韩中文字幕视频| 国产精品免费网站在线观看| 色欲人妻综合网| 亚洲国产成人av网| 亚洲另类在线观看| 欧美日韩一区中文字幕| 国产麻豆免费视频| 精品国产欧美一区二区| 日韩三级电影网| 色诱女教师一区二区三区| 91小视频xxxx网站在线| 97人人爽人人喊人人模波多| 久久久人成影片一区二区三区在哪下载 | 亚洲国产精品悠悠久久琪琪| 色视频免费在线观看| 中文字幕免费精品一区| a级影片在线| 91国产视频在线| 激情亚洲小说| 国产亚洲一区在线播放| 成人毛片在线| 日韩精品一区二区免费| 久久黄色网页| 精产国品一二三区| 91美女片黄在线观看| 亚洲女人毛茸茸高潮| 亚洲一卡二卡三卡四卡无卡久久| 国产嫩bbwbbw高潮| 欧美一区二区性放荡片| 香蕉视频免费看| 久久久av亚洲男天堂| 极品视频在线| 91亚洲国产成人精品性色| 欧美巨大xxxx| 桥本有菜av在线| 久久国产精品99国产| 国产在线观看中文字幕| 99精品视频在线观看免费| 久久精品日韩无码| 黑人极品videos精品欧美裸| 一级片在线观看视频| 国产视频精品一区二区三区| 黄色网址免费在线观看| 国产成人精品优优av| 粉嫩精品导航导航| 中日韩在线视频| 老牛影视一区二区三区| 精品一区二区三区四区五区六区| 国产精品国产三级国产aⅴ入口 | av在线免费网址| 国产成人在线一区二区| 精品精品国产三级a∨在线| 三年中文高清在线观看第6集 | 一区二区久久久久| 中文字幕在线2019| 亚洲男人的天堂在线播放| 成人性生交大片免费看在线播放| 成人久久精品视频| 欧美艳星介绍134位艳星| 欧美v在线观看| 成人97人人超碰人人99| 18岁成人毛片| 在线播放一区二区三区| 成人在线免费观看| 日本在线精品视频| 欧美影院天天5g天天爽| 成人免费观看在线| 高清在线成人网| 欧美国产日韩在线观看成人| 正在播放亚洲一区| 免费不卡视频| 国产精品自拍网| 欧美呦呦网站| 黄色免费网址大全| 国产精品网站在线播放| 中文字幕人妻互换av久久| 国产一区二区三区在线| 日韩成人亚洲| 五月天色一区| 久色婷婷小香蕉久久| 超碰人人人人人人人| 在线观看亚洲精品视频| 国产精品久久久久久久龚玥菲| 国产成人激情视频| 免费久久久久久久久| 三级在线免费看| 国产精品福利在线播放| 国产精品一级二级| 另类天堂视频在线观看| 视频二区欧美| 青青草国产免费| 99re热视频精品| 日日夜夜操视频| 国产亚洲aⅴaaaaaa毛片| 精品123区| 日本福利视频导航| 国产成人日日夜夜| 国产精品免费av一区二区| 精品视频在线播放免| 国产私拍福利精品视频二区| 中文字幕免费在线不卡| 国产精品一区二区在线看| 国产在线观看99| 亚洲欧美自拍一区| 日韩成人一区| 日韩精品在线观看av| 91免费国产在线| 中文 欧美 日韩| 欧美精品免费看| 老牛影视av一区二区在线观看| 国产一区亚洲二区三区| 国产精品婷婷午夜在线观看| 国产视频在线免费观看| 97精品视频在线播放| 成人网18免费网站| 国产伦理在线观看| 日韩欧美高清在线视频| 麻豆免费在线观看| 国产亚洲欧美另类一区二区三区| 久久综合婷婷| 激情五月少妇a| 亚洲精品在线视频| 9999在线精品视频| 97国产精东麻豆人妻电影 | 亚洲精品视频播放| 日韩一区二区三免费高清在线观看| 熟妇熟女乱妇乱女网站| 99久久99久久精品国产片果冻| 中文字幕一区二区三区四区免费看| 欧美区二区三区| 欧美日韩国产免费观看视频| 久久久久99人妻一区二区三区| 在线日韩国产精品| 黄色成人在线网|