精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DeepSeek爆火后的新Scaling Law究竟是什么? 原創

發布于 2025-3-14 11:17
瀏覽
0收藏

出品 | 51CTO技術棧(微信號:blog51cto)

嘉賓 | 周博洋、魏新宇

采訪 | 薛彥澤

撰稿 | 李美涵

DeepSeek R1的發布在全球人工智能領域引發了巨大反響。這款由中國初創企業DeepSeek推出的低成本、高性能AI模型,打破了人們對AI研發“高投入、長周期”的固有認知,被西方媒體譽為“人工智能的斯普特尼克時刻”。

DeepSeek的“奇跡”有目共睹。其應用上線僅20天,日活躍用戶數就突破了2000萬,而ChatGPT達到同樣的日活量則耗時150天之余。不僅如此,DeepSeek的開源路線也廣受好評,R1成功登頂開源平臺“抱抱臉”最受歡迎模型,還以一己之力開啟了一波開源熱潮,影響不僅波及國內模型廠商,還促使OpenAI的Altman也放出了開源計劃。

另一個近期AI圈的熱點,則是千呼萬喚始出來的GPT-4.5。在“大模型撞墻論”甚囂塵上之際,OpenAI官方承認,GPT-4.5的優勢在于規模龐大,盡管模型參數量級擴張,但性能并未達到前沿水平。這迫使我們正視:在AI領域,新的時代已經開始。

為此,AIGC實戰派特別邀請了微軟(中國)有限公司高級架構師周博洋和AI技術專家魏新宇,就DeepSeek出現后值得關注的熱門話題進行了深入討論和解讀。有趣的是,兩位專家達成了一個共識:預訓練時代并未終結,然而,新的Scaling Law已經誕生。

周博洋認為,新的Scaling Law其實是“思考時間”,即模型思考的時間越久,給出的回答質量就越佳。

魏新宇則提出,新Scaling Law的重點在于后訓練的數據質量和獎勵模型的設計。誰能在這些問題上有所突破,誰就找到了模型性能提升的第二曲線。

以下是訪談要點:

?預訓練時代的持續:兩位專家一致認為,預訓練和微調仍然是模型學習知識的標準范式。盡管Scaling曲線不再陡峭,但方法本身仍然有效。

?新的Scaling Law:魏新宇認為,新的Scaling Law將出現在訓練數據和獎勵模型的設計方面。他從獎勵模型最常見的三種設計講起,揭秘了DeepSeek R1的獎勵算法如何為模型打分。

?強化學習與推理能力:周博洋指出,強化學習之所以在出現很久后,才由R1走通了強推理的路徑,是因為此前基礎模型能力的局限性。“沒有CoT的能力,強化就沒有意義,因為強化學習不是直接賦予模型推理能力,而是激發它潛在的推理能力。”

?小模型的強推理能力:魏新宇認為,小模型擁有強推理能力的關鍵在于數據強化和訓練方法的選擇。他以微軟的小模型明星Phi-4為例,給小模型的蒸餾和微調提出了一些建議。

?接入DeepSeek的建議:周博洋提供了清晰可行的建議:如果是為了業務,就選最穩的API;如果是日常使用,就選方便易用的。

?AI應用新場景:魏新宇提到,R1的推理能力為AI應用解鎖了新的場景,在教育、科研領域的潛力更大。推理意味著模型不僅能勝任現有知識的問答,還能對未來趨勢做預測,例如預測票房、股市等。

1.預訓練時代終結了嗎?

薛彥澤: 第一個問題,預訓練時代終結了嗎?

魏新宇: 我的觀點是預訓練并沒有結束,它依然是大模型的基礎。比如最近很火的DeepSeek R1,也是基于V3進行強化學習的。預訓練仍然是通用知識庫的來源,所以仍然是必要的。不過,預訓練會與后續的強化學習結合起來,優化以前大規模消耗算力的預訓練模式。因此不能說預訓練終結,我認為是一種范式的提升。

周博洋: 補充兩句,我覺得預訓練和微調依然是模型學習知識的標準范式。

首先,預訓練和監督微調是模型理解知識本源的關鍵步驟。我們會給模型各種數據,比如互聯網數據、特定領域的數據比如MATH-500等等,目的是讓模型理解語義,繼而懂得Token之間的關聯性。傳統上,預訓練主要是讓模型學會續寫和理解語言的邏輯,而微調則是讓模型生成符合人類習慣和規范的文本。

從GPT-3開始,強化學習被引入,最初是為了讓模型對齊人類價值觀,比如避免偏見、暴力等不良內容。但在訓練的過程中,逐漸發現了強化學習在推理領域的潛力。

至于預訓練是否終結,我覺得現在討論還為時尚早。雖然Scaling的曲線沒有那么陡峭了,大家也從強化學習等其他方向,探索提升能力的路徑。但是預訓練本身仍然有效。

薛彥澤: 那目前Scaling Law的瓶頸怎么突破呢?

周博洋: 還是從兩個維度來看。

第一個維度是算力和模型參數的關系。在固定的算力體系下,模型參數和token數量的關系是關鍵。比如,現在有些模型已經接近Scaling Law的極限,但如果能突破這個限制,比如把70B參數的模型和1.4T的數據放大十倍,就會變成700B參數和14T的數據,這其實已經接近一些現有大模型的規模了。不過,像DeepMind這樣的研究機構可能覺得已經達到算力上限了,但OpenAI的模型成長速度其實還能更快。因為現在更受限于多卡互聯訓練時的通信損耗,比如馬斯克提到的十萬卡訓練,效率低主要是因為通信損耗。所以,未來可能需要在算力優化和通信效率上做更多工作。

第二個維度是數據的獲取和利用。現在很多人認為數據挖掘已經到底了。但我們忽略了99%的數據其實不在集中數據里,而是分散在端側設備上,這些數據可能因為安全問題無法聯網,價值也沒被挖掘,這可能是突破Scaling Law瓶頸的一個方向。

2.后訓練、推理語境下的新Scaling Law究竟是什么?

薛彥澤: 后訓練、推理語境下的新Scaling Law究竟是什么?

周博洋:我覺得后訓練和推理語境下的新Scaling Law其實跟“思考時間”有關。思維鏈的產生和我的偶像Donald Norman有關,他在大學癡迷玩德國撲克,這個游戲就是思考的事件越長,獲勝概率才會更高。這跟Alpha Go有點像,它們會花很長時間思考,最終戰勝人類。人類大腦也有快思考和慢思考,簡單的事情比如約喝咖啡,很快就能決定;但復雜的事情比如討論算法,就需要很多中間步驟和時間。

魏新宇: 我覺得后訓練和推理語境下的新Scaling Law,重點在于后訓練的數據質量和獎勵模型的設計。以前是靠增加模型參數和數據量來提升性能,但現在更多是看怎么優化后訓練階段。

現在強化學習領域,獎勵模型的設計也很重要。相當于給模型的答案打分,判斷是否符合人類標準。獎勵方式大概有三種:1. 直接打分:只看答案是否正確來打分;2. 多步驟打分:結合推理步驟和結果一起打分;3. 全步驟打分:每一步都打分,理論上效果最好,但很復雜,實際很難完全實現。

像DeepSeek的話,獎勵模型還會基于一些規則進行打分,比如推理問題和非推理的問題打分規則各有側重。比如訓練醫學問題時,獎勵模型會根據答案是否正確、正確答案出現的次序位置等因素打分,正確答案越靠前,分數越高。

薛彥澤: OpenAI宣布從GPT-5開始就做基礎模型和推理模型的混合模型了,那么,后訓練會推動模型的架構進行變革嗎?

周博洋: 首先,任何架構的模型都可以做推理。我覺得后訓練可能會推動模型架構的變革,但目前的核心還是提升效率,而不是徹底改變模型的本質。

從模型架構的改進來看,比如DeepSeek V3模型使用的MoE技術,MoE把模型的FFN層或MLP層變大,理論上能讓模型更好地學習語義,從而提升性能。但問題在于,如果模型太大,推理時會面臨顯存占用過高的問題。因為推理時模型的參數是固定的,傳統模型會激活所有神經元,即使有些神經元在推理時并不需要,這就會浪費顯存。

為了解決這個問題,MoE技術在訓練時只激活部分“專家”(即MLP子模塊),而不是全部。這樣可以提高效率,但訓練難度也增加了。比如,Llama 3.1模型被認為是MoE模型,但它的訓練者也承認MoE模型很難訓練充分,因為很難確定哪些專家在推理時真正起作用。

DeepSeek V3模型通過一些函數強制實現負載均衡,確保所有專家都能被訓練到,這樣MoE技術才能真正發揮作用。但目前來看,這些改進的核心還是為了提高效率,而不是徹底改變模型的推理方式。模型的變革可能還在路上,目前的重點是讓現有架構更好地支持推理和后訓練。

3.OpenAl o1、o3模型都免費了DeepSeek R1還有優勢嗎?

薛彥澤: OpenAl o1、o3模型都免費了DeepSeek R1還有優勢嗎?沿著這個思路,我們還想了解兩個開源或者說免費的模型,究竟應該如何比較?DeepSeek的核心優勢在哪里?

魏新宇: 我覺得DeepSeek R1還是有優勢的,即使OpenAI的o1、o3模型免費了。首先,免費模型雖然開源,但不一定能滿足所有定制化需求。比如DeepSeek R1雖然模型較大,有600多B,部署需要近1T顯存,但它的推理能力很強,而且在特定領域,比如金融行業,可以通過蒸餾或微調來優化,讓模型更小、推理速度更快。因為從使用體驗看,R1、o3模型有時候推理一個問題需要長達十幾秒甚至更久,這在生產環境中可能難以接受。

其次,企業對數據安全和合規性有很高要求。DeepSeek R1可以通過特定手段確保模型的回答符合人類價值觀和當地法規,比如在中東國家避免涉及某些敏感話題。而開源模型在這方面可能需要額外的定制和優化。

再者,推理效率和高可用性也是關鍵。DeepSeek R1在推理過程中采用了諸如MLA技術等優化手段,通過低秩聯合壓縮等方式節省顯存,提升推理速度。尤其是蒸餾以后,去做垂域模型,比全量模型更適合大規模商業化部署。

所以,開源或免費模型的優勢在于成本低、易獲取,但DeepSeek R1的核心優勢在于推理效率、定制化能力、數據安全性和高可用性。

薛彥澤:DS的橫空出現,會不會改變國內互聯網的競爭格局?

魏新宇:從技術人員的角度來看,我覺得DeepSeek的出現肯定會對國內模型的競爭格局產生影響,但最終的競爭還是會落到整體生態上。現在國內AI市場競爭很激烈,大家都在推各種模型,但模型之間的能力差距其實并沒有那么大。比如,R1可能比其他模型強一些,但并不是說它比其他模型高出一大截,大家的能力其實都差不多。

關鍵在于,企業有沒有自己固有的客戶流量或生態。比如微信接入DS后,可以基于自己的生態推動應用;百度也可以通過地圖等業務,基于模型做附加值的東西。谷歌和微軟也是一樣,谷歌的Gemini有YouTube和其他工具,微軟有自己的辦公軟件生態,這些都是它們的優勢。

本文轉載自??51CTO技術棧??,作者:伊風


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-3-14 14:10:25修改
收藏
回復
舉報
回復
相關推薦
美女福利精品视频| 性做久久久久久免费观看| 国产精品ⅴa在线观看h| 欧美午夜激情影院| 国产一区一区| 欧美日韩美女在线观看| 欧美一区免费视频| 国产女人高潮毛片| 亚洲专区免费| 久久人人爽亚洲精品天堂| 少妇极品熟妇人妻无码| 多野结衣av一区| 国产精品无圣光一区二区| 亚洲a级在线播放观看| 99热只有这里有精品| 久久国产成人午夜av影院宅| 欧美岛国在线观看| 国产成人精品视频ⅴa片软件竹菊| 免费高清完整在线观看| 99久久精品国产精品久久| 国产精品99免视看9| 国产大片aaa| 欧美色就是色| 亚洲激情视频在线观看| 天堂av在线网站| 精品精品导航| 亚洲天堂av老司机| 欧美亚洲免费高清在线观看| 国产成人精品毛片| 免费不卡在线视频| 欧美亚洲午夜视频在线观看| 国产精品三区在线观看| 精品美女久久| 日韩高清不卡一区二区三区| 99国产精品久久久久久久| 欧美成人猛片aaaaaaa| 国产自偷自偷免费一区| av在线官网| 欧美激情自拍偷拍| 久久精品综合一区| www黄色网址| 精品一区二区三区在线观看 | 偷拍日韩校园综合在线| 在线不卡日本| 成年人在线免费观看| 99re热这里只有精品免费视频| 亚洲一区二区三区毛片 | 老司机午夜免费精品视频 | 久久久久免费看| 国产精品久久久久蜜臀| 中文字幕国产精品| 国产一区二区三区四区五区六区| 日韩在线麻豆| 亚洲精品97久久| 中文成人无字幕乱码精品区| 精品少妇3p| 亚洲成年网站在线观看| www日本在线观看| 日韩中文一区二区| 欧美一级欧美三级在线观看| 99视频在线观看视频| 亚洲免费资源| 欧美一区二区精品在线| 国产一级片中文字幕| 国产精品高清一区二区| 欧美一区二区久久久| 能看毛片的网站| 99久热这里只有精品视频免费观看| 欧美一级久久久久久久大片| 佐佐木明希电影| 第四色中文综合网| 日韩高清免费观看| 亚洲av无码一区二区二三区| 欧美极品中文字幕| 色婷婷成人综合| 成年人二级毛片| 欧美 日韩 国产 一区| 欧美激情精品久久久久久蜜臀| 国产乡下妇女做爰视频| 国产亚洲一区在线| 国产精品久久久久999| 一本色道久久综合亚洲| 国产激情偷乱视频一区二区三区| 成人av免费电影| 日本一区二区三区在线观看视频| 久久久久国产精品厨房| 中文字幕99| 欧美日韩在线视频免费观看| 欧美日韩国产中文字幕| 欧美婷婷精品激情| 亚洲精品高潮| 亚洲精品午夜精品| 欧美成人短视频| 欧美日韩岛国| 国产97在线|日韩| 国产精品一区二区黑人巨大| 国产aⅴ精品一区二区三区色成熟| 国产美女99p| 久草在线青青草| 亚洲色图欧洲色图婷婷| 大陆av在线播放| 高清成人在线| 日韩欧美激情四射| 亚洲第一成人网站| 艳女tv在线观看国产一区| 午夜免费日韩视频| 亚洲天堂2021av| kk眼镜猥琐国模调教系列一区二区| 日本精品一区| 少女频道在线观看免费播放电视剧| 欧美日韩综合视频网址| 色网站在线视频| 天堂av一区二区三区在线播放| 色偷偷88888欧美精品久久久| 国产在线欧美在线| 蜜臀va亚洲va欧美va天堂| 官网99热精品| 在线观看免费黄色| 天天av天天翘天天综合网 | 国产v综合v亚洲欧| 日本一区视频在线观看| 牛牛电影国产一区二区| 欧美影院一区二区三区| 国产高清成人久久| 在线看片不卡| 国产精品自产拍在线观看中文| 亚洲 欧美 激情 另类| 1区2区3区欧美| 不卡影院一区二区| a级日韩大片| 久久久精品中文字幕| 波多野结衣视频在线观看| 成a人片亚洲日本久久| 国产av第一区| 日韩亚洲国产免费| 在线免费观看羞羞视频一区二区| 国产精品久久久免费视频| 国产91丝袜在线观看| 欧美一级免费在线观看| 国产福利亚洲| 国产亚洲视频在线观看| 中文字幕国产在线观看| 97久久精品人人爽人人爽蜜臀 | 香蕉亚洲视频| 成人免费观看a| 婷婷激情在线| 欧美日韩黄视频| 中文字幕伦理片| 青娱乐精品在线视频| 美日韩精品免费| 美女高潮在线观看| 亚洲第一二三四五区| 久久成人国产精品入口| 国产麻豆精品theporn| 国产精品jizz在线观看老狼| 日韩福利在线观看| 最近中文字幕日韩精品| 依依成人在线视频| 日本一二三不卡| 亚洲综合日韩欧美| 久久精品国产大片免费观看| 成人黄色av播放免费| 日本中文字幕电影在线免费观看| 欧美日精品一区视频| 青青草华人在线视频| 久久电影网站中文字幕| 亚洲一区二区高清视频| **国产精品| 伦理中文字幕亚洲| 六月丁香综合网| 偷拍日韩校园综合在线| 可以直接看的无码av| 日韩黄色小视频| 一区二区三区av| 久久精品九色| 久久久伊人欧美| 午夜在线视频观看| 日本精品一级二级| 男人av资源站| 国产91精品入口| 日本欧美黄色片| 国产一区二区三区91| 国产精品自产拍在线观看中文| 超碰在线网址| 亚洲国模精品私拍| 中文字幕一级片| 亚洲美女精品一区| 国产黑丝在线观看| 首页国产欧美日韩丝袜| 日本丰满大乳奶| 国产精品sss在线观看av| 日本最新高清不卡中文字幕| 浪潮av一区| 亚洲精品456在线播放狼人| 在线免费观看一级片| 亚洲综合一二三区| 久久婷婷五月综合| 国产成人精品免费视频网站| 亚洲免费人成在线视频观看| 91香蕉视频污在线观看| 国产成人精品综合在线观看| 成人一区二区三| 一区二区三区在线电影| 欧美福利精品| 欧美第一在线视频| 欧美重口另类videos人妖| 黄色网址在线免费播放| 日韩精品在线视频美女| 99久久精品无免国产免费| 欧美网站在线观看| 免费麻豆国产一区二区三区四区| 91在线视频观看| 1314成人网| 丝袜美腿亚洲一区二区图片| 国产肉体ⅹxxx137大胆| 日韩激情免费| 久久综合九色综合网站| 久久在线观看| 国产一区二区视频在线观看| 午夜影院在线播放| 欧美国产日本高清在线| 精品国产白色丝袜高跟鞋| 亚洲人成网站777色婷婷| 色哟哟国产精品色哟哟| 日韩一级免费观看| 91精品国产色综合久久不8| 日本乱码高清不卡字幕| 日韩av免费网址| 亚洲精品久久久久久国产精华液| 永久免费av无码网站性色av| 久久亚洲一区二区三区明星换脸| 亚洲黄色小说在线观看| 国产在线精品一区在线观看麻豆| 丝袜制服一区二区三区| 午夜亚洲影视| 国产精品秘入口18禁麻豆免会员| 韩日精品视频| 国产专区在线视频| 91精品国产麻豆国产在线观看| 日韩欧美三级电影| 国产在线观看91一区二区三区| 九九九九精品| 欧美天堂影院| 久久99国产精品| 麻豆国产欧美一区二区三区r| 成人av免费电影| 丁香一区二区| 国产九色91| 精品在线网站观看| 久久爱av电影| 亚洲精品aaaaa| 欧美精品在线一区| 国产剧情一区| 丝袜美腿玉足3d专区一区| 红桃成人av在线播放| 日韩精品一区二区三区四区五区 | 另类欧美日韩国产在线| 中文字幕 91| 国内欧美视频一区二区| 五月天六月丁香| 国产91精品露脸国语对白| 欧美日韩一区二区三区四区五区六区| 国产91丝袜在线播放| 国产极品一区二区| 久久影院午夜片一区| 性高潮久久久久久久| 国产欧美日韩精品一区| 男人天堂资源网| 亚洲日本一区二区| 国产一级视频在线观看| 狠狠久久五月精品中文字幕| 日韩美一区二区| 欧美日韩小视频| 国产成年妇视频| 精品视频中文字幕| 超碰国产在线观看| 九九精品视频在线| 欧美裸体视频| 国产精品一区二区电影| 视频精品国内| 久久精品国产精品国产精品污 | 日韩污视频在线观看| 色偷偷成人一区二区三区91| 在线观看xxxx| 亚洲成av人片在线观看香蕉| 国产中文字幕在线观看| 久热在线中文字幕色999舞| av日韩中文| 国产精品亚洲美女av网站| 色播一区二区| 日本一区二区三区免费看| 91精品啪在线观看国产18 | 免费观看成人av| 在线观看欧美一区二区| 久久久久久免费毛片精品| 午夜精品久久久久99蜜桃最新版| 亚洲高清不卡在线| 亚洲午夜无码久久久久| 精品sm捆绑视频| 色的视频在线免费看| 午夜精品理论片| 日韩专区视频网站| 精品无人乱码一区二区三区的优势| 日韩一区二区中文| 欧美激情 国产精品| 久草这里只有精品视频| 人妻在线日韩免费视频| 亚洲欧美日韩国产成人精品影院 | 夜久久久久久| 天天综合成人网| 国产亚洲欧美激情| 日韩激情一区二区三区| 欧美日韩一区二区欧美激情| 日批免费在线观看| 久久在线免费观看视频| 自拍偷自拍亚洲精品被多人伦好爽 | 久久久全国免费视频| 欧美日韩一区小说| 三级理论午夜在线观看| 欧美肥臀大乳一区二区免费视频| 国产精品传媒麻豆hd| 久久综合婷婷综合| 好看不卡的中文字幕| 激情文学亚洲色图| 欧美—级在线免费片| 人妻 日韩精品 中文字幕| 精品国产免费人成电影在线观看四季| 欧美三级理伦电影| 国产精品美女在线| 亚洲精品中文字幕99999| 国产一二三区在线播放| 国产毛片精品国产一区二区三区| 中国女人特级毛片| 一本久久a久久免费精品不卡| 丰满肥臀噗嗤啊x99av| 欧美猛男性生活免费| 电影中文字幕一区二区| 亚洲欧洲另类精品久久综合| 老司机午夜免费精品视频| 泷泽萝拉在线播放| 狠狠躁夜夜躁人人爽天天天天97| 成人久久精品人妻一区二区三区| 久久夜色精品国产亚洲aⅴ| 亚洲精品无播放器在线播放| 欧美美乳视频网站在线观看| 午夜一区不卡| 国产一区二区三区四区五区六区| 日韩欧美在线一区| 牛牛影视精品影视| 日本久久中文字幕| 免费短视频成人日韩| 免费日韩中文字幕| 国产亚洲一区二区三区四区| www.久久久久久久| 国产午夜精品久久久| 成人影院av| 三区精品视频| 美女脱光内衣内裤视频久久影院| 91ts人妖另类精品系列| 欧美剧情片在线观看| 麻豆网站在线看| 亚洲sss综合天堂久久| 欧美激情 亚洲a∨综合| 亚洲日本久久久| 欧美视频专区一二在线观看| 欧美日韩在线精品一区二区三区激情综| 欧美中文字幕第一页| 激情综合网五月| 国内自拍第二页| 亚洲国产成人tv| 青春草在线观看| 国产精品免费一区| 你懂的视频一区二区| 这里只有精品在线观看视频| 色综合中文综合网| 日本高清视频在线播放| 91精品网站| av不卡在线看| 欧美性生交大片| 欧美va在线播放| 综合另类专区| 中文字幕日韩精品久久| 岛国av在线一区| 亚洲国产成人无码av在线| 久久九九免费视频| 国内精品偷拍| 亚洲免费一级视频| 亚洲综合在线观看视频| 国产在线一二三| 97国产超碰| 丝袜亚洲另类丝袜在线| 欧美日韩在线观看免费| 亚洲美女又黄又爽在线观看| 日韩成人综合网| 黄色动漫网站入口| 亚洲精品成人少妇| 精彩国产在线| 国产欧美日韩一区二区三区| 秋霞午夜av一区二区三区| 日韩av男人天堂|