精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

谷歌的“雙子星”,正在圍剿一眾大模型 原創

發布于 2025-4-18 15:52
瀏覽
0收藏

編輯 | 云昭

出品 | 51CTO技術棧(微信號:blog51cto)

繼昨天凌晨OpenAI推出滿血o3、o4-mini之后,沒想到谷歌邁著“LLM王者”的步伐給出了自家的模型SOTA研究Gemini2.5 Flash。

如果說o3主打的是“干實事”,那么谷歌這次的新發布則是告訴我們:什么是“成本可控”的極致性價比。

這次的發布以后立馬引來一眾開發者的討論,不過這次不是負面的,而是全面的好評。

1.Gemini2.5 Flash的最大賣點控制大模型的思考預算

今天剛剛推出來的谷歌的新模型,是通過Google AI Studio和Vertex AI以預覽版形式發布的。

從官網發布的博客來看,個人看來最大的亮點在于:可開啟或關閉思考+給大模型引入了“思考預算”的可控機制。這種機制可以讓開發人員指定在生成響應之前應分配多少計算能力用于推理復雜問題。

個人認為,這是谷歌一個非常務實的戰略性舉措,重要性不亞于昨天OpenAI發布的能干實事的o3、o4-mini。

因為采用“思考預算”這種方法非常契合解決如今AI市場的一個根本矛盾:更復雜的推理,通常以更高的延遲和更高的價格為代價,進而影響了先進模型的采用和普及。

具體到Gemini 2.5 Flash的思考預算是如何制定的?

谷歌為了給開發者提供足夠的靈活性,特別添加了“思考預算設置”,可以精細控制模型在思考時能夠生成的最大token數量。更高的預算允許模型進一步推理,從而提高質量。

谷歌的“雙子星”,正在圍剿一眾大模型-AI.x社區圖表顯示,隨著思維預算的增加,推理質量有所提高

更重要的是,預算設置了 Gemini 2.5 Flash 的思考能力上限,但如果任務不需要,模型不會用盡全部預算。據了解,思考預算可以從0調整到24,576個token,作為一個最大限制而不是固定分配。根據谷歌的說法,模型會根據任務的復雜性智能地決定使用多少預算,在不需要復雜推理時節省資源。

有了這些,開發者就可以在質量、成本和延遲之間找到合適的平衡點。

2.思考與不思考:6倍價格差

價格方面,在Gemini 2.5 Flash中,每百萬個token的輸入成本為0.15美元。輸出成本則根據推理設置而存在顯著差異:關閉思考功能時每百萬token為 0.6美元,而啟用推理功能時則為每百萬token 3.5美元。

推理輸出的近六倍價格差異反映了“思考”過程的計算強度,其中模型在生成響應之前會評估多種潛在路徑和考慮因素。

谷歌的“雙子星”,正在圍剿一眾大模型-AI.x社區Gemini 2.5 Flash 性價比對比

圖源:谷歌整理的每百萬token價格和性能的帕累托圖

這里值得注意的是,單純關注定價變化已經意義不大,小編認為更大的意義上在于,谷歌做了一件值得思考的動作,即,谷歌給出了一種讓公司老板或者獨立開發者們非常方便的大模型的成本考量尺度:用推理輸出的價格差異來度量“思考”過程的計算強度。

正如谷歌Gemini產品總監在采訪中所提到的:“客戶需要為模型生成的任何思考和輸出token付費。在 AI Studio UX 中,你可以在響應之前看到這些思考。在 API 中,我們目前不提供對這些思考的訪問權限,但開發人員可以查看生成的token數量。”

3.根據提示詞自動調整思考時長

當然,除了思考預算設置,Gemini 2.5 Flash 還有一項“思考時長”的感知能力。據谷歌介紹,該模型經過訓練可以知道對于給定的提示需要思考多長時間,因此可以根據感知到的任務復雜性自動決定思考多少。

也就是說,根據你所問的問題的復雜程度,自動調整推理程度,從而可以更快地回答更簡單的請求。此外,?即使即使關閉“思考”,開發者也能保持 2.0 Flash 的快速運行速度,并提升性能。

谷歌將提示詞按照需要推理能力的強弱分成了三種:較少推理能力、中等推理能力、高級推理能力。具體粒度究竟如何?可以看下面幾個示例。

需要較少推理能力的提示:加拿大有多少個???(可以理解成“事實性”拷問)

需要中等推理能力的提示:你擲兩個骰子。它們加起來等于 7 的概率是多少?(高中數學題)

還有一個不錯的提示示例:

我的健身房每周一至周五上午 9 點至下午 3 點以及周二和周六下午 2 點至晚上 8 點安排籃球訓練。如果我每周工作 5 天,上

午 9 點至下午 6 點,并且希望在工作日打 5 個小時籃球,請為我制定一個時間表,確保一切順利。(簡單的辦公規劃)

需要高度推理的提示:計算于梁應力、開發者常用的復雜函數編程等復雜工程問題。

編寫一個evaluate_cells(cells: Dict[str, str]) -> Dict[str, float]計算電子表格單元格值的函數。

每個單元格包含:

  • 一個數字(例如"3")
  • "=A1 + B1 * 2"或者像使用+、、和其他單元格-的公式。*/

要求:

  • 解決單元格之間的依賴關系。
  • 處理運算符優先級(*/之前+-)。
  • 檢測循環并提出ValueError("Cycle detected at <cell>")。
  • 不要使用eval()。僅使用內置庫。

4.R1、Sonnet3.7被比下去了

Gemini 2.5 Flash在關鍵基準測試中展現出極具競爭力的性能,同時保持了比其他同類產品更小的模型規模。

在一項旨在評估推理和知識的嚴格測試“人類的最后考試”中,Gemini 2.5 Flash 的得分為 12.1%,優于 Anthropic 的Claude 3.7 Sonnet(8.9%)和DeepSeek R1(8.6%),但略低于 OpenAI 近期推出的o4-mini(14.3%)。

谷歌的“雙子星”,正在圍剿一眾大模型-AI.x社區圖片

該模型在博士級水平的科學問題評估GPQA Diamond(78.3%)和AIME 數學考試(2025 年測試中為 78.0%,2024 年測試中為 88.0%)等技術基準上也取得了優異的成績。

據了解,Doshi對自己的作品信心滿滿,“企業應該選擇 2.5 Flash,因為它在成本和速度方面提供了最佳價值。同時,它在數學、多模態推理、長上下文和其他幾個關鍵指標方面都比競爭對手更加強大?!?/p>

言外之意,很簡單,谷歌的模型比同行在關鍵指標性能上更強大,而在成本上更便宜,速度上更快。沒有理由不選擇谷歌。

還有一個重要的風向變化。谷歌這次除了狠狠地命中了企業開發者在使用LLM時的成本、性能、速度的“死亡三角”的痛點,同時還在高校學生側發力了。

據悉,Gemini 2.5 Flash的發布正值谷歌AI周,今天除了發布 2.5 Flash 之外,谷歌還宣布所有美國大學生在 2026 年春季之前都可以免費使用 Gemini Advanced。

谷歌開始明目張膽地在學生側發起沖鋒,可以被視作這樣一種信號:谷歌準備一場長線的戰斗,因為這些高效學生都是未來的知識型員工,而知識型員工正是大模型市場的必爭之地。當然,學生使用一款大模型的慣性或者說忠誠度究竟如何,尚有待考證。

5.網友熱議:谷歌正在贏下LLM比賽

隨著Gemini2.5發布以來,越來越多的開發者開始重新審視LLM玩家在自己心中的地位。

“谷歌正在悄悄地贏得AI競賽”的聲音越來越多。一位網友表示:Gemini Flash系列模型的宣傳水分是最少的,以自己的生產經驗來看,谷歌提供了最好的性價比體驗和多模態工具。

谷歌的“雙子星”,正在圍剿一眾大模型-AI.x社區圖片

同樣,在知乎上,同樣也拋出了類似的問題。

谷歌的“雙子星”,正在圍剿一眾大模型-AI.x社區圖片

這條帖子下面有網友用“龜兔賽跑”來比喻現在的LLM競賽,用兔子來形容優勢明顯的谷歌:數據頂級、人才頂級、算力不愁,只不過這場LLM競賽顯然不是短跑,而是一場足以讓谷歌中途打盹醒過來快速超過對手的長途馬拉松。

谷歌的“雙子星”,正在圍剿一眾大模型-AI.x社區圖片

這位答主已經說得非常形象,這里不再贅述。

但這里想從另一種視角來聊這種現象。在兩年前甚至去年上半年時,大家對于谷歌的印象還停留在“狼狽不堪”的防守姿態上。OpenAI每次都成功截胡谷歌的新發布,而且每次新發布都伴隨著這樣或那樣的質疑的聲音。

但近四個月以來,我們會發現這種現象已經消失了。取而代之的則是一片“叫好”的口碑。

就比如這次的模型發布后,hackernews下方很多網友表示:Gemini的輸出質量和風格相較于OpenAI的o1和Anthropic的Claude都有很大的不同,印象深刻。

別的模型往往卑躬屈膝,而Gemini則表現得更像是一位“諫議大夫”,“Gemini似乎不太愿意同意我的觀點。它做出了一些小的改進,而Claude和ChatGPT則會接受最初的提議,直到被特別要求才會做出改進。”

谷歌的“雙子星”,正在圍剿一眾大模型-AI.x社區圖片

“跟Gemini 2.5 Pro對話,感覺就像是和一個知識淵博、聰明絕頂的人在辯論。”

谷歌的“雙子星”,正在圍剿一眾大模型-AI.x社區圖片

這其實很直接的就能表明:谷歌的大模型,已經在趕上甚至超越同行。注重大模型用戶的切實需求和體驗,正在讓谷歌贏得用戶的認可。

此外,值得注意的是,谷歌正在摸索自己的大模型演進路徑。而不是以往被動追趕的姿態。此次OpenAI的o3發布走的是“大模型使用工具”的風格,但谷歌似乎并不care,將自己認為正確的“細粒度的思考預算控制”功能擺到臺面上切作為最大亮點進行推出。

可以看出谷歌已經開始觸到了那根大模型產品演進的主線脈絡。

不過,或許從模型層面上看,谷歌的Gemini雖然可圈可點,但從日活數據上看,還遠遠沒有達到贏得競賽的程度。據第三方分析稱, ChatGPT每周用戶超過 8 億,而 Gemini每月用戶估計為 2.5 億至 2.75 億。

但長遠看,基礎模型的領先加上極致可控的性價比,Gemini的用戶勢必會迎來新一波的暴漲。

正如下面這位轉向使用Gemini的網友所說:我同意Claude非常好,但我從未覺得它在實際工作中很舒服,3.7中有很多過度設計而半生不熟的解決方案,而這使得自己付出API的費用物失所值。

谷歌的“雙子星”,正在圍剿一眾大模型-AI.x社區圖片

可以想象在一年后的某天,幾個開發者調侃某個大模型產品或功能:“不是XX我買不起,而是XX家的更有性價比!”

到那時候,大模型的生態才算是塵埃落定了。

參考鏈接:

??https://developers.googleblog.com/en/start-building-with-gemini-25-flash/??

??https://news.ycombinator.com/item?id=43720845??

本文轉載自??51CTO技術棧??,作者:云昭

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
亚洲成人黄色| 久久香蕉视频网站| 日本一区二区综合亚洲| 亚洲精品成人一区| 四虎影视精品| 日本二三区不卡| 一区二区三区四区国产| 亚洲xxx在线| 久久裸体视频| 欧美成人黑人xx视频免费观看| 黄色av电影网站| 欧美国产日韩电影| 亚洲不卡一区二区三区| 亚洲国产精品视频一区| 亚洲国产日韩在线观看| 免费看欧美美女黄的网站| 欧美精品精品精品精品免费| 国产一级久久久久毛片精品| 999精品视频在这里| 视频二区欧美毛片免费观看| 风流少妇一区二区| 国产成人精品在线观看| 精品97人妻无码中文永久在线| 国内精品久久久久久久久电影网| 欧美一卡二卡在线观看| 日韩一级片播放| 超免费在线视频| 国产精品久久久久久久蜜臀| 久久精品欧美| 精品毛片一区二区三区| 麻豆91精品视频| 5566日本婷婷色中文字幕97| 午夜爱爱毛片xxxx视频免费看| 激情五月综合| 日韩黄色在线免费观看| 国产成人精品综合久久久久99| 91看片一区| 亚洲va欧美va人人爽午夜| 自拍视频一区二区三区| av在线天堂播放| 91偷拍与自偷拍精品| 97超碰资源| 国产三级三级在线观看| 最新超碰在线| 石原莉奈在线亚洲三区| 97在线免费观看视频| 国产精品白嫩白嫩大学美女| 99久久夜色精品国产亚洲1000部| 亚洲午夜av久久乱码| 香蕉网在线播放| 群体交乱之放荡娇妻一区二区| 精品处破学生在线二十三| 国产毛片久久久久久| 91精品亚洲一区在线观看| 欧美日韩亚洲高清一区二区| 在线观看亚洲色图| 福利一区二区免费视频| 欧美日韩久久久| 日本黄色的视频| 国产成人免费av一区二区午夜 | 精品少妇一区二区三区免费观看| 午夜剧场在线免费观看| 日韩午夜电影免费看| 欧美日韩一区三区| 色18美女社区| 亚洲综合影院| 欧美激情91| 国精品一区二区| 亚洲国产精品va在线看黑人动漫| 无码国产精品久久一区免费| 国产精品1luya在线播放| 亚洲成人动漫在线播放| 国产精品伦子伦| 免费看成人哺乳视频网站| 亚洲天堂成人在线| 正在播放国产对白害羞| 久久精品影视| 久久免费视频这里只有精品| 免费看日韩毛片| 久久久久久一区二区| 国产日韩欧美另类| 精品国产99久久久久久宅男i| 国产大陆a不卡| 精品高清视频| www.在线播放| 一区二区三区资源| 大陆极品少妇内射aaaaa| 国产精品字幕| 日韩欧美你懂的| 毛片网站免费观看| 日韩精品首页| 国外成人性视频| 免费av中文字幕| 国产福利一区二区三区在线视频| 久久草.com| av中文字幕在线| 亚洲成人福利片| 中文字幕国产传媒| 成人香蕉社区| 尤物精品国产第一福利三区| 午夜精品一区二区三区在线播放| 午夜免费看视频| 一区二区三区国产好| 亚洲欧美日韩国产成人| 亚洲一级生活片| 亚洲欧美日韩综合国产aⅴ| 国产这里只有精品| 日韩一区二区三区中文字幕| 中文字幕在线不卡一区| 国产午夜大地久久| www 久久久| 国产一区二区三区在线观看视频 | 日本综合在线观看| 国产精品v日韩精品v欧美精品网站 | 亚洲国产一区二区三区四区| 国产一级淫片久久久片a级| 在线免费观看欧美| 亚洲精品免费一区二区三区| 国产无套粉嫩白浆在线2022年| 一区二区在线免费观看| 国产一二三四在线视频| 欧洲亚洲视频| 欧美激情伊人电影| 国产精品国产三级国产aⅴ| 国产亚洲自拍一区| 日韩欧美精品免费| 欧洲精品99毛片免费高清观看 | 7777精品伊人久久久大香线蕉超级流畅| 中文字幕乱视频| 一区二区影视| 国产一区二区在线免费视频| 黄色av免费在线观看| 亚洲成人免费在线观看| 黄色片子免费看| 天天综合国产| 国产美女久久精品香蕉69| 久草视频在线看| 欧美日韩卡一| 亚洲天堂2016| 91精品999| 久久激情电影| 国产精品视频白浆免费视频| 可以在线观看的av网站| 欧美日韩亚洲高清| 亚洲精品乱码久久久久久蜜桃图片| 女人天堂亚洲aⅴ在线观看| 成人久久久久久| 成人看片免费| 91精品啪在线观看国产60岁| 免费一级黄色录像| 日韩电影在线观看一区| 日韩经典在线视频| 国产成+人+综合+亚洲欧美| 一本大道亚洲视频| 中文字幕一区二区人妻| 国产精品私人影院| 97超碰人人爽| 欧美日韩日本国产亚洲在线| 97免费资源站| 91九色在线播放| 日韩精品中文字| 日日夜夜狠狠操| 国产精品久久久久久亚洲伦| 国产在线观看中文字幕| 一区二区三区国产精华| 国产精品久久久久久久久久久久冷| 女囚岛在线观看| 日韩精品视频免费在线观看| 精品免费囯产一区二区三区| 国产片一区二区| av免费一区二区| 亚洲午夜极品| 欧美日韩大片一区二区三区| 福利一区视频| 欧美人在线观看| 日本护士...精品国| 色一情一乱一乱一91av| 国产午夜精品久久久久久久久| 美女在线观看视频一区二区| 超碰超碰超碰超碰超碰| 日韩高清一级| 国产精品直播网红| 欧美女同一区| 亚洲人成伊人成综合网久久久| 国产精品尤物视频| 一区二区三区欧美视频| 野花社区视频在线观看| 美女国产一区二区三区| 精品一二三四五区| 精品国精品国产自在久国产应用| 97aⅴ精品视频一二三区| 欧美视频在线观看网站| 精品国产精品久久一区免费式| 国产日韩欧美在线| 3344国产永久在线观看视频| 中文字幕亚洲欧美一区二区三区| 国产a级免费视频| 91国产免费看| 精品少妇一二三区| 国产精品伦理在线| 国产性生活毛片| 久久精品国产网站| 欧美色图色综合| 亚洲经典一区| 日韩精品电影网站| 国产精品18hdxxxⅹ在线| 国产日产亚洲精品| 亚洲精品永久免费视频| 欧美日韩电影在线观看| 国产女人在线观看| 日韩av在线播放资源| 国产理论片在线观看| 色噜噜狠狠色综合中国| 国产真实夫妇交换视频 | 欧美a级片免费看| 2023国产精品视频| 美女被爆操网站| 久久成人久久爱| 亚洲中文字幕久久精品无码喷水| 国产精品扒开腿做爽爽爽软件| 亚洲成人在线视频网站| 亚洲动漫精品| 国产亚洲自拍偷拍| 91午夜精品| 亚洲自拍偷拍色片视频| 久久久国产精品网站| 欧洲成人免费aa| 国产精品电影| 国产69精品久久久| 日本动漫理论片在线观看网站| 日韩在线视频播放| 97在线观看免费观看高清| 亚洲毛茸茸少妇高潮呻吟| 色综合视频在线| 亚洲第一福利网| 日本激情视频网站| 精品国产a毛片| 成人精品在线播放| 精品处破学生在线二十三| 成人毛片在线精品国产| 精品嫩草影院久久| 成人av手机在线| 日韩久久精品一区| 亚洲成人久久精品| 精品国产免费久久| 人人妻人人澡人人爽人人欧美一区 | 美女av免费在线观看| 黄色av一区| 波多野结衣av一区二区全免费观看| 你懂的亚洲视频| 日b视频免费观看| 在线观看视频免费一区二区三区| 欧美黄色免费网址| 伊人天天综合| 欧美日韩在线中文| 可以免费看不卡的av网站| 国产激情在线观看视频| 秋霞电影一区二区| www.com污| 国产69精品久久久久777| 亚洲国产精品第一页| 99久久精品免费看国产 | 神马久久av| 欧美一区二区视频在线| 不卡av一区二区| 亚洲第一精品区| 国内在线观看一区二区三区| 九色自拍视频在线观看| 香蕉久久国产| 在线观看高清免费视频| 国产一区二区网址| 人妻体内射精一区二区三区| 26uuu另类欧美亚洲曰本| 亚洲第一视频区| 伊人婷婷欧美激情| 欧美日韩一二三四区| 精品污污网站免费看| 国产特级黄色片| 日韩不卡在线观看| 91高清在线视频| 欧美第一淫aaasss性| av在线播放资源| 国产精品综合不卡av| 97品白浆高清久久久久久| 青青草成人网| 伊人久久大香线蕉精品组织观看| 国产一级爱c视频| 青青草97国产精品免费观看 | 亚洲最好看的视频| 黄瓜视频免费观看在线观看www| 亚洲婷婷在线| www.com黄色片| 99re这里只有精品6| 青青青视频在线免费观看| 亚洲成人tv网| 国产精品久久影视| 精品亚洲一区二区| www久久日com| 国产不卡视频在线| 91九色鹿精品国产综合久久香蕉| 午夜久久久影院| 天天综合天天做| 日韩欧美国产成人| www国产一区| 中文字幕久久久| 日韩av一卡| 91在线在线观看| 日韩精品影视| 动漫av网站免费观看| 国产激情精品久久久第一区二区| 久久精品成人av| 亚洲一区二区三区四区五区中文 | 天堂网avav| 欧美专区亚洲专区| 日本午夜在线| 欧美国产日韩一区二区在线观看| 久久亚洲精品人成综合网| 久久国产精品久久精品国产| 欧美精品97| 一级做a免费视频| 久久久久久一二三区| 国产精品成人av久久| 日韩一区二区精品在线观看| 国内在线精品| 欧美一级高清免费| 欧美1区2区3区4区| 2022中文字幕| 国产真实乱子伦精品视频| avhd101老司机| 色婷婷国产精品| 欧美伦理影视网| 1769国内精品视频在线播放| 国产伦理久久久久久妇女| 300部国产真实乱| 国产乱国产乱300精品| 一级免费黄色录像| 欧美日韩精品三区| 视频一区二区三区不卡| 国产一区私人高清影院| 日韩.com| 怡红院亚洲色图| 国产精品天干天干在线综合| 中文字幕在线一| 日韩中文字幕免费看| 国产一区影院| 中文精品一区二区三区 | 色www精品视频在线观看| 三级av在线| 国产ts一区二区| 欧美日韩伦理在线免费| 波多野结衣天堂| 国产精品欧美精品| 国产精品毛片一区视频播 | 国产精一品亚洲二区在线视频| 三级黄色录像视频| 3d动漫精品啪啪一区二区竹菊| 黄网页在线观看| 亚洲综合精品一区二区| 国内精品久久久久久久影视蜜臀 | 亚洲三级电影网站| 国产精品女同一区二区| 欧美精品性视频| 草草视频在线一区二区| 欧美三级在线观看视频| 久久久夜色精品亚洲| 中文字幕黄色av| 欧美精品日韩www.p站| 久久99国产精品久久99大师| 丰满少妇被猛烈进入高清播放| 久久久久久久免费视频了| 国产精品自拍第一页| 久久久电影免费观看完整版| 伊色综合久久之综合久久| 国产网站免费在线观看| 亚洲国产精品ⅴa在线观看| 国产精品久久影视| 97视频在线观看亚洲| 欧美精品一区二区久久| 天天色天天综合网| 偷偷要91色婷婷| 国产三级在线| 成人91免费视频| 亚洲精品护士| 国产成人精品视频免费| 欧美成人精品1314www| 亚洲同志男男gay1069网站| 亚洲美女网站18| 成人午夜免费电影| 亚洲第一区av| 午夜免费在线观看精品视频| 欧美日韩有码| 亚洲欧美日韩色| 欧美日韩久久久| 在线观看网站免费入口在线观看国内| 亚洲成人在线视频网站| 成人avav在线| 国产精品久久久久久久一区二区 | 久久久另类综合| av男人天堂av| 国产精品99蜜臀久久不卡二区|