精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

谷歌的“雙子星”,正在圍剿一眾大模型

原創 精選
人工智能
如果說o3主打的是“干實事”,那么谷歌這次的新發布則是告訴我們:什么是“成本可控”的極致性價比。這次的發布以后立馬引來一眾開發者的討論,不過這次不是負面的,而是全面的好評。

編輯 | 云昭

繼昨天凌晨OpenAI推出滿血o3、o4-mini之后,沒想到谷歌邁著“LLM王者”的步伐給出了自家的模型SOTA研究Gemini2.5 Flash。

如果說o3主打的是“干實事”,那么谷歌這次的新發布則是告訴我們:什么是“成本可控”的極致性價比。

這次的發布以后立馬引來一眾開發者的討論,不過這次不是負面的,而是全面的好評。

1.Gemini 2.5 Flash的最大賣點控制大模型的思考預算

今天剛剛推出來的谷歌的新模型,是通過Google AI StudioVertex AI以預覽版形式發布的。

從官網發布的博客來看,個人看來最大的亮點在于:可開啟或關閉思考+給大模型引入了“思考預算”的可控機制。這種機制可以讓開發人員指定在生成響應之前應分配多少計算能力用于推理復雜問題。

個人認為,這是谷歌一個非常務實的戰略性舉措,重要性不亞于昨天OpenAI發布的能干實事的o3、o4-mini。

因為采用“思考預算”這種方法非常契合解決如今AI市場的一個根本矛盾:更復雜的推理,通常以更高的延遲和更高的價格為代價,進而影響了先進模型的采用和普及。

具體到Gemini 2.5 Flash的思考預算是如何制定的?

谷歌為了給開發者提供足夠的靈活性,特別添加了“思考預算設置”,可以精細控制模型在思考時能夠生成的最大token數量。更高的預算允許模型進一步推理,從而提高質量。

圖表顯示,隨著思維預算的增加,推理質量有所提高圖表顯示,隨著思維預算的增加,推理質量有所提高

更重要的是,預算設置了 Gemini 2.5 Flash 的思考能力上限,但如果任務不需要,模型不會用盡全部預算。據了解,思考預算可以從0調整到24,576個token,作為一個最大限制而不是固定分配。根據谷歌的說法,模型會根據任務的復雜性智能地決定使用多少預算,在不需要復雜推理時節省資源。

有了這些,開發者就可以在質量、成本和延遲之間找到合適的平衡點。

2.思考與不思考:6倍價格差

價格方面,在Gemini 2.5 Flash中,每百萬個token的輸入成本為0.15美元。輸出成本則根據推理設置而存在顯著差異:關閉思考功能時每百萬token為 0.6美元,而啟用推理功能時則為每百萬token 3.5美元。

推理輸出的近六倍價格差異反映了“思考”過程的計算強度,其中模型在生成響應之前會評估多種潛在路徑和考慮因素。

Gemini 2.5 Flash 性價比對比Gemini 2.5 Flash 性價比對比

圖源:谷歌整理的每百萬token價格和性能的帕累托圖

這里值得注意的是,單純關注定價變化已經意義不大,小編認為更大的意義上在于,谷歌做了一件值得思考的動作,即,谷歌給出了一種讓公司老板或者獨立開發者們非常方便的大模型的成本考量尺度:用推理輸出的價格差異來度量“思考”過程的計算強度。

正如谷歌Gemini產品總監在采訪中所提到的:“客戶需要為模型生成的任何思考和輸出token付費。在 AI Studio UX 中,你可以在響應之前看到這些思考。在 API 中,我們目前不提供對這些思考的訪問權限,但開發人員可以查看生成的token數量。”

3.根據提示詞自動調整思考時長

當然,除了思考預算設置,Gemini 2.5 Flash 還有一項“思考時長”的感知能力。據谷歌介紹,該模型經過訓練可以知道對于給定的提示需要思考多長時間,因此可以根據感知到的任務復雜性自動決定思考多少。

也就是說,根據你所問的問題的復雜程度,自動調整推理程度,從而可以更快地回答更簡單的請求。此外,即使即使關閉“思考”,開發者也能保持 2.0 Flash 的快速運行速度,并提升性能。

谷歌將提示詞按照需要推理能力的強弱分成了三種:較少推理能力、中等推理能力、高級推理能力。具體粒度究竟如何?可以看下面幾個示例。

需要較少推理能力的提示:加拿大有多少個???(可以理解成“事實性”拷問)

需要中等推理能力的提示:你擲兩個骰子。它們加起來等于 7 的概率是多少?(高中數學題)

還有一個不錯的提示示例:

我的健身房每周一至周五上午 9 點至下午 3 點以及周二和周六下午 2 點至晚上 8 點安排籃球訓練。如果我每周工作 5 天,上午 9 點至下午 6 點,并且希望在工作日打 5 個小時籃球,請為我制定一個時間表,確保一切順利。(簡單的辦公規劃)

需要高度推理的提示:計算于梁應力、開發者常用的復雜函數編程等復雜工程問題。

編寫一個evaluate_cells(cells: Dict[str, str]) -> Dict[str, float]計算電子表格單元格值的函數。

每個單元格包含:

  • 一個數字(例如"3")
  • "=A1 + B1 * 2"或者像使用+、、和其他單元格-的公式。*/

要求:

  • 解決單元格之間的依賴關系。
  • 處理運算符優先級(*/之前+-)。
  • 檢測循環并提出ValueError("Cycle detected at <cell>")。
  • 不要使用eval()。僅使用內置庫。

4.R1、Sonnet3.7被比下去了

Gemini 2.5 Flash在關鍵基準測試中展現出極具競爭力的性能,同時保持了比其他同類產品更小的模型規模。

在一項旨在評估推理和知識的嚴格測試“人類的最后考試”中,Gemini 2.5 Flash 的得分為 12.1%,優于 Anthropic 的Claude 3.7 Sonnet(8.9%)和DeepSeek R1(8.6%),但略低于 OpenAI 近期推出的o4-mini(14.3%)。

圖片圖片

該模型在博士級水平的科學問題評估GPQA Diamond(78.3%)和AIME 數學考試(2025 年測試中為 78.0%,2024 年測試中為 88.0%)等技術基準上也取得了優異的成績。

據了解,Doshi對自己的作品信心滿滿,“企業應該選擇 2.5 Flash,因為它在成本和速度方面提供了最佳價值。同時,它在數學、多模態推理、長上下文和其他幾個關鍵指標方面都比競爭對手更加強大?!?/span>

言外之意,很簡單,谷歌的模型比同行在關鍵指標性能上更強大,而在成本上更便宜,速度上更快。沒有理由不選擇谷歌。

還有一個重要的風向變化。谷歌這次除了狠狠地命中了企業開發者在使用LLM時的成本、性能、速度的“死亡三角”的痛點,同時還在高校學生側發力了。

據悉,Gemini 2.5 Flash的發布正值谷歌AI周,今天除了發布 2.5 Flash 之外,谷歌還宣布所有美國大學生在 2026 年春季之前都可以免費使用 Gemini Advanced。

谷歌開始明目張膽地在學生側發起沖鋒,可以被視作這樣一種信號:谷歌準備一場長線的戰斗,因為這些高效學生都是未來的知識型員工,而知識型員工正是大模型市場的必爭之地。當然,學生使用一款大模型的慣性或者說忠誠度究竟如何,尚有待考證。

5.網友熱議:谷歌正在贏下LLM比賽

隨著Gemini2.5發布以來,越來越多的開發者開始重新審視LLM玩家在自己心中的地位。

“谷歌正在悄悄地贏得AI競賽”的聲音越來越多。一位網友表示:Gemini Flash系列模型的宣傳水分是最少的,以自己的生產經驗來看,谷歌提供了最好的性價比體驗和多模態工具。

圖片圖片

同樣,在知乎上,同樣也拋出了類似的問題。

圖片圖片

這條帖子下面有網友用“龜兔賽跑”來比喻現在的LLM競賽,用兔子來形容優勢明顯的谷歌:數據頂級、人才頂級、算力不愁,只不過這場LLM競賽顯然不是短跑,而是一場足以讓谷歌中途打盹醒過來快速超過對手的長途馬拉松。

圖片圖片

這位答主已經說得非常形象,這里不再贅述。

但這里想從另一種視角來聊這種現象。在兩年前甚至去年上半年時,大家對于谷歌的印象還停留在“狼狽不堪”的防守姿態上。OpenAI每次都成功截胡谷歌的新發布,而且每次新發布都伴隨著這樣或那樣的質疑的聲音。

但近四個月以來,我們會發現這種現象已經消失了。取而代之的則是一片“叫好”的口碑。

就比如這次的模型發布后,hackernews下方很多網友表示:Gemini的輸出質量和風格相較于OpenAI的o1和Anthropic的Claude都有很大的不同,印象深刻。

別的模型往往卑躬屈膝,而Gemini則表現得更像是一位“諫議大夫”,“Gemini似乎不太愿意同意我的觀點。它做出了一些小的改進,而Claude和ChatGPT則會接受最初的提議,直到被特別要求才會做出改進?!?/span>

圖片圖片

“跟Gemini 2.5 Pro對話,感覺就像是和一個知識淵博、聰明絕頂的人在辯論。”

圖片圖片

這其實很直接的就能表明:谷歌的大模型,已經在趕上甚至超越同行。注重大模型用戶的切實需求和體驗,正在讓谷歌贏得用戶的認可。

此外,值得注意的是,谷歌正在摸索自己的大模型演進路徑。而不是以往被動追趕的姿態。此次OpenAI的o3發布走的是“大模型使用工具”的風格,但谷歌似乎并不care,將自己認為正確的“細粒度的思考預算控制”功能擺到臺面上切作為最大亮點進行推出。

可以看出谷歌已經開始觸到了那根大模型產品演進的主線脈絡。

不過,或許從模型層面上看,谷歌的Gemini雖然可圈可點,但從日活數據上看,還遠遠沒有達到贏得競賽的程度。據第三方分析稱, ChatGPT每周用戶超過 8 億,而 Gemini每月用戶估計為 2.5 億至 2.75 億。

但長遠看,基礎模型的領先加上極致可控的性價比,Gemini的用戶勢必會迎來新一波的暴漲。

正如下面這位轉向使用Gemini的網友所說:我同意Claude非常好,但我從未覺得它在實際工作中很舒服,3.7中有很多過度設計而半生不熟的解決方案,而這使得自己付出API的費用物失所值。

圖片圖片

可以想象在一年后的某天,幾個開發者調侃某個大模型產品或功能:“不是XX我買不起,而是XX家的更有性價比!”

到那時候,大模型的生態才算是塵埃落定了。

參考鏈接:

https://developers.googleblog.com/en/start-building-with-gemini-25-flash/

https://news.ycombinator.com/item?id=43720845


責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2020-07-30 09:00:00

華為

2011-06-13 12:52:14

愛普生掃描儀

2025-02-05 08:11:39

2016-09-23 11:46:00

網絡硬件

2010-05-18 11:20:24

華碩服務器主板

2025-04-15 19:29:34

2010-07-29 13:30:54

Hibari

2024-01-08 09:11:24

編程語言歐洲

2023-07-05 14:53:49

模型黑馬項目Github

2017-09-19 14:21:37

AI

2025-08-12 04:00:00

2024-04-10 12:42:51

AI模型

2015-10-23 10:09:15

寶德多子星服務器

2019-04-18 16:10:35

ZStack Mini超融合混合云

2023-05-05 13:29:04

模型推理

2024-11-21 13:53:09

微軟AI技術

2022-11-01 13:52:44

AI數學

2020-06-02 15:29:56

Android 11谷歌安卓
點贊
收藏

51CTO技術棧公眾號

在线看片中文字幕| 久久国产这里只有精品| 免费观看a视频| 亚洲永久网站| 中文字幕亚洲欧美日韩在线不卡 | av中文在线资源| 久久综合久久综合亚洲| 成人免费福利视频| 国产福利拍拍拍| 久久五月天小说| 亚洲激情视频在线观看| 天天干天天干天天干天天干天天干| caopo在线| 国产亚洲精品aa午夜观看| 91老司机在线| 久久久黄色大片| 欧美一区激情| 深夜福利日韩在线看| 五十路六十路七十路熟婆| 国产成人精品一区二区三区视频| 亚洲电影第三页| 亚洲一区二区三区色| 天堂av一区二区三区| 国产资源精品在线观看| 国产成人av网| 国产性猛交╳xxx乱大交| 这里只有精品在线| 深夜福利一区二区| 国产 欧美 在线| 伦理一区二区| 欧美成人高清电影在线| 亚洲最大天堂网| 美女网站视频一区| 日韩欧美在线字幕| 波多野结衣与黑人| 国产二区三区在线| 国产精品久久久久久亚洲毛片 | 国产精品 欧美在线| 国产精品第一页在线观看| 一本一道久久a久久精品蜜桃| 亚洲网站在线播放| theav精尽人亡av| 久久97久久97精品免视看秋霞| 欧美一区二区三区视频在线| 天堂av8在线| 国产精品成人国产| 欧美系列在线观看| 久久婷婷国产91天堂综合精品| 欧美13videosex性极品| 亚瑟在线精品视频| 精品久久久久久无码中文野结衣| 人人超在线公开视频| 亚洲精品老司机| 国内精品国产三级国产99| 麻豆视频在线| 亚洲精选视频在线| 777久久精品一区二区三区无码 | 无码人妻久久一区二区三区蜜桃| 久久久久久爱| 欧美一级午夜免费电影| japan高清日本乱xxxxx| 综合激情网...| 精品国产免费视频| xxxx黄色片| 真实原创一区二区影院| 尤物九九久久国产精品的特点 | 一区二区三区精品久久久| 337p亚洲精品色噜噜狠狠p| 日本三级韩国三级欧美三级| 亚洲自拍另类综合| 成人在线免费观看av| 美女18一级毛片一品久道久久综合| 婷婷久久综合九色综合伊人色| 欧美日韩黄色一级片| 精品3atv在线视频| 欧美日韩成人综合天天影院 | 久久亚洲一级片| 五码日韩精品一区二区三区视频| 91免费在线| 亚洲精品菠萝久久久久久久| 大陆极品少妇内射aaaaa| 日韩精品99| 91精品国产色综合久久不卡电影 | 性欧美长视频免费观看不卡| 日本黄色一级视频| 精品一区二区在线免费观看| 国产成人精品日本亚洲11| 婷婷国产在线| 成人欧美一区二区三区小说| 你真棒插曲来救救我在线观看| 午夜影院在线观看国产主播| 欧美日韩国产综合一区二区三区| 三上悠亚 电影| 你懂的视频欧美| 久久亚洲国产成人| 天堂网中文字幕| 国产一区欧美一区| 美女被啪啪一区二区| 欧美激情视频在线播放| 黄色精品一区二区| 波多野结衣国产精品| 欧美顶级毛片在线播放| xxav国产精品美女主播| 日本一区二区三区精品| 国产一区福利在线| 日本一区二区久久精品| 影音先锋男人资源在线| 91国偷自产一区二区使用方法| 成人三级做爰av| 欧美精选一区二区三区| 久久久亚洲国产| 97在线视频人妻无码| 91蜜桃免费观看视频| www.国产亚洲| 日韩av懂色| 国产丝袜一区二区三区| 欧美丰满艳妇bbwbbw| 蜜乳av一区二区| 久久视频在线观看中文字幕| 色噜噜狠狠狠综合欧洲色8| 欧美在线一二三四区| 国产真实乱人偷精品| 亚洲精品一区二区在线看| 国产精品久久久久秋霞鲁丝| 亚洲欧美综合一区二区| 亚洲成a人v欧美综合天堂下载| 国产成人美女视频| 成人在线免费观看网站| 日本视频久久久| 外国精品视频在线观看| 精品国产成人av| 小毛片在线观看| 一区久久精品| 国产一区二区高清不卡| 后进极品白嫩翘臀在线播放| 欧美一级欧美三级在线观看| 久久福利免费视频| 久久99精品国产麻豆婷婷| 无遮挡亚洲一区| 国产香蕉久久| 色偷偷噜噜噜亚洲男人| 影音先锋黄色网址| 欧美韩国日本综合| 牛夜精品久久久久久久| 日韩电影一区| 国产精品爽爽ⅴa在线观看| 东凛在线观看| 欧美裸体bbwbbwbbw| 中国美女黄色一级片| 美女视频一区二区三区| 一区二区精品在线| 伊人久久综合网另类网站| 色偷偷偷亚洲综合网另类| 97在线公开视频| 一区二区在线免费观看| 中文字幕在线播放一区二区| 欧美区一区二| 久久99精品久久久久久久久久| 三妻四妾完整版在线观看电视剧 | 精品日产一区2区三区黄免费 | 91免费看国产| 在线看福利影| 日韩精品小视频| 无码免费一区二区三区| 国产欧美视频一区二区三区| 天天插天天操天天射| 91日韩在线| 91pron在线| 嗯啊主人调教在线播放视频| 亚洲精品色婷婷福利天堂| 自拍偷拍18p| 18欧美亚洲精品| 韩国三级在线看| 美女被久久久| 在线免费观看成人| 一区二区视频| 日韩av第一页| av免费在线观看网址| 日韩电影免费在线观看中文字幕| 久久永久免费视频| 亚洲男人天堂一区| 粗大的内捧猛烈进出视频| 亚洲欧美日韩综合国产aⅴ| 亚洲图片小说在线| 天堂精品在线视频| 欧美一区在线直播| 国产黄色在线免费观看| 亚洲国产精品字幕| 中文字幕 国产| 亚洲一区二区三区影院| 91网站免费入口| 国产激情一区二区三区| 青青在线视频免费| 欧美日韩爆操| 亚洲午夜精品福利| 老司机精品视频在线播放| 国产精品自产拍高潮在线观看| 欧美aaaxxxx做受视频| 亚洲最新av在线| 亚洲乱码国产乱码精品精软件| 色拍拍在线精品视频8848| 免费在线一级片| 亚洲国产成人私人影院tom| 污网站免费观看| 久久精品久久久精品美女| 日日橹狠狠爱欧美超碰| 欧美精品导航| 亚洲一区综合| 日韩三区视频| 高清免费日韩| 电影中文字幕一区二区| 国产91久久婷婷一区二区| 久操av在线| 久久久www成人免费精品张筱雨| 日韩av成人| 337p日本欧洲亚洲大胆精品| 国产精品视频一二区| 欧美自拍丝袜亚洲| 欧美一级特黄视频| 午夜视频一区在线观看| 综合五月激情网| 国产精品久久久久婷婷二区次| 国产aⅴ激情无码久久久无码| 丁香婷婷综合五月| 日本女人黄色片| 紧缚捆绑精品一区二区| 国产精品视频分类| 久久综合网络一区二区| 国产一区二区在线视频播放| 欧美日韩综合| 日韩精品综合在线| 国产精品99一区二区| 久久国产精品免费观看| 国产精品久久久久久久| 亚洲欧洲精品一区二区三区波多野1战4 | 欧美亚洲自拍偷拍| 国产一卡二卡三卡| 色久优优欧美色久优优| 精品人妻一区二区三区潮喷在线| 欧美日韩人人澡狠狠躁视频| 日韩欧美不卡视频| 精品久久久久久久久久| 中文字幕一区二区三区精品| 亚洲一区二区免费视频| 国产在线观看成人| 亚洲国产精品人人做人人爽| 亚洲精品在线观看av| 亚洲国产一区在线观看| 国产91av视频| 精品久久久中文| 日本中文在线播放| 欧美性xxxxxx| av首页在线观看| 欧美日本视频在线| 国产精品久久免费| 日韩亚洲欧美高清| 欧美视频一二区| 精品视频在线播放色网色视频| 亚洲色欧美另类| 亚洲男人的天堂在线| av免费观看一区二区| 色偷偷综合社区| 国产精品一卡二卡三卡| 欧美大片在线影院| 黄色激情在线播放| 国产成人91久久精品| 亚洲成人1区| 99久久久久国产精品免费| 好吊妞国产欧美日韩免费观看网站| 久久波多野结衣| 日韩在线看片| 国产精品视频二| 日韩精品一二三四| 少妇愉情理伦片bd| 91丨九色丨尤物| 免费成人深夜蜜桃视频| 亚洲精品你懂的| 久久综合亚洲色hezyo国产| 欧美丝袜第一区| 一卡二卡在线观看| 欧美tk—视频vk| 免费看男男www网站入口在线| 深夜精品寂寞黄网站在线观看| 欧美午夜大胆人体| 国产福利成人在线| 亚洲五码在线| 深田咏美在线x99av| 欧美精选一区| 亚洲精品高清无码视频| 国产精品69毛片高清亚洲| 亚洲国产av一区| 亚洲精品视频在线看| 中文字幕精品无| 亚洲成人久久久久| 丝袜美腿美女被狂躁在线观看| 欧美激情一区二区三区久久久| 最新日韩一区| 国产一级精品aaaaa看| 欧美激情成人| 免费黄色福利视频| 国产精品自拍一区| 国产伦精品一区二区三区视频女| 亚洲成人精品影院| 国产精品久久久久久久久久久久久久久久| 亚洲国产成人精品女人久久久 | 欧美69视频| 天天影视综合色| 99久久精品国产导航| 久久久久久久久毛片| 欧美色大人视频| 日韩三级电影网| 欧美另类xxx| 韩国精品视频在线观看| 久久大片网站| 国产综合网站| 天堂网成人在线| 国产精品久久久久天堂| 波多野结衣一本一道| 日韩av一卡二卡| 成人在线免费观看黄色| 91福利视频导航| 青青草成人免费| 日韩av免费| 亚洲在线免费看| 清纯唯美亚洲综合一区| 日本少妇高潮喷水视频| 国产91精品露脸国语对白| 在线免费看av网站| 欧美日韩精品系列| a天堂中文在线88| 国产ts人妖一区二区三区| 欧美一级一片| 国产在线精品91| 国产精品无码一区二区桃花视频| 欧美在线观看一区| 久热av在线| 青青在线视频一区二区三区| 精品一区二区男人吃奶| 免费网站在线观看视频| 国产成人久久精品77777最新版本| 欧美精品久久久久久久久46p| 欧美日本免费一区二区三区| 欧美私人网站| 成人网欧美在线视频| 国产精品毛片久久| 午夜大片在线观看| 亚洲精品国产品国语在线app| a视频免费在线观看| 久久综合久久八八| 伊人精品综合| 男女啪啪免费视频网站| 99国产精品视频免费观看| 日韩aaaaaa| 亚洲男人天堂视频| av有声小说一区二区三区| 色狠狠久久av五月综合| 久久精品国产免费看久久精品| 中国美女黄色一级片| 欧美一级国产精品| 免费电影视频在线看| 国产中文一区二区| 男人的天堂亚洲在线| av永久免费观看| 91精品国产欧美一区二区18| 免费在线观看av电影| 国产一区不卡在线观看| 日韩成人精品视频| 国产尤物在线播放| 精品日韩av一区二区| 在线免费av资源| 亚洲mv在线看| 国产福利一区在线| 一区二区三区视频免费看| 亚洲天堂免费观看| 国产精品亚洲综合在线观看| 免费看国产一级片| 亚洲国产成人私人影院tom| 99在线观看免费| 538国产精品视频一区二区| 日韩精品诱惑一区?区三区| 91香蕉视频在线观看视频| 亚洲v日本v欧美v久久精品| 国产一区二区影视| 亚洲精品日韩激情在线电影| 中文久久精品| 三级全黄做爰视频| 欧美成人在线直播| 电影久久久久久| 日本久久久网站| 国产夜色精品一区二区av| www.蜜臀av| 国产精品久久久久9999| 国内精品美女在线观看| 我想看黄色大片| 亚洲成人久久久久| 永久免费观看精品视频| 日本韩国欧美在线观看| 综合久久综合久久| 欧美91精品久久久久国产性生爱| 亚洲精品免费一区二区三区|