精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

首個(gè)混合推理模型Claude 3.7發(fā)布!編程能力全面領(lǐng)先,還能精準(zhǔn)控制思考時(shí)間

人工智能
GPQA是一組常用的具有挑戰(zhàn)性的生物、化學(xué)和物理問(wèn)題。 Claude 3.7 Sonnet 使用 256 個(gè)獨(dú)立樣本的等效計(jì)算、學(xué)習(xí)的評(píng)分模型和最大64 token的思維成本之下,取得了 84.8% 的 GPQA 分?jǐn)?shù)(包括 96.5% 的物理子分?jǐn)?shù))。

Claude深夜重磅發(fā)布新模型——

Claude 3.7 Sonnet,首個(gè)混合推理模型問(wèn)世,在編碼和前端Web開(kāi)發(fā)方面顯著提升,實(shí)現(xiàn)了全面領(lǐng)先。

圖片圖片

與o3-mini實(shí)際對(duì)比,相同的提示詞下,Claude 3.7 Sonnet的表現(xiàn)。

o3-mini:

Claude 3.7 Sonnet:

(提示詞:編寫一個(gè) p5.js 腳本,模擬 100 個(gè)彩球在球體內(nèi)彈跳。每個(gè)球都應(yīng)留下一條逐漸消失的軌跡,顯示其最近的運(yùn)動(dòng)軌跡。容器球體應(yīng)緩慢旋轉(zhuǎn)。確保實(shí)現(xiàn)適當(dāng)?shù)呐鲎矙z測(cè),使球保持在球體內(nèi)。)

還有用它來(lái)做視頻游戲。

作為混合推理模型,它有兩種思考模式:

近乎實(shí)時(shí)地反應(yīng)&擴(kuò)展地、循序漸進(jìn)(step-by-step)地思考。

擴(kuò)展思維模式下,它在數(shù)學(xué)、物理、指令遵循、編碼等多個(gè)任務(wù)中有額外的提升。

圖片圖片

API用戶甚至還可以精準(zhǔn)控制模型的思考時(shí)間。目前已經(jīng)在全平臺(tái)上線,包括亞馬遜云服務(wù)Bedrock平臺(tái)、谷歌云,而要想要擴(kuò)展思考模式,除免費(fèi)版外其他都可以用。

圖片圖片

模型升級(jí),價(jià)格不變——

與前代產(chǎn)品相同,每百萬(wàn)輸入token 3 美元,每百萬(wàn)輸出token 15 美元(其中包括思考代幣)。

除此之外,他們還發(fā)布了他們首個(gè)編碼工具Claude Code

它能夠一次性完成原本需要45分鐘以上手動(dòng)才能完成的工作。

圖片圖片

網(wǎng)友們紛紛表示,已經(jīng)迫不及待地想用上了。

圖片圖片

不過(guò),為什么是3.7版本呢?

圖片圖片

Claude 3.7 Sonnet:首個(gè)混合推理模型

官方此次首先表示,他們開(kāi)發(fā)Claude 3.7 Sonnet這個(gè)的理念與市場(chǎng)上其他推理模型不同。

類比于人類大腦有快速反應(yīng)和深度思考兩種一樣,他們認(rèn)為推理應(yīng)該是前沿模型的綜合能力,而不是完全獨(dú)立的模型。

由此,Claude 3.7 Sonnet在多個(gè)方面都有體現(xiàn)這個(gè)理念。

首先,Claude 3.7 Sonnet 既是普通的 LLM 模型,又是推理模型:

您可以選擇何時(shí)讓模型正常回答,何時(shí)讓模型在回答前思考更長(zhǎng)時(shí)間。

在標(biāo)準(zhǔn)模式下,Claude 3.7 Sonnet 是 Claude 3.5 Sonnet 的升級(jí)版。在擴(kuò)展思維模式下,它會(huì)在回答前進(jìn)行自我反思,從而提高其在數(shù)學(xué)、物理、遵循指令、編碼和許多其他任務(wù)上的表現(xiàn)。

圖片圖片

在兩種模式下,對(duì)模型的提示方式類似。

這是代碼生成任務(wù)下,兩種思維模式回答之間的區(qū)別。

圖片圖片

其次,控制思考預(yù)算,用速度和成本來(lái)?yè)Q取答案的質(zhì)量。

API用戶可以告訴Claude思考的數(shù)量不超過(guò) N 個(gè)token,N 的值可以是任何值,但輸出上限不能超過(guò) 128K個(gè)token。

模型能力的表現(xiàn),也就取決于允許思考的token數(shù)量。例如以下在AIME 2024的成績(jī)圖。

圖片圖片

第三,優(yōu)化重點(diǎn)轉(zhuǎn)向更能反映用戶需求的現(xiàn)實(shí)世界任務(wù),對(duì)數(shù)學(xué)和計(jì)算機(jī)競(jìng)賽問(wèn)題優(yōu)化較少。

圖片圖片

△解決實(shí)際的概率問(wèn)題

編碼任務(wù),網(wǎng)友們對(duì)它這種「vibe coding」(面對(duì)非開(kāi)發(fā)人員的AI輔助編碼)印象深刻。

有網(wǎng)友實(shí)測(cè)發(fā)現(xiàn),確實(shí)能解決其他模型無(wú)法解決的問(wèn)題。>你能用 p5js 編寫最復(fù)雜的布料模擬嗎?

結(jié)果Grok 3 和o1 pro沒(méi)有可用的結(jié)果。而Claude 3.7 Sonnet的表現(xiàn)是:

在代理工具使用上面,實(shí)現(xiàn)了SOTA。

圖片圖片

Claude 3.7 Sonnet 在指令遵循、一般推理、多模態(tài)能力和代理編碼方面表現(xiàn)出色,擴(kuò)展思維在數(shù)學(xué)和科學(xué)方面提供了顯著的提升。

圖片圖片

除了傳統(tǒng)的基準(zhǔn)測(cè)試之外,它甚至在寶可夢(mèng)游戲測(cè)試中超越了所有以前的模型——

團(tuán)隊(duì)為Claude配備了基本內(nèi)存、屏幕像素輸入以及按鍵和屏幕導(dǎo)航的功能調(diào)用,使其能夠超越通常的上下文限制,持續(xù)玩游戲,并通過(guò)數(shù)以萬(wàn)計(jì)的交互進(jìn)行游戲。

最終實(shí)驗(yàn)表明,它是迄今所有Sonnet模型中表現(xiàn)最好的,它成功與三個(gè)寶可夢(mèng)道館館主(游戲的 Boss)戰(zhàn)斗并贏得他們的徽章。相比之下,Claude 3.0 Sonnet 甚至無(wú)法離開(kāi)故事開(kāi)始的地方Pallet Town 的房子。

x 軸表示 Claude 在玩游戲時(shí)完成的互動(dòng)次數(shù);y 軸表示游戲中的重要里程碑,包括收集某些物品、導(dǎo)航到某些區(qū)域以及擊敗某些Boss。

圖片圖片

此次,研究人員使用了并行測(cè)試時(shí)間計(jì)算來(lái)提高模型的性能。

他們的方法是對(duì)多個(gè)獨(dú)立思考過(guò)程進(jìn)行采樣,并在事先不知道真實(shí)答案的情況下選出最佳答案。其中一種方法是使用多數(shù)投票;選擇最常見(jiàn)的答案作為 “最佳 ”答案。另一種方法是使用另一個(gè)語(yǔ)言模型(比如Claude的第二個(gè)副本),要求它檢查自己的工作或?qū)W習(xí)的評(píng)分函數(shù),然后選出它認(rèn)為最好的答案。

結(jié)果在GPQA評(píng)估中,這一方法讓模型取得了驚人的改進(jìn)。

GPQA是一組常用的具有挑戰(zhàn)性的生物、化學(xué)和物理問(wèn)題。 Claude 3.7 Sonnet 使用 256 個(gè)獨(dú)立樣本的等效計(jì)算、學(xué)習(xí)的評(píng)分模型和最大64 token的思維成本之下,取得了 84.8% 的 GPQA 分?jǐn)?shù)(包括 96.5% 的物理子分?jǐn)?shù))

圖片圖片

此外,Claude 3.7 Sonnet 還對(duì)有害請(qǐng)求和良性請(qǐng)求進(jìn)行了更細(xì)致的區(qū)分,與前代版本相比,不必要的拒絕次數(shù)減少了 45% 。

圖片圖片

Claude首個(gè)編碼工具面世

Claude Code,從官方透露的功能看,它可以搜索和讀取代碼、編輯文件、編寫和運(yùn)行測(cè)試、提交和推送代碼到 GitHub以及使用命令行工具。

圖片圖片

目前還只是早期的預(yù)覽版,可直接在終端運(yùn)行。

圖片圖片

早期測(cè)試中,Claude Code可以一次性完成了通常需要 45 分鐘以上手動(dòng)操作才能完成的任務(wù),從而減少了開(kāi)發(fā)時(shí)間和開(kāi)銷。

在接下來(lái)的幾周內(nèi),他們計(jì)劃結(jié)合他們使用情況不斷改進(jìn)它——

比如增強(qiáng)工具調(diào)用的可靠性,增加對(duì)長(zhǎng)時(shí)間運(yùn)行的命令的支持,改進(jìn)應(yīng)用內(nèi)渲染,并擴(kuò)展 Claude 對(duì)其功能的理解。

除此之外,他們還改進(jìn)了 Claude.ai 上的編碼體驗(yàn)。GitHub 集成現(xiàn)已在所有Claude使用平臺(tái)中提供,開(kāi)發(fā)人員可以將其代碼存儲(chǔ)庫(kù)直接連接到 Claude。

參考鏈接:
[1]https://www.anthropic.com/news/claude-3-7-sonnet
[2]https://www.anthropic.com/research/visible-extended-thinking
[3]https://docs.anthropic.com/en/docs/build-with-claude/extended-thinking
[4]https://docs.anthropic.com/en/docs/agents-and-tools/claude-code/overview
[5]https://x.com/deedydas/status/1894110678027571412
[6]https://x.com/_akhaliq/status/1894106278185898489

責(zé)任編輯:武曉燕 來(lái)源: 量子位
相關(guān)推薦

2025-02-25 09:13:16

2025-02-25 09:02:26

2025-04-18 10:36:42

2025-02-25 11:59:44

2025-05-29 03:00:00

混合推理模型LHRMAI

2025-11-13 08:00:00

大推理模型AI人工智能

2025-02-26 09:24:03

2025-03-12 12:07:07

2025-05-28 02:40:00

AdaptThink推理模型AI

2025-02-25 10:08:38

2025-02-26 10:10:12

2012-03-16 10:02:28

ZK StudioJavaEclipse

2025-06-08 14:15:42

2025-09-15 09:43:33

分層推理模型循環(huán)網(wǎng)絡(luò)推理

2025-02-14 11:18:57

2025-04-30 02:00:00

2025-04-18 10:43:23

2025-05-12 08:20:13

2025-06-11 14:39:50

AILLMMistral

2025-02-25 09:43:19

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

日本一本在线视频| www国产无套内射com| www.com亚洲| 久久一级电影| 精品少妇一区二区三区在线播放| 欧美日本视频在线观看| 国产一二三在线观看| 久久av中文字幕片| 国内精品一区二区三区四区| 国产免费无遮挡吸奶头视频| av国产精品| 亚洲在线视频网站| 亚洲高清视频在线观看| 成人爽a毛片一区二区| 视频一区二区三区在线| 久久成人在线视频| 无码h肉动漫在线观看| 99久久久国产| 色先锋资源久久综合| 欧美做受777cos| 国产精品视频二区三区| 高清shemale亚洲人妖| 国产精品视频精品视频| 久久久久久久久久久久久久av| 日韩av在线中文字幕| 亚洲精品美女网站| 欧美性猛交xx| 福利一区二区免费视频| 精品久久久久久国产91| 亚洲激情免费视频| 免费网站看v片在线a| 久久精品视频免费| 国产欧美日韩综合一区在线观看| 国产又黄又粗又长| 日本在线不卡一区| 欧美精品videosex极品1| 成年人网站在线观看视频| 香蕉人人精品| 亚洲黄色av女优在线观看| 久久aaaa片一区二区| 成人综合网站| 91国偷自产一区二区三区观看| 国产人妻人伦精品| 二区三区在线观看| 亚洲天堂av一区| 亚洲精品中字| jizz在线免费观看| 国产视频一区二区在线观看| 狠狠干一区二区| 免费a视频在线观看| 粉嫩av亚洲一区二区图片| 91亚洲精品一区二区| 中文字幕第99页| 男女性色大片免费观看一区二区| 国产91色在线|免| 九九九在线观看| 国产一区二区精品| 亲爱的老师9免费观看全集电视剧| 久久一级黄色片| 国产综合色产| 97精品久久久中文字幕免费| 日韩免费观看一区二区| 亚洲先锋成人| 97人人模人人爽人人喊中文字| 国产无遮挡又黄又爽在线观看| 亚洲福利电影| 91精品国产高清久久久久久| 国产精品老女人| 久久青草久久| 国产免费亚洲高清| 国产视频手机在线观看| 国产成人综合视频| 国产专区一区二区三区| 青春草在线观看 | 俄罗斯女人裸体性做爰| 一区三区自拍| 亚洲男人第一网站| 极品久久久久久久| 在线国产一区二区| 国模视频一区二区三区| 精品国产xxx| 免费高清不卡av| 亚洲自拍中文字幕| 婷婷在线免费视频| 国产午夜精品一区二区三区视频| 日韩免费毛片| 污视频网站在线免费| 欧美日韩在线视频观看| 久久这里只精品| 97久久超碰| 伊人av综合网| 国产一级久久久| 日韩av成人高清| 3d精品h动漫啪啪一区二区| 熟妇人妻中文av无码| 欧美国产精品专区| 成人午夜免费在线| 粉嫩91精品久久久久久久99蜜桃| 精品久久国产字幕高潮| 欧美性猛交xxxx乱| 国一区二区在线观看| 日本久久精品视频| 国产aⅴ一区二区三区| 久久香蕉国产线看观看99| 中文字幕在线亚洲精品 | 日本一区二区三区四区视频| 国产精品毛片一区二区在线看舒淇| 成人一区二区三区在线观看| 亚洲蜜桃在线| 毛片在线网站| 日韩视频一区二区| 自拍偷拍你懂的| 99在线观看免费视频精品观看| 国产精品综合网站| 三区在线观看| 亚洲宅男天堂在线观看无病毒| 五月天av在线播放| 亚洲精品无吗| 高清欧美性猛交xxxx| 亚洲中文字幕在线一区| 91视频你懂的| 人妻少妇精品久久| 三级欧美日韩| 久久激情视频免费观看| 超碰在线免费97| 91视视频在线观看入口直接观看www | 97婷婷涩涩精品一区| 精品久久久久久亚洲综合网站| 国产日产亚洲精品系列| 女人喷潮完整视频| 国产精品jk白丝蜜臀av小说| 久久亚洲精品小早川怜子66| jizz国产在线| 久久久蜜臀国产一区二区| 国产精品12345| 98视频精品全部国产| 久久99国产综合精品女同| 一级特黄aaa| 国产精品国产三级国产aⅴ中文| 777米奇影视第四色| 台湾佬综合网| 欧美亚洲另类在线| 天堂成人在线观看| 亚洲电影在线播放| 免费黄色av网址| 欧美午夜影院| 国产精品国产精品| 国产羞羞视频在线播放| 欧美xxxxxxxx| 久久精品免费av| 成av人片一区二区| 熟女少妇在线视频播放| 日韩精品导航| 日韩美女激情视频| www在线免费观看| 欧美网站一区二区| 国产精品suv一区二区88| 精品一区二区三区av| 亚洲综合激情五月| 天堂精品久久久久| 欧美精品videosex牲欧美| 天天干天天爽天天操| 欧美日韩中文字幕| jizz中文字幕| 国产在线观看免费一区| 男女啪啪免费观看| 国产一区二区三区不卡av| 91福利视频网| 97在线观看免费观看高清| 欧美日韩免费在线视频| 麻豆视频在线免费看| 成人免费观看男女羞羞视频| 久久久久久久久久久99| 欧美系列电影免费观看| 成人在线观看视频网站| www.8ⅹ8ⅹ羞羞漫画在线看| 亚洲免费电影在线观看| 国产一区二区波多野结衣| 一区二区在线观看视频在线观看| 国产a级黄色片| 日韩精品欧美精品| 欧美交换配乱吟粗大25p| 偷拍精品福利视频导航| 国产日韩欧美夫妻视频在线观看| 在线黄色网页| 亚洲精品一区中文字幕乱码| 一区二区美女视频| 亚洲18女电影在线观看| gv天堂gv无码男同在线观看| 国产精品亚洲午夜一区二区三区| 国产精品无码人妻一区二区在线| 韩日一区二区三区| 成人av男人的天堂| 日韩一区精品| 国内精品久久久久久影视8| 国产视频三级在线观看播放| 日韩欧美电影在线| 久久人人爽人人爽人人片av免费| 亚洲精品欧美激情| 野外性满足hd| 国产精品99久久不卡二区| 国产成人精品视频ⅴa片软件竹菊| 91精品婷婷色在线观看| 久久国产精品 国产精品| 羞羞视频在线观看一区二区| 57pao国产成人免费| 成人日批视频| 自拍偷拍亚洲区| 欧美自拍第一页| 欧美日韩不卡视频| 免费看污视频的网站| 亚洲小说欧美激情另类| 国精产品久拍自产在线网站| 91蜜桃在线免费视频| 性鲍视频在线观看| 麻豆91在线观看| 欧美黄色免费影院| 好看的av在线不卡观看| 中文字幕一区二区三区乱码 | 成人h版在线观看| 国产成年人视频网站| 久久久久中文| 每日在线更新av| 亚洲国产黄色| 欧美极品少妇无套实战| 9999国产精品| 天堂精品视频| 欧美人妖在线| 六十路精品视频| 精品国产一区二区三区成人影院| 91麻豆精品秘密入口| 91精品一区| 国产精品自产拍在线观看中文| 中文字幕av一区二区三区佐山爱| 久久人人看视频| 超免费在线视频| 欧美黑人巨大xxx极品| 日本一本在线免费福利| 久久亚洲影音av资源网| 超碰在线caoporn| 日韩亚洲精品电影| 免费观看久久久久| 久久精品男人天堂| 精品视频在线一区二区| 久久精品欧美视频| 国产区在线观看| 久久av在线看| 日本无删减在线| 欧美国产乱视频| av免费在线视| 91成人福利在线| 亚洲人免费短视频| 国产精品日韩在线播放| 日韩成人在线电影| 亚洲一区二区三区四区在线播放 | 亚洲v国产v在线观看| 成人aaaa| 黄色a级在线观看| 欧美国产三区| 成人毛片一区二区| 久久亚洲色图| 亚洲欧美国产中文| 国产又黄又大久久| 久久久久无码国产精品一区李宗瑞 | 性欧美丰满熟妇xxxx性久久久| 成人激情午夜影院| 香蕉视频黄色在线观看| 欧美国产综合一区二区| 午夜成人亚洲理伦片在线观看| 亚洲欧美韩国综合色| 国产无遮挡aaa片爽爽| 色综合久久久久网| 在线观看中文字幕2021| 欧美一区二区三区四区高清| 噜噜噜久久,亚洲精品国产品| 精品亚洲一区二区三区| 在线免费观看黄色网址| 久久99热精品这里久久精品| 一区二区三区短视频| 国产精品欧美激情| 91午夜精品| 日本一区二区三区www| 2023国产精品久久久精品双| 福利视频免费在线观看| 首页欧美精品中文字幕| 亚洲午夜精品在线观看| 久久综合狠狠综合久久激情| 亚洲aaa视频| 亚洲电影激情视频网站| 中文在线免费看视频| 日韩欧美国产午夜精品| 日本人妖在线| 美乳少妇欧美精品| 国精产品一区一区三区四川| 97se亚洲综合| 欧美日韩性在线观看| 丰满的少妇愉情hd高清果冻传媒| 日韩精品一级二级 | 97久久精品视频| 午夜精品久久久久久毛片| 国产自产精品| 亚洲精品久久久| 久久久久国产精品熟女影院| 国产精品99久久久久久久vr| 黄免费在线观看| 精品国产1区2区| 国产日韩精品suv| 国产亚洲精品va在线观看| 大香伊人久久| 亚洲最大福利网| 91亚洲一区| 欧美日韩在线免费播放| 不卡欧美aaaaa| 国产又黄又爽又无遮挡| 欧美色男人天堂| 色视频在线看| 97国产精品免费视频| 日韩精品中文字幕吗一区二区| 日韩av电影免费在线| 99在线观看免费视频精品观看| 在线观看视频你懂得| 国产精品久久久久三级| 日韩精品一区二区亚洲av| 亚洲国产成人av在线| 怡红院在线播放| 成人免费黄色网| 91蜜臀精品国产自偷在线| 国产男女激情视频| 91视频在线观看免费| 日本一二三区视频| 亚洲成av人片在线观看香蕉| av免费在线免费| 91精品视频在线播放| 欧美国产一级| 小泽玛利亚视频在线观看| 国产亲近乱来精品视频| 不卡av电影在线| 亚洲欧美一区二区三区久久| 日韩激情电影| 欧美成人第一区| 日韩精品每日更新| 永久免费av无码网站性色av| 欧美视频三区在线播放| 国产福利小视频在线观看| 日韩av高清不卡| 精品国产91乱码一区二区三区四区 | a级毛片免费观看在线| 91欧美精品午夜性色福利在线| 日韩黄色大片网站| 亚洲a级黄色片| 亚洲欧美日韩在线不卡| 国产黄a三级三级三级| 欧美精品做受xxx性少妇| 日韩影片在线观看| 日韩网站在线免费观看| av电影在线观看完整版一区二区| 日韩精品久久久久久久酒店| 亚洲精选中文字幕| 九九九伊在线综合永久| 亚洲欧美在线网| 国产一区二区在线免费观看| 黄页网站免费观看| 亚洲国内精品在线| 日韩精品影片| 国产大尺度在线观看| 成人久久18免费网站麻豆| 西西44rtwww国产精品| 一区二区亚洲欧洲国产日韩| 日韩专区视频网站| 激情视频小说图片| 99视频有精品| 中文字幕第315页| 欧美人成在线视频| 日韩精品福利一区二区三区| 九色91popny| 一区二区三区四区激情| 欧美高清电影在线| 成人国产精品一区| 伊人久久大香线蕉av超碰演员| 国产精品揄拍100视频| 欧美日韩精品一区二区天天拍小说| 中文字幕资源网在线观看| 国产日韩欧美一区二区| 视频在线观看一区二区三区| 日韩欧美123区| 国产视频久久网| 久久天堂久久| 爱情岛论坛vip永久入口| 亚洲免费电影在线| 日本不卡免费播放| 亚洲xxxx做受欧美| 日韩电影在线观看网站| 久久久久无码国产精品| 亚洲一区二区国产| 波多野结衣欧美| 不卡的av中文字幕| 欧美日韩人人澡狠狠躁视频| 超碰免费公开在线| 日本黑人久久| k8久久久一区二区三区 |