精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

「中杯」Claude 3.5突然上線,竟比GPT-4o還強!全新Artifacts改寫模型交互

人工智能 新聞
Anthropic曾許下要超越OpenAI的發家愿望,沒想到竟然這么快就實現了。他們剛剛發布的Claude 3.5 Sonnet模型不僅成本更低、速度更快,而且在基準測試上的表現「彎道超車」GPT-4o。

繼今年3月發布Claude 3之后,Anthropic在半年時間里又上新了!

就在今天,Claude 3.5 Sonnet發布,作為即將推出的Claude 3.5模型家族的「排頭兵」,而且已經面向全球開啟免費試用。

圖片

具體來說, Claude 3.5 Sonnet支持200K token的上下文窗口,而在多項評測中超過了OpenAI最強的GPT-4o,以及自家的Claude 3 Opus。

與此同時,Claude 3.5 Sonnet還保持著中等規模的模型所具有的速度和成本優勢。

圖片

其中,在費用方面,Claude 3.5 Sonnet處理每百萬輸入token僅需3美元,每百萬輸出token則為15美元。(與前代相同)

圖片

用戶可以在Claude.ai和Claude iOS應用程序上免費體驗,如果訂閱了Claude Pro和團隊計劃,則可以享受更高的速率;此外,還可以通過Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI使用

生成2倍速,成本僅1/5

Claude 3.5 Sonnet雖然在零樣本MATH和MMLU評測中小幅落后GPT-4o,但在研究生級推理(GPQA)、本科級知識(MMLU)和編碼能力(HumanEval)上,毋庸置疑地刷新了SOTA——

不僅大幅領先自家的前代老大哥Claude 3 Opus,而且還完成了對谷歌Gemini 1.5 Pro和Meta 4000億參數的Llama(早期預覽版)的全面超越。

它在理解細微差別、幽默和復雜指令方面有顯著提升,并且能夠用自然、貼近生活的語調撰寫高質量內容。

在運行速度方面,Claude 3.5 Sonnet也是Claude 3 Opus的兩倍。

這種性能提升,再加上高性價比,使Claude 3.5 Sonnet非常適合處理復雜任務,如上下文敏感的客戶支持和多步驟工作流程的協調。

在內部的智能體編碼評估中,Claude 3.5 Sonnet解決了64%的問題,優于Claude 3 Opus的38%。

結果顯示,在指令和相關工具的支持下,Claude 3.5 Sonnet可以獨立編寫、編輯和執行代碼,具備復雜的推理和故障排除能力。

尤其是,它能夠輕松處理代碼翻譯,因此在更新遺留應用程序和遷移代碼庫方面效果極佳。

圖片

視覺能力超越GPT-4o

在視覺方面,Claude 3.5 Sonnet也是Anthropic迄今為止推出的最強大模型,不僅明顯優于Claude 3 Opus和Gemini 1.5 Pro,而且在大部分測試中也都超過了GPT-4o。

這些改進在需要視覺推理的任務中尤為明顯,例如解釋圖表和圖形。

不僅如此,Claude 3.5 Sonnet還可以準確地從不完美的圖像中轉錄文本——這是零售、物流和金融服務領域的核心能力。

在這些領域里,AI從圖像、圖形或插圖中獲得的信息往往要比單純的文本來得更多。

圖片

基準測試中體現的這種強大視覺能力如何落實到現實應用中呢?下面這個demo給你答案。

像GPT-4o、Gemini這些模型雖然理解圖像和視頻的能力很強,但一般只能生成文字的描述內容,在這方面我們人類顯然更擅長,能比模型做得更快更好。

但Claude不僅能準確識別、轉錄圖像中的文字內容,還結合了強大的代碼生成能力,多個模態真正集成在一起。

看一眼圖片,立刻識別信息生成JSON文件,手速絕對快過任何程序員。

圖片

還能通過編碼制造交互式圖表,代碼直接可運行,數據也絲毫不差。

圖片

不僅僅是代碼,根據圖片信息生成的網頁也是圖文并茂、界面精美。原本需要一晚上才能搞定的工作量,Claude幫你5分鐘內趕上DDL。

圖片

領域專家最為鐘愛

在附帶的報告中,Anthropic還補充了一些其他測試的結果。

圖片

報告地址:https://cdn.sanity.io/files/4zrzovbb/website/fed9cc193a14b84131812372d8d5857f8f304c52.pdf

表4展示了Claude 3.5 Sonnet在「拒絕請求」時的表現。

這里,團隊使用的而是Wildchat和XSTest數據集進行測試,從而衡量模型在面對無害提示時避免不必要的拒絕,同時在面對有害內容時保持適當的謹慎。

可以看到,Claude 3.5 Sonnet在這兩個維度上都優于Opus:它的錯誤拒絕更少,正確拒絕更多。

圖片

表5、圖1和圖2展示了Claude 3.5 Sonnet在「大海撈針」任務中的表現。

可以看到,Claude 3.5 Sonnet和Claude 3 Opus的性能幾乎不相上下,但在平均召回率方面Claude 3.5 Sonnet還是要略勝一籌。

圖片

此外,從下表中能更清晰地看到,Claude 3.5 Sonnet在所有文本長度和200K長上下文之間,召回率居然沒有出現明顯滑落,這是包括Opus在內的所有前代模型的突破。

圖片

圖片

在基于人類反饋的評估方面,團隊把從Claude 2.1開始的所有模型都拉了出來。

其中,人類評審需要與模型進行對話,并根據任務特定的指令對其進行評估。

圖3展示了與Claude 3 Opus基線相比的「勝率」(win rate)。

可以看到, Claude 3.5 Sonnet不僅在編碼、文檔、創意寫作和視覺等核心能力上有著顯著的改進,而且領域專家們也更加喜歡——在法律領域的勝率高達82%,在金融領域為73%,在哲學領域為73%。

圖片

Artifacts:讓團隊實現無縫協作

除了模型的更新之外,Anthropic還Claude.ai上推出了一項全新功能——Artifacts,擴展了用戶與Claude互動的方式。

具體來說,當用戶要求Claude生成代碼片段、文本文檔或網站設計等內容時,只需要一鍵點擊,這些Artifacts會出現在對話旁邊的專用窗口中。

這樣就創建了一個動態工作空間,用戶可以實時查看、編輯并基于Claude的創作進行構建,將AI生成的內容無縫集成到他們的項目和工作流程中。

這個功能的添加,大大增強了Claude在復雜項目中的可用性。

比如想要創建一個交互式的游戲界面,你很難在一次對話中描述清楚所有的功能與需求。即使描述清楚了,以生成模型目前的能力,未必也能一次得到滿意的結果。

于是,你可以參考軟件開發的流程,將需求分解為多個步驟,更方便Claude Sonnet進行「漸進式開發」和迭代。

比如下面這個demo中,想要創建一個游戲,可以先讓模型用SVG格式生成你想要的角色形象。

圖片

再把所有這些SVG圖像放在同一個HTML網頁中。

圖片

最后,規定好角色名稱和游戲規則,只需要告訴Claude讓這個游戲變得「可玩」,不用操心任何代碼細節,一個簡單的網頁游戲就制作完成了。

圖片

Artifacts的推出,標志著Claude從對話式AI向協作工作環境的轉變。

當然,這還只是一個開始。

不久的將來,團隊——最終是整個組織——將能夠在一個共享空間中安全地集中他們的知識、文檔和正在進行的工作,Claude將作為按需的隊友提供服務。

網友:被震撼到了!

模型剛剛發布,就有早期測試者發帖表示「被震撼到了」!

圖片

我是Claude 3.5 Sonnet模型的早期測試者,我對輸出的一致反應是「超神」,模型現在已向所有人開放。

Claude 3.5 Sonnet在關鍵評估上優于競爭模型,速度是Claude 3 Opus的兩倍,但成本只有五分之一,能勝任自主編碼和視覺處理等復雜任務,而且可以管理長文檔,確保 RAG、搜索/檢索以及比較多個長文檔等任務的準確性。

以及,我個人使用體驗的反饋:從來不需要跟它說「不,你沒明白我的提示,請執行這個操作」,它就是能理解提示并做到了;Artifact讓我更有效率;文本推理/比較的結果優秀到不可思議。

有網友表示,自己不相信基準,于是便拿了道真題來了波實測。

結果不出所料,Claude 3.5 Sonnet很快就做了出來,而GPT-4o則在一通長篇大論之后給出了錯誤的答案。

圖片

Ethan Mollick表示,Anthropic新推出的「Artifacts」用起來有點類似于簡化版的代碼解釋器。

圖片

下面,就是他用Claude創建并編輯一個游戲的實時視頻。

大局觀

那么Claude 3.5 Sonnet在Anthropic和整個AI生態系統中有什么重要意義呢?

首先是性能方面,由于當前模型架構的固化以及訓練所需的巨大計算量,在沒有重大研究突破的情況下,我們很難看到從GPT-3到GPT-4那樣的飛躍。

比如,谷歌(Gemini 1.5 Pro)和OpenAI(GPT-4o)發布的旗艦產品,在基準測試和性能方面都只有小幅的提升。

其次,隨著生成式AI廠商將注意力轉向數據策劃和許可,而不是新的可擴展架構,投資者似乎對生成式AI的投資回報周期比預期更長感到擔憂。

不過,Anthropic因為處在對抗OpenAI的關鍵位置上,因此在一定程度上不會受到這種壓力的影響。

但值得注意的是,Anthropic到2024年底的預計收入只有不到10億美元,僅僅是OpenAI的「零頭」。

圖片

第三,盡管客戶群在不斷增長,包括Bridgewater、Brave、Slack和DuckDuckGo等家喻戶曉的品牌,但它仍然缺乏一定的企業知名度。正如最近與普華永道合作向企業轉售生成式AI產品的是OpenAI,而不是Anthropic。

對此,Anthropic正在采取一種戰略性且成熟的方法來開擴市場——將更多的研發投入到像Claude 3.5 Sonnet這樣的產品上,從而在市場價格下提供稍好的性能。

可以看到,Claude 3.5 Sonnet的定價與Claude 3 Sonnet相同:每百萬個輸入模型的token收費3美元,每百萬個模型生成的token收費15美元。

最后,Claude 3.5 Sonnet雖然沒有解決大模型的「幻覺」問題,但它可能足夠有吸引力,讓開發者和企業轉向Anthropic的平臺。而這才是Anthropic關心的。

為此,Anthropic加大了對工具的投入,比如:

- 實驗性的引導AI,允許開發者「引導」模型的內部特性;

- 集成使其模型能夠在應用程序中執行操作;

- 基于模型構建的工具,比如最新的Artifacts。

此外,它還聘請了一位Instagram聯合創始人擔任產品負責人。

總體來說,Anthropic似乎已經意識到,圍繞模型構建一個生態系統,而不僅僅是孤立的模型,是保持客戶的關鍵,因為模型之間的能力差距正在縮小。

最后,讓我們拭目以待吧。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-06-21 09:51:17

2024-06-21 09:58:38

2024-10-06 09:00:00

AI訓練數據

2025-01-06 13:15:02

2025-01-22 16:57:32

字節跳動豆包大模型

2024-06-28 18:13:05

2024-07-16 13:24:38

2025-04-08 02:26:00

2024-07-11 16:38:15

2024-05-14 08:23:27

GPT-4oAI技術

2024-05-17 09:35:55

GPT-4o模型OpenAI

2024-06-24 12:25:22

2024-12-19 17:50:28

2024-11-04 08:40:00

2025-08-07 14:05:40

OpenAI大模型開源

2024-05-21 12:23:17

2024-06-05 08:29:35

2024-05-20 08:20:00

OpenAI模型

2024-05-14 07:30:56

OpenAIGPT-4oGPT-4

2024-08-07 12:28:23

點贊
收藏

51CTO技術棧公眾號

av中文字幕免费| 亚洲精品国产精品自产a区红杏吧 亚洲精品国产精品乱码不99按摩 亚洲精品国产精品久久清纯直播 亚洲精品国产精品国自产在线 | 日本xxxxxwwwww| 亚洲午夜久久| 成人少妇影院yyyy| 日韩视频中文字幕| 国产第一页视频| 五月婷婷丁香花| 国产一区二区三区四区三区四| 91精品福利在线| 久99久视频| 国产香蕉在线视频| 91精品尤物| 亚洲麻豆国产自偷在线| 国产精品视频在线观看| 天天躁日日躁aaaa视频| 高清在线视频不卡| 在线日韩视频| 亚洲精品在线一区二区| 糖心vlog在线免费观看| 91av久久久| 久久中文字幕av| 欧美视频一区二区三区| 色综合电影网| 日本一本在线观看| 国产精品亚洲人成在99www| 欧美日韩一区二区免费视频| 好吊色欧美一区二区三区四区| 免费网站看av| 国产日韩三级| 精品欧美一区二区三区| 中文字幕99| 国产浮力第一页| 日韩精品国产欧美| 日韩在线免费高清视频| 欧美大片久久久| av网站大全在线| 成人午夜私人影院| 91香蕉亚洲精品| 久久精品视频9| 亚洲精品在线观看91| 日韩欧美123| 自拍日韩亚洲一区在线| 无码国产精品高潮久久99| 国产一区二区在线视频| 国内精品400部情侣激情| 欧美bbbbb性bbbbb视频| 成人国产一区| 亚洲午夜影视影院在线观看| 精品无人区一区二区三区竹菊| 国产美女裸体无遮挡免费视频| 你懂的网址国产 欧美| 亚洲国产精品高清久久久| 日韩免费高清在线| a级影片在线| 91美女片黄在线观看91美女| 国产精品精品久久久久久| 男人与禽猛交狂配| 精品亚洲精品| 欧美日韩高清在线| 九九热只有这里有精品| 蝌蚪视频在线播放| 国产精品伊人色| 国产91免费观看| 丰满少妇高潮久久三区| 国产精品一区二区av交换| 日韩电影免费观看在线观看| 182午夜在线观看| 人成在线免费网站| 亚洲欧美日韩国产另类专区| 国产精品亚洲天堂| 男人的天堂在线免费视频| 久久综合久久鬼色中文字| 91精品在线观| 精品人妻一区二区三区浪潮在线| 午夜在线a亚洲v天堂网2018| 日韩网站在线观看| 手机av在线看| 欧洲美女日日| 日韩精品中文字幕视频在线| 中文字幕第22页| 亚洲一区二区三区四区| 亚洲一区二区综合| 波多野结衣家庭教师在线| gogo在线观看| 亚洲成人av一区二区三区| 国产又大又长又粗又黄| 在线观看免费视频你懂的| 午夜国产精品一区| 国产一区 在线播放| 一区二区三区视频在线观看视频| jlzzjlzz国产精品久久| 91性高湖久久久久久久久_久久99| www.av日韩| 久久日一线二线三线suv| 亚洲精品在线免费| 久热av在线| 亚洲四区在线观看| 一区二区精品免费视频| 国产三级视频在线看| 91免费观看视频在线| 色综合久久88色综合天天提莫| 成人免费看片| 色综合欧美在线视频区| 亚洲中文字幕无码专区| 成人a在线观看高清电影| 精品国产1区二区| 长河落日免费高清观看| 欧美日韩中文一区二区| 欧美日韩国产成人| 麻豆亚洲av成人无码久久精品| 在线成人av| 国模私拍一区二区三区| 精品乱码一区内射人妻无码| 久久精品日韩欧美| 国产成人拍精品视频午夜网站| 欧美一二三区视频| 亚洲专区一区| 超碰在线观看97| 六月丁香综合网| 成人av免费观看| 精品国产一区二区三区四区精华| 中文字幕在线播放| 亚洲人吸女人奶水| 丁香啪啪综合成人亚洲| 97品白浆高清久久久久久| 日韩欧美国产一二三区| 内射毛片内射国产夫妻| 亚洲天天影视网| 国产精品第8页| 台湾av在线二三区观看| 国产日本欧美一区二区| 亚洲欧洲精品在线 | 日本久久久久久久久久久久| 高清电影一区| 亚洲国模精品一区| 久久精品欧美一区二区| 国产不卡一区视频| 久久精品国产理论片免费| 中文在线观看免费| 欧美一区二区三区影视| youjizz.com日本| 日韩大胆成人| 中文字幕日韩欧美在线| 免费一级肉体全黄毛片 | 日本特黄在线观看| 国偷自产av一区二区三区| 欧美xxxx14xxxxx性爽| 日本一区二区网站| 免费在线一区观看| 国产精品一区在线观看| 大片免费播放在线视频| 亚洲免费观看高清| а 天堂 在线| 一本一道久久a久久精品蜜桃| 成人精品久久一区二区三区| 欧美在线精品一区二区三区| 一区二区三区在线观看网站| 久久网站免费视频| 国产午夜亚洲精品一级在线| 亚洲激情在线观看视频免费| 国产亚洲欧美精品久久久久久| 欧美亚洲专区| 欧美一区二区三区四区夜夜大片 | 欧美大成色www永久网站婷| 国产精品视频一区二区三区,| av不卡一区二区三区| 毛片在线播放视频| 精品中文一区| 色综合天天综合网国产成人网| 国产成人无码av| 国产91精品欧美| 黄色一级视频在线播放| 国产精品久久乐| 日韩经典中文字幕| 国产字幕在线观看| 1024亚洲合集| 天天操天天爽天天射| 欧美日韩一本| 欧美激情va永久在线播放| 二区三区在线视频| 色综合视频一区二区三区高清| 一区二区伦理片| 国产在线一区二区| 国产特级黄色大片| 色综合色综合| 国产精品久久久久秋霞鲁丝| 五月天婷婷在线观看| 91成人在线免费观看| 国内av免费观看| 国产亚洲高清视频| 国产精品日韩欧美一区二区三区| 大桥未久在线视频| 色偷偷偷综合中文字幕;dd| 性生交大片免费看女人按摩| 中文字幕亚洲区| 草草草在线视频| 重囗味另类老妇506070| 蜜桃久久影院| 深夜福利视频一区二区| 日韩在线中文字幕| 亚洲欧美日本在线观看| 91.com视频| 亚洲天堂精品一区| 成人在线一区二区三区| 午夜视频你懂的| 中日韩视频在线观看| 极品校花啪啪激情久久| 久久爱.com| 欧美亚洲另类视频| 青青色在线视频| 色综合久久88色综合天天免费| 激情无码人妻又粗又大| 麻豆成人av在线| 91制片厂免费观看| 蜜桃成人av| 成人欧美一区二区| 蜜桃麻豆av在线| 欧美成人在线影院| eeuss影院在线播放| 亚洲精品美女在线观看播放| 国产精品无码AV| 欧美午夜精品久久久久久超碰| 五月天婷婷网站| 一区二区三区在线观看欧美| 国产麻豆a毛片| 国产精品一区二区三区乱码| 久久久久久久久久福利| 亚洲精品欧洲| 男人c女人视频| 色婷婷精品视频| 国产精品国产三级国产专区53| 亚洲一区av| 欧美国产在线电影| 超碰免费公开在线| 日韩中文字在线| 香蕉视频免费在线播放| 国产一区二区三区在线观看网站 | 麻豆最新免费在线视频| 欧美美女激情18p| 国产三级国产精品国产国在线观看 | 国产成人高清激情视频在线观看 | 亚洲午夜在线电影| 欧美成人精品欧美一级私黄| 亚洲欧美经典视频| 日本在线一级片| 亚洲免费观看高清| 久操免费在线视频| 亚洲一区二区三区四区在线| 欧美黄色一区二区三区| 亚洲一区视频在线观看视频| 欧美毛片在线观看| 亚洲一级二级三级在线免费观看| 久草国产在线视频| 亚洲国产成人av好男人在线观看| 久久无码精品丰满人妻| 亚洲电影第三页| 久久久久久久久久影院| 亚洲国产成人私人影院tom| 国产精品中文久久久久久| 国产一区二区免费看| 亚洲午夜精品在线观看| 日韩一区精品视频| 三级a在线观看| 精品一区二区影视| 久草资源站在线观看| 蘑菇福利视频一区播放| 欧美黑人又粗又大又爽免费| 日韩精品欧美精品| 欧美又黄又嫩大片a级| 国产成人综合视频| 日韩一区二区三区久久| 久久国产精品99久久久久久老狼| 超碰在线资源站| 成人午夜av电影| 亚洲国产精品无码久久久久高潮| 久久国产福利国产秒拍| 中文字幕无码毛片免费看| 成人激情黄色小说| 国产精品密蕾丝袜| 亚洲精品视频在线| 国内自拍视频在线播放| 8x8x8国产精品| 污污的视频网站在线观看| 一区二区中文字幕| 羞羞视频在线观看不卡| 视频一区视频二区国产精品| 日本在线免费| 韩国精品久久久999| aaa大片在线观看| 91超碰中文字幕久久精品| 亚洲精品白浆| 国产成人av网址| 一区二区三区亚洲变态调教大结局 | 中文字幕一区2区3区| 一本久久综合亚洲鲁鲁五月天| 正在播放木下凛凛xv99| 精品福利二区三区| 一广人看www在线观看免费视频| 欧美国产激情18| 丁香婷婷久久| 国产自产精品| 任你躁在线精品免费| 夜夜春亚洲嫩草影视日日摸夜夜添夜| 好看的日韩av电影| 成年人三级黄色片| 久久99精品久久久久久久久久久久| 99riav国产精品视频| 国产精品天干天干在观线| 国产91av视频| 欧美一级日韩一级| 国产黄在线看| 26uuu日韩精品一区二区| 九色精品蝌蚪| 国产精品久久亚洲| 欧美高清在线| 黄色三级视频片| 99免费精品在线| 久久免费视频精品| 日韩一区和二区| 亚洲福利在线观看视频| 在线播放精品一区二区三区 | 四虎永久免费观看| 综合精品久久久| 中文字幕乱码人妻二区三区| 精品视频一区在线视频| heyzo一区| 欧美重口另类videos人妖| 日韩精品99| 国产在线观看不卡| 精品国产麻豆| 天堂v在线视频| 久热成人在线视频| 貂蝉被到爽流白浆在线观看 | 一级片视频免费观看| 久久久亚洲午夜电影| 国产精品美女高潮无套| 成人免费在线观看入口| 国产99免费视频| 91精品国产aⅴ一区二区| 国产免费视频在线| 国产成人一区二区| blacked蜜桃精品一区| 免费在线观看毛片网站| 久久一区二区三区四区| 国产精品第5页| 日韩高清av一区二区三区| 高清在线视频不卡| 免费观看成人在线| 欧美综合国产| 日韩av片在线免费观看| 欧美情侣在线播放| 国产区在线观看| 欧美在线影院在线视频| 天堂资源在线亚洲| 国产成人无码一二三区视频| 国内不卡的二区三区中文字幕| 欧美日韩一区二区三区四区五区六区| 不卡的av电影| 日韩伦人妻无码| 亚洲毛片一区二区| 欧美78videosex性欧美| 国产剧情日韩欧美| 国产精品99久久精品| 免费成人在线视频网站| 久久这里只有精品6| 成人一二三四区| 久久精品人人做人人爽| 校园春色亚洲色图| 亚洲精品成人a8198a| 国产一区二三区| 男人的天堂一区二区| 国产一区二区三区视频在线观看 | 国产精品一区二区免费| 免费在线成人| 国产精品1区2区3区4区| 日韩视频免费观看高清完整版 | 色诱视频网站一区| 婷婷视频在线| 国产伦精品一区二区三区四区免费 | 国产69久久精品成人| 日韩国产在线| 日本精品一二三区| 在线精品视频一区二区| 中文字幕有码在线观看| 蜜桃网站成人| 国模一区二区三区白浆| 日韩欧美国产亚洲| 最新亚洲国产精品| 久久悠悠精品综合网| 日本中文字幕二区| 天天影视涩香欲综合网| 精品国产一级片| 热久久免费视频精品| 伊人青青综合网| 亚洲一区视频在线播放| 亚洲精品一区二区三区精华液 | 国产亚洲福利社区| 日韩电影在线免费观看| 精品爆乳一区二区三区无码av|