精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-5超越人類(lèi)醫(yī)生!推理能力比專(zhuān)家高出24%,理解力強(qiáng)29%

人工智能
MedXpertQA測(cè)試是一個(gè)用于評(píng)估模型專(zhuān)家級(jí)醫(yī)學(xué)知識(shí)與高級(jí)推理能力的綜合基準(zhǔn),有文本測(cè)試和多模態(tài)測(cè)試,共涵蓋4460道題目,涉及17個(gè)醫(yī)學(xué)專(zhuān)科和11個(gè)身體系統(tǒng),其數(shù)據(jù)源自超20個(gè)美國(guó)醫(yī)師執(zhí)照考試、歐洲放射學(xué)委員會(huì)考試等權(quán)威內(nèi)容。

GPT-5比人類(lèi)醫(yī)生還會(huì)看X光片?!

最新研究顯示,GPT-5對(duì)醫(yī)學(xué)影像的推理和理解準(zhǔn)確率分別比人類(lèi)專(zhuān)家高出24.23%和29.40%。

圖片圖片

來(lái)自埃默里大學(xué)醫(yī)學(xué)院的研究團(tuán)隊(duì)把GPT-5和GPT-4o以及更小的GPT-5變體(GPT-5-mini、GPT-5-nano)進(jìn)行了比較,分析它們?cè)卺t(yī)療領(lǐng)域處理多模態(tài)信息的能力。

圖片圖片

通過(guò)一系列標(biāo)準(zhǔn)化測(cè)試發(fā)現(xiàn)GPT-5在所有測(cè)試中的表現(xiàn)都比其他模型好,尤其是在MedXpertQA的多模態(tài)測(cè)試中,它的推理和理解得分比GPT-4o分別提高了近30%36%,甚至比人類(lèi)醫(yī)生還高。

圖片圖片

AI看病歷常見(jiàn),可是比人類(lèi)醫(yī)生還會(huì)看就不常見(jiàn)了,所以GPT-5是怎么做到的?

AI在多模態(tài)醫(yī)學(xué)領(lǐng)域超越人類(lèi)新手醫(yī)生

研究人員對(duì)GPT-5、GPT-4o以及GPT-5的mini和nano版本進(jìn)行了系統(tǒng)測(cè)試。

測(cè)試分為三類(lèi):純文本的USMLE考試、多模態(tài)的MedXpertQA測(cè)試還有放射科的VQA-RAD,都是零樣本設(shè)置,不依賴(lài)數(shù)據(jù)微調(diào)。

USMLE是美國(guó)醫(yī)師執(zhí)照考試,有標(biāo)準(zhǔn)化的命題和嚴(yán)格的評(píng)分體系,是全球醫(yī)學(xué)教育和人才評(píng)估的重要參考基準(zhǔn)。

該考試分為三個(gè)步驟:Step1主要考察基礎(chǔ)醫(yī)學(xué)知識(shí),Step2聚焦臨床應(yīng)用知識(shí),Step3側(cè)重實(shí)踐。

在此次研究中,GPT-5在USMLE考試中全面超越GPT-4o,且平均得分領(lǐng)先于其他模型。

圖片圖片

MedXpertQA測(cè)試是一個(gè)用于評(píng)估模型專(zhuān)家級(jí)醫(yī)學(xué)知識(shí)與高級(jí)推理能力的綜合基準(zhǔn),有文本測(cè)試和多模態(tài)測(cè)試,共涵蓋4460道題目,涉及17個(gè)醫(yī)學(xué)專(zhuān)科和11個(gè)身體系統(tǒng),其數(shù)據(jù)源自超20個(gè)美國(guó)醫(yī)師執(zhí)照考試、歐洲放射學(xué)委員會(huì)考試等權(quán)威內(nèi)容。

其中多模態(tài)的MedXpertQA測(cè)試?yán)盟腗M子集展開(kāi),MM子集引入了帶有多樣化圖像及豐富臨床信息(病歷、檢查結(jié)果等)的專(zhuān)家級(jí)考試題。

為增加難度,多模態(tài)子集的題目還擴(kuò)充至5個(gè)選項(xiàng),能更有效地評(píng)估模型在貼近真實(shí)場(chǎng)景下的醫(yī)學(xué)診斷推理能力。

依據(jù)之前的數(shù)據(jù),GPT-5推理和理解得分比GPT-4o分別提高了近30%36%。

圖片圖片

下圖詳細(xì)對(duì)比了未取得執(zhí)照的人類(lèi)專(zhuān)家與GPT-5系列模型及GPT-4o在MedXpertQA測(cè)試的文本子集(Text)和多模態(tài)子集(MM)中的表現(xiàn),涵蓋推理、理解及平均三個(gè)維度。

圖片圖片

在文本測(cè)試中,GPT-4o三項(xiàng)得分均低于人類(lèi)專(zhuān)家,GPT-5-nano同樣全面落后,GPT-5-mini 推理和平均得分略超人類(lèi)專(zhuān)家,而GPT-5表現(xiàn)最優(yōu),得分大幅領(lǐng)先。

在多模態(tài)測(cè)試中,GPT-4o推理和平均得分略低,GPT-5-nano整體與人類(lèi)專(zhuān)家持平,GPT-5-mini大幅超越人類(lèi)專(zhuān)家,GPT-5優(yōu)勢(shì)最為顯著,推理超人類(lèi)專(zhuān)家24%、理解得超人類(lèi)專(zhuān)家29%,展現(xiàn)出強(qiáng)大的多模態(tài)醫(yī)學(xué)推理能力。

VQA-RAD測(cè)試是醫(yī)學(xué)視覺(jué)問(wèn)答測(cè)試,該數(shù)據(jù)集包含315張放射影像以及與之對(duì)應(yīng)的3515個(gè)問(wèn)答對(duì)。常用于評(píng)估醫(yī)學(xué)多模態(tài)大語(yǔ)言模型解讀復(fù)雜醫(yī)學(xué)圖像并生成準(zhǔn)確文本描述的能力。

在此次研究中,GPT-5的匹配率為70.92%,高于GPT-4o及小變體GPT-5-nano,而其輕量化變體GPT-5-mini的表現(xiàn)略?xún)?yōu),嚴(yán)格匹配率達(dá)到74.90%。

圖片圖片

考慮到VQA-RAD規(guī)模相對(duì)較小且具有放射科專(zhuān)項(xiàng)屬性,這種得分差異可能源于較小模型存在數(shù)據(jù)集特定的過(guò)擬合現(xiàn)象。

看了這么多測(cè)試結(jié)果,那么GPT-5為什么能全面碾壓前輩GPT-4o呢?

GPT-5構(gòu)建了端到端的多模態(tài)架構(gòu)

團(tuán)隊(duì)認(rèn)為,GPT-5能力提升核心源于其跨模態(tài)注意力與對(duì)齊能力的增強(qiáng)。

GPT-5與GPT-4o的核心差距,本質(zhì)上是從文本主導(dǎo)的混合處理原生多模態(tài)深度融合的代際跨越。

GPT-4o在處理跨模態(tài)任務(wù)時(shí),仍依賴(lài)文本轉(zhuǎn)譯+外部工具調(diào)用的間接模式:例如解析醫(yī)學(xué)影像時(shí),需先通過(guò)第三方模型將圖像信息轉(zhuǎn)化為文本描述,再基于文本進(jìn)行推理。

這種模態(tài)轉(zhuǎn)換中介不僅增加了信息損耗(如圖像中的細(xì)微病變可能在轉(zhuǎn)譯中被忽略),還導(dǎo)致推理鏈條斷裂——模型難以直接建立影像特征-病理機(jī)制-治療方案的因果關(guān)聯(lián)。

GPT-5構(gòu)建了端到端的多模態(tài)架構(gòu):通過(guò)共享標(biāo)記化技術(shù),將文本、影像、音頻等信息編碼為統(tǒng)一向量空間的符號(hào),再借助跨模態(tài)注意力機(jī)制實(shí)現(xiàn)感知-推理-決策的無(wú)縫銜接。

并且,團(tuán)隊(duì)認(rèn)為在MedXpertQA Text、USMLE Step 2這樣的推理密集型任務(wù)中,GPT-5的進(jìn)步更突出是因?yàn)?/span>思維鏈提示與GPT-5增強(qiáng)的內(nèi)部推理能力形成了協(xié)同效應(yīng),使其能更準(zhǔn)確地完成多步推理。

不過(guò)研究人員也指出,盡管GPT-5在標(biāo)準(zhǔn)測(cè)試中表現(xiàn)優(yōu)秀,但要說(shuō)明的是,這些測(cè)試都是在理想環(huán)境下進(jìn)行的,題目和數(shù)據(jù)都是標(biāo)準(zhǔn)化的,現(xiàn)實(shí)中患者的情況千奇百怪,還可能遇到各種突發(fā)狀況。

所以,GPT-5要真走進(jìn)診室當(dāng)助理,還得經(jīng)過(guò)更多實(shí)戰(zhàn)考驗(yàn)。

這不,KCDH_A數(shù)字健康研究中心對(duì)AI進(jìn)行了放射科的終極考試,這是一項(xiàng)AI從未見(jiàn)過(guò)的、跨模態(tài)的檢測(cè)任務(wù),涵蓋了CT、MRI和X光,模擬日常實(shí)踐中實(shí)際遇到的復(fù)雜真實(shí)病例。

測(cè)試結(jié)果顯示,所有AI模型得分均低于實(shí)習(xí)醫(yī)生,而擁有執(zhí)業(yè)資格的放射科醫(yī)生比AI領(lǐng)先更多,雖然GPT-5剛剛進(jìn)入頂尖AI的位置,但也遠(yuǎn)低于人類(lèi)。

圖片圖片

該實(shí)驗(yàn)室的研究人員表示:

雖然我對(duì)AI發(fā)展感到興奮,我們實(shí)驗(yàn)室也在每天使用AI模型,但AI取代放射科醫(yī)生與現(xiàn)實(shí)的差距仍然很大。

由此可見(jiàn),AI獨(dú)自看病歷之前,還是得先磨練磨練。

論文地址:https://arxiv.org/abs/2508.08224

參考鏈接:

[1]https://x.com/omarsar0/status/1955252499142627788

[2]https://x.com/emollick/status/1955381296743715241

[3]https://x.com/DrDatta_AIIMS/status/1954586822849523789

責(zé)任編輯:武曉燕 來(lái)源: 量子位
相關(guān)推薦

2025-08-07 16:21:27

GPT-5AI模型

2025-11-10 08:57:00

AI模型測(cè)試

2025-09-19 14:53:34

2024-07-05 13:38:03

2025-08-08 06:39:22

2025-08-07 13:57:38

GPT-5AI模型

2025-08-12 09:18:00

2025-09-25 09:09:22

2025-06-19 09:06:00

2024-08-28 13:00:42

2023-11-16 15:57:00

數(shù)據(jù)訓(xùn)練

2024-03-05 09:16:32

AI模型GPT-4

2024-01-09 12:53:16

模型訓(xùn)練

2024-01-22 06:40:00

模型視覺(jué)

2023-03-28 08:23:38

2024-01-22 13:57:00

模型訓(xùn)練

2025-08-18 17:14:41

GPT-5OpenAIAGI

2025-08-14 09:31:24

GPT-5AI

2024-01-02 09:26:05

AI預(yù)測(cè)

2025-09-01 08:59:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

日精品一区二区三区| 亚洲免费成人av在线| 一区二区三区日韩精品视频| 国产欧美韩日| 天堂免费在线视频| 亚洲精品国产首次亮相| 亚洲精品久久久久国产| www.激情小说.com| 51av在线| 成人欧美一区二区三区白人| 精品视频导航| 国产精品欧美久久久久天天影视| 日韩视频精品在线观看| 日韩一二三在线视频播| 精品无码国产一区二区三区51安| 国产国产一区| 欧美日韩午夜剧场| 可以在线看黄的网站| 黄色片视频在线观看| 丁香婷婷综合色啪| 国产伦精品一区二区三区精品视频| 男女免费视频网站| 香蕉国产精品| 亚洲欧美综合图区| 在线播放av网址| 国产激情久久| 色欧美日韩亚洲| 给我免费播放片在线观看| 久操免费在线| 国产精品毛片大码女人| 欧美男人的天堂| 三级网站免费观看| 国产精品白丝av| 国产精品亚洲一区二区三区| 久久精品视频5| 一区久久精品| 欧美夫妻性生活xx| 一区二区成人免费视频| 小小影院久久| 中文字幕欧美视频在线| 久久久视频6r| 西野翔中文久久精品国产| 精品久久一区二区| 18深夜在线观看免费视频| 青青草国产一区二区三区| 欧洲精品一区二区| 亚洲不卡视频在线| 亚州一区二区三区| 欧美影视一区二区三区| 一级黄色香蕉视频| 欧美成人资源| 91国产免费看| 国产 porn| 91精品国产66| 欧美日韩成人在线| 黄色手机在线视频| 激情小说亚洲| 5566中文字幕一区二区电影| 亚洲第一天堂久久| 日韩激情精品| 精品福利一区二区三区免费视频| 麻豆传媒在线看| 高清日韩中文字幕| 日韩国产欧美精品在线| 给我看免费高清在线观看| 日韩欧美黄色| 伊人久久久久久久久久久久久| 熟女俱乐部一区二区| 欧州一区二区| 日韩视频亚洲视频| 少妇影院在线观看| 最新亚洲视频| 国产99视频精品免视看7| 日韩精品在线一区二区三区| 老司机免费视频一区二区三区| 国产精品色婷婷视频| 国产欧美日韩综合精品一区二区三区| 国产激情视频一区二区三区欧美| 亚洲xxx视频| 五月婷婷伊人网| 久久精品亚洲一区二区三区浴池| 亚洲精品乱码视频| 四虎影视成人| 欧美日韩亚洲系列| 四季av一区二区三区| 97久久亚洲| 亚洲欧美一区二区精品久久久| 久久久久亚洲AV成人无在| 91成人精品视频| 欧美孕妇孕交黑巨大网站| 中文字幕日韩三级| 成人视屏免费看| 色狠狠久久av五月综合| bestiality新另类大全| 精品久久香蕉国产线看观看亚洲| 国产精品一区二区羞羞答答| 日韩视频在线直播| 国产香蕉一区二区三区在线视频| 国产稀缺精品盗摄盗拍| 亚洲一区观看| 亚洲v日韩v综合v精品v| 天堂在线一二区| 亚洲视频一区二区在线观看| 鲁一鲁一鲁一鲁一澡| 日本一区二区中文字幕| 日韩av在线精品| 青青青在线免费观看| 久久综合中文| 成人精品一二区| porn亚洲| 色综合久久综合中文综合网| 国产免费a级片| 久久在线免费| 热re91久久精品国99热蜜臀| wwwav在线播放| 国产精品久久久久久久久免费丝袜| 国产中文字幕二区| 精品国模一区二区三区欧美 | 精品人妻aV中文字幕乱码色欲 | 日韩av影视| 波多野结依一区| 欧美精品高清视频| 欧美18—19性高清hd4k| 国产亚洲激情| 国产福利久久精品| 国产三区视频在线观看| 欧美日韩一区二区三区免费看| 黄色国产在线观看| 国产精品草草| 亚洲a在线观看| 麻豆视频在线观看免费| 欧美日韩国产一区| 手机看片国产日韩| 日日骚欧美日韩| 鲁丝一区二区三区免费| 国产福利片在线观看| 精品成人在线观看| 国产精品19乱码一区二区三区| 国产资源精品在线观看| 日本黄色a视频| 欧美黄色a视频| 中日韩午夜理伦电影免费 | 日韩一级视频免费观看在线| 人妻无码一区二区三区免费| 青娱乐精品在线视频| 日本日本精品二区免费| 欧美国产大片| 亚洲一级免费视频| 成人黄色片在线观看| 国产日产欧美一区二区三区| 91国产精品视频在线观看| 日韩精品诱惑一区?区三区| 国产精自产拍久久久久久| 免费看a在线观看| 91精品国产综合久久久久| 欧美一级片在线视频| 国产乱码一区二区三区| 国产日韩亚洲欧美在线| 美女主播精品视频一二三四| 538国产精品一区二区在线| 男人天堂亚洲二区| 欧美色倩网站大全免费| 青青青手机在线视频| 国产精品影视天天线| 男女激情无遮挡| 欧美极品在线观看| 91久久精品国产91性色| 女人天堂av在线播放| 亚洲国产精品小视频| 潘金莲一级淫片aaaaaa播放| 国产精品国产自产拍高清av| 亚洲一区二区中文字幕在线观看| 国户精品久久久久久久久久久不卡| 国产日本一区二区三区| 欧美精品总汇| 久久综合色88| 香蕉国产在线视频| 欧美影院一区二区| 国产精品丝袜一区二区| eeuss影院一区二区三区| 99视频在线免费| 亚洲国产不卡| 久久精品美女| 成人久久精品| 2019中文字幕在线观看| 视频三区在线| 精品无人国产偷自产在线| 中文字幕在线日亚洲9| 一片黄亚洲嫩模| 亚洲码无人客一区二区三区| 激情综合五月婷婷| 国内外成人激情视频| 亚洲国产精品久久久久蝴蝶传媒| 国产精品香蕉视屏| 久久青草免费| 97av视频在线| 超碰在线caoporen| 一区二区欧美久久| 日韩在线一区二区三区四区| 欧美性猛片aaaaaaa做受| 国产小视频在线看| 中文字幕欧美区| 97香蕉碰碰人妻国产欧美| 狠狠狠色丁香婷婷综合激情| 国产第一页视频| 欧美日韩专区| 欧美 日韩 国产 在线观看| 欧美大胆视频| av资源站久久亚洲| 国产高清精品二区| 国产精品va在线| av影院在线免费观看| 欧美另类高清videos| 香蕉视频国产在线观看| 精品无人区乱码1区2区3区在线 | 亚洲人成人99网站| 亚洲va欧美va| 日韩一级完整毛片| 国产精品视频在线观看免费| 欧美亚州韩日在线看免费版国语版| 日韩污视频在线观看| 亚洲精品你懂的| 色无极影院亚洲| 91在线观看高清| 天堂久久久久久| 成人av资源在线观看| 毛毛毛毛毛毛毛片123| 久久91精品国产91久久小草| 能看的毛片网站| 久久激情综合| 日韩欧美精品在线观看视频| 亚洲麻豆一区| 日韩av在线播放不卡| 激情久久一区| www.男人天堂网| 国产精品v日韩精品v欧美精品网站 | 久久av综合| 欧美日韩系列| 欧美禁忌电影| 日韩尤物视频| 久久麻豆精品| 亚洲一区精品视频| 国产精品久久久久久久久妇女| 午夜精品电影在线观看| 精品一区不卡| 一区二区三区国产福利| 欧美成人激情| 久久久99精品视频| 激情久久久久| 国产中文字幕免费观看| 天堂资源在线中文精品| www.99在线| 美女一区二区视频| 99热这里只有精品2| 成人丝袜高跟foot| 97人妻天天摸天天爽天天| 2020国产精品久久精品美国| 亚洲精品国产精品国自产网站| 日本一区二区视频在线| 成人18视频免费69| 一区二区三区鲁丝不卡| 国产一卡二卡在线| 色综合久久久久| 在线播放国产一区| 日韩午夜电影av| 五月天丁香视频| 揄拍成人国产精品视频| 国内精品不卡| 久久久女人电视剧免费播放下载| 黄视频免费在线看| 国产精品免费在线免费| 国产精选久久| 欧美男人的天堂| 91tv精品福利国产在线观看| 岛国大片在线播放| 日韩精品91亚洲二区在线观看 | 久久影视免费观看| а√天堂8资源中文在线| 国产成人一区二区| 日韩第一区第二区| 欧美日韩一区二区三区在线视频 | 日本高清不卡一区| 国产熟女一区二区三区五月婷| 亚洲成**性毛茸茸| 91这里只有精品| 久久久久亚洲精品成人网小说| 欧美电影网址| 国产精品加勒比| 日韩成人影院| 俄罗斯av网站| 国产一区美女在线| 蜜桃av免费看| 亚洲大片精品永久免费| 最新中文字幕免费| 精品国产第一区二区三区观看体验| 国产福利小视频在线| 欧美激情成人在线视频| 国产一区二区三区影视| 国产精品一区二区免费| 91久久高清国语自产拍| 97成人在线观看视频| 国内精品不卡在线| 一区二区三区久久久久| 亚洲成人在线网站| 国产又粗又猛又爽又黄的视频一| 精品亚洲一区二区三区在线播放| 成人av免费| 国产欧美日韩精品丝袜高跟鞋| 久久精品色播| 欧美国产视频一区| 国产在线麻豆精品观看| 三级网站在线免费观看| 午夜精品久久久久久| 精品国精品国产自在久不卡| 中文字幕亚洲字幕| 亚洲伊人av| 国内视频一区二区| 激情久久婷婷| 2025中文字幕| 亚洲精品国产第一综合99久久| 丰满熟女人妻一区二区三| 亚洲精品按摩视频| 国产丝袜视频在线播放| 亚洲伊人第一页| 亚洲欧美色图| 欧美激情国内自拍| 亚洲国产精品99久久久久久久久| 国产成人精品一区二三区| 精品国产制服丝袜高跟| 精品麻豆一区二区三区| 国产人妖伪娘一区91| 日韩电影一区| 亚洲少妇久久久| 国产精品妹子av| 一二区在线观看| 日韩在线不卡视频| 精品国产黄a∨片高清在线| 午夜午夜精品一区二区三区文| 首页欧美精品中文字幕| 亚洲精品午夜视频| 在线精品视频免费观看| 国产福利在线视频| 国产精品稀缺呦系列在线| 日韩电影免费在线观看| 91高清国产视频| 亚洲色图视频免费播放| 国产av无码专区亚洲av| 欧美大码xxxx| 91精品国产自产精品男人的天堂 | 日韩久久免费电影| 在线看片国产福利你懂的| 欧美h视频在线| 欧美aaaaaa午夜精品| 小向美奈子av| 精品少妇一区二区| 国产后进白嫩翘臀在线观看视频| 国产精品久久久久久久久婷婷| 亚洲美洲欧洲综合国产一区| 亚洲第一成人网站| 欧美视频一区二区三区在线观看 | 国产精品永久免费观看| 欧美大人香蕉在线| 日韩大尺度视频| 欧美性少妇18aaaa视频| www.av在线播放| 4444kk亚洲人成电影在线| 99精品视频免费全部在线| 国产麻豆天美果冻无码视频| 欧美视频在线观看一区| 欧美24videosex性欧美| 欧美凹凸一区二区三区视频| 日韩和的一区二区| 青青青在线免费观看| 日韩麻豆第一页| av在线国产精品| 亚洲熟妇无码另类久久久| 国产欧美日韩三区| 精品国产99久久久久久宅男i| 欧美精品久久久久| 禁断一区二区三区在线| 国产精品久久久久野外| 天天色天天操综合| p色视频免费在线观看| caoporen国产精品| 日韩不卡一二三区| 麻豆成人在线视频| 国产亚洲精品91在线| 亚洲图色一区二区三区| 99热成人精品热久久66| 最新日韩在线视频| 四虎影视2018在线播放alocalhost| 国产精品欧美激情在线播放| 一区在线视频观看| 波多野结衣欲乱| 日韩精品免费在线视频观看| 国产精品日本一区二区三区在线 | 韩国精品在线观看| 亚洲男人的天堂在线视频| 久久中国妇女中文字幕| 蜜桃成人av|