精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-4V醫(yī)學(xué)執(zhí)照考試成績(jī)超過(guò)大部分醫(yī)學(xué)生,AI加入臨床還有多遠(yuǎn)?

人工智能 新聞
在最新的研究中,來(lái)自馬薩諸塞大學(xué)、復(fù)旦大學(xué)的跨學(xué)科研究人員團(tuán)隊(duì)利用生成式多模態(tài)預(yù)訓(xùn)練模型 GPT-4V (ision) 突破了人工智能在醫(yī)學(xué)問(wèn)答中的最佳水平。

人工智能(AI)在醫(yī)學(xué)影像診斷方面的應(yīng)用已經(jīng)有了長(zhǎng)足的進(jìn)步。然而,在未經(jīng)嚴(yán)格測(cè)試的情況下,醫(yī)生往往難以采信人工智能的診斷結(jié)果。對(duì)于他們來(lái)說(shuō),理解人工智能根據(jù)醫(yī)學(xué)影像給出的判別,需要增加額外的認(rèn)知成本。

為了增強(qiáng)醫(yī)生對(duì)輔助醫(yī)療的人工智能之間的信任,讓 AI 通過(guò)一個(gè)醫(yī)生必須通過(guò)的資格考試或許是一個(gè)有效的方法。醫(yī)學(xué)執(zhí)照考試是用來(lái)評(píng)估醫(yī)生專業(yè)知識(shí)和技能的標(biāo)準(zhǔn)化考試,是衡量一個(gè)醫(yī)生是否有能力安全有效地護(hù)理患者的基礎(chǔ)。

在最新的研究中,來(lái)自馬薩諸塞大學(xué)、復(fù)旦大學(xué)的跨學(xué)科研究人員團(tuán)隊(duì)利用生成式多模態(tài)預(yù)訓(xùn)練模型 GPT-4V (ision) 突破了人工智能在醫(yī)學(xué)問(wèn)答中的最佳水平。研究測(cè)試了 GPT-4V 回答美國(guó)醫(yī)學(xué)執(zhí)照考試題的能力,特別是題目包含圖像的考題 —— 這對(duì)醫(yī)療人工智能系統(tǒng)來(lái)說(shuō)一直以來(lái)都是一項(xiàng)挑戰(zhàn)。

該研究表明,GPT-4V 不僅超越了 GPT-4 和 ChatGPT 等前輩,還超越了大部分醫(yī)學(xué)生,為人工智能能夠作為輔助診斷和臨床決策的工具提供了理論上的可能。該研究分析了 GPT-4V 在不同醫(yī)學(xué)子領(lǐng)域的性能。

同時(shí),該研究還指出了醫(yī)療人工智能在一致解釋方面的局限性,強(qiáng)調(diào)了人機(jī)協(xié)作在未來(lái)醫(yī)療診斷中的重要性。

圖片

論文鏈接:https://www.medrxiv.org/content/10.1101/2023.10.26.23297629v3

測(cè)試問(wèn)題收集

該研究中,用來(lái)測(cè)試人工智能醫(yī)學(xué)執(zhí)照考試的題型為涉及不同醫(yī)學(xué)領(lǐng)域、難度各異的帶有圖像的選擇題。論文作者們選擇了來(lái)自美國(guó)醫(yī)學(xué)執(zhí)照考試(USMLE)、醫(yī)學(xué)生考試題庫(kù)(AMBOSS)和診斷放射學(xué)資格核心考試(DRQCE)的三套選擇題,共計(jì) 226 道題(28 個(gè)醫(yī)學(xué)領(lǐng)域),來(lái)測(cè)試 GPT-4V 的準(zhǔn)確性。

其中 AMBOSS 和 DRQCE 的數(shù)據(jù)未公開,需要用戶注冊(cè)后才能獲取。AMBOSS 數(shù)據(jù)集中的每個(gè)問(wèn)題都設(shè)定有對(duì)應(yīng)的難度。問(wèn)題按難易程度分五級(jí),1、2、3、4 和 5 級(jí)分別代表學(xué)生第一次作答時(shí)最容易答對(duì)的 20%、20%-50%、50%-80%、80%-95% 和 95%-100% 的問(wèn)題。

此外,作者們還收集了醫(yī)療專業(yè)人士的偏好,用以評(píng)估 GPT-4V 的解釋是否違背醫(yī)學(xué)常識(shí)。當(dāng) GPT-4V 做錯(cuò)的時(shí)候,作者們還收集了來(lái)自醫(yī)療專業(yè)人士的反饋,用來(lái)改善 GPT-4V。

圖片用美國(guó)醫(yī)學(xué)執(zhí)照考試(USMLE)中包含圖像的考題測(cè)試 GPT-4V。

準(zhǔn)確性

結(jié)果顯示,GPT-4V 在帶有圖像的醫(yī)學(xué)執(zhí)照考試題上表現(xiàn)出了很高的準(zhǔn)確率,分別在 USMLE、AMBOSS 和 DRQCE 上達(dá)到了 86.2%、62.0% 和 73.1%,遠(yuǎn)遠(yuǎn)超過(guò)了 ChatGPT 和 GPT-4。與準(zhǔn)備考試的學(xué)生相比,GPT-4V 的大致排名能達(dá)到前 20-30% 的水平。

而在 2022 年,美國(guó)醫(yī)學(xué)執(zhí)照考試大約有前 90% 的考生通過(guò)了考試,這意味著 GPT-4V 想要獲得通過(guò),也相對(duì)較為輕松。GPT-4V 的準(zhǔn)確率反映了它掌握大量生物醫(yī)學(xué)和臨床科學(xué)知識(shí),也能夠解決醫(yī)患相處中遇到的問(wèn)題。這些都是進(jìn)入醫(yī)學(xué)臨床實(shí)踐的必備技能。

GPT-4V在美國(guó)醫(yī)學(xué)執(zhí)照考試(USMLE)的測(cè)試表現(xiàn)遠(yuǎn)遠(yuǎn)超過(guò)了 ChatGPT 和 GPT-4。

在使用提示和不使用提示的情況下,GPT-4V 在 AMBOSS 的準(zhǔn)確率分別為 86% 和 63%。隨著問(wèn)題難度的增加,不使用提示時(shí) GPT-4V 的表現(xiàn)呈現(xiàn)下降趨勢(shì)(卡方檢驗(yàn),顯著性水平 0.05)。然而,當(dāng)使用提示提問(wèn)時(shí),這種下降趨勢(shì)并未明顯觀察到。這表明,來(lái)自醫(yī)療專業(yè)人士的提示可以很好的幫助 GPT-4 做出正確的決策。

圖片

GPT-4V 和學(xué)生在不同難度 AMBOSS 考試上的準(zhǔn)確率

解釋性

在解釋質(zhì)量方面,作者們發(fā)現(xiàn),當(dāng) GPT-4V 回答正確時(shí),醫(yī)療專業(yè)人士對(duì) GPT-4V 給出的解釋與專家給出的解釋的偏好相差不大。這說(shuō)明 GPT-4V 的解釋具有可信度和專業(yè)性。作者們還發(fā)現(xiàn),在 GPT-4V 的解釋中,有超過(guò) 80% 的回答包含了對(duì)題目中圖像和文本的解讀,這說(shuō)明 GPT-4V 能夠利用多模態(tài)的數(shù)據(jù)來(lái)生成回答。

然而,當(dāng) GPT-4V 回答錯(cuò)誤時(shí),它的解釋中也存在一些嚴(yán)重的問(wèn)題,例如圖像誤解(Image misunderstanding)、文本幻覺(Text hallucination)、推理錯(cuò)誤(Reasoning error)等,這些問(wèn)題可能會(huì)影響 GPT-4V 的可靠性和可解釋性。

圖片

針對(duì)每道考試題,醫(yī)療專業(yè)人員從專家生成的解釋和 GPT-4V 生成的解釋中選擇偏好。考試分為 Step1, Step2CK, Step3 共 3 個(gè)階段。每個(gè)階段抽取 50 道題目進(jìn)行測(cè)試。

作者發(fā)現(xiàn)許多 GPT-4V 回答錯(cuò)誤的解釋是圖像誤解。在 55 個(gè)錯(cuò)誤回答中,有 42 個(gè)回答(76.3%)是由圖像理解錯(cuò)誤所導(dǎo)致的。相比之下,只有 10 個(gè)回答(18.2%)錯(cuò)誤歸因于文本幻覺。

針對(duì)圖像誤解,作者建議使用以圖像或者文字為形式的提示。例如,醫(yī)生可以用箭頭指示圖中重要的位置,或者用一兩句話來(lái)解釋圖像的意義來(lái)提示模型。當(dāng)醫(yī)生使用文字提示的時(shí)候,就有 40.5% (17/42 個(gè)) 之前錯(cuò)誤的回答被 GPT-4V 改正了。

輔助診斷的潛力

作者還展示了使用 GPT-4V 作為影像診斷輔助工具的可能性。基于一個(gè)高血壓病人的病例報(bào)告,醫(yī)生對(duì) GPT-4V 進(jìn)行提問(wèn)。定性分析表明,GPT-4V 能夠根據(jù) CT 掃描圖像、化驗(yàn)單和病人癥狀等其他信息,提供鑒別診斷和后續(xù)檢查的建議。詳細(xì)分析請(qǐng)參考原論文。

結(jié)論與展望

作者們認(rèn)為,GPT-4V 在帶有圖像的醫(yī)學(xué)執(zhí)照考試題上展現(xiàn)了非凡的準(zhǔn)確率,在臨床決策支持方面,GPT-4V 具備無(wú)窮的潛力。然而,GPT-4V 還需要改進(jìn)它的解釋質(zhì)量和可靠性,才能真正適用于臨床場(chǎng)景。

論文中嘗試使用提示來(lái)改進(jìn) GPT-4V 的判斷,取得了不錯(cuò)的效果,這為未來(lái)的研究提出了一個(gè)有希望的方向:開發(fā)更精細(xì)的人類人工智能協(xié)作系統(tǒng),使得其成為臨床環(huán)境中更可靠的工具。隨著技術(shù)的不斷進(jìn)步和研究不斷深入,我們有理由相信,AI 將在提高醫(yī)療質(zhì)量、減輕醫(yī)生工作負(fù)擔(dān)和促進(jìn)醫(yī)療服務(wù)普及化方面繼續(xù)發(fā)揮重要作用。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2025-07-23 13:18:22

2011-12-26 17:13:18

iPad統(tǒng)計(jì)App

2024-02-06 09:00:00

GPT-4VLLaVA大型語(yǔ)言

2023-10-19 09:32:45

自動(dòng)駕駛技術(shù)

2023-12-04 13:51:00

模型數(shù)據(jù)

2010-07-07 14:47:03

SQL Server

2025-05-13 15:10:50

AI用戶模型

2023-12-12 12:43:19

AI訓(xùn)練

2023-11-05 15:13:38

AI測(cè)評(píng)

2025-08-15 14:53:43

2018-08-31 07:33:58

2015-08-04 09:56:48

2010-11-18 12:44:25

LibreOffice

2023-12-01 12:32:04

數(shù)據(jù)訓(xùn)練

2019-08-09 09:40:45

AI 數(shù)據(jù)人工智能

2018-11-25 21:53:10

人工智能AI開發(fā)者

2018-09-17 15:09:28

區(qū)塊鏈去中心化互聯(lián)網(wǎng)

2023-10-23 12:28:18

AI訓(xùn)練

2020-02-06 13:43:35

微軟WindowsWindows 10

2011-11-09 09:59:21

云計(jì)算IT管理
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

一区二区三区蜜桃| 国产成人自拍网| 色偷偷亚洲男人天堂| 日本77777| 8x8ⅹ拨牐拨牐拨牐在线观看| 久久日一线二线三线suv| 日韩暖暖在线视频| 一区二区国产精品精华液| 国产调教精品| 欧美日韩第一区日日骚| 人人干视频在线| 3p视频在线观看| 99久久国产综合色|国产精品| 国产成人在线一区| 国产小视频在线看| 久久视频精品| 国产手机视频精品| 一卡二卡三卡四卡五卡| 成人看片在线观看| 亚洲成av人片一区二区三区| 亚洲视频在线二区| 外国精品视频在线观看| 国产精品 欧美精品| 国产精品久久9| 免费看日韩毛片| 重囗味另类老妇506070| 尤物精品国产第一福利三区| 97香蕉碰碰人妻国产欧美| 国产精品天堂蜜av在线播放| 日韩欧美极品在线观看| 少妇一晚三次一区二区三区| 日本在线人成| wwwwxxxxx欧美| 国产精品久久亚洲| 国产精品爽爽久久| 日韩成人av影视| 日韩美女福利视频| 国产亚洲精品女人久久久久久| 国产精品毛片一区二区在线看| 亚洲美女福利视频网站| 五十路六十路七十路熟婆| **爰片久久毛片| 日韩一区二区电影| 日韩精品视频一二三| 日本欧美一区| 欧美在线|欧美| 日本一区二区黄色| 亚洲人成在线网站| 欧美性xxxx极品高清hd直播| 成人一区二区av| 五月花成人网| 一区二区欧美在线观看| 男人添女人下部视频免费| 黄网站在线播放| 亚洲色欲色欲www| 中文一区一区三区免费| 麻豆av在线导航| 亚洲婷婷综合色高清在线| 伊人色综合影院| 午夜不卡视频| 亚洲女与黑人做爰| 蜜臀av性久久久久蜜臀av| 成人黄视频在线观看| 亚洲精品视频免费看| 国产 欧美 日本| 国产亚洲成av人片在线观看| 欧美日韩国产精品一区| 男人日女人下面视频| 欧美色网一区| 在线视频你懂得一区二区三区| 91视频免费版污| 婷婷激情成人| 日韩精品一区二区三区四区| 中文字幕在线播放一区二区| 国产欧美自拍一区| 亚洲午夜久久久久久久| 男女男精品视频网站| 我不卡神马影院| 久久久久久久一区二区| 51国产偷自视频区视频| 奇米影视一区二区三区小说| 成人网页在线免费观看| 日本高清视频网站| 国产亚洲va综合人人澡精品| 三年中国中文在线观看免费播放 | 最新69国产成人精品视频免费| 91香蕉视频污在线观看| 狠狠爱综合网| 国产精品v片在线观看不卡| 91久久久久久久久久久久| 国产91富婆露脸刺激对白| 蜜桃av色综合| 黄色网页在线免费观看| 婷婷一区二区三区| 久久国产精品国产精品| 大型av综合网站| 这里只有精品在线播放| 久久久夜色精品| 日韩av一级片| 国产精品免费区二区三区观看| 可以在线观看的av网站| 一区二区在线观看视频在线观看| 91专区在线观看| 国产一区二区| 亚洲视频在线观看| 精品视频在线观看免费| 美女视频网站黄色亚洲| 国产精品推荐精品| 香蕉视频网站在线观看| 激情成人在线视频| 手机在线免费毛片| 精品免费一区二区| 韩国视频理论视频久久| 国产又黄又粗又猛又爽| 久久蜜桃av一区二区天堂 | 欧美日韩精品一区二区| 欧美肉大捧一进一出免费视频| 欧美韩日高清| 国产999精品久久久| 老司机午夜福利视频| 中文字幕一区av| www.xxx亚洲| 色88888久久久久久影院| 九九热精品在线| 91丨porny丨在线中文| 久久久久久久久久久电影| 你真棒插曲来救救我在线观看| 国产 日韩 欧美| 色999日韩欧美国产| 中文字幕在线欧美| 91丨九色丨蝌蚪富婆spa| 无码av天堂一区二区三区| 国产电影一区二区| 久久国产一区二区三区| 伊人久久成人网| 国产偷v国产偷v亚洲高清| 91免费视频网站在线观看| 国产精品自在线拍| 久久久噜噜噜久久久| 亚洲精品一级片| 一区二区三区欧美在线观看| 精品人妻一区二区三区免费| 亚洲乱码电影| **亚洲第一综合导航网站| 国内精品久久久久久野外| 欧美久久久久久久久中文字幕| 91社区视频在线观看| 免费欧美在线视频| 亚洲三区四区| 国产日本亚洲| 久久91亚洲精品中文字幕奶水| 国产日韩欧美一区二区东京热 | 亚洲欧美日韩视频一区| 欧美videossex极品| 久久久99精品免费观看不卡| 欧在线一二三四区| 青青草国产免费一区二区下载| 国产精品女人网站| 18视频免费网址在线观看| 欧美男女性生活在线直播观看 | 婷婷国产v国产偷v亚洲高清| 久久精品女同亚洲女同13| 亚洲影院免费| 亚洲二区自拍| 国产情侣一区在线| 91精品国产91久久久久久最新| 偷拍自拍在线| 欧美日免费三级在线| 日韩三级在线观看视频| 国产成人免费视频一区| 青青草原成人网| 日韩欧美不卡| av蓝导航精品导航| xxx欧美xxx| 色偷偷888欧美精品久久久| 国产美女主播在线观看| 午夜不卡av免费| 成人无码av片在线观看| 国产真实精品久久二三区| 久久艹国产精品| 久久不见久久见国语| 91香蕉嫩草影院入口| 免费v片在线观看| 中日韩美女免费视频网址在线观看| 国产精品久久久久久久久久久久久久久久久久 | 捆绑紧缚一区二区三区视频| 国产盗摄视频在线观看| 少妇高潮一区二区三区| 成人激情在线播放| av中文字幕在线看| 中文字幕亚洲图片| 国产 欧美 精品| 欧美视频第二页| 国产乡下妇女做爰视频| 国产精品午夜电影| 国产xxxx视频| 美女看a上一区| 精品国偷自产一区二区三区| 成人亚洲一区二区| 狠狠色噜噜狠狠狠狠色吗综合| 久久精品黄色| 97精品国产97久久久久久免费 | 2019亚洲男人天堂| 国产在线观看a视频| 日韩精品黄色网| 国产黄色大片网站| 欧洲亚洲国产日韩| 日韩欧美亚洲视频| 亚洲伦在线观看| 成人在线观看免费高清| 99久久国产综合精品女不卡| 日韩不卡的av| 韩国v欧美v日本v亚洲v| 中文字幕第80页| 99亚洲伊人久久精品影院红桃| 伊人婷婷久久| 成人婷婷网色偷偷亚洲男人的天堂| 国产精品久久精品国产| 四虎国产精品免费久久5151| 日本人成精品视频在线| av福利在线导航| 色综合久久天天综线观看| 92国产在线视频| 亚洲人精品午夜在线观看| 四虎精品一区二区三区| 日韩欧美国产三级电影视频| 国产又黄又猛又爽| 欧美午夜宅男影院| 国产中文字幕视频| 亚洲一区二三区| 欧美激情国产精品免费| 亚洲嫩草精品久久| 你懂得在线观看| 国产精品伦理在线| 在线免费观看视频| 国产女人aaa级久久久级 | 成 人 黄 色 片 在线播放| 欧美日韩国产首页| 真实的国产乱xxxx在线91| 色狠狠综合天天综合综合| 九九热在线免费观看| 欧美网站在线观看| 在线观看日本视频| 色一情一伦一子一伦一区| 老熟妇仑乱一区二区av| 色8久久人人97超碰香蕉987| 中文字幕免费观看| 在线国产亚洲欧美| 中文字幕av网站| 在线观看91视频| 亚洲午夜激情视频| 91精品免费在线观看| 国产黄色小视频在线观看| 日韩精品自拍偷拍| 日本黄色免费视频| 亚洲欧美国产一本综合首页| 酒色婷婷桃色成人免费av网| 国产一区二区三区在线看| 日本视频在线| 美女少妇精品视频| 国产高潮在线| 日韩av电影在线播放| 国产一区高清| 99re在线国产| 欧美激情影院| 日韩欧美电影一区二区| 青草国产精品| 久久人妻无码一区二区| 亚洲美女一区| 能在线观看的av网站| 狠狠色丁香久久婷婷综合_中| 夜夜爽久久精品91| 99久久99久久精品免费看蜜桃| v8888av| 国产精品夫妻自拍| 国产精品第56页| 欧美在线免费视屏| 性少妇videosexfreexxx片| 亚洲精品美女久久| 999国产在线视频| 欧美极品欧美精品欧美视频| 欧美电影h版| 91|九色|视频| 久久不见久久见中文字幕免费| 中国老女人av| 新狼窝色av性久久久久久| 岛国av在线免费| 从欧美一区二区三区| 免费观看a级片| 亚洲综合免费观看高清在线观看| 国产农村妇女aaaaa视频| 91麻豆精品国产91久久久久久久久| 五月激情婷婷网| 日韩亚洲成人av在线| 精品人人视频| 亚洲a中文字幕| 九色成人国产蝌蚪91| 视色,视色影院,视色影库,视色网| 国产精品亚洲产品| 性久久久久久久久久久久久久| 91亚洲精品一区二区乱码| 国产色无码精品视频国产| 粉嫩老牛aⅴ一区二区三区| 99久久久国产精品无码网爆| 亚洲品质视频自拍网| 欧美videos另类精品| 国产精品视频网址| 窝窝社区一区二区| 日本阿v视频在线观看| 激情伊人五月天久久综合| 夜夜春很很躁夜夜躁| 精品日韩视频在线观看| 亚洲精品国产suv一区| 久久久99免费视频| 91亚洲精品| 欧美日韩无遮挡| 日韩午夜av在线| 性高潮免费视频| 亚洲黄色免费网站| 97超碰中文字幕| 综合久久五月天| 天然素人一区二区视频| 久久免费看av| 一本色道久久综合亚洲精品高清 | 中文字幕一二区| 亚洲欧美自拍一区| 国产美女精品写真福利视频| 国产精品免费一区二区| 午夜精品亚洲| 亚洲综合123| 一色屋精品亚洲香蕉网站| 波多野结衣在线观看视频| 亚洲女人天堂av| www.成人爱| 日本一区二区三区四区在线观看| 国产情侣一区| 中文精品在线观看| 日韩欧美成人网| 国产中文在线| 国产精品777| 精品视频亚洲| 我看黄色一级片| 国产精品人成在线观看免费 | 特级片在线观看| 日韩欧美资源站| 久久电影网站| 国产精品一区二区不卡视频| 激情综合亚洲| 亚洲精品乱码久久久久久不卡| 天天色综合天天| 青梅竹马是消防员在线| 日本一本a高清免费不卡| 免费久久精品| 欧美精品性生活| 亚洲婷婷在线视频| 亚洲精品喷潮一区二区三区| 午夜精品视频在线| 伊人久久大香线蕉综合网站| 北条麻妃在线视频| 国产精品久久毛片| 国产又爽又黄免费软件| 久久久久久伊人| 最新国产一区| 一区二区三区 日韩| 亚洲码国产岛国毛片在线| 免费av网站观看| 国产999在线观看| 国产精品不卡| 人妻互换一二三区激情视频| 欧美日韩另类字幕中文| 成a人片在线观看www视频| 国产一区深夜福利| 一区二区视频欧美| 久久亚洲AV无码专区成人国产| 欧美日韩国产a| 超黄网站在线观看| 亚洲 日韩 国产第一区| 国产精品一级在线| 亚洲 欧美 成人| 久久亚洲精品毛片| 美国十次av导航亚洲入口| 手机在线免费观看毛片| 亚洲美女区一区| 久蕉依人在线视频| 亚洲mm色国产网站| 亚洲一卡久久| 精品国产精品国产精品| 亚洲精品国产欧美| 日韩福利在线观看| 欧美激情视频免费看| 国产精品电影院| 无码精品视频一区二区三区| 国产在线视频不卡| 国产婷婷精品| 91porn在线视频| 亚洲欧洲在线观看| 中文无码日韩欧| 性欧美1819| 欧美午夜片欧美片在线观看| a级在线观看|