精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

o1模型醫(yī)學(xué)推理驚人,超過人類醫(yī)生

發(fā)布于 2025-2-24 09:51
瀏覽
0收藏

在醫(yī)療領(lǐng)域,大模型的應(yīng)用和影響力正在不斷擴大。但當(dāng)前對于大模型在醫(yī)療任務(wù)中的評估主要依賴于選擇題基準(zhǔn)測試,這種方式存在很多局限性,例如,高度受限、無法真實反映臨床決策復(fù)雜性以及模型可能通過語義結(jié)構(gòu)答題等問題。


為了更全面真實地評估大模型在醫(yī)學(xué)推理任務(wù)中的實際能力,哈佛醫(yī)學(xué)院、馬里蘭大學(xué)醫(yī)學(xué)院、劍橋健康聯(lián)盟、斯坦福大學(xué)等通過OpenAI的o1-preview模型,設(shè)計了一系列嚴謹?shù)膶嶒灒ㄨb別診斷生成、推理展示、概率推理和管理推理等多個關(guān)鍵測試,并由經(jīng)驗豐富的專家醫(yī)師用經(jīng)過嚴格驗證的測量方法,對模型輸出的質(zhì)量進行全面且細致的評估

結(jié)果顯示,o1-preview在差異診斷生成、展示推理和管理推理等方面展現(xiàn)了超越人類水平的表現(xiàn),尤其是在需要批判性思維的任務(wù)如診斷和管理上表現(xiàn)非常出色。

o1模型醫(yī)學(xué)推理驚人,超過人類醫(yī)生-AI.x社區(qū)

在數(shù)據(jù)收集方面,研究團隊采用了多種評分系統(tǒng)和統(tǒng)計方法來評估o1-preview的表現(xiàn)。例如,對于鑒別診斷的質(zhì)量,兩位主治內(nèi)科醫(yī)師獨立使用Bond Score進行評分,該評分系統(tǒng)的范圍是0到5,其中5分代表包含確切目標(biāo)診斷的鑒別診斷列表,0分代表與目標(biāo)診斷無關(guān)的鑒別診斷列表。


對于測試計劃的質(zhì)量,評分使用了從0到2的Likert量表,通過將建議的測試計劃與案例中實際進行的診斷進行比較。此外,研究團隊還使用了線性加權(quán)Cohen's kappa來評估評分者之間的一致性,并通過討論解決不一致的評分。


在統(tǒng)計分析方面,研究團隊使用了R語言進行數(shù)據(jù)分析。他們比較了o1-preview與歷史上的GPT-4、主治醫(yī)師和住院醫(yī)師的表現(xiàn),并使用了McNemar's test、t-test和混合效應(yīng)模型等統(tǒng)計方法來評估模型之間的差異。


研究人員首先評估的是NEJM CPCs案例,是鑒別診斷生成器的傳統(tǒng)標(biāo)準(zhǔn)。o1-preview在這些案例中的表現(xiàn)令人印象深刻。


在143個案例中,o1-preview在78.3%的情況下將正確診斷包含在其鑒別診斷中,而在70個與GPT-4相同的案例中,o1-preview在88.6%的情況下提供了確切或非常接近的診斷,相較于GPT-4的72.9%有顯著提升。

o1模型醫(yī)學(xué)推理驚人,超過人類醫(yī)生-AI.x社區(qū)

在評估o1-preview選擇下一步診斷測試的能力時,兩位醫(yī)師對o1-preview生成的測試計劃進行了評分。


在132個案例中,o1-preview在87.5%的情況下選擇了正確的測試,11%的情況下選擇的測試計劃被認為有幫助,僅有1.5%的情況下會被認為無幫助。這些數(shù)據(jù)進一步證實了o1-preview在臨床決策支持中的潛力。


在NEJM Healer診斷案例中,o1-preview的表現(xiàn)同樣出色。這些案例是為評估臨床推理而設(shè)計的虛擬患者接觸,o1-preview在80個案例中的78個達到了完美的R-IDEA評分,遠高于GPT-4的47個、主治醫(yī)師的28個和住院醫(yī)師的16個。

o1模型醫(yī)學(xué)推理驚人,超過人類醫(yī)生-AI.x社區(qū)

R-IDEA評分是一個驗證過的10點評分系統(tǒng),用于評估記錄臨床推理的四個核心領(lǐng)域。這一結(jié)果表明o1-preview在展示臨床推理方面的能力遠超人類醫(yī)師和其他同類大模型。


在基于真實案例的Grey Matters管理案例中,o1-preview的表現(xiàn)同樣出色。在五個臨床小節(jié)中,o1-preview的得分中位數(shù)為86%,高于GPT-4的42%、使用GPT-4的醫(yī)師的41%和使用傳統(tǒng)資源的醫(yī)師的34%。

o1模型醫(yī)學(xué)推理驚人,超過人類醫(yī)生-AI.x社區(qū)

在與50位普通醫(yī)師比較的六個Landmark診斷案例中,o1-preview的表現(xiàn)與GPT-4相當(dāng),中位數(shù)得分為97%,而GPT-4為92%,使用GPT-4的醫(yī)師為76%,使用傳統(tǒng)資源的醫(yī)師為74%。這些數(shù)據(jù)表明o1-preview在診斷推理方面的能力與GPT-4相當(dāng),且優(yōu)于人類醫(yī)師。


在診斷概率推理案例中,o1-preview的表現(xiàn)與GPT-4相似,在估計測試前和測試后概率方面與GPT-4表現(xiàn)相近。然而,在冠狀動脈疾病的壓力測試中,o1-preview的密度更接近參考范圍。這一結(jié)果表明o1-preview在概率推理方面的能力與GPT-4相當(dāng),但在某些特定情況下可能更接近科學(xué)參考概率。


本文轉(zhuǎn)自 AIGC開放社區(qū)  ,作者:AIGC開放社區(qū)


原文鏈接:??https://mp.weixin.qq.com/s/p6D5YozZcmX14OFA8pdDgg??

收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
欧美成人精品一区二区| 亚洲激情图片qvod| 亲爱的老师9免费观看全集电视剧| 国产日韩欧美综合精品 | 激情婷婷综合网| 四虎在线免费看| 视频一区欧美日韩| 日韩中文字幕在线精品| 午夜大片在线观看| 麻豆国产在线| 中文av字幕一区| 国产精品成人v| 久久嫩草捆绑紧缚| 日韩精品一区二区三区中文| 五月婷婷激情综合| 日韩一区二区三区资源| www.国产麻豆| 日韩av一二三| 欧美黑人xxx| 岛国av免费观看| 韩国主播福利视频一区二区三区| 成人丝袜高跟foot| 456亚洲影院| 在线观看日本黄色| 日韩一区二区a片免费观看| 不卡av中文字幕| 久久在线精品| 欧美黑人巨大精品一区二区| 亚洲国产av一区| 亚洲成人偷拍| 精品视频一区二区不卡| 欧美成人三级在线视频| av在线电影免费观看| 成人污视频在线观看| 国产精品激情自拍| 日本少妇性高潮| 久久久久蜜桃| 亚洲精品国产精品国自产观看浪潮 | 天天影院图片亚洲| 久久99国产精品久久99果冻传媒| 亚洲男人的天堂网站| 精品久久久久久无码人妻| 亚洲国产综合在线观看| 欧美日韩午夜在线| 国产主播中文字幕| 成人mm视频在线观看| 色94色欧美sute亚洲线路一ni| 欧美日韩一区二区三| 亚洲国产精品久久人人爱潘金莲 | 26uuu日韩精品一区二区| 2021亚洲天堂| 国产精品av一区二区| 欧美成人第一页| 日韩欧美综合视频| 欧美激情无毛| 欧美疯狂xxxx大交乱88av| 强乱中文字幕av一区乱码| 91精品国产成人观看| 不卡av在线播放| 538精品在线视频| 欧美在线亚洲综合一区| 久热在线中文字幕色999舞| 综合五月激情网| 国产在线综合视频| 日韩一级淫片| 日韩久久精品一区| 北京富婆泄欲对白| 欧美黄视频在线观看| 日韩欧美国产1| 亚洲婷婷在线观看| 免费成人结看片| 中文字幕亚洲综合久久| 免费在线黄色网| 精品91视频| 国产成人精品999| 在线观看免费视频一区| 国产麻豆成人传媒免费观看| 国产精品青青草| 色在线免费视频| 国产精品久久久久影院亚瑟| 97精品国产97久久久久久粉红| 少妇精品视频一区二区| 91视频精品在这里| 午夜精品一区二区三区在线观看 | 精品久久久久久久久久久久久久久久久 | 国产欧美一区二区三区四区| 国产精品熟女久久久久久| 国产在线不卡一区| 国产主播一区二区三区四区| 毛片网站在线观看| 亚洲狼人国产精品| 黄色免费视频大全| 日韩和的一区二在线| 欧美裸体一区二区三区| 中文字幕在线播放视频| av在线不卡顿| 欧美精品精品精品精品免费| 人人草在线观看| 国产一区二区精品久久| 九色91国产| 麻豆视频在线观看免费网站| 亚洲成人在线观看视频| 欧美美女一级片| 日韩av黄色在线| 欧美精品免费播放| 伊人中文字幕在线观看| 国产麻豆视频一区| 亚洲天堂免费看| 国产精品一区在线观看| 成全电影播放在线观看国语| 亚洲一区二区三区免费视频| 蜜臀视频一区二区三区| 96sao在线精品免费视频| 中文字幕免费国产精品| 成年人免费看毛片| 国产精品夜夜嗨| 日本在线免费观看一区| 超级白嫩亚洲国产第一| 欧美一区二区福利在线| 四虎国产精品成人免费入口| 伊人久久亚洲美女图片| 91九色蝌蚪国产| 成人影视在线播放| 欧美日韩亚洲视频一区| 欧美xxxxx少妇| 亚洲天堂一区二区三区四区| 国产精品久久久久久超碰| 三级小视频在线观看| 亚洲人成网站在线| 17c国产在线| 欧美日韩激情在线一区二区三区| 亚洲国内高清视频| 激情五月婷婷小说| 久久精品国产99久久6 | 97人妻精品视频一区| 成人天堂资源www在线| 法国空姐在线观看免费| 黄色精品视频| 亚洲人成电影网站色…| www.中文字幕在线观看| av在线不卡免费看| 777777av| 日韩三级视频| 69精品小视频| 午夜成人免费影院| 欧美日韩精品在线视频| 亚洲天堂成人av| 国产精品五区| 日本精品二区| 99热播精品免费| 中日韩美女免费视频网站在线观看| 国产精品无码无卡无需播放器| 欧美超碰在线| 成人黄色生活片| 91精品久久| 欧美成人女星排名| 色综合久久88色综合天天看泰| 国偷自产av一区二区三区麻豆| jizz性欧美2| 久久久久久国产免费| 亚洲精品久久久久久动漫器材一区 | 亚州精品国产精品乱码不99按摩| 久久久久久久电影| 无码精品a∨在线观看中文| 香蕉视频一区| 国产精品福利无圣光在线一区| 99热这里只有精品3| 一区二区免费在线| 在线免费播放av| 天堂成人免费av电影一区| 亚洲精品高清国产一线久久| 欧美网站免费| 九九久久久久久久久激情| 欧美特黄一级视频| 色婷婷综合久久久| 国产精品综合激情| 国产成人综合在线观看| 欧美色图色综合| 色综合蜜月久久综合网| 亚洲综合色av| 人成在线免费网站| 中文字幕精品国产| 亚洲精品久久久久久无码色欲四季 | av动漫免费观看| 136国产福利精品导航网址应用| 国产小视频国产精品| 亚洲影视一区二区| 亚洲精品中文在线影院| 大地资源二中文在线影视观看| 韩国久久久久| 日韩av大全| 亚洲国产高清在线观看| 日本伊人精品一区二区三区介绍| 亚洲精品国产精品乱码不卡| 色综合久久天天综合网| 午夜精品一区二区三级视频| 99精品1区2区| 精品综合久久久久| 久久精品观看| 国外成人在线视频| 亚洲中文字幕无码一区| 美女爽到呻吟久久久久| 性欧美18一19内谢| 亚洲免费观看高清完整版在线观| 日韩一区av在线| 日韩有码第一页| 3d成人h动漫网站入口| 欧美一级特黄视频| 亚洲老司机在线| 成人小视频免费看| 91色九色蝌蚪| 2025中文字幕| 精品一二三四在线| 91香蕉视频污版| 亚洲性人人天天夜夜摸| 一区二区视频在线观看| 深爱激情综合网| 国产精品毛片va一区二区三区| 国产99re66在线视频| 中文字幕日韩欧美在线视频| 性高潮久久久久久久久久| 欧美成人国产一区二区| 国产精品久久久久久久久毛片| 国产精品乱人伦中文| 亚洲男女在线观看| 国产激情一区二区三区桃花岛亚洲| 国产一级不卡视频| 99热在线成人| 亚洲欧洲国产精品久久| 神马电影久久| 久久久久久久久久久久久久一区| 亚洲十八**毛片| 国内精品小视频在线观看| 久操视频在线免费播放| 中文字幕一精品亚洲无线一区| 91亚洲精品国偷拍自产在线观看 | 亚洲在线播放电影| 黑丝美女一区二区| 免费试看一区| 美女毛片一区二区三区四区最新中文字幕亚洲 | 久久综合九九| 欧美巨大xxxx| 国内精品二区| 国产精品毛片久久久| 国产99视频精品免费视频36| 亚洲精品一二三**| 91原创国产| 999久久久精品一区二区| 91青青草免费在线看| 清纯唯美激情亚洲| 成人福利视频网站| 男人日女人bb视频| 午夜影院日韩| 精品www久久久久奶水| 久久精品午夜| 孩娇小videos精品| 精品一区二区三区欧美| 香蕉视频999| 国产精品中文字幕日韩精品| 岛国大片在线免费观看| 福利电影一区二区三区| 在线观看免费视频黄| 成人h版在线观看| 美女久久久久久久久久| 国产精品网站导航| 91杏吧porn蝌蚪| 亚洲国产色一区| 国产又黄又粗又爽| 欧美日韩一级黄| 国产日韩精品suv| 欧美精品一区视频| 免费观看成年在线视频网站| 中文字幕av一区二区三区谷原希美| 91影院在线播放| 91精品国产综合久久久久久漫画 | 欧美日韩一区二区欧美激情 | 日韩欧美在线视频| 精品黑人一区二区三区| 欧美区一区二区三区| 亚洲精品无遮挡| 亚洲欧美中文日韩在线| 激情成人四房播| 午夜精品视频在线| 国产亚洲欧美日韩精品一区二区三区 | 美女网站视频一区| 亚洲自拍中文字幕| 亚洲精品国产setv| 做爰高潮hd色即是空| 亚洲经典三级| 久久婷婷国产91天堂综合精品| 亚洲精品乱码| 色悠悠久久综合网| 国产ts人妖一区二区| 怡红院一区二区三区| 一区二区视频在线| 国产又黄又爽又色| 91精品国产综合久久久久久久久久 | 国产丝袜一区二区三区免费视频| 中文字幕一区二区人妻| 日韩一级大片在线观看| 男人久久精品| 欧美乱妇高清无乱码| 欧美7777| 成人看片视频| 日韩精品水蜜桃| 国产精品后入内射日本在线观看| 国产精品草草| 激情综合网俺也去| 国产99久久久国产精品潘金| 91麻豆精品国产91久久综合| 亚洲国产精品麻豆| 亚洲在线观看av| 精品爽片免费看久久| 婷婷丁香在线| 91精品久久久久久久久| 九九热线有精品视频99| 久久久亚洲国产精品| 国产精品亚洲第一区在线暖暖韩国| 欧美日韩久久婷婷| 国产欧美日韩精品在线| 91在线视频在线观看| 亚洲国产精品va在看黑人| 成人在线直播| 国产有码在线一区二区视频| 欧美女优在线视频| 2019日韩中文字幕mv| 国产专区综合网| 亚洲综合久久av一区二区三区| 亚洲日本乱码在线观看| 免费在线不卡av| 亚洲欧美中文在线视频| 亚洲最新无码中文字幕久久| 国产日韩欧美一区二区| 在线日韩中文| 黄色在线免费播放| 亚洲国产日韩在线一区模特| 国产日韩在线观看一区| 中文字幕亚洲欧美日韩在线不卡| 国产网站在线免费观看| 国产精品久久久久久久av电影 | 国产精品剧情一区二区在线观看| 久久精品国产欧美激情| 久久91视频| 一区二区视频在线免费| 看国产成人h片视频| 蜜桃av免费观看| 欧美精品vⅰdeose4hd| 精品国产白色丝袜高跟鞋| 91人成网站www| 午夜欧美理论片| 中国免费黄色片| 亚洲夂夂婷婷色拍ww47| 狠狠躁日日躁夜夜躁av| 国语自产精品视频在线看抢先版图片 | 三级毛片在线免费看| 91精品国产高清| 日韩av网址大全| 日韩a在线播放| 亚洲国产精品成人综合色在线婷婷| 激情综合五月网| 玖玖视频精品| 伊人久久青草| 日韩电影一二三区| a级黄色免费视频| 欧美一级高清大全免费观看| 51xtv成人影院| 国产午夜精品在线| 久久九九99| 网站永久看片免费| 欧美变态口味重另类| 婷婷电影在线观看| 天堂社区 天堂综合网 天堂资源最新版 | 日韩电影大全在线观看| 久久成人免费日本黄色| 欧美三级 欧美一级| 日韩va亚洲va欧洲va国产| 先锋欧美三级| 大桥未久一区二区三区| 99久久国产免费看| 国产一级精品毛片| 九色成人免费视频| 杨幂一区二区三区免费看视频| 日本中文字幕亚洲| 久久久久久电影| 99国产成人精品| 欧美亚洲另类激情另类| 久久国产精品成人免费观看的软件| 久久久一本二本三本| 日本一区二区三区四区| 国产精品国产一区二区三区四区| 中文字幕精品在线| 中文无码日韩欧| 欧美一区二区三区爽大粗免费| 成人夜色视频网站在线观看| 亚洲欧美日韩激情| 蜜臀久久99精品久久久无需会员| 激情小说亚洲| 成 年 人 黄 色 大 片大 全| 国产乱码精品一区二区三| 国产美女激情视频|