国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

【患者安全】大語言模型-誤診卓越診斷?

0
分享至


Large Language Models

—Misdiagnosing Diagnostic Excellence?

編譯自:Sumant R. Ranji, MD,JAMA Netw Open. 2024;7(10) 圖片來自網(wǎng)絡(luò)。


在最近的一次美國國家醫(yī)學(xué)科學(xué)院會議上,Goh團(tuán)隊的研究成果引起了聽眾的震驚與擔(dān)憂。這項隨機(jī)臨床試驗評估了全科醫(yī)生在診斷6個模擬病例時的表現(xiàn)。醫(yī)生被分為兩組:一組僅使用常規(guī)在線資源,另一組除了這些資源外,還額外使用大語言模型(LLM) (ChatGPT Plus [GPT-4]; OpenAI)。此外,研究還單獨測試了LLM的診斷能力。為了客觀評價診斷質(zhì)量,研究團(tuán)隊設(shè)計了一套評分標(biāo)準(zhǔn),由專家對臨床推理過程進(jìn)行盲評,包括醫(yī)生的最終診斷、鑒別診斷及支持/不支持診斷的因素。

研究的主要發(fā)現(xiàn)是:使用LLM輔助診斷的醫(yī)生得分與僅使用傳統(tǒng)資源的醫(yī)生相比,并沒有顯著提高。然而,LLM單獨完成診斷時的表現(xiàn)卻顯著優(yōu)于任何一組醫(yī)生。這一結(jié)果引發(fā)了不少人對自身職業(yè)未來的擔(dān)憂,不少與會者甚至擔(dān)憂:“我們會失業(yè)嗎?”

Goh團(tuán)隊的試驗在探索生成式人工智能(AI)應(yīng)用于診斷方面邁出了重要一步。該研究通過分析未經(jīng)專業(yè)LLM培訓(xùn)的醫(yī)生如何在實際場景中使用GPT-4,為現(xiàn)階段和可預(yù)見未來的臨床實踐提供了真實的評估。值得注意的是,這項研究沒有單純關(guān)注最終診斷的準(zhǔn)確性,而是強(qiáng)調(diào)診斷過程的質(zhì)量,這種更全面的評價方法值得未來研究借鑒。研究同時表明,僅靠生成式AI并不能提高診斷質(zhì)量,醫(yī)生需要接受專門的培訓(xùn),才能充分發(fā)揮這類工具的潛力。


作者提醒道:“研究結(jié)果并不意味著LLM可以獨立承擔(dān)診斷任務(wù),醫(yī)生的監(jiān)督仍然必不可少。”然而,LLM單獨診斷表現(xiàn)優(yōu)于醫(yī)生的結(jié)果,勢必成為引發(fā)關(guān)注的核心話題。對于以診斷為核心職業(yè)身份的醫(yī)生來說,使用LLM進(jìn)行診斷的前景既讓人興奮,也讓人感到不安。隨著更多關(guān)于LLM診斷能力的研究發(fā)表,醫(yī)生應(yīng)當(dāng)如何看待這些新技術(shù)的挑戰(zhàn)和機(jī)遇呢?

需要謹(jǐn)慎對待的是,LLM在模擬病例中的優(yōu)異表現(xiàn)是否可以推廣到實際的臨床實踐中。模擬病例的診斷條件通常是理想化的——病史、體格檢查結(jié)果、實驗室及影像學(xué)數(shù)據(jù)都以整齊有序的方式呈現(xiàn),便于構(gòu)建鑒別診斷。而實際臨床診斷是一個復(fù)雜的迭代過程,往往需要在繁雜的環(huán)境中整合來自患者、家屬及多學(xué)科團(tuán)隊的多種信息,這種非線性的過程需要在不斷獲取新信息的基礎(chǔ)上不斷修正診斷,同時還需要將治療反應(yīng)納入診斷推理,診斷和治療之間的區(qū)別往往變得模糊。

那么,LLM在接近真實臨床環(huán)境下的表現(xiàn)如何?最近的一項研究評估了LLM在處理4種常見腹部疾病的診斷和管理方案制定中的表現(xiàn)。研究中,LLM接收的是逐步呈現(xiàn)的患者數(shù)據(jù),每個步驟后需總結(jié)信息并提出診斷或額外檢查建議。完成診斷后,LLM還需制定治療計劃。然而,在這種現(xiàn)實化的場景中,LLM的表現(xiàn)很差:除最簡單的病例外,其診斷表現(xiàn)顯著遜色于醫(yī)生,同時,LLM 也未能始終如一地要求進(jìn)行適當(dāng)?shù)脑\斷檢查,即使在得出正確診斷后也經(jīng)常提出錯誤的治療建議。

盡管LLM的性能在不斷提升,但當(dāng)前的局限性仍需關(guān)注。即便未來LLM能夠基于不斷變化的信息完成復(fù)雜的迭代診斷,它是否能夠有效減少診斷錯誤帶來的傷害仍然值得懷疑。

醫(yī)學(xué)診斷中的錯誤通常源于系統(tǒng)性失誤(潛在錯誤),這些問題讓個體醫(yī)生的錯誤(顯性錯誤)最終影響患者。生成式AI的優(yōu)勢在于幫助醫(yī)生減少認(rèn)知錯誤,即數(shù)據(jù)收集和整合方面的失敗。但認(rèn)知錯誤并不是孤立于醫(yī)療系統(tǒng)之外的,它往往是醫(yī)生在充滿潛在錯誤的環(huán)境中工作時的表現(xiàn),例如人員不足、工作壓力大、不完善的電子病歷系統(tǒng)以及醫(yī)護(hù)團(tuán)隊溝通不暢。這些系統(tǒng)性問題會增加醫(yī)生的認(rèn)知負(fù)擔(dān),阻礙其做出準(zhǔn)確決策。專注于 AI 的生成潛力以防止認(rèn)知錯誤,可能會最大限度地減少系統(tǒng)故障在診斷錯誤中的作用,并分散人們對解決這些問題的注意力。

實現(xiàn)卓越診斷需要建立一個支持醫(yī)生準(zhǔn)確決策并全程服務(wù)患者的醫(yī)療體系。生成式AI可以成為其中的重要組成部分,但要成功地將LLM融入臨床診斷,還需要技術(shù)的進(jìn)一步完善、醫(yī)生的系統(tǒng)性培訓(xùn),以及AI與臨床環(huán)境的深度融合。即使這些條件都具備,也不應(yīng)期待AI能夠獨立解決所有診斷問題。


對于那些認(rèn)為Goh團(tuán)隊的研究結(jié)果威脅到醫(yī)生職業(yè)安全的人來說,本文試驗中使用AI平臺的回答或許能帶來一些安慰。在試驗中,研究團(tuán)隊使用了加州大學(xué)舊金山分校的安全AI平臺(Versa),并向其提出以下問題:“既然最近的研究顯示LLM在模擬病例中的診斷準(zhǔn)確性已經(jīng)達(dá)到甚至超過了醫(yī)生,這是否意味著未來LLM會取代醫(yī)生?”

LLM的回答如下:

“大語言模型(LLM)在模擬病例診斷中顯示出前景,但完全取代醫(yī)生并不現(xiàn)實。LLM可以通過提供決策支持、處理大量數(shù)據(jù)和提出診斷建議來增強(qiáng)醫(yī)療實踐。然而,醫(yī)學(xué)實踐還包括復(fù)雜的人際互動、倫理判斷和體格檢查,這些是AI無法完全復(fù)制的。LLM是提升醫(yī)療質(zhì)量的工具,而非醫(yī)生的替代品。LLM的整合應(yīng)以協(xié)作為目標(biāo),而非取代?!?/strong>

這段回應(yīng)恰如其分地總結(jié)了生成式AI在醫(yī)療領(lǐng)域的定位。我們不應(yīng)將其視為威脅,而應(yīng)將其視為一種可以與醫(yī)生合作的強(qiáng)大工具,共同推動醫(yī)療診斷的進(jìn)步。


【原文】 https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2825399

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
又死了一對一年賺200萬的

又死了一對一年賺200萬的

求實處
2026-04-11 22:29:22
0-1!熱刺14輪不勝+近8場僅1分 無緣逃離降級區(qū) 德澤爾比遭開門黑

0-1!熱刺14輪不勝+近8場僅1分 無緣逃離降級區(qū) 德澤爾比遭開門黑

我愛英超
2026-04-12 23:07:29
美國之恥:30分鐘滾出去。伊朗利用狼群戰(zhàn)術(shù),將美軍逼出霍爾木茲

美國之恥:30分鐘滾出去。伊朗利用狼群戰(zhàn)術(shù),將美軍逼出霍爾木茲

梁訊
2026-04-12 14:59:13
女大學(xué)生吐槽“普信男”視頻火了,卻因長相被嘲:你也照照鏡子吧

女大學(xué)生吐槽“普信男”視頻火了,卻因長相被嘲:你也照照鏡子吧

世界圈
2026-04-12 00:10:16
如何優(yōu)雅地謀殺一座城:陳麗華的推土機(jī)與華新民的廢紙

如何優(yōu)雅地謀殺一座城:陳麗華的推土機(jī)與華新民的廢紙

有戲
2026-04-11 09:21:04
我敢說,大部分會跟我一樣,選擇黑色衣服那個女孩!

我敢說,大部分會跟我一樣,選擇黑色衣服那個女孩!

草莓解說體育
2026-04-12 17:05:01
隨著曼城3-0,熱刺0-1,維拉1-1,紐卡1-2,英超最新積分榜出爐

隨著曼城3-0,熱刺0-1,維拉1-1,紐卡1-2,英超最新積分榜出爐

側(cè)身凌空斬
2026-04-13 03:08:52
特朗普稱美國不允許伊朗通過出售石油賺錢

特朗普稱美國不允許伊朗通過出售石油賺錢

新華社
2026-04-12 23:18:14
長談21小時未果,萬斯離開前豎大拇指,特朗普關(guān)鍵時刻看格斗賽 ,伊朗:不著急

長談21小時未果,萬斯離開前豎大拇指,特朗普關(guān)鍵時刻看格斗賽 ,伊朗:不著急

紅星新聞
2026-04-12 15:44:23
陰雨何時休?下周天氣趨勢來了!

陰雨何時休?下周天氣趨勢來了!

上海靜安
2026-04-12 18:35:00
鄭麗文返臺發(fā)表講話,賴清德急了,民眾黨暴露真面目,不簡單

鄭麗文返臺發(fā)表講話,賴清德急了,民眾黨暴露真面目,不簡單

DS北風(fēng)
2026-04-12 19:36:09
今年最慘淡的行業(yè)是哪個?理發(fā)店店主納悶:大家剪頭不用去網(wǎng)上吧

今年最慘淡的行業(yè)是哪個?理發(fā)店店主納悶:大家剪頭不用去網(wǎng)上吧

白宸侃片
2026-04-12 17:33:25
委內(nèi)瑞拉徹底炸鍋:97天的沉默,終于變成怒吼

委內(nèi)瑞拉徹底炸鍋:97天的沉默,終于變成怒吼

策略述
2026-04-12 16:55:28
知名時政記者爆料王石被抓,本人回應(yīng)了

知名時政記者爆料王石被抓,本人回應(yīng)了

財通社
2026-04-12 19:53:51
2-0奪冠!“辛卡”大戰(zhàn)落幕:世界第一易主,辛納獨創(chuàng)6大個人紀(jì)錄

2-0奪冠!“辛卡”大戰(zhàn)落幕:世界第一易主,辛納獨創(chuàng)6大個人紀(jì)錄

大秦壁虎白話體育
2026-04-12 23:33:44
劉亦菲.竟也有這么洶涌的照片,太奔放了微信朋友圈

劉亦菲.竟也有這么洶涌的照片,太奔放了微信朋友圈

情感大頭說說
2026-04-13 00:50:52
有人用銼刀把MacBook棱角磨圓了,蘋果設(shè)計師看了沉默

有人用銼刀把MacBook棱角磨圓了,蘋果設(shè)計師看了沉默

爬蟲飼養(yǎng)員
2026-04-12 09:20:43
曝何超蕸乳癌復(fù)發(fā)去世,何超儀曾說她太好欺負(fù),多位港民曝其人品

曝何超蕸乳癌復(fù)發(fā)去世,何超儀曾說她太好欺負(fù),多位港民曝其人品

古希臘掌管松餅的神
2026-04-12 17:20:48
耶魯大學(xué)教授夸贊特朗普:他像狐貍一樣聰明,很多決策都是理性的

耶魯大學(xué)教授夸贊特朗普:他像狐貍一樣聰明,很多決策都是理性的

爆角追蹤
2026-04-12 13:15:47
創(chuàng)造歷史!柏林聯(lián)盟任命五大聯(lián)賽首位女性主教練

創(chuàng)造歷史!柏林聯(lián)盟任命五大聯(lián)賽首位女性主教練

體壇周報
2026-04-12 19:42:10
2026-04-13 06:07:00
醫(yī)護(hù)健康科普 incentive-icons
醫(yī)護(hù)健康科普
分享健康科普知識
2514文章數(shù) 2415關(guān)注度
往期回顧 全部

科技要聞

理想稱遭惡意拉踩,東風(fēng)日產(chǎn):尊重同行

頭條要聞

美中央司令部:4月13日起封鎖伊朗港口海上交通

頭條要聞

美中央司令部:4月13日起封鎖伊朗港口海上交通

體育要聞

創(chuàng)造歷史!五大聯(lián)賽首位女性主教練誕生

娛樂要聞

賭王女兒何超蕸病逝,常年和乳癌斗爭

財經(jīng)要聞

美伊談判破裂的三大癥結(jié)

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態(tài)度原創(chuàng)

時尚
數(shù)碼
旅游
家居
軍事航空

被周冬雨、林更新戴上熱搜的珠寶,究竟有多驚艷?

數(shù)碼要聞

蘋果版套娃 買臺Mac Pro回家:打開一看里面還藏著一臺Mac Pro

旅游要聞

北京:郁金香迎來盛花期

家居要聞

復(fù)古風(fēng)格 自然簡約

軍事要聞

美國副總統(tǒng)萬斯:美伊談判未能達(dá)成協(xié)議

無障礙瀏覽 進(jìn)入關(guān)懷版