国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

百川發(fā)布M2 Plus,醫(yī)療幻覺率比DeepSeek低3倍!

0
分享至

作者|子川

來源|AI先鋒官

大模型競爭越來越激烈,今天你屠個(gè)榜,明天我拿個(gè)全球第一 !

但似乎沒有一款模型在醫(yī)療領(lǐng)域“拍胸脯”!

畢竟,幻覺問題至今無法解決,滿嘴跑火車的情況對(duì)醫(yī)療而言,實(shí)在“致命”。

昨天,百川智能發(fā)布了循證增強(qiáng)醫(yī)療大模型Baichuan-M2 Plus。

評(píng)測顯示,M2 Plus 的醫(yī)療幻覺率較通用大模型顯著降低,相比 DeepSeek 低約 3 倍,甚至優(yōu)于美國最火醫(yī)療產(chǎn)品 OpenEvidence,可信度比肩資深臨床醫(yī)生水準(zhǔn)。

先看M2 Plus的成績單——

在多國醫(yī)學(xué)知識(shí)考試中,得分優(yōu)于其他頂尖模型


比如,在美國執(zhí)業(yè)醫(yī)師資格考試(USMLE)中,M2 Plus拿下了97分,和GPT-5打了個(gè)平手,穩(wěn)居全球第一梯隊(duì)。

在中國執(zhí)業(yè)醫(yī)師資格考試 (NMLE),及格線360分,能考到500分以上就是大家眼里的學(xué)神,而M2 Plus直接考了568分。

不僅如此,M2 Plus的幻覺率也大幅度降低!


在病史分析、診斷思路、治療方案等真實(shí)復(fù)雜的核心醫(yī)療場景中,綜合幻覺率在所有大模型當(dāng)中最低。

相較 DeepSeek R1 最新版降低3倍,顯著領(lǐng)先 OpenEvidence和GPT-5。

為什么模型的幻覺率有明顯的下降?

百川給M2 Plus開了獨(dú)門藥方——首創(chuàng)“六源循證推理”(EAR范式。

簡單來說,就是三步走,給AI的嘴,上把鎖。

M2 Plus做的第一件事,就是把網(wǎng)上那些魚龍混雜的非專業(yè)信息全都屏蔽掉,只使用權(quán)威來源的醫(yī)學(xué)證據(jù)。

在此基礎(chǔ)上構(gòu)建了從證據(jù)、到實(shí)踐、再到真實(shí)世界反饋六層證據(jù)類型的知識(shí)體系。

  • 原始研究層:索引海量醫(yī)學(xué)期刊論文 4000 余萬篇,超過 PubMed 收錄數(shù)量,涵蓋基礎(chǔ)與臨床研究成果,是循證鏈條的起點(diǎn);

  • 證據(jù)綜述層:整合系統(tǒng)評(píng)價(jià)和 Meta 分析等高等級(jí)證據(jù),提供經(jīng)過匯總的研究結(jié)論;

  • 指南規(guī)范層:引入國際和國內(nèi)權(quán)威機(jī)構(gòu)發(fā)布的臨床指南、專家共識(shí)和行業(yè)標(biāo)準(zhǔn),確;卮鸱献钚乱(guī)范;

  • 實(shí)踐知識(shí)層:包含臨床病例報(bào)道、一線專家經(jīng)驗(yàn)和診療技巧等實(shí)用知識(shí),貼近醫(yī)療實(shí)踐場景;

  • 公共健康教育層:匯集權(quán)威科普和公共衛(wèi)生知識(shí),如疾病預(yù)防宣教、健康指導(dǎo)等內(nèi)容,服務(wù)大眾健康教育;

  • 監(jiān)管與真實(shí)世界層:涵蓋藥監(jiān)部門公告、臨床試驗(yàn)登記及大規(guī)模真實(shí)世界研究數(shù)據(jù)等信息,以反映最新的監(jiān)管動(dòng)態(tài)與人群研究結(jié)果;


這六個(gè)源頭像一個(gè)金字塔,從最底層的4000多萬篇醫(yī)學(xué)論文,到藥監(jiān)部門公告和真實(shí)世界的研究數(shù)據(jù),一層比一層精煉。

原始層回答“事實(shí)是否存在”、證據(jù)層回答“結(jié)論是否一致”、指南層回答“行業(yè)如何規(guī)范”、實(shí)踐層回答“醫(yī)生應(yīng)如何決策”、公共層回答“患者應(yīng)如何理解”、真實(shí)世界層回答“是否存在新風(fēng)險(xiǎn)”。

這么一套組合拳下來,就保證了AI的知識(shí)庫里全是干貨,先是從源頭上杜絕了胡說八道。

有了靠譜的知識(shí)庫還不夠,還得找得準(zhǔn)。普通AI搜索就像大海撈針,而M2 Plus用的是一套叫PICO框架的思維模式。

它會(huì)像醫(yī)生一樣,把你的問題拆解成四個(gè)核心要素:人群(P)、干預(yù)(I)、對(duì)照(C)、結(jié)局(O)。

比如你問“老年人睡前用呼吸機(jī)(CPAP)能改善高血壓嗎?”

它會(huì)立刻抓住“老年人”、“呼吸機(jī)”、“高血壓”這些關(guān)鍵點(diǎn),然后去知識(shí)庫里精準(zhǔn)匹配最高質(zhì)量的研究報(bào)告。

最關(guān)鍵的一步來了。為了防止AI在拿到證據(jù)后自由發(fā)揮。

百川給M2 Plus的訓(xùn)練機(jī)制加了道鎖:獎(jiǎng)勵(lì)“引用”,懲罰“臆測”。

在M2 Plus的系統(tǒng)里,如果回答能準(zhǔn)確引用權(quán)威指南或者文獻(xiàn),就會(huì)得高分;

一旦回答脫離了檢索到的證據(jù)就會(huì)受到懲罰。

同時(shí),它還內(nèi)置了內(nèi)置“證據(jù)評(píng)估器”,能自動(dòng)評(píng)估證據(jù)的可信度,優(yōu)先采用最高等級(jí)的證據(jù)。

最終的結(jié)果就是,M2 Plus的每一個(gè)關(guān)鍵回答,都會(huì)像寫論文一樣,清清楚楚地附上參考文獻(xiàn)和來源,讓你隨時(shí)可以查證。


AI看病這事兒,看起來慢慢要靠譜了。

掃碼邀請(qǐng)進(jìn)群,我們帶你一起來玩轉(zhuǎn)ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學(xué)一些AI搞錢技能。

往期文章回顧

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
閑魚不愧是全國最大的黑市,網(wǎng)民:只有你想不到,沒有你買不到

閑魚不愧是全國最大的黑市,網(wǎng)民:只有你想不到,沒有你買不到

小熊侃史
2026-01-16 07:40:07
TOP14位身高170以上的女神,有顏有燈有演技

TOP14位身高170以上的女神,有顏有燈有演技

素然追光
2026-01-02 02:45:02
在美國買了房,房子是你的不假一旦你無力負(fù)擔(dān)房產(chǎn)稅照樣無家可歸

在美國買了房,房子是你的不假一旦你無力負(fù)擔(dān)房產(chǎn)稅照樣無家可歸

忠于法紀(jì)
2025-12-23 21:02:38
醫(yī)生發(fā)現(xiàn):天冷堅(jiān)持戴口罩的人,用不了多久,身體或會(huì)有5大變化

醫(yī)生發(fā)現(xiàn):天冷堅(jiān)持戴口罩的人,用不了多久,身體或會(huì)有5大變化

霹靂炮
2025-12-04 22:54:47
海港跟山東泰山熱身賽大比分輸球!主要還是陣容不整

海港跟山東泰山熱身賽大比分輸球!主要還是陣容不整

80后體育大蜀黍
2026-01-27 17:13:04
思想配得上苦難

思想配得上苦難

求實(shí)處
2026-01-26 22:20:03
芬蘭訪華目的達(dá)成!在離開中國前,奧爾波送上了一份“重磅大禮”

芬蘭訪華目的達(dá)成!在離開中國前,奧爾波送上了一份“重磅大禮”

安珈使者啊
2026-01-27 20:08:30
馬斯克大兒子:首富長子不做,換姓又變性別,在父親心中“死了”

馬斯克大兒子:首富長子不做,換姓又變性別,在父親心中“死了”

半身Naked
2026-01-27 21:58:33
1976年,張耀祠率人前往毛遠(yuǎn)新的住處,向其宣布:依據(jù)中央的決定,對(duì)你實(shí)施保護(hù)審查

1976年,張耀祠率人前往毛遠(yuǎn)新的住處,向其宣布:依據(jù)中央的決定,對(duì)你實(shí)施保護(hù)審查

寄史言志
2026-01-26 11:58:21
庫頁島有“三不”:不屬于中國、不像俄羅斯、不承認(rèn)過去

庫頁島有“三不”:不屬于中國、不像俄羅斯、不承認(rèn)過去

壹知眠羊
2026-01-13 07:14:17
每天2包煙,頓頓8兩白酒,70歲李琦跟去世前楊少華狀態(tài)如出一轍

每天2包煙,頓頓8兩白酒,70歲李琦跟去世前楊少華狀態(tài)如出一轍

以茶帶書
2026-01-11 13:55:14
投資20億!同程中心總部大廈開工,蘇州未來新地標(biāo)!

投資20億!同程中心總部大廈開工,蘇州未來新地標(biāo)!

GA環(huán)球建筑
2026-01-26 18:02:24
哇塞!神級(jí)交易!湖人,老鐵太夠意思啦!

哇塞!神級(jí)交易!湖人,老鐵太夠意思啦!

體育新角度
2026-01-27 17:02:29
男子在路上看見陌生阿姨穿著印有寓意“死亡”字母的衣服便善意提醒,男子:“我們的父母可能也不認(rèn)識(shí)英文”

男子在路上看見陌生阿姨穿著印有寓意“死亡”字母的衣服便善意提醒,男子:“我們的父母可能也不認(rèn)識(shí)英文”

觀威海
2026-01-27 17:18:20
二婚在即?趙麗穎38歲生日,周放喊“好好愛她”,與林更新好事將近

二婚在即?趙麗穎38歲生日,周放喊“好好愛她”,與林更新好事將近

八卦王者
2026-01-27 14:04:27
172:233!高市重新洗牌,日本新首相人選出爐,對(duì)中國態(tài)度不簡單

172:233!高市重新洗牌,日本新首相人選出爐,對(duì)中國態(tài)度不簡單

榮亭小吏
2026-01-26 19:42:05
9年以后,再看王屹芝和章澤天的現(xiàn)狀,才知什么是“風(fēng)水輪流轉(zhuǎn)”

9年以后,再看王屹芝和章澤天的現(xiàn)狀,才知什么是“風(fēng)水輪流轉(zhuǎn)”

FancyMusic
2026-01-27 22:05:33
阿爾沙文:沒想到皇馬只落后巴薩1分,希望阿韋洛亞遭遇失敗

阿爾沙文:沒想到皇馬只落后巴薩1分,希望阿韋洛亞遭遇失敗

懂球帝
2026-01-27 21:08:06
為培養(yǎng)兒子踢進(jìn)國足,他賤賣上海8套房,如今兄弟倆都給他長臉

為培養(yǎng)兒子踢進(jìn)國足,他賤賣上海8套房,如今兄弟倆都給他長臉

一娛三分地
2026-01-24 16:14:55
三部門:對(duì)樹葬等不保留骨灰和土葬區(qū)遺體深埋不留墳頭等給予適當(dāng)獎(jiǎng)補(bǔ)

三部門:對(duì)樹葬等不保留骨灰和土葬區(qū)遺體深埋不留墳頭等給予適當(dāng)獎(jiǎng)補(bǔ)

新京報(bào)
2026-01-27 17:29:07
2026-01-27 22:43:00
AI先鋒官 incentive-icons
AI先鋒官
AIGC大模型及應(yīng)用精選與評(píng)測
421文章數(shù) 40關(guān)注度
往期回顧 全部

健康要聞

耳石脫落為何讓人天旋地轉(zhuǎn)+惡心?

頭條要聞

體大畢業(yè)生收費(fèi)教人騎自行車800元1次 網(wǎng)友直呼"離譜"

頭條要聞

體大畢業(yè)生收費(fèi)教人騎自行車800元1次 網(wǎng)友直呼"離譜"

體育要聞

冒充職業(yè)球員,比賽規(guī)則還和對(duì)手現(xiàn)學(xué)?

娛樂要聞

張雨綺風(fēng)波持續(xù)發(fā)酵,曝多個(gè)商務(wù)被取消

財(cái)經(jīng)要聞

多地對(duì)壟斷行業(yè)"近親繁殖"出手了

科技要聞

馬化騰3年年會(huì)講話透露了哪些關(guān)鍵信息

汽車要聞

標(biāo)配華為乾崑ADS 4/鴻蒙座艙5 華境S體驗(yàn)車下線

態(tài)度原創(chuàng)

房產(chǎn)
本地
手機(jī)
時(shí)尚
公開課

房產(chǎn)要聞

實(shí)景兌現(xiàn)在即!綠城,在海棠灣重新定義終極旅居想象!

本地新聞

云游中國|撥開云霧,巫山每幀都是航拍大片

手機(jī)要聞

消息稱三星Galaxy S26 Ultra手機(jī)確認(rèn)將采用真10bit屏幕

這些韓系穿搭最適合普通人!多穿深色、衣服基礎(chǔ),簡潔耐看

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版