国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

最強(qiáng)“醫(yī)生版ChatGPT”來了!Baichuan-M2 Plus橫掃人類醫(yī)學(xué)考試,可信度比肩資深專家!

0
分享至

AI醫(yī)療取得又一重大突破,團(tuán)隊來自中國!

10月22日,百川智能發(fā)布首個循證增強(qiáng)醫(yī)療大模型Baichuan-M2Plus,為醫(yī)療AI樹立了新標(biāo)桿。

此前百川發(fā)布的Baichuan-M2,作為全球最強(qiáng)開源醫(yī)療模型,引發(fā)行業(yè)廣泛關(guān)注。

而這次的升級版,更“靠譜”,也更“可用”。

Baichuan-M2 Plus的幻覺率較通用大模型顯著降低,相比Deepseek降低3倍,優(yōu)于美國最火醫(yī)療產(chǎn)品OpenEvidence,可信度比肩資深臨床醫(yī)生水準(zhǔn)。



在多個人類醫(yī)學(xué)考試中,Baichuan-M2 Plus取得了遠(yuǎn)超人類水平的成績。


能做到這些,原因在于百川把現(xiàn)代醫(yī)學(xué)的核心方法——循證醫(yī)學(xué)(Evidence-Based Medicine),深度融入到了AI之中。

簡單來說,就是讓AI像真正的醫(yī)生一樣,不靠猜測,而是基于可靠的醫(yī)學(xué)證據(jù)來做判斷。

通用大模型,雖然也能回答醫(yī)學(xué)問題,但很多答案是憑空生成的。它可能讀過很多網(wǎng)頁,但信息真假混雜。所以,它有時會一本正經(jīng)地胡說八道,這在醫(yī)學(xué)上是不可接受的。

畢竟,我們都不想將生命健康交給一個會信口開河的AI。

Baichuan-M2Plus“循證”為核心原則,真正切中了醫(yī)生和患者的痛點,讓醫(yī)療大模型備了真正的科學(xué)可信度。

眼下,AI醫(yī)療已成為海內(nèi)外最熱門的賽道之一,傳奇投資人木頭姐(Cathie Wood)表示「醫(yī)療保健是AI最被低估的應(yīng)用領(lǐng)域」;世界經(jīng)濟(jì)論壇提出80億AI醫(yī)生愿景,每個人都將擁有自己的私人醫(yī)生。

在美國,現(xiàn)象級醫(yī)療大模型產(chǎn)品OpenEvidence,因符合醫(yī)學(xué)認(rèn)知的循證增強(qiáng),已有40%美國醫(yī)生注冊使用,每月咨詢量達(dá)1650萬次。

AI將顛覆醫(yī)療行業(yè),已成為頂級資本的共識,OpenEvidence今年以來連續(xù)完成A、B、C輪融資,三輪累計融資金額達(dá)到4.85億美元,估值已達(dá)60億美金。

作為AI醫(yī)療的先行者,百川智能首創(chuàng)六源循證推理(EAR)范式,在美、日、英的醫(yī)療評測中均超過OpenEvidence,代表中國在世界大模型擂臺上再下一城。

即日起,M2-Plus將以API形式面向醫(yī)療AI開發(fā)者、科研機(jī)構(gòu)和行業(yè)合作伙伴全面開放;「百小應(yīng)」APP也已接入M2-Plus作為核心醫(yī)療問答引擎,為臨床醫(yī)生提供精準(zhǔn)的診療決策支持,幫助患者及家屬獲得最新最權(quán)威的醫(yī)學(xué)知識。

正如DeepSeek以極致的性能優(yōu)化與開放的合作精神掀起技術(shù)平權(quán)浪潮,百川智能同樣為醫(yī)療健康事業(yè)開啟了一個創(chuàng)新共贏的未來。


首創(chuàng)六源循證推理范式,樹立行業(yè)新標(biāo)桿

循證醫(yī)學(xué)(Evidence-Based Medicine, EBM)自20世紀(jì)90年代由加拿大麥克馬斯特大學(xué)提出以來,已成為現(xiàn)代醫(yī)學(xué)知識體系的核心范式。

在百川智能看來,循證不只是醫(yī)生的行為準(zhǔn)則,也應(yīng)成為AI系統(tǒng)的底層原則。

基于這一理念,M2PlusBaichuan-M2行業(yè)領(lǐng)先的醫(yī)療推理能力上再次進(jìn)化,首創(chuàng)了 “六源循證推理”范式,讓AI真正學(xué)會人類醫(yī)生的思維和臨床實踐方法。

六源循證:打造從原始研究到真實世界的完整知識體系

可靠的證據(jù)是“循證醫(yī)學(xué)”的基石,百川智能主動屏蔽了互聯(lián)網(wǎng)的非專業(yè)信息來源,只使用權(quán)威來源的醫(yī)學(xué)證據(jù),從根源上保證了數(shù)據(jù)質(zhì)量。

在循證醫(yī)學(xué)體系中,證據(jù)的采取遵循一套用于評估研究質(zhì)量和置信強(qiáng)度的模型,最可靠的知識存在于頂端,較不可靠的證據(jù)位于底部,構(gòu)成一個證據(jù)金字塔(Hierarchy of Evidence)。

M2 Plus在證據(jù)分層上也采用了這一原則,將醫(yī)學(xué)證據(jù)分為六個層級,并根據(jù)實際需求動態(tài)調(diào)用。

  • 原始研究層:索引海量醫(yī)學(xué)期刊論文
    4000
    萬篇,超過
    PubMed
    收錄數(shù)量,涵蓋基礎(chǔ)與臨床研究成果,是循證鏈條的起點;
  • 證據(jù)綜述層:整合系統(tǒng)評價和
    Meta
    分析等高等級證據(jù),提供經(jīng)過匯總的研究結(jié)論。
  • 指南規(guī)范層:引入國際和國內(nèi)權(quán)威機(jī)構(gòu)發(fā)布的臨床指南、專家共識和行業(yè)標(biāo)準(zhǔn),確?;卮鸱献钚乱?guī)范。
  • 實踐知識層:包含臨床病例報道、一線專家經(jīng)驗和診療技巧等實用知識,貼近醫(yī)療實踐場景。
  • 公共健康教育層:匯集權(quán)威科普和公共衛(wèi)生知識,如疾病預(yù)防宣教、健康指導(dǎo)等內(nèi)容,服務(wù)大眾健康教育。
  • 監(jiān)管與真實世界層:涵蓋藥監(jiān)部門公告、臨床試驗登記及大規(guī)模真實世界研究數(shù)據(jù)等信息,以反映最新的監(jiān)管動態(tài)與人群研究結(jié)果。


這一整套從證據(jù)、到實踐、再到真實世界反饋六層證據(jù)類型的知識體系,經(jīng)層層演化而來:原始層回答“事實是否存在”、證據(jù)層回答“結(jié)論是否一致”、指南層回答“行業(yè)如何規(guī)范”、實踐層回答“醫(yī)生應(yīng)如何決策”、公共層回答“患者應(yīng)如何理解”、真實世界層回答“是否存在新風(fēng)險”。

這讓模型從“生成答案”走向“以證據(jù)回答”,實現(xiàn)了從語言可信度到知識可信度的躍升。

循證檢索:從“找得到”躍升到“找得準(zhǔn)”

傳統(tǒng)的RAG 檢索往往追求“找得到”,而循證檢索追求“找得準(zhǔn)”。

M2 Plus采用PICO框架(人群 Population、干預(yù) Intervention、對照 Comparison、結(jié)局 Outcome)思維,將查詢轉(zhuǎn)化為結(jié)構(gòu)化醫(yī)學(xué)問題,并在六源數(shù)據(jù)庫中進(jìn)行分層匹配。

例如:當(dāng)輸入“老年OSA 患者使用 CPAP 能否改善高血壓?”時,系統(tǒng)優(yōu)先在高等級證據(jù)(系統(tǒng)綜述、RCT 元分析)中搜索,并自動辨識研究質(zhì)量、樣本量、置信區(qū)間與結(jié)局指標(biāo)。

這種方法克服了通用RAG的兩大缺陷:一是缺乏醫(yī)學(xué)語義理解(無法區(qū)分 CPAP 療效與依從性分析);二是無法辨別文獻(xiàn)可靠性(新聞與指南同權(quán))。

在此基礎(chǔ)上,M2 Plus能夠三步精準(zhǔn)鎖定“鐵證”:

第一步,智能提問:自動將用戶問題拆解成多個專業(yè)的PICO查詢,進(jìn)行“地毯式”證據(jù)搜索,兼顧精度與廣度。

第二步,精準(zhǔn)鎖定:通過自研的Medical Contextual Retrieval技術(shù),完整保留文獻(xiàn)的臨床因果鏈,避免信息割裂。

第三步,證據(jù)排序:內(nèi)置“審稿人”模型,自動評估證據(jù)等級(如RCT、Meta分析),將最可信、最相關(guān)的“鐵證”優(yōu)先呈現(xiàn)。

循證推理:讓模型像醫(yī)生一樣思考

如果說“六源循證”解決了醫(yī)療AI知識從哪來的問題,“PICO智能檢索”解決了如何快速找到正確證據(jù)的問題,那么最關(guān)鍵的一步是如何確保AI在手握證據(jù)時,不會“自由發(fā)揮”、脫離事實胡亂回答。

百川智能在M2 Plus中引入“循證增強(qiáng)訓(xùn)練”機(jī)制,為模型的回答過程“上了一道鎖”,從根本上改變了其生成邏輯,讓它學(xué)會“引用,而非臆測”:

首先,在訓(xùn)練中獎勵引用,懲罰臆測,準(zhǔn)確引用權(quán)威來源(如指南、文獻(xiàn))時會獲得高分,一旦回答脫離了檢索到的證據(jù)就會受到懲罰;

其次,內(nèi)置證據(jù)評估器,模型被訓(xùn)練得能夠自動評估檢索到的證據(jù)質(zhì)量,優(yōu)先采納高可信度的信息(如RCT、Meta分析),并將其無縫嵌入到推理鏈中;

第三,句句有據(jù),可回溯、可驗證:經(jīng)過訓(xùn)練,M2-Plus的回答風(fēng)格發(fā)生了根本性改變,在輸出關(guān)鍵結(jié)論時,自動附上參考文獻(xiàn)、指南出處等來源,這賦予了AI回答更高的可解釋性與可信賴度。


幻覺水平最低,DeepSeek降低3

這種“循證驅(qū)動”的生成邏輯,M2 Plus幾乎杜絕了無中生有的內(nèi)容。

在多場景評測中,其綜合幻覺率在所有大模型當(dāng)中最低,相較Deepseek R1最新版降低3倍,顯著領(lǐng)先OpenEvidence。

不僅如此,在病史分析、診斷思路、治療方案等真實復(fù)雜的核心醫(yī)療場景中,達(dá)到了與人類資深臨床專家同等的可信度。

301醫(yī)院的姜醫(yī)生提問,“目前公認(rèn)最有效的基因治療藥物靶向足細(xì)胞遞送方案有哪些?”

很多通用大模型回答這個問題時都產(chǎn)生了明顯幻覺,而M2 Plus的回答不僅查到了全球最新研究成果,還能按納米系統(tǒng)/ AAV病毒載體等維度分類。

姜醫(yī)生評價道:“引用文獻(xiàn)非常具有專業(yè)性、且信息源緊貼頂刊ERA等最新進(jìn)展,對足細(xì)胞基因治療這么前沿的方向,能幫我快速了解國際熱點技術(shù)路線,少走彎路?!?/p>

北京天壇醫(yī)院的熊醫(yī)生,在研究目前PACAP在偏頭痛中的研究進(jìn)展如何時發(fā)現(xiàn),頭痛相關(guān)的研究越來越多,想找到真正有價值的文獻(xiàn)并不容易,多數(shù)大模型給出的答案都因幻覺問題而不可用。

他試用時發(fā)現(xiàn),百小應(yīng)“能梳理全球PACAP偏頭痛研究,從機(jī)制到III期臨床試驗自動串聯(lián)證據(jù)鏈,不僅回答問題,更讓醫(yī)生站在未來看科研進(jìn)展。



多國醫(yī)學(xué)考試斷崖領(lǐng)先,遠(yuǎn)超人類醫(yī)生

美國執(zhí)業(yè)醫(yī)師資格考試(USMLE)是評估臨床知識和推理能力的黃金標(biāo)準(zhǔn),即便是經(jīng)驗豐富的臨床專家,要突破90分也極具挑戰(zhàn)。

在此項考試中,M2-Plus取得了驚人的97分,不僅遠(yuǎn)超人類考生平均水平,更與GPT-5的成績持平,穩(wěn)居全球第一梯隊,展示了其世界級的臨床問題解決能力。

中國執(zhí)業(yè)醫(yī)師資格考試(NMLE及格線為360分,對于廣大醫(yī)學(xué)生而言,能考到450分以上已是高分,超過500分則被視為“學(xué)神”級別。

M2 Plus則取得了568分的“碾壓級”成績,在所有公開測試的主流大模型中位列第一,充分證明其對中國臨床指南和醫(yī)療實踐的掌握已爐火純青。

如果說執(zhí)醫(yī)考是“從業(yè)門檻”,那么中國碩士研究生招生考試臨床醫(yī)學(xué)綜合能力(西醫(yī))則是頂尖醫(yī)學(xué)生競爭的“華山論劍”。該考試不僅知識面廣,且題目設(shè)計極為復(fù)雜,對臨床思維要求高。

通常,能考到280分以上的考生,都是超過協(xié)和、北醫(yī)等頂尖學(xué)府的頭部學(xué)霸。M2 Plus在此項考試中取得了282分。

同時,在日本、英國、澳大利亞等國高級醫(yī)師職稱晉升考試中,M2 Plus的準(zhǔn)備率達(dá)到85%以上,遠(yuǎn)超各國及格線。

這些壓倒性的成績充分說明,M2 Plus在復(fù)雜醫(yī)學(xué)知識運用上的能力,已經(jīng)超越了人類醫(yī)生水準(zhǔn)。


百川按下“加速鍵”,助推醫(yī)療AI邁入可信可用階段

在AI重塑醫(yī)療的浪潮中,百川智能懷普惠之志,為行業(yè)開放頂尖模型能力,切實推動智慧醫(yī)療的落地。

接入M2 Plus的百小應(yīng)已在各大手機(jī)應(yīng)用商店更新,打造"醫(yī)生版ChatGPT"。為方便電腦端使用,網(wǎng)頁版(ying.ai)也同步上線。


醫(yī)生可以通過它快速查閱循證指南和文獻(xiàn),患者能夠深入理解疾病和治療方案,公眾則可獲取權(quán)威、可信、可追溯的健康知識。

尤其是,當(dāng)前患者用DeepSeek自診和帶著DeepSeek就醫(yī)的現(xiàn)象越來越多。通過百小應(yīng),醫(yī)生有了面對通用模型幻覺挑戰(zhàn)的“專屬武器”。

此外,M2 Plus也將以API形式面向醫(yī)療AI開發(fā)者、科研機(jī)構(gòu)和行業(yè)合作伙伴全面開放。

通過標(biāo)準(zhǔn)化接口,開發(fā)者和醫(yī)療機(jī)構(gòu)可以快速構(gòu)建出專屬的AI醫(yī)生或智能輔助決策系統(tǒng),并結(jié)合自身數(shù)據(jù)資源實現(xiàn)差異化創(chuàng)新。

這一能力可靈活集成至醫(yī)院信息系統(tǒng)、科研工具、數(shù)字醫(yī)療產(chǎn)品與健康服務(wù)平臺,應(yīng)用于醫(yī)院流程優(yōu)化、??戚o助診斷、個性化健康管理等多種場景。

通過開源Baichuan-2、發(fā)布Baichuan-2 plus、百小應(yīng),開放API,百川致力于持續(xù)提升AI醫(yī)療在真實臨床場景的可用性,推動大模型在嚴(yán)肅醫(yī)療場景進(jìn)入落地可用新階段。

歸根到底,百川智能所做的,是前沿的AI技術(shù)真正服務(wù)于醫(yī)生,也服務(wù)于每一個普通人。



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
法國、英國、德國、加拿大、日本等14國發(fā)表聯(lián)合聲明

法國、英國、德國、加拿大、日本等14國發(fā)表聯(lián)合聲明

政知新媒體
2025-12-25 08:12:04
馬斯克預(yù)測美國經(jīng)濟(jì)18個月內(nèi)實現(xiàn)兩位數(shù)增長,AI成關(guān)鍵驅(qū)動力

馬斯克預(yù)測美國經(jīng)濟(jì)18個月內(nèi)實現(xiàn)兩位數(shù)增長,AI成關(guān)鍵驅(qū)動力

華爾街見聞官方
2025-12-25 05:42:06
17歲差算個球?姆巴佩牽手伊萬卡,空窗期緋聞比進(jìn)球還吸金

17歲差算個球?姆巴佩牽手伊萬卡,空窗期緋聞比進(jìn)球還吸金

羅氏八卦
2025-12-25 11:45:55
闞清子車停醫(yī)院2天!3個細(xì)節(jié)戳破早產(chǎn)謠言,怎么判斷爆料真假?

闞清子車停醫(yī)院2天!3個細(xì)節(jié)戳破早產(chǎn)謠言,怎么判斷爆料真假?

可樂談情感
2025-12-25 00:55:18
烤雞少年承認(rèn)用“肉寶王”來調(diào)味,廠家人員:是已生產(chǎn)25年的合法調(diào)味料,不是添加劑

烤雞少年承認(rèn)用“肉寶王”來調(diào)味,廠家人員:是已生產(chǎn)25年的合法調(diào)味料,不是添加劑

極目新聞
2025-12-22 19:57:51
王彥霖投票肖戰(zhàn),東北式直球引爆全網(wǎng)社死!

王彥霖投票肖戰(zhàn),東北式直球引爆全網(wǎng)社死!

犀利辣椒
2025-12-25 06:42:18
官宣!上海史上“最貴地鐵”19號線正式開疆拓土

官宣!上海史上“最貴地鐵”19號線正式開疆拓土

普陀動物世界
2025-12-25 10:18:58
女子不明原因拉肚子,丈夫:我不是有錢人,但傾家蕩產(chǎn)都要她活著出來!

女子不明原因拉肚子,丈夫:我不是有錢人,但傾家蕩產(chǎn)都要她活著出來!

聽李醫(yī)生說
2025-12-24 09:06:09
徐湖平背后貴人被曝光,父親是老軍人,在當(dāng)?shù)仃P(guān)系網(wǎng)很大、人脈廣

徐湖平背后貴人被曝光,父親是老軍人,在當(dāng)?shù)仃P(guān)系網(wǎng)很大、人脈廣

觀星賞月
2025-12-25 12:06:58
美媒:爵士拒絕交易1.2億美元的凱斯勒讓湖人躲過一劫

美媒:爵士拒絕交易1.2億美元的凱斯勒讓湖人躲過一劫

懂球帝
2025-12-25 11:38:08
張元英大腿好長

張元英大腿好長

情感大頭說說
2025-12-25 09:56:07
高圓圓小學(xué)六年級照片曝光!從小就是美人坯子!趙又廷撿了大便宜

高圓圓小學(xué)六年級照片曝光!從小就是美人坯子!趙又廷撿了大便宜

小娛樂悠悠
2025-12-25 09:53:22
臺灣其實根本就不用打,打它干什么?只要把臺灣海峽劃成戰(zhàn)區(qū)

臺灣其實根本就不用打,打它干什么?只要把臺灣海峽劃成戰(zhàn)區(qū)

百態(tài)人間
2025-12-24 16:46:46
錯換人生38年:被富養(yǎng)的女孩拒絕認(rèn)親,養(yǎng)父母逼著她見親生父母

錯換人生38年:被富養(yǎng)的女孩拒絕認(rèn)親,養(yǎng)父母逼著她見親生父母

漢史趣聞
2025-12-24 09:57:53
盧比奧痛斥歐洲領(lǐng)導(dǎo)人的高高在上!

盧比奧痛斥歐洲領(lǐng)導(dǎo)人的高高在上!

西樓飲月
2025-12-24 21:43:47
鬧起來了!某光伏公司放大假,員工開車堵門抗議!

鬧起來了!某光伏公司放大假,員工開車堵門抗議!

黯泉
2025-12-24 20:49:18
狂掃1000噸黃金,美聯(lián)儲慌了,金價殺到4400,中國暗藏底牌

狂掃1000噸黃金,美聯(lián)儲慌了,金價殺到4400,中國暗藏底牌

夢史
2025-12-25 10:07:23
中美俄戰(zhàn)機(jī)飛行1小時成本對比:F22要60萬,蘇27需18萬,殲20多少

中美俄戰(zhàn)機(jī)飛行1小時成本對比:F22要60萬,蘇27需18萬,殲20多少

阿器談史
2025-12-21 23:20:57
美媒預(yù)測西部奪冠概率最高的5支球隊:馬刺10%,升至第四超湖人!

美媒預(yù)測西部奪冠概率最高的5支球隊:馬刺10%,升至第四超湖人!

你的籃球頻道
2025-12-25 11:02:06
監(jiān)視員工的電腦軟件被公開叫賣!記者實測:微信聊天就像在“裸奔”,殺毒軟件卻“失明”

監(jiān)視員工的電腦軟件被公開叫賣!記者實測:微信聊天就像在“裸奔”,殺毒軟件卻“失明”

每日經(jīng)濟(jì)新聞
2025-12-25 00:48:23
2025-12-25 16:32:49
智藥局 incentive-icons
智藥局
我們更懂藥物創(chuàng)新
954文章數(shù) 170關(guān)注度
往期回顧 全部

科技要聞

屠龍少年被"招安"!英偉達(dá)平安夜豪擲200億

頭條要聞

男子信訪被勸返收鎮(zhèn)干部4300元路費獲罪 二審駁回上訴

頭條要聞

男子信訪被勸返收鎮(zhèn)干部4300元路費獲罪 二審駁回上訴

體育要聞

單賽季11冠,羽壇“安洗瑩時代”真的來了

娛樂要聞

金莎小19歲男友求婚成功!兩人雪地?fù)砦?/h3>

財經(jīng)要聞

時隔15月,人民幣升破7,三大推手曝光

汽車要聞

預(yù)售31.3萬元起 全新奧迪Q5L將于1月內(nèi)上市

態(tài)度原創(chuàng)

旅游
時尚
游戲
藝術(shù)
本地

旅游要聞

偶遇大理上關(guān)花天龍洞景區(qū),感覺挺有意思的,可惜還沒來得及去

對不起周柯宇,是陳靖可先來的

玩家討厭游戲教程!填鴨式教程如何消磨熱情?

藝術(shù)要聞

緬懷 | 著名油畫家宮立龍逝世,享年73歲

本地新聞

云游安徽|亳州晨暮皆成史,街巷縱橫印春秋

無障礙瀏覽 進(jìn)入關(guān)懷版