 
10 月 22 日,百川智能发布循证增强医疗大模型 Baichuan-M2 Plus,同步升级配套应用百小应并开放 API。这是百川自 8 月开源 Baichuan-M2 以来的又一次重要动作。评测显示,M2 Plus 的医疗幻觉率较通用大模型显著降低,相比 DeepSeek 低约 3 倍,优于美国最火医疗产品 OpenEvidence。
据了解,国内众多医院虽积极尝试部署和优化 DeepSeek,但实际效果不尽人意。反观大洋彼岸的现象级医疗大模型产品 OpenEvidence,能给我们重要的启示。该产品因符合医学认知的循证增强,已有 40% 美国医生在临床场景中注册使用,每月咨询量达 1650 万次。两天前,该公司C轮融资 2 亿美金,估值达 60 亿美元。
据介绍,“循证驱动”的生成逻辑,让 M2 Plus 几乎杜绝了无中生有的内容,而且,在病史分析、诊断思路、治疗方案等真实复杂的核心医疗场景中,达到了与人类资深临床专家同等的可信度。

比如,301 医院的姜医生提问,“目前公认最有效的基因治疗药物靶向足细胞递送方案有哪些?”很多通用大模型回答这个问题时都产生了明显幻觉,而 M2 Plus 的回答不仅查到了全球最新研究成果,还能按纳米系统 / AAV 病毒载体等维度分类。姜医生表示:“引用文献非常具有专业性、且信息源紧贴顶刊 ERA 等最新进展,对足细胞基因治疗这么前沿的方向,能帮我快速了解国际热点技术路线,少走弯路。”
北京天坛医院的熊医生,在研究目前 PACAP 在偏头痛中的研究进展如何时发现,头痛相关的研究越来越多,想找到真正有价值的文献并不容易,多数大模型给出的答案都因幻觉问题而不可用。他试用百小应时看到,“能梳理全球 PACAP 偏头痛研究,从机制到 III 期临床试验自动串联证据链,不仅回答问题,更让医生站在未来看科研进展。”

据悉,接入 M2 Plus 的百小应已在各大手机应用商店更新,为方便电脑端使用,网页版(ying.ai)也同步上线。(定西)
 
                            
 
                             
                             
                     
                     
                 
                         
                 
                         
                 
                    