□ 本报记者 胡彬
图为评测环节中10名临床医师正在通过电脑与患者沟通。 小荷健康 供图
如今,人工智能(AI)大模型凭借其强大的数据处理能力与卓越的自主学习能力备受瞩目,被公认为推动产业升级和经济转型的关键动力。在医疗领域,大模型的开发与应用也如火如荼。相关数据显示,截至2024年9月,我国已有逾百家企业和机构发布了医疗大模型。
当医疗大模型打造的AI医生来到患者身边,它的表现会如何?为解答这一问题,日前,中国信息通信研究院、人民卫生出版社、抖音集团旗下小荷健康联合开展了一场医疗大模型真实场景诊疗能力评测,并组织医疗管理、临床、科技,以及法律、伦理等多领域专家共聚一堂,针对直接面向用户的AI诊疗服务,进行了一次深度研讨,为AI医生的发展把脉。
AI医生实力如何
为确保此次医疗大模型的诊疗能力评测工作更真实、更科学,评测团队公开招募了30名患者,涉及消化科、呼吸内科、心血管内科、骨科、神经内科5个科室的常见病。
患者汪女士患支气管哮喘已有20年,当看到网上的招募信息后,她觉得既有意义又有意思,果断报了名。汪女士自述,被诊断为哮喘后,她接受了很长一段时间的激素和支气管扩张剂治疗,目前规律用药控制症状。“这次我主要想问问医生,哮喘会不会遗传给孩子,另外,我是不是该做新的检查了,目前有没有更好的药物可以治疗哮喘。”
对于评测选择的常见病种类以及患者的真实病情,团队都与临床专家评委进行了沟通,确保其典型性和作为测试题的合理性。
为汪女士这样的患者问诊的3组“选手”,分别是“小荷AI医生”,来自国内二级及以上公立医疗机构的主治医师职称以上医生和线上医疗平台的互联网医院医生。
“医”患双方的交流过程全部由工作人员通过聊天界面辅助完成,10名来自公立三甲医疗机构拥有主任医师职称的临床专家,以及9名专业领域覆盖人文、法律、传媒的行业专家,根据“医”患双方的对话内容,分别从包括信息问询、疾病诊断、健康建议等在内的医学专业维度,以及包括需求分析、语言能力、用户价值等在内的服务体验维度进行评审,具体评分标准参考中国信息通信研究院发布的《医疗健康行业大模型成熟度评估模型第1部分:健康咨询》。
评测和评审均以“盲评”形式展开,参与的患者不知道给自己提供问诊服务的是真人医生还是虚拟“医生”,评委在打分时,也只能看到医患对话的结果,并不知道对话“医生”的真实身份。同时,整个研究方法由统计学家严格把关,每个病例确保有两名同科室临床专家以及两名行业专家评分。
评审结果显示,在医学严谨性层面,AI医生能通过精准问询快速定位问题,给出有准确性和逻辑性的疾病诊断和建议,基本达到三级公立医院主治医师水平;在用户体验方面,AI医生能够迅速响应,并且深入细致地理解用户需求,语言表达流畅,带来较好的用户体验。
小荷健康相关负责人介绍,此次评测的“小荷AI医生”产品由“小荷医疗大模型”提供支撑。“小荷医疗大模型”是在字节跳动豆包大模型基础上,由小荷健康团队自主研发的一款医疗垂类大模型,已在2024年8月完成了境内深度合成算法备案。
这款医疗大模型可以根据用户输入的文本问题,生成健康科普知识、给出健康咨询指导或初步诊断结果等医疗领域信息,具有知识问答、多轮对话、逻辑推理等能力。其训练对标的是真实世界的执业医师培养方式,模型训练从住院医师核心胜任力出发,并在应用中不断完善。
在评测“揭盲”后,参与的患者小利才了解到这些“医生”的真实身份。“相比真人医生专业、明确的解答,‘小荷AI医生’在速度方面自然更胜一筹。另外,它也详细地询问了我的病史和既往治疗情况,并且很快给出了可能的诊断以及健康建议,不仅全面而且很有实操性。没想到AI现在也可以达到这样的水平了。”小利对数字医生的表现很满意。
“通过这次的真实世界评测,我们希望能够以科学、权威、严谨的评估方式,精准定位模型的优势和不足,更有针对性地对产品进行迭代优化。”小荷健康副总裁李萌在发言中表示,医疗大模型的快速迭代是一个技术问题,但如何利用好这一技术,如何使医疗大模型服务赋能已有的医疗卫生服务体系,如何精准地把握政策法规,在创新场景中审慎地探索试错空间,这些问题更有挑战性,也更有意义。
优势显著潜力待开发
在研讨会上,参与评审的评委共同围绕医疗大模型的问诊效果和未来应用展开讨论。专家充分认可了人工智能大模型的能力,同时给出了模型能力继续提升及应用方面的建议。
“在全球各国积极推进数字健康战略的背景下,如何为我国医学人工智能发展做好政策护航,促进其发挥优势,成为当下亟待解决的问题。”中国信息通信研究院副总工程师石友康表示,当前我国医疗大模型已在临床辅助诊疗、健康产业发展、医学科研教育等场景开展应用,有效提升了基层医生服务能力、提高了医院临床诊疗水平和医疗服务效率。
北京大学人民医院创伤骨科主任医师薛峰表示,在当天的评测中,能明显感受AI医生的优势:问诊更有逻辑性、条理清晰,关键是它能像真人一样与患者交流。“当前,三甲医院门诊患者大多数的问题都是常见病。如果这些患者在咨询AI医生后得到合理分流,可使医疗资源得到更合理的利用。”
中国医院协会常务副会长毛群安表示,过去我们对于国外的医生拥有助理艳羡不已。如今,数字医生的出现可能让大家的梦想变为现实。
神经内科医生面对的疾病通常情况复杂,在为患者诊疗时不仅需要结合查体、影像等多方面的结果,同时要兼顾对患者的人文关怀。中国医学科学院阜外医院神经内科主任李淑娟表示,AI医生的一些优势恰恰能满足这些需求。“AI医生在危险因素识别、高危患者筛查,以及随访方面能够起到重要作用。特别是对于一些神经内科疾病患者,AI医生可为其提供预警信息,并为他们提供情绪价值,帮助解决‘双心’问题。而这也是临床医生非常欢迎的。”
北京大学人民医院骨关节科主任医师李虎坦言,AI医生在解决多数非严重患者问题、提供人文关怀及适当指导等方面优势显著。“AI医生不仅能帮助我们治疗患者,还能在人文关怀、心理指导等方面为医生和患者提供帮助,助力诊疗服务质量进一步提升。”
与会专家表示,AI大模型与医生是合作、互补的关系而非替代关系。公众对人工智能咨询类应用有较大需求。在这些方面,AI大模型等可给出适当的建议、帮助患者按需转诊等,在医疗资源配置、医疗模式补充及提升患者认知等方面有较高的应用价值。
目前,在网络上寻医问药已经成为不少人的习惯。依靠传统的搜索工具,公众需要在茫茫信息中寻找靠谱、有用的信息,普通公众很难辨伪存真,因而在此过程中面临着一系列问题。与会专家表示,借助医疗大模型和用户交流,可引导用户叙述自己面临的问题,大模型能够从整体上关注其健康情况并与其交流,可进一步提升公众对于疾病的认识,促进全民健康。
医疗大模型未来可期
“AI医生目前还存在缺乏个性化、难以针对特殊患者做深度分析、缺乏影像分析能力等不足。”首都医科大学宣武医院神经内科主任医师王默力坦言,AI医生仍存在一些“盲区”,有待进一步改进、升级。
“目前,大模型在判断患者情况时更多是从整体出发进行思考,而医疗专家与患者面对面时,会凭直觉判断患者可能是哪方面的问题。”毛群安表示,大模型的思维模式与专家的经验思维仍有较大差别,在更快速、精准地识别疾病,以及为患者提供诊疗建议等方面,还可进一步提升。
首都医科大学附属北京朝阳医院呼吸与危重症医学科主任医师王晶也指出,AI医生给大部分患者提供的是基础建议。“例如,遇到有‘喘’症状的患者,尤其是老年人,究其‘喘’的原因,有哮喘、心衰、感染等多种可能性。一些复杂疾病患者仍然需要资深医生认真为其进行查体、分析化验结果,才能给出准确结论。”王晶说。
首都医科大学附属北京友谊医院消化内科主任医师吴咏冬指出,AI医生在问诊及鉴别诊断时仍有针对性不足等问题,还需要综合考虑多种因素做鉴别与判断,不能简单依据某项检查结果就下结论。
对于医疗大模型的未来,与会专家寄予厚望。“AI医生的时代一定会到来。”清华大学附属北京清华长庚医院消化内科主任医师蒋绚认为,“但同时,人们对于AI医生的要求会比对人类医生的要求更高,哪怕1%的错误率都较难被公众认可。AI医生会面临准确性、安全性和个性化之间的博弈,因此,在其不断发展的过程中,更需要各方协力并进。”
中日友好医院呼吸与危重症医学科主任医师赵红梅直言,目前我国医疗资源仍然存在分布不均的问题,优势医疗资源过于集中,医疗资源下沉相对不足。“从今天的评测结果我们可以看到,人工智能的基本面是足够的,它可以有效解决基层医疗卫生机构人员水平不足以及偏远地区患者问诊难的问题。”赵红梅表示,数字医生在现阶段虽不能完全取代医生,但它可作为医生的高级助手,协助完成基础工作,还可助力慢病管理,识别疾病风险并给出转诊等建议。
首都医科大学附属北京积水潭医院心血管内科主任刘巍则提出了更具体的期待:“希望通过智能体对话,人工智能大模型等新技术能在未来解决患者随访的问题。我们既需要验证其准确性、可靠性,又要关注其开发成本及后续运营、费用等问题。相信这些都是新技术未来的发展方向。”
人工智能大模型可能带来的法律及伦理等相关问题,也是专家关注的重点。
“医疗大模型的评分标准中考虑到了人文要素,这是非常好的现象。”北京协和医学院人文与社会科学学院教授睢素利强调,新技术虽发展迅速,但在其应用过程中仍要始终秉持“科技向善”的原则。
北京市律师协会卫生法律专业委员会主任龚楠指出,真人医生与AI医生的思维逻辑存在差异,应明确其各自更适合的领域。“同时,我们要关注避免基层医生、医学生对AI医生过度依赖等问题。”龚楠提醒,高科技发展易掩盖违法、违反伦理情况,需回归常规线下场景分析。
“医疗AI大模型若要变得更准确、可信,需要学习科学、规范、高质量的医学专业知识,要能对多模态信息进行解析,并为每一次的决策提供循证依据。”人民卫生出版社人卫助手知识服务数字平台负责人贾晓巍说,“让人工智能取得人类的信任绝非易事,这需要在政府的主导下,更多的专业人员、更多的机构积极参与相关工作。”
“目前人工智能具备理解世界的能力,但还没有发展到可感知世界的阶段。人工智能的发展速度超乎我们的想象,我们还是要审慎地对待这一问题。”美中爱瑞肿瘤医院院长徐仲煌说,“现阶段及未来一段时间,人工智能可成为医生的有力伙伴,助力我们探索未来世界。”