□ 中国信息通信研究院云计算与大数据研究所数字健康部 冯天宜
2022年11月美国科技公司OpenAI推出ChatGPT 3.5聊天机器人。该聊天机器人基于Transformer深度学习架构、采用预训练方式获取语言知识。由于其参数量巨大、神经网络层结构复杂,因此被称为大语言模型。随后衍生出ChatGPT系列若干版本,朝向能形成更完整的思维链条,具备更强计算和推理能力的大型多模态模型演进。
随着ChatGPT的出现,各国研发训练大模型的竞赛日趋激烈。我国的国产大模型积极赶超,并将医学作为重要领域。截至2023年10月,我国发布医疗健康垂类大模型超过50个,呈现系列化、多模态、融合化、协同化、轻量化的发展趋势。
2025年1月20日,中国科技初创公司DeepSeek发布了DeepSeekR1 开源“推理”大模型,在国外大模型排名平台上,该模型基准测试成绩升至全类别大模型第三,在分项测试中与OpenAI o1并列第一。
数据要素和算力赋能大模型发展
医疗健康大模型发展,离不开医疗健康数据要素和算力基础设施建设。数据要素是大模型发展的燃料,我国当下正在加速对数据要素的全方位布局。
政策层面,国家数据局的成立以及《国家数据基础设施建设指引》等的发展,成为数据要素建设走深向实的政策推动力。
资源层面,海量数据资源为我国数据要素的充分利用提供先决条件。2024年5月国家数据局联合多部门发布《全国数据资源调查报告(2023年)》。这是我国首次对数据资源“全面体检”,结果显示:2023年全国数据生产总量达32.85ZB,同比增长22.44%,数据“产、存、算”规模优势基本形成。
流通与交易体系建设方面,我国医疗健康数据要素体系逐渐形成,由医疗健康数据基础设施层、医疗健康数据治理层、医疗健康流通及交易层、医疗健康数据应用层、医疗健康数据要素监管层以及保障层五部分组成,推动数据价值释放。
医疗健康领域大模型发挥所长
大模型的兴起激发了在医疗健康领域应用的广阔前景。国家卫生健康委印发《卫生健康行业人工智能应用场景参考指引》,明确了人工智能十三大应用领域,推动基于强大的算力和多模态数据训练的医疗健康大模型实现“从辅助于人”到“启智于人”的飞跃。
在医疗服务领域,大模型将用于辅助专病决策、治疗方案和医疗文书生成。相对于只能给出判断结果的临床决策支持系统,大模型能对医生的多轮问询给出反馈,并可进一步提供治疗方案。目前,大模型已在骨科、消化内科等有应用案例。此外,大模型还可实现病历、出院小结的生成,推动医疗文书标准化。
在医药服务领域,大模型可用于指导患者合理用药。依托临床试验数据、标准指南、医疗文书等训练的大模型可将研发过程中产生的资料提炼总结、生成指导合理用药的学术推广材料。为实现更生动的用药指导,大模型与数字人结合,用专业或通俗的语言同医生和患者互动,讲解新药临床使用知识。
在医保服务领域,大模型可实现辅助诊断到医保控费全程自动化。依托病历、医保数据、临床路径数据训练的大模型,可嵌入到临床路径中,并与DRG/DPI支付改革要求结合,实现从疾病诊断、选择临床路径、生产治疗方案、书写病历、计算医保付费的全程自动化。
在中医药管理服务领域,大模型可助力中医药经验传承和机理阐明。依托中医古籍典籍、病案、方剂等数据训练中医药专业模型,为解决中医面临的隐性经验难以显性化、结构化、文言语言和现代文的翻译理解障碍等传承问题提供新方法。此外通过大模型的操控让中药材的生产设备更加智能,提高方剂煎煮、中成药制备质量工艺控制水平,以“药材好”实现“药才好”。
在医院管理领域,大模型可实现对自动化运营和管理决策的支持。依托运营管理数据训练管理模型,可进行医院能耗管理、供应链管理、绩效管理等的报表设计和数据分析,辅助管理决策。
在公共卫生领域,大模型可实现对流行病趋势和社会影响的预测,如模拟群体传播趋势和分布、预测疫苗保护率、预测流行病对经济、社会和人口的影响,从而改善疾病监测、增强疫情监测、优化公共卫生政策。
在药物研发领域,大模型或破解“双十定律”,加速新药创制速度。长期以来,药物研发存在新药上市需要花费超过10年时间、投入超过10亿美元的“双十”定律。大模型可用于靶点发现、分子对接预测、分子属性预测、合成路径设计、临床试验方案设计和数据分析等场景,降低研发成本。
在医学教学领域,大模型可生成医教资源和患者科普资料,提高教学效率。基于临床病案、标准指南数据训练教学模型,可辅助老师生成教学素材、回答初级问题、订正考试答案。基于病案、影像等多模态数据训练出的卫生视频大模型,已用于为患者进行治疗方案讲解和知识科普,提高患者医患沟通效率。
在医学科研领域,大模型依托标准指南、文献资料、临床研究、知识产权等数据训练出的科研大模型改变了科研人员思考问题、分析数据和产生新见解的方式,帮助进行思路找寻、文献检索、翻译、综述生成、试验/实验方案生成、数据分析、报告起草等环节。
数据要素、算力应与大模型协同发展
大模型用于医学领域同样面临风险挑战,因此行业各方应予以关注。
一是存在算法成熟度风险。算法局限性会导致生成的医疗内容失真、模型泛化能力弱、可解释性较差等隐患。
二是存在算力资源与大模型体量不匹配的风险。模型日益复杂参数和层数增多,需要更大算力训练和推理,然而集群服务器间网络通信迟滞延长训练时间、性能表现难以达到预期等问题制约大模型研发和使用效率。
三是高质量医疗数据不足,训练推理存在安全和隐私泄露风险。大模型在提升科研效率同时也存在伪造参考文献、无法对生成内容负责等潜在问题。
四是存在医疗应用公平和伦理风险。大模型可能会使用在性别、年龄、社会地位等存在偏见的数据训练,且缺乏符合伦理的道德编程,导致算法偏见,生成不公平的医疗决策和治疗方案。
引导医疗健康数据要素、算力与大模型协同发展将成为未来趋势。对于医疗健康数据要素,建议加快完善流通与交易体系,丰富服务和工具供给;构建行业专属数据库,从源头提升模型训练用数据质量。对于算力,建议注重芯片研发,推动国产算力硬件设施与软件、模型适配,鼓励基于国产算力的大模型研发与应用。对医疗健康垂类大模型本身,建议加快完善监管和治理机制,强化场景应用牵引,加强具有医疗健康行业属性的大模型标准研制;构建“训、评、测”三位一体的综合评价体系和智能化工具,引导医疗健康大模型规范开发、依法依规使用,最终实现大模型的算法、算力、数据三者高质量融合发展。