学术动态
您当前的位置: > 动态研究  > 学术动态

面向异质患者画像的医疗费用预测研究——基于行政索赔数据深度学习

  • 期号:2025-08 总140期

Mohammad Amin Morid1,* Olivia R. Liu Sheng2

1. Department of Information Systems and AnalyticsLeavey School of BusinessSanta Clara UniversitySanta ClaraCalifornia

2. Department of Information SystemsW. P. Carey School of BusinessArizona State UniversityTempeArizona

编者按:

本工作指出,占人口5%的高需求患者消耗约50%的医疗支出,而现行风险调整模型因行政索赔数据的多源异质性、就诊关系缺失及代码无序等问题,常导致对这类患者的费用低估或高估,进而引发医保支付偏差、资源配置失衡。作者提出“通道式深度学习框架”,将诊断、操作、药品及费用信息按类型分通道建模,并以预训练的Doc2Vec嵌入+双向GRU+注意力机制捕捉时间模式,显著降低预测误差(平均下降23%),并分别减少16.4%的超付与19.3%的少付。更值得关注的是,团队创新性地以多通道熵指标量化患者数据异质性,无需繁复的临床编码即可灵活识别高需求群体,为医保方、健康计划及政策制定者提供了可扩展、可落地的决策支持工具。该研究不仅拓展了智慧医养领域的算法前沿,也为破解高需求人群支付服务错配难题提供了可复制的技术与评估范式,值得学界与产业界共同关注。

美国医疗费用的持续上升已成为消费者、医疗服务提供者、支付方(如健康计划提供者、医疗保健和医疗补助)以及政府财政部门的共同关注的问题。为降低患者负担并优化资源配置,包括联邦医保与医助服务中心(the Centers for Medicare & Medicaid ServicesCMS)在内的机构正积极推进费用分析与预测工作。自本世纪初以来,美国医保体系开始尝试从按服务收费(fee-for-service)模式转向按价值付费(fee-for-valueFFV)模式,后者根据医疗质量而非服务数量进行支付,以遏制过度医疗导致的成本膨胀。

按人头付费(capitation paymentCP)是实现按价值付费的常见机制,由支付方按参保人固定金额向健康计划或医疗机构预付全年费用,涵盖预防、门诊及治疗等全部服务。在联邦医保优势计划(Medicare AdvantageMA)中,CMS 作为支付方,向商业保险公司支付该笔费用;后者再按 CP 或其他模式向医疗服务提供者结算。商业保险场景下,健康维护组织亦采用类似机制向医疗集团支付。本研究聚焦联邦医保人群,文中统一将 CMS 视为支付方,健康计划视为受付方。

5% 的美国人口消耗近半医疗支出。由于不同患者健康状况差异显著,风险调整模型(Risk Adjustment ModelsRAMs)通过统计方法预估个体下一年度费用,并据此调整 CP 金额,确保资源合理分配。CMS 即在 MA 计划中运用 RAMs,提前锁定每位参保人的年度总支付额。

然而,RAMs 仍存在系统性缺陷:支付不足导致健康计划缺乏足够资源为复杂慢病患者提供高质量服务,甚至回避高风险人群;支付过度则激励健康计划“摘樱桃”,倾向吸纳低费用健康人群以获取超额利润。准确预测异质患者群体的费用,可帮助支付方合理补偿健康计划,削弱其偏向低风险人群的动机,甚至吸引高需求患者,为其提供高效服务并盈利。

现有费用预测模型依赖支付方从医疗机构收入周期系统收集的行政索赔(Administrative ClaimsAC)数据。但 AC 数据存在语义与关系异质性,尤其当患者一天内辗转多家机构就诊时,诊断、操作、药品代码混杂于同一日索赔中,且缺乏时间顺序与关联信息,导致高需求患者的数据异质性尤为突出,严重削弱模型泛化能力与公平性。

本研究从社会技术视角出发,将患者复杂就医路径映射为 AC 数据异质性的多种表现:代码类型差异、跨就诊关系缺失、单索赔内代码无序等。为此,我们设计了一条通道式深度学习流水线:先按代码及费用类型分通道学习同质表示,再融合多通道特征,以显著降低数据异质性,并提升对高需求患者的预测性能与支付公平性。鉴于基于专家知识对患者严重程度分层的复杂性与可扩展性限制,我们进一步提出以多通道熵指标衡量个体数据异质性,实现灵活、可扩展的患者分层与模型评估。

综上,本文贡献两大设计洞见:其一,构建超加成的数据异质削减机制,应对高需求患者在 AC 数据中的独特挑战;其二,填补患者异质性在模型性能与影响评估设计中的研究空白,提出以数据异质性指标近似患者需求层级的灵活方案。研究强调在评估设计中纳入人文关怀结果(支付差异),为医疗及其他面临人口异质性与数据异质性交织问题的领域提供决策启示。

资料来源:

根据Mohammad Amin Morid等于2025年发表在Information Systems Research 题目为《Healthcare Cost Prediction for Heterogeneous Patient Profiles Using Deep Learning Models with Administrative Claims Data》的文章缩写整理而成。

(本文责任编辑:陈劭)

Copyright © 2021 RESEARCH INSTITUTE OF SMART SENIOR CARE. All rights reserved

京ICP备18021587号-6