慢加急性肝衰竭 (ACLF) 是一种复杂疾病,定义各异,特征不明确,这使得风险分层和针对性管理变得复杂,而无监督聚类可以通过消除预定义的假设实现了无偏见的群组分层。西安交通大学数学与统计学院祖建教授团队、西安交通大学第二附属医院肝病科纪泛扑教授团队,洛杉矶Cedars-Sinai Medical Center杨毅辉博士以及英国伦敦大学学院Rajiv Jalan教授合作开展系列工作,基于现实世界ICU队列使用机器学习模型对慢加急性肝衰竭患者进行无偏聚类,揭示关键聚类特征分布规律,量化各亚型间死亡率风险差异,并解析了不同集群的临床表型特征。相关成果发表在Nature Communications(《自然通讯》)上,西安交通大学数学与统计学院为第一完成单位。

团队合作研究结果显示从MIMIC-IV重症监护数据库中筛选出2008年至2019年期间符合北美终末期肝病研究联盟(NACSELD)标准的ACLF患者,并通过基于模糊聚类改进的环绕中心点分割算法(PAC)可以确定最优聚类数目为2,其中性能最优的非负矩阵分解(NMF)模型为Lee-2。聚类结果显示Lee-2模型的一致性矩阵显示出清晰、无重叠的区块边界,表明聚类结果高度稳定,患者分类明确(图1)。

图1. 最佳聚类模型Lee-2一致性矩阵
Lee-2模型聚类结果不仅展示出稳定的聚类性能,其聚类集群也凸显了特殊的临床意义。两个集群之间的死亡风险存在显著差异,亚组1的30天死亡率(70.35%)高于亚组2(26.06%)。而传统器官衰竭数量分类的方法,虽然随着器官衰竭数量的增加,慢加急性肝衰竭患者死亡率也在增加,Grade I、Grade II、Grade III的30天死亡率分别为45.05%、62.86%、69.05%,但是Lee-2模型分类后不同组别之间的死亡率差异更显著,说明Lee-2模型能够更好地区分患者的风险程度。同时值得注意的是,酸碱平衡相关变量,包括碳酸氢盐、pH、碱基过剩、乳酸和阴离子间隙在ACLF患者的聚类中发挥了重要作用,这是过往探究中很少提及的,进一步揭示了酸碱平衡在ACLF中的重要作用(图2)。

图2. 根据Lee-2模型分类的慢加急性肝衰竭患者的亚组分析
在验证分析中,研究利用Lee-2模型对更大规模的ICU中的失代偿性肝硬化患者队列(无论是否发展成ACLF)进行了验证,证明了聚类模型的稳健性及其在真实世界环境中的潜在可用性。同时,Lee-2在欧洲肝病研究协会(EASL-CLIF)定义的ACLF队列中的良好表现也证明了其广泛的适用性。同时研究还使用独立队列对聚类模型进行了外部验证,其外部验证结果也证实了模型的稳定性和可重复性(图3)。

图3. 使用Lee-2模型比较两组慢加急性肝衰竭患者前十大基线特征的雷达图
综上,研究团队采用无偏聚类方法成功识别出具有不同死亡风险和生理特征的慢加急性肝衰竭集群,并强调了代谢调节在慢加急性肝衰竭结局中的关键作用,以及验证的一致性。
文章链接:https://doi.org/10.1038/s41467-026-68368-6