当前位置: 新闻网首页>今日交大>正文
今日交大

【科技自立自强】西安交大-西农联合团队提出空间转录组多模态融合智能解析框架S3RL

日期:2026-01-20 12:01 浏览量:

针对空间转录组(下称“空转”)数据分析技术瓶颈,西安交大电信学部科研团队与西北农林科技大学研究团队合作,提出了一种更贴近生物学真实情况的无监督学习框架,并基于此设计、实现了空转数据分析新型方法S3RL(图1)。S3RL可精细地解析和刻画组织的空间功能结构,为理解复杂生物组织的空间异质性提供了高效、可靠的新工具。相关研究成果于近日发表于国际权威期刊《Advanced Science》。

空转技术能够同步获取动植物组织原位空间坐标与细胞转录组信息,从而在空间维度上揭示细胞的分布特征与功能状态,为深入解析复杂生物学过程提供了关键手段,现已成为生命科学领域的前沿热点。该技术的突破性贡献已获国际学界广泛认可,并于2020年被《Nature Methods》评为年度技术。

尽管近年空转技术持续发展,相关数据分析仍面临诸多挑战。在真实组织中,空间相邻的细胞并不必然具有相似的分子功能,不同功能区域之间常呈连续渐变的过渡结构;同时,空间坐标、基因表达谱与组织学图像等在尺度、维度、噪声及生物学语义层次上存在显著差异。当前分析方法通常将跨尺度、多维度、多模态数据直接混合建模,易导致组织空间边界被过度平滑、功能区域划分不准确,进而影响后续生物学机制解析与功能推断。如何从上述数据中实现对组织空间结构的精准解析,赋能生物学功能深入挖掘,当前仍是该领域亟待突破的核心问题。为此,科研团队在组织空间关系建模中引入了符号图(signed graph)建模策略。通过同时建模“促进相似”的正边和“保持区分”的负边,使模型在学习组织空间表示时既能够强化组织区域内的一致性,又能够显式抑制组织区域间的错误聚合,从结构层面提升了组织空间域边界的判别能力。

科研团队提出了一个以可分离表征学习(separable representation learning)为核心的分析框架,在整体设计上注意避免过早融合不同模态信息,而是通过分阶段、分层次的方式逐步刻画组织空间结构,提升了在学习组织空间结构时区分“真实生物信号”和“由噪声引入的伪相似性”的能力。

此外,科研团队将跨尺度、多维度、多模态信息映射到统一的超球面表示空间中,并在该空间内引入原型学习机制(prototype learning)。S3RL在无监督条件下为每一个潜在功能区域学习一个区域级原型,使单细胞表示在空间邻域约束和基因表达约束的共同作用下,逐步向最匹配的原型靠拢。这种优化设计不仅增强了空间区域内部的紧凑性,也显著提高了不同区域之间的可分性。

科研团队在多个空转数据集上对S3RL进行了系统性评估(图2)。结果表明,S3RL在空间域识别稳定性、空间边界清晰度以及跨切片对齐一致性方面均显著优于现有方法(例如 ARI指标提升170%)。下游分析显示,S3RL所解析空间功能区域在通路富集和细胞–细胞通讯分析中表现出更高的生物学一致性,更可靠地揭示了组织内部功能分区与空间调控关系,为复杂组织结构的生物学阐释提供了稳健的计算基础。

图1 S3RL算法框架。首先利用组织学图像和空间位置信息,识别组织中具有相似语义特征的局部区域,并区分彼此应当聚集或分开的空间关系。然后结合符号图、可分离表征学习以及超球面表示空间原型学习机制,模型自动学习稳定的空间功能“中心”,使细胞自然形成清晰、连贯的空间功能区域,从而准确地刻画组织空间结构。

西安交通大学电信学部为该研究第一完成单位。电信学部助理教授付来义为论文第一作者、博士研究生王鹏磊与三年级本科生徐高远为共同第一作者;西北农林科技大学教授吴丹阳与西安交通大学教授孙贺全为论文共同通讯作者。

该研究得到国家自然科学基金(62303372、GYKP034)、陕西省自然科学基础研究项目(2024JC-YBQN-0700)、浙江省自然科学基金(LQ23F020018)等基金资助。

图2.S3RL在DLPFC数据集上的性能评估以及与现有方法的比较(更多分析与比较请查看原文)。A.不同方法聚类性能比较。B-C.DLPFC组织学图像及皮层分层人工标注。D.不同方法空间分区结果对比。E-F.层特异性标记基因的表达分布对比。G.细胞类型在空间中的分布。H.低维嵌入可视化结果。I.S3RL消融实验分析。J.不同方法的运行效率与性能对比。

科研团队AI4Bread致力于交叉融合信息学理论与前沿技术,聚焦攻克生命科学领域核心挑战,赋能关键研究技术突破与创新。团队秉持开放协作理念,诚邀对生命科学与信息学交叉研究感兴趣的老师与同学加入,与我们共同探索未知、拓展知识与技术的边界。

文字:电信学部
图片:电信学部
编辑:闻道

关闭

相关文章

读取内容中,请等待...