恶性肿瘤是一大类复杂的多组学(基因)疾病。现代肿瘤学理论认为,肿瘤的发生、发展是肿瘤患者的内因和外因耦合作用的结果,其内因主要是癌症遗传风险。基于多组学大数据,挖掘癌症遗传风险,不仅是肿瘤研究的前沿领域和热点方向,而且能够广泛应用于肿瘤风险筛查、肿瘤分子预警、肿瘤精准体检和早诊。基于大数据绘制癌症遗传风险图谱是癌症遗传风险图谱研究的热点和难点,风险图谱是临床辅助决策的重要基线之一,也是《关于促进和规范健康医疗大数据应用发展的指导意见》明确的、全面深化健康医疗大数据应用的重点任务中具有重要意义的研究和应用模块。
近日,CELL杂志刊发了迄今为止最全面的癌症遗传风险图谱研究。该研究由西安交大计算机科学与技术系、陕西省医疗健康大数据工程研究中心王嘉寅教授团队与圣路易斯华盛顿大学、哈佛大学-麻省理工学院Broad研究所、贝勒医学院、梅奥临床医学院等13家顶级研究机构历时近三年合作完成。该研究基于33种常见癌症类型、共计1万多名肿瘤患者的多组学大数据,全面应用了目前最优的生物信息学分析和实验手段,优化设计了面向多组学的数据处理流程,累计分析了超过14.6亿个候选基因变异,首次系统性地报道了871个罕见易感/疑似易感变异和拷贝数变异,且较大比例地存在与基因表达异常、丧失异质性等体细胞突变的耦合,这为下游研究,特别是遗传变异分类和检测奠定了基础。同时,大数据分析明确展示了不同癌症类型的一些病例具有共同或类似癌症遗传风险的关键证据,这些共性模式及其与体细胞突变的相互作用能够为异癌同治提供临床辅助决策依据。
上述研究成果以“Pathogenic Germline Variants in 10,389 Adult Cancers”为题于4月5日发表于 CELL 173卷第2期。CELL 与 Nature 和 Science 并称CNS,是世界最权威的学术杂志之一,代表国际学术研究最前沿,影响因子为30.41。该研究得到国家自然科学基金、西安交大青拔计划、中央直属高校基本科研业务费的支持。
西安交通大学医疗健康大数据陕西省工程研究中心大数据驱动的辅助决策团队成立于2015年10月,以电信学院王嘉寅教授、赵仲孟教授、张选平教授、管理学院孙新宇教授等为主要学术骨干,成立至今已连续在Nature Medicine、Cell、Nature Communications等顶尖期刊和CCF生物信息学推荐会议上发表研究论文10余篇,主持、参与国家自然科学基金、国家重点研发计划等各类项目,编译出版的《数据质量征途》等入选“十三五”国家重点图书。
文章链接:http://www.cell.com/cell/fulltext/S0092-8674(18)30363-5