科学大势,分久必合。自一甲子以来,诸多学科交叉融合贯通的背景之下,一个强劲的“信息”骨架逐渐明晰,尤其在生命医学领域,依托大数据分析揭秘,大有贯穿分子、细胞、组织、单体和群落之态,由此生命演化的奥秘之形巍然显现。
而生命医学大数据研究,主旨关注人工智能在生物医学领域的基础理论研究和应用,发展至今已成为涉及信息、生命、医学、数学、物理、化学等诸多学科且积极促进相关学科深度融合的前沿研究方向。该方向从各学科现代成果中汲取先进技术和思维方式,立足于坚实的实测数据,正日新月异,飞速发展。
纵观大势,笔者拟从微观到整体的两个空间维度,从模拟过去到预测未来的两个时间尺度,从技术导向到问题导向的思维方式转变三个方面分别展望该方向未来三十年之发展远景。
第一,从点、线、面到多层面、全系统高通量动态观测生命体微观组成及其相互作用。生命体由DNA、RNA、蛋白等微观单元构成,对基本组成部件的空间位置、状态乃至组件之间相互作用的了解是生命医学研究的基本基础。传统生命医学研究多从一个基因、一个蛋白出发,深入研究其特性,并逐步扩展到与之相互作用的上下游其它分子组件;当前,以基因组测序为代表的高通量技术,快速获取生命体中所有组成部分的单个性状,例如从转录组、甲基化测序、Hi-C数据对基因表达、表观修饰、DNA远程相互作用的全局观测,迅速提升我们对生命体的认识。但是当前技术多采用离体样本制备和破坏性观测技术,得到的是非自然条件下的单个时间点的信息,尚不能做到在生命体内原位、多性状同步、多时间点连续观测,这需要在未来几十年通过物理、化学、信息、生命、医学等多学科联合攻关解决。
第二,从理解过去到计算未来。当前,研究人员通过数学建模、关联规则挖掘等方法综合利用积累的多维生命医学大数据,深度理解生命体的基本规律,试图基于模型和规则解释疾病发生发展的原因,预测个体未来关键生命事件的时间节点和空间位置。但是,由于生命体内在复杂性、生命体与外界相互作用的偶发性,当前预测生命体未来关键事件仍然十分困难。我们需要在前述技术进行突破,即完成对生命体内部微观组成无损和实时观测、体系内各组成部分相互作用连续监控,对机体建模模拟过去事件,逐步推演计算生命体未来重大疾病关键事件的空间和时间并保证精确性。如我们已经实现如果天气预报一样,从刚开始的提前几个小时预警到提前几天预报,乃至提前几年到十几年的趋势预测,并将该成果运用到国家2030健康支撑中,有利于人民大众健康生活、延缓衰老,提高生命质量、减少医疗负担。
第三,从技术导向到问题导向。笔者10多年前在荷兰莱顿大学听过一位从事遗传算法研究的教授授课,了解到他经常主动与从事法律、生命、医学、图书管理、化学、药学等方向教授联系,寻找适合遗传算法来解决的实际问题。目前回想起来,一方面为他交叉学科意识所折服,另外一方面也在思考,这是拿着解决方案去寻找适合的问题,而且是单一解决方案,适用面可能很窄。当前科研难点问题越来越复杂,涉及知识面越来越宽,单一学科方向逐渐无力支撑。例如笔者最近主导发表在《科学》的文章中,是由英国团队从事药用植物育种、代谢产物检测、关键代谢酶进化研究的专家,与西安交大从事植物生理学、基因组变异检测、基因表达调控、计算机算法开发的学者通力协作完成的。缺少其中任何一环,都会严重影响该项目的重要性和创新性,也可能半途而废。我们从项目策划阶段就有意识地搭配不同学科方向学者协作,并在项目实施过程中动态调整,通过自己学习或者请教相关专家的方式,补齐短板,高效推进项目进展。从该项目中,笔者切实认识到不管黑猫白猫,能抓住老鼠就是好猫这一经验;假若老鼠太狡猾,孤猫难鸣,大可一群不同颜色的猫齐力攻关克难。
为适应未来学科发展的趋势,迎接可能的挑战,确保西安交大在此方向的制高点地位,学校和学院应该在教师科研和学生培养两个方面做好准备。
对教师,必须从技术导向转变到问题导向。在当前的模式下,教师身处在哪一个学科,其学科知识框架、科研项目经历,决定了今后研究方向,是典型的技术导向思维方式。面对国际科研难点问题越来越复杂,涉及多个学科联合攻关,这需要教师转换思维,从技术导向转变为问题导向。即从拿着解决方案去寻找合适的问题的思维方式,转变到针对特定的难点问题,跳出学科思维定式,思考如何更高效、更巧妙解决问题,尝试通过自己初步了解其它学科基本知识,主动与其它学科专业人士紧密合作,临时合理搭建多学科科研攻关小组,充分发挥科研中集体的力量。同欧美发达国家的研究机构,甚至与我国沿海地区的高校和研究所相比,西安交大在基础设施和人才储备总量上没有优势,这更加需要我们在体制机制上创新,大力提倡学科交叉、国际国内合作,避免个人英雄主义的单打独斗,发挥多学科联动和集体的智慧。
对学生,从注重传授知识转变到引导并培养学生与其它学科方向学生交流、协作,共同攻关的集体协作意识。从本科生开始,多设置通识课,打好学科交叉的基础;到硕士研究生和博士研究生课程阶段,可通过设置前沿科研进展讲座,多学科科研项目交流会等方式,让不同学科的硕士生和博士生能介绍自己的科研项目,分享遇到的关键科研难点,寻求其它方向教师和学生的帮助。根据笔者在博士学位期间自己助人和被助的科研经历,发现如果能找到合适的其它学科专家协助,一天时间相当于自己努力几个月到半年,这使得困难变为容易,使“人为的”不可能变为“协作下的”可能。我们需要在学生中培养科研中的艰苦奋斗、协作意识、集体主义意识,警惕单打独斗的个人英雄主义意识。
作者简介:叶凯,电信学院教授,荷兰莱顿大学客座教授。
邮箱:kaiye@xjtu.edu.cn
团队简介:
西安交通大学叶凯青年科学家工作室成立于2016年3月,并于2016年4月2日正式挂牌,是学校首个以科学家命名的青年科学家工作室。工作室由叶凯教授担任首席科学家,带领工作室从事应用人工智能于生物医疗的海量数据模式挖掘,是具有鲜明交叉学科特色的基因组学与生物信息学研究团队。工作室致力于逐步建成一支具有国际一流水平的研究团队,承担国家重大重点课题及重大国际合作课题,不断产出重要原创性成果,培养一批具有国际竞争力的优秀人才,探索有利于科研创新的新体制、在交叉学科大环境下的全新人才培养模式。同时,对相关一级学科及科研基地的发展形成有力支撑。
工作室始终以“交叉学科、国际合作”为发展理念,团队由不同学科背景的科研研人员组成:留学归国教授1名、副教授2名,讲师1名,医学博士后1名,生物实验员2名;招收研究生涉及多个学科,在读硕士14人、博士3人。
工作室自成立至今,已主持4项国家自然科学基金项目,参与或作为课题负责人承担2项科技部重点研发“精准医学”项目;与国外多家一流高等学府、科研机构建立并开展了紧密的科研合作;在工作室的牵头下,学校与荷兰莱顿大学签署了11个双硕士、双博士研究生培养协议,涉及生命、医学、计算机等多个学科。2018年8月,叶凯教授领衔中英科学家以西安交通大学为第一作者在Science上发表的“鸦片罂粟基因组及吗啡喃的合成”,在国际上首次公布了鸦片罂粟的高质量全基因组序列,引起行业内广泛关注,被国内外著名媒体报道。