今日交大

【科技自立自强】西安交大孙鹤立教授团队在AI生成式信息检测领域取得进展

日期：2025-11-26 14:59 浏览量：

随着Deepseek-R1、GPT-5以及通义万相等大模型的接连出圈，人工智能生成内容（AIGC）技术受到越来越多的关注。AIGC在为内容创作、文化传播带来新发展契机的同时，也为虚假信息、合成媒体滥用以及深度伪造等新型社会安全威胁的滋生与扩散提供了技术基础和发展温床。为此，针对AI生成式信息的检测，亟需发展具备跨模态感知与细粒度辨伪能力的技术手段，以应对日益复杂的多重伪造挑战。

在国家自然科学基金等项目资助下，西安交通大学电信学部计算机学院孙鹤立教授团队针对视听跨模态场景下的伪造人脸检测开展研究，提出通用面部表征建模与强判别性伪造特征捕捉的二阶段学习范式（如图1）。具体而言，首先构建出当前业界最大的多源混合式自监督视听人脸表征学习数据集以支撑大规模编码器预训练，其次设计提出迭代感知的渐进式分级上下文聚合组件以促进高效跨模态融合与伪造线索捕获，最后引入伪监督信号语义注入策略以从全局层面进一步拓宽深度模型的判别边界，并提升对于细微人脸伪造痕迹的鲁棒检测能力。在多媒体领域国际顶级会议ACM Multimedia 2025（计算机学会推荐的A类会议）上，所提出的方法超越了来自美国普渡大学、韩国成均馆大学、中国科学技术大学以及Pindrop（美国语音安全领域头部公司）等多个国内外研究团队，获得2025年1M-Deepfake检测全球挑战赛总冠军。在共包含80万条样本的测试集上，取得超出第二名4.76个百分点的优异成绩。

该研究工作为AI生成式信息检测技术的发展提供了一种新方案，并能够为通用视听场景理解以及数字内容安全治理体系的构建带来可行的实践参考。

图1. 面向伪造人脸检测的二阶段学习范式示意图

同时，基于上述研究成果形成的学术论文HOLA: Enhancing Audio-visual Deepfake Detection via Hierarchical Contextual Aggregations and Efficient Pre-training已被ACM Multimedia 2025国际多媒体大会接收。孙鹤立教授与计算机学院2023级硕士研究生武雪程为共同第一作者，西安交通大学为第一署名单位。

文字：电信学部

图片：电信学部

编辑：王恺悦

上一条：【科技自立自强】西安交大何刚教授科研团队在紫精光生物催化领域取得重要进展

下一条：西安交大第十一届全国大学生物理实验竞赛（创新）获佳绩