近日,西安交通大学杨瑞娜教授团队的研究成果《Eliminating Social Popularity Bias in Recommendation: Causal Inference-Based Social Graph Neural Networks》正式发表于管理学顶级期刊《INFORMS Journal on Computing》。该研究聚焦社交推荐系统中长期被忽视的社交流行度偏差问题,通过引入因果推断框架,为企业与平台提供了兼具推荐准确性与多样性的解决方案,再次彰显了中国学者在管理科学与人工智能交叉领域的前沿探索实力。
研究背景:社交推荐系统的双重偏差困境
在信息过载的时代,推荐系统已成为连接用户与信息的关键工具。社交推荐系统通过引入用户之间的社交关系,在缓解冷启动问题和提升推荐效果方面展现出显著优势。然而,社交推荐模型不仅存在传统推荐系统中广为人知的物品流行度偏差,还面临一种被现有研究所忽视的社交流行度偏差。物品流行度偏差使得热门物品被过度推荐,大量长尾物品难以获得曝光;社交流行度偏差则使得用户倾向于追随意见领袖的偏好,导致用户表征的学习产生偏倚。两种偏差相互交织、相互强化,使得推荐结果同质化严重,最终损害推荐的多样性与准确性。目前,尚未有研究系统性地探讨社交流行度偏差的形成机制及其消除方法。
研究内容:基于因果推断的去偏框架创新构建
现有针对推荐系统偏差的解决方案主要包括四类:基于逆倾向评分加权的方法、基于排序调整的方法、基于训练正则化的方法,以及基于因果嵌入的方法。然而,这些方法大多只关注物品流行度偏差,而忽略了社交关系引入的额外偏差。尤其是在社交推荐场景中,物品流行度与社交流行度往往相互交织,使得传统去偏方法效果有限。
基于上述现状,杨瑞娜教授团队联合博士生徐慧琳、西北工业大学的耿瑞彬副教授,针对社交推荐系统中的社交流行度偏差问题展开深入研究。研究过程中,他们首先构建了一个因果图模型,系统揭示物品流行度与社交流行度作为混杂因素如何通过后门路径干扰用户表征的学习,以及用户一致性偏好如何绕过匹配分数直接对排序分数产生干扰。针对上述问题,研究提出了两种核心去偏方法:通过后门调整技术阻断因果图中的混杂路径,实现对用户表征的无偏估计;通过反事实推理策略,计算一致性偏好对排序分数的总效应与自然直接效应的差值,从而剥离社会影响力的干扰。基于上述方法论,研究构建了基于因果推断的社交图神经网络模型(CISGNN),并在Ciao、Epinions、Yelp-Philadelphia和Yelp-Tucson四个真实社交数据集上进行了严格验证。

图1 基于因果推断的社交图神经网络模型(CISGNN)
研究成果及其影响:引领推荐系统治理新范式
通过大量实验对比与消融分析,研究团队揭示了社交流行度偏差与物品流行度偏差的相互作用机制。首先,研究表明通过因果图建模可以系统消除两类偏差的干扰。在四个真实社交数据集上的实验结果表明,CISGNN模型在推荐准确率(HR、NDCG指标)和推荐多样性(新颖度、小众物品覆盖率)两项关键指标上均显著优于现有最优模型,打破了推荐系统中准确性与多样性难以兼顾的传统困境。其次,该研究探讨了后门调整与反事实推理两种去偏方法的协同作用。分析表明,后门调整主要用于消除混杂因素对用户表征学习的干扰,而反事实推理则进一步剥离一致性偏好对排序分数的直接影响,二者共同实现了对社交流行度偏差的根源性消除。
研究成果以“Eliminating Social Popularity Bias in Recommendation: Causal Inference-Based Social Graph Neural Networks”为题,发表在管理学顶级期刊《INFORMS Journal on Computing》(UTD 24 期刊)上。作为UTD24顶级期刊之一,《INFORMS Journal on Computing》一直是管理科学与计算交叉领域的权威发声平台。未来,团队将继续聚焦推荐系统与因果推断的前沿问题,为推动算法公平与信息生态健康发展贡献更多力量。