当前位置: 新闻网首页>今日交大>正文
今日交大

数学筑基解构大模型 探索人工智能新范式

国家天元数学西北中心“揭示大模型机理的新一代机器学习数理基础讲习班”举办

日期:2025-04-04 09:09 浏览量:

大模型技术正以前所未有的速度推动人工智能的飞速发展,但其底层机理仍未被完全探索,隐藏着无尽的数学奥秘。为了系统化地剖析大模型背后的数学、统计、物理与生物基础,西安交通大学数学与统计学院依托国家天元数学西北中心于3月28日至4月1日成功举办“揭示大模型机理的新一代机器学习数理基础讲习班”。本期讲习班作为中心“数学与人工智能”主题年的核心活动,聚焦大模型的底层机理,开设了六门前沿课程,吸引了来自全国20余所高校及科研机构的百余位青年学者和博士生,共同开启一场探索大模型数理基础的学术盛宴。

开幕式上,国家天元数学西北中心主任、西安交通大学徐宗本院士在线上为讲习班致辞。他剖析了人工智能浪潮下数学研究的机遇与挑战。他指出,当前大模型技术发展迅猛,但其底层机理仍缺乏系统性理论支撑,这为数学研究者提供了“探索本质问题、突破核心瓶颈”的机遇。徐院士强调,数学研究者应直面大模型发展的核心问题,从理论解释和工具创新中寻找突破点,而非停留于“小修小补”式的算法改进。他期待通过主题年系列活动,助力学者在大模型数理基础领域取得原创性突破。讲习班召集人、西安交通大学孟德宇教授进一步阐释了讲习班的定位:本次课程涵盖了任务泛化能力、智能涌现能力、鲁棒-精确悖论、“思维链”训练能力、高效优化机制等六大主题,并融入了物理、生物等跨学科探索,力求通过系统化的课程内容帮助学者构建全局视角,为学员拓展研究思路。

在为期五天的讲习班上,西安交通大学孟德宇教授讲授了具有本质“任务泛化能力”的“模拟学习方法论”的机器学习模式,并介绍其统计学习理论基础以及在机器学习自动化任务当中的有效应用。东北师范大学郑术蓉教授与西安交通大学束俊副教授讲解了智能涌现及尺度率等基本知识,并揭示了大模型完全不同于小模型的统计学习规律。北京大学王立威教授与贺笛助理教授围绕神经网络的表达能力,探讨了其如何帮助理解并正确指引现代模型和算法的设计。西北核技术研究所张俊杰副研究员聚焦“大模型的鲁棒-精确悖论现象”,从物理学原理角度出发介绍了深度神经网络的固有不确定原理、副本对称破缺机制。西安交通大学叶凯教授与杨晓飞教授聚焦生命系统与人工智能的深度融合,探索了如何从生物智能的动态性、涌现性和超高效能中汲取灵感,突破传统模型的固有局限。香港中文大学(深圳)孙若愚副教授围绕大模型的高效优化机制展开,系统介绍了大模型优化算法的核心技术与最新发展趋势。在学术交流环节中,学员与专家围绕可解释性理论构建、物理启发式AI实践等议题展开了热烈讨论。学员们表示,课程不仅梳理了前沿理论,更让大家意识到数学工具在解决大模型底层机理、提升模型泛化能力、优化训练效率以及探索人工智能与多学科融合等问题中的巨大潜力。

此次讲习班是国家天元数学西北中心2025“数学与人工智能”主题年的核心活动。主题年系列活动将围绕“揭示大模型机理的新一代机器学习数理基础”“探讨人工智能与科学计算相融合的新一代数值方法数学机理”和“构建重大应用领域具有理论保证与安全可控的专有人工智能方法”三大科学问题,开展系统性研究和学术交流活动,支持西部地区青年学者开展创新研究。未来中心将持续聚焦国家重大需求,推动数学与人工智能的深度交叉,为破解“卡脖子”技术难题、培育复合型人才提供理论支撑与智力支持。

文字:数学学院 白佳宁
编辑:星火

关闭

相关文章

读取内容中,请等待...