为探讨生成式人工智能在助力语言诊断测试与评价的创新发展与改革实践,5月16日至18日,“AI+背景下的语言诊断测试与评价专题研讨会”在西安交通大学召开。本次研讨会由中国英汉语比较研究会语言测试与评价专业委员会主办,西安交通大学外国语学院承办,《外语测试与教学》编辑部、《语言测试与评价》编辑部、《外语教学》编辑部和《北京第二外国语学院学报》编辑部协办。会议吸引了国内外近百所高校的近200位师生参加。
5月16日,本次研讨会的系列工作坊在逸夫外文楼拉开帷幕。Rasch专家张权和魏金刚以“Rasch-GZ: Item Analysis and Test Equating in the Age of AI”为题,谢琴副教授和博士生杨洋以“AI赋能的学术成果可视化传播”为题,杜文博、董艳云和史晓婷以“AI赋能的语言认知诊断评估”为题开展工作坊。三场工作坊分别由西安交通大学杜文博、钱希和马晓梅主持。工作坊紧跟学术前沿,方法专业、启发深远,现场座无虚席。
5月17日上午,会议正式开幕。西安交通大学副校长洪军、中国英汉语比较研究会语言测试与评价专业委员会会长刘建达出席开幕式并致辞。开幕式由西安交通大学外国语学院院长陈向京主持。

5月17日上午开幕式
5月17日上午,四场主旨演讲精彩纷呈。广东外语外贸大学副校长刘建达聚焦AI与技术赋能的形成性评价;澳门城市大学的程李颖教授在题为“Embracing AI to Create Impact-Driven and Diagnostic-Driven Assessment, Learning and Teaching”的发言中强调在人工智能背景下重新定义评估、学习、教学及三者关系的重要性;兰卡斯特大学教授Luke Harding在线做了题为“Assessing Communicative Competence in Technology-Mediated Environments: Towards New Understandings of the Speaking Construct”的报告,讨论了数字技术在口语测评中的多种作用,演示了如何使用语料库工具分析口语交流的语用和互动特征;新加坡南洋理工大学Vahid Aryadoust副教授带来了“Oracy Assessment for Learning in the Age of Generative AI”的发言,介绍了人机交互的Oracy结构、核心组件及其在学习评估中的作用。主旨发言分别由上海交通大学金艳教授,西安交通大学杨瑞英教授、孟亚茹教授,上海外国语大学潘鸣威教授主持。

5月17日上午主旨发言
5月17日下午,6场特邀论坛和12场平行论坛在逸夫外文楼展开。特邀论坛聚焦AI与技术赋能下的语言诊断与人机互动、L1/L2汉语教学测评与反馈、教师测评、测评素材加工与任务设计、认知诊断与反馈、形成性评估与动态评估,分别由浙江大学闵尚超教授、香港理工大学祝新华教授、华南师范大学许悦婷教授、华南师范大学金檀教授、西安交通大学杜文博助理教授、武汉大学李丹丽副教授召集;分别由伊利诺伊大学闫逊教授、西安外国语大学汪顺玉教授、上海外国语大学潘鸣威教授、西安外国语大学吕生禄教授、南京航空航天大学范婷婷副教授、上海理工大学刘芹教授点评。平行论坛围绕着AI赋能的语言测评与学习、反馈与师生反馈素养、翻译与口译研究、诊断性测评与动态评估、课堂教学、效度研究等话题展开,涵盖不同学习阶段、不同语言背景的AI赋能测评与教学实践。
5月18日,另外四场主旨发言相继展开。上海交通大学金艳教授以“高校人工智能使用政策:大学英语教师与学术的视角”为题,针对AI使用问题,探究我国高校AI政策与师生态度,为政策优化、AI融合的教学实践提供启示;澳门大学谢琴副教授通过文献计量学方法分析了过去三十年的测试反拨研究;美国伊利诺伊大学的闫逊教授带来了“Flexibility, Sensitivity, and Sustainability: What does AI Mean for Local Language Testing?”的发言,聚焦本地语言测评的特殊性,评估了人工智能在本地语言测评环境下的适用性和对当地的影响,探索了如何利用人工智能工具进行测试的开发、管理、验证。最后,西安交通大学孟亚茹教授做了“认知诊断在GenAI背景下的测评与反馈研究”的发言,展示了GenAI技术在提升听力试题干扰项和大学生英语写作语篇能力反馈报告生成方面的最新探索。本部分主旨发言分别由美国北卡罗来纳大学夏洛特分校王闯教授、浙江大学闵尚超教授、澳门大学谢琴副教授、西安交通大学马晓梅教授主持。

5月18日上午主旨发言
主编论坛由西安交通大学外国语学院副院长程冰主持,来自《中国外语》的副主编常少华,《外语与外语教学》的主编邓耀臣,Language Testing in Asia的联合主编金艳,《语言测试与评价》的编委闵尚超,《外语测试与教学》的编委潘鸣威,Language Education and Assessment(主编)、Language Assessment Quarterly (副主编)、TEFL Journal of Asia TEFL(副主编)谢琴、Language Testing的联合主编闫逊、《外语教学》的副主编赵永刚以及《北京第二外国语学院学报》的执行主编周长银分别介绍了各自期刊在语言测评与教学研究中的定位、办刊理念和特色,并提供了有针对性的建议,为与会专家的学术发表带来启发。

5月18日上午主编论坛
闭幕式上,程冰教授对本届研讨会的主题与内容进行了总结,高度评价了本次论坛的学术成果,对各方的支持与参与表示感谢,期待与会者们在语言测试与评价领域继续深耕、携手前行。

AI+背景下的语言诊断测试与评价专题研讨会合影留念
本次会议汇聚了语言测试与评价领域国内外极具影响力的专家学者以及来自国内外高校的师生。会议期间,前沿思想激烈交锋,学术观点碰撞融合,充分展示了语言测评领域的最新研究成果。本次会议作为一场学术盛会,对促进国际AI+背景下的诊断测试发展的学术交流、推动学科交叉融合、科技服务新文科建设具有深远意义。