《看有新诗带醉来》封面。 陕西日报记者 孙亚婷翻拍
人工智能“华七”IP形象。受访者供图
人工智能的发展大潮汹涌澎湃,影响力与日俱增。在先进算法、计算能力提升、大数据积累等的助推下,人工智能在文本处理、绘画、写作等领域的运用日益广泛,展现出强大的创造性和实用性。
人工智能作诗在大众视野中频频“现身”。近期,西安交通大学师生团队研发的人工智能诗词创作系统“华七”创作了一本诗词集《看有新诗带醉来》。
“华七”和它的诗作是如何诞生的?人工智能作诗有何现实意义?未来又将如何?这些都值得思考和探索。
一个团队的强势集结
2023年6月,西安交通大学外国语学院博士生导师、中日诗歌研究所所长金中带领学校东亭诗社的学生加入人工智能发展大潮中,成立了一个人工智能作诗研发团队。
“我们团队的学生从大一到研二,专业五花八门,其中有几位是计算机专业,懂得编程方面的专业知识。他们都上过我的‘中华诗词创作’选修课,喜欢诗词。就这样,我们聚在了一起,发挥各自的强项,互相配合,成为一个整体。”金中说。
团队成立初期没有任何资助和设备,甚至没有可以展开研发创作的空间,使用的自然语言处理模型是现在相对陈旧的BERT和GPT-2。凭着对诗词的一腔热爱,金中和学生们开启了人工智能诗词创作这项研究。他们利用课余时间,开会研讨、请教专业老师,一步一个脚印,不断优化程序,终于有所收获。
“我把我们团队研发的人工智能命名为‘华七’。‘华’取中华之华,‘七’取七言律诗的七。”金中介绍。
经过紧锣密鼓的筹备,团队选择从模拟最有代表性的唐代诗人李白开始,尝试让“华七”进行创作。2024年元旦,团队让“华七”以李白的50首格律诗的首句为基础进行创作,总计生成了9804首作品,共用时69.7分钟。
接下来,金中细细品读了“华七”的诗。长期从事诗歌创作、朗诵、翻译及学术研究的他,对“华七”生成的诗感到十分震撼。这让他产生了想要将人工智能诗作汇编成集的想法。
2024年春节过后,金中在已经品读完成的“华七”诗作中挑选了100余首,形成《看有新诗带醉来》初稿。
文学创作的数学转化
4月20日,由雁塔诗词学会主办的首届人工智能作诗研讨会在长安南路小学举办。陕西省信息哲学领域、诗词界、教育界及文学评论领域的数名专家学者,围绕人工智能作诗的诸多话题展开研讨,对《看有新诗带醉来》进行了审稿讨论。
为了更直观感受人工智能作诗的速度之快,检验诗作质量,研讨会上,金中邀请在座专家现场出题,直接展示“华七”的作诗过程。
“当我们给‘华七’输入首句作为指令,确定好生成诗作的体裁要求后,‘华七’会将首句转化成词向量,然后在已录入的作为学习资料的116万首中国古典诗词中挑选出第二句的第一个字,接着再根据首句和第二句的第一个字挑选第二句的第二个字,以此类推,最终生成整首诗。”金中解释。
人工智能的作诗机制,其实是把诗歌创作这一文学问题转化为基于统计、概率和算法的数学问题。人工智能作诗的方式与人不同,基于数学概率论的方法进行创作,使人工智能可以在古今中外所有的知识和一切能搜索到的人类经验中遨游,不受特定经验、灵感的局限,风格可以豪迈抑或婉约,口吻可以激情澎湃,也可以深沉如钟。
AI能写出好诗吗?
目前,“华七”的载体是一台普通的笔记本电脑,创作一首七言绝句平均用时约0.3秒,一天内可以生成20多万首诗歌。
金中说:“人工智能生成的诗质量参差不齐,必然会出现一些词不达意、可读性差的残次品,但数量如此庞大的诗作中确实会出现一部分具有独特文学价值的佳作或佳句。而且经过图灵测试可以看出,人们对‘华七’创作的诗作和唐诗的识别正确率不到50%,说明了AI诗作的文学价值。”
“床前明月光,中有桂子香。姮娥倚桂树,邀我白霓裳”是收录在《看有新诗带醉来》中,“华七”以“床前明月光”为首句创作的新诗之一。“‘华七’展开联想,关联知识,由月而见桂,由桂而知香,由桂香而思嫦娥,由嫦娥而想霓裳,展现了一幅意境优美的浪漫画卷,实在令人惊讶。”西安交通大学国际信息哲学研究中心主任邬焜说。
人工智能作诗的现实思考
我国是诗歌大国,以唐诗宋词为代表的中华传统诗词是国人千百年来引以为傲的文化精粹。利用人工智能赋能文学教育,为中华优秀诗词文化的传承与发展贡献力量,是金中团队的初衷。
人工智能创作的潜力是巨大的,人工智能诗作的出现是否会对现有的文学生态环境造成冲击?
金中表示:“人们总担心自己会被机器取代。但我相信,只要人类还保留着人工智能无法取代的特定强项,比如鉴赏能力,那便具有与人工智能良好合作、共生共存的基础,有可能构建一个人类和人工智能各取所长、相互受益的良好环境。”
研讨会上,专家学者认可这样一个观点:人工智能作诗不是要代替人写诗,而是要帮助人把诗写得更好。
金中提出,未来的诗歌创作界将会淘汰一批低水平的拟古诗,当代诗词高手的创作水平将显著提升;诗词将不再是少数文化人的专利,会成为社会大众的通用品。他希望能够与诗词界人士更加紧密地团结在一起,用人类的智慧有效地管控机器创作。
为避免人工智能诗作泛滥、规避其弊端,金中设计了一个针对人工智能诗作编号的体系,使人工智能诗作拥有自己的“身份证号码”。据此可以看出该诗是应何人之请、由哪个人工智能团队何时所生成等信息,能对其来源和去向进行追溯,以便进行统一规范的管理。
“今后,我们可以构建一个大型的AI诗词作品库,可以随时检索,尽量杜绝有人抄袭AI的作品来招摇撞骗之类的问题发生。同时,会联系其他从事人工智能作诗的科研团队,与我们一起组建一个联盟,就AI诗作的管理机制和行业准则达成共识。”金中说。