本篇文章3330字,读完约8分钟

介绍

什么是艺术?

机器的工作可以称为艺术吗?

机器能代替艺术家吗?

我相信不同的人对这些问题会有不同的答案。许多人认为机器生成的作品只是模仿人类而没有创造性,但是人类艺术家不是从模仿和学习开始的吗?这篇文章是为《纸周刊》写的关于机器诗歌生成的总结文章,希望能提高人们对这一领域的认识。

诗歌是人类文学的瑰宝。自中国的《诗经》以来,两千年来的诗歌都充满了星星。在人工智能领域,让机器自动生成诗歌一直是一项具有挑战性的任务。

基于传统方法的诗歌生成

机器诗的产生始于20世纪70年代。传统诗歌的生成方法主要有以下几种:

单词萨拉达(Word salada)是最早的诗歌生成模型,它被称为简单地随机组合和堆叠单词,而不考虑语义语法要求。

基于模板和基于模式的方法:基于模板的方法类似于空.完形填空有些词是从一首现存的诗中挖掘出来的,用作模板,然后用一些其他的词替换以产生一首新诗。用这种方法产生的诗歌在语法上有所改进,但灵活性太差。因此,后来出现了一种基于模式的方法,它限制每个位置的词类和词的韵律水平来生成诗歌。

基于遗传算法的方法:周昌乐等[1]提出并应用于宋词的生成。在这里,诗歌创作被认为是空.各州之间的搜索问题首先,我们从随机的诗开始,然后借助手工定义的诗评价函数,进行连续的评价和迭代进化,最终得到诗。这种方法在单句中有很好的效果,但句子之间缺乏语义连贯。

基于抽象生成的方法:严锐等[2]将诗歌生成视为具有特定写作意图的抽象生成问题,并加入了一些与诗歌相关的优化约束。

基于统计机器翻译的方法:msra的何晶和周明[3]将诗歌生成视为一个机器翻译问题,将前一句作为源语言,下一句作为目标语言,使用统计机器翻译模型进行翻译,并加入押韵等约束条件得到下一句。通过重复这个过程,我们可以得到一首完整的诗。

基于深度学习技术的诗歌生成

传统方法在很大程度上依赖于诗歌领域的专业知识,这就要求专家设计大量的人工规则来约束生成的诗歌的节奏和质量。同时,它很难直接应用于其他文体(唐诗、宋词等)。)和语言(英语、日语等)。)。随着深度学习技术的发展,诗歌生成研究进入了一个新的阶段。

rnnlm

基于rnn语言模型[4]的方法,将诗歌的全部内容发送到rnn语言模型作为训练语料进行训练。训练完成后,首先给出一些初始内容,然后根据语言模型输出的概率分布进行抽样,得到下一个单词。重复这个过程会产生一首完整的诗。卡普西有一篇文章非常详细地介绍了这一点:递归神经网络的不合理的有效性

用递归神经网络生成中国诗歌

Rnnpg模型[5],第一个句子由用户给出的关键词生成,然后第二个句子由第一个句子生成,第三个句子由一两个句子生成,重复这个过程直到生成诗歌。模型的模型由三部分组成:

自愿句子模型(CSM): CNN模型,用于获得句子的向量表示。

递归上下文模型(rcm):句子级的rnn,它根据历史生成句子的向量,并输出下一个要生成的句子的上下文向量。

递归生成模型(rgm):字符级rnn,根据rcm输出的上下文向量和句子前生成的字符,输出下一个字符的概率分布。解码时,根据rgm模型的输出概率和语言模型的概率生成下一首诗,并通过人工规则保证押韵。

模型结构如下:

模型生成示例如下:

基于神经注意模型的中文歌曲iambics生成

模型[6]是一个基于注意力的编译框架,它把历史上产生的内容作为源语言,把下一句话作为翻译的目标语言。用户被要求提供第一句话,然后第一句话产生第二句话,第一句和第二句话产生第三句话,并且这个过程被连续重复,直到产生完整的诗。

基于注意机制和语义连贯理论,我们可以学习较长的诗歌,同时在一定程度上保证前后语义的连贯。

模型结构如下:

模型生成示例如下:

基于规划的神经网络中文诗歌生成

模型[8]是一个没有专家知识的端到端模型。它试图模仿人类开始写作之前计划写作大纲的过程。整个诗歌生成框架由两部分组成:规划模型和生成模型。

规划模型:以代表用户写作意图的查询为输入,生成写作提纲。写作大纲是一系列的关键词,第I个关键词代表第I个句子的主题。

生成模型:基于编解码框架。有两个编码器,其中一个以主题词作为输入,另一个编码器将历史生成的句子放在一起作为输入,解码器生成下一个句子。生成解码器时,使用注意机制对主题词和历史生成内容的向量进行评分,生成过程中各部分的重要性由模型决定。

在以前的模型中,用户的写作意图只能反映在第一句话中。随着生成过程的推进,后续句子与用户写作意图之间的关系变得越来越弱,并且可能出现话题漂移。规划模型可以使用户的写作意图直接影响整首诗的生成,从而在一定程度上避免了主题漂移,使整首诗的逻辑语义更加连贯。

总体框架如下:

生成的模型框架图如下:

诗歌的图灵测试:给定一个主题,让机器和人类分别写一首诗,让人类区分哪首诗是人类写的。实验结果也很有趣。对于普通人来说,不可能区分诗歌是由机器还是人产生的。以下是一组测试示例:

现代概念诗的例子;

诗人I:通过具有迭代抛光模式的递归神经网络的自动诗歌创作

模型[7]基于编码器-解码器框架。在编码器阶段,用户提供一个查询作为他的写作意图,并且cnn模型获得查询的向量表示。在解码阶段,使用了一个分层的rnn生成框架,它由两个rnn组成:句子级和单词级。

句子级rnn:输入句子向量表示,输出下一个句子的上下文向量。

字符级rnn:输入上下文向量和历史字符,并输出下一个字符的概率分布。当句子生成完成时,字符级rnn的最后一个向量作为表示句子的向量被发送到句子级rnn。

本文一个有趣的部分是,它想模拟人类诗歌写作的反复修改过程,并增加了润色机制。重复迭代提高诗歌生成质量。

总体框架如下:

生成主题诗歌

模型[9]基于编码器-解码器框架,分为两个步骤。首先,根据用户输入的关键词,获得每个句子的最后一个词,该词押韵并与用户输入相关。然后这些押韵的单词被作为一个序列发送到编码器,解码器生成整首诗。一方面,这种机制保证了押韵,另一方面,它类似于前面提到的规划模型,并在一定程度上避免了主题漂移。

模型框架图如下:

生成示例如下:

seqgan:具有政策梯度的序列生成对抗网络

模型[10]在图像中生成一个对抗网络,并将其应用于文本生成。生成网络是一个网络,它直接生成整首诗。歧视网络是美国有线电视新闻网。它用于判断这首诗是人写的还是机器生成的,并通过强化学习将梯度传递回生成网络。

模型框架图如下:

摘要

从传统方法到深度学习,诗歌生成技术已经取得了很大的进步,甚至在一定程度上,它可以生成普通人的真假难辨的诗歌。然而,目前诗歌生成技术只学习知识的概率分布,即诗歌内部和诗歌之间的搭配规则。不知道诗歌包含思想和感情。因此,尽管生成的诗歌看起来不同,但它们仍然感觉只是表面的,缺乏人类精神的痕迹。

当 AI 邂逅艺术:机器写诗综述

另一方面,与机器翻译不同,诗歌仍然依赖人工主观评价,缺乏可靠的自动评价方法。因此,模型优化的客观功能与主观诗歌评价指标之间存在较大差距,这也影响了诗歌生成质量的提高。在围棋游戏中,以阿尔法戈为代表的机器已经超越了人类的顶尖玩家,但在诗歌一代的人类顶尖诗人之前,还有很长的路要走。

参考

[1]宋词自动生成的遗传算法及其机器实现

[2]i,《诗人》:通过约束优化下的生成式摘要框架自动撰写中国诗歌

[3]用统计机器翻译模型生成中国古典诗歌

[4]基于递归神经网络的语言模型

[5]用递归神经网络生成中国诗歌

[6]基于神经注意模型的中国歌曲韵律词生成

[7]i,诗人:通过具有迭代抛光模式的递归神经网络的自动诗歌创作

[8]基于规划的神经网络的中国诗歌生成

[9]生成主题诗歌

[10]seqgan:具有政策梯度的序列生成对抗网络

雷锋。(公开号码:雷锋。com)出版社:这篇文章的原作者是萧瑟,它最初发表在作者的智湖专栏。

人工智能神经网络专业培训班

20年来,清华大学神经网络讲师将带你系统地学习人工智能的神经网络!

一站式深入了解深度学习的发展现状、基本原则和主要方法。

课程链接:mooc.ai/course/65

雷锋文章版权所有。严禁擅自转载。详情请参考转载说明。

来源:搜狐微门户

标题:当 AI 邂逅艺术:机器写诗综述

地址:http://www.shwmhw.com/shxw/61422.html