本篇文章3941字,读完约10分钟
最近,计算语言学协会(ACL),自然语言处理领域最权威的国际学术会议,发表了2017年聘请的论文。
自然语言处理是人工智能最重要的研究方向之一,它以人类语言为研究对象。作为自然语言处理领域最具影响力和活力的国际学术组织,第55届国际计算语言学会年会将于2017年7月30日至8月4日在加拿大温哥华举行。
4月22日,为促进中国自然语言处理相关研究的发展和研究人员之间的交流,中国信息社会青年工作委员会和腾讯公司在北京召开了“2017年中国语言学会论文报告会”,邀请了部分国内聘请论文的作者报告他们的论文方法,共同探讨自然语言处理领域的新发展和新技术(从幻灯片下载,主讲人)。
作为一个合作媒体,雷锋。会议还邀请了《科技评论》参加,会后还采访了一些作者,请他们就投稿技巧、心中的偶像、未来计划以及新旧研究方法之间的联系发表看法。雷锋。(公开号码:雷锋。com)将答案总结如下。
雷锋。请简要描述一下这次提交的过程,从选题、手稿撰写、提交到收录。你认为什么样的经历可以效仿?吴双智:如果你不谈经验,那是一个循序渐进的过程。首先,我专注于做神经网络机器翻译,所以我需要掌握和理解现有模型的优缺点。我通常会看很多相关的作品,寻找灵感。这篇文章的内容也试图解决翻译中的一个经典问题。至于方法,是在偶然的机会与同事讨论时决定的,当时也是抱着尝试的心态。当模型原型制作完成后,发现效果相当好,所以我们可以继续深入做下去。后来,就在提交acl之前,它几乎完成了,acl被投票。所以我认为这是一个循序渐进的过程。
何世柱:在读博士期间,我一直在研究知识库问答。我了解到目前知识库问答研究的一个重要瓶颈是问答标注数据的缺乏。碰巧的是,研究组的一些老兄弟正在研究社区问答,社区问答中有很多用户标注的问答数据,虽然这些数据很吵,也有错,但仍然是非常有价值的资源。因此,当时我想知道我是否可以使用社区问答的数据来帮助知识库回答。早期的想法很简单,我没有想到更好的模型来完成这样的任务。在过去16年的上半年,我看过华为诺亚方舟实验室的几部相关作品,并与相关作者进行了深入的交流和交流。受此启发,本文的模型是根据我们的问题设计的。
在选择题目的时候,我和小组里的老师讨论过,他们认为题目很有意义,但是困难在于如何评价。目前,还没有好的评价方法,只能边工作边探索来推动工作。任务是什么,要解决的问题是什么,解决这些问题的模型是怎样的?这些想法确定之后,论文的写作就会更加流畅。
另外,在写作过程中,老师和学生,尤其是不在这个研究领域的学生,帮助检查也是非常重要的。就个人而言,仔细思考并讨论“要解决什么问题”和“如何解决这个问题”是非常重要的。
罗::这篇论文的题目比较自然。在关系抽取的相关实验中,我发现数据集的噪声极大地影响了最终关系抽取器的效果。然而,通过查阅以前的文献,我们发现以前的工作已经粗略地处理了这个问题。因此,我通过查阅其他领域噪声处理的相关文献来寻找灵感,并根据关系抽取的具体情况设计了当前的算法,并进行了相应的实验。由于编写代码和做实验相当顺利,所以最初完成这项工作并不需要太多时间。然而,由于这部作品中有许多线索,所以写这部手稿花了很大的力气,从开始到最后定稿也花了一个多月的时间。努力工作是有回报的,并且评审者给出的分数相对较高,所以它从提交到包含都很顺利。
就经验而言,首先,我认为选题是论文的基础,而选择的研究方向最好是解决一类问题,或者可以显著提升一项重要任务。在方法设计方面,我们可以从问题本身的角度来分析问题的本质和难点。在澄清问题之后,我们可以结合大量的文献研究来寻找灵感,同时保证我们自己方法的新颖性。
当你最终写好一份手稿时,你必须认真对待它,因为做好一份工作是没有用的,让别人难以理解,或者论证不足。最好在截止日期前一个月开始写,然后通过迭代逐步改进。在迭代过程中,我们必须请有经验的人(如导师和高年级学生)给出一些建议,并努力弄清楚评审者在文章中可能发现的所有问题。例如,当我写这篇手稿时,有人指出直觉是不够的,文章的上下文需要重新组织,某一部分的实验缺失,实验演示太浅。要找出这些问题,我们需要有足够的提交论文的经验,但是我们的学生往往在这一点上缺乏经验,所以找到更有经验的人来给出一些建议可以大大提高最终论文被接受的概率。
不愿透露姓名的作者:这次我很幸运,我的作品可以被收入acl。本文提出的模型简单,但方法相对新颖。由于研究方向是信息抽取,我们一直在探索信息抽取相关任务的方法,不存在选题问题。在尝试和探索方法方面做了大量工作。
至于方法的探索,这次我们并不局限于现有的抽取方法框架,而是借鉴自然语言处理的其他研究任务,将我们需要研究的抽取问题转化为另一种形式的“序列标注问题”,从而便于使用更有效的端到端模型来实现抽取。在相关数据集上进行了实验,实验结果也验证了该方法的有效性。
有了以上实验工作,你就可以开始写论文了。总的来说,我写论文的想法是:提问(清楚地解释这篇论文要研究什么样的任务以及它的意义),分析问题(这个任务的特点和现有方法中存在的问题),解决问题(设计模型的想法和本文模型的创新)。力求思路清晰,逻辑严谨,描述通俗易懂。在学术道路上我还有很多要学。以上只是我自己在研究过程中的习惯和体会。
屠存超:我认为选择一个话题最重要的方面是面对现实问题,提出自己的解决方案,不要无病呻吟。动机足够强或者研究问题足够新,这样我们就更有把握被美国公民自由联盟的顶尖专业人士雇佣。
夏乔·林:虽然我的论文是在自然语言处理领域,但它受到了很多其他领域的论文的启发,所以我的经验是,多读一些自己学科的论文可能会有所帮助。
雷锋。在nlp方向有什么偶像吗?谁是学术界?谁是行业?何世柱:斯坦福大学nlp小组的梁佩西受到nlp的崇拜。我读了他的相关文章,深入研究了他的开源思想。人们发现他不仅写得好,而且代码也很漂亮。阅读他的文章和代码获益匪浅。
不想被命名的作者:没有固定的偶像,只有一些被欣赏的作品。像辛顿、伦存这样的大奶牛更多的是一种敬畏和崇拜。此外,我很欣赏像mikolov这样的年轻学者,他刚刚从博士学位毕业,并推出了颇具影响力的word2vec工作,很好地将学术和工程结合起来。
杜存超:学术偶像:克里斯托弗·曼宁;;行业偶像:托马斯·米科洛夫
雷锋。你有想加入的公司吗?是哪一个?你打算创业吗?吴双智:就我个人而言,我喜欢做研究,我希望研究成果能够投入实际应用。所以我希望加入一家可以做研究和实现产品转型的公司。至于创业,我还没有想过。
何世柱:我现在没有加入这个行业的想法,也没有创业的计划(也许我应该多锻炼,我觉得创业很难)。还是你更喜欢科学研究的自主性?然而,我们的相关研究实际上与工业应用非常相关。例如,我的文章是为了解决行业中真正的用户需求。因此,我们也非常乐意与业界合作,因为我们可以更准确地获得真正的用户需求和数据。
夏乔·林:我还在读博士,但我会考虑去谷歌这样的公司实习。丹尼尔集中的地方,我应该学到很多。我想尝试在中国的一些创业公司实习。
屠存超:打算创业。
雷锋。你如何看待当前热门的研究方法(神经网络)和传统方法之间的关系?或者如何对待经验主义和理性主义的钟摆。吴双智:我认为神经网络与传统方法相比有很多优点。神经网络具有很强的学习能力。我们知道在很多任务中,传统的方法可能需要复杂的子模型来完成,而且训练过程和使用过程都很复杂,这就需要更多的背景知识。然而,神经网络可以用一个网络来模拟任务,并且它在许多任务上的性能优于传统方法。神经网络模型降低了自然语言许多经典任务的门槛。然而,我不认为我们应该盲目地跟随神经网络,我们应该在应用神经网络的同时思考具体的任务。传统方法是领域专家多年的研究成果,值得借鉴。
因此,我认为对于一个特定的任务,我们不仅要使用神经网络,还要掌握这个任务的传统和经典的方法。
何世柱:这个问题很大。在实践中,我只能根据自己的感受来回答。神经网络和传统方法各有优缺点。神经网络具有很强的表达能力,能够很好地概括数据(本质上是平滑的),并且具有较强的记忆能力(能够存储和匹配更多的数据模式)。然而,神经网络方法对数据有较高的要求,因此大量高质量的数据可以学习到好的模型。传统方法可以很好地整合人类知识。事实上,许多神经网络方法都试图添加更多的外部知识。例如,在机器翻译中添加句法信息实际上是一种外部知识。我们的工作是将存储在外部知识库中的知识整合到神经网络中。
罗:我认为神经网络方法在很大程度上为传统方法研究的问题提供了一个新的建模视角,即不同于传统的通过人工构造特征来描述问题的方法。神经网络方法可以通过设计神经网络的结构来模拟问题的各种特征,或者通过深层网络使模型自己学习特征。虽然神经网络的优点之一是不需要特征工程,但它与传统的基于特征的方法并不冲突。例如,谷歌的深度和广度模型就是神经网络模型和传统特征工程方法相结合的典型例子。另外,像lstm+crf这样的模型是神经网络和概率图模型的有效结合。我相信将来我们会看到更多的神经网络与传统方法相结合的案例。
不愿透露姓名的作者:当前热门的神经网络方法更倾向于数据驱动的方法。与传统方法相比,它不需要更多的人工干预,但对训练数据有很强的依赖性。在当今的大数据时代和丰富的计算资源中,它相对更具优势。此外,它们不是完全独立的,它们可以相互补充。例如,传统的手工定义规则模板的方法可以提供精确的先验知识,以及如何将这些精确的先验知识与神经网络模型融合。
* movoi的nlp工程师李超为本文撰稿。
雷锋原创文章。严禁擅自转载。详情请参考转载说明。
来源:搜狐微门户
标题:尽管有伊隆马斯克的嘲讽,但学术论文该写还是要写的,而且要写好
地址:http://www.shwmhw.com/shxw/63099.html