adequacy AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文( 七 )


20. 置信加权多任务学习
Confidence Weighted Multitask Learning
这项研究由阿卜杜拉国王科技大学与腾讯AI Lab合作完成。为了缓解传统在线多任务学习仅利用了数据流的一阶信息的问题,我们提出置信加权多任务学习的算法。对于每个任务,它都维护了一个高斯分布来引导在线学习过程。高斯分布的均值向量是一个局部成分和全局成分的和,其中全局成分是在所有任务间共享的。此外,本文也解决了在线多任务学习场景下主动学习的挑战。不同于索要所有样本的标签,所提算法可以基于相关任务的预测置信度来决定是否索要相应的标签。理论结果显示,后悔上界可以被显著的减小。经验结果表明,所提算法可以获得很高的学习性能,且同时可以减小标注成本。
21. 旨在提升asepct-level情感分类的、从粗粒度到细粒度的迁移学习
Exploiting Coarse-to-Fine Task Transfer for Aspect-level Sentiment Classification
这项研究由香港科技大学与腾讯AI Lab合作完成。Aspect-level的情感分类旨在找出句子里针对具体aspect的情感倾向,其中aspect可以是一个泛类,比如食品、服务,也可以是一个具体的项,比如三文鱼、时速。然而,由于极其耗时耗力的标注成本,当前AT-level的公开数据集都相对较小。受限于这些小规模的数据集,当前大多数方法依赖于复杂的结构,从而限制了神经网络模型的有效性。该论文提出了一个新的解决方案,即从数据相对充足的粗粒度任务到数据稀疏的细粒度任务进行迁移学习。为了解决两个领域在aspect粒度以及特征上的不一致,本文提出了一个多粒度对齐网络。在MGAN中,一个全新的Coarse2Fine注意力机制可以帮助AC-level的任务也可以建模同AT-level相似的细粒度。同时,一个对比的特征对齐方法用来语义对齐两个领域的特征表示。另外,本文提供了一个AC-level的大规模多领域情感分类数据集。大规模的实验证明了MGAN的有效性。
22. 基于属性仓库的表亲网络引导的素描图识别
Cousin Network Guided Sketch Recognition via Latent Attribute Warehouse
这项研究由腾讯AI Lab主导,与澳洲国立大学合作完成,本论文对扫描图片识别的问题进行研究。由于两个原因导致该问题难度较高:1)素描图片相对自然图片比较稀缺,2)素描图片与自然图片之间存在较大的鸿沟。为了克服这些困难,研究者提出了利用自然图像训练好的网络来引导素描图片识别网络的学习过程。表亲网络将引导素描图片识别网络学习更多与自然图像相关的特征。为加强分类模型的可迁移能力,一个连接自然图像和素描图像的属性仓库建立起来,以逼近自然图像和素描图像的域间差。实验证明本文提出的方法取得了当前最优的识别性能。
23. 层级化的照片场景编码器用于相册故事生成
Hierarchical Photo-Scene Encoder for Album Storytelling
这项研究由腾讯AI Lab主导,与山东大学合作完成。本文提出了一种用于相册故事生成的新型模型,该新型模型使用了层级相片-场景编码器和重构器。其中,相片-场景编码器包含两个子模块,分别是相片编码器和场景编码器,它们重叠在一起,以分层的形式充分利用相册中照片的结构信息。具体来说,相片编码器利用相册中相片的时序关系的同时,为每一张照片生成语义表示。场景编码器依赖于生成的相片语义表示,负责检测相册的场景变化并生成场景特征。接着,解码器动态地、有选择性地总结这些编码的相片和场景语义表示,用以生成相册表示序列。基于此,一个含有多个一致性句子的故事就产生了。为了充分提取和利用相册中有效的语义信息,重构器被引入到该模型中,来重构那些基于解码器的隐藏状态而被动态总结了的相册表示。本文提出的模型以一种端到端的形式进行训练,在公开的visual storytelling数据集上得到了更好的性能。对比研究实验进一步论证了本文所提出的层级相片-场景编码器和解码器的有效性。

推荐阅读