Advancing Seq2seq with Joint Paraphrase Learning

Clinical Natural Language Processing Workshop Pub Date : 2020-11-01 DOI:10.18653/v1/2020.clinicalnlp-1.30

So Yeon Min, Preethi Raghavan, Peter Szolovits

引用次数: 5

Abstract

We address the problem of model generalization for sequence to sequence (seq2seq) architectures. We propose going beyond data augmentation via paraphrase-optimized multi-task learning and observe that it is useful in correctly handling unseen sentential paraphrases as inputs. Our models greatly outperform SOTA seq2seq models for semantic parsing on diverse domains (Overnight - up to 3.2% and emrQA - 7%) and Nematus, the winning solution for WMT 2017, for Czech to English translation (CzENG 1.6 - 1.5 BLEU).

查看原文本刊更多论文

用联合释义学习推进Seq2seq

我们解决了序列到序列(seq2seq)体系结构的模型泛化问题。我们建议通过释义优化的多任务学习来超越数据增强，并观察到它在正确处理未见过的句子释义作为输入方面是有用的。我们的模型在不同领域的语义分析方面大大优于SOTA seq2seq模型(Overnight -高达3.2%，emrQA - 7%)和Nematus, WMT 2017的获奖解决方案，用于捷克语到英语的翻译(CzENG 1.6 - 1.5 BLEU)。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Clinical Natural Language Processing Workshop

自引率

0.00%

发文量