Google发布pQRNN新NLP模型:基于投影的高效模型架构


谷歌发布了一种NLP模型,称为pQRNN,它以最小的模型尺寸提高了NLP性能的最新水平。pQRNN的新颖之处在于它如何将简单的投影操作与准RNN编码器相结合,以实现快速,并行的处理。该模型可在文本分类任务上实现接近BERT级别的性能,同时使用的模型参数要少几个数量级。
 
通常上一代模型PRADO的做法是:首先将输入到NLP模型的文本处理为适合于神经网络的形式,方法是将文本分割成与预定义的通用字典(所有可能的标记列表)中的值相对应的片段(标记)。然后,神经网络使用可训练的参数向量(包含嵌入表)唯一地标识每个段。但是,文本的分割方式会对模型的性能,大小和延迟产生重大影响。
基于PRADO改进的pQRNN模型由三个构建块组成:一个将文本中的令牌转换为三元向量序列的投影运算符,一个密集的瓶颈层和一个QRNN编码器堆栈组成。

点击标题见原文