现在数据已经准备就绪,可以构建模型了。
本文的模型参考了论文 《Convolutional Neural Networks for Sentence Classification》,原文代码在此。
论文里使用了两个词嵌入:随模型进行训练的词嵌入和 Google 预训练好的 Word2Vec 词嵌入。本文里为了直观,没有采用预训练的词嵌入。
构建模型
论文里使用了三个卷积核分别为 3、4、5 的二维卷积层,拼接后经过一个范围为 4 的池化层。最后经过一个全连接层,经过 sigmoid 函数处理后输出。