0

我试图修改 YoonKim 的代码以使用 CNN 进行情绪分析。他应用了三个过滤heights=[3,4,5]width=300

input=(batch_size, 1, len(sentence_vector), len(wordVector))

Conv,Pool第一次计算后我被卡住了。考虑

input=(batch_size, 1, 64, 300)

64 是每个句子向量的长度,300 是词嵌入大小。

map=(20, 1, 3, 300)

在他的实现中,他首先应用了一个 height=3 和 width=300 的内核。因此输出将是

convolution_output=(batch_size, 20, 62, 1)

之后他使用poolsize=(62, 1). MaxPooling 后的输出变为

maxpool_output=(batch_size, 20, 1, 1)

这就是我卡住的地方。在论文中,他应用了 3 个 和 的过滤heights[3,4,5]width=300。但是在应用第一个过滤器后,卷积就没有输入了。我如何(以及在​​什么上)应用第二个内核?

任何帮助或建议都会很棒。git 页面包含指向论文的链接。

4

0 回答 0