我试图修改 YoonKim 的代码以使用 CNN 进行情绪分析。他应用了三个过滤heights=[3,4,5]
器width=300
input=(batch_size, 1, len(sentence_vector), len(wordVector))
Conv,Pool
第一次计算后我被卡住了。考虑
input=(batch_size, 1, 64, 300)
64 是每个句子向量的长度,300 是词嵌入大小。
map=(20, 1, 3, 300)
在他的实现中,他首先应用了一个 height=3 和 width=300 的内核。因此输出将是
convolution_output=(batch_size, 20, 62, 1)
之后他使用poolsize=(62, 1)
. MaxPooling 后的输出变为
maxpool_output=(batch_size, 20, 1, 1)
这就是我卡住的地方。在论文中,他应用了 3 个 和 的过滤heights[3,4,5]
器width=300
。但是在应用第一个过滤器后,卷积就没有输入了。我如何(以及在什么上)应用第二个内核?
任何帮助或建议都会很棒。git 页面包含指向论文的链接。