如果我有两条影评:
"this was a really good movie" and "i did not like this movie at all"
我对它们应用 GloVe 嵌入,我将得到两个向量,其中包含多个单词向量,如下所示:
1st Review: [[300 Floats],[300 Floats],[300 Floats],[300 Floats],[300 Floats],[300 Floats]]
2nd Review: [[300 Floats],[300 Floats],[300 Floats],[300 Floats],[300 Floats],[300 Floats],[300 Floats],[300 Floats]]
基本上,评论中的每个单词都会被转换成一个 300 元素的浮点数数组。由于数组的长度可变,我不能将它们插入分类器。
我想过做某种词袋表示,但我不确定既然单词已经变成了数字,我将如何实现它。