问题标签 [glove]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

93 问题

0 投票

1 回答

391 浏览

nltk - 如何使用许多 PDF 文件训练自定义 Glove 矢量表示？

我想通过使用许多 PDF 文件来训练我自己的自定义 Glove 表示。我怎样才能做到这一点？有什么方法可以使用 POS 标记和依赖解析等概念吗？你能建议任何链接来实现它吗？

2018-12-29T05:39:23.220

0 投票

2 回答

909 浏览

python - GloVe中两个词的相似度

如何在 Glove 中找到两个单词的相似度？我们model.similarity(word1, word2)在 Word2vec 中有。GloVe中是否有类似的方法？如何保存和加载训练有素的 GloVe 模型？

python glove

2019-01-08T20:27:08.617

0 投票

1 回答

3490 浏览

python - 在 Keras 中平均一个句子的词向量 - 预训练词嵌入

我是 Keras 的新手。

我的目标是为推文的情感分析创建神经网络多分类。

我用来建立我的模型Sequential。Keras

我想在模型的第一层使用预训练的词嵌入gloVe，特别是.

这是我目前的模型：

embedding_matrix由来自文件的向量填充glove.840B.300d.txt

由于我对神经网络模型的输入是句子（或推文），并且在咨询了一些理论之后，我希望在嵌入层之后的层，在获取推文中的每个词向量之后，对句子的词向量进行平均。

目前我使用的是LSTM，我想用这种平均技术或p-means. 我无法在keras文档中找到它。

我不确定这是否是问这个问题的正确地方，但我们将不胜感激。

python tensorflow keras glove

2019-01-16T12:53:37.570

0 投票

1 回答

166 浏览

glove - ValueError：需要超过 0 个值才能解包 - 手套

我下载了手套模型 https://nlp.stanford.edu/projects/glove/

我使用自己的语料库训练 Glove 模型，除了添加自己的语料库外，我没有做任何其他更改。但它给出了以下错误。

glove

2019-01-30T06:00:50.780

0 投票

2 回答

661 浏览

gensim - 有没有办法从 KeyedVectors 词汇中删除一个单词？

我需要从“gensim.models.keyedvectors.Word2VecKeyedVectors”的词汇中删除一个无效单词。

我尝试使用删除它del model.vocab[word]，如果我打印model.vocab单词消失了，但是当我model.most_similar使用其他单词运行时，我删除的单词仍然显示为相似。那么我怎样才能以影响不带它model.vocab的方式删除一个单词呢？model.most_similar

gensim word2vec embedding glove

2019-02-14T19:26:53.663

0 投票

1 回答

4246 浏览

python - 是否可以在 pytorch 的嵌入层中仅冻结某些嵌入权重？

在 NLP 任务中使用 GloVe 嵌入时，数据集中的某些单词可能不存在于 GloVe 中。因此，我们为这些未知词实例化随机权重。

是否可以冻结从 GloVe 获得的权重，只训练新实例化的权重？

我只知道我们可以设置：model.embedding.weight.requires_grad = False

但这使得新词无法训练..

还是有更好的方法来提取单词的语义..

python nlp pytorch word-embedding glove

2019-02-28T11:23:39.837

0 投票

1 回答

139 浏览

nlp - 创建词嵌入而不在存储库中保留 fastText Vector 文件

我试图在 Infersent 的帮助下嵌入一个句子，而 Infersent 使用fastText向量进行词嵌入。fastText 矢量文件接近 5 GiB。

当我们将 fastText 矢量文件与代码存储库一起保存时，它会使存储库变得巨大，并使代码难以共享/部署（甚至创建 docker 容器）。

有什么方法可以避免将矢量文件与存储库一起保存，而是将其重新用于嵌入新句子？

nlp fasttext glove

2019-03-05T17:52:22.783

0 投票

2 回答

871 浏览

nlp - 使用 GloVe 时出现非法硬件指令错误

我正在尝试训练 GloVe 嵌入。在stanfordnlp的 GloVe 实现中，有 4 个脚本要运行。但是，运行第二个脚本coocur会导致Illegal Hardware Instruction-Error。我不明白这个错误是如何产生的。

使用输入文件，3.txt我的命令如下所示：

我在远程服务器（Debian GNU/Linux 9 (stretch)）上运行这些命令。当我在本地（18.04.2 LTS（Bionic Beaver））上对相同的数据运行相同的命令时，没有问题。这可能是什么原因？

nlp stanford-nlp word-embedding glove illegal-instruction

2019-03-08T11:15:09.850

0 投票

1 回答

4402 浏览

python - 在 scikit-learn 中使用预训练的手套词嵌入

我已经使用 keras 来使用预训练的词嵌入，但我不太确定如何在 scikit-learn 模型上做到这一点。

我也需要在 sklearn 中执行此操作，因为我正在使用vecstackkeras 顺序模型和 sklearn 模型进行集成。

这就是我为 keras 模型所做的：

我对 scikit-learn 很陌生，从我看到的在 sklearn 中制作模型的情况来看：

所以，我的问题是如何在这个模型中使用预训练的 Glove？我在哪里通过预先训练的手套embedding_matrix

非常感谢您，我非常感谢您的帮助。

python keras scikit-learn word-embedding glove

2019-03-16T16:06:08.057

0 投票

1 回答

337 浏览

nlp - 手套中超参数的含义

以下是glove 的 demo.sh 中的超参数。VERBOSE, MEMORY,WINDOW_SIZE和是什么意思BINARY。

是WINDOW_SIZE15，意思是从右边选了 15 个词，从左边选了 15 个词？

nlp hyperparameters glove

2019-04-09T03:39:15.537

1 2 3 4 5 6 7 8 9 10

问题标签 [glove]

Reference