问题标签 [glove]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
150 浏览

machine-learning - 如何使用预先训练的手套模型将向量转换回自然语言?

我正在用大量文本数据训练我的神经网络。首先,我使用手套将每个文本(单词)转换为矢量。这些向量是神经网络的输入。现在,我有一个来自网络输出层的输出向量。如何将该输出向量转换回自然语言?

将单词映射到向量的代码:

一种可能是使用余弦相似度。我们有一个向量,需要找到向量空间中余弦角的相似度。tensorflow可以在这里帮助我吗?

0 投票
0 回答
306 浏览

python - 在 LSTM 中使用没有嵌入层的 Glove 向量

我想在语言建模中使用手套向量。但问题是如果我在模型中使用 Embedding 层,我无法预测输出向量并匹配单词。我的意思是,我想将我的句子的手套向量表示作为输入。并从 Lstm 层中取出它们并获取向量并将其与 Glove 向量匹配我想使用没有嵌入层的 glove 向量。有人可以提出一种方法吗?我正在使用 keras 和 python3

我想要的是使用嵌入层作为一个模型1并返回输出向量并将其作为输入提供给另一个LSTM模型2。它给出了词向量的索引。

在此处输入图像描述

0 投票
0 回答
253 浏览

r - 如何计算预训练词嵌入的相似度

我想从R中的预训练嵌入向量中知道与另一个词最相似的词。例如:类似于“啤酒”的词。为此,我在http://nlp.stanford.edu/data/glove.twitter.27B.zip上下载了预训练的嵌入向量,并应用了以下代码:

源代码:

但我不知道如何得到最相似的单词。我找到了示例,但由于嵌入向量的结构不同而不起作用

如何计算R中预训练词嵌入的相似度?

0 投票
1 回答
2055 浏览

python - 与多个单词最相似的手套

我应该用 python glove 做一些练习,大部分都没有给我任何问题,但现在我应该从“glove-wiki-gigaword-”中找到与“norway - war + Peace”最相似的 5 个词100 英寸包装。但是当我运行我的代码时,它只是说“单词”不在词汇表中。现在我猜这是某种格式,但我不知道如何使用它。

0 投票
2 回答
63 浏览

relationship - 有没有办法从 'GloVe' word2vec 获得关系?

我正在使用 Glove、Gensim-word2vec模块,我可以使用它来返回实体之间的相似度分数,例如'man'and 'woman'will return 0.89034。但是有没有办法返回两个实体之间的语义关系呢?比如给定word'people'和a 'location',结果应该是关系'lives_in'

我可以做类似的事情:

输出是:

期望的输出:

0 投票
0 回答
404 浏览

neural-network - GloVe 嵌入 - 未知/词汇外标记

我想知道是否有用于GloVe嵌入的通用(默认)词汇表外 (OOV)令牌。特别是对于来自斯坦福大学的预训练: https ://nlp.stanford.edu/projects/glove/

我在 SO 上找到了这个:glove.6B.50d.txt 中的“unk”是什么?

给出的答案表明该代币"unk"代表OOV 代币,并在 Github 上共享了 Glove 项目的链接作为证据。
然而,这对我来说似乎不是很确定,因为该链接仅指"<unk>"代码中的标记(不是"unk"),但"<unk>"确实存在于词汇表中!

所以我想知道,是否有任何(默认)用于 GloVe的 OOV 令牌(什么可用于未知/看不见的单词),如果有,它是什么?

0 投票
1 回答
891 浏览

r - 使用 GLOVE 预训练的 glove.6B.50.txt 作为词嵌入 R 的基础

我正在尝试使用 R 中的 GLOVE 将文本数据转换为向量。我的计划是平均一个句子的词向量,但我似乎无法进入词向量化阶段。我已经下载了 glove.6b.50.txt 文件,它的父 zip 文件来自:https ://nlp.stanford.edu/projects/glove/我访问了 text2vec 的网站并尝试运行他们加载维基百科数据的示例。但我不认为它是我正在寻找的(或者我不理解它)。我正在尝试将预训练的嵌入加载到模型中,这样如果我有一个句子(比如“我爱灯”),我可以遍历那个句子并将每个单词变成一个向量,然后我可以平均(将未知单词变成zeros) 具有矢量化(word) 之类的函数。如何将预训练的嵌入加载到手套模型中作为我的语料库(这甚至是我实现目标所需要做的吗?)

0 投票
3 回答
3501 浏览

python - 嵌入时出错:无法将字符串转换为浮点数:'ng'

我正在使用 GloVe 方法研究预训练的词向量。数据包含维基百科数据的向量。嵌入数据时出现错误,指出无法将字符串转换为浮点数:'ng'

我尝试浏览数据,但找不到符号“ng”

这是错误报告。请进一步指导我。

0 投票
1 回答
46 浏览

keras - 将文本表示到深度学习的最佳工具

所以我想问你哪个是用于准备我的深度学习文本的最佳工具?

Word2Vec, Glove, Keras, LSA... 和有什么区别

0 投票
1 回答
85 浏览

apache-spark - 如何将 spark mllib word2vec 模型转换为 glove txt 格式?

我使用 Spark MLlib 来训练特定领域的 word2vec 模型,我需要以 glove word2vec 格式使用它。如何将其转换为手套 txt 格式?