问题标签 [glove]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 如何使用预先训练的手套模型将向量转换回自然语言?
我正在用大量文本数据训练我的神经网络。首先,我使用手套将每个文本(单词)转换为矢量。这些向量是神经网络的输入。现在,我有一个来自网络输出层的输出向量。如何将该输出向量转换回自然语言?
将单词映射到向量的代码:
一种可能是使用余弦相似度。我们有一个向量,需要找到向量空间中余弦角的相似度。tensorflow可以在这里帮助我吗?
r - 如何计算预训练词嵌入的相似度
我想从R中的预训练嵌入向量中知道与另一个词最相似的词。例如:类似于“啤酒”的词。为此,我在http://nlp.stanford.edu/data/glove.twitter.27B.zip上下载了预训练的嵌入向量,并应用了以下代码:
源代码:
但我不知道如何得到最相似的单词。我找到了示例,但由于嵌入向量的结构不同而不起作用
如何计算R中预训练词嵌入的相似度?
python - 与多个单词最相似的手套
我应该用 python glove 做一些练习,大部分都没有给我任何问题,但现在我应该从“glove-wiki-gigaword-”中找到与“norway - war + Peace”最相似的 5 个词100 英寸包装。但是当我运行我的代码时,它只是说“单词”不在词汇表中。现在我猜这是某种格式,但我不知道如何使用它。
relationship - 有没有办法从 'GloVe' word2vec 获得关系?
我正在使用 Glove、Gensim-word2vec模块,我可以使用它来返回实体之间的相似度分数,例如'man'
and 'woman'
will return 0.89034
。但是有没有办法返回两个实体之间的语义关系呢?比如给定word'people'
和a 'location'
,结果应该是关系'lives_in'
?
我可以做类似的事情:
输出是:
期望的输出:
neural-network - GloVe 嵌入 - 未知/词汇外标记
我想知道是否有用于GloVe嵌入的通用(默认)词汇表外 (OOV)令牌。特别是对于来自斯坦福大学的预训练: https ://nlp.stanford.edu/projects/glove/
我在 SO 上找到了这个:glove.6B.50d.txt 中的“unk”是什么?
给出的答案表明该代币"unk"
代表OOV 代币,并在 Github 上共享了 Glove 项目的链接作为证据。
然而,这对我来说似乎不是很确定,因为该链接仅指"<unk>"
代码中的标记(不是"unk"
),但"<unk>"
确实存在于词汇表中!
所以我想知道,是否有任何(默认)用于 GloVe的 OOV 令牌(什么可用于未知/看不见的单词),如果有,它是什么?
r - 使用 GLOVE 预训练的 glove.6B.50.txt 作为词嵌入 R 的基础
我正在尝试使用 R 中的 GLOVE 将文本数据转换为向量。我的计划是平均一个句子的词向量,但我似乎无法进入词向量化阶段。我已经下载了 glove.6b.50.txt 文件,它的父 zip 文件来自:https ://nlp.stanford.edu/projects/glove/我访问了 text2vec 的网站并尝试运行他们加载维基百科数据的示例。但我不认为它是我正在寻找的(或者我不理解它)。我正在尝试将预训练的嵌入加载到模型中,这样如果我有一个句子(比如“我爱灯”),我可以遍历那个句子并将每个单词变成一个向量,然后我可以平均(将未知单词变成zeros) 具有矢量化(word) 之类的函数。如何将预训练的嵌入加载到手套模型中作为我的语料库(这甚至是我实现目标所需要做的吗?)
python - 嵌入时出错:无法将字符串转换为浮点数:'ng'
我正在使用 GloVe 方法研究预训练的词向量。数据包含维基百科数据的向量。嵌入数据时出现错误,指出无法将字符串转换为浮点数:'ng'
我尝试浏览数据,但找不到符号“ng”
这是错误报告。请进一步指导我。
keras - 将文本表示到深度学习的最佳工具
所以我想问你哪个是用于准备我的深度学习文本的最佳工具?
Word2Vec
, Glove
, Keras
, LSA
... 和有什么区别
apache-spark - 如何将 spark mllib word2vec 模型转换为 glove txt 格式?
我使用 Spark MLlib 来训练特定领域的 word2vec 模型,我需要以 glove word2vec 格式使用它。如何将其转换为手套 txt 格式?