问题标签 [glove]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
663 浏览

pytorch - Pytorch.Embedding 中的 from_pretrained 和 weight.data.copy 有什么区别

最近,我用glove初始化Embedding的权重,发现from_pretrained和weight.data.copy_的区别是:from_pretrained = {weight.data.copy_(); embedding.weight.requires_grad = False}
我想知道我说的是否正确?
戴手套的准确率比不戴手套的要低 10%,但是当我计算手套未覆盖的单词时,我发现只有 10% 的单词不在手套中。

0 投票
1 回答
184 浏览

keras - Keras 词嵌入矩阵的第一行为零

我正在查看 Keras Glove 词嵌入示例,但不清楚为什么嵌入矩阵的第一行填充了零。

首先,在单词与数组关联的地方创建嵌入索引。

然后通过查看标记器创建的索引中的单词来创建嵌入矩阵。

由于循环将从 开始i=1,因此如果矩阵以不同方式初始化,则第一行将仅包含零和随机数。跳过第一行有什么原因吗?

0 投票
0 回答
77 浏览

machine-learning - 如何下载手套预训练词向量的共现矩阵

我正在尝试在域语料库上训练手套嵌入,尝试使用现有手套向量进行增量训练,但无法获得手套预训练词向量的共现矩阵。如何获得共现矩阵

0 投票
1 回答
475 浏览

python - 了解手套矢量的用法

我使用以下代码将手套向量用于词嵌入

我知道这段代码用于将手套预训练向量用于词嵌入。但我不确定每一行发生了什么。为什么要将手套转换为 word2vec 格式?KeyedVectors.load_word2vec_format 究竟做了什么?

0 投票
1 回答
1458 浏览

python-3.x - Python3 Glove 属性错误:“生成器”对象没有属性“形状”

我正在尝试使用手套训练我的模型。我的代码如下:

当我尝试运行此代码时,出现以下错误:

回溯(最近一次调用):文件“mytest3.py”,第 36 行,在 glove.fit(get_data, epochs=10, verbose=True) 文件“/usr/local/lib/python3.5/dist-packages/ glove/glove.py",第 86 行,适合 shape = matrix.shape AttributeError: 'generator' object has no attribute 'shape'

我错过了什么?对此问题的任何帮助将不胜感激。

提前致谢

0 投票
2 回答
3069 浏览

python - GloVe for Python 3.7 版本

我正在尝试在 Python 3.7 版上从 Pypi 安装 GloVe 包,但它不断返回下面写的相同错误。有什么方法可以使用手套吗?我也尝试从https://github.com/stanfordnlp/GloVe安装它, 但它也以错误结束。谢谢您的帮助!

0 投票
1 回答
104 浏览

c - 手套:使用单个文本文件进行训练。GLoVE 是否尝试将其读入内存?还是流式传输?

我需要训练一些手套模型来将它们与 word2vec 和 fasttext 输出进行比较。它是用 C 实现的,我看不懂 C 代码。github在这里

训练语料库需要格式化为单个文本文件。对我来说,这将是>>100G——对内存来说太大了。在我浪费时间构建这样的东西之前,如果有人能告诉我手套算法是否试图将它读入内存,或者它是否从磁盘流式传输,我将不胜感激。

如果是前者,那么 glove 当前的实现将与我的数据不兼容(我认为)。如果是后者,我愿意。

0 投票
0 回答
113 浏览

python - 如何在 Python 中加载当前为 JSON 格式的巨型(约 13 GB)手套矢量字典?

我将 Glove 840B 文本文件转换为 {"word": [300 Dimensional feature vector]} 格式的 JSON 向量,我需要在我的程序中查询这个 JSON 文件数千次以获得数千个单词的向量。

我正在考虑以另一种格式存储这个 JSON 文件,比如 SQL 数据库,但我不确定。

任何帮助将不胜感激,谢谢!

0 投票
2 回答
870 浏览

python-3.x - Python 手套缺少模块“手套”“手套”

这是我执行的操作:

安装 pip3 install glove_py ok。在 Jupyter Python 中, import glove 可以正常工作。

问题:

当我尝试基本设置代码以确保所有模块都已加载并正常工作时。我有这个代码,其中的错误消息是:“NameError: name 'glove' is not defined”。现在由于模块 glove 导入工作正常,我尝试了函数 'glove' 和 'Glove',两者都没有定义 NameError。

我确实找到了 'git clone http://github.com/stanfordnlp/glove ' 之类的库,并使用 make 下载并构建了代码。此代码在控制台中运行正常以获取示例。

pip install 为 glove_py 安装好了。

但是 pip install for glove_python 安装失败,出现“错误命令错误,退出状态 1:”。

glove 'git clone http://github.com/stanfordnlp/glove ' 下载好并使用 make ok 构建。但即使使用这个 make'd 版本,我也无法让 Python 导入手套找到在 Jupyter Python 环境中实现的这个 c 代码。

我怀疑我遗漏了一些简单的东西,我将不胜感激。

Python代码,测试运行。这是我的 Python 代码测试运行,它在找不到模块时失败。

目录函数查看“gl”模块中的函数,从手套包导入,没有显示模块函数名称。所以这清楚地表明手套作为 gl 的导入存在一些问题。

0 投票
1 回答
295 浏览

r - R文本2vec;rsparse::GloVe$new() GlobalVectors$new() 环境设置/未设置

问题:使用库(text2vec)的 R GloVe 环境。使用 rsparse::GloVe$new() 的代码执行设置环境,但是,不使用 GlobalVectors$new() 的代码执行设置环境。

然后运行 ​​wv_main = glove$fit_transform(tcm...),错误:

glove$fit_transform(tcm...) 错误 tcm 是有效的 dgTmaticx,S4 数据类型,暗度为 (545 X 545)

cpp_glove_create(glove_params) 中的错误:与请求的类型不兼容:[type=S4; 目标=双]。

在 glove$fit_transform(tcm) 上寻求不兼容请求类型的帮助。