问题标签 [glove]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2083 浏览

python - 为什么我不能使用 Gensim 下载 API 下载数据集

当我执行以下操作时:

gensim.downloader API 抛出以下错误:

[Errno 2] 没有这样的文件或目录:'/Users/vtim/gensim-data/information.json'。

我究竟做错了什么?

0 投票
0 回答
919 浏览

csv - 如何将 GloVe 词嵌入用于非英文文本

我正在尝试在Bengali新闻数据集上运行 GloVe 词嵌入。现在,原始的 GloVe 源除了英语之外没有任何受支持的语言,但我发现具有为 30 种非英语语言预训练的词向量。

我正在使用 GloVe 嵌入在文本分类上运行此笔记本。我的问题是

  1. 我可以将预训练的孟加拉语词向量与我的自定义Bengali数据集一起使用,并在此模型上运行吗?

  2. 这个预训练的孟加拉语词向量是有tsv格式的。使用以下代码,我似乎无法将其解析为word-vector列表。

我得到了错误

0 投票
1 回答
45 浏览

python - 我的变量如何自相矛盾地既是 ndarray 又是 dict?

我正在尝试为机器学习模型获取我的 GloVe 向量,而不必每次都加载模型。因此,我想将 glove_model 字典保存到 json 文件中,以便在初始构建后可以将其加载到其他地方。

但是我不断收到此错误:“TypeError:ndarray 类型的对象不是 JSON 可序列化的”-下面的完整错误。谢谢!

这会引发错误:

然而,当我检查数据类型时,