问题标签 [gensim]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
837 浏览

python-2.7 - 如何使用 gensim 将一组文档标记为 unigram + bigram bagofwords?

我知道使用 scikit learn 我可以使用,

这段代码。但是我怎么能用 gensim 做到这一点?

0 投票
2 回答
2979 浏览

python - 在 Gensim 中使用潜在狄利克雷分配

我正在做一个项目,我想使用潜在狄利克雷分配来从大量文章中提取主题。

我的代码是这样的:

我还尝试以 3 种不同的方式使用 LdaMulticore:

每次我得到这个错误:

有任何想法吗?

先感谢您。

0 投票
2 回答
11471 浏览

machine-learning - word2vec中一个词的向量代表什么?

word2vec是 Google 的开源工具:

  • 对于每个单词,它提供一个浮点值向量,它们究竟代表什么?

  • 还有一篇关于段落向量的论文,任何人都可以解释他们如何使用 word2vec 来获得段落的固定长度向量。

0 投票
0 回答
555 浏览

python - 如何将 scikit-learn 和 gensim 添加到我的库的 setup.py 中?

Scikit-learn是一个需要这些依赖的机器学习库,http ://scikit-learn.org/stable/install.html :

在用户可以:

并且gensim不需要额外的依赖项,http://radimrehurek.com/gensim/install.html并且只需执行以下操作:

我有我setup.pyscikit,它的依赖项和gensim来自https://github.com/alvations/pywsd/blob/master/setup.py

如何添加scikit-learngensim到我的setup.py?

0 投票
3 回答
17534 浏览

python - Load PreComputed Vectors Gensim

I am using the Gensim Python package to learn a neural language model, and I know that you can provide a training corpus to learn the model. However, there already exist many precomputed word vectors available in text format (e.g. http://www-nlp.stanford.edu/projects/glove/). Is there some way to initialize a Gensim Word2Vec model that just makes use of some precomputed vectors, rather than having to learn the vectors from scratch?

Thanks!

0 投票
1 回答
920 浏览

python - lda[doc_bow] 和 lda.inference(corpus) 之间的区别是什么?

在 LDA 模型中,这是我认为使用现有模型推断新文档的两种方法。这两种方法有什么区别?

0 投票
1 回答
2168 浏览

python - 我应该使用 tfidf 语料库还是仅使用语料库来使用 LDA 推断文档?

我想知道当我们在 gensim 中使用 LDA 推理文档时,它是要使用的 TFIDF 语料库还是只是要使用的语料库

这是一个例子

0 投票
1 回答
482 浏览

python-3.x - 从一些外部 tf-idf 矩阵和术语列表中使用 gensim 训练 LDA 模型

我已经有一个 tf-idf 矩阵,其中包含术语行和文档列。现在我想用给定的术语文档矩阵训练一个 LDA 模型。第一步似乎是使用gensim.matutils.Dense2Corpus将矩阵转换为语料库格式。但是如何构造id2word参数呢?我有术语列表(#terms==#rows),但我不知道字典的格式,所以我无法从gensim.corpora.Dictionary.load_from_text. 有什么建议么?谢谢你。

0 投票
3 回答
1513 浏览

python - 将术语文档矩阵传递给 Gensim LDA 模型

我的术语文档矩阵采用 numpy 矩阵格式,并且我有一个字典来表示术语文档矩阵的。

有什么方法可以轻松地将这两个传递到 Gensim 的 LDA 模型中?

我可以以某种方式将其传递给 gensim.models.ldamodel.LDA 吗?

0 投票
1 回答
260 浏览

python - 安装gensim的一个错误

我通过多种方式无法成功安装gensim。对于我是一名编码大一新生,我很难理解以下信息。



感谢帮助!