问题标签 [fasttext]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
278 浏览

amazon-ec2 - Gcc 错误尝试 PIP 安装 Fasttext Redhat (Amazon ec2)

只是我收到了这个错误:

尝试运行命令:sudo pip install fasttext

服务器信息:

0 投票
5 回答
19608 浏览

python - 如何使用 FastText 查找相似词?

我正在玩https://pypi.python.org/pypi/fasttextFastText,这与. 由于它似乎是一个相当新的库,还没有很多内置函数,我想知道如何提取形态相似的词。Word2Vec

例如:model.similar_word("dog")-> 狗。但是没有内置功能。

如果我输入 model["dog"]

我只得到向量,它可以用来比较余弦相似度。 model.cosine_similarity(model["dog"], model["dogs"]]).

我是否必须进行某种循环并对cosine_similarity文本中的所有可能对进行处理?那需要时间……!!!

0 投票
0 回答
433 浏览

linux - 使用 Fasttext 的分段错误错误

我在 Linux 6.7 上使用 Fasttext,但我不断收到分段错误错误。我使用自己的数据,或者运行 Fasttext 安装包中包含的示例都没有关系。在任何一种情况下,我都会遇到同样的错误。我正在使用 gcc 3.5.2 运行 Fasttext。任何帮助将不胜感激。

0 投票
1 回答
446 浏览

c++ - fasttext 断言“counts.size() == osz_”失败

我正在尝试使用 fasttext 进行文本分类,并且正在 Windows 上对 850MB 文本的语料库进行训练,但我不断收到以下错误:

我检查了 and 的值counts.size()osz_发现counts.size = 2515626and osz_ = 300。当我调用in.good()输入流时,FastText::loadModel我得到 0,in.fail()=1并且in.eof()=1.

我正在使用以下命令来训练和测试我的模型:

我的输入数据根据fasttext github页面正确格式化,所以我想知道这是我的失败还是错误。

感谢您对此的任何支持!

0 投票
2 回答
1157 浏览

cygwin - 在 Windows 10 Python 3 上安装 Fasttext 时出错

我正在尝试在 Windows 10 上使用 pip install fastText 安装 fastText。我在 Anaconda 中安装了 Python 3。我尝试阅读几篇文章,但它们并没有明确说明我应该对安装进行哪些确切更改。我收到以下错误: 在此处输入图像描述

下面显示的错误为:

有人可以帮忙吗?

0 投票
1 回答
1786 浏览

python - fastText python 实现创建训练和测试集

我正在网页抓取,我将我的 utf-8 保存到 csv,清理它,现在我正在尝试创建我的训练和测试文件以便能够使用 Facebook 的 fastText,现在这就是我所拥有的,它给了我一个错误

这是它返回的错误,这是 jupyter notebook 中 windows 的 fastText

0 投票
3 回答
10964 浏览

facebook - 如何使用 fasttext 对整个文本进行矢量化?

要获取单词的向量,我可以使用:

但是如果我想得到一个句子的向量,我需要对所有单词的向量求和或者得到所有向量的平均值。

FastText 是否提供了一种方法来做到这一点?

0 投票
1 回答
323 浏览

word2vec - 为什么两个句子之间预训练的 fasttex 模型的 cosine_similarity 高,根本不相关?

我想知道为什么使用 wiki(韩语)预训练的“fasttext 模型”似乎效果不佳!:(

模型 = fasttext.load_model("./fasttext/wiki.ko.bin")

model.cosine_similarity("테스트 테스트 이건 테스트 문장", "지금 아무 관계 없는 글 정말로 정말로")

(英文) model.cosine_similarity("test test this is test sentence", "now not all relative docs really really")

0.99....?? 那些句子根本不是相对的意思。因此,我认为余弦相似度必须更低。然而它是 0.997383...

将孤句与 fasttext 进行比较是不可能的吗?那么它是使用 doc2vec 的唯一方法吗?

0 投票
1 回答
1080 浏览

java - 无法写入核心转储,Java 运行时环境检测到致命错误

当我使用 fasttext 在 java 中使用 Jfasttext 库获取单词的向量时出现错误。错误是

0 投票
1 回答
1283 浏览

nlp - Is there a way to load the wiki-fasttext model faster with load_word2vec_format

Loading the wiki-fasttext model with the gensim library takes six minutes.

I'm aware of ways to cache the model but I'm looking for ways to speedup the initial model loading. The specific api is below:

Granted, wiki-fasttext a very large model, however I have load the same model in many languages.