问题标签 [fasttext]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
4643 浏览

ubuntu - lsattr:在 Ubuntu 16.04 中读取文件中的标志时不允许操作

我从这里下载了一个 fasttext 词向量文件。

虽然我可以更改文件的权限和所有者,但我无法读取标志或内容。

以下是一些命令的结果:

  1. 文件权限(ls -ltra wiki.es.vec)

    /li>
  2. lsattr 的结果 (lsattr wiki.es.vec)

    /li>
  3. 以 root 身份登录时 lsattr 的结果 (lsattr wiki.es.vec)

    /li>
  4. chattr 也不起作用(chattr -i wiki.es.vec)

    /li>

我检查了符号链接,没有链接。我拥有我的机器的所有权利。问题仅在于大文件(大小 2.4 GB、6.6 GB),如果大小小于该大小,则没有问题。

0 投票
2 回答
11526 浏览

python - Fasttext .vec 和 .bin 文件的区别

我最近下载了英语的 fasttext 预训练模型。我有两个文件:

  1. 维基.en.vec
  2. wiki.en.bin

我不确定这两个文件有什么区别?

0 投票
0 回答
1259 浏览

python - 使用 FastText 计算多标签分类的准确性

我有一个使用 FastText 的多标签分类任务。我必须为它计算混淆矩阵。我已经解决了计算单个标签的 CM 的问题。这是它的 Python 脚本:

这将输出类似

问题是在多标签任务的特定情况下,这无法正常工作,因为我正在计算准确性

当文件具有一列/标签时可以正常工作,但当 FastText 的预测输出是两列/标签文件时则不行。

0 投票
4 回答
5622 浏览

python - Gensim 中的 FastText

我正在使用 Gensim 加载我的 fasttext.vec文件,如下所示。

但是,如果我需要加载.bin文件来执行诸如 , 等命令m.most_similar("dog")m.wv.syn0我会感到困惑m.wv.vocab.keys()吗?如果是这样,该怎么做?

或者.bin文件对于执行这个余弦相似度匹配并不重要?

请帮我!

0 投票
1 回答
187 浏览

tensorflow - 将自定义数据集添加到 fasttext 分类深度学习中

基于此 guithub 链接https://github.com/brightmart/text_classification,我想运行“ fasttext ”分类,但有些文件我找不到它们,所以我想在其上添加我的自定义数据集作为输入然后运行它。在 github 手册中没有添加我们自己的数据集作为输入的说明?

我该如何解决这个问题?

0 投票
1 回答
1364 浏览

machine-learning - 在 FastText 中评估每个类别的精度和召回率

我正在按照教程使用 Facebook Research FastText 库进行文本分类。我有 2 个标签,我正在执行分类(2 类)。测试文件上的预测输出显示了相同的精度和召回率。如何计算测试文件的每类精度和召回率?

0 投票
3 回答
1708 浏览

python - 子进程调用在 python 中不起作用,但命令在终端中起作用

当我./fasttext从终端运行时,它运行良好。但是当我尝试它时,subprocess.check_output('./fasttext')它给出的错误是。

错误

我与笔记本中的 fasttext 位于同一目录中。

0 投票
1 回答
538 浏览

python - 如何计算两个 n-gram 之间的语义相似度?

我正在尝试计算两个二元组之间的语义相似度,我需要使用 fasttext 的预训练词向量来完成这项任务。

例如:

b-gram 是两个元素的 python 列表: [his, name][I, am]

它们是两个元组,我需要通过任何必要的方式计算这两个元组之间的相似性。

我希望有一个分数可以给我一个很好的相似度近似值。例如,如果有方法可以告诉我这与than[His, name]更相似。[I, am][An, apple]

现在我只使用了包含任何语义相似性的余弦相似度。

0 投票
2 回答
11636 浏览

nlp - FastText 使用预训练的词向量进行文本分类

我正在研究一个文本分类问题,也就是说,给定一些文本,我需要为其分配某些给定的标签。

我尝试使用 Facebook 的快速文本库,它有两个我感兴趣的实用程序:

A) 带有预训练模型的词向量

B) 文本分类实用程序

但是,似乎这些是完全独立的工具,因为我找不到任何合并这两个实用程序的教程。

我想要的是能够通过利用 Word-Vectors 的预训练模型对一些文本进行分类。有没有办法做到这一点?

0 投票
1 回答
1127 浏览

classification - ValueError:变量嵌入已经存在,不允许。您的意思是在 VarScope 中设置 reuse=True 吗?最初定义

基于此 github 链接https://github.com/brightmart/text_classification/tree/master/a03_TextRNN当我使用 google_news_wor22vec.bin 和带有我的文档 + 标签的文本文件运行a03_TextRNN 时遇到这些错误:

我该如何解决这个问题?

错误图像