问题标签 [fasttext]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ubuntu - lsattr:在 Ubuntu 16.04 中读取文件中的标志时不允许操作
我从这里下载了一个 fasttext 词向量文件。
虽然我可以更改文件的权限和所有者,但我无法读取标志或内容。
以下是一些命令的结果:
文件权限(ls -ltra wiki.es.vec)
/li>lsattr 的结果 (lsattr wiki.es.vec)
/li>以 root 身份登录时 lsattr 的结果 (lsattr wiki.es.vec)
/li>chattr 也不起作用(chattr -i wiki.es.vec)
/li>
我检查了符号链接,没有链接。我拥有我的机器的所有权利。问题仅在于大文件(大小 2.4 GB、6.6 GB),如果大小小于该大小,则没有问题。
python - Fasttext .vec 和 .bin 文件的区别
我最近下载了英语的 fasttext 预训练模型。我有两个文件:
- 维基.en.vec
- wiki.en.bin
我不确定这两个文件有什么区别?
python - 使用 FastText 计算多标签分类的准确性
我有一个使用 FastText 的多标签分类任务。我必须为它计算混淆矩阵。我已经解决了计算单个标签的 CM 的问题。这是它的 Python 脚本:
这将输出类似
问题是在多标签任务的特定情况下,这无法正常工作,因为我正在计算准确性
当文件具有一列/标签时可以正常工作,但当 FastText 的预测输出是两列/标签文件时则不行。
python - Gensim 中的 FastText
我正在使用 Gensim 加载我的 fasttext.vec
文件,如下所示。
但是,如果我需要加载.bin
文件来执行诸如 , 等命令m.most_similar("dog")
,m.wv.syn0
我会感到困惑m.wv.vocab.keys()
吗?如果是这样,该怎么做?
或者.bin
文件对于执行这个余弦相似度匹配并不重要?
请帮我!
tensorflow - 将自定义数据集添加到 fasttext 分类深度学习中
基于此 guithub 链接https://github.com/brightmart/text_classification,我想运行“ fasttext ”分类,但有些文件我找不到它们,所以我想在其上添加我的自定义数据集作为输入然后运行它。在 github 手册中没有添加我们自己的数据集作为输入的说明?
我该如何解决这个问题?
machine-learning - 在 FastText 中评估每个类别的精度和召回率
我正在按照本教程使用 Facebook Research FastText 库进行文本分类。我有 2 个标签,我正在执行分类(2 类)。测试文件上的预测输出显示了相同的精度和召回率。如何计算测试文件的每类精度和召回率?
python - 子进程调用在 python 中不起作用,但命令在终端中起作用
当我./fasttext
从终端运行时,它运行良好。但是当我尝试它时,subprocess.check_output('./fasttext')
它给出的错误是。
错误
我与笔记本中的 fasttext 位于同一目录中。
python - 如何计算两个 n-gram 之间的语义相似度?
我正在尝试计算两个二元组之间的语义相似度,我需要使用 fasttext 的预训练词向量来完成这项任务。
例如:
b-gram 是两个元素的 python 列表:
[his, name]
和[I, am]
它们是两个元组,我需要通过任何必要的方式计算这两个元组之间的相似性。
我希望有一个分数可以给我一个很好的相似度近似值。例如,如果有方法可以告诉我这与than[His, name]
更相似。[I, am]
[An, apple]
现在我只使用了包含任何语义相似性的余弦相似度。
nlp - FastText 使用预训练的词向量进行文本分类
我正在研究一个文本分类问题,也就是说,给定一些文本,我需要为其分配某些给定的标签。
我尝试使用 Facebook 的快速文本库,它有两个我感兴趣的实用程序:
A) 带有预训练模型的词向量
B) 文本分类实用程序
但是,似乎这些是完全独立的工具,因为我找不到任何合并这两个实用程序的教程。
我想要的是能够通过利用 Word-Vectors 的预训练模型对一些文本进行分类。有没有办法做到这一点?
classification - ValueError:变量嵌入已经存在,不允许。您的意思是在 VarScope 中设置 reuse=True 吗?最初定义
基于此 github 链接https://github.com/brightmart/text_classification/tree/master/a03_TextRNN当我使用 google_news_wor22vec.bin 和带有我的文档 + 标签的文本文件运行a03_TextRNN 时,我遇到了这些错误:
我该如何解决这个问题?