问题标签 [spacy]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
4858 浏览

python-3.x - python - 在anaconda环境中安装spacy包的问题

我正在尝试按照本教程将自然语言处理包 spaCy 安装到 python 3 anaconda 环境中,windows 8

我打开控制台,cd-ed 到我的站点包文件夹,激活环境,pip-ed 进行安装,一切似乎都很好,除了我无法在这里运行第二个命令

现在我可以成功加载包,但是当我运行下面的第二行时,出现以下错误

我认为这是因为我无法跑步python -m spacy.en.download

谁能告诉我python -m spacy.en.download应该做什么?

任何人都可以提供如何在 anaconda 环境中安装 spaCy 的演练吗?

这是我在设置目录、激活 python env、运行命令后得到的错误。我尝试的前几次,我的 spyder 编辑器没有响应,我杀死了控制台,最近一次我得到了这个错误

感谢您提供的任何帮助或建议

0 投票
5 回答
32092 浏览

python - 带spacy的名词短语

如何使用 spacy 从文本中提取名词短语?
我不是指词性标签。在文档中,我找不到有关名词短语或常规解析树的任何信息。

0 投票
1 回答
15773 浏览

python - 使用 spaCy 的 POS 标记

我正在尝试使用 Python 中的 spaCy 模块进行 POS 标记。

这是我的相同代码

输出:

在这里,它以名词而不是形容词的形式返回脆皮。但是,如果我使用像这样的测试句

它承认脆皮是一个形容词。这是输出:

我认为在第一种情况下,crispy 没有被标记为形容词的主要原因是因为在第二种情况下,dosa 被标记为“NN”,而 fries 被标记为“NNS”。

在第二种情况下,有什么方法可以让我变得酥脆以被标记为形容词吗?

0 投票
2 回答
1849 浏览

python - 对于 nlp.matcher.add 方法,SpaCy 的“匹配器”(地名词典)格式如何工作?

我已经开始使用 Spacy.io 的 NLP 包,并检查了一些介绍以及一些示例代码。

我对 spacy.en.English.matcher.add 方法很感兴趣——添加我自己的实体的格式是什么?虽然解释了基本格式,但似乎还有其他可用功能。我添加的实体可以链接到 dbpedia/wikipedia 条目或其他外部链接吗?

这是 Spacy 匹配器示例中的代码: https ://github.com/honnibal/spaCy/blob/master/examples/matcher_example.py

感谢您的时间。

0 投票
6 回答
32840 浏览

python - spacy 的导入错误:“没有名为 en 的模块”

我在使用 Python spaCy 库时遇到问题。它似乎安装正确,但在

我收到以下导入错误:

我对 Python 不是很熟悉,但这是我在网上看到的标准导入,并且安装了该库:

编辑 我测试了重命名文件,但这不是问题。我在做的时候也遇到了同样的错误:

(该命令应该下载一些模型)

0 投票
1 回答
1137 浏览

python - python解释器在加载spacy时被杀死

问题:运行以下代码行时 Python 解释器被终止:

该示例位于以下链接: https ://spacy.io/#example-use

环境:

  • MacBook
  • 带有 python 3.5 的 Conda(我已经通过 conda 安装了 spacy)

我收到的错误只是“杀死”这个词,它退出了 python 解释器。

有没有人遇到过这个错误?

-谢谢

0 投票
1 回答
2027 浏览

python - 在 spaCy 中使用不同的 word2vec 训练数据

因此,当我使用该方法时,我想在 spaCy中使用其中的一些训练数据。similarity()

我也想在这个页面上使用预训练的向量。

但是这里似乎缺少 spaCy 文档,有人知道该怎么做吗?

0 投票
4 回答
1868 浏览

python - 在Python中遍历树并获取相邻的子节点

我正在尝试遍历一棵树,并将某些子树放入特定的数据结构中。我认为一个例子是解释它的最好方法:

在此处输入图像描述

对于这棵树,我想要根节点及其子节点。然后任何有自己的孩子的孩子都应该以同样的方式遍历,依此类推。所以对于上面的树,我们最终会得到一个数据结构,例如:

到目前为止,我有一些代码可以生成这个,但是有一个问题是它停止得太早了(或者看起来就是这样):

请注意,此代码不会生成与图像中相同的树。我觉得生成器也更适合这里,但我的生成器 fu 甚至比我的递归 fu 还要糟糕。

0 投票
1 回答
919 浏览

nlp - Spacy 自然语言处理 Pickle 文件问题

对于 Spacy 包,当我尝试使用 pickle 加载 deps、ner 和 pos 的模型文件时,它们会引发无效的加载键或 EOF 错误。

我已经在 windows 和 linux 系统上执行了代码。我认为这不是二进制模式传输问题。我已经详细检查过了。我无法弄清楚这个问题。该文件很可能已损坏,但我不确定。有没有办法使用十六进制编辑器修复它?

非常感谢任何帮助。如果有人能详细解释酸洗,那就太好了。

感谢你的帮助。

0 投票
1 回答
6837 浏览

python - 带有 Spacy 管道的多线程 NLP

我正在尝试将 Spacy NLP(自然语言处理)管道应用于像 Wikipedia Dump 这样的大文本文件。这是我基于 Spacy文档示例的代码:

Spacy 一次性应用所有 nlp 操作,如 POS 标记、词形还原等。它就像 NLP 的管道,一步即可处理您需要的一切。应用管道方法应该通过多线程处理管道的昂贵部分来使过程更快。但是我没有看到速度有很大的提高,我的 CPU 使用率大约是 25%(只有 4 个内核中的一个在工作)。我还尝试以多个块读取文件并增加输入文本的批次:

但仍然是相同的表现。有没有办法加快这个过程?我怀疑应该启用 OpenMP 功能来编译 Spacy 以利用多线程功能。但是没有关于如何在 Windows 上执行此操作的说明。