问题标签 [spacy]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2104 浏览

python - spaCy nlp - 在字符串中标记实体

假设我有一个字符串,并且想要标记一些实体,例如 Persons 和 Locations。

我想用 [ ] 标记人,用 { } 标记位置。

我的代码:

...所以使用示例字符串可以正常工作。但是对于更复杂的句子,我会在某些实体周围加上双引号。对于句子:

返回>> {Canada}, {Canada}, {Canada}, {Canada}, {{Canada}}, Canada

我将句子字符串一分为二的原因是只替换新词(具有更高的字符位置)。我认为这个错误可能在于我正在循环doc.ents,所以我得到了我的字符串的旧位置,并且字符串随着新的 [] 和 {} 的每个循环而增长。但是感觉在 spaCy 中必须有一些更简单的方法来处理这个问题。

0 投票
1 回答
255 浏览

nlp - 解析 Spacy 的输出

我知道 spacy 正在解析给定的句子并对其进行 POS 标记。但是在解析完句子之后,我想对输出有所了解。

定个明天晚上七点的闹钟,

预期产出

来自 spacy 的输出:

0 投票
2 回答
396 浏览

testing - 使用小型 Spacy 模型创建测试环境

这更像是一个最佳/常见做法问题。

我们在生产系统中使用 Spacy。在测试时,很多时候我们必须下载完整的 spacy 模型(解析器 + 词向量),这可能非常慢(约 30 分钟)并且令人沮丧。也许更好的策略是创建一个自定义的轻量级 spacy 模型进行测试,例如,只有 1000 个单词的词汇和一个较小的解析模型。

在使用可应用于此场景的大型数据模型进行测试时,是否有建议的策略/最佳实践?

0 投票
1 回答
1694 浏览

python - 是否可以将您自己的 WordNet 添加到库中?

我有一个丹麦 WordNet 的 .txt 文件。有没有办法将它与 Python 的 NLP 库(如 NLTK)一起使用?如果不是,您将如何使用给定库不支持的语言进行自然语言处理。还说您想在 spaCy 之类的库中以英语或荷兰语以外的语言进行命名实体识别。有没有办法做到这一点?

0 投票
1 回答
866 浏览

python - Spacy 导入错误未定义符号

我已经在他们的 GitHub 问题页面上向开发人员询问过,但到目前为止没有任何帮助 https://github.com/explosion/spaCy/issues/855

使用 conda 创建了一个新环境

conda create -n spacy python=3.5 ipython

然后用 pip 安装 spacy (1.6.0) (conda 仍然有版本 0.101.0)

pip install spacy

但我仍然得到这个错误。

我确实采购了新的 conda 环境,而 pip 就是来自那个新环境的那个。我在这里没有选择。

这里有一个类似的问题,explosion/sense2vec#19,但该解决方案没有帮助。

操作系统:Ubuntu 16.04.1 LTS

请注意,我在 MacOS Sierra 上没有这个问题。


更新

我已经从 MacOS(它正在工作的地方)导出了我的 conda 环境,并在它不工作的机器上创建了一个新环境。相同的堆栈跟踪。

0 投票
1 回答
5563 浏览

python - 没有名为管道的模块

我正在尝试在 rasa-nlu 中训练一些数据。

所以,我安装了 anaconda,然后是 rasa-nlu 和 spacy。

但是,每当我尝试跑步时

我明白了

我无法使用 conda 或 pip 安装管道。

0 投票
1 回答
352 浏览

python - spacy POS,引理

我想我遗漏了一些东西,但即使我只是尝试他们的例子,我也无法获得 POS 和引理结果:

我得到:

我在 64 位 python 2.7

0 投票
2 回答
3133 浏览

python - pip install nlp 找不到匹配的发行版

我是 Ubuntu 和 Python 的新手,正在练习 Python 的 Spacy 库。我正在关注使用该模块的 Spacy 库的本教程。nlp因此,我必须安装它,但是当我使用以下命令时

然后它给出以下结果:

我搜索了它,但直到现在还没有找到任何解决方案。

0 投票
1 回答
984 浏览

python - 无法在 WinPython 上安装 spaCy:“ModuleNotFoundError: No module named 'semver'”

我正在尝试使用便携式 Python 解释器,因此我安装了 WinPython 并计划有一天将我的应用程序部署到其他机器上。

对于我的应用程序,我需要使用 NLP 模块“spaCy”。我尝试在 WinPython 上安装 spaCy(pip install -U spacy),但无法安装。当它安装模块依赖项时,似乎无法安装模块“semver”:

我试图直接安装 semver,它显示了同样的错误。我下载了“semver-2.7.6.tar.gz”文件并使用WinPython控制面板安装它。它无法安装。

我应该怎么办?

0 投票
1 回答
2650 浏览

tokenize - spaCy tokenizer 如何拆分句子?

我发现标记化代码非常复杂,但我仍然找不到代码中的句子被拆分的位置。

例如,分词器如何知道

Mr. Smitt stayed at home. He was tired

不应拆分为“先生”。并且应该在“He”之前拆分。?在“他”发生之前,代码中的哪个位置发生了分裂?

(事实上​​,我不确定我是否在寻找正确的地方:如果我在里面搜索sentstokenizer.pyx我没有找到任何出现)