问题标签 [spacy]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

3061 问题

0 投票

1 回答

2104 浏览

python - spaCy nlp - 在字符串中标记实体

假设我有一个字符串，并且想要标记一些实体，例如 Persons 和 Locations。

我想用 [ ] 标记人，用 { } 标记位置。

我的代码：

...所以使用示例字符串可以正常工作。但是对于更复杂的句子，我会在某些实体周围加上双引号。对于句子：

返回>> {Canada}, {Canada}, {Canada}, {Canada}, {{Canada}}, Canada

我将句子字符串一分为二的原因是只替换新词（具有更高的字符位置）。我认为这个错误可能在于我正在循环doc.ents，所以我得到了我的字符串的旧位置，并且字符串随着新的 [] 和 {} 的每个循环而增长。但是感觉在 spaCy 中必须有一些更简单的方法来处理这个问题。

2017-02-19T23:00:51.777

0 投票

1 回答

255 浏览

nlp - 解析 Spacy 的输出

我知道 spacy 正在解析给定的句子并对其进行 POS 标记。但是在解析完句子之后，我想对输出有所了解。

定个明天晚上七点的闹钟，

预期产出

来自 spacy 的输出：

nlp spacy

2017-02-20T21:50:53.717

0 投票

2 回答

396 浏览

testing - 使用小型 Spacy 模型创建测试环境

这更像是一个最佳/常见做法问题。

我们在生产系统中使用 Spacy。在测试时，很多时候我们必须下载完整的 spacy 模型（解析器 + 词向量），这可能非常慢（约 30 分钟）并且令人沮丧。也许更好的策略是创建一个自定义的轻量级 spacy 模型进行测试，例如，只有 1000 个单词的词汇和一个较小的解析模型。

在使用可应用于此场景的大型数据模型进行测试时，是否有建议的策略/最佳实践？

testing spacy

2017-02-22T18:28:29.497

0 投票

1 回答

1694 浏览

python - 是否可以将您自己的 WordNet 添加到库中？

我有一个丹麦 WordNet 的 .txt 文件。有没有办法将它与 Python 的 NLP 库（如 NLTK）一起使用？如果不是，您将如何使用给定库不支持的语言进行自然语言处理。还说您想在 spaCy 之类的库中以英语或荷兰语以外的语言进行命名实体识别。有没有办法做到这一点？

python machine-learning nlp nltk spacy

2017-02-23T17:35:40.877

0 投票

1 回答

866 浏览

python - Spacy 导入错误未定义符号

我已经在他们的 GitHub 问题页面上向开发人员询问过，但到目前为止没有任何帮助 https://github.com/explosion/spaCy/issues/855

使用 conda 创建了一个新环境

conda create -n spacy python=3.5 ipython

然后用 pip 安装 spacy (1.6.0) (conda 仍然有版本 0.101.0)

pip install spacy

但我仍然得到这个错误。

我确实采购了新的 conda 环境，而 pip 就是来自那个新环境的那个。我在这里没有选择。

这里有一个类似的问题，explosion/sense2vec#19，但该解决方案没有帮助。

操作系统：Ubuntu 16.04.1 LTS

请注意，我在 MacOS Sierra 上没有这个问题。

更新

我已经从 MacOS（它正在工作的地方）导出了我的 conda 环境，并在它不工作的机器上创建了一个新环境。相同的堆栈跟踪。

python python-3.x python-import spacy

2017-02-28T18:33:29.820

0 投票

1 回答

5563 浏览

python - 没有名为管道的模块

我正在尝试在 rasa-nlu 中训练一些数据。

所以，我安装了 anaconda，然后是 rasa-nlu 和 spacy。

但是，每当我尝试跑步时

我明白了

我无法使用 conda 或 pip 安装管道。

python pip anaconda spacy rasa-nlu

2017-03-02T06:29:05.913

0 投票

1 回答

352 浏览

python - spacy POS，引理

我想我遗漏了一些东西，但即使我只是尝试他们的例子，我也无法获得 POS 和引理结果：

我得到：

我在 64 位 python 2.7

python spacy

2017-03-02T12:44:50.000

0 投票

2 回答

3133 浏览

python - pip install nlp 找不到匹配的发行版

我是 Ubuntu 和 Python 的新手，正在练习 Python 的 Spacy 库。我正在关注使用该模块的 Spacy 库的本教程。nlp因此，我必须安装它，但是当我使用以下命令时

然后它给出以下结果：

我搜索了它，但直到现在还没有找到任何解决方案。

python spacy

2017-03-02T18:43:41.737

0 投票

1 回答

984 浏览

python - 无法在 WinPython 上安装 spaCy：“ModuleNotFoundError: No module named 'semver'”

我正在尝试使用便携式 Python 解释器，因此我安装了 WinPython 并计划有一天将我的应用程序部署到其他机器上。

对于我的应用程序，我需要使用 NLP 模块“spaCy”。我尝试在 WinPython 上安装 spaCy（pip install -U spacy），但无法安装。当它安装模块依赖项时，似乎无法安装模块“semver”：

我试图直接安装 semver，它显示了同样的错误。我下载了“semver-2.7.6.tar.gz”文件并使用WinPython控制面板安装它。它无法安装。

我应该怎么办？

python semantic-versioning spacy

2017-03-08T06:18:52.337

0 投票

1 回答

2650 浏览

tokenize - spaCy tokenizer 如何拆分句子？

我发现标记化代码非常复杂，但我仍然找不到代码中的句子被拆分的位置。

例如，分词器如何知道

Mr. Smitt stayed at home. He was tired

不应拆分为“先生”。并且应该在“He”之前拆分。？在“他”发生之前，代码中的哪个位置发生了分裂？

（事实上，我不确定我是否在寻找正确的地方：如果我在里面搜索sents，tokenizer.pyx我没有找到任何出现）

tokenize spacy

2017-03-13T10:08:07.653

1 2 3 4 5 6 7 8 9 10

问题标签 [spacy]

Reference