问题标签 [spacy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - spaCy nlp - 在字符串中标记实体
假设我有一个字符串,并且想要标记一些实体,例如 Persons 和 Locations。
我想用 [ ] 标记人,用 { } 标记位置。
我的代码:
...所以使用示例字符串可以正常工作。但是对于更复杂的句子,我会在某些实体周围加上双引号。对于句子:
返回>> {Canada}, {Canada}, {Canada}, {Canada}, {{Canada}}, Canada
我将句子字符串一分为二的原因是只替换新词(具有更高的字符位置)。我认为这个错误可能在于我正在循环doc.ents
,所以我得到了我的字符串的旧位置,并且字符串随着新的 [] 和 {} 的每个循环而增长。但是感觉在 spaCy 中必须有一些更简单的方法来处理这个问题。
nlp - 解析 Spacy 的输出
我知道 spacy 正在解析给定的句子并对其进行 POS 标记。但是在解析完句子之后,我想对输出有所了解。
定个明天晚上七点的闹钟,
预期产出
来自 spacy 的输出:
testing - 使用小型 Spacy 模型创建测试环境
这更像是一个最佳/常见做法问题。
我们在生产系统中使用 Spacy。在测试时,很多时候我们必须下载完整的 spacy 模型(解析器 + 词向量),这可能非常慢(约 30 分钟)并且令人沮丧。也许更好的策略是创建一个自定义的轻量级 spacy 模型进行测试,例如,只有 1000 个单词的词汇和一个较小的解析模型。
在使用可应用于此场景的大型数据模型进行测试时,是否有建议的策略/最佳实践?
python - 是否可以将您自己的 WordNet 添加到库中?
我有一个丹麦 WordNet 的 .txt 文件。有没有办法将它与 Python 的 NLP 库(如 NLTK)一起使用?如果不是,您将如何使用给定库不支持的语言进行自然语言处理。还说您想在 spaCy 之类的库中以英语或荷兰语以外的语言进行命名实体识别。有没有办法做到这一点?
python - Spacy 导入错误未定义符号
我已经在他们的 GitHub 问题页面上向开发人员询问过,但到目前为止没有任何帮助 https://github.com/explosion/spaCy/issues/855
使用 conda 创建了一个新环境
conda create -n spacy python=3.5 ipython
然后用 pip 安装 spacy (1.6.0) (conda 仍然有版本 0.101.0)
pip install spacy
但我仍然得到这个错误。
我确实采购了新的 conda 环境,而 pip 就是来自那个新环境的那个。我在这里没有选择。
这里有一个类似的问题,explosion/sense2vec#19,但该解决方案没有帮助。
操作系统:Ubuntu 16.04.1 LTS
请注意,我在 MacOS Sierra 上没有这个问题。
更新
我已经从 MacOS(它正在工作的地方)导出了我的 conda 环境,并在它不工作的机器上创建了一个新环境。相同的堆栈跟踪。
python - 没有名为管道的模块
我正在尝试在 rasa-nlu 中训练一些数据。
所以,我安装了 anaconda,然后是 rasa-nlu 和 spacy。
但是,每当我尝试跑步时
我明白了
我无法使用 conda 或 pip 安装管道。
python - spacy POS,引理
我想我遗漏了一些东西,但即使我只是尝试他们的例子,我也无法获得 POS 和引理结果:
我得到:
我在 64 位 python 2.7
python - pip install nlp 找不到匹配的发行版
我是 Ubuntu 和 Python 的新手,正在练习 Python 的 Spacy 库。我正在关注使用该模块的 Spacy 库的本教程。nlp
因此,我必须安装它,但是当我使用以下命令时
然后它给出以下结果:
我搜索了它,但直到现在还没有找到任何解决方案。
python - 无法在 WinPython 上安装 spaCy:“ModuleNotFoundError: No module named 'semver'”
我正在尝试使用便携式 Python 解释器,因此我安装了 WinPython 并计划有一天将我的应用程序部署到其他机器上。
对于我的应用程序,我需要使用 NLP 模块“spaCy”。我尝试在 WinPython 上安装 spaCy(pip install -U spacy),但无法安装。当它安装模块依赖项时,似乎无法安装模块“semver”:
我试图直接安装 semver,它显示了同样的错误。我下载了“semver-2.7.6.tar.gz”文件并使用WinPython控制面板安装它。它无法安装。
我应该怎么办?
tokenize - spaCy tokenizer 如何拆分句子?
我发现标记化代码非常复杂,但我仍然找不到代码中的句子被拆分的位置。
例如,分词器如何知道
Mr. Smitt stayed at home. He was tired
不应拆分为“先生”。并且应该在“He”之前拆分。?在“他”发生之前,代码中的哪个位置发生了分裂?
(事实上,我不确定我是否在寻找正确的地方:如果我在里面搜索sents
,tokenizer.pyx
我没有找到任何出现)