问题标签 [spacy]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

3061 问题

0 投票

2 回答

678 浏览

python - 为什么在使用 spacy 进行词干提取/词形还原时我们不能得到一致的结果？

这是我的python代码：

输出是：

为什么第三个algorithms没有转换为“算法”？当我删除lower()功能时，我得到了这个：

这次第一个和第二个algorithms无法转换。这个问题让我发疯，我该如何解决这个问题才能让每个单词都被词形还原？

2016-12-30T09:06:26.480

0 投票

2 回答

3868 浏览

nlp - 使用 Spacy 或 NLTK 在文章中搜索职位

我是 NLP 新手，最近一直在玩 NTLK 和 Spacy。但是，我找不到在文章中搜索职位（例如：产品经理、首席营销官等）的方法。

例如，我有 1000 篇文章，我想获取所有具有我感兴趣的职位的文章。

另外，职位属于什么实体类型？我检查了https://spacy.io/docs/usage/entity-recognition并没有在其中看到它。我有计划添加吗？

谢谢。

nlp named-entity-recognition spacy

2016-12-30T18:27:06.557

0 投票

1 回答

734 浏览

nlp - 查找两个带有 spacy 的文档共享的令牌百分比

对于 nltk 它会是这样的：

由于 spacy 更快，我试图在 spacy 中做到这一点，但令牌对象似乎没有为此提供快速解决方案。有任何想法吗？

谢谢大家。

nlp nltk similarity symmetric spacy

2017-01-04T17:54:25.327

0 投票

0 回答

122 浏览

apache - 在 apache mod_wsgi 环境中仅实例化 Spacy 对象一次

我的应用程序.py

当我在开发模式下运行这个应用程序时，__main__它将执行并且它只会实例化一次 spacy，我将使用它。

对于生产，我们使用 apache 服务器 mod_wsgi 配置。同样我想实例化一次（myapp）并使用相同的obj。在我的配置中，它为每个请求实例化。请提出一些解决方案。

环境

操作系统： Linux
使用的 Python 版本： 2.7
环境信息： apache mod_wsgi 部署

apache flask mod-wsgi wsgi spacy

2017-01-06T11:41:40.977

0 投票

0 回答

206 浏览

spacy - 尝试运行 Spacy 文本蕴涵示例并获得值错误（keras）

大家好，我正在尝试运行 spacy 示例以进行文本蕴涵。我已经安装了所有要求，我正在尝试运行初步测试..

我得到错误

应该很简单，任何帮助表示赞赏。

spacy

2017-01-08T00:44:17.103

0 投票

5 回答

2402 浏览

python - 安装 spaCy - SSL 证书错误

我已经安装了 spaCy，pip install spacy但是在尝试时python -m spacy.en.download all，我收到以下错误..

（对于谷歌——ssl.CertificateError: hostname 'index.spacy.io不匹配 'api.explosion.ai'`）

有没有办法轻松解决这个问题？参考..

https://spacy.io/docs/usage/ - 安装 spaCy
当我尝试安装 spaCy 英语语言模型时，我得到 CERTIFICATE_VERIFY_FAILED
https://github.com/explosion/spaCy/issues/507 - GitHub 问题相关

python ssl spacy

2017-01-18T16:56:38.693

0 投票

1 回答

779 浏览

python - 在 Spacy for Python3 中安装英文模型的问题

(Mac OS X 10.12.2)

所以，当我运行这两行时：

它运行良好，我可以在 python (2.x) 中使用 spacy 和英文模型

但是当我为 python3 (3.6.0) 运行相同的

它安装了 spacy，但下载模型时出现错误。因此，当我在 python3 中使用 spacy 时它不起作用，我得到的是空字段而不是 pos、tag ...

我得到的错误与 urllib 有关：

关于做什么的任何想法？

多谢！干杯

编辑：我也在 Github 上的 spacy 存储库上问过这个问题，显然唯一的方法是将数据从 python2.7 复制/粘贴到 python3.6：

所以我将文件夹en-1.1.0 从复制/粘贴/Users/[myname]/anaconda/lib/python2.7/site-packages/spacy/data 到/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages/spacy/data/

一切正常，现在可以在 python3 中使用 Spacy 了！

希望它会帮助别人

python python-3.6 spacy

2017-01-25T11:34:44.103

0 投票

1 回答

3563 浏览

python - 在对字符串进行标记时，如何防止 spacy 的标记器拆分特定的子字符串？

在对字符串进行标记时，如何防止 spacy 的标记器拆分特定的子字符串？

更具体地说，我有这句话：

一旦取消注册，该文件夹就会从外壳中消失。

scapy 1.6.0 将其标记为 [Once/unregistered/,/the/folder/went/away/from/the/ she/ll /.]。我不希望将子字符串shell切割成两个不同的标记she和ll.

这是我使用的代码：

输出：

python nlp tokenize spacy

2017-01-26T03:26:39.337

0 投票

1 回答

2270 浏览

python-2.7 - from backports import csv ImportError: cannot import name csv

我正在使用基于Python Spacy构建的 NLP 工具。这个工具叫做textacy。我安装了 Spacy、textacy 并下载了 Spacy 的英文数据。全部在我的Python2.7上

现在，当我尝试使用 textacy 提取名词块时：

它一直向我展示这个

因此我尝试安装backports.csv. 我尝试从 1.0 版到最新的 1.0.3 版，它一直在重新调整我同样的错误....

你知道如何解决这个问题吗？

python-2.7 spacy backport

2017-01-26T04:40:17.193

0 投票

1 回答

303 浏览

python - 如何在 Bluemix 上下载 Spacy 语言模型

我有一个要推送到 bluemix 的 python 程序。该程序使用spacy。我没有使用任何 buildpack，因为 bluemix 不需要 python。我将 spacy 放入我的 requirements.txt 并进行推送。Spacy 需要安装语言模型。安装英语语言模型的命令如下：

python -m spacy.en.download all

如何在 bluemix 上做到这一点？

https://spacy.io/docs/usage/

python ibm-cloud spacy

2017-01-26T20:13:07.263

1 2 3 4 5 6 7 8 9 10

问题标签 [spacy]

环境

Reference