问题标签 [spacy]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

3061 问题

0 投票

1 回答

294 浏览

python - SpaCy urllib.error.URLError 在安装过程中

我刚刚开始在 python 下使用 spaCy。可悲的是，我已经陷入安装过程（https://spacy.io/docs/#getting-started）。
在pip install spacy我想下载模型后python -m spacy.en.download，我收到以下错误：

有人有类似的错误吗？

2016-08-09T14:37:26.897

0 投票

3 回答

1854 浏览

python - 太空管道？

所以最近我一直在玩 WikiDump。我对其进行了预处理并在 Word2Vec + Gensim 上对其进行了训练

有谁知道 Spacy 中是否只有一个脚本可以同时生成标记化、句子识别、词性标记、词形还原、依赖解析和命名实体识别

我一直无法找到明确的文件谢谢

python nlp spacy

2016-08-17T00:02:35.387

0 投票

1 回答

2997 浏览

python - Python：使用 Spacy 等将名词短语以外的其他词（例如介词）分块

自从有人告诉我 Spacy 是一个用于自然语音处理的强大 Python 模块后，我现在正在拼命寻找一种方法来将单词组合成多个名词短语，最重要的是介词短语。我怀疑是否有 Spacy 功能，但我猜这将是最简单的方法（SpacySpaCy 导入已经在我的项目中实现）。尽管如此，我对任何短语识别/分块的可能性持开放态度。

python nlp chunking phrases spacy

2016-08-23T12:03:12.183

0 投票

1 回答

983 浏览

python - 尝试安装 Spacy 英语语言模型，出现 urlopen 错误

我正在尝试在带有 python 3 的 anaconda 环境中使用 Windows 8 安装 spaCy。按照 spaCy 网站上的说明，我运行以下命令。

第一个命令看起来很好。但是，第二个命令会导致错误：urllib.error.URLError：

完整的追溯：

其他类似的问题似乎表明代理可能是问题，但我没有使用代理。

python python-3.x spacy

2016-08-24T13:49:48.987

0 投票

3 回答

15169 浏览

python - 如何使用 spacy/nltk 生成双/三元组

输入文本总是菜名列表，其中有 1~3 个形容词和一个名词

输入

输出：

基本上，我正在寻找解析句子树并尝试通过将形容词与名词配对来生成二元组。

我想用 spacy 或 nltk 来实现这一点

python nlp nltk n-gram spacy

2016-08-31T05:53:14.523

0 投票

1 回答

2412 浏览

python - 与 spaCy 的搭配

我一直在使用 NLTK 来查找搭配或 n-gram，并且最近发现了用于 NLP 的 spaCy 模块。我才刚刚开始熟悉它，到目前为止，几乎没有提到支持的搭配功能。

可以使用 spaCy 直接查找搭配吗？

我已经阅读了文档，但没有看到提及。

python nlp spacy

2016-08-31T20:29:16.633

0 投票

0 回答

89 浏览

model - 为什么 spaCy 的模型与 TextBlob 中使用的大约 1MB 的词典相比超过 500MB？

如果您转到包含 spaCy 模型的目录，您会发现 data\en-1.1.0\deps\model 有 433.881 KB，data\en-1.1.0\ner\model 有 35.698 KB，data\en-1.1 .0\pos\model 有 11.524 KB 和 data\en-1.1.0\vocab 两个二进制文件 lexemes.bin 有 81.096 KB 和 vec.bin 有 206.562 KB 和 strings.json 有 18.371 KB。当然还有几个较小的文件，总计 812.694 KB。加载时（需要一些时间），主内存消耗增加约 2.4 GB。在 TextBlob 中，整个英文目录大约为 2.299 MB。为什么会有近三个数量级的巨大差异？

model textblob spacy

2016-09-02T13:34:42.823

0 投票

1 回答

2021 浏览

python - TypeError：“模块”对象在 Spacy Python 中不可调用

我想Parse Tree使用打印Spacy。但是下面的代码给出了错误

en_nlp = spacy.language('English') TypeError: 'module' object is not callable

错误在这一en_nlp = spacy.loads('en')行。en_nlp = spacy.language(English)我试图通过导入来摆脱，from spacy.en import English但它仍然无法正常工作。有人可以帮忙吗？

代码：

python nlp spacy

2016-09-04T15:14:25.117

0 投票

1 回答

420 浏览

python - SpaCy，解析，标记 - 输出为列表

我正在为 nlp 使用 spacy，并且我以简洁的形式打印/输出结果。目前 (token.pos_) 的每个输出都会换行。

我希望能把它打印出来，作为一个列表。我可以在 nltk/stanford pos 中做到这一点，但是 spacy 的文档非常模糊。我似乎无法找出令牌如何工作或如何以可接受的方式调用我需要的值。斯派西，太机械了。

这是我的代码：

我努力了

python spacy

2016-09-04T22:03:37.330

0 投票

3 回答

6221 浏览

python - Can I find subject from Spacy Dependency tree using NLTK in python?

I want to find the subject from a sentence using Spacy. The code below is working fine and giving a dependency tree.

From this dependency tree code, Can I find the subject of this sentence?

python nlp spacy

2016-09-05T02:54:03.007

1 2 3 4 5 6 7 8 9 10

问题标签 [spacy]

Reference