问题标签 [spacy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - SpaCy urllib.error.URLError 在安装过程中
我刚刚开始在 python 下使用 spaCy。可悲的是,我已经陷入安装过程(https://spacy.io/docs/#getting-started)。
在pip install spacy
我想下载模型后python -m spacy.en.download
,我收到以下错误:
有人有类似的错误吗?
python - 太空管道?
所以最近我一直在玩 WikiDump。我对其进行了预处理并在 Word2Vec + Gensim 上对其进行了训练
有谁知道 Spacy 中是否只有一个脚本可以同时生成标记化、句子识别、词性标记、词形还原、依赖解析和命名实体识别
我一直无法找到明确的文件谢谢
python - Python:使用 Spacy 等将名词短语以外的其他词(例如介词)分块
自从有人告诉我 Spacy 是一个用于自然语音处理的强大 Python 模块后,我现在正在拼命寻找一种方法来将单词组合成多个名词短语,最重要的是介词短语。我怀疑是否有 Spacy 功能,但我猜这将是最简单的方法(SpacySpaCy 导入已经在我的项目中实现)。尽管如此,我对任何短语识别/分块的可能性持开放态度。
python - 尝试安装 Spacy 英语语言模型,出现 urlopen 错误
我正在尝试在带有 python 3 的 anaconda 环境中使用 Windows 8 安装 spaCy。按照 spaCy 网站上的说明,我运行以下命令。
第一个命令看起来很好。但是,第二个命令会导致错误:urllib.error.URLError:
完整的追溯:
其他类似的问题似乎表明代理可能是问题,但我没有使用代理。
python - 如何使用 spacy/nltk 生成双/三元组
输入文本总是菜名列表,其中有 1~3 个形容词和一个名词
输入
输出:
基本上,我正在寻找解析句子树并尝试通过将形容词与名词配对来生成二元组。
我想用 spacy 或 nltk 来实现这一点
python - 与 spaCy 的搭配
我一直在使用 NLTK 来查找搭配或 n-gram,并且最近发现了用于 NLP 的 spaCy 模块。我才刚刚开始熟悉它,到目前为止,几乎没有提到支持的搭配功能。
可以使用 spaCy 直接查找搭配吗?
我已经阅读了文档,但没有看到提及。
model - 为什么 spaCy 的模型与 TextBlob 中使用的大约 1MB 的词典相比超过 500MB?
如果您转到包含 spaCy 模型的目录,您会发现 data\en-1.1.0\deps\model 有 433.881 KB,data\en-1.1.0\ner\model 有 35.698 KB,data\en-1.1 .0\pos\model 有 11.524 KB 和 data\en-1.1.0\vocab 两个二进制文件 lexemes.bin 有 81.096 KB 和 vec.bin 有 206.562 KB 和 strings.json 有 18.371 KB。当然还有几个较小的文件,总计 812.694 KB。加载时(需要一些时间),主内存消耗增加约 2.4 GB。在 TextBlob 中,整个英文目录大约为 2.299 MB。为什么会有近三个数量级的巨大差异?
python - TypeError:“模块”对象在 Spacy Python 中不可调用
我想Parse Tree
使用打印Spacy
。但是下面的代码给出了错误
en_nlp = spacy.language('English') TypeError: 'module' object is not callable
错误在这一en_nlp = spacy.loads('en')
行。en_nlp = spacy.language(English)
我试图通过导入来摆脱,from spacy.en import English
但它仍然无法正常工作。有人可以帮忙吗?
代码:
python - SpaCy,解析,标记 - 输出为列表
我正在为 nlp 使用 spacy,并且我以简洁的形式打印/输出结果。目前 (token.pos_) 的每个输出都会换行。
我希望能把它打印出来,作为一个列表。我可以在 nltk/stanford pos 中做到这一点,但是 spacy 的文档非常模糊。我似乎无法找出令牌如何工作或如何以可接受的方式调用我需要的值。斯派西,太机械了。
这是我的代码:
我努力了