问题标签 [pytextrank]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
4966 浏览

python - spaCy 需要一个不存在的文件:strings.json

我正在运行 pytextrank 处于第二阶段,我从 spaCy 收到此错误:

我寻找了strings.json,但没有这样的东西。

有趣的是,当我使用以下错误代码安装 spaCy 时,存在与 pathlib.py 类似的错误:

你们有什么想法吗?谢谢

0 投票
2 回答
1085 浏览

python-2.7 - 使用 pytextrank 时 Spacy 中的值错误(textrank 的 Python 实现)

我已经使用pytextrank来提取关键字。我使用以下命令安装了 pytextrank 和 spacy。

这是我的代码

当我尝试执行此操作时出现以下错误

我正在使用 python 2.7、anaconda 4.3、jupyter notebook 和 ubuntu 14.04

0 投票
1 回答
2547 浏览

python - Google colab:找不到名为 pytextrank 的模块(以前使用同一个笔记本)

从最近开始,每当我运行笔记本时,我都会收到此错误:

这是我笔记本的链接: https ://colab.research.google.com/github/neomatrix369/awesome-ai-ml-dl/blob/master/examples/better-nlp/notebooks/jupyter/better_nlp_summarisers.ipynb#滚动至=-dJrJ54a3w8S

虽然检查显示该库已安装,但 python 导入失败 - 我曾在不同的场景中遇到过此问题,并使用以下方法修复它:

但这没有任何影响,错误仍然存​​在。

这在过去不是问题,同样的笔记本运行良好 - 我认为这可能是一种回归。

有什么想法吗?任何有用的反馈将不胜感激。

这是我调用的代码:

我在 colab 单元中得到了这个:

0 投票
6 回答
8636 浏览

python - OSError: [E050] 找不到模型 'en'

我正在尝试使用 python 的这个 pytextrank 库- https://github.com/DerwenAI/pytextrank/blob/master/example.ipynb 但我无法解决这个错误,早些时候我收到了一个错误,ip.json 可以'找不到,但后来解决了

0 投票
0 回答
65 浏览

python - Python - 从分叉的 GitHub 存储库安装

我正在尝试安装此处找到的软件包:

https://github.com/xang1234/pytextrank

这是一个分叉的回购pip3 install pytextrank

我搜索了这个网站,它提供了不同的解决方案,但似乎没有什么对我有用:

即我尝试过:

以及其他一些变体。如果我不使用鸡蛋,我会收到关于使用鸡蛋的错误,然后如果我添加一个随机鸡蛋,我会收到如下错误:

我对该怎么做有点困惑,任何建议都会有所帮助。谢谢

0 投票
2 回答
1143 浏览

python - 模块“pytextrank”没有属性“parse_doc”

我正在执行 nlp 任务。我已经编写了以下代码。在执行时,它显示以下错误。任何解决错误的建议都会有所帮助。我在 google colab 中有 python 3 env。

我收到以下错误:

0 投票
2 回答
920 浏览

python - spacy-udpipe 与 pytextrank 从非英文文本中提取关键字

我一直在使用带有 spacy 和英文模型的 pytextrank ( https://github.com/DerwenAI/pytextrank/ ) 来提取关键字——效果很好!

现在我需要处理非英文文本,我找到了 udpipe ( https://github.com/TakeLab/spacy-udpipe ) 但它不能开箱即用......之后

我得到带有 POS 和 DEP 标签的令牌,但doc._.phrases(doc.noun_chunks也是空的) 中没有任何内容,并且nlp.pipe_names只是 ['textrank']

我应该在 spacy 的管道中添加什么以使其正常工作?我假设 pytextrank 需要 noun_chunks ......

任何提示或建议在哪里看都会对我有所帮助 - 谢谢!

0 投票
1 回答
64 浏览

nlp - Pytextrank - 避免将小写标签转换为关键短语提取

我想避免在 pytextrank 中使用小写标签。关于如何实现的任何建议?

0 投票
1 回答
66 浏览

plotly - 读取 pyTextRank 文件

我有一段文本,我希望使用 pytextrank 将其呈现为图表。代码(从源代码复制)是

"it" 将一些内容写入文件 "graph.dot"。这看起来像一个带有第一个字段“digraph {}”的 json 文件。在这一点上,我迷路了。我如何创建一个漂亮的文本图表(或者根本就没有图表)

谢谢,

安德烈亚斯

使用 ubuntu 20.04.1LTS、python 3.8、pytextrank 2.0.3

0 投票
1 回答
41 浏览

spacy - 将大文本提供给 PyTextRank

我想PyTextRank用于关键词提取。如何将 500 万份文档(每个文档由几段组成)提供给包?

这是我在官方教程上看到的例子。

我是否只能选择将数百万个文档连接到一个字符串并将其传递给nlp(text)?我不认为我可以使用nlp.pipe(texts),因为我想通过计算所有文档中的单词/短语来创建一个网络。