1

我想避免在 pytextrank 中使用小写标签。关于如何实现的任何建议?

4

1 回答 1

1

PyTextRank版本 2.1.0(于 2021-01-31 发布)开始,当应用程序遍历排名短语时,例如:

for phrase in doc._.phrases[:10]:
    print(phrase.text)

...每个短语的默认文本是其在文档中出现的最流行的实例。这就是在数据类的text字段中设置的内容。Phrase

但是,请查看文档中出现的所有短语实例的chunks字段。由于这些是从文档的原始文本中提取的,因此它们不会被强制小写。

OTOH,当算法构造其内部引理图数据结构时,引理化的标记被强制小写。但是,您不需要使用引理图作为最终结果。也许这可能是一些混乱的根源?

于 2021-03-01T01:44:17.977 回答