我想避免在 pytextrank 中使用小写标签。关于如何实现的任何建议?
问问题
64 次
1 回答
1
从PyTextRank版本 2.1.0(于 2021-01-31 发布)开始,当应用程序遍历排名短语时,例如:
for phrase in doc._.phrases[:10]:
print(phrase.text)
...每个短语的默认文本是其在文档中出现的最流行的实例。这就是在数据类的text
字段中设置的内容。Phrase
但是,请查看文档中出现的所有短语实例的chunks
字段。由于这些是从文档的原始文本中提取的,因此它们不会被强制小写。
OTOH,当算法构造其内部引理图数据结构时,引理化的标记被强制小写。但是,您不需要使用引理图作为最终结果。也许这可能是一些混乱的根源?
于 2021-03-01T01:44:17.977 回答