0

我喜欢 Carrot2 的工作方式。我目前主要使用 XML 导入。我想用 TF-IDF 结果而不是片段导入 XML 文件。这将允许我按照我的意愿准备数据。

我试图在片段中传递 TF-IDF 关键字(没有指标)并且它以某种方式工作。不幸的是,Carrot2 再次对我的数据执行 TF-IDF,结果很平庸。如果我可以将关键字与重要性指标一起传递,然后仅使用 Carrot2 来微调结果,那就太好了。

我在 API 中搜索了这样的解决方案,但我找不到。有可能吗?

4

1 回答 1

0

不幸的是,Carrot2 不支持直接输入 TF-IDF 数据。您可以尝试的一种技巧是用句点 (.) 分隔每个关键字,按照其重要性指标(四舍五入/缩放到最接近的整数)指示的次数重复每个关键字。用句点分隔关键字将确保 Carrot2 不会尝试将相邻的关键字连接成短语。

于 2020-01-20T10:18:59.433 回答