0

在openrefine中,当我上传数据时,点击text facet然后聚类。它创建集群。喜欢: Aniket Ghodke 和 Ghodke Aniket 它会建议合并它们。但是有什么方法可以存储这些值。就像我将“Aniket Ghodke”和“Ghodke Aniket”合并为“Aniket Ghodke”一样,我可以存储这些值以供进一步参考。我也准备好使用 Python 或 java 库了。但是有没有可能。

4

1 回答 1

0

ngram(value,4)您可以像 GREL 一样或fingerprint(value)通过 GREL调用大多数聚类函数。您可以将结果存储在新列或构面中以探索结果。

这篇博客文章解释了如何使用它们。

于 2014-10-16T02:58:26.607 回答