在openrefine中,当我上传数据时,点击text facet然后聚类。它创建集群。喜欢: Aniket Ghodke 和 Ghodke Aniket 它会建议合并它们。但是有什么方法可以存储这些值。就像我将“Aniket Ghodke”和“Ghodke Aniket”合并为“Aniket Ghodke”一样,我可以存储这些值以供进一步参考。我也准备好使用 Python 或 java 库了。但是有没有可能。
问问题
428 次
1 回答
0
ngram(value,4)
您可以像 GREL 一样或fingerprint(value)
通过 GREL调用大多数聚类函数。您可以将结果存储在新列或构面中以探索结果。
这篇博客文章解释了如何使用它们。
于 2014-10-16T02:58:26.607 回答