0

我正在使用 Open Refine 清理工作表 (.csv) 中的一些地址。如何在列中对完全匹配进行聚类?似乎聚类算法将聚类几乎相似但数量不同的地址。例如:

56, LORONG RENGAS, SELANGOR
76, LORONG RENGAS, SELANGOR
90, LORONG RENGAS, SELANGOR
76, lorong rengas, selangor
56, LORONG RENGAS, SELANGOR

如何使用 OpenRefine 根据完全匹配对这些地址进行聚类?问题听起来很傻,但我对这件事失去了理智。

谢谢

4

1 回答 1

1

您是否尝试过使用 facet 功能?基于精确匹配的构面组记录。您可以观看有关刻面和数据分析的视频

于 2014-12-04T12:49:23.523 回答