我正在使用 Open Refine 清理工作表 (.csv) 中的一些地址。如何在列中对完全匹配进行聚类?似乎聚类算法将聚类几乎相似但数量不同的地址。例如:
56, LORONG RENGAS, SELANGOR
76, LORONG RENGAS, SELANGOR
90, LORONG RENGAS, SELANGOR
76, lorong rengas, selangor
56, LORONG RENGAS, SELANGOR
如何使用 OpenRefine 根据完全匹配对这些地址进行聚类?问题听起来很傻,但我对这件事失去了理智。
谢谢