我有一列看起来像这样的数据
["Lymore Cottages", "Lymore Cottages", "Lymore Cottages", "Lymore Cottages", "Lymore Cottages", "Lymor Cottages"]
它多次本质上是同一件事,但由于这些是由用户输入的,它们可能会有所不同。如果您注意到最后一个缺少 e。
我想做的是创建一个新列,其中只有唯一的名称。因此,新列将仅包含“Lymore Cottages, Lymor Cottages”。
我相信这可以通过 Google/open Refine 实现。我尝试了聚类,但这也将所有其他行聚类到具有相同细节而不是每个单元格。(无论是否有其他 20 行具有相同数据,我都需要对每一行进行此操作)