0

我有一个表中的字段,这些字段的值最初是手工填写的。即使输入/表示相同的值,也可能存在“轻微”偏差。现在我想比较一行中 2 列中的值是否非常相似。

如果有一些相似之处,我希望在新列中有一个 True,否则为 False。用例类似于合并两个表时的模糊连接,但字段在一个表中并且不用作主键。我在下面创建了一个表格,它应该是什么样子:

一个标题 另一个标题 计算列
1 苏黎世,1.OG Telefonzentrale 电话中心 真的
2 Mittelterrasse 1.OG 劳姆 T190 中部特拉斯 T1 真的
1 TM-Raum 225 伯尔尼,Bollwerk 10 / 2.OG 错误的
2 G7803 91G7803 真的

如果有人能在这个话题上帮助我,那就太好了。

4

1 回答 1

0

我不知道是否有办法做到这一点,但我们可以尝试验证 column1 中有多少单词出现在 column2 中:

CheckIfTrue__ = 
VAR SplitByCharacter = " "
VAR Org = SELECTEDVALUE(Sheet3[​A header])
VAR CurrentF = SELECTEDVALUE(Sheet3[Another header] )
VAR Table0 =
    SELECTCOLUMNS(
    ADDCOLUMNS (
        GENERATE (
            ROW ( "Text", Org),
            VAR TokenCount =
                PATHLENGTH ( SUBSTITUTE ( [Text], SplitByCharacter, "|" ) )
            RETURN
                GENERATESERIES ( 1, MAX(TokenCount,1) )
        ),
        "Word", PATHITEM ( SUBSTITUTE ( [Text], SplitByCharacter, "|" ), [Value] )
    ),
    "Word",[Word])

VAR Table1 =
    SELECTCOLUMNS(
    ADDCOLUMNS (
        GENERATE (
            ROW ( "Text", CurrentF),
            VAR TokenCount =
                PATHLENGTH ( SUBSTITUTE ( [Text], SplitByCharacter, "|" ) )
            RETURN
                GENERATESERIES ( 1, MAX(TokenCount,1) )
        ),
        "Word", PATHITEM ( SUBSTITUTE ( [Text], SplitByCharacter, "|" ), [Value] )
    ),
    "Word",[Word])
RETURN
   COUNTROWS(INTERSECT(Table0, Table1))+0

在此处输入图像描述

于 2021-12-08T11:43:00.770 回答