借助 SAP HANA,您可以进行文本分析、全文搜索甚至情绪分析。
在 SAP HANA 中自定义标记化的选项有哪些?
我知道我可以为特殊词创建一个自定义词典。例如,我可以让 HANA 将“堆栈溢出”识别为单个实体/令牌。
但有时 HANA 会从不是一个标记/实体的多个单词中创建标记,例如“SAP experiece”在这里我想要 2 个标记“sap”和“experience”(不是“sap 经验”)
那么如何自定义tokanization(自定义词典除外)
借助 SAP HANA,您可以进行文本分析、全文搜索甚至情绪分析。
在 SAP HANA 中自定义标记化的选项有哪些?
我知道我可以为特殊词创建一个自定义词典。例如,我可以让 HANA 将“堆栈溢出”识别为单个实体/令牌。
但有时 HANA 会从不是一个标记/实体的多个单词中创建标记,例如“SAP experiece”在这里我想要 2 个标记“sap”和“experience”(不是“sap 经验”)
那么如何自定义tokanization(自定义词典除外)