0

借助 SAP HANA,您可以进行文本分析、全文搜索甚至情绪分析。

在 SAP HANA 中自定义标记化的选项有哪些?

我知道我可以为特殊词创建一个自定义词典。例如,我可以让 HANA 将“堆栈溢出”识别为单个实体/令牌。

但有时 HANA 会从不是一个标记/实体的多个单词中创建标记,例如“SAP experiece”在这里我想要 2 个标记“sap”和“experience”(不是“sap 经验”)

那么如何自定义tokanization(自定义词典除外)

4

1 回答 1

0

我偶然发现了这些信息,并认为我会传递它以防万一。

查看可用于自定义 HANA 中文本索引的众多参数。要查看全文索引的配置,请使用 SYS.FULLTEXT_INDEXES 视图。您对 PHRASE INDEX RATIO 有什么价值?

full source: http://help.sap.com/saphelp_hanaplatform/helpdata/en/cc/c504cebb571014badd88b622a24cae/content.htm?frameset=/en/f5/ceb3d471bf4ec0bf5a77351c1f035d/frameset.htm¤t_toc=/en/fd/c71ac6a10b43cd97ff1bee7a3c3aab/plain.htm&node_id =21&show_children=假

于 2015-01-05T03:07:48.393 回答