0

我想创建一个自动同义词查找算法(主要用于品牌名称)。例如,如果用户输入“可口可乐”这个词,我想返回“可乐”这个词。

这可以很容易地使用字典来完成;但我需要一个字典文件。如何自动创建一个?(我有一个包含 100 万多条记录的小型语料库,同义词将来自此)。

有没有针对这个问题的文本挖掘算法?此外,还有一些在线同义​​词服务,但这些服务不包含品牌名称 :-(

谢谢,克里斯

4

1 回答 1

0

基于 trie 的算法可以找到同义词或相似词。它不使用键,而是使用树中的位置来定义键。例如,从 A 到 B,从 B 到 C。 trie 有许多数据结构。最简单的是邻接列表或三元搜索树。

于 2012-06-18T10:29:56.460 回答