4

我正在增强一个聊天机器人,我希望从输入句子中找到单词的引理。聊天机器人是用 c++ 编写的,我发现了一个免费的开源词形还原工具,称为 LemmaGen。我已经下载了 c++ 的 2.2 版,但它没有关于如何引用甚至使用它的文档。

过去有没有人使用 LemmaGen for c++ 的经验?任何信息都会有所帮助。非常感谢

4

1 回答 1

2

我没有使用 c++ 版本,但我确实使用了 C# 版本。在 C# 中使用 LemmaGen 很简单,也很直接。首先你用模型文件的参数初始化 Lemmatizer 类型的对象,然后你可以调用它的公共方法来 Lemmatize 表示为字符串的单词。因此,您所要做的就是对文本进行标记,然后对每个标记逐个进行词形还原。方法返回表示输入词引理的字符串。

我猜C++版本的使用是相似的。

于 2014-08-22T12:43:00.407 回答