-1

我需要使用 Map-Reduce 概念对单个文档进行文本挖掘。

我的一些朋友建议我使用 Apache Lucene。

但是在浏览了一些关于 Apache Lucene 的文档后,我发现它只有在我们需要索引文档时才有用。

谁能建议我更好的方法?

先感谢您

4

1 回答 1

0

Lucene 是一个用于文档索引和检索的框架。当然,人们可以使用索引数据,如关键字搜索、文档相似度等。

如果您对 TM 感兴趣,请查看 OpenNLP 和 LingPipe。他们有 100 多个用于文本挖掘和自然语言处理的库。

于 2013-05-09T09:59:45.013 回答