13

我正在寻找一种 Java 驱动的解决方案来满足分析句子以记录关键字是正面使用还是负面使用的需求。

即关键字可能是“卷心菜”和句子:-

“我喜欢卷心菜,但不喜欢豌豆”

而且我想要某种Java文本分析器将其记录为肯定的。lucene (Hibernate-Search) 库可以用于此目的吗?

有什么想法吗?

4

3 回答 3

16

您正在寻找“情绪分析”。一种可能性是LingPipe,它也很乐意与他们的竞争对手联系Jeff Dalton 在他的博客中也列出了很多自然语言处理工具。

于 2010-09-23T12:57:31.257 回答
1

我怀疑有这样的事情。Lucene 绝对不能开箱即用。

您甚至如何以可以编程方式评估的方式定义“一个关键词被正面或负面地使用”?要正确地做到这一点,您必须分析文本的实际含义,这是一个甚至无法远程解决的 AI 问题。

我想你可以通过统计分析关键字是否更频繁地出现在积极(如,好,伟大,精彩)或消极(坏,讨厌,蹩脚,该死)关键字,但即使在那里,否定,讽刺和复杂的句子结构都会有问题。

于 2010-09-23T12:44:00.180 回答
0

看看Mahout Taste,它建立在 Lucene 之上,但添加了很多你需要的开箱即用的东西。(编辑)我应该补充一点,Mahout Taste 仅您要查找的内容有关,而不是 100% 匹配。

于 2010-09-23T12:43:42.303 回答