9

我知道以下开源工具,但我没有发现它们分别有多好。准备使用短语提取的工具:

  • 凯亚
  • MAUI (http://code.google.com/p/maui-indexer/)
  • 龙,xTract (http://dragon.ischool.drexel.edu/xtract.asp)
  • Lingpipe (http://alias-i.com/lingpipe/demos/tutorial/interestingPhrases/read-me.html)
  • Mahout (https://cwiki.apache.org/MAHOUT/collocations.html)
  • 还要别的吗

有没有人见过这样的比较?

4

2 回答 2

4

在我的实验中, MAUI的表现优于 KEA。对无监督自动关键短语提取方法进行了比较(Coling 2010 论文)。但他们不分析监督方法,我计划在不久的将来这样做。

此外,我还探索了一组更丰富的功能,这些功能提高了自动关键短语提取的性能,但仍然远非完美。明年我可能会发布带有这些扩展的 MAUI 的扩展版本。

请阅读以下论文或通过电子邮件向我发送更多详细信息:

使用众包、光过滤和共同参考规范化监督新闻故事的主题关键短语提取

广播新闻关键词云生成

于 2012-11-28T05:58:54.570 回答
0

我喜欢Mallet,因为它有一个非常易于使用的命令行工具

于 2012-03-26T07:03:13.457 回答