我想从简短的荷兰语文本中提取关键字。是否有此 API 或我可以使用的某个库。
如果这些不适用于荷兰语,任何有关如何自己提取它们的提示也将不胜感激。我已经通过词性标注器和词形还原器运行文本自己尝试过。但从那时起,我发现很难提取出像样的关键字。TF-IDF 没有用,因为文本太短而无法获得好的结果。
我更喜欢 Java,但也非常欢迎任何其他语言实现。
我想从简短的荷兰语文本中提取关键字。是否有此 API 或我可以使用的某个库。
如果这些不适用于荷兰语,任何有关如何自己提取它们的提示也将不胜感激。我已经通过词性标注器和词形还原器运行文本自己尝试过。但从那时起,我发现很难提取出像样的关键字。TF-IDF 没有用,因为文本太短而无法获得好的结果。
我更喜欢 Java,但也非常欢迎任何其他语言实现。
这是我使用 RapidMiner 进行文本挖掘的视频系列。它展示了如何轻松获得 TF-IDF 等:
http://vancouverdata.blogspot.ca/2010/11/text-analytics-with-rapidminer-loading.html