0

我使用 Boilerpipe 使用 java 程序分析了一些新闻评论。我使用PatternandMatcher从文本中提取关键字。

我的问题是我有一些企业(WHO、Total、2A、SEE、ARE...)我也需要提取,正如你所看到的,它们的名称也作为常用词存在,所以我得到了一些“谁,见,是“......结果,尽管文章没有谈到企业。你知道我该如何解决这个问题(也许就像分析这个词的邻域......)?

4

0 回答 0