0

我正在寻找一种检测 POS(如 POS 标记器)并将同义词返回给用户的 API。

谢谢

4

1 回答 1

1

那是一个真正的脑筋急转弯。

如果您先提取所有同义词,然后再提取每个同义词怎么办:

  1. 重新创建有问题的短语
  2. 查询谷歌以查看该确切短语已使用了多少次
  3. 使用您找到的结果数量来排除无意义的结果。

因此,在您的示例中,您将提取字段的所有同义词,并将“字段”一词替换为这些同义词。

当你到达“领域”时,当你搜索“计算机科学领域”时,谷歌会给你大约 400,000 个结果。这将是一个很好的打击,值得保留。

当您到达“圆形剧场”时,当您搜索“计算机科学圆形剧场”时,谷歌只会给您 1 个结果。那将是一个糟糕的打击,从可用同义词列表中删除“圆形剧场”。

这需要一些工作,并且不会在所有情况下都有用,但这可能是一个不错的开始。

于 2013-08-09T02:23:39.200 回答