我正在寻找一种检测 POS(如 POS 标记器)并将同义词返回给用户的 API。
谢谢
那是一个真正的脑筋急转弯。
如果您先提取所有同义词,然后再提取每个同义词怎么办:
因此,在您的示例中,您将提取字段的所有同义词,并将“字段”一词替换为这些同义词。
当你到达“领域”时,当你搜索“计算机科学领域”时,谷歌会给你大约 400,000 个结果。这将是一个很好的打击,值得保留。
当您到达“圆形剧场”时,当您搜索“计算机科学圆形剧场”时,谷歌只会给您 1 个结果。那将是一个糟糕的打击,从可用同义词列表中删除“圆形剧场”。
这需要一些工作,并且不会在所有情况下都有用,但这可能是一个不错的开始。