4

我想synonym在 Elasticsearch 中使用 tokenfilter 作为索引。我下载了WordNet 3.0的Prolog版本,找到了wn_s.plElasticsearch能看懂的文件。但是,该文件似乎包含各种单词和短语的同义词,而我真的只对支持名词的同义词感兴趣。有没有办法提取这些类型的条目?

4

1 回答 1

9

鉴于格式wn_s.pl

s(112947045,1,'usance',n,1,0).
s(200001742,1,'breathe',v,1,25).

一种非常原始的方法是在您的终端中执行以下操作,以仅从该文件中获取具有“,n,”字符串的行。

grep ",n," wn_s.pl > wn_s_nouns_only.pl

该文件wn_s_nouns_only.pl将仅包含标记为名词的条目。

于 2013-07-31T15:47:14.790 回答