我想将 grep 与停用词文件一起使用来过滤掉另一个文件中的常见英文单词。文件“somefile”每行包含一个单词。
cat somefile | grep -v -f stopwords
这种方法的问题是:它检查停用词中的单词是否出现在 somefile 中,但我想要相反,即检查 somefile 中的单词是否出现在停用词中。
这该怎么做?
例子
somefile 包含以下内容:
hello
o
orange
停用词包含以下内容:
o
我只想从 somefile 中过滤掉单词“o”,而不是 hello 和 orange。