我有一个过滤 RSS 提要并删除包含我选择的“停用词”的任何项目的管道。目前我已经在管道编辑器中为每个停用词手动创建了一个过滤器,但更合乎逻辑的方法是从文件中读取它们。我已经弄清楚如何从文本文件中读取停用词,但是如何将过滤器运算符应用于提要,每个停用词一次?
文档明确指出不能在循环构造中应用运算符,但希望我在这里遗漏了一些东西。
我有一个过滤 RSS 提要并删除包含我选择的“停用词”的任何项目的管道。目前我已经在管道编辑器中为每个停用词手动创建了一个过滤器,但更合乎逻辑的方法是从文件中读取它们。我已经弄清楚如何从文本文件中读取停用词,但是如何将过滤器运算符应用于提要,每个停用词一次?
文档明确指出不能在循环构造中应用运算符,但希望我在这里遗漏了一些东西。
您没有遗漏任何东西 - 过滤器运算符不能循环。
您最好的选择可能是从停用词中生成一个正则表达式并使用它进行过滤。例如生成一个字符串,如(word1|word2|word3|...|wordN)
.
您可能必须转义任何奇怪的字符。另外我不确定一个正则表达式可以有多长,所以你可能不得不将它分成多个过滤规则。
除了 Gavin Brock 的回答之外,以下 Yahoo Pipes 根据多个停用词过滤提要项目(标题、描述、链接和作者):
输入