0

我正在研究一个 Integromat 场景,我试图将 RSS 提要聚合到一个将发布到不和谐服务器的提要中。提要有一个“描述”,我必须使用 Integromat 中的“从 HTML 获取元素”文本解析器将其拆分为 HTML 链接。这将返回以下内容:

积分邮报

在此处输入图像描述

看看它如何将描述中的五个链接及其相关文本中的每一个都拉到五个不同的帖子中。我只需要将第二个链接作为整个帖子返回,其他链接都不需要。

或者,使用 RegEx 提取 HTML 的“Fandoms”部分以获得类似的结果。正在解析的 Feed 中的原始 HTML 如下所示:

原始 RSS HTML

在此处输入图像描述

到目前为止,我已经尝试了多个 RegEx,但无法在 Integromat 中实现包含标题、作者和粉丝的单个帖子。在没有帮助的情况下,我根本无法将 Fandom 部分从 Feed 描述中拉出来。

Integromat 支持将无济于事。他们会让我付钱给第三方来解释他们的产品或为我编写场景。这不是商业或营利性。这是一个有趣的不和谐服务器,一个试图说连接的人的社区。而且我们没有很多钱。

我不是程序员。

任何愿意提供帮助的人,我都会感谢您的帮助。

4

1 回答 1

0

我不是一个正则表达式的人,可能有比我想要的更好的解决方案。

您需要的第一件事是设置一个正则表达式模块,该模块将提取<li>带有文本的元素Fandoms

\<li\>[^<]*?(Fandoms).*?\<\/li\>

您可以在此处查看一个工作示例。

之后,您将需要 Integromat 中的模块首先使用给定的正则表达式解析 RSS 提要以提取 HTML 元素。这可以通过使用正则表达式来完成,

(?<result><li\>[^<]*?(Fandoms).*?\<\/li\>.*)

这将把结果分组为resultIntegromat 中的变量,然后可用于进一步处理。

在此处输入图像描述

完成此操作后,您现在可以使用 Text Parse Module 再次提取锚链接以进行进一步处理,

在此处输入图像描述

而且,结果看起来像这样,

在此处输入图像描述

于 2021-09-01T09:48:46.990 回答