我想从使用书签服务 Delicious 转移到 Diigo,但 diigo 在其 RSS 中组织标签的方式阻止了转移。
我想使用 Yahoo Pipe 将 Diigo rss 标签转换为与 Delicious rss 标签相同的格式
Diigo 标签存储为“描述”项底部的 html 列表,如下所示:
Some test describing the link.
<p class="diigo-tags"><strong>Tags:</strong>
<a rel="nofollow" target="_blank" href='https://www.diigo.com/user/username/firsttag'>firsttag</a>
<a rel="nofollow" target="_blank" href='https://www.diigo.com/user/username/2ndtag'>2ndtag</a>
<a rel="nofollow" target="_blank" href='https://www.diigo.com/user/username/anothertag'>anothertag</a>
etc... </p>
我需要提取其中的每一个并将它们存储在自己的项目中。Delicious 按数字将每个标签存储在嵌套字段类别中,如下所示:
category
0
domain http://delicious.com/username/
content firsttag
1
domain http://delicious.com/username/
content 2ndtag
因此,Yahoo Pipe 需要剥离 html 列表并将每个标签分成单个类别字段。
不知道从哪里开始,除了正则表达式中的这个正则表达式来剥离 html:
(?si)<a[^<>]*?[^<>]*>(.*?)</a>
任何建议表示赞赏。