我正在使用 Yahoo Pipes 构建一个抓取工具,它可以通过 xPath 抓取我们公司的微型站点,并生成一个 RSS 提要,然后我可以将其嵌入到主站点中。
到目前为止,我已经从页面上抓取了职位名称和位置,但我无法将这些项目链接到微型网站。
到目前为止,这是我的管道: http://pipes.yahoo.com/pipes/pipe.info?_id= 2bb5b8fedd0064b64d0e8861e3fc8fd5
我想我需要从每个节点中提取 href 链接,然后应用正则表达式,但我真的无法理解它。
该链接在代码中如下所示: www2.jobs.badenochandclark.ch/JavaScript:OpenAssignment('a960c93a-11fe-4751-bc27-83a48429c3ba',%20'/Jobs/Details/a960c93a-11fe-4751-bc27-83a48429c3ba ');
但我正在努力生成一个基本上可以做到这一点的正则表达式: www2.jobs.badenochandclark.ch/ JavaScript:OpenAssignment('a960c93a-11fe-4751-bc27-83a48429c3ba',%20' /Jobs/Details/a960c93a-11fe -4751-bc27-83a48429c3ba ');
所以我坚持如何提取链接,然后如何将其构建到管道上。任何朝着正确方向的帮助或推动将不胜感激。