我已经编写了一个基于“学习”技术的scrubyt 提取器——也就是说,指定页面上的当前文本并让它自己计算出XPath 表达式。但是,我现在想导出提取器,以便即使页面发生更改也可以使用它。
现在,scrubyt 的文档似乎到处都是,但据我所知,我应该能够放置这条线extractor.export(__FILE__)
并且它应该可以工作。它没有 - 我只是收到一个错误,说导出的参数数量错误,它应该有 0。我已经尝试过没有任何参数,但它仍然失败。
我会在scrubyt 论坛上问,但似乎很久没有人在那里了!
任何想法在这里做什么?