我想知道是否有一种快速的方法来对 LinkParseFilter 配置进行单元测试。
例如,如果我有一个带有 LinkParseFilter 的 parsefilter 文件,如下所示:
...
{
"class": "com.digitalpebble.stormcrawler.parse.filter.LinkParseFilter",
"name": "MyGalleryParseFilter",
"params": {
"thumbnails": "substring-before(substring-after(//a[@class='thumbnail']/span/@style, 'background-image: url('), ')')",
"gallery": "//div[@class='browse']//a/@href",
"interesting": "//ul[@class='also-interesting']//a/@href",
"original": "//div[@id='original-image-frame']//a/img/@src"
}
},
...
使用一些示例页面内容对其进行单元测试以检查它是否提取了我想要的内容的最快方法是什么?