我正在使用 Heritrix 3.1.0 爬行。我正在尝试使用 MirrorWriterProcessor 保存文件。但是,此选项在 crawler-beans.cxml 中不可用。
我所做的是将“warcWriter”“org.archive.modules.writer.WARCWriterProcessor”替换为“org.archive.modules.writer.MirrorWriterProcessor”
但是,此处理器将镜像内容写入 $HERITRIX_HOME/mirror
我将“路径”配置为“${launchId}/mirror”,希望Heritrix将镜像目录写入job目录下。
我应该怎么做才能将 MirrorWriterProcessor 的路径更改为作业目录下?