1

我已经意识到如果 url 中包含特殊字符(如德语),HTTrack 无法下载文件ß- 它返回 404 响应。

错误看起来像屏幕截图:

图片

HTTrack 中是否有任何设置使其能够处理此类字符?

ps:我找到了一个类似的帖子,但没有答案:

遇到日语编码的 URL 时 Httrack 出错

4

1 回答 1

1

HTTrack 似乎能够从带有特殊字符的 url 中无错误地获取文件,前提是您不运行“真正的”域爬网,但是:

  • 首先创建一个 url 列表,
  • 另存为iso-8859-1,
  • 而不是让 HTTrack 爬取这个列表

如果 HTTrack 将自行探索 url,它将在带有特殊字符的 url 上遇到 404 错误——至少我无法让它们无错误。也许有人会提供一个神奇的设置;)

于 2017-08-04T15:46:54.843 回答