1

我目前正在修改 offline-dokuwiki[1] shell 脚本,以获取应用程序的最新文档,以便自动嵌入到该应用程序的实例中。这工作得很好,除了它当前的形式它抓取每个页面的三个版本:

  1. 整个页面,包括页眉和页脚
  2. 只是没有页眉和页脚的内容
  3. 原始 wiki 语法

我实际上只对 2 感兴趣。这是通过 html<link>标记从主页链接到的<head>,如下所示:

<link rel="alternate" type="text/html" title="Plain HTML" 
href="/dokuwiki/doku.php?do=export_xhtml&amp;id=documentation:index" /> 

并且与主 wiki 页面的 url 相同,只是它们在查询字符串中包含“do=export_xhtml”。有没有办法指示 wget 只下载这些版本或自动将 '&do=export_xhtml' 添加到它所遵循的任何链接的末尾?如果是这样,这将是一个很大的帮助。

[1] http://www.dokuwiki.org/tips:offline-dokuwiki.sh(作者:samlt)

4

1 回答 1

2

DokuWiki 也接受 do 参数作为 HTTP 标头。您可以使用参数 --header "X-DokuWiki-Do: export_xhtml" 运行 wget

于 2011-05-28T10:54:53.290 回答