我目前正在修改 offline-dokuwiki[1] shell 脚本,以获取应用程序的最新文档,以便自动嵌入到该应用程序的实例中。这工作得很好,除了它当前的形式它抓取每个页面的三个版本:
- 整个页面,包括页眉和页脚
- 只是没有页眉和页脚的内容
- 原始 wiki 语法
我实际上只对 2 感兴趣。这是通过 html<link>
标记从主页链接到的<head>
,如下所示:
<link rel="alternate" type="text/html" title="Plain HTML"
href="/dokuwiki/doku.php?do=export_xhtml&id=documentation:index" />
并且与主 wiki 页面的 url 相同,只是它们在查询字符串中包含“do=export_xhtml”。有没有办法指示 wget 只下载这些版本或自动将 '&do=export_xhtml' 添加到它所遵循的任何链接的末尾?如果是这样,这将是一个很大的帮助。
[1] http://www.dokuwiki.org/tips:offline-dokuwiki.sh(作者:samlt)