mediawiki - 如何以浏览器身份登录 MediaWiki 站点？

Question

我试图通过访问编辑页面从旧的 MediaWiki 站点中获取内容。为此，我需要登录。这应该意味着我将能够在 textarea 字段中没有任何 html 的情况下获取内容和标记。

该网站似乎没有启用 api，而且它似乎是一个相当旧的版本，至少自 2010 年以来没有升级。

wikidb_mw__session当我尝试进行 POST 登录时发送了一个cookie

/w/index.php?title=Special:Userlogin&action=submitlogin&type=login

使用wpName=usrname&wpPassword=userpass&wpLoginattempt=Log+in

但是当我提供此 cookie 并尝试使用 POST 再次登录时，返回的内容显示我提供的用户名不正确。

如果我改为使用浏览器登录，我会收到根据实时标题发回的wikidb_mw_UserID、wikidb_mw_UserName和cookie。wikidb_mw_Token

只是想知道除了会话 cookie 之外还有什么可以让我登录。

score 1 · Accepted Answer

使用编辑页面导出内容不是一个好主意。您可以使用Special:Export来获取 XML。

例如，要从 Wikipedia 导出有关 StackOverflow 的文章，请替换它的 URL

http://en.wikipedia.org/wiki/Stack_Overflow

和

http://en.wikipedia.org/wiki/ Special:Export /Stack_Overflow

1 回答 1