-1

我试图通过访问编辑页面从旧的 MediaWiki 站点中获取内容。为此,我需要登录。这应该意味着我将能够在 textarea 字段中没有任何 html 的情况下获取内容和标记。

该网站似乎没有启用 api,而且它似乎是一个相当旧的版本,至少自 2010 年以来没有升级。

wikidb_mw__session当我尝试进行 POST 登录时发送了一个cookie

/w/index.php?title=Special:Userlogin&action=submitlogin&type=login

使用wpName=usrname&wpPassword=userpass&wpLoginattempt=Log+in

但是当我提供此 cookie 并尝试使用 POST 再次登录时,返回的内容显示我提供的用户名不正确。

如果我改为使用浏览器登录,我会收到根据实时标题发回的wikidb_mw_UserIDwikidb_mw_UserName和cookie。wikidb_mw_Token

只是想知道除了会话 cookie 之外还有什么可以让我登录。

4

1 回答 1

1

使用编辑页面导出内容不是一个好主意。您可以使用Special:Export来获取 XML。

例如,要从 Wikipedia 导出有关 StackOverflow 的文章,请替换它的 URL

http://en.wikipedia.org/wiki/Stack_Overflow

http://en.wikipedia.org/wiki/ Special:Export /Stack_Overflow

于 2013-06-03T09:51:11.003 回答