问题标签 [pywikibot]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
4116 浏览

mysql - 将 MediaWiki 内容合并在一起

目前我有两个 MediaWiki,一个比另一个版本稍旧。我想将两者的内容合并在一起,而不消除重复的页面。到目前为止,我能想到的最佳选择是使用机器人(如 pywikipedia)浏览一个 wiki 的所有页面,并尝试将它们插入另一个 wiki,重命名重复的页面。

不过,这个解决方案似乎需要一段时间才能完成。有没有更愉快的方式来做到这一点,我只是不知道?我没有直接使用 MediaWiki 数据库,所以我不太愿意在不知道自己在做什么的情况下搞乱它。

0 投票
2 回答
207 浏览

python - pywikipedia 名称 wikiquote 未定义?

我正在为 Wikipedia 编写一个机器人,但有一个问题。当我想从另一个 Wikimedia 站点获取内容时,我收到错误 - 错误名称 'wikiquote' 未定义。

这是我像这样开始代码的时候-

然而,如果我从编写维基百科而不是维基语录开始,它会起作用。据我所知,它应该可以在其他 Mediawiki 网站上使用?

帮助感激不尽!

谢谢!

0 投票
2 回答
205 浏览

python - pywikipedia 登录?

由于各种原因,我无法使用 login.py 登录,所以我想知道是否有人知道代码,以便我可以使用我的脚本登录维基百科,而无需运行单独的脚本?干杯!

0 投票
2 回答
450 浏览

python - 虚拟主机上的 python 脚本问题

我已经为 Wikipedia 编写了一个脚本,它在我的计算机上运行良好,但是当我将它上传到我的网络主机(Dreamhost)时它不起作用并说我尝试登录的用户被阻止 - 这不是是的,它可以在我的电脑上运行并且我没有被阻止。这是我得到的确切错误消息-

关于为什么它不起作用的任何想法?

谢谢,非常感谢!

0 投票
4 回答
981 浏览

python - 我可以使用 pywikipedia 来获取页面的文本吗?

是否有可能,使用 pywikipedia,只获取页面的文本,没有任何内部链接或模板,也没有图片等?

0 投票
2 回答
1600 浏览

python - 带有 https 和 http 身份验证的 pywikipedia 机器人

我无法让我的机器人登录到 Intranet 上的 MediaWiki 安装。我相信这是由于 http 身份验证保护了 wiki。

事实:

  1. wiki 根目录是:https ://local.example.com/mywiki/
  2. 使用 Web 浏览器访问 wiki 时,会弹出一个要求提供企业凭据的弹出窗口(我假设这是基本访问身份验证)

这就是我的 user-config.py 中的内容:

这就是我在 mywiki_family.py 中的内容:

当我执行 login.py -v -v 时,我得到这个:

(我不确定为什么它有 'local.example.com/w' 而不是 '/mywiki'。)

我认为它可能正在尝试对 example.com 而不是 example.com/wiki 进行身份验证,因此我将身份验证行更改为:

但后来我从 IIS 收到 HTTP 401.2 错误:

您无权使用您提供的凭据查看此目录或页面,因为您的 Web 浏览器正在发送 Web 服务器未配置为接受的 WWW-Authenticate 标头字段。

任何有关如何使这项工作的帮助将不胜感激。

更新修复我的家庭档案后,它现在说:

获取站点 mywiki:en 的信息('http 错误'、401、'未授权'、)警告:无法打开' https://local.example.com/mywiki/index.php?title=Non-existing_page&action=edit&useskin=单书'. 也许服务器或您的连接已关闭。1 分钟后重试...

我查看了计划 urllib2.ulropen 调用中的 HTTP 标头,它使用的是 WWW-Authenticate: Negotiate WWW-Authenticate: NTLM。我猜是 urllib2,因此 pywikipedia 不支持这个?

更新添加了一个美味的赏金以帮助使其正常工作。我可以使用 python-ntlm 进行身份验证。如何将其集成到 pywikipedia 中?

0 投票
2 回答
1400 浏览

python - pywikipedia login.py socket.error: (10060, '操作超时')

我对python完全陌生,所以如果我做的事情明显错误,希望有人能提供帮助。我正在尝试在语义媒体维基网站 vocabularies.referata.com 上创建和运行一个简单的 pywikipedia 机器人。我下载了 pywikipedia 发行版并创建了一个家庭文件:

我创建了一个用户 wikibot 并运行:

根据以下说明:

当我尝试运行时:

我收到以下错误:

他们是我需要检查或做错了什么愚蠢/明显的事情吗?我在防火墙后面,这会是问题吗?(如果是这样,我需要采取哪些步骤来修复它)。

感谢您的帮助斯图尔特

0 投票
5 回答
11825 浏览

image - 如何在不注册 Bot 帐户的情况下以编程方式从 Wikimedia Commons 下载图像?

似乎获得 Bot 帐户批准的唯一方法是添加或编辑已经在 Wikimedia 上的信息。如果您尝试在没有机器人帐户的情况下使用某些 api 库下载任何图像,您会收到错误消息而不是图像。似乎他们阻止了任何不从浏览器进入的人?其他人有这方面的经验吗?我在这里错过了什么吗?

0 投票
3 回答
655 浏览

python - Python-维基百科自动下载器

[使用 Python 3.1] 有谁知道如何让 Python 3 应用程序允许用户编写包含多个单词的文本文件,并用逗号分隔。该程序应读取该文件,并下载所请求项目的维基百科页面。例如,如果他们输入 hello,p​​ython-3,chicken 它会转到 Wikipedia 并下载http://www.wikipedia.com/wiki/hellohttp://www.wikip ... 有人认为他们可以这样做吗?

当我说“下载”时,我的意思是下载文本,与图像无关。

0 投票
1 回答
806 浏览

python - 使用 pywikipedia 登录和访问 wikipedia API

我是 python 新手。我有访问维基百科的任务。为此,我使用客户端pywikipedia来访问 mediawiki api。当我运行 login.py 时,它会询问我密码。我将如何获得密码?有人研究过 pywikipedia 工具吗?我可以使用哪个客户端的任何建议?