问题标签 [pywikibot]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
mysql - 将 MediaWiki 内容合并在一起
目前我有两个 MediaWiki,一个比另一个版本稍旧。我想将两者的内容合并在一起,而不消除重复的页面。到目前为止,我能想到的最佳选择是使用机器人(如 pywikipedia)浏览一个 wiki 的所有页面,并尝试将它们插入另一个 wiki,重命名重复的页面。
不过,这个解决方案似乎需要一段时间才能完成。有没有更愉快的方式来做到这一点,我只是不知道?我没有直接使用 MediaWiki 数据库,所以我不太愿意在不知道自己在做什么的情况下搞乱它。
python - pywikipedia 名称 wikiquote 未定义?
我正在为 Wikipedia 编写一个机器人,但有一个问题。当我想从另一个 Wikimedia 站点获取内容时,我收到错误 - 错误名称 'wikiquote' 未定义。
这是我像这样开始代码的时候-
然而,如果我从编写维基百科而不是维基语录开始,它会起作用。据我所知,它应该可以在其他 Mediawiki 网站上使用?
帮助感激不尽!
谢谢!
python - pywikipedia 登录?
由于各种原因,我无法使用 login.py 登录,所以我想知道是否有人知道代码,以便我可以使用我的脚本登录维基百科,而无需运行单独的脚本?干杯!
python - 虚拟主机上的 python 脚本问题
我已经为 Wikipedia 编写了一个脚本,它在我的计算机上运行良好,但是当我将它上传到我的网络主机(Dreamhost)时它不起作用并说我尝试登录的用户被阻止 - 这不是是的,它可以在我的电脑上运行并且我没有被阻止。这是我得到的确切错误消息-
关于为什么它不起作用的任何想法?
谢谢,非常感谢!
python - 我可以使用 pywikipedia 来获取页面的文本吗?
是否有可能,使用 pywikipedia,只获取页面的文本,没有任何内部链接或模板,也没有图片等?
python - 带有 https 和 http 身份验证的 pywikipedia 机器人
我无法让我的机器人登录到 Intranet 上的 MediaWiki 安装。我相信这是由于 http 身份验证保护了 wiki。
事实:
- wiki 根目录是:https ://local.example.com/mywiki/
- 使用 Web 浏览器访问 wiki 时,会弹出一个要求提供企业凭据的弹出窗口(我假设这是基本访问身份验证)
这就是我的 user-config.py 中的内容:
这就是我在 mywiki_family.py 中的内容:
当我执行 login.py -v -v 时,我得到这个:
(我不确定为什么它有 'local.example.com/w' 而不是 '/mywiki'。)
我认为它可能正在尝试对 example.com 而不是 example.com/wiki 进行身份验证,因此我将身份验证行更改为:
但后来我从 IIS 收到 HTTP 401.2 错误:
您无权使用您提供的凭据查看此目录或页面,因为您的 Web 浏览器正在发送 Web 服务器未配置为接受的 WWW-Authenticate 标头字段。
任何有关如何使这项工作的帮助将不胜感激。
更新修复我的家庭档案后,它现在说:
获取站点 mywiki:en 的信息('http 错误'、401、'未授权'、)警告:无法打开' https://local.example.com/mywiki/index.php?title=Non-existing_page&action=edit&useskin=单书'. 也许服务器或您的连接已关闭。1 分钟后重试...
我查看了计划 urllib2.ulropen 调用中的 HTTP 标头,它使用的是 WWW-Authenticate: Negotiate WWW-Authenticate: NTLM。我猜是 urllib2,因此 pywikipedia 不支持这个?
更新添加了一个美味的赏金以帮助使其正常工作。我可以使用 python-ntlm 进行身份验证。如何将其集成到 pywikipedia 中?
python - pywikipedia login.py socket.error: (10060, '操作超时')
我对python完全陌生,所以如果我做的事情明显错误,希望有人能提供帮助。我正在尝试在语义媒体维基网站 vocabularies.referata.com 上创建和运行一个简单的 pywikipedia 机器人。我下载了 pywikipedia 发行版并创建了一个家庭文件:
我创建了一个用户 wikibot 并运行:
根据以下说明:
当我尝试运行时:
我收到以下错误:
他们是我需要检查或做错了什么愚蠢/明显的事情吗?我在防火墙后面,这会是问题吗?(如果是这样,我需要采取哪些步骤来修复它)。
感谢您的帮助斯图尔特
image - 如何在不注册 Bot 帐户的情况下以编程方式从 Wikimedia Commons 下载图像?
似乎获得 Bot 帐户批准的唯一方法是添加或编辑已经在 Wikimedia 上的信息。如果您尝试在没有机器人帐户的情况下使用某些 api 库下载任何图像,您会收到错误消息而不是图像。似乎他们阻止了任何不从浏览器进入的人?其他人有这方面的经验吗?我在这里错过了什么吗?
python - Python-维基百科自动下载器
[使用 Python 3.1] 有谁知道如何让 Python 3 应用程序允许用户编写包含多个单词的文本文件,并用逗号分隔。该程序应读取该文件,并下载所请求项目的维基百科页面。例如,如果他们输入 hello,python-3,chicken 它会转到 Wikipedia 并下载http://www.wikipedia.com/wiki/hello、http://www.wikip ... 有人认为他们可以这样做吗?
当我说“下载”时,我的意思是下载文本,与图像无关。
python - 使用 pywikipedia 登录和访问 wikipedia API
我是 python 新手。我有访问维基百科的任务。为此,我使用客户端pywikipedia来访问 mediawiki api。当我运行 login.py 时,它会询问我密码。我将如何获得密码?有人研究过 pywikipedia 工具吗?我可以使用哪个客户端的任何建议?