问题标签 [pywikibot]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
7904 浏览

python - 维基百科信息框的内容

我需要获取任何电影信息框的内容。我知道电影的名字。一种方法是获取维基百科页面的完整内容,然后对其进行解析,直到找到{{Infobox并获取信息框的内容。

有没有其他方法可以使用一些 API 或解析器?

我正在使用 Python 和 pywikipediabot API。

我也熟悉 wikitools API。因此,如果有人有与 wikitools API 相关的解决方案,请不要提及 pywikipedia,也请提及这一点。

0 投票
2 回答
2899 浏览

python - 导入使用原始文件,但不在 IDLE 中

更新 10 秒后
现在正确修复,感谢 JF 和 Gauden。

更新
我通过将空闲文件保存在另一个工作文件所在的目录中找到了一个临时修复。(如果可以的话,我仍然想知道如何完全修复它。)

这不是永久修复,因此,如果您想尝试帮助使其在保存文件的任何地方都能正常工作,请随意。

这是一个 python 文件的开始:

(您可能已经注意到这是一个 pywikipedia 脚本,但我认为这无关紧要)

该文件从命令行运行良好。

但是,当我尝试使用 IDLE 开发脚本,或者只使用 IDLE 解释器时,我得到一个错误:

我真的不知道为什么它不起作用。

我也试过这个:

错误日志中给出的路径是 wikipedia.py 文件的正确路径,.之前就是wikipedia.py.

然后我尝试将路径添加到sys.path,但这也不起作用:

模块路径: `c:\users\joe_bloggs\py\wikipedia.pyc

Python 可执行文件:命令行: C:\Python27\python.exe, IDLE:C:\Python27\pythonw.exe

PYTHONPATH两者都抛出:

操作系统: Windows 7

Python版本: 2.7.2

一个新的 PATH:IDLE 和命令行:

0 投票
1 回答
162 浏览

python - Pywikipedia 如何在命令行上管理颜色?

正如我所阅读的所有内容所说,我一直认为命令行上没有可能的格式。

然而,我最近发现 pywikipedia(一个用于自动编辑维基百科风格的 wiki 的 python bot 框架)可以cmd.exe以不同的颜色将文本输出到命令行(普通窗口)!

这是python语法:

您必须使用wikipedia.output()(或pywikibot.output()) 但不仅仅是print.

在线 pywikipedia 存储库(大约 7990 行)给出了一个简短的解释:

我认为这可能与这条线有关:

但我找不到任何对ui类的引用。

那么 Pywikipedia 是如何管理它的呢?

0 投票
2 回答
253 浏览

automation - 在 mediaWiki 中手动创建分层类别的自动化替代方案?

我想启动一个基于 mediaWiki 的站点,但不是手动添加类别和子类别,而是想以自动方式添加它们,我提供类似 xml 文件的内容,并且 bot/script/algorithm/... 遍历列表并自动创建类别和子类别及其页面。目前还没有页面,但我想从一组干净的类别开始,帮助用户对页面进行排序。

我找到了pywikipediabot,但我不知道如何将它用于我的目的 - 它似乎只适用于现有页面的类别。你会使用 pywikipediabot 来创建新类别的层次结构吗?如果是的话怎么做?xml文件可以用作模板吗?

0 投票
1 回答
415 浏览

python - 在 python 正则表达式中查找特殊字符时匹配任何内容

我想使用一个匹配任何东西的正则表达式,但是当它发现一个特殊字符时停止匹配。] 我想使用这个模式\*\s*\[\[.*,当变成这个时:]]它停止匹配。

例如它应该匹配* [[anything here]]or* [[]]并且它不应该匹配 the * [[anythng here]] anything ]]or 不应该匹配 the* [[]]]]

我想在 Python 中将这个正则表达式用于 Wikipedia 机器人。

0 投票
1 回答
316 浏览

mediawiki - Pywikibot 错误“警告:在 Example:de 上找不到令牌。您将无法编辑任何页面”

我试图安装 Pywikibot。到目前为止一切顺利,机器人能够登录,显然是 access api.php,但是当我想运行一个脚本时它说:

警告:在 Example:de 上找不到令牌。您将无法编辑任何页面

我试图在网上搜索,但要么我看起来不够好,要么就是没有人遇到我的问题。

0 投票
1 回答
27 浏览

mediawiki - 较低的 MediaWiki 页面修订 ID 是否总是意味着较早的编辑?

一般来说,至少对于单个页面来说,Mediawiki 页面历史的较低修订 ID 意味着更早的编辑时间似乎是正确的。这是真的吗?有没有例外?修订 ID 铸造如何工作?

我正在尝试尝试使用 Pywikipedia 编写一个函数,它将页面文本作为任意时间戳。根据修订 ID 进行排序会更加优化,而不是制作修订 ID 时间戳的字典,然后对时间戳进行排序。

0 投票
1 回答
81 浏览

web-scraping - 使用 MediaWiki API 检索维基百科页面上的 # 个贡献者,“不检索姓名和其他信息”

我正在使用 MediaWiki API,试图在维基百科页面上同时检索已知和匿名贡献者的数量,但我发现的唯一属性是“贡献者”,它返回有关贡献者的所有数据,所以它真的很慢。

我想知道我和维基百科是否有任何有效的方法来检索数字而不检索名称和其他数据,或者我们应该将此问题添加到: https://bugzilla.wikimedia.org/show_bug.cgi?编号=17993

还有一个问题:你认为如果我使用维基百科数据库转储会更快吗?

0 投票
1 回答
89 浏览

python - Pywikipedia unicode 错误

当使用 pywikipedia 在我的 wiki 上上传图像时,无论图像是什么,我都会收到以下错误:

我的环境信息:

它表明unicde设置正确。

整个错误是:

最后一行显然是一个错误,因为我可以登录...

一周以来我一直在努力解决这个错误的任何帮助将不胜感激......

0 投票
1 回答
342 浏览

python - 为什么 pywikibot 给在输出?

我在linux中使用PywikiBot核心版本来创建一个程序来简单地获取维基百科页面的类别。我的代码是:

我希望得到类别,但我得到:

我遵循本教程,但我应该说 pywikibot 中的文档写得不好,您应该打开文件以查找一些信息,我发现了def 类别

而且我不喜欢更改框架代码。