问题标签 [pywikibot]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
246 浏览

mediawiki - 如何获得维基百科用户的所有贡献?

给定 Wikipedia 用户/编辑者 ID 和时间范围,Python 中有没有办法获取有关用户/编辑者所做的所有贡献/编辑的详细信息?我想获取详细信息,例如页面编辑、采取的操作、在修订时添加/删除的字节以及评论(如果有)。这可能吗?

非常感谢!

0 投票
1 回答
54 浏览

wikipedia - 如何获取包含我需要的所有信息的 wikipedia xml 页面?

我将 enwiki-20110115-abstract.xml 作为图像 1 中的以下内容: 在此处输入图像描述

我也有 enwiki-20110115-pages-articles.xml 如下图 2: 在此处输入图像描述

我需要的是同一个维基百科页面的第一个文件(enwiki-20110115-abstract.xml)中的所有信息标签和第二个文件(enwiki-20110115-pages-articles.xml)中的重定向信息。请问有没有具有此信息的维基百科版本,或者我可以做些什么来获取这些数据?我考虑过加入两个文件,但计算起来会非常昂贵。!!!

0 投票
2 回答
134 浏览

python - 如何导入 pywikibot?

我已经安装了 pywikibot 并按照说明中的说明设置了配置。但是,当我将“importpywikibot”放在脚本顶部时,它会显示“没有名为 pywikibot 的模块”。我必须在特别的地方安装 pywikibot 吗?

谢谢。

0 投票
0 回答
59 浏览

git - 有没有办法将markdown文件的git历史移植到mediawiki,或者只是将markdown文件的文件结构移植到mediawiki?

有没有办法将markdown文件的git历史移植到mediawiki,或者只是将markdown文件的文件结构移植到mediawiki?

我有一个项目,我一直在使用 git 和 markdown 进行记录。该项目已经变得足够复杂,需要媒体 wiki 迁移。我更愿意将 git 历史移植到 mediawiki,并且想知道这是否以前做过。在研究这个问题时,我发现了从 mediawiki 到 git 的门户,但没有将 git 导入到 mediawiki 的能力。该项目有数百个用 Markdown 编写的文件。有没有办法将带有 markdown 文件的 git 历史记录移植到 mediawiki?如果以前没有这样做过,是否有现成的工具可以将 markdown 文件的文件结构移植到 mediawiki?

否则我的计划是使用 pandoc 和 pywikibot 编写我自己的 python 代码

0 投票
0 回答
15 浏览

python-3.x - Python:搜索正则表达式和通过正则表达式替换的差异

我正在编写一个小脚本,用于使用pywikibot自动更正跨维基翻译链接。我寻找现有的链接,并希望以标准格式重写它们,并带有指向所有页面的链接。

我正在寻找的文字看起来有点像

或多行有点像

我设法通过以下方式在 wiki 页面源中找到这两个实例

这让我成为了模板的核心(对于第一种情况)

并且类似于第二个的多行字符串。

但是,我现在在替换命令中使用相同的 reg_strg,它无法进行任何替换,文本保持不变,new_strg 是根据读取的内容创建的,以构成替换字符串。但结果与 new_strg 是多行字符串还是简单的“flobberigoo”无关

所以很明显 re.search 和 re.sub 之间存在一些区别 - 但是我在文档中找不到这一点(即使我知道 re.search 和 re.match 之间的区别,我也理解它,即 re. sub 的行为应该像第一个)。

我想念什么?如何用字符串替换我在页面中找到的提到的正则表达式?

为了完整起见,这是包括调试打印在内的完整功能:

0 投票
1 回答
269 浏览

python - Wikipedia api python 返回奇怪的结果

为什么此代码会返回带有“tom tom”的消歧错误,而不仅仅是条目“tomato”的摘要/消歧错误?搜索词显然不是汤姆汤姆或者我在这里遗漏了什么?为什么这不起作用?

0 投票
1 回答
44 浏览

python-3.x - python3:如何删除 Mediawiki 模板的两个参数之间的数据

以下是来自 Wikisource 页面的数据;-

我想删除两个参数之间的一些特定数据,即从|Remarks=|Width=开始。我尝试了以下代码,但它删除了参数“|Remarks=”之后的所有数据,而不是我上面提到的。如何仅删除上述参数之间的数据?

我的测试代码;-

0 投票
3 回答
314 浏览

web-scraping - 使用 pywikibot 的维基百科修订历史

我想一次收集所有的修订历史数据。Pywikibot page.revisions() 没有获取更改的字节数的参数。它为我提供了我需要的所有数据,除了更改的字节数。

如何更改字节数?

例如:对于文章主页,修订历史在这里历史截图

我当前的代码:

仅显示 1 个输出:

我需要更改的字节数,在修订历史链接中显示为 {+1, -1, +1, -2},也可以在上面的历史截图中看到。

0 投票
1 回答
76 浏览

mediawiki - 如何从 mediawiki API 获取特定人的所有报价列表?

我正在尝试从 mediawiki api 中获取所有 Kurt Cobain 名言的列表。我有:

https://en.wikiquote.org/w/api.php?format=json&action=query&srsearch=Kurt+Cobain&list=search

但是,它似乎没有给我任何他的引文,如此处所示……它也没有提供一种能够轻松解析的良好格式。

如何使用 API 获取他所有报价的列表?如果可能的话,还想包括来源 - 例如From an interview on MTV with Zeca Camargo, 1993-01-21, Rio de Janeiro, Brazil

更喜欢直接使用 API,但使用 pywikibot 的答案也很好。

0 投票
2 回答
476 浏览

python - 没有 user_config.py

我们有一个内部 wiki,我想使用 pywikibot 从中获取一些数据。从 pip 安装它,但是当我导入它时,我得到:

看这里https://www.mediawiki.org/wiki/Manual:Pywikibot/Installation#Configure_Pywikibot

我看到对 pwb.py 的引用,但 /usr/local/lib/python3.7/site-packages/pywikibot 中不存在该引用。

我在这里想念什么?

谢谢!