0

我目前正在使用以下代码来获取维基百科的页面内容。

import pywikibot as pw

page = pw.Page(pw.Site('en'), 'Forensic science')
page.text

但是,上面的代码似乎没有返回Talk pages维基百科的内容。例如,

import pywikibot as pw
page = pw.Page(pw.Site('en'), 'Talk:Forensics science')
page.text

更准确地说,我想获取此页面的内容:https ://en.wikipedia.org/w/index.php?title=Talk:Forensic_science&action=edit

如果需要,我很乐意提供更多详细信息。:)

4

1 回答 1

2

您在讨论页标题中有错字。'Talk:Forensics science'应该是'Talk:Forensic science'(没有s结尾的Forensic)。除此之外,它应该可以按您的预期工作。

如果您想在页面不存在时获得显式错误,请尝试以下Page.get方法:

import pywikibot as pw
page = pw.Page(pw.Site('en', 'wikipedia'), 'Talk:Forensics science')
text = page.get()

这将引发:

[...]
"...site.py", line 4166, in loadrevisions
    raise NoPage(page)
pywikibot.exceptions.NoPage: Page [[wikipedia:en:Talk:Forensics science]] doesn't exist.
CRITICAL: Exiting due to uncaught exception <class 'pywikibot.exceptions.NoPage'>
于 2019-02-05T04:39:51.873 回答