通过使用python 的报纸模块,我可以通过以下方式从文章中获取顶部图像:
from newspaper import Article
first_article = Article(url="http://www.lemonde.fr/...", language='fr')
first_article.download()
first_article.parse()
print(first_article.top_image)
但我需要获取文章中的所有图像。他们的 github 文档说:“从 html 中提取所有图像”是可能的。但我无法弄清楚这一点。而且我不想手动下载html文件并将其保存在硬盘驱动器中,然后将文件提供给模块并获取图像。
我可以通过什么方式实现这一目标?