python-newspaper - Newspaper3k：如何检索已兑现的文章？

Question

该文档说，默认情况下，报纸会缓存所有以前提取的文章并删除它已经提取的任何文章。

>>> cbs_paper = newspaper.build('http://cbs.com')
>>> cbs_paper.size()
1030

>>> cbs_paper = newspaper.build('http://cbs.com')
>>> cbs_paper.size()
2

好的，但是如果我建立一个网站，它什么也没说，我如何检索兑现的文章？

score 1 · Accepted Answer

报纸 3k 使用 memoize 缓存源的文章

将 memoize 设置为 false 将停止缓存机制

cbs_paper = newspaper.build('http://cbs.com', memoize_articles=False)

但是，如果您仍然想要缓存并想要访问缓存的文章，您可以在临时文件夹中找到 .newspaper_scraper 目录（Windows 机器中的路径）

C:\Users\your_user\AppData\Local\Temp\.newspaper_scraper\memoized

1 回答 1