0

文档说,默认情况下,报纸会缓存所有以前提取的文章并删除它已经提取的任何文章。

>>> cbs_paper = newspaper.build('http://cbs.com')
>>> cbs_paper.size()
1030

>>> cbs_paper = newspaper.build('http://cbs.com')
>>> cbs_paper.size()
2

好的,但是如果我建立一个网站,它什么也没说,我如何检索兑现的文章?

4

1 回答 1

1

报纸 3k 使用 memoize 缓存源的文章

将 memoize 设置为 false 将停止缓存机制

cbs_paper = newspaper.build('http://cbs.com', memoize_articles=False)

但是,如果您仍然想要缓存并想要访问缓存的文章,您可以在临时文件夹中找到 .newspaper_scraper 目录(Windows 机器中的路径)

C:\Users\your_user\AppData\Local\Temp\.newspaper_scraper\memoized
于 2020-09-10T07:08:20.243 回答