我正在尝试创建一个数据集来对新闻文章进行情绪分析。我正在使用 Newspaper3k 从网站上抓取文章。我抓取了一些网站,但没有正确存储文章,因此我无法使用它们。当我再次尝试抓取相同的网站时,它只会抓取新文章,而不是已经抓取的文章。有没有办法让我把已经刮过的文章刮一遍??
问问题
366 次
我正在尝试创建一个数据集来对新闻文章进行情绪分析。我正在使用 Newspaper3k 从网站上抓取文章。我抓取了一些网站,但没有正确存储文章,因此我无法使用它们。当我再次尝试抓取相同的网站时,它只会抓取新文章,而不是已经抓取的文章。有没有办法让我把已经刮过的文章刮一遍??