问题标签 [praw]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1803 浏览

python - 使用 futures.ProcessPoolExecutor 而不是 futures.ThreadPoolExecutor 和 PRAW 包装器时的递归最大错误

我正在使用此代码来抓取 API:

它与线程一起工作得很好/很快,但是当我尝试使用进程时,我得到一个完整的队列并且这个错误:

请注意,最初这些过程对于小型数据检索工作得很好而且非常快,但现在它们根本不起作用。这是一个错误还是发生了什么,PRAW 对象会导致进程出现递归错误,但线程不会出现递归错误?

0 投票
2 回答
3493 浏览

python - Reddit Praw Api 用于搜索提交内容

基本代码:

我希望编写一个代码来获取所有提交及其相关的评论。提交应受搜索查询和时间段的限制。

我面临的问题是:

一个。我不明白如何在上面指定时间段,文档往往很差

湾。我不知道结果是否受到限制。上面的代码产生:

我非常怀疑肯定不止这些。如果是,我怎样才能得到它们。如果请求被限制在一个时间窗口内。是否有一些解决方法可以让您睡觉然后获得更多?

C。我不知道它是否是像 twitter 这样的限制,而不是访问历史数据。尽管时期论点相反。还是不确定。

d.它返回一个生成器。我如何才能访问完整的提交文本和相关评论的文本。

对不起,如果它看起来有点间接,但是在线示例的缺乏和缺乏适当的文档导致面临这些问题。

0 投票
1 回答
74 浏览

python - 抓取网页时从纪元时间转换不正确

错误: 我得到不正确的时间。

我不明白这个问题,我认为我在时区转换中犯了一个错误。但是reddit帖子提到UTC了,因此我没有得到错误。

0 投票
1 回答
1014 浏览

python - Python (2.7.10):关键错误:'id'

我正在尝试按照教程在 Python 中制作 Reddit 和 Twitter 机器人。我使用了 Python (2.7.10),因为我相信这是教程中使用的版本,但是我有以下错误:

完整的脚本如下所示(删除了令牌和密钥):

0 投票
2 回答
3837 浏览

python - Reddit search API not giving all results

Ouput=953

Why the limitation?

  1. [Documentation][1] mentions

We can at most get 1000 results from every listing, this is an upstream limitation by reddit. There is nothing we can do to go past this limit. But we may be able to get the results we want with the search() method instead.

Any workaround? I hoping someway to overcome in API, I wrote an scraper for twitter data and find it to be not the most efficient solution.

Same Question:https://github.com/praw-dev/praw/issues/430 [1]: https://praw.readthedocs.org/en/v2.0.15/pages/faq.html Please refer the aformentioned link for related discussion too.

0 投票
0 回答
369 浏览

python - 使用 Django 检索 reddit 帖子

作为学习 Python/Django 的一种方式,我正在尝试使用 PRAW 在 Django 中重新创建 reddit,但我遇到了一些问题。目前,我将我的应用程序配置为连接到 reddit 并从我的 IndexView 类的主页中检索前 10 个帖子,但是当我尝试在我的Posts模型中添加字段然后使用makemigrations. 即使我从 django admin 中删除了我的数据库中的所有内容,如果我在模型中添加一个字段,然后使用python manage.py makemigrations,我经常会收到一个错误提示no such column: post_is_self或类似内容。当我注释掉新字段时,重新启动 django 服务器,这些帖子又回到了数据库中,即使同时我还没有访问我的应用程序的索引。

我相信问题出在我填充数据库的方式上。当用户访问我的应用程序的索引时,我想检索最新的前 10 个帖子,但现在添加新字段非常困难。它似乎在不应该检索帖子时检索帖子,当将新字段添加到模型并调用 makemigrations 时,这会导致问题。

这是我的 IndexView 类:

编辑:...和我的Post模型:

我应该在其他地方检索热门帖子吗?是否在将新字段添加到模型之前检索帖子?任何帮助表示赞赏,谢谢!

0 投票
2 回答
675 浏览

python - 获取 subreddits 的任何提交的 URL

我正在尝试使用 PRAW 从 Reddit 上的 subreddits 获取新帖子。以下代码片段显示了我如何在特定 subreddit 上获取新项目。

有没有办法获取特定提交的 URL?

0 投票
1 回答
9669 浏览

python - 如何从 Reddit 上的 subreddit 中抓取所有评论?

我正在尝试从 subreddit 中删除所有评论。我找到了一个名为 PRAW 的库。它举了一个例子

但是,这只返回最近的 25 条评论。如何解析 subreddit 中的所有评论?在 Reddit 界面上,有一个next按钮,所以应该可以逐页返回历史记录。

0 投票
1 回答
299 浏览

ubuntu - 我如何安装虾

我一直在尝试使用pip install praw 安装 praw但不断收到此错误消息:

我有 python 2 和 3。有什么想法吗?

0 投票
1 回答
510 浏览

python - 递归检索线程化评论列表

我正在尝试编写一个递归函数,可以从 Reddit 提交中检索嵌套评论。我正在使用 Python + PRAW

我得到以下输出,它不完整并且有嵌套数组:

Submission对象有一个comments属性,它是一个Comment对象列表。每个Comment对象都有一个_replies属性,该属性是更多Comments 的列表。

我错过了什么?我尽力而为——递归很难。