问题标签 [twint]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
29 浏览

python - 使用 Python 对 Twitter 进行情绪分析(将查询与其他推文分开)

我正在使用 Python 为我的组织做一些情绪分析。我正在尝试找到一种方法,将人们提出的查询与与组织 Twitter 句柄关联的其他推文分开。有没有办法做到这一点?如果有人可以提供帮助,我将不胜感激。

0 投票
2 回答
619 浏览

python - twint 发布时间数据“2020–04–29 00:00:00”与格式“%Y-%m-%d %H:%M:%S”不匹配

当我想从 Twitter 配置SinceUntil. 我使用这样的格式'2020-01-01 00:00:00'

这个错误向我显示

ValueError: time data '2020–04–29 00:00:00' does not match format '%Y-%m-%d %H:%M:%S'

你有什么解决办法吗?

0 投票
0 回答
260 浏览

python - Python Twitter:在没有 API 的情况下通过 url 检查推文是否存在

我有来自同一帐户的推文 url 列表,我想检查这些推文是否仍然存在。

如果 twitter 以此类错误响应,则一条推文可能不再存在:

或者

或任何此类错误。

我尝试使用 twint 库从给定的配置文件中抓取所有推文,并检查我的“推文列表”上的推文是否也在 twint 库的结果中。

我已经使用此功能使用 twint 抓取所有推文:

这很好用,但问题是它不会抓取所有推文,并且会在某个日期停止(对于我正在测试的用户名“GideonCRozner”,它会在 2020 年 6 月 24 日停止),并且我有帖子网址在该日期之前。所以很简单,我无法使用 twint 库抓取所有帖子。

我现在的解决方案是包含selenium在代码和get尚未被一一抓取的帖子中,但正如您所知,selenium 是一个较慢的解决方案。

所以我希望我可以利用你的一些想法,刮掉所有用户的推文或测试一条推文,如果它没有硒并且没有 Twitter API

非常感谢您的时间!

0 投票
1 回答
369 浏览

python - 计算一年中包含特定单词的推文的频率

我试图计算一年中单个单词的推文数量,同时写下每天及其推文数量并存储,而不是将其存储在带有“日期”和“频率”的 CSV 文件中。这是我的代码,但运行一段时间后我不断收到错误消息。

我得到的错误是这个

感谢您的帮助 :)

0 投票
0 回答
76 浏览

python - 如何在 Python 3 中处理 2 个不同的错误,这两个错误都是 ValueError

我有一个用来获取推文的推特用户名列表。在此过程中,我面临两个主要错误:

CRITICAL:root:twint.get:User:'user'
raise ValueError("Cannot find twitter account with name = " + self.config.Username)
ValueError: Cannot find twitter account with name = blablabla

CRITICAL:root:twint.get:User:'data'
raise ValueError("Cannot find twitter account with name = " + self.config.Username)
ValueError: Cannot find twitter account with name = blablabla

第一个发生在用户名不正确并且我不介意传递错误时。但是,我认为第二个是由于连接超时或类似原因,因为每当我收到该错误时,我都会将脚本停止 3-4 分钟并继续,然后它照常进行。

因此,我想捕捉第二个错误并用 sleep() 处理它。问题是,如果我这样做,它也会因不正确的用户名错误而休眠,这是浪费时间:

只有在发生第二个错误时,我才能让它休眠?

0 投票
1 回答
4235 浏览

python - 不使用 API 的 Python Twitter Scraper

我正在尝试使用 python 使用 twint 模块制作 Twitter Scraper,但我认为 twitter 阻止了这个模块。

运行 Twint 模块时出现此错误。任何人都可以给我任何其他方式来刮 twitter twits。

...

...

我的代码

...

...

0 投票
1 回答
327 浏览

python - 为 pycare (setup.py) 构建轮子 ...错误

我正在尝试安装 Twint,每次尝试安装软件包时,我都会收到涉及pycares. 我试过pycares自己安装,我得到了同样的错误。我没有Ares安装或c_ares安装。我也没有homebrew安装。

我可以毫无问题地安装其他软件包。我也试过手动安装pycares,还是不行。

0 投票
0 回答
49 浏览

python - 为什么 Reticulate 不能运行 twint

我正在尝试使用 R Reticulate 中的 Twint python scraper,但是当我运行 Twint 函数时,我收到此错误:

0 投票
1 回答
369 浏览

python - Twint 抓取:ClientPayloadError:响应负载未完成

当我使用 抓取有关某个主题标签的推文twint时,我收到了以下错误。谁能解释我为什么会发生此错误以及如何解决此问题?但是,由于某个日期的推文已被抓取,因此该日期之前的其他推文由于此错误而无法被抓取。

谢谢你的帮助!

0 投票
2 回答
462 浏览

python - 从 Twitter 用户列表 (csv) 中抓取加入日期/用户信息

我正在寻找一个可能非常简单的问题的解决方案,并且非常感谢一些帮助或提示。我有 python 和 webscraping 的基本知识。

我想在 Twitter 上探索某个主题标签及其背后的社区。使用twint,我已将所有提及主题标签的推文下载到 .csv 文件中。之后,我清理了 .csv,这样就没有同一用户的多个条目(来自具有相同主题标签的多个推文)并将其保存为 .txt。我现在想获得关于上述列表中大约 1.500 名用户的更多信息——主要是他们加入推特的日期,推文的数量将是一个奖励

我试过的: Twint 应该能够做到这一点,但它没有用(我正在使用他们 github 上提供的 docker 镜像)。我试图通过以下方式获取用户信息:

Twint 发出一条很长的错误消息,如果我理解正确的话,它与 twint 中的一个开放错误有关:

我试图遍历列表并让 twint 单独查找每个用户名,但它也不起作用:

用 Google Colab 运行它,我给了我

我在寻找 什么 获取列表中这些用户的加入日期的最简单的解决方案是什么?我应该使用不同的库吗?我可以用 beautifulsoup 之类的东西遍历列表并刮掉加入日期吗?我该怎么做?

非常感谢您的帮助,在此先感谢!