问题标签 [twint]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
129 浏览

python-3.x - 在 Python 中监控 Twint 进度

我正在使用 Twint 在 Twitter 上搜索特定的搜索词。当 Twint 正在抓取 Twitter 时,我想看看它的进展 - 具体来说,我想看看它已经抓取了多少条推文(示例输出:“我找到了 X 条包含你的搜索词的推文。”)。理想情况下,我想将这个正在进行的计数器显示为单个,例如“X”中的位置(参见示例输出)继续攀升,但语句的其余部分保持不变。

虽然我通常在运行 Python 3.7.4(64 位)的 Jupyter Notebook 中工作(我目前正在运行 Python 3.7.4(64 位)的 Jupyter Notebook 中编写/测试代码),但我意识到输出如这可能不适用于 Jupyter Notebook。鉴于我的抓取返回了数十万条推文,我不想使用一个print声明一长串新行的语句。我希望单行显示推文被抓取时的数量。如果这意味着我需要在 IDE 中以 .py 文件的形式运行它,那就这样吧。

我还搜索了 StakeOverflow 和 Google,但我找不到任何可以提供此输出标准的代码,所以我发布了这些问题。

我怎样才能实现我正在寻找的输出?

我很感激任何帮助。

0 投票
1 回答
62 浏览

python - 无法在python中清理csv文件

我正在尝试将 CSV 文件加载到 python 中并清理文本。但我不断收到错误消息。我将 CSV 文件保存在一个名为 data_file 的变量中,下面的函数会清理文本并返回干净的 data_file。

我在这里遇到一个关键错误。

0 投票
1 回答
57 浏览

python - pywren 和 twint - Tweet 下载

以下代码采用用户名并从给定日期抓取他们的 Twitter 历史记录

当我运行该函数时,我得到了预期的结果,即 Pandas 数据帧,例如 scrape_user("DeLaCalleHum")。但是,当我使用 pywren 时(即使是一个用户名)

我得到这个错误。

我究竟做错了什么?我将不胜感激任何帮助。

0 投票
0 回答
150 浏览

python - Python Twint Twitter API ValueError - 时间数据

我正在使用 twint 包,我正在尝试获取用户的帖子,直到现在我成功了,但是由于以下错误,今天由于某种原因它停止了工作:

我的查询:

谁能帮帮我吗?谢谢 !

0 投票
0 回答
95 浏览

python - api data to json file split per day, then merged

The code suppose to pull results from api, split it by day, and store each day’s results as distinct json file. Why it doesn't create json files?

twint_loop splits the date range into a series of days and calls twint_search to do the searching for each date. Each json is named after the date and stored in a directory based on the search term, using clean_name to ensure that it is a valid directory name.

0 投票
0 回答
50 浏览

python - 有没有办法使用 Twint 在 csv 文件中只存储一个 tweets 列?

我按照本教程开发了一个 Twitter GPT-2 机器人,但是抓取推文的方法已经过时了。

所以我开始使用 Twint 作为替代,我想问一下是否可以将用户的推文存储在单列 csv 文件中?我必须在命令行中设置什么参数?twint 是否能够在抓取时忽略主题标签和提及(@users),如果是这样,我必须设置为 false 才能发生这种情况?我在 wiki 中看到了 {mentions} 和 {hashtag} 参数。谢谢!

或者是否有一种正则表达式方法可以在 csv 文件中删除 @、# 和附加到它们的单词?

0 投票
0 回答
44 浏览

python-datetime - twint 将我的“直到”日期缩短 2 天,改为返回 2017 年 12 月

当我请求 Twint 从 2018-01-01 到 2018-01-06 进行搜索时,它会返回 2018-01-04 到 2018-01-01 加上 2017-12-31 的结果。有什么办法可以解决吗?也许让它按升序返回搜索结果(对于实时图表?)

0 投票
2 回答
1332 浏览

python - 将 Python Twint 模块导入 Jupyter Notebook 时出现问题 - ModuleNotFoundError: No module named 'twint'

当我尝试将twint包 ( https://pypi.org/project/twint/ ) 导入 Jupyter Notebook 时,我收到一条错误消息。

但是我知道twint安装好了。

在 Atom 上查看了 Python "ImportError: No module named twint" 试图使用 twint (Python Module),我知道我没有安装两个版本的 python。

我该如何前进?我想使用这个或类似的模块,而不是 Twitter API。

谢谢!

0 投票
1 回答
429 浏览

python - 如何使用 twint 收集特定 Twitter 用户正在关注的列表?

我正在尝试在 pycharm 中使用 twint 收集关注特定主要用户的用户列表。但是,当我运行我的代码时,我不断收到这些错误。

这是我的代码:

我不知道为什么这没有运行。我见过的所有教程都有几乎这个完全相同的代码,并且似乎可以工作。

我还尝试为 twint 运行命令行,但我的机器无法识别其上存在 twint。

在 pip 安装 twint 并克隆存储库之后,我尝试在命令行中运行它作为测试。

似乎没有任何效果。我也不知道为什么。

任何帮助表示赞赏!

注意:我正在运行 Python 3.9 顺便说一句。

0 投票
1 回答
438 浏览

python - 类型错误:replace() 参数 2 必须是 str,而不是 int

我正在尝试使用 Twint 抓取推文目标是根据关键字获取推文并根据我提供的自定义格式打印它们。在将 twint 配置设置为scrape时,我遇到了以下错误

我正在尝试的代码是:

我检查了format.py替换()函数配置看起来像这样

如果有任何人可以帮助我,那就太好了。如果问题需要重写,也请告诉我,不太擅长形成问题。