问题标签 [twint]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
562 浏览

python - 如何在 twint 中使用 since 和 until 参数?

我使用 twint 包从 2016 年 1 月 1 日到 2021 年 1 月 1 日获取所有英文推文以搜索 btc,并将其保存为 csv 文件。我的代码如下所示(我使用的是 jupyter notebook)

当我运行脚本时,出现以下错误: ValueError: time data '2016–01–01 00:00:00' does not match format '%Y-%m-%d %H:%M:%S'

我已经运行了没有Since和Until参数的脚本,它工作正常

0 投票
1 回答
172 浏览

python - pip3 安装不工作无效语法?(视窗)

我曾尝试在 Python 3.9 上多次使用 pip3 install 函数,但它从未奏效。我首先使用 JupyterNotebook 进行了尝试,最后使用 Anaconda 安装了 Jupyter。我目前正在尝试安装 Twint 和 InstagramOSINT,但每次我使用 pip3 install 时都会收到一条错误消息,提示 SyntaxError:Invalid Syntax。我检查了我的 PC 上是否安装了 pip3,我确实安装了。

0 投票
1 回答
332 浏览

python - 使用 Twint 时抓取推文

我正在对推文的情绪分析进行一些研究。我一直在使用twint从我获得更多推文的选定城市中抓取推文。当我与从 2010 年到 2015 年的 5 年期间为全世界抓取相同主题标签的推文进行比较时。我无法理解为什么 twint 会这样做。这是我的代码:

0 投票
2 回答
246 浏览

python - 将 .csv 文件加载到 pandas 数据框时出错

我正在使用 Twint 创建一个包含十个结果的 .csv 文件。但是,每当我尝试将其加载到 pandas 数据框中时,都会出现错误。有人可以帮助我了解发生了什么吗?

-编辑-

我查看了我的 csv 文件,发现数据的格式很奇怪。包括用户名、日期时间和推文在内的一整行信息都将被塞进一个单元格中。

对于其他几行,推文会中断并继续在它旁边的单元格中。它看起来像这样。

我的数据截图

0 投票
1 回答
857 浏览

python - 没有更多数据了!刮擦现在将停止。- 无法使用 twint 获取更多推文

根据 twint 官方文档,从特定用户那里获取 3200 条推文应该不难。但是,我的问题是:在我运行配置代码后,我只能得到最近的 20-60 条推文。一定有问题,希望得到一些。

我安装了最新版本的 twint,这是我的配置代码

0 投票
3 回答
1732 浏览

python - ImportError:无法从“aiohttp.helpers”导入名称“CeilTimeout”

导入 twint 时出现错误。我也尝试过虚拟环境。

ImportError Traceback (最近一次调用最后) C:\Users\name\AppData\Local\Temp/ipykernel_12356/3064374937.py in ----> 1 import twint

D:\NLP\twint\twint_ init _.py in 12 from .config import Config 13 from . 版本导入版本 ---> 14 来自 . 导入运行 15 16 _levels = {

D:\NLP\twint\twint\run.py in 2 from asyncio import get_event_loop, TimeoutError, ensure_future, new_event_loop, set_event_loop 3 ----> 4 from . 从 .token 导入日期锁、提要、获取、输出、详细、存储 5 从 .token 导入 TokenExpiryException 6 导入令牌

D:\NLP\twint\twint\get.py in 10 import random 11 from json import load, dumps ---> 12 from aiohttp_socks import ProxyConnector, ProxyType 13 from urllib.parse import quote 14

c:\users\name\appdata\local\programs\python\python38\lib\site-packages\aiohttp_socks_init _.py in 3 4 from .proxy import SocksVer, ProxyType ----> 5 from .connector import ( 6 SocksConnector、ProxyConnector、7 ChainProxyConnector、ProxyInfo

c:\users\name\appdata\local\programs\python\python38\lib\site-packages\aiohttp_socks\connector.py in 6 from aiohttp import TCPConnector 7 from aiohttp.abc import AbstractResolver ----> 8 from aiohttp. helpers import CeilTimeout # noqa 9 10 from .proxy import (ProxyType, SocksVer, ChainProxy,

ImportError:无法从“aiohttp.helpers”导入名称“CeilTimeout”(c:\users\name\appdata\local\programs\python\python38\lib\site-packages\aiohttp\helpers.py)

0 投票
2 回答
873 浏览

python - python出现错误如何重新执行?

我正在使用 Twint(一个 Twitter 抓取工具),但不知何故有一个我无法解决的问题。我想知道是否有一种方法可以在发生错误时等待1分钟并重新执行?我的代码是这样的:

有时,twint.run.Search(c)无法正常运行。那么,一旦出现错误,有没有办法只再次执行此循环而不重新执行整个循环?

有人会帮助我吗?任何想法都会非常有帮助。非常感谢!

0 投票
0 回答
83 浏览

python - Twitter Scraper Twint 不会返回所有推文

Twint 在我指定的限制下返回。这是我正在运行的所有代码

在我运行之后,它只返回 156 条推文。我不确定我做错了什么,但它不会返回我设置的推文限制,因为它返回的方式低于该限制

0 投票
0 回答
21 浏览

web-scraping - 使用特定时间时出现孪生问题

我们正在尝试获取 2021 年的数据,但该月存在问题,即我们无法获取 2021 年的整个月份,但我们只得到了最近一个月的数据,而且只有几条推文。(对不起,我的英语不好)

0 投票
0 回答
7 浏览

python - 用于 Python 的 Twint 停止报废

我目前正在使用twintin Powershellfrom anaconda

我的 python 版本是3.6,我昨天刚刚更新了 twint

我现在有个问题。

我使用这个代码

起初它向我展示了过去几天发布的一些推文,但它只是停下来并说以下内容:

我知道有更多带有该短语的推文,但是twint不收集它们,以前有人遇到过这个问题吗?如果你有,你是如何解决的?