-1
  • 任何人都可以在这里帮助我处理一些用于数据收集的 Python3 逻辑,或者提出任何更简单的有效方法。我知道您可以将数据源添加到 Tableau 和其他程序等程序中,但这并不是我真正要做的,除非您确定它具有轻松内置的功能。

我将如何处理用 python 编写的数据收集程序的逻辑,以收集所有使用 say 主题标签 #sample 的一系列推文,然后我从哪里获取它们的位置 --- GeoJson?我假设..

对于那些有更多使用 python3 收集数据的经验的人,我可以添加逻辑,允许我使用 twitter api 应用程序或 py tweety 进行收集。我只是想知道我是否可以让每 10 个收集一个触发次要动作,这不会对快速移动的流的性能征税。

用例场景:例如,像 Kenny Chesney 音乐会中所有推文的流或数据集合,我知道它是 long1 lat1 和 long2 lat2 之间的 1 平方英里,在竞技场周围形成一个正方形,可以延伸到我想要的一英里要以艰难的方式流式传输有关奥运会的所有推文,我会收集它而不是获取提要。有人可以给我关于使用 python 和 twitter 收集的一二,以及地理定位对于那些帖子为 geolocation=on 的用户的效果如何。对于在同一日期时间 +- 1 小时使用#samplekenny 主题标签发推文的每个人,我想继续收集和提醒自己或将名称添加到 txt 文件或某些触发器。

任何接近这个的东西,即使它有点像这个问题,来自不同的人,我会很感激,我以前做过这个,不是用python,我真的很喜欢python,但我不能说我知道它。

我想我已经接近了,我想找到最不费力的方式来做到这一点,比如说事件,然后如果有一种总体上不那么费力的方式,除了用更严格的过滤器等来限制你的收集组。只需要文本和编码符号。和 tweetId

4

1 回答 1

0

您可以使用这个 python 包附带的命令行脚本,它几乎完全符合您的要求:https ://github.com/geduldig/TwitterGeoPics

您可以使用 REST API:

python -u -m TwitterGeoPics.SearchOldTweets -words #sample -location nyc

或者,您可以通过以下方式使用 Streaming API:

python -u -m TwitterGeoPics.StreamNewTweets -words #sample -location nyc

这些脚本查找一个地方的纬度和经度。如果您想自己指定纬度和经度,只需去掉查找代码。

大多数人不转地理位置,所以不要期望很多结果。

于 2018-04-15T15:08:03.377 回答