1

我已经有了 Twitter 标准 API(我最近获得了批准,还没有使用 Twitter API),因为我需要收集历史推文。所以我必须升级到高级 API,但我应该选择 API 沙箱在付费之前测试我的代码并升级高级 API 完整存档吗?我害怕丢失一些推文并减少请求。我对理解一些运算符 results_per_call=100 .. max_results=100 .. 他们是什么意思有点困惑?我可以选择任何数字来获得更多推文吗?我每天可以使用多少个请求?我在 python 中找到我将使用它来收集的代码?这是对的吗?我是 python 的初学者,我在
哪里可以在我的计算机上找到 JSON 文件。?以及如何将此文件转换为 .cvs?

!pip install searchtweets
!pip install yaml
import yaml
config = dict(
search_tweets_api = dict(
    account_type = 'premium',
    endpoint = 'https://api.twitter.com/1.1/tweets/search/fullarchive/YOUR_LABEL.json',
    consumer_key = 'YOUR_CONSUMER_KEY',
    consumer_secret = 'YOUR_CONSUMER_SECRET'
))
with open('twitter_keys_fullarchive.yaml', 'w') as config_file:
yaml.dump(config, config_file, default_flow_style=False)
from searchtweets import load_credentials
premium_search_args = load_credentials("twitter_keys_fullarchive.yaml",
                                   yaml_key="search_tweets_api",
                                   env_overwrite=False)
print(premium_search_args)
from searchtweets import gen_rule_payload 
query = "(#COVID19 OR  # Corona_virus) (pandemic OR corona OR  infected OR vaccine)" rule = gen_rule_payload(query, results_per_call=100, from_date="2020-01-01", to_date="2020-01-30")`         from searchtweets import ResultStream
rs = ResultStream(rule_payload=rule,
              max_results=100,
              **premium_search_args) print(rs)
mport json
with open('twitter_premium_api_demo.jsonl', 'a', encoding='utf-8') as f:
n = 0
for tweet in rs.stream():
    n += 1
    if n % 10 == 0:
        print('{0}: {1}'.format(str(n), tweet['created_at']))
    json.dump(tweet, f)
    f.write('\n') print('done')

非常感谢您提前。

4

1 回答 1

2

一旦我完成了使用不同条件收集 twitter 数据的相同任务,经过大量搜索和测试,我必须为我的任务创建完全独立的 python twitter 客户端 API。这就是我对 API 的了解(文档有点混乱)

Twitter API 有 3 个版本用于搜索和下载数据。

  • 标准(有限制的免费版本)
  • 高级版(带有一些扩展功能的付费版)
  • 企业版(付费版,具有大规模运营的自定义选项)

标准 API

  • 通过正确的身份验证免费使用

  • 仅返回过去 7 天的数据

  • 可以使用标准搜索运算符

  • 您可以在给定的时间段内发送有限数量的请求(例如,用户身份验证在 15 分钟内发送 180 个请求,应用身份验证在 15 分钟内发送 450 个请求)

  • 一个请求返回 100 个数据对象(100 条推文)

高级 API

Preimum APi 包括 2 个版本。

  1. 30 天端点 - 提供过去 30 天内发布的推文
  2. 完整存档端点 - 提供从 2006 年开始的推文

这两个版本共享相同的端点,唯一的区别是您可以搜索的时间范围。

  • 高级包每个请求最多返回 500 个数据对象,您仍然可以根据您的用例限制返回计数。
  • 按订阅选择每月请求(例如 50 个请求,250 个请求(每月))

回答您的问题:

results_per_call=100表示 API 默认返回多少个推文对象,max_results=100是您需要多少个对象。

我应该在付费前选择 API 沙箱来测试我的代码并升级高级 API 完整存档吗?

是的,您可以使用免费服务测试基本逻辑和一些搜索查询并检查返回对象。但是如果您需要搜索超过 7 天的日期差异,或者高级运营商,您必须使用高级 API。

这些是一些有用的链接

https://developer.twitter.com/en/docs/tweets/search/overview

运营商

https://developer.twitter.com/en/docs/tweets/search/guides/standard-operators https://developer.twitter.com/en/docs/tweets/search/guides/premium-operators

API

https://developer.twitter.com/en/docs/tweets/search/api-reference/premium-search https://developer.twitter.com/en/docs/tweets/search/api-reference/get-search -推文

文档中有更多隐藏信息,如果您发现任何有用的信息,请添加更多信息。

于 2020-07-13T05:28:20.763 回答