python - 使用 Twint 时抓取推文

Question

我正在对推文的情绪分析进行一些研究。我一直在使用twint从我获得更多推文的选定城市中抓取推文。当我与从 2010 年到 2015 年的 5 年期间为全世界抓取相同主题标签的推文进行比较时。我无法理解为什么 twint 会这样做。这是我的代码：

import twint
import pandas as pd
import nest_asyncio
nest_asyncio.apply()

cities=['Hyderabad','Mumbai','Kolkata','Vijayawada', 'Warangal', 'Visakhapatnam']
unique_cities=set(cities) #To get unique cities of country
cities = sorted(unique_cities) #Sort & convert datatype to list
for city in cities:
    print(city)
    config = twint.Config()
    config.Search = "#MarutiSuzuki"
    config.Lang = "en"
    config.Near = city
    config.Limit = 1000000
    config.Since = "2010–01–01"
    config.Until = "2015–12–01"
    config.Store_csv = True
    config.Output = "my_finding.csv"
    twint.run.Search(config)`

score 0 · Accepted Answer

也许 Twitter 在全球搜索时对显示推文数量有限制，例如，它只显示 X 个条目，但是当您根据位置更具体地缩小搜索范围时，它会显示该区域的最大数量。例如，亚马逊只会显示搜索项目的 400 页，即使可能更多，同样，如果您指定详细信息，它可能会显示比之前搜索更多的项目。

python - 使用 Twint 时抓取推文

1 回答 1

Related

Reference