python - Tweepy 公共流过滤器由一个变化的变量

Question

我正在使用 Python 的 Tweepy 库来访问公共 twitter 流，并遇到了一个问题，即一旦流运行，它就不会停止。现在，这对它的作用是有意义的，但我希望它开始使用一个空的用户 ID 列表进行过滤，一段时间后，用户 ID 会在有人发布特定跟踪词后添加到列表中，这样一旦他们发布了一个词，跟踪器开始跟踪他们所有的推文。问题是，一旦使用初始过滤器选项启动流，更改变量不会影响过滤器；它只是继续使用初始参数。

userIDs = []

trackWords = ["#Obama"]

def stream():

    s = Stream(auth, StreamListener())

    s.filter(follow = userIDs, track = trackWords)

在添加新关键字后，我可以通过再次调用流定义来解决这个问题，但是我有多个流搜索，我将它们放在单独的线程中，这样它们就可以同时运行。我不知道如何刷新线程，因此尝试刷新过滤器而不调用定义似乎更容易。

我对编程还很陌生，所以也许这是一个我还不知道的基本概念，但希望有一个简单的技巧可以让它刷新。

如果对任何人有帮助，这是我所有的相关代码。以上只是帮助说明我在说什么的快速方法：

userIDs = []
userNames = []

account = ['@DMS_423']

publicKeyWords = ['the','be','to','of','and','are','is','were','was']

class AStreamListener(StreamListener):
    def on_status(self, status):
        if status.author.screen_name not in userNames:
            userNames.append(str(status.author.screen_name))
            userIDs.append(str(api.get_user(str(status.author.screen_name)).id))
            print status.author.screen_name, "has joined the game."

def uStream():
    s = Stream(auth, StreamListener())
    s.filter(follow = userIDs)

def pStream():
    ps = PStream(pAuth, PStreamListener())
    ps.filter(track = publicKeyWords)

def aStream():
    adds = Stream(auth, AStreamListener())
    adds.filter(track = account)

t1 = Thread(target = aStream)
t2 = Thread(target = uStream)
t3 = Thread(target = pStream)

def run():
    t1.start()
    t2.start()
    t3.start()

run()

score 2 · Accepted Answer

如果您想在推文数量的特定条件/要求下停止推文，self.num_tweets = 0请编辑并记录它。您可以将其用作限制器，在def on_status

score 1 · Accepted Answer

Tweepy python 库 API 不支持您正在寻找的行为。无法修改与订阅的流相关的参数。

事实上，Twitter API 本身不支持在中途更改参数。他们甚至警告不要这样做。这并不是说不可能让它工作（只是要小心并避免超过速率限制）。

我会调整您的方法以使用新的查询参数初始化第二个流，使用推文 ID 来避免两次传递/保留相同的推文，然后一旦建立第二个流，您将关闭初始流。

python - Tweepy 公共流过滤器由一个变化的变量

2 回答 2

Related

Reference