0

我试图让这个问题没有本地化,但由于我对 Python 的了解非常原始,请随时编辑它以使其更清晰!

Twitter 正处于放弃对包括 RSS 在内的 XML 支持的最后阶段,我正在努力通过解析 Twitter 提供的 json 并使用 PyRSS2Gen 获取输出来获得相同的行为。我以这个链接为例:https ://github.com/dschep/Twitter-user_timeline.rss-proxy/blob/master/timeline_rss_proxy.py

我实际上得到了它的工作,但转推的大部分时间都被截断了。但是可以使用item['retweeted_status']['text']而不是获取整个推文item['text']。我需要获取item['text'](^RT @username:) 的正则表达式部分并将其与item['retweeted_status']['text'].

所以我创建了一个名为“get_tweet_text”的函数,我想用这个函数的输出填充列表中标题描述的值items,但是这个函数似乎被忽略了,所以我得到了错误:

Traceback (most recent call last):
  File "1.py", line 59, in <module>
    ) for item in feed
  File "/usr/lib/python2.7/dist-packages/PyRSS2Gen.py", line 397, in __init__
    "must define at least one of 'title' or 'description'")
TypeError: must define at least one of 'title' or 'description'

这是完整的代码。我用 X 模糊了我的应用程序和用户键。sys.argv[1]指的是要下载其时间线的用户。请随时纠正您可能发现的更多错误:)

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import sys, re, datetime, urlparse, json, PyRSS2Gen
import oauth2 as oauth

name = sys.argv[1]

consumer = oauth.Consumer(
    'XXXXXXXXXXXXXXXXXXXXXX',
    'XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX'
)
token = oauth.Token(
    'XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX',
    'XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX'
)
client = oauth.Client(consumer, token)

resp, content = client.request(
    'http://api.twitter.com/1.1/statuses/user_timeline.json?screen_name=%s'
    % name,
    method='GET',
)
feed = json.loads(content)

link_tmpl = 'http://twitter.com/{user}/status/{id}'

def get_tweet_text(item):
#   try:
    text = '%s: %s %s' % (
        name,
        re.search('^RT @\w+:', item['text']).group(0),
        item['retweeted_status']['text']
    )
#   except:
#       text = item['text']

rss = PyRSS2Gen.RSS2(
    title = 'Twitter / {0}'.format(name),
    link = 'http://twitter.com/{0}'.format(
        feed[0]['user']['name'].encode('utf-8')
    ),
    description = feed[0]['user']['description'],

    lastBuildDate = datetime.datetime.now(),

    items = [
        PyRSS2Gen.RSSItem(
            title       = get_tweet_text(item),
            link        = link_tmpl.format(user=name, id=item['id']),
            description = get_tweet_text(item),
            guid        = PyRSS2Gen.Guid(link_tmpl.format(
                user=name, id=item['id']
            )),
            pubDate     = datetime.datetime.strptime(
                item['created_at'][:19] + item['created_at'][25:],
                '%a %b %d %H:%M:%S %Y'
            )
        ) for item in feed
    ]
)

print rss.to_xml()
4

1 回答 1

1

你不会从你的get_tweet_text函数中返回任何东西。你只需要return text最后。

于 2013-03-20T18:00:40.357 回答