我的 cron 工作的目标是将带有时间戳的推文保存到 Google App Engine 的数据存储中。我无法弄清楚如何以时间戳形式保存数据(当前保存为字符串)。理想情况下,我想将其保存为 DateTimeProperty 以便更轻松地对条目进行排序。我正在努力解决两个特别的问题:
- 正确使用 time.mktime(),以及
- 将正确的格式化值放入 GQL
该字段在 json 中的格式如下:
s = "Wed, 20 Mar 2013 05:39:25 +0000"
我尝试使用datetime模块来解析这个字符串:
timestr = datetime.datetime.strptime(s, "%a, %b %Y %d %H:%M:%S +0000")
when = datetime.fromtimestamp(time.mktime(timestr))
总结一下,这是我的 cron.py 文件的片段:
result = simplejson.load(urllib.urlopen(twitterurl))
for item in result['results']:
g = ""
try:
g = simplejson.dumps(item['geo']['coordinates'])
except:
pass
timestr = datetime.datetime.strptime(str(item['created_at']), "%a, %b %Y %d %H:%M:%S +0000")
when = datetime.fromtimestamp(time.mktime(timestr))
tStore = TweetsFromJSON(user_id=str(item['from_user_id']),
user=item['from_user'],
tweet=unicodedata.normalize('NFKD', item['text']).encode('ascii', 'ignore'),
timestamp=when,
iso=item['iso_language_code'],
geo=g
)
数据存储的模型将是:
class TweetsFromJSON(db.Model):
user = db.TextProperty()
user_id = db.TextProperty()
tweet = db.TextProperty()
timestamp = db.DateTimeProperty()
iso = db.StringProperty()
geo = db.StringProperty()